11wk: 르벡적분 맛보기2, 르벡적분의 정의
1. 강의영상
{{< https://youtu.be/playlist?list=PLQqh36zP38-ylPlXv_PN9QIA9eoHEEq8b&si=CJ4Y0DP9dCmmI-n8 >}}2. 예비학습
A. 확장된 실수공간
- 교재에 따라서 확장된 실수공간 \(\bar{\mathbb{R}}\)를 고려하기도 한다. (Durrett 2019, p 14)
\[\bar{\mathbb{R}} = \mathbb{R} \cup \{-\infty\} \cup \{\infty\}\]
- 또한 확장된 실수공간에 대응하는 보렐셋 \(\bar{\cal R}\) 을 정의하기도 한다.
B. \(\sup\), \(\inf\)
- 집합 \(A=\{1,2,3\}\) 에 대하여 아래의 표현을 살펴보자.
- \(\max A =3\)
- \(\min A =1\)
- 집합 \(A=[0,2]\) 에 대하여 아래의 표현을 살펴보자.
- \(\max A =2\)
- \(\min A =0\)
- 집합 \(A=(0,2)\) 라면?
1 2라고 하고싶은데 2라고 할 수 없다. (즉 정의할 수 없다.)
2 0이라 하고싶은데 0이라고 할 수 없다. (즉 정의할 수 없다.)
3. 르벡적분 맛보기2
A. 대략적 수식화
- 리만적분이 정의역을 잘게 쪼개는 방식이라면, 르벡적분은 치역을 잘게 쪼개는 방식이다. \(\int f d\lambda\) 가 계산되는 원리를 대략적으로 수식화하면 아래와 같다.
\[\int f d\lambda \approx \sum_{n=1}^{N} \Big(a_n \times \lambda(A_n)\Big),\quad \text{where $A_n:=\{x: f(x)=a_n\}$} \]
여기에서 \(A_n\)은 \(\{a_n\}\) 에 대한 \(f\) 의 inverse image 라고 해석할 수 있다.3 우변의 값은 \(N\)이 커질수록 좌변과 비슷해진다. (그리고 \(\lambda (A_n)\)의 값은 점점 작아지겠지.. 그래서 나중에 \(d\lambda\)로 표현!)
3 그래서 취향에 따라 \(A_n = f^{-1}(\{a_n\})\) 라고 쓸 수도 있음
B. 기호의 비교
- 리만적분(\(dx\))과 르벡적분(\(d\lambda\))를 연결하여 보자.
# 예제1 – 친숙한 예제로, 까다로운 기호를 정리해보자.
아래와 같은 함수 \(f(x)\)를 고려하자.
\[f(x) = \begin{cases} \alpha & x \in [0,1] \\ o.w \end{cases}\]
이 함수에 한정하여 아래는 모두 같은 표현이다.
1. \(\int_{-\infty}^{\infty} f(x) dx\)
2. \(\int_0^1f(x)dx\)
3. \(\int_0^1 \alpha dx\)
4. \(\alpha \int_0^1 dx\)
5. \(\alpha \times 1\)
그런데 5에서 \(\alpha\)를 높이 혹은 함수값으로 해석한다면 \(1\)은 밑변의길이 혹은 “함수값에 대응하는 역상의 길이”로 해석할 수 있다. 함수값에 대응하는 역상을 \(A = \{x: f(x)=\alpha\} = [0,1]\) 라고 정의하고 역상의 길이를 르벡측도로 “재서” \(\lambda(A)\) 로 표현한다면 5는 아래와 같이 쓸 수 있다.
6. \(\alpha \times \lambda(A)\)
여기에서 5,6은 서로 대응되는 표현이다. 그렇다면 1 ~ 4에 대한 대응되는 표현도 존재할텐데 보통 아래와 같이 사용한다.
7. \(\alpha\int_{A}d\lambda\)
8. \(\int_{A}\alpha d\lambda\)
9. \(\int_{A}f d\lambda\)
10. \(\int_{\mathbb{R}} f d\lambda\)
정리하면 아래와 같다.
| 리만적분 | 르벡적분 |
|---|---|
| \(\int_{-\infty}^{\infty} f(x) dx\) | \(\int_{\mathbb{R}} f d\lambda\) |
| \(\int_{0}^{1} f(x) dx\) | \(\int_{A} f d\lambda\) |
| \(\int_{0}^{1} \alpha dx\) | \(\int_{A} \alpha d\lambda\) |
| \(\alpha\int_{0}^{1} dx\) | \(\alpha \int_{A} d\lambda\) |
| \(\alpha \times 1\) | \(\alpha \times \lambda(A)\) |
#
- 생략표현
- \(\int_{\mathbb{R}} f d\lambda\) 는 특별히 \(\int f d\lambda\) 로 간단히 표현하기도 한다.
- 사실 \(\int_{-\infty}^{\infty} f(x) dx\) 역시 줄여서 \(\int f(x)dx\) 로 표현하기도 하지만 이건 적분연산 자체를 의미하는 부정적분과 혼돈될 우려가 있어 사용을 지양하는 편이다.
C. 르벡적분의 매력
# 예제1 – 표현을 좀 더 엄밀하게
아래와 같은 문장이 있다고 하자.
아래와 같은 함수 \(f(x)\)를 고려하자. \[f(x) = \begin{cases} \alpha & x \in [0,1] \\ o.w \end{cases}\] 이러한 함수에서 아래의 표현을 고려하자. \[\int f d\lambda\]
여기에서 \(\lambda\)는 르벡메저이다. 르벡메저는 \((\mathbb{R}, {\cal R})\) 의 존재가 있어야 정의가능하므로 사실 위의 문장은 엄밀하게 쓰여진 것이 아니다. 이를 좀 더 엄밀한 언어로 쓰면 아래와 같다.
측도공간 \((\mathbb{R}, {\cal R}, \lambda)\) 를 고려하자. 그리고 함수 \(f: \mathbb{R} \to \mathbb{R}\) 을 아래와 같이 정의하자. \[f(x)=\begin{cases} \alpha & x \in [0,1] \\ o.w\end{cases}\] 여기에서 \(\alpha \in \mathbb{R}\) 이다. 이제 아래의 표현을 고려하자. \[\int f d\lambda\]
#
# 예제2 – 르벡적분의 우수성
예제1의 표현들에서 \(d\lambda\) 와 같은 표현은 르벡메져가 아닌 일반적인 메져에서도 표현가능하다. 만약 가측공간 \((\mathbb{R},{\cal R})\) 에 아래와 같은 메져 \(\mu\)가 존재한다고 하자.
\[\mu(A) = 2\lambda(A),\quad \forall A \in {\cal R}\]
여기에서 \(\lambda\)는 르벡메져이다. 그렇다면 아래가 성립한다.
\[\int_A f d\mu = \alpha \times \mu(A) = 2\alpha \times \lambda(A) = 2\int_A f d\lambda,\quad\forall A \in {\cal R}\]
#
- 좀 더 일반적으로는 측도공간 \((\Omega,{\cal F},\mu)\) 에서 함수 \(f:\Omega \to \mathbb{\bar R}\) 에 대하여 아래의 표현을
\[\int f d\mu\]
고려해볼 수 있다. (이때 \(\int f d\mu\) 라는 표현이 언제나 잘 정의될지 의문이 남지만 잘 정의된다고 치자..)
# 예제3 – \(\int dx\)
\((\Omega, {\cal F}, \mu)\) 가 \((\mathbb{R}, {\cal R}, \lambda)\) 이면
- \(\int f(x)dx = \int f d\lambda\)
- \(\int_a^b f(x)dx = \int_E fd\lambda\)
와 같이 사용한다. 단, 여기에서 \(E=[a,b]\). (Durrett 2019, p 23)
\(\int_E fd\lambda\)는 종종
- \(\int_E f(x)\lambda(dx)=\int_E f(x)d\lambda(x)\)
- \(\int_E f(y)\lambda(dy)=\int_E f(y)d\lambda(y)\)
와 같이 표현하기도 한다. 이러한 표현은 때때로 유용하다. 예를들어
- \(\int_{(0,1)}x^y \lambda(dx)=\int_{(0,1)}x^y d\lambda(x)\) 는 함수 \(x \mapsto x^y\) 에 대한 적분을
- \(\int_{(0,1)}x^y \lambda(dy)=\int_{(0,1)}x^y d\lambda(y)\) 는 함수 \(y \mapsto x^y\) 에 대한 적분을
의미한다. (Makarov and Podkorytov 2013, p 125), (Durrett 2019, p 32, p 38)
#
# 예제4 – \(\sum_{i}\)
측도공간 \((\mathbb{N}, 2^{\mathbb{N}},\#)\) 을 고려하자. 여기에서 \(\#: 2^{\mathbb{N}} \to [0,\infty]\) 는 counting measure 이다. 즉 \(\#\) 은 아래를 만족하는 집합함수이다.
\[\#(A) = \begin{cases} |A| & \text{$A$ 는 유한집합} \\ \infty & \text{$A$ 는 무한집합} \end{cases}\]
이때 \(f(n)=(1/2)^n\) 일 때 아래를 계산하라.
\[\int f d\#\]
(풀이)
\(f\)의 치역은 \(\{1/2, 1/4, 1/8, \dots \}\) 이며, 치역의 각 값에 대응하는 \(A_1, A_2, A_3 \dots\) 는
- \(A_1=\{1\}\)
- \(A_2=\{2\}\)
- \(A_3=\{3\}\)
- \(\dots\)
이다. 따라서 \(\int f d\#\) 은 아래와 같이 쓸 수 있다.
\[\begin{align*} \int f d\# &= \int \frac{1}{2^n} d\#\\ &=\left(\frac{1}{2}\times \#(A_1)\right) + \left(\frac{1}{4}\times \#(A_2)\right) + \left(\frac{1}{8}\times \#(A_3)\right)+ \cdots \\ &=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+ \cdots \\ &=\sum_{i=1}^{\infty}\frac{1}{2^n}=1 \end{align*}\]
- \(\Omega\): a countable set
- \({\cal F}\): \(2^\Omega\)
- \(\#\): counting measure
라고 하자. 그러면
- \(\int f d\# = \sum_{i \in \Omega} f(i)\)
이 성립한다. (Durrett 2019, p 23)
#
느낌: 르벡적분은 리만적분과 시그마를 통합하여 서술할 수 있는 언어이다.
# 예제5 – 기대값
\((\Omega,{\cal F},\mathbb{P})\)를 확률공간이라고 하고 \(\Omega=\{H,T\}\), \({\cal F}=2^\Omega\), \(\mathbb{P}(H)=\mathbb{P}(T)=\frac{1}{2}\)라고 하자. 확률변수 \(X(H)=0\), \(X(T)=1\)를 정의하자. 이 확률변수의 기대값 \(\mathbb{E}(X)\)를 계산하여 보자.
(풀이)
아래와 같이 계산할 수 있다. (고등학교 수준)
\[\mathbb{E}(X)= \sum_{x=0}^{1} x \mathbb{P}(X=x) = 0 \times \frac{1}{2} + 1\times \frac{1}{2}\]
또는 아래와 같이 볼 수 도 있다. (여기서부터 대학원수준)
\[ \begin{align} \mathbb{E}(X)&= 0 \times \mathbb{P}(\{\omega: X(\omega)=0\}) + 1 \times \mathbb{P}(\{\omega: X(\omega)=1\})\\ &=0 \times \mathbb{P}\big(X^{-1}(\{0\})\big) + 1\times \mathbb{P}\big(X^{-1}(\{1\})\big) \quad \cdots(\star) \end{align} \]
\((\star)\)의 해석1: \(\star\) 에서
- \(0=X(H)\)
- \(1=X(T)\)
- \(X^{-1}(\{0\})= \{H\}\)
- \(X^{-1}(\{1\})= \{T\}\)
를 대입하면 \((\star)\)는 \(X(H)\mathbb{P}(\{H\}) + X(T)\mathbb{P}(\{T\})\) 로 정리된다. 이를 정리하면
\[\mathbb{E}(X) = X(H)\mathbb{P}(\{H\}) + X(T)\mathbb{P}(\{T\})\]
로 표현가능한데, 이것은 의미상
\(H\)를 숫자화한 값 \(\times\) 사건 \(\{H\}\)가 발생할 확률 \(+\) \(T\)를 숫자화한 값 \(\times\) 사건 \(\{T\}\)가 발생할 확률
을 의미하므로 평균의 뜻과 잘 맞다.
\((\star)\)의 해석2: \((\star)\) 에서 \(0\)을 \(X\)에 대한 함수값으로 해석하고, \(X^{-1}(\{0\})\)을 함수값 0에 대한 역상으로 해석할 수 있다. 동일하게 \(1\)역시 \(X\)에 대한 함수값으로 해석하고, \(X^{-1}(\{1\})\) 역시 1에 대한 역상으로 이해할 수 있다. 그렇다면 \((\star)\)는 \(\int X d\mathbb{P}\) 로 쓸 수 있다. 따라서 기대값을 르벡적분으로 표현하면 아래와 같이 표현할 수 있다.
\[\mathbb{E}(X)=\int X d\mathbb{P}\]
\((\star)\)의 해석3: \((\star)\) 에서
\[\mathbb{P}\big(X^{-1}(\{0\})\big) = \mu_X(\{0\})\]
으로 해석하면, 아래와 같이 쓸 수 있다.
\[(\star) = 0\times \mu_X(\{0\}) + 1 \times \mu_X(\{1\})\]
여기에서 함수 \(g(x)=x\)를 고려하면 상과 역상이 같아지므로 아래와 같이 사용할 수 있다.
\[(\star) = \int g(x) d\mu_X=\int x d\mu_X\]
이때 \(\mu_X\)는 사실 \(F_X\)로 유일하게 결정할 수 있으므로 (확장이론2) 위에서 \(\mu_X\) 대신에 \(F_X\)를 쓰기도 한다. 따라서 평균은 아래와 같이 표혈할 수 있다.
\[\mathbb{E}(X) = \int x d\mu_X = \int x dF_X\]
위의 서술은 모두 \(X\)가 연속형이든 이산형이든 상관없이 사용할 수 있다.
만약에 \(\frac{d \mu_X}{d\lambda}\) 의 역할을 해주는 어떠한 함수 \(f\) 가 존재한다면 (\(X\)가 연속형 확률변수일 경우 이러한 일이 생김) 아래와 같이 쓸 수 있다.
\[\mathbb{E}(X) = \int x d\mu_X = \int x fd\lambda = \int x f(x)dx\]
#
D. \(\int f d\mu\)의 존재성
- 의문 (PTSD): 리만적분 불가능한 함수는 살펴보았다.4 그러하면 르벡적분 불가능한 함수는 존재할까? 즉 임의의 함수 \(f\) 에 대하여
4 유리수에서 1을, 무리수에서 0을 가지는 함수
\[\int f d\mu\]
라는 표현이 지칭하는 값은 언제나 모순없이 정의가능할까?
# Rationale:
\(\int f d\mu\) 가 계산되는 원리를 대략적으로 살펴보아 수식화하면 아래와 같다.
\[\int f d\mu \approx \sum_{n=1}^{N} \Big(a_n \times \mu(A_n)\Big),\quad \text{where $A_n:=\{x: f(x)=a_n\}$} \]
여기에서 \(A_n\)은 \(\{a_n\}\) 에 대한 \(f\)의 inverse image 라고 해석할 수 있다.5 우변의 값은 \(N\)이 커질수록 좌변과 비슷해질 것이므로 결국 우변의 값이 잘 정의되면 좌변의 값도 잘 정의된다고 볼 수 있다. 우변의 값이 잘 정의되지 않는 경우를 생각해보자.
5 그래서 취향에 따라 \(A_n = f^{-1}(\{a_n\})\) 라고 쓸 수도 있음
1. \(\mu(A_n)\) 이라는 표현자체가 불가능한 경우, 즉 \(A_n\)이 잴 수 없는 집합일 경우.
당연히 이 경우에는 우변의 표현이 불가능하다. 이 상황을 피하기 위해서는 \(f\) 의 역상이 모두 잴 수 있음을 보장하면 되므로 \(f\) 가 measurable function 이라는 조건을 주면 충분할 것 같다. 따라서 \((\Omega, {\cal F}, \mu)\) 를 측도공간이라 하고 \(f: (\Omega, {\cal F}) \to (\mathbb{R}, {\cal R})\) measurable function 이라는 조건을 주면 충분할 것 같다.
2. \(\mu(A_n)\) 이라는 표현은 가능하지만, 어떠한 \(n\)에 대해서는 \(\mu(A_n)=\infty\) 인 경우.
이러면 \(\int f \mu\) 를 근사한 우변의 값이 \(\infty - \infty\) 꼴이 될 수 있으므로 값을 정의할 수 없다. 따라서 이럴 경우는 피해야한다. 이를 피하기 위해서는 \(\mu\)가 유한측도이면 좋겠는데, 이는 너무 강한 조건이다. 생각해보니까 모든 \(n\)에 대하여 \(\mu(A_n)<\infty\) 이기만 하면 되므로 유한측도가 아니더라도 시그마유한측도이면 충분할 것 같다.
3. \(\mu(A_n)\) 이라는 표현은 가능하고, 모든 \(n\)에 대해서는 \(\mu(A_n)<\infty\) 이지만, \(N \to \infty\) 일때 \(\sum_{n=1}^{N}\Big(a_n \times \mu(A_n)\Big)\) 이 수렴안하는 경우..
뭐 그럴수도 있지 않겠어요?.. \(1-2+4-8+16+\dots..\) 이런 경우??
주의: \(1+2+4+8+\dots\)와 같은 경우 그냥 \(\int f\mu = \infty\)로 정의하면 그만이므로 \(\int f\mu\) 라는 표현이 모순되는 문제는 없음.. 마찬가지로 \(-1-2-4-8\dots\)와 같은 경우도 그냥 \(\int f \mu = -\infty\)라고 하면 되므로 이 경우에도 \(\int f\mu\) 라는 표현이 모순되는 문제는 없음.. 그런데 예시의 수열의 경우 \(1+(-2+4)+(-8+16)+\dots\) 으로 해석하면 양의 무한대로 발산하고 \((1-2)+(4-8)+\dots\) 으로 해석하면 음의 무한대로 발산하므로 정의자체를 할 수 없음.
#
4. 르벡적분의 정의
A. 목표
- 개론: 두 개의 잴 수 있는 공간 \((\Omega, {\cal F})\), \((\mathbb{R}, {\cal R})\)을 고려하자. 함수 \(\mu:{\cal F} \to [0,\infty]\)을 \((\Omega, {\cal F})\) 에서 정의된 시그마유한측도라고 하자. 또한 함수 \(f\) 를 \((\Omega,{\cal F}) \to (\mathbb{R},{\cal R})\) measurable fucntion 이라고 하자. 이러한 조건하에서 아래와 같은 표현이 의미하는 값을 명확하게
\[\int f d\mu\]
정의하고 싶다.
여기에서 \(\int f d\mu\) 를 “\(f\) 의 \(\mu\)에 대한 적분 (intergral of \(f\) w.r.t. \(\mu\))” 이라고 부른다.
\(\int f d\mu\) 라는 기호를 논의하기 전에 (1) \(\mu\) 가 \(\sigma\)-finite msr on \((\Omega, {\cal F})\) 임을 체크해야하고 (2) \(f\)는 \((\Omega,{\cal F}) \to (\mathbb{R}, {\cal R})\) measurable function 임을 체크해야 한다. 이게 중요함!
B. \(f\) 가 simple function 일때
# 정의 – simple function
\((\Omega,{\cal F})\)가 잴 수 있는 공간이라고 하자. 서로소인 집합열 \(A_1,A_2, \dots, A_n {\cal F}\) 에 대한 지표함수의 유한가중합으로 표현되는 함수 \(f\) 를 simple function 이라고 한다. 즉 함수 \(f:\Omega \to \mathbb{R}\) 가 아래와 같이 표현된다면 \(f\) 를 simple function 이라고 한다.
\[f(\omega)=\sum_{i=1}^{n} a_i \mathbb{1}_{A_i}(\omega)\]
이때, \(a_1,a_2,\dots,a_n \in \mathbb{R}\) 이다.
#
# 약속: \(f(\omega)=\sum_{i=1}^{n} a_i \mathbb{1}_{A_i}(\omega)\) 를 간단히 아래와 같이 표현하기도 한다.
\[f=\sum_{i=1}^{n} a_i \mathbb{1}_{A_i}\]
# 이론: \(f(\omega)=\sum_{i=1}^{n}a_i \mathbb{1}_{A_i}(\omega)\) 는 \({\cal F}-{\cal R}\) measurable map 이다.
(증명)
\(n=2\) 일 때만 따져보자. \(f\) 의 상과 역상을 정리하면 아래와 같다.
| 역상 | 상 |
|---|---|
| \(\Omega-A_1-A_2\) | \(\{0\}\) |
| \(A_1\) | \(\{\alpha_1\}\) |
| \(A_2\) | \(\{\alpha_2\}\) |
| \(\Omega - A_2\) | \(\{0,\alpha_1\}\) |
| \(\Omega - A_1\) | \(\{0,\alpha_2\}\) |
| \(A_1 \uplus A_2\) | \(\{\alpha_1,\alpha_2\}\) |
| \(\Omega\) | \(\{0,\alpha_1,\alpha_2\}\) |
| \(\emptyset\) | . |
사고의 편의상 상과 역상을 서로 대응되는것 처럼 작성했지만 실제로는 꼭 대응되는 개념은 아님을 유의하라. 예를들어 \(A_1\)은 \(\{\alpha_1\}\) 의 역상이기도 하지만 \(\mathbb{R}-\{0,\alpha_2\}\) 의 역상이기도 하다. 따라서 사실 아래의 표가 더 정확하다.
| \(B ~(B \in {\cal R})\) | 역상 |
|---|---|
| \(0 \in B, \alpha_1 \notin B, \alpha_2 \notin B\) | \(\Omega-A_1-A_2\) |
| \(0 \notin B, \alpha_1 \in B, \alpha_2 \notin B\) | \(A_1\) |
| \(0 \notin B, \alpha_1 \notin B, \alpha_2 \in B\) | \(A_2\) |
| \(0 \in B, \alpha_1 \in B, \alpha_2 \notin B\) | \(\Omega - A_2\) |
| \(0 \in B, \alpha_1 \notin B, \alpha_2 \in B\) | \(\Omega - A_1\) |
| \(0 \notin B, \alpha_1 \in B, \alpha_2 \in B\) | \(A_1 \uplus A_2\) |
| \(0 \in B, \alpha_1 \in B, \alpha_2 \in B\) | \(\Omega\) |
| \(0 \notin B, \alpha_1 \notin B, \alpha_2 \notin B\) | \(\emptyset\) |
아무튼 발생가능한 모든 역상 8개의 역상이 \({\cal F}\) 의 원소이므로 \(f\) 는 \((\Omega, {\cal F}) \to (\mathbb{R},{\cal R})\) 인 잴 수 있는 함수이다.
#
# 정의1 (\(\star\)) – \(f\) 가 simple function일 경우 \(\int f d\mu\) 의 정의
시그마유한측도공간 \((\Omega,{\cal F},\mu)\) 를 고려하자. 만약 \(f:\Omega \to \mathbb{R}\) 가 simple function 이라면 (즉 \(f=\sum_{i=1}^{n}a_i \mathbb{1}_{A_i}\) 와 같이 표현가능하다면) 기호 \(\int f d\mu\) 의 값은 아래와 같이 정의한다.
\[\int f d\mu = \sum_{i=1}^{n}a_i \mu(A_i)\]
즉 기호 \(\int f d\mu\) 의 값은 \(\mu\)가 시그마유한이고 \(f\)가 simple function일 경우 모순되지 않게 항상 정의할 수 있다.
#
- 참고사항: 동일한 simple function \(f\) 에 대한 표현 \(\sum_{i=1}^{n}\alpha_i \mu(A_i)\) 는 유일하지 않다. (왜냐하면 \(\alpha_i\)가 서로 다른값이라는 가정을 한 것은 아니므로) 아래를 관찰하면 그 이유를 쉽게 알 수 있다.
\[a\mathbb{1}_{(0,2]}=a\mathbb{1}_{(0,1]}+a\mathbb{1}_{(1,2]}\]
하지만 앞으로의 논리전개에서 이러한 점은 별로 문제되지 않는다. 찝찝하다면 아래의 이론을 확인하고 넘어가도 무방.
# 이론 –
\((\Omega,{\cal F})\) 가 잴 수 있는 공간이라고 하자. 함수 \(\mu:{\cal F} \to [0,\infty]\)을 \((\Omega, {\cal F})\) 에서 정의된 \(\sigma\)-finite measure 라고 하자. 만약 \(f\) 를 아래와 같은 두가지 방법으로 표현 가능하다면
\[f=\sum_{i=1}^{n}a_i \mathbb{1}_{A_i}=\sum_{j=1}^{m}b_j \mathbb{1}_{B_j}\]
아래가 성립한다.
\[\int f d\mu =\sum_{i=1}^{n}a_i\mu(A_i)=\sum_{j=1}^{m}b_j \mu(B_j)\]
즉 \(f\) 가 서로 다른 형태의 simple function으로 표현될 수 있으나 \(\int f d\mu\) 가 지칭하는 값은 같다.
하여튼 \(f\)가 simple function일 경우는 \(\int f d\mu\) 가 의미하는 것이 아주 명확하다는 의미.
#
# 예제1 – 사각형의 넓이
두개의 잴 수 있는 공간 \((\mathbb{R}, {\cal R})\)와 \((\mathbb{R}, {\cal R})\)을 고려하자. \(\lambda:{\cal R} \to [0,\infty]\) 를 르벡메져라고 하자. 함수 \(f:\mathbb{R} \to \mathbb{R}\)를 아래와 같이 표현하자.
\[f(x) = \begin{cases} 1 & 0\leq x \leq 1 \\ 0 & o.w. \end{cases}\]
\(\int f d\lambda\) 잘 정의되는가? 만약 그렇다면 \(\int f d\lambda\)의 값은 어떻게 계산할 수 있는가?
note: 현재는 \((\Omega, {\cal F})=(\mathbb{R}, {\cal R})\)인 상황이다.
(풀이)
르벡메저는 시그마유한측도이고, \(f\) 는 simple function 이므로 \(\int f d\lambda\) 는 값을 모순없이 정의가능하며 그 값은
\[\int f d\lambda = 1 \times \lambda([0,1]) = 1\]
이다.
#
# 예제2 –
두개의 잴 수 있는 공간 \((\mathbb{R}, {\cal R})\)와 \((\mathbb{R}, {\cal R})\)을 고려하자. \(\lambda:{\cal R} \to [0,\infty]\)를 르벡메져라고 하자. 함수 \(f:\mathbb{R} \to \mathbb{R}\)를 아래와 같이 표현하자.
\[f(x) = \begin{cases} 1 & x \in [0,1] \cap \mathbb{Q} \\ 2 & x \in [0,1] \cap \mathbb{Q}^c \\ 0 & o.w. \end{cases}\]
\(\int f d\lambda\) 는 잘 정의되는가? 만약 그렇다면 \(\int f d\lambda\)의 값은 어떻게 계산할 수 있는가?
(풀이)
르벡메저는 시그마유한측도이다. 또한
| \(a_1=1\) | \(A_1=[0,1]\cap \mathbb{Q}\) |
| \(a_2=2\) | \(A_2=[0,1]\cap \mathbb{Q}^c\) |
와 같이 설정하면 \(f\)는 아래와 같이 표현가능하다.
\[f=\sum_{i=1}^{2} a_i\mathbb{1}_{A_i}\]
여기에서 \(A_1,A_2 \in {\cal R}\) 이고 \(a_1,a_2\)는 모두 실수 이므로 \(f\)는 simple function 이다. 따라서 \(\int f d\lambda\)의 값은 모순없이 아래의 값으로 정의할 수 있다.
\[\int f d\lambda = \sum_{i=1}^{n} a_i\lambda(A_i) = 1 \times \lambda\big([0,1]\cap \mathbb{Q} \big) + 2 \times \lambda\big([0,1]\cap\mathbb{Q}^c\big) = 2\]
#
D. \(f\) 가 non-negative function 일때
# 정의2 – \(f\) 가 non-negative function 일 경우 \(\int f d\mu\) 의 정의
시그마유한측도공간 \((\Omega,{\cal F}, \mu)\) 를 고려하자. 함수 \(f:(\Omega,{\cal F})\to(\mathbb{\bar R},\bar{\cal R})\) non-negative (w.r.t. \(\mu\)) measurable function 이라고 하고 \(\varphi: \Omega \to \mathbb{R}\) 를 simple function이라고 하자. 이 경우 기호 \(\int f d\mu\) 의 값은 아래와 같이 정의한다.
\[\int f d\mu := \sup\Big\{\int \varphi d\mu: 0\leq \varphi \leq f, ~\text{a.e. with respect to } \mu \Big\}\]
즉 기호 \(\int f d\mu\) 의 값은 \(\mu\) 가 시그마유한이고 \(f\) 가 non-negative (w.r.t. \(\mu\)) 일 경우 모순되지 않게 항상 정의할 수 있다.
#
- 참고: \(\sup\)은 항상 잘 정의됩니다..
E. \(f\) 가 measurable function 일때
# 예비학습
1 임의의 함수 \(f:\Omega \to \mathbb{R}\)에 대하여 아래와 같은 함수를 관찰하자.
- \(f^+ = \max(0,f)\)
- \(f^- = \max(0,-f)\)
함수 \(f^+\) 와 \(f^-\)는 아래의 성질이 성립한다.
- \(f^+, f^-\) 는 모두 양수이다.
- \(|f| = f^+ + f^-\)
- \(f = f^+ - f^-\)
2 외우세요 그냥
만약에 \(f:(\Omega, {\cal F}) \to (\bar{\mathbb{R}},\bar{{\cal R}})\) 이면
- \(f^+: (\Omega, {\cal F}) \to (\bar{\mathbb{R}},\bar{{\cal R}})\)
- \(f^-: (\Omega, {\cal F}) \to (\bar{\mathbb{R}},\bar{{\cal R}})\)
이다.
(증명) 그냥 받아들이세요
#
- 지금까지의 스토리: \(\sigma\)-finite measurable space \((\Omega, {\cal F}, \mu)\) 를 고려하자. 아래의 경우 \(\int f d\mu\) 의 값이 모순없이 잘 정의되었다.
- \(f:(\Omega, {\cal F}) \to (\mathbb{R}, {\cal R})\) 인 simple function
- \(f:(\Omega, {\cal F}) \to (\bar{\mathbb{R}}, \bar{{\cal R}})\) 인 non-negative (w.r.t. \(\mu\)) measurable function
이제 일반적인 \(f:(\Omega,{\cal F}) \to (\bar{\mathbb{R}}, \bar{{\cal R}})\) 에 대하여 \(\int f d\mu\) 의 값이 모순없이 잘 정의되는지 살펴보겠다.
#
# 정의3 –
시그마유한측도공간 \((\Omega, {\cal F}, \mu)\) 를 고려하자. 가측함수 \(f:(\Omega, {\cal F}) \to (\bar{\mathbb{R}},\bar{{\cal R}})\) 의 \(\mu\)에 대한 적분 (intergral of \(f\) w.r.t. \(\mu\)) 은 아래와 같이 생각할 수 있다.
\[\int f d\mu := \int f^+ d\mu - \int f^- d\mu\]
이 값은 잘 정의될 수도 있고, 그렇지 않을 수도 있다. 구체적으로 아래와 같다.
- \(\int f^+ d\mu < \infty\) and \(\int f^- d\mu < \infty\) \(\Rightarrow\) \(\int f d\mu = \int f^+ d\mu - \int f^- d\mu\) 로 정의
- \(\int f^+ d\mu = \infty\) and \(\int f^- d\mu < \infty\) \(\Rightarrow\) \(\int f d\mu = \infty\) 로 정의
- \(\int f^+ d\mu < \infty\) and \(\int f^- d\mu = \infty\) \(\Rightarrow\) \(\int f d\mu = -\infty\) 로 정의
- \(\int f^+ d\mu = \infty\) and \(\int f^- d\mu = \infty\) \(\Rightarrow\) \(\int f d\mu\) 는 정의할 수 없음.
이중에서 1,2,3에 해당하는 경우는 “\(\int f d\mu\)가 존재한다 (exist)” 고 표현하며, 4의 경우는 “\(\int f d\mu\) 가 존재하지 않는다”고 표현한다. 이때 1의 경우를 특별하게 “\(f\) is integrable w.r.t. \(\mu\)” 라고 표현한다.
헷갈려: 언뜻 생각하면 “\(f\)가 \(\mu\)에 대하여 적분가능하지 않다”라는 의미가 “\(\int f d\mu\) 의 값을 모순없이 잘 정의할 수 없다” 라는 의미로 이해할 수 있는데 그렇지 않다.
- 위의 정의에서 \(\int f^+ d\mu\) 혹은 \(\int f^- d\mu\) 라는 표현이 잘 정의되는 이유는 \(f^+, f^-\)이 모두 \((\Omega, {\cal F}) \to (\mathbb{R}, {\cal R})\)인 non-negative (w.r.t. \(\mu\)) function 이기 때문이다.
5. 시벤코정리
- ref: Approximation by Superpositions of a Sigmoidal Function (Cybenko 1989)
- meaure, measurable function, \(\int_E f(x)d\mu(x)\) 의 표현이 등장
- 임의의 연속함수 \(f\) 를 sigmoidal function의 가중합으로 근사가능하다는 의미