12wk: 적분 (2)
강의영상
youtube: https://youtube.com/playlist?list=PLQqh36zP38-xwz12M1ec2nmB2kDOpzoXj
적분
-
ref: Durrett (2019), Sec 1.4
-
개론: 두 개의 잴 수 있는 공간 \((\Omega, {\cal F})\), \((\mathbb{R}, {\cal R})\)을 고려하자. 함수 \(\mu:{\cal F} \to [0,\infty]\)을 \((\Omega, {\cal F})\)에서 정의된 \(\sigma\)-finite measure 라고 하자. 또한 함수 \(f\)를 \({\cal F}-{\cal R}\) measurable fucntion 이라고 하자. 이러한 공간에서 아래와 같은 표현
\[\int f d\mu\]
을 정의하고자 한다.
simple function
-
정의: \((\Omega,{\cal F})\)가 잴 수 있는 공간이라고 하자. 함수 \(f:\Omega \to \mathbb{R}\)가 아래와 같이 표현된다면 \(f\)를 simple function 이라고 한다.
\[f(\omega)=\sum_{i=1}^{n} \alpha_i \mathbb{1}_{A_i}(\omega)\]
여기에서 \(A_1,A_2,\dots, A_n \in {\cal F}\) 은 서로소인 집합열, \(\mathbb{1}_{A_1} = \begin{cases} 1 & \omega \in A_1 \\ 0 & \omega \not \in A_1 \end{cases}\), 그리고 \(\alpha_1,\alpha_2,\dots, \alpha_n \in \mathbb{R}\) 이다. 보통은 위를 간단하게 아래와 같이 사용한다.
\[f = \sum_{i=1}^{n} \alpha_i \mathbb{1}_{A_i}\]
-
이론: \(f\)는 \({\cal F}-{\cal R}\) measurable map 이다.
-
Note: 가측공간 \((\Omega, {\cal F})\)에서 정의된 가측함수 \(f\)가 finite한 치역을 가진다면 \(f\)는 simple function 이다.
-
정의: \((\Omega,{\cal F})\)가 잴 수 있는 공간이라고 하자. 함수 \(\mu:{\cal F} \to [0,\infty]\)을 \((\Omega, {\cal F})\)에서 정의된 \(\sigma\)-finite measure 라고 하자. 또한 함수 \(f\)를 \({\cal F}-{\cal R}\) measurable fucntion 이라고 하자. 만약 \(f\)가 아래와 같이 표현된다면
\[f=\sum_{i=1}^{n}\alpha_i \mathbb{1}_{A_i}\]
즉, \(f\)가 simple function 이라면 “\(f\)의 \(\mu\)에 대한 적분 (intergral of \(f\) w.r.t. \(\mu\))”을 아래와 같이 정의한다.
\[\int f d\mu = \sum_{i=1}^{n}\alpha_i \mu(A_i)\]
-
참고: 동일한 simple function \(f\)에 대한 표현 \(\sum_{i=1}^{n}\alpha_i \mu(A_i)\) 는 유일하지 않다. (왜냐하면 \(\alpha_i\)가 서로 다른값이라는 가정을 한 것은 아니므로) 아래를 관찰하면 그 이유를 쉽게 알 수 있다.
\[\alpha\mathbb{1}_{(0,2]}=\alpha\mathbb{1}_{(0,1]}+\alpha\mathbb{1}_{(1,2]}\]
하지만 앞으로의 논리전개에서 이러한 점은 별로 문제되지 않는다. 찝찝하다면 아래의 이론을 확인하고 넘어가도 무방.
-
이론: \((\Omega,{\cal F})\)가 잴 수 있는 공간이라고 하자. 함수 \(\mu:{\cal F} \to [0,\infty]\)을 \((\Omega, {\cal F})\)에서 정의된 \(\sigma\)-finite measure 라고 하자. 또한 함수 \(f\)를 \({\cal F}-{\cal R}\) measurable fucntion 이라고 하자. 만약 \(f\)를 아래와 같은 두가지 방법으로 표현 가능하다면
\[f=\sum_{i=1}^{m}\alpha_i \mathbb{1}_{A_i}=\sum_{j=1}^{n}\beta_j \mathbb{1}_{B_j}\]
아래가 성립한다.
\[\sum_{i=1}^{m}\alpha_i\mu(A_i)=\sum_{j=1}^{n}\beta_j \mu(B_j)\]
즉 \(f\)가 서로 다른 형태의 simple function으로 표현될 수 있으나 \(\int f d\mu\)가 지칭하는 값은 같다.
-
하여튼 \(f\)가 simple function일 경우는 \(\int f d\mu\) 가 의미하는 것이 아주 명확하다는 의미.
-
(예제1) – 사각형의 넓이
두개의 잴 수 있는 공간 \((\mathbb{R}, {\cal R})\)와 \((\mathbb{R}, {\cal R})\)을 고려하자. \(\lambda:{\cal R} \to [0,\infty]\)를 르벡메져라고 하자. 함수 \(f:\mathbb{R} \to \mathbb{R}\)를 아래와 같이 표현하자.
\[f(x) = \begin{cases} 1 & 0\leq x \leq 1 \\ 0 & o.w. \end{cases}\]
\(\int f d\lambda\) 는 잘 정의되는가? 만약 그렇다면 \(\int f d\lambda\)의 값은 어떻게 계산할 수 있는가?
note: 현재는 \((\Omega, {\cal F})=(\mathbb{R}, {\cal R})\)인 상황이다.
(해설)
- \(\lambda\)는 \((\mathbb{R}, {\cal R})\)에서의 시그마유한측도이다.
- \(A=[0,1]\) 일때 함수 \(f\)는 \(f(x) = 1\times \mathbb{1}_A(x)\) 이므로 \(f\)는 simple function 이고 따라서 \({\cal R}-{\cal R}\) 가측함수이다.
- 1-2에 의하여 우선 \(f\)와 \(\lambda\)는 \(\int f d\lambda\)라는 기호를 논의할 자격이 있다.
- \(f\)가 simple function 일 경우는 \(\int f d\lambda\) 의 값이 잘 정의되며 그 값은 \(\lambda(A)=1\)이다.
-
(예제2) –
두개의 잴 수 있는 공간 \((\mathbb{R}, {\cal R})\)와 \((\mathbb{R}, {\cal R})\)을 고려하자. \(\lambda:{\cal R} \to [0,\infty]\)를 르벡메져라고 하자. 함수 \(f:\mathbb{R} \to \mathbb{R}\)를 아래와 같이 표현하자.
\[f(x) = \begin{cases} 1 & x \in [0,1] \cap \mathbb{Q} \\ 2 & x \in [0,1] \cap \mathbb{Q}^c \\ 0 & o.w. \end{cases}\]
\(\int f d\lambda\) 는 잘 정의되는가? 만약 그렇다면 \(\int f d\lambda\)의 값은 어떻게 계산할 수 있는가?
(해설)
- \(\lambda\)는 \((\mathbb{R}, {\cal R})\)에서의 시그마유한측도이다.
- \(A_1=[0,1]\cap \mathbb{Q}\), \(A_2=[0,1]\cap \mathbb{Q}^c\) 일때 함수 \(f\)는 \(f(x) = 1\times \mathbb{1}_{A_1}(x)+ 2\times \mathbb{1}_{A_2}(x)\) 이므로 \(f\)는 simple function 이고 따라서 \({\cal R}-{\cal R}\) 가측함수이다.
- 1-2에 의하여 우선 \(f\)와 \(\lambda\)는 \(\int f d\lambda\)라는 기호를 논의할 자격이 있다.
- \(f\)가 simple function 일 경우는 \(\int f d\lambda\) 의 값이 잘 정의되며 그 값은 \(\lambda(A_1)+2\lambda(A_2)=2\)이다.
-
앞으로의 논리전개: \(f\)를 simple function을 이용하여 근사할 수 있을 경우 르벡적분값 \(\int f d\mu\)가 모순없이 잘 정의됨.
non-negative function
-
정의: \((\Omega,{\cal F})\)가 잴 수 있는 공간이라고 하자. 함수 \(\mu:{\cal F} \to [0,\infty]\)을 \((\Omega, {\cal F})\)에서 정의된 \(\sigma\)-finite measure 라고 하자. 또한 함수 \(f:(\Omega,{\cal F})\to(\mathbb{R},{\cal R})\) non-negative (w.r.t. \(\mu\)) function 이라고 하고 \(\varphi:(\Omega,{\cal F})\to(\mathbb{R},{\cal R})\) simple function이라고 하자. 그러면 “\(f\)의 \(\mu\)에 대한 적분 (intergral of \(f\) w.r.t. \(\mu\))”을 아래와 같이 정의할 수 있다.
\[\int f d\mu := \sup\Big\{\int \varphi d\mu: 0\leq \varphi \leq f, ~\text{a.e. with respect to } \mu \Big\}\]
-
정의상 \(\int f d\mu\)는 무한대의 값을 가질 수 있다. 이 경우에도 \(\int f d\mu\)의 값은 모순 없이 잘 정의된다.
-
(예제1)
두개의 잴 수 있는 공간 \((\mathbb{R}, {\cal R})\)와 \((\mathbb{R}, {\cal R})\)을 고려하자. \(\lambda:{\cal R} \to [0,\infty]\)를 르벡메져라고 하자. 함수 \(f:\mathbb{R} \to \mathbb{R}\)를 아래와 같이 표현하자.
\[f(x) = \begin{cases} x & x \in [0,1] \\ 0 & o.w. \end{cases}\]
\(\int f d\lambda\) 는 잘 정의되는가? 만약 그렇다면 \(\int f d\lambda\)의 값은 어떻게 계산할 수 있는가?
(해설)
- \(\lambda\)는 \((\mathbb{R}, {\cal R})\)에서의 시그마유한측도이다.
- \(f(x)\)는 가측함수이다.
- 따라서 \(\int f d\mu\)라는 기호를 논의할 자격은 있다.
- 1에서 0으로 등간격으로 감소하고 길이가 \(n\)인 적당한 수열 \(a_1,\dots,a_n\)에 대하여 서로소인 집합열 \(A_n = \{x: f(x)>a_n\}-A_{n-1}\) 를 설정하자. 단 \(A_0=\emptyset\).
- 함수 \(\varphi_n(x)=\sum_{k=1}^{n} a_k \times \mathbb{1}_{A_k}(x)\)를 고려하자.
- 이때 \(0\leq \varphi_n(x) \leq f\) a.e. w.r.t. \(\lambda\).
- 모든 \(n \in \mathbb{N}\) 에 대하여 \(\int \varphi_nd \lambda\)의 값은 잘 정의된다. (simple function 이므로)
- 따라서 집합 \(\big\{\int \varphi_n(x)d\lambda\big\}\) 역시 잘 정의되며 \(\sup\big\{\int \varphi_n(x)d\lambda\big\}=\frac{1}{2}\) 역시 잘 정의된다.
-
임의의 양의함수에 대하여서도 아래와 같은 방식으로 근사할 수 있다.
measurable function
-
지금까지의 스토리: \(\sigma\)-finite measurable space \((\Omega, {\cal F}, \mu)\) 를 고려하자. 아래의 경우 \(\int f d\mu\) 의 값이 모순없이 잘 정의되었다.
- \(f:(\Omega, {\cal F}) \to (\mathbb{R}, {\cal R})\)인 simple function
- \(f:(\Omega, {\cal F}) \to (\mathbb{R}, {\cal R})\)인 non-negative (w.r.t. \(\mu\)) function
이제 일반적인 \(f:(\Omega,{\cal F}) \to (\mathbb{R}, {\cal R})\) 에 대하여 \(\int f d\mu\) 의 값이 모순없이 잘 정의되는 조건을 살펴보겠다.
-
임의의 함수 \(f:\Omega \to \mathbb{R}\)에 대하여 아래와 같은 함수를 관찰하자.
- \(f^+ = \max(0,f)\)
- \(f^- = \max(0,-f)\)
함수 \(f^+\) 와 \(f^-\)는 아래의 성질이 성립한다.
- \(f^+, f^-\) 는 모두 양수이다.
- \(|f| = f^+ + f^-\)
- \(f = f^+ - f^-\)
-
이론 만약에 \(f:(\Omega, {\cal F}) \to (\mathbb{R},{\cal R})\) 이면
- \(f^+: (\Omega, {\cal F}) \to (\mathbb{R},{\cal R})\)
- \(f^: (\Omega, {\cal F}) \to (\mathbb{R},{\cal R})\)
이다.
-
정의: \(\sigma\)-finite measurable space \((\Omega, {\cal F}, \mu)\) 를 고려하자. 일반적인 가측함수 \(f:(\Omega, {\cal F}) \to (\mathbb{R},{\cal R})\)의 \(\mu\)에 대한 적분 (intergral of \(f\) w.r.t. \(\mu\)) 은 아래와 같이 생각할 수 있다.
\[\int f d\mu := \int f^+ d\mu - \int f^- d\mu\]
이 값은 잘 정의될 수도 있고, 그렇지 않을 수도 있다. 구체적으로 아래와 같다.
- \(\int f^+ d\mu < \infty\) and \(\int f^- d\mu < \infty\) \(\Rightarrow\) \(\int f d\mu = \int f^+ d\mu - \int f^- d\mu\) 로 정의
- \(\int f^+ d\mu = \infty\) and \(\int f^- d\mu < \infty\) \(\Rightarrow\) \(\int f d\mu = \infty\) 로 정의
- \(\int f^+ d\mu < \infty\) and \(\int f^- d\mu = \infty\) \(\Rightarrow\) \(\int f d\mu = -\infty\) 로 정의
- \(\int f^+ d\mu = \infty\) and \(\int f^- d\mu = \infty\) \(\Rightarrow\) \(\int f d\mu\) 는 정의할 수 없음.
이중에서 1,2,3에 해당하는 경우는 “\(\int f d\mu\)가 존재한다 (exist)” 고 표현하며, 4의 경우는 “\(\int f d\mu\) 가 존재하지 않는다”고 표현한다. 이때 1의 경우를 특별하게 “\(f\) is integrable w.r.t. \(\mu\)” 라고 표현한다.
헷갈려: 언뜻 생각하면 “\(f\)가 \(\mu\)에 대하여 적분가능하지 않다”라는 의미가 “\(\int f d\mu\) 의 값을 모순없이 잘 정의할 수 없다” 라는 의미로 이해할 수 있는데 그렇지 않다.
-
위의 정의에서 \(\int f^+ d\mu\) 혹은 \(\int f^- d\mu\) 라는 표현이 잘 정의되는 이유는 \(f^+, f^-\)이 모두 \((\Omega, {\cal F}) \to \mathbb{R}, {\cal R})\)인 non-negative (w.r.t. \(\mu\)) function 이기 때문이다.
NOTATIONS (\(\star\star\star\star\star\))
-
\((\Omega, {\cal F}, \mu)\) 가 \((\mathbb{R}, {\cal R}, \lambda)\) 이면
- \(\int f(x)dx = \int f d\lambda\)
- \(\int_a^b f(x)dx = \int_E fd\lambda\)
와 같이 사용한다. 단, 여기에서 \(E=[a,b]\). (Durrett 2019, p 23)
-
\(\int_E fd\lambda\)는 종종
- \(\int_E f(x)\lambda(dx)=\int_E f(x)d\lambda(x)\)
- \(\int_E f(y)\lambda(dy)=\int_E f(y)d\lambda(y)\)
와 같이 표현하기도 한다. 이러한 표현은 때때로 유용하다. 예를들어
- \(\int_{(0,1)}x^y \lambda(dx)=\int_{(0,1)}x^y d\lambda(x)\) 는 함수 \(x \mapsto x^y\) 에 대한 적분을
- \(\int_{(0,1)}x^y \lambda(dy)=\int_{(0,1)}x^y d\lambda(y)\) 는 함수 \(y \mapsto x^y\) 에 대한 적분을
의미한다. (Makarov and Podkorytov 2013, p 125), (Durrett 2019, p 32, p 38)
-
\((\Omega, {\cal F}, \mu)\) 가 \((\mathbb{R}, {\cal R}, \mu_X)\) 이고 \(F_X = \mu_X((-\infty,x])\) 라면
- \(\int g d\mu_X= \int g dF_X= \int g(x) dF_X(x)\)
와 같이 사용할 수 있다. 만약에 \(F_X(x)\)가 density function \(f_X(x)\)를 가진다면
- \(\int g(x) dF_X(x) = \int g(x)f_X(x)dx\)
와 같이 사용할 수 있다. 표현 \(\int g(x) dF_X(x)\) 와 \(\int g(x)f_X(x)dx\) 는 모두 \(\mathbb{E}[g(X)]\) 를 의미하지만 \(\int g(x) dF_X(x)\)는 확률변수 \(X\)의 density가 존재하지 않을 때에도 표현가능하다는 장점이 있다. (Durrett 2019, p 23)
-
\((\Omega,{\cal F},\mu)\) 에서
- \(\Omega\): a countable set
- \({\cal F}\): \(2^\Omega\)
- \(\#\): counting measure
라고 하자. 그러면
- \(\int f d\# = \sum_{i \in \Omega} f(i)\)
이 성립한다. (Durrett 2019, p 23)
-
예시1: \((\mathbb{N}, 2^{\mathbb{N}}, \#)\) 를 고려하자. 여기에서 \(\#\)는 counting measure 이다. 그렇다면
\[\sum_{i=1}^{\infty} 1/2^n = \int 1/2^n d\#\]
와 같이 표현할 수 있다. 이는 이전에 수행하였던 르벡적분이
- 치역을 쪼갠다.
- 쪼개진 치역에 대한 정의역의 길이를 측정한다.
- 1과 2를 곱한뒤 모두 더한다
의 과정을 수행한다는 사실을 떠올리면 쉽게 이해할 수 있다.
-
가장 중요한 응용: \((\Omega, {\cal F}, \mu)\)가 확률공간일 경우!
시벤코정리
-
ref: Approximation by Superpositions of a Sigmoidal Function (Cybenko 1989)
-
meaure, measurable function, \(\int_E f(x)d\mu(x)\) 의 표현이 등장
-
임의의 연속함수 \(f\)를 sigmoidal function의 가중합으로 근사가능하다는 의미