10wk: 분포와 분포함수, 밀도함수는 어려워, 르벡적분 맛보기1

Author

최규빈

Published

November 14, 2024

1. 강의영상

2. Preview

- 확률변수 \(X\)\(\Omega\)의 모든 원소를 적절한 숫자로 “잘” 연결하는 어떠한 맵핑이라는 느낌은 이해했다. 하지만 말 그대로 확률변수 \(X\)는 두 measurable space \((\Omega, {\cal F})\)\((\mathbb{R},{\cal R})\)을 잘 연결하는 어떠한 맵핑일 뿐이라서 우리가 그동안 가지고 있던 “랜덤성”에 대한 정의는 \(X\)에서 빠져있다. 즉 \(\omega \in \Omega\)의 값이 고정이면 \(X(\omega)\)의 값도 고정이다. 하지만 우리는 \(X\)가 랜덤으로 숫자가 바뀌는 (잘못된) 느낌을 가지고 살고 있었는데, 그렇다면 이러한 “랜덤성”은 어디에서 비롯한 것일까?

- \(X\)의 입력이 결정되면 출력이 고정되므로 \(X\)가 가지고 있는 “출력이 랜덤으로 변화하는 느낌”을 위해서는 함수 \(X\)의 입력 \(\omega\)가 랜덤으로 변화해야 한다. 이렇게 \(\omega\)를 랜덤하게 선택할 수 있게 만들어주는 장치가 확률측도 \(\mathbb{P}\)이며 \(\mathbb{P}(\{\omega\})\)\(\Omega\)에서 \(\{\omega\}\)가 선택될 확률을 의미한다. 따라서 \(\mathbb{P}\)\(\omega\)를 랜덤으로 선택할 수 있게 해주고 그 결과 \(X(\omega)\)의 출력 역시 랜덤하게 나올 수 있도록 해준다.

- 저번시간에서는 \(X\)에 초점을 맞추었다. 즉 \(\Omega\)\(\mathbb{R}\)을 “잘 연결” 하는 작업에 초점을 맞추었다. 그 결과 \(X\)의 임의의 inverse image에 대하여 \(\mathbb{P}\)로 그 길이를 재는데 모순됨이 없도록 하였다.

- 이번시간에는 \(P\)가 가지는 랜덤성에 초점을 맞추도록 하겠다. 특히 서로 다른 확률공간 \((\Omega, {\cal F}, \mathbb{P})\)\((\Omega',{\cal F}',\mathbb{P}')\) 이 비슷한 랜덤성을 가질때, 이러한 랜덤성을 효과적으로 서술하는 “분포”라는 개념을 구체화하고 나아가 “분포함수”, “밀도함수”의 개념을 소개한다.

3. 분포 (distribution)

# 예제1 – 동전예제

동전을 던지는 예제로 만들어지는 아래와 같은 확률공간 \((\Omega,{\cal F},\mathbb{P})\) 를 생각하자.

  • \(\Omega = \{H,T\}\)
  • \({\cal F} = 2^\Omega\)
  • \(\mathbb{P}(\{H\})=\mathbb{P}(\{T\})=\frac{1}{2}\)1
  • 1 이렇게만 해도 확률이 정의되는 이유는 카라테오도리 확장정리 덕분

  • 확률변수 \(X:\Omega \to \mathbb{R}\)를 아래와 같이 정의하자.

    • \(X(H)=1\)
    • \(X(T)=0\)

    이제 \(B \in {\cal R}\) 에 대하여 아래와 같은 표현들을 고려하자.

    1. \(\mathbb{P}(X \in B)\) // 친숙한 표현
    2. \(\mathbb{P}(\{\omega: X(\omega) \in B\})\) // 1의 엄밀한 표현
    3. \(\mathbb{P}(X^{-1}(B))\) // 2의 다른 버전, inverse image의 느낌이 확 살아 있음. 여기에서 \(X^{-1}: {\cal R} \to {\cal F}\) 인 함수로 생각하자.
    4. \((\mathbb{P} \circ X^{-1})(B)\) // 생각해보니까 이것도 가능함. \(\mathbb{P}\), \(X^{-1}\) 모두 함수였잖아?

    표현4를 좀 더 살펴보자. 기호를 간단하게 하기위해서 \(\mu_X:=\mathbb{P}\circ X^{-1}\)로 정의하자. (정의에 따라서 \(\mu_X\)\({\cal R}\to [0,1]\)인 집합함수가 된다.)

    • \(\mathbb{P}(\emptyset) = 0 \Leftrightarrow \mu_X(\mathbb{R}-\{0,1\}) = 0\)
    • \(\mathbb{P}(\{H\}) = \frac{1}{2} \Leftrightarrow \mu_X(\{0\}) = \frac{1}{2}\)
    • \(\mathbb{P}(\{T\}) = \frac{1}{2} \Leftrightarrow \mu_X(\{1\}) = \frac{1}{2}\)
    • \(\mathbb{P}(\{H,T\}) = 1 \Leftrightarrow \mu_X(\{0,1\}) = 1\)

    #

    # 예제2 – 주머니 예제

    주머니에 하얀공과 빨간공이 하나씩 있다고 하자. 주머니에 손을 넣어 이중 하나의 공을 뽑는 시행을 한다고 하자. 이러한 상황으로 만들어지는 아래와 같은 확률공간 \((\Omega,{\cal F},\mathbb{P})\) 를 생각하자.

    • \(\Omega = \{R,W\}\)
    • \({\cal F} = 2^\Omega\)
    • \(\mathbb{P}(\{R\})=\mathbb{P}(\{W\})=\frac{1}{2}\)

    확률변수 \(X:\Omega \to \mathbb{R}\)를 아래와 같이 정의하자.

    • \(X(R)=1\)
    • \(X(W)=0\)

    이제 \(B \in {\cal R}\) 에 대하여 아래와 같은 표현들을 고려하자.

    1. \(\mathbb{P}(X \in B)\)
    2. \((\mathbb{P} \circ X^{-1})(B)=\mu_X(B)\)

    두 표현을 비교하여 살펴보자.

    • \(\mathbb{P}(\emptyset) = 0 \Leftrightarrow \mu_X(\mathbb{R}-\{0,1\}) = 0\)
    • \(\mathbb{P}(\{R\}) = \frac{1}{2} \Leftrightarrow \mu_X(\{0\}) = \frac{1}{2}\)
    • \(\mathbb{P}(\{W\}) = \frac{1}{2} \Leftrightarrow \mu_X(\{1\}) = \frac{1}{2}\)
    • \(\mathbb{P}(\{R,W\}) = 1 \Leftrightarrow \mu_X(\{0,1\}) = 1\)

    #

    # 생각의 시간1: 예제1,2를 관찰하며 생각

    예제1과 예제2는 분명히 다른예제이다. 하지만 사실 같은 예제인 것 같다는 느낌이 있다. 구체적으로 “확률과 관련된 시행이 어떠한 결과로 나타나는지”에 관련한 본질적인 면에서 같다 느껴진다. (우리는 이것을 “분포가 같다”라 부르기로 했어요)

    • 예제1,2의 차이점: Outcome, event, \(\sigma\)-field, \(\mathbb{P}\), \(X\)가 다름.
    • 예제1,2의 공통점: \(\mu_X\)는 똑같음!
    • 아이디어: \(\mu_X\)\(\mathbb{P}\) 보다 예제1,2의 공통속성 (우리가 이미 “분포”라고 알고 있는 개념) 을 나타내기에 유리한 것 같은데?

    #

    # 생각의 시간2: \(\mu_X:{\cal R} \to [0,1]\) 는 언제나 모순없이 잘 정의되는가?

    이론?: \((\Omega,{\cal F}, \mathbb{P})\)가 확률공간이고 \(X:\Omega \to \mathbb{R}\)이 확률변수라면, \(\mu_X:=\mathbb{P}\circ X^{-1}\)는 언제나 잘 정의된다.

    • 시그마필드: 모든 \(B \in {\cal R}\)에 대하여 \(X^{-1}(B)\)가 시그마필드의 원소가 아닐 수 없다. (만약 그렇다면 \(X\)는 확률변수가 아닌걸?)
    • 메져: 모든 \(B \in {\cal R}\)에 대하여 \(\mathbb{P}(X^{-1}(B))\)의 값을 모순되게 정의할 수 없다. (만약 그렇다면 \((\Omega, {\cal F}, P)\)는 확률공간이 아닌걸?)

    결론: \(\mu_X\)는 안전해!

    #

    # 생각의 시간3: \(\mu_X:{\cal R} \to [0,1]\) 는 확률측도의 조건을 만족한다. 구체적으로는 \((\mathbb{R}, {\cal R})\)에서의 확률측도가 된다. 아래를 체크하자.

    1. 정의역: \(\mu_X\)는 시그마필드를 정의역으로 가진다.
    2. 함수값: \(\mu_X(\emptyset)=0\), \(\mu_X(\mathbb{R})=1\) 이며 \(\mu_X(\cdot)\)은 항상 양의값을 가진다.
    3. \(\sigma\)-add: \(\mu_X\)\({\cal R}\)의 모든 서로소인 집합에 대하여 \(\sigma\)-additivity 가 성립한다.2
  • 2 서로소인 두 집합 \(A,B \in {\cal R}\) 에서의 inverse image는 겹치지 않죠, 귀류법을 써서 겹친다고 가정하고 논리전개하면 \(X\)가 함수가 아니게 되어 모순이 됩니다

  • 따라서 \(\mathbb{P}\)\((\Omega,{\cal F})\)에서의 확률측도이듯이 \(\mu_X\)\((\mathbb{R}, {\cal R})\)에서의 확률측도이다.

    #

    # 정의: \(X\)를 확률공간 \((\Omega, {\cal F}, \mathbb{P})\)에서 정의된 확률변수라고 하자. 이때 \(\mu_X:=P \circ X^{-1}\)로 정의가능한 함수 \(\mu_X: {\cal R} \to [0,1]\)\(X\)의 distribution 라고 부른다.

    여기에서 “\(X\)를 확률공간 \((\Omega, {\cal F}, \mathbb{P})\)에서의 확률변수”라는 말이 얼마나 많은 구질구질한 선언을 대신 하는지 생각해보라. 제대로 쓰려면 아마

    \(\Omega\)를 어떠한 실험에 의하여 발생한 outcome들의 집합이라고 하자. 그리고 \({\cal F}\)\(\Omega\)에 대한 시그마필드라고 하자. 즉 \({\cal F}\)는 … 을 만족하는 집합이다. \((\Omega, {\cal F})\)을 묶어서 가측공간이라고 하자. \(\mathbb{P}\)는 잴 수 있는 공간 \((\Omega, {\cal F})\)에 대한 확률측도라고 하자. 즉 \(\mathbb{P}\)는 … 를 만족하는 함수이다. 그리고 \(X\)\((\Omega,{\cal F}) \to (\mathbb{R}, {\cal R})\)인 확률변수라고 하자. 즉 \(X\)는 임의의 \(B \in {\cal R}\)에 대하여 … 를 만족하는 함수이다. 여기에서 \({\cal R}\)은 Borel \(\sigma\)-field이다. 즉 \({\cal R}\)은 … 를 만족하는 집합이다.”

    와 같은 방식으로 써야할 것이다.

    #

    - \(\mu_X\)\((\mathbb{R}, {\cal R})\)에서의 확률측도이므로 \((\mathbb{R},{\cal R},\mu_X)\)는 확률공간이 된다. 그런데 \(\mu_X\)\(X\)에 의하여 정의되므로, 확률공간 \((\mathbb{R},{\cal R},\mu_X)\) 역시 \(X\)에 의하여 정의되는데 이러한 이유로 확률공간 \((\mathbb{R}, {\cal R}, \mu_X)\)\(X\)에 의하여 유도된 확률공간이라고 표현하기도 한다.

    - \((\mathbb{R}, {\cal R}, \mu_X)\)\(X\)에 의하여 유도된 확률공간이라는 선언의 숨은 의미3: 함수 \(X\)가 잘 정의된다면 (\(X\)가 확률변수라면!) 공간 \((\Omega, {\cal F}, P)\)와 공간 \((\mathbb{R}, {\cal R}, \mu_X)\)는 대등한 역할을 한다. 즉 \(\Omega\)의 임의의 원소는 \(\mathbb{R}\)의 임의의 원소로 바꾸어 생각할 수 있고, \({\cal F}\)의 임의의 원소는 \({\cal R}\)의 임의의 원소로 대치할 수 있으며, \({\cal F}\)의 임의의 원소(event)를 측도 \(\mathbb{P}\)로 재는 일은 \({\cal R}\)의 임의의 원소를 측도 \(\mu_X\)로 재는 일과 동치로 해석할 수 있다.

  • 3 사실 교재가 숨긴적은 없고요, 제가 그냥 몰랐던거에요.

  • 4. 분포함수 (distribution function)

    - 모티브: \(\mu_X:{\cal R} \to [0,1]\) 는 정의역이 집합이라서 아쉬움. (솔직히 우리한테 친숙한 형태는 아님) 만약에

    • 집합 \(\to\) 숫자

    와 같은 방식으로 랜덤성을 정의하지 않고

    • 숫자 \(\to\) 숫자

    와 같은 방식으로 랜덤성을 정의할 수 있다면 어떨까?

    - 결국 랜덤성을 기술하려면 \(\mathbb{P}\) 를 기술해야한다. 그런데 \(\mathbb{P}\) 를 기술하기가 좀 까다로울 경우가 많은데 그것을 단순화 하기 위한 노력의 시작은 카라테오도리의 확장정리였다.4 그리고 이 노력의 마지막은 이제 소개하는 분포함수이다.

  • 4 이 정리가 없었다면 단순히 주사위를 던지는 사건에 대한 \(\mathbb{P}\) 를 기술하기 위해서 \(2^6\)개의 모든 \({\cal F}=2^\Omega, \Omega=\{1,2,3,4,5,6\}\)에 대하여 “집합 -> 숫자”를 일일히 기록해야 했을 것이다.

  • # 예제1 – 동전예제 다시

    동전을 던지는 예제로 만들어지는 아래와 같은 확률공간 \((\Omega,{\cal F},\mathbb{P})\) 를 생각하자.

    • \(\Omega = \{H,T\}\)
    • \({\cal F} = 2^\Omega\)
    • \(\mathbb{P}(\{H\})=\mathbb{P}(\{T\})=\frac{1}{2}\)

    확률변수 \(X:\Omega \to \mathbb{R}\)를 아래와 같이 정의하자.

    • \(X(H)=1\)
    • \(X(T)=0\)

    이제 아래와 같은 함수를 정의하자.

    \[\mu_X((-\infty,x])=F_X(x)=\begin{cases} 0 & x<0 \\ \frac{1}{2} & 0\leq x < 1 \\ 1 & 1 \leq x \end{cases}\]

    이 함수는 동전예제가 가지는 랜덤성을 완전히 설명한다. 즉 \(F_X:\mathbb{R} \to [0,1]\)를 정의하는 일은 \(\mathbb{P}:{\cal F} \to [0,1]\)를 정의하는 일과 동치이다. 왜 그런지 논의하라.

    (해설)

    해설을 위한 준비

    아래의 이론을 한번 떠올려보자..

    확장이론2: \(\big(\Omega, \sigma({\cal A}), \mathbb{P}\big)\) 가 확률공간이라고 하자. 그리고 \({\cal A}\)\(\pi\)-system이라고 하자. 확률측도 \(\mathbb{P}: \sigma({\cal A}) \to [0,1]\) 의 값은 \({\cal A}\) 에서의 값으로 유일하게 결정된다.

    그리고 아래의 내용을 체크하자.

    \(\mu_X\)\((\mathbb{R}, {\cal R})\)에서의 확률측도이다. 따라서 \((\mathbb{R}, {\cal R}, \mu_X)\)는 확률공간이다.

    진짜해설

    \(F_X(x)=\mu_X((-\infty,x])\)로 쓸 수 있다. 따라서 모든 실수 \(x\in \mathbb{R}\)에 대하여 \(F_X(x)\)의 값을 정의하는 일은 모든 \({\cal A}=\{(-\infty,x]: x\in \mathbb{R}\}\) 에서 \(\mu_X:{\cal A} \to [0,1]\) 을 정의하는 일과 동치이다. 그런데 \({\cal A}\)는 파이시스템이므로 \({\cal A}\)에서의 \(\mu_X\)값만 결정해도 \({\cal R}\)의 모든 집합에서의 \(\mu_X\)값이 올바르게 결정된다. 그런데 공간 \((\mathbb{R}, {\cal R}, \mu_X)\)\(X\)에 의하여 유도된 공간이므로 \((\mathbb{R}, {\cal R})\)에서 \(\mu_X\)를 정의하는 일은 \(\mathbb{P}\)를 정의하는 일과 같다.

    \(\mathbb{R}\)에서 \(F_X(x)\)를 정의 \(\Leftrightarrow\) \({\cal A}\)에서 \(\mu_X\)를 정의 \(\Leftrightarrow\) \({\cal R}\)에서 \(\mu_X\)를 정의 \(\Leftrightarrow\) \({\cal F}\)에서 \(\mathbb{P}\)를 정의

    #

    # 정의: \(X\)를 확률공간 \((\Omega, {\cal F}, \mathbb{P})\)에서 정의된 확률변수라고 하자. 그리고 \((\mathbb{R}, {\cal R}, \mu_X)\)\(X\)에 의하여 유도된 확률공간이라고 하자. \(F_X: \mathbb{R} \to [0,1]\) 인 함수를 아래와 같이 정의하자.

    \[F_X(x) = \mu_X((-\infty, x])\]

    함수 \(F_X\)를 확률변수 \(X\)의 distribution function 혹은 cumulative distribution function (CDF) 라고 부른다. 그리고 \(\mu_X((-\infty,x])=\mathbb{P}(X\leq x)\)5 임을 떠올리면 함수 \(F_X(x)\)\(F_X(x) = \mathbb{P}(X\leq x)\)로 표현할 수도 있음을 알 수 있다.6

  • 5 \(\mu_X(B) = \mathbb{P}(X \in B)\)

  • 6 반가운 표현의 등장

  • #

    # 약속1: \(X\)를 확률공간 \((\Omega, {\cal F}, \mathbb{P})\)에서 정의된 확률변수라고 하자. 아래와 같은 표현을 약속하자.

    • \(X \sim \mu_X\) \(\Leftrightarrow\) \(X\)의 distribution 이 \(\mu_X\)이다.
    • \(X \sim F_X\) \(\Leftrightarrow\) \(X\)의 distribution function이 \(F_X\)이다.

    #

    # 약속2: \(X\)를 확률공간 \((\Omega_X, {\cal F}_X, \mathbb{P}_X)\)에서 정의된 확률변수라고 하고, \(Y\)를 확률공간 \((\Omega_Y, {\cal F}_Y, \mathbb{P}_Y)\)에서 정의된 확률변수라고 하자.

    • \(X \overset{d}{=} Y\) \(\Leftrightarrow\) \(\forall B \in {\cal R}: \mu_X(B) = \mu_Y(B)\)
    • \(X \overset{d}{=} Y\) \(\Leftrightarrow\) \(\forall c \in {\mathbb R}: F_X(c) = F_Y(c)\)
    • \(X \overset{d}{=} Y\) \(\Leftrightarrow\) \(\forall c \in {\mathbb R}: \mathbb{P}_X(X\leq c) = \mathbb{P}_Y(Y\leq c)\)

    만약에 랜덤성을 기술하는 언어가 \(P\)하나 뿐이었다면 “같은 분포를 가진다” 혹은 “점근적으로 같은 분포를 가진다”와 같은 개념을 수식화 하기 불리하다.

    #

    # 이론: 임의의 분포함수 \(F:\mathbb{R} \to [0,1]\)는 (1) 비감소 (2) \(\lim_{x \to -\infty}F(x)=0\) and \(\lim_{x \to \infty}F(x)=1\) (3) 오른쪽연속의 성질을 가진다.

    # 이론: 임의의 함수 \(F:\mathbb{R} \to \mathbb{R}\)가 (1) 비감소 (2) \(\lim_{x \to -\infty}F(x)=0\) and \(\lim_{x \to \infty}F(x)=1\) (3) 오른쪽연속의 성질을 가진다면, \(F\)는 어떠한 확률변수 \(X\)의 분포함수이다.

    5. 밀도함수는 어려워

    # 정의(?)\(X\)를 확률공간 \((\Omega, {\cal F}, \mathbb{P})\)에서 정의된 확률변수라고 하고 \(F_X\)\(X\)의 분포함수 라고 하자. 만약에 \(F_X\)가 아래와 같은 방식으로 표현된다면 \(f_X\)\(X\)를 density function 혹은 probability density function (PDF) 이라고 한다.

    \[F_X(x)=\int_{-\infty}^xf_X(y)dy\]

    그런데 이 정의 너무 쌔지않어? \(F_X\)가 미분불가능인 순간 끝나는데??

    #

    - 걱정: 저런 표현이 존재하지 않는다면 어쩌지?

    • \(F_X(x)\)가 불연속인 경우: 미분 불가능
    • \(F_X(x)\)가 연속인 경우: 미분가능할 수도 있고, 아닐 수도 있고..

    - 앞으로의 할일: 밀도함수의 이해

    1. 르벡적분: \(\int_{-\infty}^{x}f_X(y)dy\) 를 좀 더 깊이 이해하자.
    2. 절대연속: \(F_X(x)\) 가 미분가능하길 기대하는건 너무 까다롭다.. 좀 더 약한조건 있을까?
    3. 라돈니코딤도함수: 수리통계에서는 pdf와 pmf를 분리하여 배웠는데, 이를 통합하여 하나의 정의로 만들 수 있을까?

    6. 르벡적분 맛보기1

    A. motivating EX

    # 예제1 – 사각형의 넓이

    아래와 같은 함수의 밑면적을 계산해보자.

    \[f(x)= \begin{cases} 1 & 0 \leq x \leq 1 \\ 0 & o.w. \end{cases}\]

    답은 1이다. 이것을 적분을 이용하여 구하는 과정을 서술해라.

    (서술1) – 고등학생이 하는 그 풀이

    \[\int_{-\infty}^{\infty} f(x)dx = \int_0^1 f(x) dx = \int_{0}^{1}dx = 1\]

    (서술2) – 르벡메저를 이용한 풀이

    그런데 이 예제의 경우 구간 \([0,1]\)에서 함수 \(f(x)\)의 값이 모두 \(f(x)=1\)로 같고 그 외의 구간에서는 모두 \(f(x)=0\)이므로 아래와 같이 수식을 쓰는 것도 가능하다.

    \[\lambda([0,1]) \times 1= 1\]

    #

    # 예제2 – 사각형의 넓이 (2)

    이제 아래와 같은 함수의 밑면적을 고려하자.

    \[g(x)= \begin{cases} 1 & 0 < x < 1 \\ 0 & o.w. \end{cases}\]

    이것을 적분을 이용하여 구하는 과정을 서술하고 기호를 살펴보자.

    (틀린서술)

    \[\int_{-\infty}^{\infty} g(x)dx=\int_0^1 g(x)dx = \int_0^1dx=1\]

    – 틀린이유? \(\int_0^1\)은 폐구간 \([0,1]\)를 의미함. 이러한 구간에서는 \(g(x)\)의 값이 일괄적으로 1이라고 주장할 수 없다.

    (서술1) – 약간 말장난인데?

    구간 \([0,1]\)에서 \(g(x)\)의 밑면적은 구간 \([0,1]\)에서 \(f(x)\)의 밑면적과 같으므로 1이다.

    (서술2) – 르벡메저를 이용한 풀이

    이 예제의 경우 구간 \((0,1)\)에서 함수 \(g(x)\)의 값이 모두 \(g(x)=1\)로 같고 그 외의 구간에서는 모두 \(g(x)=0\)이므로 아래와 같이 수식을 쓸 수 있다.

    \[\lambda((0,1)) \times 1= 1\]

    #

    # 예제3 – 사각형의 넓이 (3)

    이제 아래와 같은 함수 \(f(x)\)에 대한 밑면적을 계산하고 싶다고 생각해보자.

    \[f(x)= \begin{cases} 1 & 0<x<1/2 \\ 2 & 1/2 \leq x < 1 \\ \frac{1}{3} & 1<x<3 \\ 0 & o.w \end{cases}\]

    예제1,2에서 소개한 서술1,2에 근거하여 \(f\)의 밑면적을 구하는 방법을 논의하라.

    (서술1) – 많이 들어본 논리.. 이해는 되지만.. 애매한 논리..

    \(f\)의 밑면적 \(S\)를 적분으로 나타내면

    \[S=\int_{0}^{\frac{1}{2}}dx + \int_{\frac{1}{2}}^{1} 2dx + \int_{1}^{3} \frac{1}{3}dx\]

    사실 \(\int_{a}^{b}f(x)dx\) 와 같은 형태는 일반적으로 함수가 \(f\)가 폐구간 \([a,b]\) 에서 정의된다고 가정하고 사용하므로 위의 기호는 정확하지 않다.

    1. \(x=\frac{1}{2},1,3\)에 해당하는 영역은 중복혜서 계산된다.
    2. \(x=\frac{1}{2}\)에 해당하는 영역은 함수값을 1로 보기도 하고 2로 보기도 한다.
    3. \(x=1\)에 해당하는 영역은 함수값을 2로 보기도 하고 3으로 보기도 한다.
    4. \(x=0\)에 해당하는 영역은 실제로는 함수값이 0이지만 계산상으로는 1로 생각한다.
    5. \(x=1\)에 해당하는 영역은 실제로는 함수값이 0이지만 계산상으로는 2 혹은 \(\frac{1}{3}\)로 생각한다.
    6. \(x=3\)에 해당하는 영역은 실제로는 함수값이 0이지만 계산상으로는 \(\frac{1}{3}\)로 생각한다.

    하지만 이러한 사소한점을 무시해도 계산결과는 여전히 \(S\)이다.

    (서술2)

    함수 \(f\)의 면적 \(S\)는 아래와 같이 나타낼 수 있다.

    \[S = 1\times \lambda(A_1) + 2 \times \lambda(A_2) + \frac{1}{3} \lambda(A_3)\]

    단, 여기에서 \(A_1=(0,\frac{1}{2}), A_2=[\frac{1}{2},1), A_3=(1,3)\) 이다.

    (소감)

    르벡메져를 이용하여 넓이를 정의하니까 애매한 점 없이 매우 깔끔하다. 단지 \(A_1,A_2,A_3\)이 르벡측도로 잴 수 있는 집합이어야 하므로 \(A_1,A_2,A_3 \in {\cal R}\) 정도만 체크해주면 될 것 같다.

    #

    # 예제4 – 리만적분 vs 르벡적분

    이제 아래와 같은 함수 \(f\)의 밑면적을 계산하는 방식을 고려하여 보자.

    \[f(x) = \begin{cases} 1 & x \in [0,1] \cap \mathbb{Q} \\ 2 & x \in [0,1] \cap \mathbb{Q}^c \\ 0 & o.w. \end{cases}\]

    (서술1) – 리만적분

    적분이 불가능하다. 그 이유를 엄밀하지 않게 서술하면 아래와 같다.

    1. 우리가 알고 있는 “적분”이라는 것은 본래 \(x\)축을 잘게 쪼개서 아주 작은 구간을 만든뒤에 그 구간에서 \(f(x)\)의 값들이 비슷함을 이용하여 \(f(x)\)의 밑면적을 사각형넓이들의 합으로 근사시키는 방식이다.
    2. 이것은 아주 작은 구간에서는 \(f(x)\)의 값이 다른값을 가져봤자 그 차이는 미미하고 그래서 거의 상수처럼 생각할 수 있다는 직관을 이용하는 것이다.
    3. 일반적인 함수는 구간의 크기를 작게 만들수록 \(f(x)\)의 값은 점점 상수화되고 그 결과 사각형들의 합으로 근사된 넓이는 함수 \(f\)의 밑면적으로 수렴한다.
    4. 그런데 이 예제의 경우 아무리 작은 구간을 잡아도 그 사이에는 수많은 유리수와 수많은 무리수가 있으므로 함수값 \(f(x)\)은 안정화 되지 않으며 1과 2사이를 “널뛴다.”
    5. 따라서 적분값은 안정화되지 않는다.

    구간에서의 \(f(x)\)의 대표값을 양 끝점중 하나로 설정한다고 하자. 만약 구간의 양끝점을 유리수로만 설정하면 넓이는 1로 계산되고, 무리수로만 설정하면넓이는 2로 계산될 것이다.

    (서술2) – 르벡적분

    함수 \(f\)의 면적 \(S\)는 아래와 같이 나타낼 수 있다.

    \[S = 1\times \lambda(A_1) + 2 \times \lambda(A_2)\]

    단, 여기에서 \(A_1=[0,1] \cap \mathbb{Q}, A_2=[0,1] \cap \mathbb{Q}^c\) 이다. 집합 \(A_1,A_2\) 는 모두 \({\cal R}\)-measurable 하므로 \(\lambda(A_1), \lambda(A_2)\)의 값이 각각 0과 1로 잘 정의된다. 따라서 \(S=2\)로 계산할 수 있다.

    #

    B. 리만적분 vs 르벡적분

    - 느낌: 리만적분은 정의역을 잘게 쪼개는 느낌이지만, 르벡적분은 치역을 잘게 쪼개는 느낌이다. (리만적분을 밑넓이를 세로로 나누어 계산하고, 르벡적분은 가로로 나누어 계산한다.)

    그림1: 위키에서 긁은 그림.. 르벡적분은 \(y\) 에 대응하는 \(x\) 의 영역을 찾는다..

    그림2: 유튜브에서 긁은 그림, 리만적분과 르벡적분을 비교한다. 리만적분은 \(x\)값에 대응하는 \(y\)를 찾고, 르벡적분은 \(y\)값에 대응하는 \(x\)값을 찾는다

    ref: https://www.youtube.com/watch?app=desktop&v=PGPZ0P1PJfw

    C. 거의 모든 곳에서..

    # 복습? 아래예제의 서술을 다시 살펴보자.

    # 예제 – 사각형의 넓이 (2)

    이제 아래와 같은 함수의 밑면적을 고려하자.

    \[g(x)= \begin{cases} 1 & 0 < x < 1 \\ 0 & o.w. \end{cases}\]

    이것을 적분을 이용하여 구하는 과정을 서술하고 기호를 살펴보자.

    서술1 – 약간 말장난인데?

    구간 \([0,1]\)에서 \(g(x)\)의 밑면적은 구간 \([0,1]\)에서 \(f(x)\)의 밑면적과 같으므로 1이다.

    #

    - 느낌: \(f(x)\)\(g(x)\)거의 같으니까 \(\int_{-\infty}^{\infty}f(x)dx = \int_{-\infty}^{\infty}g(x)dx\) 라고 계산해도 된다는 논리..

    - 거의 같다의 엄밀한 의미??

    Note

    르벡측도 0인 곳을 제외하고는 어떠한 명제가 성립할때 거의 모든 곳에서 라는 수식어를 붙인다. 영어로는 almost everywhere 라고 하며 기호로는 a.e. 라고 표현한다. 좀더 엄밀하게는 with repect to \(\lambda\) 라는 표현을 추가하기도 한다.ㄴ

    # 예시1 – 아래와 같은 함수 \(f\)를 고려하자.

    \[f(x) = \begin{cases} 1 & x\in \mathbb{Q} \\ 0 & x\in \mathbb{R}-\mathbb{Q} \end{cases}\]

    이 함수는 거의 모든 곳에서 0이다.

    기호로는 \(f \overset{a.e.}{=} 0\) 혹은 \(f \overset{a.e.}{=} 0\) w.r.t. \(\lambda\) 와 같이 표현한다.

    #

    # 예시2 – 아래와 같은 함수 \(f,g\)를 고려하자.

    \[f(x) = \begin{cases} 1 & x\in \mathbb{Q} \\ 0 & x\in \mathbb{R}-\mathbb{Q} \end{cases}\]

    \[g(x) = \begin{cases} 2 & x\in \mathbb{Q} \\ 0 & x \in \mathbb{R}-\mathbb{Q} \end{cases}\]

    함수 \(f\)\(g\)거의 모든 곳에서 같다.

    기호로는 \(f\overset{a.e.}{=} g\) 혹은 \(f\overset{a.e.}{=} g\) w.r.t. \(\lambda\) 와 같이 표현한다.

    #

    # 예시3 – 아래와 같은 함수 \(f,g\)를 고려하자.

    \[f(x) = \begin{cases} 0 & x\in \mathbb{Q} \\ 1 & x\in \mathbb{R}-\mathbb{Q} \end{cases}\]

    함수 \(f\)거의 모든 곳에서 양수이다.

    기호로는 \(f\overset{a.e.}{>} 0\) 혹은 \(f\overset{a.e.}{>} g\) w.r.t. \(\lambda\) 와 같이 표현한다.

    #

    # 예시4 – 아래와 같은 함수 \(f,g\)를 고려하자.

    \[f(x) = \begin{cases} 0 & x\in \mathbb{Q} \\ 1 & x\in \mathbb{R}-\mathbb{Q} \end{cases}\]

    \[g(x) = \begin{cases} 0 & x\in \mathbb{Q} \\ 2 & x \in \mathbb{R}-\mathbb{Q} \end{cases}\]

    함수 \(f\)거의 모든 곳에서 \(g\)보다 작다.

    기호로는 \(f\overset{a.e.}{<} g\) 혹은 \(f\overset{a.e.}{<} g\) w.r.t. \(\lambda\) 와 같이 표현한다.

    #

    # 예시5 – 만약에 아래와 같은 함수 \(f,g\)가 있다면

    \[f(x) = \begin{cases} 1 & x\in \mathbb{Q} \\ 0 & x\in \mathbb{R}-\mathbb{Q} \end{cases}\]

    \[g(x) = \begin{cases} 1 & x\in \mathbb{Q} \\ 0 & x \in \mathbb{R}-\mathbb{Q} \end{cases}\]

    함수 \(f\)\(g\)모든 곳에서 같다라고 할 수 있겠다. (보통 그냥 같다라고 하죠..)

    #