05wk: 시그마필드 – Motivation2, 측도와 확률측도

Author

최규빈

Published

October 3, 2024

1. 강의영상

2. 지금까지의 스토리

- 지금까지의 이야기.

  • 우리가 원래 원했던 것은 \(\Omega=[0,1)\) 의 모든 부분집합에 대해서 확률을 “무모순”으로 정의 하는 것이었다.
  • \(\Omega=[0,1)\) 의 모든 부분집합에 대해서 확률을 “무모순”으로 정의하는게 엄청 쉬운일 인줄 알았는데 사실은 그렇지가 않았다. 확률을 정의하는건 매우 까다로운 일이었다.
  • 이러한 까다로움을 해결하기 위해서 “르벡메져”라는 새로운 도구를 사용했다. 이 도구는 몇 가지 까다로운 집합에 대해서도 확률을 무모순으로 정의할 수 있었다.
  • 그런데 “르벡메저”를 사용해도 \(\Omega=[0,1)\)의 부분집합 중 확률을 잴 수 없는 집합이 존재함을 알았다. (비탈리집합이라나 뭐라나..)
  • “르벡메저”를 사용하여 \(\Omega=[0,1)\)의 모든 부분집합에 대한 확률을 정의하는 일은 포기하기로 했다. 즉 비탈리집합의 경우 길이를 정의하지 않기로 했다. 그런데 문제는 비탈리집합의 길이만 정의하지 않으면 끝나는것이 아니었다.1
  • 따라서 \(\Omega=[0,1)\)의 부분집합중, 확률을 정의할 수 있는 집합들의 모임이라는 개념을 논의할 필요성이 생겼고 이러한 집합들의 모임이 가져야 할 성질에 대하여 상상해보는 시간을 가졌었다.
  • 1 예를들면 \([0,1)\)에서 비탈리집합의 길이를 정의하지 않는다는 말은, \([0,1)\)에서 비탈리집합을 뺀 집합의 길이도 정의하지 않는다는 말과 동일해지는 문제가 있음

  • 3. \(\sigma\)-field - Motivation2

    A. 시그마필드

    # 생각1 – trivial \(\sigma\)-field

    \(\Omega=[0,1)\) 이라고 하자. \({\cal F}\)을 아래와 같이 정의한다고 하자. 이러한 묶음 \({\cal F}\)는 합리적일까?

    \[{\cal F}=\{\emptyset, \Omega \}\]

    (해설)

    이렇게 잡으면 모순이 일어나진 않음. (그렇지만 쓸모가 없음..)

    #

    # 생각2 – 교집합..?

    \(\Omega=\{1,2,3,4\}\)라고 하자. 아래와 같은 \({\cal F}\)는 합리적일까?

    \[{\cal F}= \big\{ \emptyset, \{1,2\}, \{1,3\}, \{1,4\},\{2,3\},\{2,4\},\{3,4\}, \Omega\big\}\]

    (해설)

    집합 \(A\)\(B\)에 대한 확률값을 매길 수 있다면 \(\mathbb{P}(A \cap B)\)를 정의할 수 있어야 할까? 이 문항은 이 질문에 대한 답을 준다. 주어진 \({\cal F}\)는 아래의 조건을 만족한다.

    조건1. \(\Omega \in {\cal F}\)

    조건2. \(A \in {\cal F} \Rightarrow A^c \in {\cal F}\)

    조건3. \(\big(\forall n \in \mathbb{N}: B_n \in {\cal F} \big) \text{ and } \big(\forall {m,k} \in \mathbb{N}, m\neq k:~ B_m \cap B_k = \emptyset \big) \quad \Longrightarrow \uplus_{n=1}^{\infty} B_n \in~ {\cal F}\)

    그렇지만 \({\cal F}\)

    \[\{1,2\} \cap \{1,3\} = \{1\}\]

    와 같은 집합이라든가,

    \[\{1,2\} \cup \{1,3\} = \{1,3,4\}\]

    와 같은 집합의 확률값을 잴 수 없다고 한다. 즉 \(\mathbb{P}(A)\), \(\mathbb{P}(B)\)를 잴 수 있음에도 \(\mathbb{P}(A \cap B)\), \(\mathbb{P}(A \cup B)\) 의 확률값은 모두 잴 수 없다고 하는 것이다. 하지만 이 접근법은 확률의 공리에 모순을 불러일으키는 건 아니다. (그렇지만 “확률”을 쓸모없게 만들지)

    통계학과 입장: 확률의 공리상 \(A\)\(B\)에 대한 확률을 모두 정의할 수 있다고 해서 \(A\cap B\)를 잴 수 있어야 하는건 아니다.

    수학과의 입장: 그런데, 사실 \(\Omega\) 에서의 확률이라는 것은 사실 “길이”의 개념을 일반화 한 것이다. 확률을 무모순으로 정의가능한 집합은 사실 어떠한 집합의 크기,길이,넓이,부피 등 “재다”라는 개념을 무모순으로 정의가능한 집합을 잘 정의하면 되는 일이다. 이러한 집합에 한정하여 말한다면 집합 \(A\)를 잴 수 있고 집합 \(B\)를 잴 수 있는데, 집합 \(A \cap B\)는 잴 수 없다는 것이 오히려 이상하다. (오히려 \(\Omega\)를 잴 수 있다는게 더 이상한거 아니야?)

    합의: 그냥 \(A \cap B\) 도 잴 수 있다고 하시죠

    #

    # 조건의정리 (교집합을 추가하면)

    두 집합 \(A\), \(B\)에 대한 확률을 무모순으로 정의가능하다면 그것의 교집합인 \(A\cap B\)에 대하여서도 확률값을 무모순으로 정의가능하다고 가정하자. 즉 \(\Omega\)의 부분집합중 잴 수 있는 집합의 모임 \({\cal F}\) 는 아래의 조건1~ 조건4을 만족하는 집합의 집합 (collection) 이라고 정의하자.

    조건1. \(\Omega \in {\cal F}\)

    조건2. \(A \in {\cal F} \Rightarrow A^c \in {\cal F}\)

    조건3. \(\big(\forall n \in \mathbb{N}: B_n \in {\cal F} \big) \text{ and } \big(\forall {m,k} \in \mathbb{N}, m\neq k:~ B_m \cap B_k = \emptyset \big) \quad \Longrightarrow \uplus_{n=1}^{\infty} B_n \in~ {\cal F}\)

    조건4. \(A \in {\cal F}, B \in {\cal F} \Rightarrow A \cap B \in {\cal F}\)

    그런데 조건3조건4를 이용하면 아래와 같은 조건5를 유추할 수 있다.

    조건1. \(\Omega \in {\cal F}\)

    조건2. \(A \in {\cal F} \Rightarrow A^c \in {\cal F}\)

    조건3. \(\big(\forall n \in \mathbb{N}: B_n \in {\cal F} \big) \text{ and } \big(\forall {m,k} \in \mathbb{N}, m\neq k:~ B_m \cap B_k = \emptyset \big) \quad \Longrightarrow \uplus_{n=1}^{\infty} B_n \in~ {\cal F}\)

    조건4. \(A \in {\cal F}, B \in {\cal F} \Rightarrow A \cap B \in {\cal F}\)

    조건5. \(\big(\forall n \in \mathbb{N}: A_n \in {\cal F} \big) \Rightarrow \cup_{n=1}^{\infty} A_n \in~ {\cal F}\)

    그런데 조건5조건3을 imply 하므로 조건3을 삭제할 수 있다.

    조건1. \(\Omega \in {\cal F}\)

    조건2. \(A \in {\cal F} \Rightarrow A^c \in {\cal F}\)

    조건4. \(A \in {\cal F}, B \in {\cal F} \Rightarrow A \cap B \in {\cal F}\)

    조건5. \(\big(\forall n \in \mathbb{N}: A_n \in {\cal F} \big) \Rightarrow \cup_{n=1}^{\infty} A_n \in~ {\cal F}\)

    그런데 조건5조건2조건4를 imply 하므로 조건4 역시 삭제할 수 있다. 따라서 정리하면 아래와 같다.

    조건1. \(\Omega \in {\cal F}\)

    조건2. \(A \in {\cal F} \Rightarrow A^c \in {\cal F}\)

    조건3. \(\big(\forall n \in \mathbb{N}: A_n \in {\cal F}\big) \Rightarrow \cup_{n=1}^{\infty} A_n \in~ {\cal F}\)

    #

    # 정의: 시그마필드

    \(\Omega\)의 부분집합중 아래의 조건1~ 조건3을 만족하는 집합의 집합 (collection) \({\cal F}\)를 “\(\Omega\)에 대한 시그마필드”라고 한다.

    조건1. \(\Omega \in {\cal F}\)

    조건2. \(A \in {\cal F} \Rightarrow A^c \in {\cal F}\)

    조건3. \(\big(\forall n \in \mathbb{N}: A_n \in {\cal F}\big) \Rightarrow \cup_{n=1}^{\infty} A_n \in~ {\cal F}\)

    그리고 \({\cal F}\)의 원소를 \({\cal F}\)-measurable set 이라고 한다.

    #

    - 좀 더 편리하게 아래와 같이 기억하면 좋다.

    시그마필드는 아래와 같은 규칙을 만족해야 한다. (1) 전체집합을 포함한다. (2) 여집합에 닫혀있다. (3) 가산합집합에 닫혀있다.

    - 참고1: 시그마필드라는 것은 유일하게 정의되지 않는다. 즉 동일한 \(\Omega\)에 대하여 정의할 수 있는 시그마필드 \({\cal F}\)는 유일하지 않다.

    - 참고2: 시그마필드는 \(\Omega\) 없이 단독으로 정의되지 않는다. 즉

    \[{\cal F}=\{\emptyset, \{H\}, \{T\}, \{H,T\}\}\]

    는 단지 그냥 시그마필드라고 언급하기 보다 \(\Omega=\{H,T\}\)에 대한 시그마필드라고 해야 정확한 표현이다.

    - 참고3: 참고2에 따라서 \({\cal F}\) 단독으로 표기하는 것 보다 \(\Omega\)를 붙여서 \((\Omega,{\cal F})\)와 같이 쌍으로 표기하는게 더 합리적이다. 앞으로는 이러한 쌍을 measurable space 라고 부른다.

    B. 시그마필드의 성질

    - 정리표:

    \(A \cap B\) \(\emptyset\) \(A-B\) \(\cup_iA_i \to \uplus_i B_i\) \(\Omega\) \(A^c\) \(A\cup B\) \(\cup_{i=1}^{\infty}A_i\) \(\uplus_{i=1}^{\infty}B_i\) \(\cap_{i=1}^{\infty}A_i\)
    \(\pi\)-system \(O\) \(X\) \(X\) \(X\) \(X\) \(X\) \(X\) \(X\) \(X\) \(X\)
    semi-ring \(O\) \(O\) \(\Delta\) \(O\) \(X\) \(X\) \(X\) \(X\) \(X\) \(X\)
    semi-algebra \(O\) \(O\) \(\Delta\) \(O\) \(O\) \(\Delta\) \(X\) \(X\) \(X\) \(X\)
    ring \(O\) \(O\) \(O\) \(O\) \(X\) \(X\) \(O\) \(X\) \(X\) \(X\)
    algebra \(O\) \(O\) \(O\) \(O\) \(O\) \(O\) \(O\) \(X\) \(X\) \(X\)
    \(\sigma\)-ring \(O\) \(O\) \(O\) \(O\) \(X\) \(X\) \(O\) \(O\) \(O\) \(O\)
    \(\lambda\)-system \(X\) \(O\) \(\Delta\) \(X\) \(O\) \(O\) \(X\) \(X\) \(O\) \(X\)
    \(\sigma\)-field \(O\) \(O\) \(O\) \(O\) \(O\) \(O\) \(O\) \(O\) \(O\) \(O\)

    - 아래를 체크해보자.

    • \(A, B \in {\cal F} \Rightarrow A \cap B \in {\cal F}\)
    • \(\emptyset \in {\cal F}\)
    • \(A, B \in {\cal F} \Rightarrow A-B \in {\cal F}\)
    • \(\big(\forall n \in \mathbb{N}: A_n \in {\cal F} \big) \Rightarrow \cap_{n=1}^{\infty} A_n \in~ {\cal F}\)

    4. 측도와 확률측도

    - 강의오류 공지 – 시그마필드는 사실 “확률값”을 무모순으로 정의가능한 집합들의 모임이 아닙니다. 엄밀하게는 (확률이든 길이든 넓이든 뭐든) “잰다”라는 행위를 합리적이게 만드는 집합들의 모임입니다. 따라서 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서 \({\cal F}\)\(\Omega\) 의 부분집합중, (확률이든 길이든 넓이든 뭐든) “잰다”라는 행위가 말이되게 만드는 집합들의 모임을 의미한다고 볼 수 있습니다. 혼란을 드려 죄송합니다. (그런데 내년에도 이렇게 설명하지 않을까요?.. ㅎㅎ)

    강의오류에도 불구하고 시그마필드는 의미가 있다. 시그마필드를 만들었다고 거기에서 항상 확률을 항상 정의가능한 것은 아니지만, 확률은 항상 시그마필드에서 정의해야 하기 때문. 즉 “시그마필드 \(\Leftrightarrow\) \(\Omega=[0,1)\)의 부분집합중 확률을 잴 수 있는 집합의 모임” 은 아니지만 “시그마필드 \(\Leftarrow\) \(\Omega=[0,1)\)의 부분집합중 확률을 잴 수 있는 집합의 모임” 은 성립

    - 여기에서 “잰다”라는 행위를 함수로 이해한다면, 그 함수의 정의역이 \({\cal F}\) 가 되는 것이다. 참고로 “잰다”라는 행위를 수행하는 함수를 measure 혹은 measurable function, measurable mapping 이라고 한다.

    A. 측도의 정의, 확률측도의 정의

    # 메져의 정의: 메져는 잴 수 있는 공간 \((\Omega, {\cal F})\)가 전제되었을 경우 정의 할 수 있는 일종의 함수 \(m: {\cal F} \to [0,\infty]\) 인데, 아래의 조건을 만족해야 한다.

    조건1. \(\forall A \in {\cal F}:~ m(A) \geq 0\).

    조건2. \(m(\emptyset)=0\).

    조건3. \(\big(\forall n \in \mathbb{N}: B_n \in {\cal F} \big) \text{ and } \big(\forall {m,k} \in \mathbb{N}, m\neq k:~ B_m \cap B_k = \emptyset \big) \quad \Longrightarrow m\left(\uplus_{n=1}^{\infty} B_n\right) = \sum_{n=1}^{\infty}m(B_n)\)

    쉽게 말하면 (1) 메저는 항상 양수이어야 하고, (2) 공집합은 항상 측정값이 0이며 (3) \(\sigma\)-additivity2가 성립해야한다는 의미이다.

  • 2 countable additivity 라고 하기도 함

  • #

    # 확률의 정의: 확률은 잴 수 있는 공간 \((\Omega, {\cal F})\)가 전제되었을 경우 정의 할 수 있는 일종의 함수 \(\mathbb{P}:{\cal F} \to [0,1]\) 인데, 아래의 조건을 만족해야 한다.

    조건1. \(\forall A \in {\cal F}:~ \mathbb{P}(A) \geq 0\).

    조건2. \(\mathbb{P}(\Omega)=1\).

    조건3. \(\big(\forall n \in \mathbb{N}: B_n \in {\cal F} \big) \text{ and } \big(\forall {m,k} \in \mathbb{N}, m\neq k:~ B_m \cap B_k = \emptyset \big) \quad \Longrightarrow \mathbb{P}\left(\uplus_{n=1}^{\infty} B_n\right) = \sum_{n=1}^{\infty}\mathbb{P}(B_n)\)

    쉽게 말하면 (1) 확률은 항상 양수이어야 하고, (2) 전체확률은 1이며 (3) \(\sigma\)-additivity3가 성립해야한다는 의미이다.

  • 3 countable additivity 라고 하기도 함

  • #

    # 예제1 확률은 메저의 한 종류임을 보여라. 즉 확률의 공리1-3을 만족하면 메저의 공리1-3을 만족함을 보여라.

    # 예제2 메저의 정의에서 조건4 \(m(\Omega)=1\) 임을 추가하면 확률의 공리1-3이 됨을 보여라.

    B. 확률측도

    # 예제1 – 시그마필드에서만 확률정의가능

    \(\Omega=\{H,T\}\) 라고 하고 \({\cal F}=\{\emptyset, \{H\},\Omega\}\) 이라고 하자. 아래와 같은 함수 \(\mathbb{P}\) 를 고려하고 이것을 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0\)
    • \(\mathbb{P}(\{H\}) = \frac{1}{2}\)
    • \(\mathbb{P}(\Omega) = 1\)

    (해설) \({\cal F}\)는 시그마필드가 아니므로 이 위에서는 애초에 확률을 정의할 수 없음.

    확률을 잘 정의하기 위해서는 우선 잘 정의된 “잴 수 있는 공간 \((\Omega, {\cal F})\)” 가 필요하다.

    #

    # 예제2 – 잘 정의된 확률

    \(\Omega=\{H,T\}\) 라고 하고 \({\cal F}=2^{\Omega}\) 이다. 아래와 같은 함수 \(\mathbb{P}\) 를 고려하고 이를 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0\)
    • \(\mathbb{P}(\{H\}) = \frac{1}{100}\)
    • \(\mathbb{P}(\{T\}) = \frac{99}{100}\)
    • \(\mathbb{P}(\Omega) = 1\)

    (해설) 합리적임.

    #

    # 예제3 – 확률은 0보다 커야해.

    \(\Omega=\{H,T\}\) 라고 하고 \({\cal F}=2^{\Omega}\) 이다. 아래와 같은 함수 \(\mathbb{P}\) 를 고려하고 이를 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0\)
    • \(\mathbb{P}(\{H\}) = -\frac{1}{2}\)
    • \(\mathbb{P}(\{T\}) = \frac{1}{2}\)
    • \(\mathbb{P}(\Omega) = 1\)

    (해설) 확률은 음수가 나오면 안되므로 합리적이지 않음.

    #

    # 예제4 – 전체확률은 1이어야 함.

    \(\Omega=\{H,T\}\) 라고 하고 \({\cal F}=\{\emptyset, \Omega\}\) 이다. 아래와 같은 함수 \(\mathbb{P}:{\cal F} \to [0,1]\)를 고려하고 이를 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0\)
    • \(\mathbb{P}(\Omega) = 0.5\)

    (해설) 전체확률은 1이어야 하므로 합리적이지 않음.

    #

    # 예제5 – 공집합의 확률은 0이어야 함.

    \(\Omega=\{H,T\}\) 라고 하고 \({\cal F}=\{\emptyset, \Omega\}\) 이다. 아래와 같은 함수 \(\mathbb{P}:{\cal F} \to [0,1]\)를 고려하고 이를 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0.5\)
    • \(\mathbb{P}(\Omega) = 1\)

    (해설) 공집합의 확률은 0이어야 하므로 합리적이지 않음.

    #

    # 예제6 – 서로소인 집합을 합친 확률, 여집합의 확률

    \(\Omega=\{H,T\}\) 라고 하고 \({\cal F}=\{\emptyset, \{H\}, \{T\}, \Omega\}\) 이다. 아래와 같은 함수 \(\mathbb{P}:{\cal F} \to [0,1]\)를 고려하고 이를 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0\)
    • \(\mathbb{P}(\{H\}) = 1/3\)
    • \(\mathbb{P}(\{T\}) = 1/3\)
    • \(\mathbb{P}(\Omega) = 1\)

    (해설) 합리적이지 않음. 왜냐하면

    • \(P(\{H\}\cup \{T\})=P(\Omega)=1\)
    • \(P(\{H\}\cup \{T\})=P(\{H\})+P(\{T\})=2/3\)

    이므로 모순임.

    #

    # 예제7 – 포함관계에 있는 집합의 확률

    \(\Omega=\{1,2,3\}\) 라고 하고

    \[{\cal F}=\{\emptyset, \{1\}, \{2\}, \{3\}, \{1,2\}, \{1,3\}, \{2,3\}, \Omega\}\]

    라고 하자. 아래와 같은 함수 \(\mathbb{P}:{\cal F} \to [0,1]\)를 고려하고 이를 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0\)
    • \(\mathbb{P}(\{1\}) = 1/4\)
    • \(\mathbb{P}(\{2\}) = 1/4\)
    • \(\mathbb{P}(\{3\}) = 2/4\)
    • \(\mathbb{P}(\{1,2\}) = 2/4\)
    • \(\mathbb{P}(\{1,3\}) = 3/4\)
    • \(\mathbb{P}(\{2,3\}) = 1/4\)
    • \(\mathbb{P}(\Omega) = 1\)

    (해설) 합리적이지 않음. 왜냐하면

    • \(\mathbb{P}(\{2\}\cup \{3\})=\mathbb{P}(\{2,3\})=1/4\)
    • \(\mathbb{P}(\{2\}\cup \{3\})=\mathbb{P}(\{2\})+\mathbb{P}(\{3\})=3/4\)

    이므로 모순임.

    #

    정의역이 시그마필드이고, 확률의 공리1,2,3을 만족하는 경우만 우리는 “확률”이라 인정하겠다.

    # 예제7 – 포함관계에 있는 집합의 확률

    \(\Omega=\{1,2,3\}\) 라고 하고

    \[{\cal F}=\{\emptyset, \{1\}, \{2\}, \{3\}, \{1,2\}, \{1,3\}, \{2,3\}, \Omega\}\]

    라고 하자. 아래와 같은 함수 \(\mathbb{P}:{\cal F} \to [0,1]\)를 고려하고 이를 잴 수 있는 공간 \((\Omega,{\cal F})\) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • \(\mathbb{P}(\emptyset) = 0\)
    • \(\mathbb{P}(\{1\}) = 1/4\)
    • \(\mathbb{P}(\{2\}) = 1/4\)
    • \(\mathbb{P}(\{3\}) = 2/4\)
    • \(\mathbb{P}(\{1,2\}) = 2/4\)
    • \(\mathbb{P}(\{1,3\}) = 3/4\)
    • \(\mathbb{P}(\{2,3\}) = 1/4\)
    • \(\mathbb{P}(\Omega) = 1\)

    (해설) 합리적이지 않음. 왜냐하면

    • \(\mathbb{P}(\{2\}\cup \{3\})=\mathbb{P}(\{2,3\})=1/4\)
    • \(\mathbb{P}(\{2\}\cup \{3\})=\mathbb{P}(\{2\})+\mathbb{P}(\{3\})=3/4\)

    이므로 모순임.

    #

    C. 확률측도와 측도의 차이

    # 예제1\(|\Omega|<\infty\) 인 경우

    \(\Omega=\{1,2,3,4,5,6\}\) 라고 하자. 이때 \(2^\Omega\)\(\Omega\)의 모든 부분집합들의 집합이다. 여기에서 \(2^\Omega\)는 시그마필드의 정의를 만족하므로 \((\Omega, 2^{\Omega})\) 는 잴 수 있는 공간이 된다. 이 공간위에서 함수 \(\mathbb{P}: 2^{\Omega} \to [0,1]\) 를 아래와 같의 정의하자.

    \[\mathbb{P}(A)=\frac{|A|}{|\Omega|}.\]

    이러한 함수 \(\mathbb{P}\) 는 (1) 정의역이 시그마필드이며 (2) 확률의공리1-3을 만족하므로 확률이라 주장할 수 있다.

    #

    # 예제2\(|\Omega| = \aleph_1\) 인 경우, 확률정의 불가능

    \(\Omega=[0,1)\) 라고 하자. 이때 \(2^\Omega\)\(\Omega\)의 모든 부분집합들의 집합이다. 여기에서 \(2^\Omega\)는 시그마필드의 정의를 만족하므로 \((\Omega, 2^{\Omega})\) 는 잴 수 있는 공간이 된다. 이 공간위에서 함수 \(\mathbb{P}: 2^{\Omega} \to [0,1]\) 를 아래와 같이 정의하자.

    \[\mathbb{P}(A)=\lambda(A), \quad \text{$\lambda$ is lebesgue measure}.\]

    이러한 함수 \(\mathbb{P}\) 는 (1) 정의역이 시그마필드이지만 (2) 확률의공리1-3을 만족하지 않는다. (왜? 비탈리집합!) 따라서 함수 \(\mathbb{P}\) 를 확률이라고 주장할 수 없다. 또한 \(\mathbb{P}(A)=\lambda(A)\)가 아닌 그 어떠한 방식으로 정의해도 잴 수 있는 공간 \((\Omega, 2^{\Omega})\) 위에서 확률을 무모순으로 정의하는게 불가능함이 밝혀져 있다.

    #

    의문: 그러면 이름이 이상한것 아니야? 즉, \(\Omega=[0,1)\) 일경우 \((\Omega, 2^{\Omega})\)를 잴 수 있는 공간이라고 말하는 것 자체가 잘못된것 아니야??

    # 예제3\(|\Omega| = \aleph_1\) 인 경우, 측도정의가능

    \(\Omega=[0,1)\) 라고 하자. 이때 \(2^\Omega\)\(\Omega\)의 모든 부분집합들의 집합이다. 여기에서 \(2^\Omega\)는 시그마필드의 정의를 만족하므로 \((\Omega, 2^{\Omega})\) 는 잴 수 있는 공간이 된다. 이 공간위에서 함수 \(m: 2^{\Omega} \to [0,\infty]\) 를 아래와 같이 정의하자.

    \[m(A)=0, \quad \forall A \in 2^{\Omega}\]

    이러한 함수 \(m\) 은 (1) 정의역이 시그마필드이고 (2) 측도의공리1-3을 만족한다. 따라서 함수 \(m\) 를 측도라고 주장할 수 있다. (그런데 이따위 측도를 어디에 쓰지?)

    #

    D. 측도공간, 확률공간

    # 정의 – 잴 수 있는 공간 \((\Omega,{\cal F})\) 와 그 공간에서의 측도 \(m:{\cal F} \to [0,\infty]\) 을 묶은 \((\Omega, {\cal F},m)\) 을 measure space 라고 한다. 만약에 측도 \(m\)이 확률측도의 정의를 만족한다면 공간 \((\Omega, {\cal F},m)\) 혹은 \((\Omega, {\cal F},\mathbb{P})\) 는 확률공간 (probability space) 라고 한다.

    5. 확률을 어디에서 정의할까?

    # 확장이론 \(\Omega=[0,1)\) 일 경우 확률(=길이)을 정의하는 방법:

    • 사전인지사항1: \((\Omega, 2^{\Omega})\) 에서 확률(=길이)를 정의하는 것은 불가능함
    • 사전인지사항2: \((\Omega, \{\emptyset, \Omega\})\) 에서 \(\mathbb{P}=\lambda\)를 정의하는 것은 의미가 없음.
    • 문제를 해결하는 자세: \(\{\emptyset, \Omega\}\) 보다는 크고, \(2^{\Omega}\) 보다는 작은 어떠한 \({\cal F}\)에 대하여 확률(=길이)를 정의해야 하지 않나?
    • \((\Omega, ???, \lambda)\) 를 measure space 로 만드는 적당한 시그마필드 \(???\) 를 찾으면 되는것 아닌가? 그리고 그 \(???\) 에서 확률을 정의하면 되지 않나?

    우리는

    1. \((\Omega, ???, \lambda)\) 를 measure space 로 만드는 시그마필드는 찾는 방법??
    2. \(???\) 에서 확률을 정의하는 방법??

    을 논의하면 된다.

    #

    A. 상황1 – 시그마필드 구하기 귀찮아

    \((\Omega, ???, \lambda)\) 를 measure space 로 만드는 시그마필드는 찾는 방법?? 을 생각하자. 가능한 방식은 아래의 2가지가 있는데

    방법1: \(2^\Omega\) 에서 확률(=길이)을 잴 수 없는 집합들을 제외한다.

    방법2: 확률(=길이)를 정의할 수 있는 집합들 \({\cal A}\)를 정의하고 이를 확장시킨다.

    이중에서 방법2를 채택한다.

    # 예제1

    \(\Omega=\{1,2,3,4\}\)이라고 하자. 내가 관심있는 event의 모음은 아래와 같다.

    \[{\cal A} = \{\{1\},\{2\}\}\]

    당연히 이러한 이벤트에 대해서만 적절한 확률을 정의하면 좋겠는데, 이는 불가능 하다. 왜냐하면 \({\cal A}\)는 시그마필드가 아니기 때문이다. 따라서 할 수 없이 아래와 같은 방식으로 시그마필드를 구해야 했다.

    \[{\cal F} = \big\{\emptyset, \{1\}, \{2\}, \{1,2\}, \{3,4\}, \{1,3,4\}, \{2,3,4\}, \Omega \big\}\]

    이러한 \({\cal F}\)를 구하기는 것은 귀찮은 일인데, 이를 편리하게 해결하기 위해서 \(\sigma({\cal A})\)라는 기호를 도입하고 이를 “\(\{1\}\), \(\{2\}\)를 원소로 가지는 최소한의 \({\cal F}\)” 라고 생각 하기로 하였다. 즉 앞으로는

    \[\sigma({\cal A})\]

    라고만 써도 위에서 명시한 \({\cal F}\)를 의미한다고 알아서 생각하면 된다는 것이다.

    걱정: 문제는 이러한 논리전개가 항상 가능하냐는 것이다.

    귀찮아서 만든 이론1: 걱정할 필요 없다. 언제나 \(\sigma({\cal A})\)라는 표현은 가능하다. 즉 \(\Omega\)의 임의의 부분집합에 대하여 우리가 관심있는 집합만 모은 것을 \({\cal A}\)라고 할때, \({\cal A}\)의 모든 원소를 포함하고 시그마필드의 정의를 만족하는 최소한의 시그마필드 \(\sigma({\cal A})\)는 항상 존재한다.

    #

    # 예제2

    \(\Omega = \mathbb{R}\) 이라고 하자. 이중에서 우리가 관심있는 집합들은 르벡메져로 길이를 명확하게 잴 수 있는 아래와 같은 형태이다.

    \[[a,b]\]

    여기에서 \(a,b \in \mathbb{R}\), \(a<b\) 이라고 하자. 따라서 이 경우 \({\cal A}\)를 아래와 같이 설정할 수 있다.

    \[{\cal A} = \big\{[a,b]: a,b \in \mathbb{R}, a<b\big\}\]

    이제 \(\sigma({\cal A}):={\cal R}\) 를 상상하자. (귀찮아서 만든 이론1에 의하면 이러한 \({\cal R}\) 는 항상 존재함) 언뜻 생각하면 \({\cal R}\)의 원소는 \([a,b]\) 의 형태만 가능하여, 확률 혹은 길이를 정의함에 너무 제한적인 정의역일것 같은데 그렇지 않다. \({\cal R}\) 은 상당히 많은 케이스를 포함하는 집합이다. 예를들면 아래와 같은 집합들은 모두 \({\cal R}\) 의 원소이다.

    • \([0,2)\)
    • \(\{2\}\)
    • \((0,2)\)
    • \([0,\infty)\), \((0,\infty)\)
    • \((-\infty,0)\), \((-\infty,0]\)
    • \([1,2] \cup [3,4]\)
    • \((1,2] \cup [3,4)\)
    • \(\mathbb{N}\), \(\mathbb{Z}\), \(\mathbb{Q}\)
    • \([0,2] \cap \mathbb{Q}\)

    #

    B. 상황2 – 확률 정의하기 귀찮아

    # 예제1 – motivating EX

    \(\Omega=\{1,2,3,4\}\)이라고 하자. 내가 관심있는 집합의 모음은 아래와 같다.

    \[{\cal A} = \{\emptyset, \{1\},\{2\},\{3,4\},\Omega\}\]

    여기에서 \({\cal A}\)는 시그마필드가 아니다. 따라서 \({\cal A}\)에서는 확률을 정의할 수 없다. 확률을 정의하려면 \(\sigma({\cal A})\)에서 정의해야 한다.

    - 소망: 그래도 그냥 \({\cal A}\)에서만 확률 비슷한걸4 잘 정의하면 안될까?

  • 4 정의역이 시그마필드가 아니므로 확률이라고 말할 수 없다

  • - 희망: 이게 될 것 같다. 예를들면 함수 \(\tilde{P}:{\cal A} \to [0,1]\)를 아래와 같이 정의하자.

    • \(\tilde{P}(\emptyset) = 0\)
    • \(\tilde{P}(\{1\}) = 1/4\)
    • \(\tilde{P}(\{2\}) = 1/2\)
    • \(\tilde{P}(\{3,4\}) = 1/4\)
    • \(\tilde{P}(\Omega) = 1\)

    이 정도만 정의해보자. \(\tilde{P}\)는 정의역이 시그마필드가 아니라는 점만 제외하면 set function \(\tilde{P}\) 는 확률의 공리 1,2,3을 따른다. 이렇게 함수 \(\tilde{P}\)를 정의하게 되면

    \[\sigma({\cal A}) = \big\{\emptyset, \{1\}, \{2\}, \{1,2\}, \{3,4\}, \{1,3,4\}, \{2,3,4\}, \Omega \big\}\]

    에서의 확률 \(\mathbb{P}:\sigma({\cal A}) \to [0,1]\)는 확률 비슷한 함수 \(\tilde{P}\)를 “알아서, 잘, 센스있게” 확장하여 정의할 수 있다. 구체적으로는 아래와 같이 된다.

    \(\mathbb{P}\) \(\tilde{P}\)
    \(\emptyset\) \(0\) \(0\)
    \(\{1\}\) \(\frac{1}{4}\) \(\frac{1}{4}\)
    \(\{2\}\) \(\frac{1}{2}\) \(\frac{1}{2}\)
    \(\{3,4\}\) \(\frac{1}{4}\) \(\frac{1}{4}\)
    \(\Omega\) \(1\) \(1\)
    \(-\) \(-\) \(-\)
    \(\{1,2\}\) \(\frac{3}{4}\) None
    \(\{1,3,4\}\) \(\frac{1}{2}\) None
    \(\{2,3,4\}\) \(\frac{3}{4}\) None

    #

    # 예제2 – motivating EX (2)

    \(\Omega=\{1,2,3,4\}\)이라고 하고 \({\cal A} = \{\emptyset, \{1\},\{2\}, \{3,4\}, \Omega\}\) 라고 하자. 그리고 아래와 같은 \(\sigma({\cal A})\)를 다시 상상하자.

    \[\sigma({\cal A}) = \big\{\emptyset, \{1\}, \{2\}, \{1,2\}, \{3,4\}, \{1,3,4\}, \{2,3,4\}, \Omega \big\}\]

    위의 시그마필드에서 확률을 예제1과 다른 방식으로 정의할 수 도 있다. 예를들면 아래와 같은 방식으로 정의가능하다.

    \(\mathbb{P}_1\) \(\tilde{P}_1\)
    \(\emptyset\) \(0\) \(0\)
    \(\{1\}\) \(\frac{1}{3}\) \(\frac{1}{3}\)
    \(\{2\}\) \(\frac{1}{3}\) \(\frac{1}{3}\)
    \(\{3,4\}\) \(\frac{1}{3}\) \(\frac{1}{3}\)
    \(\Omega\) \(1\) \(1\)
    \(-\) \(-\) \(-\)
    \(\{1,2\}\) \(\frac{2}{3}\) None
    \(\{1,3,4\}\) \(\frac{2}{3}\) None
    \(\{2,3,4\}\) \(\frac{2}{3}\) None

    또한 아래와 같은 방식도 가능하다.

    \(\mathbb{P}_2\) \(\tilde{P}_2\)
    \(\emptyset\) \(0\) \(0\)
    \(\{1\}\) \(0\) \(0\)
    \(\{2\}\) \(0\) \(0\)
    \(\{3,4\}\) \(1\) \(1\)
    \(\Omega\) \(1\) \(1\)
    \(-\) \(-\) \(-\)
    \(\{1,2\}\) \(0\) None
    \(\{1,3,4\}\) \(1\) None
    \(\{2,3,4\}\) \(1\) None

    어떠한 방식으로 정의하든 \({\cal A}\)에서 확률 비슷한 것 \(\tilde{P}_1,\tilde{P}_2\)를 잘 정의하기만 \(\sigma({\cal A})\)에서의 확률로 적절하게 확장할 수 있다. 심지어 이런 확장은 유일한 듯 하다.

    귀찮아서 만든 이론2: 운이 좋다면, \({\cal A}\) 에서 확률의 공리를 만족하는 적당한 함수 \(\tilde{P}:{\cal A} \to [0,1]\)\((\Omega, \sigma({\cal A}))\) 에서의 확률측도 \(\mathbb{P}\)로 업그레이드 할 수 있으며 업그레이드 결과는 유일하다.

    #

    # 예제3 – 운이 안 좋은 경우 1

    \(\Omega=\{1,2,3\}\) 이라고 하고 \({\cal A} = \{\emptyset, \{1,2\},\{2,3\}, \Omega\}\) 라고 하자.

    아래와 같은 확률 비슷한 함수 \(\tilde{P}:{\cal A} \to [0,1]\)를 정의하자.

    • \(\tilde{P}(\emptyset) = 0\)
    • \(\tilde{P}(\{1,2\}) = 0\)
    • \(\tilde{P}(\{2,3\}) = 0\)
    • \(\tilde{P}(\Omega) = 1\)

    \(\tilde{P}\)는 분명히 \({\cal A}\)에서 확률의 공리1-3을 만족한다. 하지만 \(\sigma({\cal A})\)로의 확장은 불가능하다.

    #

    # 예제4 – 운이 안 좋은 경우 2

    \(\Omega=\{1,2,3,4\}\) 이라고 하고 \({\cal A} = \{\emptyset, \{1,2\},\{2,3\}, \Omega\}\) 라고 하자.

    아래와 같은 확률 비슷한 함수 \(\tilde{P}:{\cal A} \to [0,1]\)를 정의하자.

    • \(\tilde{P}(\emptyset) = 0\)
    • \(\tilde{P}(\{1,2\}) = 1/2\)
    • \(\tilde{P}(\{2,3\}) = 1/2\)
    • \(\tilde{P}(\Omega) = 1\)

    \(\tilde{P}\)는 분명히 \({\cal A}\)에서 확률의 공리1-3을 만족한다.

    \(\sigma({\cal A})\)로의 확장도 가능하다. 하지만 유일한 확장을 보장하지 않는다.

    \(\mathbb{P}_1\) \(\mathbb{P}_2\) \(\tilde{P}\)
    \(\emptyset\) \(0\) \(0\) \(0\)
    \(\{1,2\}\) \(\frac{1}{2}\) \(\frac{1}{2}\) \(\frac{1}{2}\)
    \(\{2,3\}\) \(\frac{1}{2}\) \(\frac{1}{2}\) \(\frac{1}{2}\)
    \(\Omega\) \(1\) \(1\) \(1\)
    \(-\) \(-\) \(-\) \(-\)
    \(\{1\}\) \(0\) \(\frac{1}{2}\) None
    \(\{2\}\) \(\frac{1}{2}\) \(0\) None
    \(\{3\}\) \(0\) \(\frac{1}{2}\) None
    \(\{4\}\) \(\frac{1}{2}\) \(0\) None
    \(\{1,3\}\) \(0\) \(1\) None
    \(\{1,4\}\) \(\frac{1}{2}\) \(\frac{1}{2}\) None
    \(\{2,4\}\) \(1\) \(0\) None
    \(\{3,4\}\) \(\frac{1}{2}\) \(\frac{1}{2}\) None
    \(\{2,3,4\}\) \(1\) \(\frac{1}{2}\) None
    \(\{1,3,4\}\) \(\frac{1}{2}\) \(1\) None
    \(\{1,2,4\}\) \(1\) \(\frac{1}{2}\) None
    \(\{1,2,3\}\) \(\frac{1}{2}\) \(1\) None

    #

    # 예제5 – 혹시…

    \(\Omega=\mathbb{R}\), \({\cal A}=\big\{[a,b]: a,b \in \mathbb{R}, a<b \big\}\) 라고 하자.

    \({\cal A}\)에서만 측도비슷한 함수 \(\tilde{\lambda}([a,b])=b-a\)를 잘 정의한다면 그것이 \(\sigma({\cal A})\)에서의 측도 \(\lambda\)으로 업그레이드 가능하며, 그 업그레이드 결과는 유일할까? 그래서 아래의 집합들에 대한 확률을 무모순으로 정의가능할까?

    • \([0,2)\)
    • \(\{2\}\)
    • \((0,2)\)
    • \([0,\infty)\), \((0,\infty)\)
    • \((-\infty,0)\), \((-\infty,0]\)
    • \([1,2] \cup [3,4]\)
    • \((1,2] \cup [3,4)\)
    • \(\mathbb{N}\), \(\mathbb{Z}\), \(\mathbb{Q}\)
    • \([0,2] \cap \mathbb{Q}\)

    이게 가능하다면 대박인데, 결론적으로 말하면 이게 가능하다. 이게 가능한 이유는 카라테오도리의 확장정리 때문

    #

    6. 측도론의 유산

    이걸 제가 좀 자세히 할지 못할지 모르겠네요..

    # 이론 – 아래와 같은 집합을 고려하자.

    • \({\cal A}_1:= \{A\subset \mathbb{R}: A \text{ is open}\}\)5
    • \({\cal A}_2:= \{(a,b): a,b \in \mathbb{R}, a<b\}\)
    • \({\cal A}_3:= \{[a,b): a,b \in \mathbb{R}, a<b\}\)
    • \({\cal A}_4:= \{(a,b]: a,b \in \mathbb{R}, a<b\}\)
    • \({\cal A}_5:= \{[a,b]: a,b \in \mathbb{R}, a<b\}\)
    • \({\cal A}_6:= \{(-\infty,b): a,b \in \mathbb{R}, a<b\}\)
    • \({\cal A}_7:= \{(-\infty,b]: a,b \in \mathbb{R}, a<b\}\)
    • \({\cal A}_8:= \{(a,\infty): a,b \in \mathbb{R}, a<b\}\)
    • \({\cal A}_9:= \{[a,\infty): a,b \in \mathbb{R}, a<b\}\)
  • 5 여기에서 open은 엄밀하게 말하면 usual topological spcace \((\mathbb{R},{\cal U})\) 에서의 \({\cal U}\)-open set을 의미한다. 즉 보통위상공간에서 정의가능한 openset을 의미한다.

  • 아래가 성립한다.

    \[{\cal R}:={\cal B}(\mathbb{R}) = \sigma({\cal A}_1)=\sigma({\cal A}_2)=\dots=\sigma({\cal A}_9)\]

    #

    # 정의 – 위의 이론에서 논의된 \({\cal R}\)을 보렐시그마필드라고 한다.

    참고로 “시그마필드” \(\Leftarrow\) “길이를 잴 수 있는 집합들의 모임” 이지만, “보렐시그마필드” \(\Leftrightarrow\) “길이를 잴 수 있는 집합들의 모임” 이다. 그리고 보렐시그마필드야 말로 \((\mathbb{R},???,\lambda)\) 를 measure space로 만드는 가장 합리적인 집합(collection)이다.

    #

    # 이론\(\Omega=\mathbb{R}\) 에 대하여 아래와 같은 collection \({\cal A}\)를 고려하자.

    \[{\cal A}=\{(a,b]: a,b\in \mathbb{R}, a<b\}\]

    그리고 아래와 같은 함수 \(\tilde{\lambda}:{\cal A} \to [0,\infty]\)을 고려하자.

    \[\tilde{\lambda}((a,b]) = b-a\]

    이러한 함수 \(\tilde{\lambda}\)\((\mathbb{R},{\cal R})\)에서의 메져 \(\lambda:{\cal R} \to [0,\infty]\)로 쉽게 업그레이드 가능하며 이 업그레이드 결과는 유일하다.

    #

    # 정의 – 위의 이론에 의하여 업그레이드 된 메져 \(\lambda\)을 르벡메져라고 한다.