On this page

04wk: 측도론 intro (4)

Author

최규빈

Published

March 28, 2023

강의영상

youtube: https://youtube.com/playlist?list=PLQqh36zP38-ysaKaydM8V9RauAwOaUhSN

지금까지의 스토리

- 지금까지의 이야기.

  • Ω의 모든 부분집합에 대해서 확률을 “무모순”으로 정의하는게 엄청 쉬운일 인줄 알았는데,
  • 사실은 그렇지가 않았다. 확률을 정의하는건 매우 까다로운 일이었다.
  • 이러한 까다로움을 해결하기 위해서 “르벡메져”라는 새로운 도구를 사용했다. 이 도구는 몇 가지 까다로운 집합에 대하여 확률을 무모순으로 정의할 수 있었다.
  • 르벡메져는 구간 [0,2π)의 모든 유리수 집합의 길이와 구간 [0,2π)의 모든 무리수 집합의 길이를 다르게 정의하는 신기한 방식을 사용하는데, 이러한 방식을 납득하기 위한 최소한의 노력으로 “셀 수 있는 무한”과 “셀 수 없는 무한”의 개념을 공부했다.
  • 하지만 르벡메져를 통해서도 Ω의 모든 부분집합에 대하여 길이를 잴 수 없는 집합이 존재함이 밝혀졌다.
  • 따라서 Ω의 모든 부분집합에 대해서 확률을 “무모순”으로 정의하는 일은 포기하였다.
  • 대신에 Ω의 부분집합 중, 잴 수 있는 집합들에 대해서만 확률을 “무모순”으로 정의하는 일을 시도했다.
  • 이 잴 수 있는 집합들의 모임을 시그마필드라 칭하고 기호로는 F라고 정의하였다.
  • 1 동전예제

  • 2 바늘이 하나 있는 시계예제

  • 3 비탈리집합

  • - 이제 하고 싶은 것

    시그마필드에서 확률을 정의하자! 시그마필드를 정의역으로 하는 “확률”이라는 이름의 함수를 정의하자.

    확률측도 motivation

    (예제1) – 시그마필드에서만 확률정의가능

    Ω={H,T} 라고 하고 F={,{H},Ω} 이라고 하자. 아래와 같은 함수 P를 고려하고 이것을 확률이라고 하자. 이러한 확률은 합리적인가?

    • P()=0
    • P({H})=12
    • P(Ω)=1

    (해설1) F는 시그마필드가 아니므로 이 위에서는 애초에 확률을 정의할 수 없음.

    (해설2) 확률을 잘 정의하기 위해서는 우선 잘 정의된 “잴 수 있는 공간 (Ω,F)” 가 필요하다.

    (예제2) – 잘 정의된 확률

    Ω={H,T} 라고 하고 F=2Ω 이다. 아래와 같은 함수 P를 고려하고 이를 잴 수 있는 공간 (Ω,F) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • P()=0
    • P({H})=1100
    • P({T})=99100
    • P(Ω)=1

    (해설) 합리적임.

    (예제3) – 확률은 0보다 커야해.

    Ω={H,T} 라고 하고 F=2Ω 이다. 아래와 같은 함수 P를 고려하고 이를 잴 수 있는 공간 (Ω,F) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • P()=0
    • P({H})=12
    • P({T})=12
    • P(Ω)=1

    (해설) 확률은 음수가 나오면 안되므로 합리적이지 않음.

    (예제4) – 전체확률은 1이어야 함.

    Ω={H,T} 라고 하고 F={,Ω} 이다. 아래와 같은 함수 P:F[0,1]를 고려하고 이를 잴 수 있는 공간 (Ω,F) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • P()=0
    • P(Ω)=0.5

    (해설) 전체확률은 1이어야 하므로 합리적이지 않음.

    (예제5) – 공집합의 확률은 0이어야 함.

    Ω={H,T} 라고 하고 F={,Ω} 이다. 아래와 같은 함수 P:F[0,1]를 고려하고 이를 잴 수 있는 공간 (Ω,F) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • P()=0.5
    • P(Ω)=1

    (해설) 공집합의 확률은 0이어야 하므로 합리적이지 않음.

    (예제6) – 서로소인 집합을 합친 확률, 여집합의 확률

    Ω={H,T} 라고 하고 F={,{H},{T},Ω} 이다. 아래와 같은 함수 P:F[0,1]를 고려하고 이를 잴 수 있는 공간 (Ω,F) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • P()=0
    • P({H})=1/3
    • P({T})=1/3
    • P(Ω)=1

    (해설1) 합리적이지 않음. 왜냐하면

    • P({H}{T})=P(Ω)=1
    • P({H}{T})=P({H})+P({T})=2/3

    이므로 모순임.

    (해설2) 합리적이지 않음. 왜냐하면

    • P(Ω{H})=P({T})=1/3
    • P(Ω{H})=1P({H})=2/3

    이므로 모순임.

    (예제7) – 포함관계에 있는 집합의 확률

    Ω={1,2,3} 라고 하고

    F={,{1},{2},{3},{1,2},{1,3},{2,3},Ω}

    라고 하자. 아래와 같은 함수 P:F[0,1]를 고려하고 이를 잴 수 있는 공간 (Ω,F) 에서의 확률이라고 하자. 이러한 확률은 합리적인가?

    • P()=0
    • P({1})=1/4
    • P({2})=1/4
    • P({3})=2/4
    • P({1,2})=2/4
    • P({1,3})=3/4
    • P({2,3})=1/4
    • P(Ω)=1

    (해설1) 합리적이지 않음. 왜냐하면

    • P({2}{3})=P({2,3})=1/4
    • P({2}{3})=P({2})+P({3})=3/4

    이므로 모순임.

    (해설2) 합리적이지 않음. 왜냐하면

    • {3}{2,3}
    • P({3})P({2,3})

    이므로 ABP(A)P(B) 가 성립하지 않음.

    (기타등등 해설)

    P({2,3}c), P({1}{2,3}) 따위를 계산해도 모순임

    생각의 시간

    - 확률이라는 것을 구체적으로 정의하지는 않았지만 적어도 현재까지 파악한 직관에 의하면 아래와 같은 조건을 만족하는 함수라고 “일단은” 생각할 수 있다.

    1. 확률 P는 시그마필드에서 정의되어야 한다. 따라서 확률이라는 말을 하기 전에 우선 “Ω에 대한 F”를 정의하거나 “잴 수 있는 공간 (Ω,F)”을 정의해야 한다.
    2. 확률 P는 0보다 크고 1보다 작아야 한다.
    3. 전체확률은 항상 1이어야 한다. 즉 P(Ω)=1 이어야 한다. // (이게 5번과 결합하면 공집합일 확률이 0이어야 한다는 것을 암시한다)
    4. 서로소인 두 집합 A,B에 대하여 확률 P(AB)P(A)+P(B)와 같이 계산 되어야 한다.
    5. P(Ac)=1P(A) 가 성립해야 한다.
    6. 포함관계에 있는 두 집합 AB에 대하여 P(A)P(B)가 항상 성립해야 한다.

    - 또한 아래와 같은 성질도 있어야 할 것 같다. (혹은 있었으면 좋겠다)

    1. 서로소인 집합열 B1,B2, 에 대하여 P(i=1Bi)=i=1P(Bi) 가 성립하면 좋겠다. (4번의 업그레이드 버전)
    2. P(AB)=P(A)+P(B)P(AB) 등을 포함한 기타 잡스러운 성질들도 모두 성립하면 좋겠다.

    - 이제 우리가 따져봐야 할 것은 (1) 확률을 정의하기 위한 조건으로 1-8이면 충분한지 (혹시 더 많은 조건들이 필요한건 아닌지) (2) 위에서 리스팅한 조건들이 꼭 모두 다 필요한지? (예를 들면 한 두개의 조건이 다른조건을 암시하는건 아닌지) 이다.

    - 결론적으로는 말하면 1,2,3,7만 있으면 충분하다.

    - 연습1: (3),(4)(5) 임을 보여라.

    - 연습2: (2),(4)(6) 임을 보여라.

    확률측도의 정의

    - 확률의 정의: 메져(measure)는 길이따위를 일반화한 개념이다. 확률은 메져의 특수한 형태이다.메져와 확률은 아래와 같이 정의한다.

  • 4 메져의 조건에서 전체집합의 길이가 1이라는 제약만 있음

  • 그림1: Durret책에서 정의한 measure와 probability measure의 정의, 드래그한 부분이 정의임.

    - 교재의 정의 약간 설명

    • 교재에서는 일반적인 측도 μ를 설명하고 전체집합의 길이가 1인 측도를 확률측도 P라고 한다고 설명하고 있다. 따라서 교재의 μ는 문맥상 P로 바꾸어 이해해도 무방함.
    • 교재에서 μ는 잴 수 있는 공간 (Ω,F에서 정의한다고 서술하고 있으며 이는 우리가 이미 살펴본 조건 1과 일치한다.
    • 교재에서 μ:FR이라고 서술되어 있는데 우리의 경우는 P:F[0,1]로 바꾸어 이해하면 된다.

    - 사실 잘 따져보면 이것은 우리가 위키에서 찾아본 확률의 공리도 결국 같은 소리를 하고 있다.

    그림2: 확률의 공리

    - 확률의 정의: 확률은 잴 수 있는 공간 (Ω,F)가 전제되었을 경우 정의 할 수 있는 일종의 함수 P:F[0,1] 인데, 아래의 조건을 만족해야 한다. // 위키버전

    1. 확률은 항상 양수이어야 하며,
    2. 전체 확률은 1이어야 하며, (그리고 이것은 공집합일 확률이 0임을 암시함)
    3. σ-additivity가 성립해야 한다.

    - 메져의 정의: 메져는 잴 수 있는 공간 (Ω,F)가 전제되었을 경우 정의 할 수 있는 일종의 함수 m:F[0,]인데, 아래의 조건을 만족해야 한다.

    1. 메저는 항상 양수이어야 하며,
    2. 공집합은 메져가 0이어야 하며,
    3. σ-additivity가 성립해야 한다.

    귀찮아서 만든 이론들 ()

    상황1: 시그마필드 구하기 귀찮아

    (예제1)

    - Ω={1,2,3,4}이라고 하자. 내가 관심있는 event의 모음은 아래와 같다.

    A={{1},{2}}

    - 당연히 이러한 이벤트에 대해서만 적절한 확률을 정의하면 좋겠는데, 이는 불가능 하다. 왜냐하면 A는 시그마필드가 아니기 때문이다.

    - 따라서 할 수 없이 아래와 같은 방식으로 시그마필드를 구해야 했다.

    F={,{1},{2},{1,2},{3,4},{1,3,4},{2,3,4},Ω}

    - 이러한 F를 구하기는 것은 귀찮은 일인데, 이를 편리하게 해결하기 위해서 σ(A)라는 기호를 도입하고 이를 “{1}, {2}를 원소로 가지는 최소한의 F” 라고 생각 하기로 하였다. 즉 앞으로는

    σ(A)

    라고만 써도 위에서 명시한 F를 의미한다고 알아서 생각하면 된다는 것이다.

    걱정: 문제는 이러한 논리전개가 항상 가능하냐는 것이다.

    귀찮아서 만든 이론1: 걱정할 필요 없다. 언제나 σ(A)라는 표현은 가능하다. 즉 Ω의 임의의 부분집합에 대하여 우리가 관심있는 집합만 모은 것을 A라고 할때, A의 모든 원소를 포함하고 시그마필드의 정의를 만족하는 최소한의 시그마필드 σ(A)는 항상 존재한다.

    (예제2)

    Ω=R 이라고 하자. 이중에서 우리가 관심있는 집합들은 르벡메져로 길이를 명확하게 잴 수 있는 아래와 같은 형태이다.

    [a,b]

    여기에서 a,bR, a<b 이라고 하자. 따라서 이 경우 A를 아래와 같이 설정할 수 있다.

    A={[a,b]:a,bR,a<b}

    이제 σ(A)를 상상하자. 이는 Ω=R에서 잴 수 있는 집합들의 모임이다. 편의상 σ(A):=R로 정의하자. 여기에서 R 상당히 많은 케이스를 포함하는 집합이다. 예를들면 아래와 같은 집합들은 모두 R의 원소이다. (즉 아래의 집합은 [a,b]를 잴 수 있다고 할때, 당연히 잴 수 있다고 여겨지는 집합들이다.)

    • [0,2)
    • {2}
    • (0,2)
    • [0,), (0,)
    • (,0), (,0]
    • [1,2][3,4]
    • (1,2][3,4)
    • N, Z, Q
    • [0,2]Q

    사실상 R=σ(A)와 같은 기호가 없다면 R에서 잴 수 있는 집합들의 모임은 명시적으로 쓰는 것 자체가 불가능함.

    상황2: 확률 정의하기 귀찮아

    (예제1) – motivating EX

    - Ω={1,2,3,4}이라고 하자. 내가 관심있는 집합의 모음은 아래와 같다.

    A={,{1},{2},{3,4},Ω}

    - 여기에서 A는 시그마필드가 아니다. 따라서 A에서는 확률을 정의할 수 없다. 확률을 정의하려면 σ(A)에서 정의해야 한다.

    - 소망: 그래도 그냥 A에서만 확률 비슷한걸 잘 정의하면 안될까?

  • 5 정의역이 시그마필드가 아니므로 확률이라고 말할 수 없다

  • - 희망: 이게 될 것 같다. 예를들면 함수 P~:A[0,1]를 아래와 같이 정의하자.

    • P~()=0
    • P~({1})=1/4
    • P~({2})=1/2
    • P~({3,4})=1/4
    • P~(Ω)=1

    이 정도만 정의해보자. P~는 정의역이 시그마필드가 아니라는 점만 제외하면 확률의 공리 1,2,3을 따른다. 이렇게 함수 P~를 정의하게 되면

    σ(A)={,{1},{2},{1,2},{3,4},{1,3,4},{2,3,4},Ω}

    에서의 확률 P:σ(A)[0,1]는 확률 비슷한 함수 P~를 “알아서, 잘, 센스있게” 확장하여 정의할 수 있다. 구체적으로는 아래와 같이 된다.

    P P~
    0 0
    {1} 14 14
    {2} 12 12
    {3,4} 14 14
    Ω 1 1
    {1,2} 34 None
    {1,3,4} 12 None
    {2,3,4} 34 None

    (예제2) – motivating EX (2)

    - Ω={1,2,3,4}이라고 하고 A={,{1},{2},{3,4},Ω} 라고 하자. 그리고 아래와 같은 σ(A)를 다시 상상하자.

    σ(A)={,{1},{2},{1,2},{3,4},{1,3,4},{2,3,4},Ω}

    - 위의 시그마필드에서 확률을 예제1과 다른 방식으로 정의할 수 도 있다. 예를들면 아래와 같은 방식으로 정의가능하다.

    P1 P~1
    0 0
    {1} 13 13
    {2} 13 13
    {3,4} 13 13
    Ω 1 1
    {1,2} 23 None
    {1,3,4} 23 None
    {2,3,4} 23 None

    또한 아래와 같은 방식도 가능하다.

    P2 P~2
    0 0
    {1} 0 0
    {2} 0 0
    {3,4} 1 1
    Ω 1 1
    {1,2} 0 None
    {1,3,4} 1 None
    {2,3,4} 1 None

    - 어떠한 방식으로 정의하든 A에서 확률 비슷한 것 P~1,P~2를 잘 정의하기만 σ(A)에서의 확률 P로 적절하게 확장할 수 있다. 심지어 이런 확장은 유일한 듯 하다.

    귀찮아서 만든 이론2: 운이 좋다면, A 에서 확률의 공리를 만족하는 적당한 함수 P~:A[0,1](Ω,σ(A)) 에서의 확률측도 P로 업그레이드 할 수 있으며 업그레이드 결과는 유일하다.

    (예제3) – 운이 안 좋은 경우

    - Ω={1,2,3} 이라고 하고 A={,{1,2},{2,3},Ω} 라고 하자.

    - 아래와 같은 확률 비슷한 함수 P~:A[0,1]를 정의하자.

    • P~()=0
    • P~({1,2})=0
    • P~({2,3})=0
    • P~(Ω)=1

    - P~는 분명히 A에서 확률의 공리1-3을 만족한다.

    - 하지만 σ(A)로의 확장은 불가능하다.

    (예제4) – 운이 안 좋은 경우

    - Ω={1,2,3,4} 이라고 하고 A={,{1,2},{2,3},Ω} 라고 하자.

    - 아래와 같은 확률 비슷한 함수 P~:A[0,1]를 정의하자.

    • P~()=0
    • P~({1,2})=1/2
    • P~({2,3})=1/2
    • P~(Ω)=1

    - P~는 분명히 A에서 확률의 공리1-3을 만족한다.

    - σ(A)로의 확장도 가능하다. 하지만 유일한 확장을 보장하지 않는다.

    P1 P2 P~
    0 0 0
    {1,2} 12 12 12
    {2,3} 12 12 12
    Ω 1 1 1
    {1} 0 12 None
    {2} 12 0 None
    {3} 0 12 None
    {4} 12 0 None
    {1,3} 0 1 None
    {1,4} 12 12 None
    {2,4} 1 0 None
    {3,4} 12 12 None
    {2,3,4} 1 12 None
    {1,3,4} 12 1 None
    {1,2,4} 1 12 None
    {1,2,3} 12 1 None

    (예제5) – 혹시…

    - Ω=R, A={[a,b]:a,bR,a<b} 라고 하자.

    - A에서만 측도비슷한 함수 m~([a,b])=ba를 잘 정의한다면 그것이 σ(A)에서의 측도 m으로 업그레이드 가능하며, 그 업그레이드 결과는 유일할까?