On this page

10wk: 분포, 분포함수

Author

최규빈

Published

May 9, 2023

강의영상

youtube: https://youtube.com/playlist?list=PLQqh36zP38-ymuuOEv4Zru7SF5duhH7dC

Preview

- 확률변수 XΩ의 모든 원소를 적절한 숫자로 “잘” 연결하는 어떠한 맵핑이라는 느낌은 이해했다. 하지만 말 그대로 확률변수 X는 두 measurable space (Ω,F)(R,R)을 잘 연결하는 어떠한 맵핑일 뿐이라서 우리가 그동안 가지고 있던 “랜덤성”에 대한 정의는 X에서 빠져있다. 즉 ωΩ의 값이 고정이면 X(ω)의 값도 고정이다. 하지만 우리는 X가 랜덤으로 숫자가 바뀌는 (잘못된) 느낌을 가지고 살고 있었는데, 그렇다면 이러한 “랜덤성”은 어디에서 비롯한 것일까?

- X의 입력이 결정되면 출력이 고정되므로 X가 가지고 있는 “출력이 랜덤으로 변화하는 느낌”을 위해서는 함수 X의 입력 ω가 랜덤으로 변화해야 한다. 이렇게 ω를 랜덤하게 선택할 수 있게 만들어주는 장치가 확률측도 P이며 P({ω}) Ω에서 {ω}가 선택될 확률을 의미한다. 따라서 Pω를 랜덤으로 선택할 수 있게 해주고 그 결과 X(ω)의 출력 역시 랜덤하게 나올 수 있도록 해준다.

- 저번시간에서는 X에 초점을 맞추었다. 즉 ΩR을 “잘 연결” 하는 작업에 초점을 맞추었다. 그 결과 X의 임의의 inverse image에 대하여 P로 그 길이를 재는데 모순됨이 없도록 하였다.

- 이번시간에는 P가 가지는 랜덤성에 초점을 맞추도록 하겠다. 특히 서로 다른 확률공간 (Ω,F,P)(Ω,F,P) 이 비슷한 랜덤성을 가질때, 이러한 랜덤성을 효과적으로 서술하는 “분포”라는 개념을 구체화하고 나아가 “분포함수”, “밀도함수”의 개념을 소개한다.

분포와 분포함수

분포 (distribution)

- (예제1) – 동전예제

동전을 던지는 예제로 만들어지는 아래와 같은 확률공간 (Ω,F,P) 를 생각하자.

  • Ω={H,T}
  • F=2Ω
  • P({H})=P({T})=12
  • 1 이렇게만 해도 확률이 정의되는 이유는 카라테오도리 확장정리 덕분

  • 확률변수 X:ΩR를 아래와 같이 정의하자.

    • X(H)=1
    • X(T)=0

    이제 BR 에 대하여 아래와 같은 표현들을 고려하자.

    1. P(XB) // 고등학교 부터 쓰던 그 표현
    2. P({ω:X(ω)B}) // 이번에 배운 표현, 표현1의 정확한 버전
    3. P(X1(B)) // 표현2의 다른 버전, inverse image의 느낌이 확 살아 있음
    4. (PX1)(B) // 생각해보니까 이것도 가능함. P, X 모두 함수였잖아?

    표현4를 좀 더 살펴보자. 기호를 간단하게 하기위해서 μX:=PX1로 정의하자.

    • P()=0μX()=0
    • P({H})=12μX({0})=12
    • P({T})=12μX({1})=12
    • P({H,T})=1μX({0,1})=1

    - (예제2) – 주머니 예제

    주머니에 하얀공과 빨간공이 하나씩 있다고 하자. 주머니에 손을 넣어 이중 하나의 공을 뽑는 시행을 한다고 하자. 이러한 상황으로 만들어지는 아래와 같은 확률공간 (Ω,F,P) 를 생각하자.

    • Ω={R,W}
    • F=2Ω
    • P({R})=P({W})=12

    확률변수 X:ΩR를 아래와 같이 정의하자.

    • X(R)=1
    • X(W)=0

    이제 BR 에 대하여 아래와 같은 표현들을 고려하자.

    1. P(XB)
    2. (PX1)(B)=μX(B)

    두 표현을 비교하여 살펴보자.

    • P()=0μX()=0
    • P({R})=12μX({0})=12
    • P({W})=12μX({1})=12
    • P({R,W})=1μX({0,1})=1

    - 생각의 시간1: 예제1,2를 관찰하며 생각

    • 예제1,2의 공통속성: 제1과 예제2는 어떠한 공통점이 있다. 비록 outcome, event, σ-field, P, X 가 모두 다르지만 사실 어떻게 보면 기호의 차이만 있을 뿐 “확률과 관련된 시행이 어떠한 결과로 나타나는지”에 관련한 본질적인 면에서 같다고 볼 수 있다.
    • μXP보다 예제1,2의 공통속성을 나타내기에 유리한 것 같은데?
  • 2 우리는 이것을 “분포”가 같다고 부르고 있어요

  • 3 우리가 이미 “분포”라고 알고 있는 개념

  • - 생각의 시간2: μX는 언제나 잘 정의되는가?

    (Ω,F,P)가 확률공간이고 X:ΩR이 확률변수라면, μX:=PX1는 언제나 잘 정의된다.

    • 시그마필드: 모든 BR에 대하여 X1(B)가 시그마필드의 원소가 아닐 수 없다. (만약 그렇다면 X는 확률변수가 아닌걸?)
    • 메져: 모든 BR에 대하여 P(X1(B))의 값을 모순되게 정의할 수 없다. (만약 그렇다면 (Ω,F,P)는 확률공간이 아닌걸?)

    결론: μX는 안전해!

    - 생각의 시간3: μX도 확률측도의 조건을 만족한다. 구체적으로는 (R,R)에서의 확률측도가 된다. 아래를 체크하자.

    1. 정의역: μX는 시그마필드를 정의역으로 가진다.
    2. 함수값: μX()=0, μX(R)=1 이며 μX()은 항상 양의값을 가진다.
    3. σ-add: μXR의 모든 서로소인 집합에 대하여 σ-additivity 가 성립한다.

    따라서 P(Ω,F)에서의 확률측도이듯이 μX(R,R)에서의 확률측도이다.

    - (정의): X를 확률공간 (Ω,F,P)에서 정의된 확률변수라고 하자. 이때 μX:=PX1로 정의가능한 함수 μX:R[0,1]X의 distribution 라고 부른다.

    여기에서 “X를 확률공간 (Ω,F,P)에서의 확률변수”라는 말이 얼마나 많은 구질구질한 선언을 대신 하는지 생각해보라. 제대로 쓰려면 아마 “Ω를 어떠한 실험에 의하여 발생한 outcome들의 집합이라고 하자. 그리고 FΩ에 대한 시그마필드라고 하자. 즉 F는 … 을 만족하는 집합이다. (Ω,F)을 묶어서 가측공간이라고 하자. P는 잴 수 있는 공간 (Ω,F)에 대한 확률측도라고 하자. 즉 P는 … 를 만족하는 함수이다. 그리고 X(Ω,F)(R,R)인 확률변수라고 하자. 즉 X는 임의의 BR에 대하여 … 를 만족하는 함수이다. 여기에서 R은 Borel sets이다. 즉 R은 … 를 만족하는 집합이다.” 와 같은 방식으로 써야할 것이다.

    - μX(R,R)에서의 확률측도이므로 (R,R,μX)는 확률공간이 된다. 그런데 μXX에 의하여 정의되므로, 확률공간 (R,R,μX) 역시 X에 의하여 정의되는데 이러한 이유로 확률공간 (R,R,μX)X에 의하여 유도된 확률공간이라고 표현하기도 한다.

    - (R,R,μX)X에 의하여 유도된 확률공간이라는 선언의 숨은 의미: 함수 X가 잘 정의된다면 (X가 확률변수라면!) 공간 (Ω,F,P)와 공간 (R,R,μX)는 대등한 역할을 한다. 즉 Ω의 임의의 원소는 R의 임의의 원소로 바꾸어 생각할 수 있고, F의 임의의 원소는 R의 임의의 원소로 대치할 수 있으며, F의 임의의 원소(event)를 측도 P로 재는 일은 R의 임의의 원소를 측도 μX로 재는 일과 동치로 해석할 수 있다.

  • 4 사실 교재가 숨긴적은 없고요, 제가 그냥 몰랐던거에요.

  • 분포함수 (distribution function)

    - 모티브: μX:R[0,1] 는 정의역이 집합이라서 아쉬움. (솔직히 우리한테 친숙한 형태는 아님) 만약에

    • 집합 숫자

    와 같은 방식으로 랜덤성을 정의하지 않고

    • 숫자 숫자

    와 같은 방식으로 랜덤성을 정의할 수 있다면 어떨까?

    - 결국 랜덤성을 기술하려면 P를 기술해야한다. 그런데 P를 기술하기가 좀 까다로울 경우가 많은데 그것을 단순화 하기 위한 노력의 시작은 카라테오도리의 확장정리였다. 그리고 이 노력의 마지막은 이제 소개하는 분포함수이다.

  • 5 이 정리가 없었다면 단순히 주사위를 던지는 사건에 대한 P를 기술하기 위해서 26개의 모든 F=2Ω,Ω={1,2,3,4,5,6}에 대하여 “집합 -> 숫자”를 일일히 기록해야 했을 것이다.

  • - (예제1) – 동전예제 다시

    동전을 던지는 예제로 만들어지는 아래와 같은 확률공간 (Ω,F,P) 를 생각하자.

    • Ω={H,T}
    • F=2Ω
    • P({H})=P({T})=12

    확률변수 X:ΩR를 아래와 같이 정의하자.

    • X(H)=1
    • X(T)=0

    이제 아래와 같은 함수를 정의하자.

    FX(x)={0x<0120x<111x

    이 함수는 동전예제가 가지는 랜덤성을 완전히 설명한다. 즉 FX:R[0,1]를 정의하는 일은 P:F[0,1]를 정의하는 일과 동치이다. 왜 그런지 논의하라.

    (해설)

    복습 – 강의노트 06주차 파이시스템에서의 확장이론

    Thm: (Ω,σ(A),P)를 확률공간이라고 하자. 여기에서 A는 파이시스템이라고 가정하자. 그렇다면 확률측도 P:σ(A)[0,1]의 값은 P:A[0,1]의 값에 의하여 유일하게 결정된다.

    체크

    • μX(R,R)에서의 확률측도이다. 따라서 (R,R,μX)는 확률공간이다.

    진짜해설

    FX(x)=μX((,x])로 쓸 수 있다. 따라서 모든 실수 xR에 대하여 FX(x)의 값을 정의하는 일은 모든 A={(,x]:xR} 에서 μX:A[0,1] 을 정의하는 일과 동치이다. 그런데 A는 파이시스템이므로 A에서의 μX값만 결정해도 R의 모든 집합에서의 μX값이 올바르게 결정된다. 그런데 공간 (R,R,μX)X에 의하여 유도된 공간이므로 (R,R)에서 μX를 정의하는 일은 P를 정의하는 일과 같다.

    R에서 FX(x)를 정의 A에서 μX를 정의 R에서 μX를 정의 F에서 P를 정의

    - (정의): X를 확률공간 (Ω,F,P)에서 정의된 확률변수라고 하자. FX:R[0,1] 인 함수를 아래와 같이 정의하자.

    FX(x)=μX((,x])

    함수 F를 확률변수 X의 distribution function 이라고 한다.

    - 위의 정의에서 함수 FX(x)FX(x)=P(Xx)로 표현할 수도 있다.

  • 6 반가운 표현의 등장

  • - (예제3) – 주사위를 던지는 예제

    분포함수의 위력을 살펴보기 위하여 주사위를 던지는 예제로 만들어지는 아래와 같은 확률공간 (Ω,F,P) 를 생각하자.

    • Ω={1,2,3,4,5,6}
    • F=2Ω
    • P({1})==P({6})=16

    확률변수를 X:ΩRX(ω)=ω와 같이 정의하자. X의 distribution fucntion 을 구하라.

    (풀이)

    생략

    - 약속: X를 확률공간 (Ω,F,P)에서 정의된 확률변수라고 하자. 아래와 같은 표현을 약속하자.

    • XμX X의 distribution 이 μX이다.
    • XFX X의 distribution function이 FX이다.

    - 약속2: X를 확률공간 (ΩX,FX,PX)에서 정의된 확률변수라고 하고, Y를 확률공간 (ΩY,FY,PY)에서 정의된 확률변수라고 하자.

    • X=dY BR:μX(B)=μY(B)
    • X=dY kR:FX(k)=FY(k)
    • X=dY kR:PX(Xk)=PY(Yk)

    만약에 랜덤성을 기술하는 언어가 P하나 뿐이었다면 “같은 분포를 가진다”와 같은 개념을 수식화 하기 불리하다.

    - Thm: 임의의 분포함수 F:R[0,1]는 (1) 비감소 (2) limxF(x)=0 and limxF(x)=1 (3) 오른쪽연속의 성질을 가진다.

    - Thm: 임의의 함수 F:RR가 (1) 비감소 (2) limxF(x)=0 and limxF(x)=1 (3) 오른쪽연속의 성질을 가진다면, F는 어떠한 확률변수 X의 분포함수이다.

    밀도함수 (density function)

    - (정의) X를 확률공간 (Ω,F,P)에서 정의된 확률변수라고 하고 FXX의 분포함수 라고 하자. 만약에 FX가 아래와 같은 방식으로 표현된다면 fXX를 밀도함수 (density function) 이라고 한다.

    FX(x)=xfX(y)dy

    - 저런 표현이 존재하지 않는다면 어쩌지?