On this page

13wk-1: 마코프체인 (12)

최규빈

2023-05-25

강의영상

youtube: https://youtube.com/playlist?list=PLQqh36zP38-x4iyJGrSEk1pswE7dsNoke

imports

import numpy as np

nature와 정상분포 (cont)

지난시간

- 정의 {Xt}가 HMC라고 하자. 아래의 식을 만족하는

π~P=π~

π~invariant measure 라고 한다. 만약에 π~ 이 분포의 정의를 만족하면 stationary measure 혹은 stationary distribution 이라고 부른다.

- 예시: “오른쪽으로만 갈래” 예제에서는

π~=[1,1,1,]

이 수식

π~P=π~

을 만족한다. 따라서 이 예제에서 π~=[1,1,1,]invariant measure 이다.

- {Xt}가 HMC라고 하자. 각각에 대하여 아래가 성립한다.

IRR nature !π~ up to multiplier !π 에르고딕정리(LLN)
O PR O O O
O NR O X X
O TR Δ X X

- 이론: {Xt}가 IRR-HMC 라고 하자. {Xt}가 정상분포를 가진다는 조건과 유일한 정상분포를 가질 조건은 동치이다.

  • 1 irreducible 한 homogeneous markov chain

    • {Xt}가 IRR-HMC 일때, 정상분포가 존재한다는 사실만 보이면 자동으로 유일성이 보장된다.

    - Thm: {Xt}가 IRR-HMC 라고 하자. 그러면 positvite recurrent!π 은 동치조건이다. 즉

    • IRR-HMC {Xt} 가 positive recurrent 하다면 항상 {Xt} 는 유일한 정상분포를 가진다.
    • IRR-HMC {Xt} 가 정상분포를 가지면 (그 분포는 유일해지고) {Xt}는 항상 positive recurrent 하다.

    이번시간

    - (정의) – 복습 {Xt}가 HMC라고 하자. 모든 iE 는 아래의 조건중 하나를 만족하는데

    1. Pi(Ti<)=1 and Ei[Ti]<,
    2. Pi(Ti<)=1 and Ei[Ti]=,
    3. Pi(Ti<)=0.

    이중에서 3의 경우는 상태 itransient 하다고 표현하며, 1,2의 경우는 각각 potivite recurrent, null recurrent 하다고 표현한다.

    - 이걸 갑자기 복습하는 이유? 결국 TR, NR 모두 그 상태에 머물확률이 궁극적으로는 0이라는 느낌을 위해서! TR일 경우는 따질 필요 없이 확실하고 NR일 경우는 아래 식을 이용하여 판단할 수 있다.

    1E(Ti)1Tt=1T#1(Xt=i)

    1. T=100 일때 21번 상태 0에 있었음.
    2. 평균적으로 211001/5 비율로 상태 0에 있는듯
    3. 현재 상태 0에 머물러 있다면, 평균 5번정도내로는 돌아올 듯 (그렇지 않다면 2가 성립하지 않는걸?)

    - 직관: 어떠한 상태가 PR이 아닌 경우는 그 상태에 머물 확률이 0이므로 당연히 정상분포를 가지지 않음.

    - Thm (에르고딕 thm): IRR-HMC {Xt}가 PR 조건을 만족한다고 하자. 그러면 iE|f(i)|πi<를 만족하는 함수 f:ER에 대하여 아래가 성립한다.

    limT1Tt=0T1f(Xt)=Eπ[f(X0)]

    여기에서 ππ=πP를 만족하는 유일한 정상분포이고 P{Xt}의 transition matrix 이다.

    FINITE 한 경우와 비교1: FINITE 조건이 PR 조건으로 바뀐느낌.

    FINITE 한 경우와 비교2: iE|f(i)|πi< 이라는 조건은 없었는데 생김

    - 이론: (에르고딕 thm, ver2) IRR-HMC {Xt}가 PR이면 아래가 성립한다는 의미이다.

    π¯π

    (증명?)

    이 이론이 성립하는 이유는 원래의 에르고딕 이론에서 f를 잘 해석하면 된다.

    SOME NOTES

    1. IRR 조건은 까다롭지 않다. (없다면 그냥 가정할 수 있음)
    2. PR 조건이 있는 이유? NR 이거나 TR 이면 애초에 수렴할 정상분포가 없는걸?

    - 이론: (에르고딕 thm, ver3) IRR-HMC {Xt}가 FINITE 이면 아래가 성립한다.

    π¯π

    (증명?)

    IRR-HMC가 FINITE 할 경우 PR이 임플라이 되므로 자동성립

    에르고딕 정리는 결국 LLN의 upgrade 버전이며 (조건은 약화되었는데 결론도 강해요) “시간평균 앙상블평균” 을 의미한다.

    periodicity

    - 예제1 – 주기를 뭐라고 할 수 없어..

    {Xt}를 아래와 같은 transition matrix를 가지는 HMC라고 하자.

    P = np.array([[1.0, 0.0],
                  [0.05,0.95]])
    P
    array([[1.  , 0.  ],
           [0.05, 0.95]])

    - 관찰1: 상태0으로 결국 가게 되어있다.

    - 관찰2: 상태1에는 일시적으로 머문다. 상태0에는 반복적으로 방문한다.

    • 상태1은 transient 하고, 상태 0은 recurrent 하다. (정확하게는 positive recurrent)

    - 주기??

    • 상태0의 주기는 1이라고 할 수 있다.
    • 상태1의 주기는? 무한대?

    - 이 마코프체인은 AP인가?

    • 질문이 틀림.
    • 주기라는 개념은 recurrent state 인 경우에만 정의한다.

    - 정의: {Xt}가 상태공간 E에서 정의된 HMC 라고 하자. 상태공간 E의 원소중 recurrent state iE 에 대하여 아래와 같은 집합 Ii 를 생각하자.

    Ii={t:pii(t)>0, t1}

    그렇다면 상태 i의 주기는 Ii의 모든 원소들의 최대공약수로 정의한다.

    - 이론: {Xt}가 상태공간 E에서 정의된 HMC 라고 하자. {Xt}가 IRR & recurrent 라고 가정하자. 그러면 모든 상태는 같은 주기를 가진다.

    - 예제2: 아래와 같은 전이확률을 고려하자.

    P = np.array([0.0, 1.0, 0.0,
                  0.0, 0.0, 1.0,
                  1.0, 0.0, 0.0]).reshape(3,3)
    P
    array([[0., 1., 0.],
           [0., 0., 1.],
           [1., 0., 0.]])
    1
    1
    1
    0
    1
    2

    모든 상태 i에 대하여 주기를 구하라.

    - 예제3: 아래와 같은 전이확률을 고려하자.

    P = np.array([0.0, 1.0, 0.0, 0.0,
                  0.0, 0.0, 0.0, 1.0,
                  0.0, 1.0, 0.0, 0.0,
                  1/3, 0.0, 2/3, 0.0]).reshape(4,4)
    P
    array([[0.        , 1.        , 0.        , 0.        ],
           [0.        , 0.        , 0.        , 1.        ],
           [0.        , 1.        , 0.        , 0.        ],
           [0.33333333, 0.        , 0.66666667, 0.        ]])
    1
    1
    1
    1/3
    2/3
    0
    1
    2
    3

    모든 상태 i에 대하여 주기를 구하라.

    - 이론: {Xt}가 IRR-TR-HMC는 극한분포가 존재하지 않는다.

  • 2 irreducible and transient homogeneous markov chain

    • 왜냐하면 P=0 이므로

    - 이론: {Xt}가 IRR-NR-HMC 역시 극한분포가 존재하지 않는다.

    • 왜냐하면 P=0 이므로

    - 이론: {Xt}가 IRR-PR-HMC 의 경우 AP 조건을 만족하면 극한분포 p가 존재한다.

    IRR nature periodicity P의 수렴 !p
    O TR 정의할수X O X
    O NR 상관X O X
    O PR AP 조건 충족 X X X
    O PR AP 조건 충족 O O O

    정리 (high-resolution)

    - 우리가 결국에 보이고 싶은 정리는 아래의 형태이다.

    π¯π=p

    - 이게 가능한 형태의 마코프체인을 에르고딕이라고 하며 그 조건은 IRR, PR, AP 이다.

    IRR nature periodicity π¯π=p 안되는 이유
    O PR AP O -
    O PR AP 조건 충족 X X p가 수렴안해서
    O TR 정의할 수 X X π 가 없어서
    O NR 상관X X π 가 없어서

    정리 (low-resolution)

    - 우리가 하고 싶었던 것: 어떠한 현상에 대하여, 확률공간 (Ω,F,P) 에 대한 완전한 기술

    - 이것을 수행하는 방법.

    • 방법1: (Ω,F,P)를 state 하고 “관심있는 어떤 것”을 이론적으로 구한다.
    • 방법2: ωX(ω)=x 를 무한번 반복 관찰하고 (=시뮬레이션하고!) “관심있는 어떤 것”을 시뮬레이션으로 근사
    • 방법3: 독립적으로 n회 관찰된 (x1,x2,,xn) 를 이용하여 “관심있는 어떤 것”을 추정, 추정 결과를 합리적으로 설득.

    - 우리가 이 섹션에서 하고 싶었던 것: 시간평균 앙상블평균

    1. 우리가 쓰는 전략은 방법3이다.
    2. 방법3을 쓰기 위해서는 n회 관측된 샘플이 필요한데 우리는 one-sample만 가지고 있으므로 one-sample을 쪼개어 T샘플을 만드는 전략을 사용한다. (비판여지 있음)
    3. 이때 우리가 관심있는 어떤 것은 “평균” 즉 “앙상블평균” 이다.
    4. 우리가 관심있는 것을 추정하기 위해서 “시간평균”을 이용하였다.
    5. 시간평균으로 앙상블평균을 근사한다는 논리를 합리적으로 설득하기 위해서는 “독립적으로 시행”과 “동일한 분포” 가정이 있어야 한다. 하지만 우리의 경우는 그렇지 않다. (비판여지 있음)

    - “시간평균 앙상블평균” 에 대한 이론적인 근거를 백업하기 위해서 필요한 것: 에르고딕 정리 (IRR,PR)

    - 마코프체인의 특화트릭: “시간평균 앙상블평균 = P의 원소값” 에 대한 이론적인 근거를 백업하기 위해서 필요한 것: 에르고딕 정리 (IRR,PR,AP)