05wk-1: 마코프체인 (1)

최규빈

2023-03-30

강의영상

youtube: https://youtube.com/playlist?list=PLQqh36zP38-xlV_TS7zhmYyyYNKv8np4W

확률벡터

- 확률변수와 확률벡터

확률변수 $X : (Ω, F) \to (R, R)$
확률벡터 $X : (Ω, F) \to (R^{d}, R^{d})$

- 기호표현1

확률변수: $X (ω) = x$
확률벡터: $X (ω) = (x_{1}, x_{2}, \dots, x_{d})$

여기에서 $(x_{1}, x_{2}, \dots, x_{d})$ 는 col-vec, row-vec 구분 없이 길이가 $d$ 인 vector 라고 생각한다. 언제든 편의에 따라 row-vector 혹은 col-vector로 해석할 수 있다.

- 기호표현2

확률변수 $X$
확률벡터 $X = (X_{1}, X_{2}, \dots, X_{d})$ , 여기에서 $X_{1}, X_{2}, \dots, X_{d}$ 는 각각 r.v.

- 기호표현3 (외우세요!!)

$X (ω) = (X_{1}, X_{2}, \dots, X_{d}) (ω) = (X_{1} (ω), X_{2} (ω), \dots, X_{d} (ω)) = (x_{1}, x_{2}, \dots, x_{d})$

(예제1) 동전을 2회 던지자!

1. outcomes: $H H, H T, T H, T T$

2. sample space: $Ω = {H H, H T, T H, T T}$

3. event: $\emptyset, {H H}, {H T}, {T H}, {T T}, {H H, H T}, \dots, Ω$

4. $σ$ -field: $F = 2^{Ω}$

5. probability measure function: $P : Ω \to [0, 1]$ such that

$P (\emptyset) = 0$
$P (H H) = \frac{1}{4}$
$P (H T) = \frac{1}{4}$
$P (T H) = \frac{1}{4}$
$P (T T) = \frac{1}{4}$
$P ({H H, H T}) = \frac{1}{2}$
$\dots$
$P (Ω) = 1$

6. random vector: $X : Ω \to R^{2}$ such that

$X (H H) = (1, 1)$
$X (H T) = (1, 0)$
$X (T H) = (0, 1)$
$X (T T) = (0, 0)$

6의 다른표현들

$X (ω_{1}) = (X_{1}, X_{2}) (ω_{1}) = (X_{1} (ω_{1}), X_{2} (ω_{1})) = (1, 1)$
$X (ω_{2}) = (X_{1}, X_{2}) (ω_{2}) = (X_{1} (ω_{2}), X_{2} (ω_{2})) = (1, 0)$
$X (ω_{3}) = (X_{1}, X_{2}) (ω_{3}) = (X_{1} (ω_{3}), X_{2} (ω_{3})) = (0, 1)$
$X (ω_{4}) = (X_{1}, X_{2}) (ω_{4}) = (X_{1} (ω_{4}), X_{2} (ω_{4})) = (0, 0)$

확률벡터의 평균 ( $⋆$ )

확률변수의 평균

- 예제1: 동전을 던지는 예제

$ω$	$x = X (ω)$	$P (X = x)$
$ω_{1}$	$0$	$\frac{1}{2}$
$ω_{2}$	$1$	$\frac{1}{2}$

$∴ E (X) = \sum_{x = 0}^{1} x P (X = x) = (0 \times \frac{1}{2} + 1 \times \frac{1}{2}) = \frac{1}{2} (0 + 1)$

- 예제2: 주사위를 던지는 예제

$ω$	$x = X (ω)$	$P (X = x)$
$ω_{1}$	$1$	$\frac{1}{6}$
$ω_{2}$	$2$	$\frac{1}{6}$
$ω_{3}$	$3$	$\frac{1}{6}$
$ω_{4}$	$4$	$\frac{1}{6}$
$ω_{5}$	$5$	$\frac{1}{6}$
$ω_{6}$	$6$	$\frac{1}{6}$

$∴ E (X) = \sum_{x = 1}^{6} x P (X = x) = \frac{1}{6} (1 + 2 + 3 + 4 + 5 + 6) = 3$

확률벡터의 평균

- 예제1: 동전을 2회 던지는 예제

$ω$	$x = X (ω)$	$P (X = x)$
$ω_{1}$	$[\begin{matrix} 0 \\ 0 \end{matrix}]$	$\frac{1}{4}$
$ω_{2}$	$[\begin{matrix} 0 \\ 1 \end{matrix}]$	$\frac{1}{4}$
$ω_{1}$	$[\begin{matrix} 1 \\ 0 \end{matrix}]$	$\frac{1}{4}$
$ω_{2}$	$[\begin{matrix} 1 \\ 1 \end{matrix}]$	$\frac{1}{4}$

$∴ E (X) = \frac{1}{4} ([\begin{matrix} 0 \\ 0 \end{matrix}] + [\begin{matrix} 0 \\ 1 \end{matrix}] + [\begin{matrix} 1 \\ 0 \end{matrix}] + [\begin{matrix} 1 \\ 1 \end{matrix}]) = [\begin{matrix} \frac{1}{2} \\ \frac{1}{2} \end{matrix}] = [\begin{matrix} E (X_{1}) \\ E (X_{2}) \end{matrix}]$

$E (X_{1}) = E (X_{2})$ 인 이유?? iid 이니까~

- 예제2: 동전을 10회 던지는 예제

$ω$	$x = X (ω)$	$P (X = x)$
$ω_{1}$	$[0, 0, \dots, 0]^{⊤}$	$\frac{1}{2^{10}}$
$ω_{2}$	$[0, 0, \dots, 1]^{⊤}$	$\frac{1}{2^{10}}$
$\dots$	$\dots$	$\dots$
$ω_{1024}$	$[1, 1, \dots, 1]^{⊤}$	$\frac{1}{2^{10}}$

$∴ E (X) = [\begin{matrix} \frac{1}{2} \\ \frac{1}{2} \\ \dots \\ \frac{1}{2} \end{matrix}] = [\begin{matrix} E (X_{1}) \\ E (X_{2}) \\ \dots \\ E (X_{10}) \end{matrix}]$

시간평균, 앙상블평균

motivating example

- 예제1: 동전을 1000번 던지는 예제를 상상하자. 앞면이 나올 확률은 $p$ 이며 이 $p$ 는 0.5인지 모른다고 가정하자.

import numpy as np

unknown_probability = np.random.rand()

x = np.random.binomial(n=1,p=unknown_probability,size=1000) # X(ω) for some ω
x

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0,
       1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1,
       1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0,
       0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0,
       1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1,
       1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1,
       1, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0,
       1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0,
       1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1,
       1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1,
       1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1,
       1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1,
       1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       0, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1,
       1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0,
       1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0,
       1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1,
       1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 1,
       0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1,
       1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1,
       1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0,
       1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 0,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0,
       0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 0,
       1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1,
       1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1,
       1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1,
       1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0,
       0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1,
       1, 1, 1, 0, 1, 1, 1, 0, 1, 1])

이것은 적당한 $ω$ 에 맵핑되어있는 하나의 realization 이다.

- 질문: unknown_probability는 얼마일까??

np.mean(x), unknown_probability

(0.796, 0.7863482228867129)

- 비판: 문제 이상하게 푼다?

$ω$	$x = X (ω)$	$P (X = x)$
$ω_{1}$	$[0, 0, \dots, 0]^{⊤}$	$\frac{1}{2^{1000}}$
$ω_{2}$	$[0, 0, \dots, 1]^{⊤}$	$\frac{1}{2^{1000}}$
$\dots$	$\dots$	$\dots$
$ω_{2^{1000}}$	$[1, 1, \dots, 1]^{⊤}$	$\frac{1}{2^{1000}}$

$∴ E (X) = [\begin{matrix} E (X_{1}) \\ E (X_{2}) \\ \dots \\ E (X_{1000}) \end{matrix}]$

$E (X_{1000}) = \frac{1}{2^{1000}} (대충 0 혹은 1이 있는 숫자들을 더한것) = p$

x[-1] # 이게 하나의 X_{1000} 에 대한 하나의 실현치일 뿐임.

따라서 개념상으로는 아래와 같이 시뮬레이션하여 구하는게 옳음

sample1 = np.random.binomial(n=1,p=unknown_probability,size=1000) 
sample2 = np.random.binomial(n=1,p=unknown_probability,size=1000) 
sample3 = np.random.binomial(n=1,p=unknown_probability,size=1000) 
sample4 = np.random.binomial(n=1,p=unknown_probability,size=1000) 
sample5 = np.random.binomial(n=1,p=unknown_probability,size=1000) 
sample6 = np.random.binomial(n=1,p=unknown_probability,size=1000) 
sample7 = np.random.binomial(n=1,p=unknown_probability,size=1000)

(sample1[-1]+sample2[-1]+sample3[-1]+sample4[-1]+sample5[-1]+sample6[-1]+sample7[-1])/7

0.8571428571428571

unknown_probability

0.7863482228867129

좀 더 많이…

samples = np.stack([np.random.binomial(n=1,p=unknown_probability,size=1000) for i in range(43052)])
samples

array([[1, 1, 1, ..., 1, 0, 1],
       [1, 0, 1, ..., 0, 1, 1],
       [1, 0, 0, ..., 1, 1, 1],
       ...,
       [1, 1, 1, ..., 1, 1, 0],
       [0, 1, 0, ..., 1, 1, 1],
       [1, 0, 1, ..., 1, 1, 1]])

samples.shape

(43052, 1000)

np.mean(samples[:,-1]) # E(X_{1000})을 근사한것

0.7862120226702592

용어정리의 시간

- 확률변수열을 표현할 때 $i$ 대신 $t$ 로 바꾼다면?

$X_{1}, X_{2}, X_{3}, \dots, X_{i}, \dots, X_{n}$ $\Rightarrow$ $X_{1}, X_{2}, X_{3} \dots, X_{t}, \dots X_{T}$
$E (X_{i})$ $\Rightarrow$ $E (X_{t})$
$\frac{1}{n} \sum_{i = 1}^{n} X_{i}$ $\Rightarrow$ $\frac{1}{T} \sum_{t = 1}^{T} X_{t}$

- 용어: $E (X_{t})$ 를 앙상블평균 (ensemble average) 이라고 하고, $\frac{1}{T} \sum_{t = 1}^{T} X_{t}$ 를 시간평균 (time average) 이라고 한다.

생각의 시간 (1)

- 원래 $E (X_{1000})$ 은 $\frac{1}{T} \sum_{t = 1}^{T} X_{t}$ 와 같은 방식으로 근사계산할 수 없긴해. (말도 안되는 소리임..)

- 예제1: 아래와 같은 확률변수열를 고려하자.

$X_{1} \sim B e r (0.5)$ .
$X_{t} = X_{t - 1}$ for $t = 2, 3, 4, \dots, 1000$ .

$E (X_{1000})$ 을 구하여라. $E (X_{1000})$ 을 $\frac{1}{T} \sum_{t = 1}^{T} X_{t}$ 와 같은 방식으로 근사할 수 있는가?

(풀이)

$E (X_{1000}) = 0.5$ 임. 하지만 $\frac{1}{T} \sum_{t = 1}^{T} X_{t}$ 로 $E (X_{1000})$ 을 근사할 수 없음.

시뮬1 – calculating time average of one-sample $(x_{1}, \dots, x_{1000})$

x1 = np.random.binomial(n=1,p=0.5,size=1).item()
x1

one_sample = np.array([x1]*1000)
one_sample

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

np.mean(one_sample)

0.0

시뮬2 – approximating ensemble average with 43052 samples

samples = np.array([[np.random.binomial(n=1,p=0.5,size=1).item()] * 1000 for i in range(43052)])
samples

array([[1, 1, 1, ..., 1, 1, 1],
       [0, 0, 0, ..., 0, 0, 0],
       [1, 1, 1, ..., 1, 1, 1],
       ...,
       [0, 0, 0, ..., 0, 0, 0],
       [0, 0, 0, ..., 0, 0, 0],
       [1, 1, 1, ..., 1, 1, 1]])

np.mean(samples[:,-1])

0.5003251881445694

- 하지만 사실 iid가정이 있다면 앙상블평균을 시간평균으로 추정해도 문제 없어.

- 예제2: 서로 독립인 1000개의 확률변수를 $N (0, 1)$ 에서 뽑는다고 하자.

$X_{t} = ϵ_{t} \overset{i . i . d .}{\sim} N (0, 1)$

이때는 $E (X_{1000})$ 을 $\frac{1}{T} \sum_{t = 1}^{T} X_{t}$ 와 같은 방식으로 근사할 수 있다.

시뮬1 – calculating time average of one-sample $(x_{1}, \dots, x_{1000})$

one_sample = np.random.binomial(1,0.5,1000)
np.mean(one_sample)

0.536

시뮬2 – approximating ensemble average with 43052 samples

np.stack([np.random.binomial(1,0.5,1000) for i in range(43052)])[:,-1].mean()

0.4999535445507758

- 결론: 원래 time-average와 ensemble-average는 “전혀” 다른 개념이다. 그런데, 확률변수열이 iid일 경우는 time-average로 ensemble-average를 근사계산 할 수 있다.

- 아래의 그림은 time-average와 ensemble-average의 차이를 파악하기 용이한 예제이다.

AR(1)

- 예제3: $ϵ_{t} \overset{i . i . d .}{\sim} N (0, 1)$ 일 때, 아래와 같은 확률변수 열을 고려하자.

$X_{1} = ϵ_{1}$
$X_{t} = \frac{7}{8} X_{t - 1} + ϵ_{t}$ for $t = 2, 3, \dots, T$

eps = np.random.randn(1000)
x = np.zeros(1000)
x[0] = eps[0]
for t in range(1,1000):
    x[t] = (7/8)*x[t-1] +eps[t]

import matplotlib.pyplot as plt

plt.plot(x,'--o',alpha=0.5)

이때 $E (X_{T})$ 을 $\frac{1}{T} \sum_{t = 1}^{T} X_{t}$ 와 같은 방식으로 근사할 수 있을까?

(풀이)

우선 독립인지 아닌지 체크해보자.

check: $X_{t}$ 와 $X_{t - 1}$ 은 독립??

plt.plot(x[:-1],x[1:],'o',alpha=0.2)

corr이 있음.. $\Rightarrow$ 독립아님 $\Rightarrow$ ensemble-average를 time-average로 근사할 수 없다??

참고로 독립이라면~

plt.plot(eps,'--o',alpha=0.5)

plt.plot(eps[1:],eps[:-1],'o',alpha=0.2)

시뮬1 – calculating time average of one-sample $(x_{1}, \dots, x_{T})$

def gen(T=1000):
    eps = np.random.randn(T)
    x = np.zeros(T)
    x[0] = eps[0]
    for t in range(1,T):
        x[t] = (7/8)*x[t-1] +eps[t]
    return x

one_sample = gen()
np.mean(one_sample)

-0.04427929741501683

시뮬2 – approximating ensemble average with 43052 samples

samples = np.stack([gen() for ω in range(43052)])

np.mean(samples[:,-1])

-0.001607068412044872

근사 되는 것 같은데..?

생각의 시간 (2)

- 확률변수는 값이 랜덤으로 바뀌는 변수느낌이 아니라 $X : Ω \to R$ 인 잴 수 있는 함수임.

- 확률벡터는 값이 랜덤으로 바뀌는 벡터느낌이 아니라 $X : Ω \to R^{d}$ 인 잴 수 있는 함수임.

- 동전을 반복하여 던져서 관측한 아래와 같은 확률변수열(=확률벡터)

$0, 1, 0, 0, 1, 1, \dots, 1$

은 어떠한 $ω \in Ω$ 에 대응하는 하나의 realization $X (ω) = x$ 임. (즉 one-sample임)

- 그런데 확률변수열을 독립으로 얻었다면 이러한 one-sample을 쪼개서 마치 여러개의 샘플을 얻은것처럼 생각할 수 있으며 이때

$E (X_{T}) \approx \frac{1}{T} \sum_{t = 1}^{T} X_{t}$

와 같은 방식으로 근사할 수 있음.

- 사실상 $E (X_{1}) = E (X_{2}) = \dots = E (X_{T}) \approx \frac{1}{T} \sum_{t = 1}^{T} X_{t}$ 이므로 ( $∵$ iid) 결국 아직 관측되지 않은 미래시점 $T + 1$ 의 값에 대해서도

$E (X_{T + 1}) \approx \frac{1}{T} \sum_{t = 1}^{T} X_{t}$

라고 주장할 수 있음.

- 이렇게 one-sample을 여러개의 조각으로 쪼개는 기법은 iid에서만 성립할 것 같음. 만약에 iid가정이 없다면 (시뮬2)와 같은 방식으로 여러샘플을 통하여 ensemble-average를 근사시켜야 함. 정리하면 아래와 같음.

one-sample만 관측가능, iid 조건 만족 $\Rightarrow$ 분석가능
여러개의 sample 관측가능 , iid 조건 만족 $\Rightarrow$ 분석가능
one-sample만 관측가능, iid 조건 만족하지 않음 $\Rightarrow$ 분석불가능??
여러개의 sample 관측가능 , iid 조건 만족하지 않음 $\Rightarrow$ 분석가능

- 문제: 그런데 실제로 우리가 다루고 싶은 자료의 형태는 3의 경우가 많다.

- 소망: 그래서 iid가 아니지만 마치 iid인것 처럼 one-sample을 가지고 분석하고 싶다.

앞으로 해야 할 것: 독립인듯 독립아닌 독립같은 확률과정은 없을까?

독립인듯 독립아닌 독립같은 확률과정

fig, ax = plt.subplots(3,3,figsize=(10,10))
ax[0][0].plot(x[:-1],x[1:],'o',alpha=0.1)
ax[0][1].plot(x[:-2],x[2:],'o',alpha=0.1)
ax[0][2].plot(x[:-3],x[3:],'o',alpha=0.1)
ax[1][0].plot(x[:-4],x[4:],'o',alpha=0.1)
ax[1][1].plot(x[:-5],x[5:],'o',alpha=0.1)
ax[1][2].plot(x[:-6],x[6:],'o',alpha=0.1)
ax[2][0].plot(x[:-7],x[7:],'o',alpha=0.1)
ax[2][1].plot(x[:-8],x[8:],'o',alpha=0.1)
ax[2][2].plot(x[:-9],x[9:],'o',alpha=0.1)

강의영상

확률벡터

확률벡터의 평균 (⋆)

확률변수의 평균

확률벡터의 평균

시간평균, 앙상블평균

motivating example

용어정리의 시간

생각의 시간 (1)

AR(1)

생각의 시간 (2)

확률벡터의 평균 ( $⋆$ )