Importance Sampling

Machine Learning

Importance Sampling

Viator 2022. 12. 20. 09:33

Importance Sampling은 기댓값을 계산하는 확률분포함수는 알고 있지만 표본을 생성하기 어려울 때 해당 확분포함수 대신에 표본을 생성하기가 쉬운 다른 확률 분포함수를 이용해 기댓값을 추정하는 방법이다.

즉 표본 $x$ 의 확률분포함수를 $p (x)$ 라 할 때 해당 표본에 대한 어떤 함수 $f (x)$ 의 기댓값은 아래와 같이 전개할 수 있게 된다는 것이다.

$\begin{aligned} E_{x \sim p (x)} [f (x)] & = \int_{x} p (x) f (x) d x \\ = \int_{x} \frac{p (x)}{q (x)} q (x) f (x) d x \\ = E_{x \sim q (x)} [\frac{p (x)}{q (x)} f (x)] \end{aligned}$

여기서 $p$ 와 $q$ 의 다름 정도를 나타내는 $\frac{p (x)}{q (x)}$ 는 importance weight이라 칭한다. 그래서 importance sampling은 importance weight으로 비율을 맞춰주면서 $f (x)$ 에 대한 기대값을 구하는 기법이라고도 할 수 있다. 그렇다면 $p (x)$ 로 샘플링을 하기 힘든 모든 상황에서 이 단순한 대체 기법을 적용할 수 있을까?
결론부터 얘기하면 $p (x)$ 와 $q (x)$ 가 비슷하지 않으면 분산이 달라지기 때문에 적용하기 어렵다.

본래의 확률분포함수 $p (x)$ 를 따른 $f (x)$ 의 분산식은 아래와 같고,

$V a r_{x \sim p (x)} [f (x)] = E_{x \sim p (x)} [f (x)^{2}] - E_{x \sim p (x)} [f (x)]^{2}$

대체 확률분포함수 $q (x)$ 를 따른 $f (x)$ 의 분산식은 아래와 같다.

$\begin{aligned} V a r_{x \sim q (x)} [f (x)] & = E_{x \sim q (x)} [{(\frac{p (x)}{q (x)} f (x))}^{2}] - {(E_{x \sim q (x)} [\frac{p (x)}{q (x)} f (x)])}^{2} \\ = \int_{x} {(\frac{p (x)}{q (x)} f (x))}^{2} q (x) d x - {(E_{x \sim p (x)} [f (x)])}^{2} \\ = \int_{x} \frac{p (x)}{q (x)} (f (x))^{2} p (x) d x - {(E_{x \sim p (x)} [f (x)])}^{2} \\ = E_{x \sim p (x)} [\frac{p (x)}{q (x)} (f (x))^{2}] - {(E x \sim p (x) [f (x)])}^{2} \end{aligned}$

여기서 두 분산식의 첫째항을 살펴보면 $\frac{p (x)}{q (x)}$ 가 1이 될 때의 값은 같으나 $p (x)$ 와 $q (x)$ 의 값이 같지 않으면 본래의 분산식과는 차이가 생겨 $p$ 대신 $q$ 를 사용하는 결과에 대해 신뢰하기 어렵게 된다.

그러므로 이 importance sampling 사용에 있어서 " $p (x)$ 와 $q (x)$ 의 값이 거의 비슷할 때" 라는 제약조건이 붙는다.

저작자표시 비영리 동일조건

현재글Importance Sampling

Enlightenment in the shadow 반갑습니다. 본 블로그는 저의 관점에서 포착되고 흥미를 끄는 머신러닝 및 금융 지식을 스터디하고 공유하기 위해 만들어졌습니다. 앎에 대한 threshold를 높게 두고 깊게 탐구하는 연구자로서, 제가 이해하지 못하는 것은 포스팅하지 않고 현학적인 표현은 지양합니다. GitHub : https://github.com/coorung

해밀턴 야코비 벨만 방정식, 테일러 전개, HJB equation, LQR, stochastic HJB equation, GBM simulation, 행렬회전, 코딩테스트, Bellman's Optimality, 계층적구조다중필터링, GBM mean, Python, 해밀턴 자코비 방정식, GBM solution, 해밀턴 자코비 벨만 방정식, GBM variance, Ito's lemma, 코테, Hamilton Jacobi Bellman equation, 파이썬,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Enlightenment in the shadow

Importance Sampling

'Machine Learning'의 다른글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역