학습목표
베타분포와 감마분포의 관계를 이할 수 있으며, 순서통계량의 분포를 구할 수 있다.
핵심 키워드
- 베타분포(Beta Distribution)
- 감마분포(Gamma Distribution)
- 순서통계량(Order Statistics)
학습하기
학습목표
베타분포와 감마분포의 관계를 이할 수 있으며, 순서통계량의 분포를 구할 수 있다.
핵심 키워드
학습하기
학습내용
베타분포와 감마분포의 관계
story) 은행-우체국 예시
은행 대기시간을 X \sim Gamma(a, \lambda)X∼Gamma(a,λ), 우체국 대기시간을 Y \sim Gamma(b, \lambda)Y∼Gamma(b,λ) 이라고 했을 때, ( X, YX,Y는 서로 독립)
→ 두 곳에서의 총 대기시간: T = X+Y \sim Gamma(a+b,\space \lambda)T=X+Y∼Gamma(a+b, λ)
→ 총 대기시간에서 은행 대기시간이 차지한 비율: W = \Large \frac{X}{X+Y}W=X+YX ( \lambda =1(λ=1 로 가정)
f_{T,W}(t,w) = f_{X,Y}(x,y) \displaystyle |\frac{d(x,y)}{d(t,w)}|fT,W(t,w)=fX,Y(x,y)∣d(t,w)d(x,y)∣
=\space \displaystyle \frac{1}{\Gamma(a)\Gamma(b)}x^a e^{-x}y ^b e^{-y} \frac{1}{xy} |J|= Γ(a)Γ(b)1xae−xybe−yxy1∣J∣
x+y = t \qquad \displaystyle \frac{x}{x+y} = wx+y=tx+yx=w
x = tw \qquad y= t-twx=twy=t−tw
|J| = t∣J∣=t
= \space \displaystyle \frac{1}{\Gamma(a)\Gamma(b)}w^{a-1} (1-w)^{b-1}t^{a+b}e^{-t}\displaystyle \cdot \frac{1}{t}= Γ(a)Γ(b)1wa−1(1−w)b−1ta+be−t⋅t1
= \space \displaystyle \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} w^{a-1}(1-w)^{b-1} \frac{1}{\Gamma(a+b)} t^{a+b} e^{-t} \frac{1}{t}= Γ(a)Γ(b)Γ(a+b)wa−1(1−w)b−1Γ(a+b)1ta+be−tt1
\Rightarrow ⇒ w의 함수와 t의 함수로 이루어진 식. W, \space TW, T 은 독립이다
f_W(w) = \displaystyle \int ^\infty _{-\infty} f_{T, W}(t,w)dt = \frac{\Gamma(a+b)}{\Gamma(a)\Gamma(b)} w^a(1-w)^{b-1}fW(w)=∫−∞∞fT,W(t,w)dt=Γ(a)Γ(b)Γ(a+b)wa(1−w)b−1
\Rightarrow T \sim Gamma(a+b,\space 1), \quad W\sim Beta(a, \space b)⇒T∼Gamma(a+b, 1),W∼Beta(a, b)
E(W)E(W) 구하기
방법 1. LOTUS (정석)
방법 2. \displaystyle E(\frac{X}{X+Y}) = \frac{E(X)}{E(X+Y)}E(X+YX)=E(X+Y)E(X) (T, W(T,W 적용하기)
T = X+Y, \quad W = \space \displaystyle \frac{X}{X+Y}T=X+Y,W= X+YX 는 서로 독립이므로
\displaystyle E(\frac{X}{X+Y}) E(X+Y) = E(X)E(X+YX)E(X+Y)=E(X) 이 성립한다.
따라서, \displaystyle E(\frac{X}{X+Y}) = \frac{a}{a+b}E(X+YX)=a+ba
순서통계량 (Order Statistics)
X_1, ..., X_n \enspace \rightarrow iidX1,...,Xn→iid 분포라 가정했을 때,
정의) 순서통계량 X_{(1)} \le X_{(2)} \le \cdots\le X_{(n)} X(1)≤X(2)≤⋯≤X(n)
X_{(1)} = min(X_1, ..., X_n), \enspace X_{(n)} = max(X_1, ..., X_n))X(1)=min(X1,...,Xn),X(n)=max(X1,...,Xn))
\rightarrow n →n이 홀수일 때, 중위수는 순서통계량 \large X_{(\frac{n+1}{2})}X(2n+1)로 표현할 수 있다.
특징) - 서로 독립이 아니다.
- 이산확률변수의 경우, 동일한 값의 경우(tie) 순서를 매기기 어려워진다.
분포 구하기)
방법 1. X_1, ... ,X_n \sim^{iid} X1,...,Xn∼iid PDF f, f, CDF FF한다고 했을 때,
X_{(j)}X(j)의 CDF: P(X_{(j)} \le x) = P(P(X(j)≤x)=P(적어도 j개의 X_iXi들은 xx보다 작다))
= \displaystyle \sum ^n _{k= j} {n \choose k} F(x)^k (1-F(x) )^{n-k}=k=j∑n(kn)F(x)k(1−F(x))n−k
→ PDF: 위 식의 도함수
방법 2. PDF: f_{X_{(j)}}(x)dx = \space \displaystyle n{{n-1}\choose {j-1}} f(x)dx F(x)^{j-1} (1-F(x))^{n-j}fX(j)(x)dx= n(j−1n−1)f(x)dxF(x)j−1(1−F(x))n−j
f_{X_{(j)}}(x)dx = \space \displaystyle n{{n-1}\choose {j-1}} F(x)^{j-1} (1-F(x))^{n-j}f(x)fX(j)(x)dx= n(j−1n−1)F(x)j−1(1−F(x))n−jf(x)
ex) U_1, ..., U_n \sim^{iid} Unif(0,1)U1,...,Un∼iidUnif(0,1)이라 할 때,
f_{U_{(j)}} = \space \displaystyle n {{n-1}\choose{j-1}}x^{j-1}(1-x)^{n-j} \qquad(0fU(j)= n(j−1n−1)xj−1(1−x)n−j(0
\Rightarrow U_{(j)} \sim Beta(j, \space n-j+1)⇒U(j)∼Beta(j, n−j+1)