이산형 확률 분포
① 이산형 확률변수
확률변수 X가 유한집합이거나 자연수의 부분집합과 일대일 대응일 때의 확률변수 X
② 수학적 기대값, E[u(x)]
f(x)가 이산확률변수 x의 pdf이고 ∑u(x)f(x)의 값이 존재할 때, 이를 수학적 기대값이라 함
★ 기대값의 성질 ★ 1. E[c]= C [단, C는 상수] 2. E[cx] = cE(x) 3. E[cu(x)]=cE[u(x)]4. E[c1 u1 (x)±c2 u2 (x) ]=c1 E[u1 (x)]± c2 E[u2 (x)] 5. u1 (x) ≤ u2 (x)이면 E[u1 (x)] ≤ E[u2 (x)]이다.
평균과 분산
확률변수 X가 이산확률밀도 함수f(x)를 갖고 그 공간 R={b1 ,b2 ...}일 때, b1 f(b1 )+b2 f(b2 )....를 평균이라고 함
ex1> f(x)=1/8 (x=0,1) , f(x)=3/8 (x=2,3)일때, X의 평균은? E(X) = ∑xf(x)= 0*(1/8) + 1*(1/8) + 2*(3/8) + 3*(3/8) = 2
표준편차의 제곱을 분산이라고 함
분산은 '평균'으로부터 떨어진 정도를 나타냄
var(x) = (표준편차)2 = E[(x-u)2 ] = E[x2 -2ux+u2 ] = E[x2 ]-2uE[x]+u2 = E[x2 ] - u2 = E[x2 ] - (E[x])2
★ 분산의 성질 ★ 1. var(Cx) = Cvar(x) [단, C는 상수] 2. var(ax+b) = a2var(x) [단, a,b는 상수] 3. var(C) = 0 [단, C는 상수]
※ 체비세프의 부등식
확률변수 X가 유한인 평균과 분산을 가지면, k≥1인 모든 k에 대해 P[|x-u|≥k*(표준편차)]≤(1/k)2 를 만족한다.
③ 확률질량함수[Probability Mass Functon, pmf]
이산확률변수 X에 대한 확률P(X=x)
f(x)를 이산확률변수 X의 pmf라고 한다.
f(x) > 0 , x ∈ R R : X의 공간
∑f(x) = 1
P(X∈A) = ∑f(x) , A⊂R
누적분포함수[Cumulative Distribution Function, cdf]
A={t:t≤x, x∈R}, F(x)=P(X∈x)=∑f(t)일 때, 확률변수 X의 누적분포함수를 F(x)라고 함
0 ≤ F(x) ≤1 → F(x)는 확률이므로
F(x)는 x의 비감소 함수 x1 <x2 일때, F(x1 ) = P(X≤x1 ) ≤ P(X≤x2 ) = F(x2 )
F(∞) = 1 F(-∞) = 0
F는 오른편 연속 함수
X가 이산확률변수일 때, F(x)는 계단함수[Step Function]
적률생성함수[Moment Generating Function, mgf], M(t)
-h <t < h 일때, E(etx )=∑etx f(x)를 x의 적률생성함수라고 함
확률변수 X의 적률은 X의 거듭제곱의 기대값을 적률(Moment)이라고 함 → 확률변수는 pdf가 f(x)인 이산확률변수
E[xr ] = ∑xr f(x) → 원점에 대한 X의 r차 적률
E[(x-b)r ] = ∑(x-b)r f(x) → 중심이 b인 X의 r차 적률
확률변수 X의 적률생성함수가 -h < t < h에서 존재할 때, R(t) = lnM(t)를 x의 누가적률이라고 함
서로 독립인 확률변수 x1 ,x2 , ... xn 의 적률생성함수가 각각 Mx1 (t)....Mxn (t)라고 할 때, Y = a0 + a1 x1 + a2 x2 + .... + an xn (단, a1 ,a2 ,....an 은 상수)의 적률생성함수는 MY(t)=ea0 t Mx1 (a1 t) X ....... X Mxn (an t)
적률생성함수 특징
var(x)= E(x2 )-[E(x)]2 = M''x(0)-[M'(0)]2
※ 맥로린 급수[Maclaurln's Series]
Talyer's Series에서 f(x)=ex 를 대입한 것
f(x) = f(0) + f'(0)x + f''(0)x2 /2! + ....
ex = 1 + x + x2 /2! + x3 /3! + ....
M(t) = E(etx )=E(1 + xt + (xt)2 /2! +...) = E(1) + E(x)t + E(x2 )t2 /2! +....
④ 베르누이 시행과 이항 분포
베르누이 시행[Bernoulli Trial]
두 가지의 서로 배반적이고 완전히 분할되는 실험일 때 적용 가능 ex> 결과가 둘 중 하나(앞/뒤, 합/불, 삶/죽음 등) 일 때 즉, 서로 동시에 일어날 확률이 0
확률변수 X의 pdf가 f(x) = px (1-p)1-x , x=0,1 , 0≤p≤1 , q = 1 - p 일때, X는 베르누이 분포를 갖는다
이항분포[Binomial Distribution]
확률변수 x의 밀도함수가 다음과 같을 때, X는 모수가 (n,p)인 이항분포를 갖는다.
베르누이 시행의 반복 횟수를 n, 각 시행에서 성공할 확률을 p라고 할 때 다음과 같다.
이항분포의 성질
약한 대수의 법칙
⑤ 초기하 분포[Hypergeometric Distribution]
X의 pdf인 f(x)가 다음과 같을 때 초기하 분포라고 함
크기가 유한인 모집단으로 부터 비복원 추출시 나타나는 확률 분포
⑥ 기하 분포[Geometric Distribution]
성공 확률이 p인 베르누이 시행에서 처음 성공이 일어날 때까지 반복한 시행 횟수
확률변수 x의 pdf가 다음과 같이 주어질 때, x는 모수가 p인 기하분포를 가짐
⑦ 음이항 분포[Negative Binominal Distribution]
성공확률이 p인 베르누이 시행에서 독립적으로 반복시행시 r번 성공할 때까지의 실패횟수
확률변수 x의 pdf가 다음과 같을 때, x는 모수가 r,p인 음이항 분포를 가짐
⑧ 포아송 분포[Poisson Distribution]
시간과 공간 내에서 발생하는 사건의 발생횟수에 대한 확률분포
확률변수 x의 pdf가 다음과 같을 때 x는 모수가 λ인 포아송 분포를 가짐
포아송 분포가 되기 위한 조건
겹치지 않는 구간에서 일어나는 사건의 수는 서로 독립이다.
짧은 구간에서 하나의 사건이 일어날 확률은 구간의 길이에 비례한다.
충분히 짧은 구간에서 둘 이상의 사건이 일어날 확률은 0이다.
전 구간을 통해 어느 부분에서나 사건은 동일하게 일어난다.
⑨ 다항 분포[Multinomial Distribution]
세가지 이상의 결과를 가지는 반복 시행에서 발생하는 확률분포
이항분포를 확장한 확률 분포
확률변수 x의 pdf가 다음과 같을 때 x는 다항분포를 가짐
댓글 영역