Transcript 離散型確率分布
超幾何分布とポアソン分布 超幾何分布 ポアソン分布 超幾何分布(Hypergeometric distribution) 定義:母集団がN個の要素を持ち、ある属 性を持つ要素がそのうちM個あるとする。 この母集団からn個の要素を取り出したと き(非復元抽出)、その属性を持つ要素がx 個含まれている確率が超幾何分布で表さ れる。 N:母集団の要素の数 M:ある属性を要する要素の数 n=標本の大きさ 超幾何分布の確率関数 確率関数 範囲: P( X x) M Cx N M Cnx N Cn max(0, n N M ) x min(M , n) M/N=pとすれば 期待値: np 分散: 2 np(1 p)(N n) / (N 1) 超幾何分布と二項分布の関係 P=M/Nを一定に保ちつつ、Nを大きくすれば、超幾何分 布は二項分布に近づく。 N! ( N )n n!( N n)! n! M! ( Np)! ( Np) x C M x x!(M x)! x!( Np x)! x! ( N M )! ( Nq)! C N M n x (n x)!( N M n x)! (n x)!( Nq n x)! ( Nq)n x = (n x)! N Cn と書き直すと n! ( Np) x( Nq)n x p( x) x!(n x)! ( N )n 超幾何分布と二項分布の関係 ところが ( Np) x( Nq)n x ( N )n したがって 1 x 1 1 n x 1 p( p ) ( p )q(q ) (q N N N N 1 n 1 1(1 ) (1 ) N N x n x p q N p( x) n Cx p x qn x N p一定 練習問題1 (p87) 山にいる猿500匹のうち、100匹に標識をつけてから 自然に返されてある。いま山から猿を5匹取ったとき、 そのうち標識が付いた猿が0匹である確率はどれくら いか。また、1匹の場合はどれほどか。 [解説] ここで、N=500,M=100,n=5として計算すると、0匹である確率は 練習問題2 20 個の飴が入った箱があるとする。20 個のうち 8 個は赤 色で、12 個は黄色である。この箱から 4 個の飴を無作為 に抽出するとき、その中の 1 個が赤色である確率を求めよ う 解答: ポアソン分布(Poisson distribution) nが大きいが、Pが小さいとき、Xの確率分布を二項 分布から求めることは困難である。 定義 パラメータと期待値と分散 二項分布とポアソン分布の比較 定義 npが→λとなるように、n→∞のとき、p→0となっ た極限では、各xについて P( X k)n Ck p (1 p) k nk e P( X x) x! x → が成り立つ。 この分布をポアソンと呼び、Po(λ)で表す。 eは自然対数の底で、e=2.71828・・・・ 証明: n のと き, np, p k n Ck p q n k e k , (q 1 p) k! n n! 1 k !(n k )! n n k lim n Ck pk qnk n n k (1 )n 1 n(n 1) (n k 1) k n k k! n (1 )k n n(n 1) (n k 1) n (n 1) (n k 1) n のと き , 1 k n n n n = lim(1 n n )n e よ り , ( 1- n のと き , Ck p q k n e k 即ち, P( x k ) k! n k n ) n e , (1 e k k! n )k 1 超幾何分布とポアソン分布 P=M/Nが小さく、nが大きいとき、超幾何分 布は次のようにポアソン分布で近似するこ とができる。 e P( x) x! N x ポアソン分布の パラメータ、期待値、分散 パラメータ:λ=np 期待値: 分散: 2 二項分布とポアソン分布の近似(1) 図5.6 二項分布(n=50,P=0.3) 0.14 0.12 0.1 0.08 0.06 0.04 0.02 0 0 3 6 9 12 15 18 21 24 27 30 33 36 39 42 46 49 二項分布とポアソン分布の近似(2) 図5.7 ポアソン分布(n=50,P=0.3,λ=15) 0.12 0.1 0.08 0.06 0.04 0.02 0 0 3 6 9 12 15 18 21 24 27 30 33 36 39 42 46 49 二項分布と超幾何分布とポアソン分布の関係 (N =50, M = 30, n=15, p = 0.3) 0.3 0.25 ポアソン分布 0.2 超幾何分布 二項分布 0.15 0.1 0.05 0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 45 47 49 例題:P103,③ 解説:2時間の間に釣った魚の数Xは λ=np=2×2=4のポアソン分布に従う。 e40 4 ① P( X 0) e 0.02 0! 4 4 e ② P( X 4) 0.195 4! 解説 P( X 4) ? ③ 参考: 1 e 4 0.0183 e 4