Transcript 母集団比率の統計推定
統計推定:
母集団比率の区間推定
1.基本概念
2.母集団比率の区間推定
3.小標本の区間推定
4.標本の大きさの決定
1.基本概念
点推定(point estimation):母集団の未知
パラメータ を一つの値で推計する。
区間推定(interval estimation):母集団の
パラメータ が入る確率がある値 1
以上と保証される区間[L1, L2]を求める。
( は が区間に入らない確率)
P(L1 L2 ) 1
母集団比率の区間推定
標本比率の期待値と分散
pq
E( p) p,V ( p)
n
基準化確率変数
Z
p p
pq / n
2.信頼区間の作成
中心極限定理により、Nが大きいとき
N(0,1)
P(| Z | c) 1
pq
pq
P( pˆ c
P pˆ c
) q=1-p
n
n
x
不等式の両端の辺でpの変わりに pˆ を
n
用いると、
信頼区間、信頼係数、区間推定
pˆ (1 pˆ
pˆ (1 qˆ
P * ( pˆ c
P pˆ c
)
n
n
近似的に区間
pˆ (1 pˆ
pˆ (1 qˆ
J z ( pˆ ) ( pˆ c
, pˆ c
)
n
n
の中に母集団比率Pが含まれる確率が 1 である
ことを示す。ただし、ここで信頼度の大きさ 1
を信頼係数という。P*は確率ではないこと。
練習問題
ある都市の労働力人口から1000人を無作
為に抽出した結果、31人が失業であった。
1)失業率の点推定値 pˆ を求め、標本の
データから標本分布の標本分散を推定し、
推定の誤差を説明せよ。
2)母集団比率P(この都市の失業率)につい
て信頼係数0.95の信頼区間を求めよ。
解答(1)
N=1000、x=31
x 31
pˆ
0.031
n 1000
ˆ の分散の
n=1000で大標本であるので、 p
推定値は
pˆ (1 pˆ ) 0.031(1 0.031)
v( pˆ )
0.00003
n
1000
pˆ 0.0055
解答(2)
P(| Z | c) 2(c) 1 1 0.95
(c) 0.975
C=1.96
L1 0.0311.96 0.0055 0.02
L2 0.0311.96 0.0055 0.042
即ち、
0.02 P 0.042
3. N<30、1 0.95 ときの区間推定
P(| Z | c) 0.95 p(| Z | 1.96)
P1.96
x
P
n
1.96 0.95
p(1 p) / n
x
2
2 p(1 p)
上の式を書き直すと、 ( n p) (1.96)
n
これを整理すると、Pについての2次不等式
2
x
(n 3.84) p (2x 3.84) p 0
n
2
P( p1 p p2 ) 0.95
p1 p2
2次方程式 ap bp c 0 の解
2
2
x
(n 3.84) p (2x 3.84) p 0
n
2
b b2 4ac
p1
2a
b b 4ac
p2
2a
2
練習問題
学生400人をランダムに選んで、たばこを
好む人の数を調べたところ、95人であった。
学生全員の中で喫煙者の割合Pを、信頼係
数95%で区間推定してみよう。
4.標本の大きさの決定
nが大であれば、標本比率x/nは近似的に正規
分布N(p,pq/n)に従うから、信頼係数95%で
x
P
n
1.96
p(1 p) / n
推定の誤差|x/n - p|をE以内にとすると、
|x/n - p|=Eとし、不等号を等号にして求められ
ると、nの値は
1.96 2
n(
) p(1 p) となる。(P=1/2とする)
E
練習問題
ある電気器具メーカが自社のある製品を利
用している家庭の割合を標本調査によっ
て推定しようと考えている。信頼係数95%
で誤差を3%以内におさえたいとすれば必
要な標本数はどれくらいか?
解:E=0.03,P=1/2として、
1.96 2 1 1
n(
) ( )( ) 1067.1
0.03 2 2