母比率の区間推定

Transcript 母比率の区間推定

母平均の区間推定
ケース２・・・母分散σ２が未知の場合
母集団（平均μ、分散σ２）からのN個の無作為標本から平均値
xが得られている
標本平均は平均μ、分散σ２／Ｎの正規分布に近似的に従う
N ( ,
2
N
信頼水準１－αで
区間推定
)
μ
95％信頼水準 α=0.05
99%信頼水準 α=0.01
標本平均が前提区間の最大値の位置にある場合（母平均の信頼区間の最小値）
N ( ,

n
母分散が既知
x
2
)

2
a
Pr(X  x ) 
X
標準化
母分散σ２が既知
N (0,1)
x 
/ n

z 
2

2
X 
Z
/ n
x 

Pr(Z 
)
/ n 2

2

z 
2
Z

x 
z  
2 / n
：標準正規分布においてその
上側確率がα／2となる値
 

  x  z 
2 n
標本平均が前提区間の最大値の位置にある場合（母平均の信頼区間の最小値）
N ( ,

n
母分散が未知
x
2
)

2
a
Pr(X  x ) 

2
X
母分散σ２が未知
不偏分散
自由度n-1のｔ分布
ˆ
2
標準化
を使う
x 
ˆ / n
X 
ˆ / n
x 

Pr(t 
)
ˆ / n 2

2
t

tn1 
2
t

tn1 
2
：自由度n-1のｔ分布においてその
上側確率がα／2となる値

x 
tn1  
 2  ˆ / n
  ˆ

  x  tn1 
2 n
標本平均が前提区間の最小値の位置にある場合（母平均の信頼区間の最大値）
x

2
N ( ,
a
2
n
)
Pr(X  x ) 
X
母分散σ２が未知
不偏分散

2
x 
ˆ / n
ˆ
2
標準化
を使う
自由度n-1のｔ分布

 tn1 
2
2
X 
t
ˆ / n
x 

Pr(t 
)
ˆ / n 2

 tn1 
2
t

：自由度n-1のｔ分布においてその
下側確率がα／2となる値

x 
 tn1   
 2  ˆ / n
  ˆ

  x  tn1 
2 n
信頼水準１－αでの母平均の区間推定（母分散が未知の場合）まとめ
自由度n-1のｔ分
布
x 
ˆ / n
標本平均が前提区間の最大値に位置している場合

2
t

x 
ˆ / n

tn1  
2
：自由度n-1のｔ分布においてその
上側確率がα／2となる値

x 
tn1  
 2  ˆ / n
 ˆ
  x  tn1 
2 n
標本平均が前提区間の最小値に位置している場合
自由度n-1のｔ分布

 tn1 
2
2

 tn1  
2

tn1 
2
t
：自由度n-1のｔ分布においてその
下側確率がα／2となる値

x 
 tn1   
 2  ˆ / n
x
 ˆ
  x  tn1 
2 n
母集団からのn個の無作為標本から標本平均値
が得られている。この時、標本不偏
分散が ˆ 2 とすると、母平均μの信頼水準１－αの信頼区間は下式で与えられる。
  ˆ
  ˆ


x  tn1 
   x  tn1 
2 n
2 n
適用例
母平均の区間推定（母分散が未知の場合）
３６個の標本から標本平均100と不偏分散144が得られている。この時、信頼水準95％と99％
の信頼区間を求めよ
 ˆ
 ˆ
x  tn1 
   x  tn1 
2 n
2 n
95%
100  t35(0.025)
t35(0.025)  2.0301
99%
144
 100  t35(0.025)  2    100  t35(0.025)  2
36
100  2.0301 2  95.931    100  2.0301 2  104.06
144
 100  t35(0.005)  2    100  t35(0.005)  2
36
100  2.7238 2  94.55    100  2.7238 2  105.45
100  t35(0.005)
t35(0.005)  2.7238
不偏分散144が母分散だとしたら
 
 
x  z 
   x  z 
2 n
2 n
144
100

z
(
0
.
025
)
 100  z(0.025)  2    100  z(0.025)  2
95%
36
100  1.96  2  96.08    100  1.96  2  103.92
z(0.025)  1.9600
ｔ分布と正規分布
正規分布
自由度５のｔ分布
-2
-1
0
1
2
   

tn1   z 
2 2
 ˆ
 ˆ
x  tn1 
   x  tn1 
2 n
2 n
 
 
x  z 
   x  z 
2 n
2 n
広い
狭い
標本比率の分布
母比率πの母集団からのｎ個の無作為標本に基づく標本比率ｐの分布
平均π、分散π（１－π）／ｎの正規分布で近似できる
N ( ,
 (1   )
n
)
分散は？ → 既知又は未知？
×
分散が既知（π（１－π））
○
分散は未知
← 母分散πが既知
分散は未知 → どのように推定するか？
標本比率 p を用いる
標本比率の分布の分散は p(1-p)／n とする
標本比率を議論する場合には標本数が多いことが前提
平均π、分散ｐ（１－ｐ）／ｎの正規分布で近似できる
母比率の区間推定（信頼水準１－α）
その１：標本比率が前提区間の最大値の位置にある場合（母比率の信頼区間の最小値）
p(1  p)
N ( ,
)
n
p

a
Pr(P  p) 
2
π－a
π
π+a
p 
p(1  p) / n
Z
Z

z 
2
p 
p(1  p) / n
p 

)
2
p(1  p) / n
Pr(Z 

2

z 
2
2
P
標準化
N (0,1)

：標準正規分布においてその
 
z  
2
上側確率がα／2となる値
p 
p(1  p) / n
 p(1  p)
  p  z 
2
n
母比率の区間推定（信頼水準１－α）
その２：標本比率が前提区間の最小値の位置にある場合（母比率の信頼区間の最大値）
p

N ( ,
p(1  p)
)
n
a
2
π－a
Pr(P  p) 
π
π＋a
P
標準化
p 
p(1  p) / n
N (0,1)

2

z 
2
2
Z
p 
p(1  p) / n
Pr(Z 
p 

)
2
p(1  p) / n

 z 
2
Z

 
 z  
2
：標準正規分布においてその
下側確率がα／2となる値
p 
p(1  p) / n
 p(1  p)
  p  z 
2
n
信頼水準１－αでの母比率の区間推定
p 
p(1  p) / n
N (0,1)
標本比率が前提区間の最大値に位置している場合

2
Z
p 
p(1  p) / n

z 
2

z 
2
 
z  
2
：標準正規分布においてその
上側確率がα／2となる値
p 
p(1  p) / n
 p(1  p)
  p  z 
2
n
標本平均が前提区間の最小値に位置している場合
N (0,1)

2
Z

z 
2
まとめ

 z 
2
 
 z  
2
母集団からのn個の無作為標本から標本比率
頼水準１－αの信頼区間は下式で与えられる。
：標準正規分布においてその
下側確率がα／2となる値
p 
p(1  p) / n
 p(1  p)
  p  z 
2
n
p が得られている。この時、母比率πの信
 p(1  p)
 p(1  p)
p  z 
   p  z 
n
n
2
2
適用例
母比率の区間推定
100個の標本から標本比率0.5が得られている。この時、母比率の信頼水準95％と99％の信
頼区間を求めよ
 p(1  p)
 p(1  p)
p  z 
   p  z 
n
n
2
2
95%
0.5  z(0.025)
z(0.025)  1.9600
99%
0.5  1.96  0.05  0.402    0.5  1.96  0.05  0.598
0.5  z(0.005)
z(0.005)  2.5758
0.5(1  0.5)
0.5
0.5
 0.5  z(0.025) 
   0.5  z(0.025) 
10
10
100
0.5(1  0.5)
0.5
0.5
 0.5  z(0.005) 
   0.5  z(0.005) 
10
10
100
0.5  2.5758 0.05  0.3712    0.5  2.5758 0.05  0.5129
区間推定の精度に基づく標本数の決定
①母分散が既知の場合の、ｎ個の標本に基づく標本平均の区間推定
x  z( / 2)

n
   x  z( / 2)

n
信頼区間の長さは？

2z( / 2)
n
精度の高い（区間幅の狭い）予測値を得るためには？
標本数を多くする
区間幅をある値 a より小さくするためには？
2z( / 2)
4z( / 2)

n
2

2
n
a
a
2
4z( / 2)2 2
n
2
a
②母分散が未知の場合の、ｎ個の標本に基づく標本平均の区間推定
x  tn1( / 2)
ˆ
n
   x  tn1( / 2)
ˆ
n
区間幅をある値 a より小さくするためには？
2tn1( / 2)
ˆ
n
a
2
ˆ

2
4tn1( / 2)
n
ˆ
a
2
4tn1( / 2)2ˆ 2
n
2
a
の値は過去の類似調査を参考とする
③ｎ個の標本に基づく標本比率の区間推定
p  z( / 2)
p(1  p)
p(1  p)
   p  z( / 2)
n
n
区間幅をある値 a より小さくするためには？
p(1  p)
2z( / 2)
a
n
p(1  p) 2
4z( / 2)
a
n
2
● P の値は過去の値を参考とする
● 安全を見越すとすれば
p(1-p) は p=0.5 の時最大値となる → p=0.5 を用いる
4z( / 2)2 p(1  p)
n
2
a
例：区間推定の精度に基づく標本数の決定
①標本平均の区間推定の精度に基づく標本数の決定（母分散が既知）
母分散が100の時、信頼係数
95％の信頼区間の幅を５以内
に抑えたい
4z( / 2)2 2
n
a2
4 1.962 100
 61.5  n
52
②母分散が未知の場合の、ｎ個の標本に基づく標本平均の区間推定
不偏分散が100の時、信頼係
数95％の信頼区間の幅を５以
内に抑えたい
4tn1( / 2)2ˆ 2
n
a2
N=64
4 1.99832 100
 63.89  n
2
5
③ｎ個の標本に基づく標本比率の区間推定
TV番組の視聴率調査をする。こ
の時、信頼係数95％の信頼区
間の幅を５％以内に抑えたい
4z( / 2)2 p(1  p)
n
2
a
安全を見込めば
4 1.962  0.5  (1  0.5)
 1536.6  n
0.052
TV番組の視聴率で
あることを考えれば
4 1.962  0.3  (1  0.3)
 1290.8  n
2
0.05