大前提が正しい場合に

Download Report

Transcript 大前提が正しい場合に

統計的推定
標本から算出された値に基づいて母集団における値(母数)を推測すること
標本平均値 → 母平均
標本比率
→
母比率
統計的推定のための2つの方法
①点推定
母平均を1つの値で推定すること。例え
ば、標本平均を母平均の推定値とするこ
と。
標本平均値30 → 母平均は30である
平均50、分散100の母集団から
の50個の無作為標本に基づく標
本平均値
平均50、分散2の正規分布
45
50
55
推定値が母数と一致することはまれである
推定値がどの程度正確なものかも分からない
② 区間推定
母数がとりうる値の範囲(区間)を、その推測の確からしさ(確率)ととも
に示す。つまり、
推測の精度
→
とりうる値の範囲で示す
推測の確実性
→
その推測が成り立つ確率を示す
標本平均値30 から、
母平均は20~40の範囲(区間)にあると推定される
この推測の確からしさ(正しい確率)は 0.95 である
推測の精度が粗い(区間が広い)
推測の確実性が低い
推定結果の利用は、慎重に行
う必要がある
推定結果の利用に関するリスクを考慮できる → 一般に広く利用されている
区間推定の基本的な考え方(母平均の推定)
N ( ,

(1)最も現れやすい値はμとその近傍の値であり、
2
n
(2)μから離れるに従って、それが生じる可能性
は小さくなる
)
↓ しかし
(3)μを中心として、極めて広い範囲の値をとる
可能性があり、このままでは手掛かりが無い
μ
区間推定を行うための大前提
我々が手にした標本平均は、母平均を中
心して、その前後±a の範囲の値、つまり
μ-a ~μ+a
の値である。
この前提が正しい確率は、標本平均がこの範
囲にある確率、つまり水色の面積である
大前提が正しい場合に、母平均に関してどのような推論が行えるか? ・・その1
観測された平均値が前提の範囲の最大値に相当する場合
x
a
x
x a
大前提が正しい場合の
母平均の最小値(μL)
大前提が正しい場合に、母平均に関してどのような推論が行えるか? ・・その2
観測された平均値が前提の範囲の最小値に相当する場合
x
a
x
x a
大前提が正しい場合の
母平均の最大値(μU)
大前提が正しい場合に、母平均に関してどのような推論が行えるか? ・・結論
x
x a
大前提が正しい場合の
母平均の最小値(μL)
L  x  a
a
大前提が正しい場合の
母平均の最大値(μU)
U  x  a
大前提が正しい場合の
母平均の範囲
x a    x a
この推論が正しい確率は?
a
x a
大前提が正しい確率
我々が手にした標本平均が母平
均を中心にしてその前後±a の範
囲にある確率 → 水色の面積
区間推定の考え方のまとめ
x が得られた時、母平均μの
標本平均
存在範囲は
x a    x a
この推論が正しい確率は、標本平均が母平
均を中心にしてその前後±a の範囲にある
確率である
推論が正しい確率 : 信頼水準
精度の高い(予測範囲の狭い)予測をしたい
→ 信頼水準が下がる(予測がはずれる可能性が高くな
る)
はずれる危険性の低い予測をしたい
→ 精度の低い予測で我慢する
一般的に用いられる信頼水準は、
95% → 20回に1回誤った結論を導く可能性がある
又は99% → 100回に1回誤った結論を導く可能性がある
母平均の区間推定
ケース1 ・・・ 母分散σ2が既知の場合
母集団(平均μ、分散σ2からのN個の無作為標本から平均値
xが得られている
標本平均は平均μ、分散σ2/Nの正規分布に近似的に従う
N ( ,
2
N
信頼水準1-αで
区間推定
)
μ
95%信頼水準 α=0.05
99%信頼水準 α=0.01
観測された平均値が前提の範囲の最大値に相当する場合
x
Pr(X  x ) 
a

2
X  N ( ,
2
N
)
確率α/2
z
X
x 
/ N
x 

Pr(Z 
)
2
/ N

z( )
2
Z
X 
/ N
Z  N (0,1)
標準正規分布においてその上
側確率がα/2となる値

x 
 
z( ) 
   x  z( )
2 / N
2 N
例:95%の信頼区間 → α=0.05(5%) → Z(0.025)=1.9600
  x  1.96

N
観測された平均値が前提の範囲の最小値に相当する場合
x
Pr(X  x ) 
確率α/2
a
z

2
x 
/ N
x 

Pr(Z 
)
2
/ N

 z( )
2
X  N ( ,
Z
2
N
)
X 
/ N
Z  N (0,1)
標準正規分布においてその下側確率がα/2と
なる値

x 
 
 z( ) 
   x  z( )
2 / N
2 N
例:95%の信頼区間 → α=0.05(5%) → Z(0.025)=1.9600
  x  1.96

N
まとめ
母平均の区間推定

z( )
2
ケース1 ・・・ 母分散σ2が既知の場合
標準正規分布においてその上
側確率がα/2となる値
信頼区間の
下限値

x 
 
z( ) 
   x  z( )
2 / N
2 N
x
/ N
x
/ N
信頼区間の
下限値

x 
 
 z( ) 
   x  z( )
2 / N
2 N
 
 
x  z( )
   x  z( )
2 N
2 N
例: 母分散が100の母集団からの100個の標本に基づく標本平

 z( )
2

z( )
2
母平均の区間推定
ケース1 ・・・ 母分散σ2が既知の場合
母分散がσ2の母集団からのN個の標本に基づく標本平均が
間 (信頼水準1-α)
 
xの場合の母平均の信頼区
 
x  z( )
   x  z( )
2 N
2 N
例: 母分散が100の母集団からの100個の標本に基づく標本平均が50であった場合の母
平均の信頼区間は?
信頼水準95%(α=0.05)
z(0.025)  1.9600
信頼水準99%(α=0.01)
z(0.005)  2.5758
50  z(0.025)
10
10
   50  z(0.025)
100
100
50  1.96    50  1.96  48.04    51.96
50  z(0.005)
10
10
   50  z(0.005)
100
100
50  2.58    50  2.58  47.42    52.58