資料Bの修正版!

Download Report

Transcript 資料Bの修正版!

確率と統計2009
2010年1月7日(木)
Version 3
今日も検定、検定また検定
PROBLEM

全国10歳の女子の身長は、平均μ=140cm、標準偏差
σ=5cmの正規分布に従うことが知られている。いま、あ
る地域に住む10歳の女子25名の身長を調べたところ、
平均m=137cmであった。この地域の女子の身長は全
国水準と比べてどうか?
平均μ = 140cm
標準偏差σ = 5cm
平均μ = 137cm
標準偏差
平均μ = 140cm
標準偏差σ = 5cm
平均m = 137cm
標準偏差
標本平均 m = 140cm
標準偏差σX = σ/√n








仮説H0:その地域に関するデータは、全国データの標本で
ある。
定理:N(μ=140, σ2=25)から得られる標本に関して、
標本平均の平均はN( μ, σ2 / n ) に従う。
事実(調査結果): 標本の平均m=137cm。
分析: N( μ, σ2 / n ) = N( 140, 52/ 25 ) = N( 140, 1 ) に
おいて、平均値mが137cm以下か143以上になる
確率Pを計算する(両側検定)。
有意水準を5%とする。
Z = ( m - μ) / (σ / √n) = -3 および正規分布表より、
P = 0.0027 < 0.05
仮説H0を棄却する。
結論:有意水準5%でその地域の女子の身長は
全国平均よりも低い。
データ分析の練習をしてみよう!
PROBLEM

あるガン性疾患Xの疑いのある患者60名のうち、最終的
にガンXの診断が確定した者が20名であった。いま、全
症例についてその血液型を調べ、A型の人数を数えた
ところ以下のようになった。ガンXの患者ではA型の人が
多いと言えるか?考察せよ。
ガン陽性(+)
A
型
+ 15
- 5
合計
20
ガン陰性
(-)
合 計
15
25
30
30
40
60
考察

2行2列の表になっているので、2×2分割表の検定法
を適用する。
(15  25  15  5 )  60
2
 
2
20  40  30  30
 7 .5
PROBLEM

前立腺ガンの患者150名をランダムに2群に分け、A,B
2種類の方法で治療を試みた。一定期間後、両群の生
存・死亡数を比較したところ以下のようになった。治療法
により生存率が異なると言えるか?
生存者数
死亡者数
治療法A
治療法B
合計
55
20
35
40
90
60
75
75
150
( 55  40  35  20 )  150
2
 
2
75  75  90  60
 11 . 11
PROBLEM

シャープペンシル用の芯を作っている工場において、
製造した芯の太さの平均値μ(母平均)が0.90mmにな
るようにしないと、シャープペンシルに合わない芯が出
て顧客から苦情が来るため、母平均が0.90mmではな
くなったときは機械を止めて調整することにしている。母
平均が0.90mmかどうかは、毎日製造される芯の中から、
無作為に100本を取り出して、その太さを測りその平均
値mを計算することで調べている。いまmを求めたら
0.91mmであり、また、標準偏差s=0.03mmであった。
この場合あなたはどういう判断を下しますか?
(機械を止めて調整する? まだしない?)
考察
条件設定:
 分かっているもの:
母平均μ
 標本平均m
 標本の大きさn


分かっていないもの:

母標準偏差σ
数学的事実
標本平均Xは、標本の大きさが十分大きければ、
N( μ, σ2/n ) に従う。
 従って、Z=(X-μ) / ( σ /√n ) は、N(0, 1) に従う。

【疑問】
この定理が利用できるためには、母平均と母標準偏差
がともに分かっていなければならない。
しかしながら、今の場合には分かっていない!
どうすればいいのか?
新たな事実

標本の大きさnが十分大きければ、s≒σ とおける。
考察(続き)
Z 
X 

n

X 
s
n

0 . 91  0 . 90
0 . 03
100
有意水準1%とすると、
|Z0| > 2.576 だから、母平均は0.90mmではない。
機械を止めて調整しよう!
 3 .3
PROBLEM (平均値の差の検定)

A社とB社の食料品を、それぞれ無作為に100個ずつ
取り出して、その濃度を測定したところ、ma=45.36%,
sa=0.35%, mb=45.24%, sb=0.40% であった。両社の
製品に関する濃度の母平均には差があるだろうか?統
計的に検討しなさい。
①
②
③
仮説H:2つの母平均には差がない。μa = μb。
ma=45.36, mb=45.24, sa=0.35=σa, sb=0.40=σb,
na=nb
z0 
45 . 36  45 . 24
0 . 35  0 . 40
2
 2 . 26
2
100
④
|z0|>1.96だから、有意水準5%でHは棄却。
(A社の方がB社のものより濃度が高い。)
根拠

2つの標本の元の分布が正規分布ならば、ma-mbの
分布もまた正規分布で、
N(μa-μb, σa2/na + σb2 /nb) になる。また、nが十分
大きければ元の分布が正規分布でなくても、中心極限
定理により正規分布とみなしてよい。