Transcript 9月1日第3時限
第2日目第3時限の学習目標
点推定と区間推定について学ぶ(続き)。
(1)区間推定の公式の導き方の基本を知
る。
(2)区間推定の演習を行う。
統計的検定の基本的な考え方について学ぶ。
(1)母平均の統計的検定の考え方を知る。
(2)帰無仮説とその採択・棄却の概念を
学ぶ。
(3)仮説検定に際しての危険率(有意水
準)の
概念を学ぶ。
信頼区間導出の概要-3(参考)
実際、標本が得られた母集団の母分散が未知の
場合、平均μ0なる正規分布からの N 個の標本を
用いて上記の t なる量を計算すると、
sx
t ( x 0 ) /
t
N 1
すなわち、t は自由度 ν=N-1 の t-分布に従うこ
とが証明できる。ここで、t-分布とは?
信頼区間導出の概要-4 (参考)
t 分布とは、つぎのような関数から成る
分布で、f(t) は任意の t が特定の値を取
る確率を表す。また Γ はガンマ関数で
ある:
1
1
2
2
t
2
f (t )
1
2
自由度 v = N-1 の t-分布の分布とは?
-正規分布に近い y 軸対称な分布
確率
斜線部
1-α
t- 分布
t
- t N-1(α/2)
t N-1(α/2)
信頼区間導出の概要-5(参考)
上の分布の特徴からは、次式が成り立
つ:
sx
prob t N 1 ( x 0 ) /
t N 1
2
2
N 1
1 .
この式を変形し μ0 について解くと、先ほどの
信頼区間の公式となる。すなわち、
区間推定の公式-統計的推定問題の例
sx
sx
Pr ob x t N 1 ( )
0 x t N 1 ( )
2
2
N 1
N 1
1 上の式は、母平均を、標本平均や標本標準偏差等を
用いて、ある区間に入る確率がどれだけ、という言
い方で推定する式であり、
統計における基本的な2つの方法である、推定と検
定のうち、推定の問題の1つの例といえる。
演習6
平均値の区間推定を行う。
授業での演習のサンプル数は、10 と
する。
(データセット1):
41,24,20,21,15,26
,19,23,40,26
(データセット2):
38,24,15,26,10,22
,14,29,37,29
演習6
区間推定の公式(再掲載)
標本
平均
標本標
準偏差
t-分布の上側
100 (α/2)
%点
sx
sx
Pr ob x t N 1 ( )
0 x t N 1 ( )
2
2
N 1
N 1
1
母
平
均
演習6(計算の手順)
(1)平均を求める。
(2)標準偏差 sx を求める。
(3)
s / N 1 を計算する。
x
• (4) つぎに示す t 分布表で、自由度
ν=N-1 の t 分布の5%棄却
点の値を読み取る。
• (5)区間推定の公式を用いて、母平均
の95パーセント信頼区間を求める。
演習6(自由度 ν=N-1 の t-分布の
棄却点の値 tN-1(α/2) の読み取り方)
α のこ
と
ν
p
0.9
0.8
…
0.05
1
.158
.325
…
2
.142
.289
…
∶
9
0.02
…
12.706
31.821
…
4.303
6.965
…
2.262
2.821
…
∶
.129
.261
…
∶
∶
∞
…
…
統計的検定の基本的な考え方(1)
区間推定の方法の復習ー1
母平均の区間推定の場合には、ある母集団から
N 個の標本を手にしたとき、標本平均及び標本
標準偏差からつぎの量 t 、すなわち
sx
t ( x 0 ) /
N 1
を計算すると、この量 t の値が、つぎの区間に
入る確率が、
統計的検定の基本的な考え方(2)
区間推定の方法の復習ー2
prob t N 1 t t N 1 1 .
2
2
となることを用いてこの式を変形し、μ0 につい
て解くと、先ほど演習した、当該標本が得られ
たもとの母集団の母平均の区間推定の公式
が導けることを学んだ。
統計的検定の基本的な考え方(3)
母平均の統計的検定(1)
これに対して、ある母集団から N 個の標本を手
にしたとき、標本平均及び標本標準偏差からつ
ぎの量
sx
t ( x 0 ) /
N 1
t t N 1 に入る確率を
が t N 1 t , 2
2
考えてみよう。つまり、
自由度 v = N-1 の t-分布で、
横軸の値 t がこの図の斜線部に入る確率
裾野の両側
の斜線部の
合計が α
確
率
t- 分布
t
- t N-1(α/2)
1-α
t N-1(α/2)
統計的検定の基本的な考え方(4)
母平均の統計的検定(2)(参考)
上の分布の特徴からは、次式が成り立つ:
sx
prob t N 1 ( x 0 ) /
,
2
N 1
sx
( x 0 ) /
t N 1 .
2
N 1
この式を変形し
x について解くと、つぎのよう
になる。すなわち、
統計的検定の基本的な考え方(5)
母平均の統計的検定(3)(参考)
sx
prob0 t N 1
x,
2 N 1
sx
x 0 t N 1
.
2 N 1
上式は、データが母平均μ0 なる母集団からの標
本ならば、標本平均が上記の範囲に入る確率は
α % である、ことを意味している。
統計的検定の基本的な考え方(6)
母平均の統計的検定(4)(参考)
ここでの αは、検定の文脈では危険率あるいは有
意水準と呼ばれる。
αは、通常、5% か1% が選ばれる。
また、「データが母平均μ0 なる母集団からの標
本である」という言明は、統計的検定の文脈で
は、帰無仮説と呼ばれ、つぎのように表記され
る:
H0 : 0
統計的検定の基本的な考え方(7)
母平均の統計的検定(5)(参考)
ところで、危険率 α が5% の場合、データが母平
均μ0 なる母集団からの標本ならば、標本平均が
上記の範囲のような極端な値を取る可能性は、
100回のサンプリングでも5回ぐらいしかな
いことになる。
万が一、うえの帰無仮説のもとで、このような
起こり得そうもないことが起きた場合、我々は
その帰無仮説を捨てる。これを、統計学では、
帰無仮説を棄却する、という。さもなければ、
我々は、帰無仮説を採択する。これが、検定で
ある。
統計的検定の基本的な考え方(8)
統計的検定における2種類の過誤
統計的検定における第1種及び第2種の過誤
(1) 第1種の過誤 :
帰無仮説が正しいのに、棄却する確率
(2) 第2種の過誤 :
帰無仮説が間違っているのに、採択する確率
2種類の過誤の関係
2種類の過誤は、一方を大きくすると他方は小
さく
なり、その逆も成り立つという二律背反の関係
にある。