平均値の差の検定の手順

Download Report

Transcript 平均値の差の検定の手順

第10回授業(6/12)の学習目標




第5章 平均値の差の検定の基本的な考え方を
学ぶ。
平均値の差の検定の一連の手順を学ぶ。
分散の等質性の検定の具体的手順を学ぶ。
分散の等質性の検定の後の、平均値の差の検
定の具体的手順を学ぶ(この途中までで、終了)。
第5章 平均値の差の検定-1

心理学では、検査や実験により得ら
れた得点に、あらかじめ設定した2
つの条件間で差が見られるかどうか
を検討することがよくある。
第5章 平均値の差の検定-2
例えば、ミラーリエル錯視実験の
30度30mm条件と30度45mm 条
件の2条件間の錯視量に差がみら
れるであろうか。
 あるいは、30度30mmの条件での
錯視量に、男女差は見られるので
あろうか。

検定における標本と
検討すべき仮説-1

これらの課題を検討するための1
つの客観的・実証的な方法は、既
に第3章の後半で少し紹介した統
計的仮説検定を行うことである。
検定における標本と
検討すべき仮説-2

これを行うためには、まず第1にそ
れぞれの条件下で実験を行い、
それぞれの条件での測定値を得
ることが必要である。統計学では、
これを標本を収集するという。
検定における標本と
検討すべき仮説-3

標本は漠然と収集するのではなく、
何らかの(統計的)仮説を立て、無
作為に収集する必要がある。
平均値の差の検定での
2群の標本とは?

例えば、ミラーリエル錯視のある条件下での男
子と女子の錯視量がそれぞれ Nx 人、Ny 人づ
つ得られたとすると、2群の標本は、一般的には
、それぞれ
x1 , x2 , , x N x
(男子)
y1 , y2 , , y N y
(女子)
と書ける。
平均値の差の検定
における帰無仮説

平均値の差の検定における仮説は、帰
無仮説と呼ばれ、両条件の母集団の平
均値 μx, μy に差がない、というものであり、
これを数式で書くとつぎのようになる:
H0 :
x   y
母集団と標本での平均値の差の違い

うえの仮説は、両条件での標本の平均値
に差がない、すなわち
xy
とは異なり、標本が抽出されるもとの母集
団での平均値に差がない、というものであ
る点に注意が必要である。
母集団の特徴の違いによる
平均値の差の検定方法の違い-1

2つの群間で平均値に違いがある
かどうかを検討する場合、データが
得られるもとの母集団の特徴の違
いにより、検定方法が異なる。
母集団の特徴の違いによる
平均値の差の検定方法の違い-2

1つの方法は、テキスト p.19 の 5.1
節の
「母集団の分布形が未知だが、母
分散は既知で、標本数が大の場合」
である。
母集団の特徴の違いによる
平均値の差の検定方法の違い-3

他方は、テキスト p.20 の 5.2 節
の
「母集団の分布が正規分布で、
母分散は未知の場合」
である。
t-統計量とその分布

帰無仮説のもとでは、5.2 節の条件の下
では、テキスト p.23 の (5.9) 式、すなわち
次の量 t がどんな値を取る可能性がどれ
ぐらいであるかが理論的にわかっている:
t 
N x N y ( N x  N y  2)
X Y
NxS  N yS
2
x
2
y
Nx  Ny
自由度 v の t-分布の分布とは?
-正規分布に近い y 軸対称な分布
確率
斜線部
1-α
t- 分布
t
- t N-1(α/2)
t N-1(α/2)
帰無仮説の棄却とは?-1
つまり、帰無仮説のもとでは、標本
から計算される上記の t の値が上
の図の下限値以下か、上限値以上
の範囲に入る可能性は α である。
 この α の値は、統計学では通常
0.05 か 0.01 を考えるのが慣習で
ある。

帰無仮説の棄却とは?-2

そこで、もし帰無仮説のもとで標本か
ら計算された t-値が下限値以下や上
限値以上の値を取ったならば、われわ
れは帰無仮説のもとでは起こりえそう
もないことが起こったとして、帰無仮説
を捨てる。統計では、帰無仮説を棄却
するという。
帰無仮説の棄却とは?-3
平均値の差の検定で、帰無仮説を棄
却することは、両条件の平均値に差
があることを意味する。
 なぜならば、この場合の帰無仮説は
先ほど示したように、

H0 :
であるから。
 x=y
帰無仮説の採択とは?-1
一方、帰無仮説のもとでは、標本から
計算される上記の t の値が上の図の
下限値から上限値の範囲に入る可能
性は 1-αである。
 通常、ここでの α は 0.05 か 0.01 なの
で、1-α の値は、通常 0.95 か 0.99 で
ある。

帰無仮説の採択とは?-2

そこで、帰無仮説のもとで、標本から
計算された t-値が下限値から上限値
の範囲の値を取ったならば、われわ
れは帰無仮説のもとでは起こりえそう
なことが起こったとして、帰無仮説を
受け入れる。統計では、帰無仮説を
採択するという。
帰無仮説の採択とは?-3
平均値の差の検定で、帰無仮説を
採択することは、両条件の平均値に
差がないことを意味する。
 なぜならば、この場合の帰無仮説は
先ほど示したように、

H0 :
であるから。
 x=y
平均値の差の検定における
t-分布の自由度はいくつ?-1
既に第3章でもふれたように、一般
に t-分布の形を決めるパラメータは、
自由度と呼ばれる量で表される。
 ただし、第3章での t-分布の自由度
νはサンプル数 N に対して、 ν=N-1
であった。

平均値の差の検定における
t-分布の自由度はいくつ?-2

これに対して、第5章での t-分布の形
は第3章のそれとは異なる。その値は、
つぎに述べる、ある条件の違いにより、
テキスト p.22 末尾の
  Nx  N y  2
となったり、
(5.8)
平均値の差の検定における
t-分布の自由度はいくつ?-3

同 p.23 の下方の

(Wx  Wy )
2
W /( N x  1)  W ( N y  1)
2
x
2
y
となったりするので、注意せよ。
(5.12)
t-分布の形を変える、
ある条件とは?-1

平均値の差の検定では、2群の標本
が抽出される元の集団すなわち母集
団分布に正規分布が仮定される場合
(テキストでは、p.20 からの 5.2 節)
には、t-統計量が用いられる。
t-分布の形を変える、
ある条件とは?-2

ただし、この場合、t-統計量そのも
のが、2つの母集団の分散(母分
散)が等しいかどうかで、異なるも
のになることがわかっている。これ
が、t-分布の形を変える「ある条件」
である。
母分散の等質性の検定とは?-1

つまり、2群の母集団が正規分布に
従うとみなされる時、われわれは平均
値の差の検定に先立ち、2つの母集
団の分布の分散が等しいかどうかの
検定を行わないといけないのである。
母分散の等質性の検定とは?-2

この検定は、母分散の等質性の検
定と呼ばれ、つぎに示す、テキスト
p.21 の最上部の (5.4) 式がそのた
めの統計量であり、F は F-分布に従
うことが知られている。
U x s N x ( N y  1)
F

U y s N y ( N x  1)
2
x
2
y
(5.4)
F-分布の形状を決めるパラメータ

F-分布の形は、t-分布と異なり2つの自由
度により決まる。テキスト p.21 の (5.4) 式
の F-分布の自由度は、テキスト p.20 の
末尾の下から2行目にあるように、2群の
標本のサンプル数をそれぞれ Nx, Ny とす
ると、
 x  N x  1,
 y  N y 1
F-分布の標準的な形状

F-分布の標準的な形状は、つぎのとおりであ
る:
F-分布
α/2
α/2
上側α/2%点
 
F1  
2
2
F-統計量の実際の計算方法(1)

テキスト p.21 の中ほどに書いたように、実際
のF-統計量の計算には、数表を用いる場合、
(5.4) 式ではなく、(5.5) 式を用いる、すなわち
s N1 ( N 2  1)
F
s N 2 ( N1  1)
2
1
2
2
F-統計量の実際の計算方法(2)

この式の分子の分散と分母の分散は、順に
2
1
s ,
2
2
s ,
であるが、前者は、2群の標本での不偏分散の大
きい方に対応する分散でないといけないので、注
意が必要である。
F-統計量の実際の計算方法(3)

うえに示した (5.4) 式の F は、両群のサ
ンプル数 N1 及び N2 が等しい時、テキ
スト p.22 の (5.6) 式、すなわち、
2
1
2
2
s
F
s
(5.6)
となり、両群のサンプルでの標本分散の
比の形に書ける。
平均値の差の検定の一連の手順

平均値の差の検定の一連の手順は、つぎのと
おり:
(1)最初に、分散の等質性の検定を行う。
(2)その結果、両群の分散が等しいと見なさ
れる場合は、(5.9) 式の t の値を計算する。
(3)もし、両群の分散が等しいとみなせない
場合は、(5.10) 式の t’ の値を計算する。
分散の等質性の検定の手順

平均値の差の検定に先立つ、分散の等質性の検
定を行うには、テキスト p.26 の上部にあるように、
(1)2組の標本の平均を、それぞれ求める。
(2)2組の標本の分散を、それぞれ求める。
(3)テキスト p.22 の (5.6) 式により F-値を
計算する。
(4)テキスト p.24 の下方の、F-検定の危険率に
対応する棄却点の値と上の F-値を比較する。
F-統計量の実際の計算方法(1)

テキスト p.21 の中ほどに書いたように、実際
のF-統計量の計算には、数表を用いる場合、
(5.4) 式ではなく、(5.5) 式を用いる、すなわち
s N1 ( N 2  1)
F
s N 2 ( N1  1)
2
1
2
2
F-統計量の実際の計算方法

この式の分子の分散と分母の分散は、順に
2
1
s ,
2
2
s ,
であるが、前者は、2群の標本での不偏分散の
大きい方に対応する分散でないといけないので
、注意が必要である。ただし、2群のサンプル数
が等しい場合は、単純に分散の大きい方を分子
に、小さい方を分母に取ればよい。
F-統計量の実際の計算方法(3)

前回、既に見たように、結局 F は両群のサン
プル数 N1 及び N2 が等しい時、テキスト
p.22 の (5.6) 式、すなわち、
2
1
2
2
s
F
s
(5.6)
となり、両群のサンプルでの標本分散の比の形
に書けるので、この式の値を求めればよい。
平均値の差の一連の検定
の危険率(1)


平均値の差の検定では、多くの場合分散
の等質性の有無が不明であるので、平均
値の差の検定に先立ち、分散の等質性の
検定を行う必要がある。
この時、両母集団の分散が等しい場合に
は、分散の等質性の検定統計量 F と、平
均値の差の通常の検定統計量 t とは、互
いに独立であることが知られている(Hogg,
1961)、
平均値の差の一連の検定
の危険率(2)

この時、両検定をそれぞれ危険率αで行う
と、全体的な危険率α*は、テキスト p.24
の (5.14) 式のようになる。すなわち、
  1  (1   ) ,
*
となる。
2
平均値の差の一連の検定
の危険率(3)
例えば、それぞれの検定の危険率を 0.01
とすると、
 *  1  (1   ) 2 ,
 1  (1  0.01)  0.0199
2
 0.02
となり、危険率のインフレをまねく。
平均値の差の一連の検定
の危険率(4)
これを避けるには、個々の検定の危険率 α
は、全体の危険率を α* として、
  1 1 * ,
にすればよい。これを実現するには、全体
の危険率α* =0.05 ならば、個々の危険率を
およそ 0.025 に、α*=0.01 ならば、個々の
危険率をおよそ 0.005 に取ればよい。
分散の等質性の検定の手順 (1)

もし諸君の標本での F-値が、演習時に指定され
た危険率に対応する棄却点の値(テキスト p.24,
中程)
  0.05  F (0.025 / 2)  2.9021,
*
19
19
(  0.01  F19 (0.005 / 2)  3.8616)
*
19
未満ならば、等分散仮説を採択する。こ
の場合、分散は等しいとみなされる。
分散の等質性の検定の手順 (2)

それに対して、もし諸君の標本での F-値が、演
習時に指定された危険率に対応する棄却点の
値
  0.05  F (0.025 / 2)  2.9021,
*
19
19
(  0.01  F19 (0.005 / 2)  3.8616)
*
19
以上ならば、等分散仮説を棄却する。こ
の場合、分散は異なるとみなされる。
両群の分散が等しいとみなされる時の、
平均値の差の検定の手順(1)

両群での分散が等しいとみなされる場合は、テ
キスト pp.22-23 の t-統計量と対応する自由度
を計算する。すなわち、
t 
N x N y ( N x  N y  2)
X Y
NxS  N yS
2
x
2
y
また、自由度は、
  N x  N y  2.
Nx  Ny
,
両群の分散が等しいとみなされる時の、
平均値の差の検定の手順(2)

t-統計量を計算し、自由度を計算
したら、最後にテキスト p.24 の下
方の、授業中に指定された危険
率に対応する「分散が等しいとき
の t-検定の危険率と棄却点の値」
を見る。すなわち、
両群の分散が等しいとみなされる時の、
平均値の差の検定の手順(3)

標本での t-値がこの棄却点の値
  0.05  t38 (0.025 / 2)  2.3337,
*
(  0.01  t38 (0.005 / 2)  2.9803)
*
未満ならば、等平均仮説を採択する。この
場合、平均値の差がないことを意味する。
両群の分散が等しいとみなされる時の、
平均値の差の検定の手順(4)

一方、授業中に指定された危険率に対応する
「分散が等しいときの t-検定の危険率と棄却点
の値」を見て、標本での t-値がこの棄却点の値
  0.05  t38 (0.025 / 2)  2.3337,
*
(  0.01  t38 (0.005 / 2)  2.9803)
*
以上ならば、等平均仮説を棄却する。この
場合、両群の平均値に差があることを意味す
る。