この 場合

Download Report

Transcript この 場合

第13回授業 (1/8)の学習目標
 第5章平均値の差の検定の復習
を行う。
 平均値の差の検定の実習をおこ
なう。
平均値の差の検定の目的
 心理学では、検査や実験により得られた得
点に、あらかじめ設定した2つの条件間で
差が見られるかどうかを検討することがよ
くある。
 例えば、ミラーリエル錯視実験の30度30
mm条件と30度45mm 条件の2条件間の錯
視量に差がみられるであろうか。
 あるいは、30度30mmの条件での錯視量に、
男女差は見られるのであろうか。
平均値の差の検定のデータの一般形
 例えば、ミラーリエル錯視のある条件下での男
子と女子の錯視量がそれぞれ Nx 人、Ny 人づつ
無作為に得られたとすると、2群の標本は、一
般的には、それぞれつぎのように書ける:
x1 , x2 , , x N x
(男子)
y1 , y2 , , y N y
(女子)
平均値の差の検定のデータの具体例
 例えば、2群の標本の値が、それぞれ10名づ
づで、つぎのようであったとする:
第1群(男子)
10、96、26、12、97、18、
96、57、15、54
第2群(女子)
10、76、61、15、40、17、
14、03、14、55
平均値の差の検定の大枠
 平均値の差の検定の一連の手順はつぎのとお
り:
(1)最初に、両群の分散の等質性の検定を
行う。
(2)その結果、両群の分散が等しいと見な
さ れる場
合は、(5.9) 式の t の値による平均値の差
の検定
を行う。
(3)もし、両群の分散が等しいとみなせな
い場合は、
平均値の差の検定に先立つ
分散の等質性の検定ー1
 平均値の差の検定に先立つ、分散の等質性の検定
を
行うには、テキスト p.26 の上部にあるように、
(1)2組の標本の平均を、それぞれ求める。
(2)2組の標本の分散を、それぞれ求める。
(3)一般には(5.4) 式により F-値を計算する。
(4)サンプル数が共に20の場合は、テキス
ト p.24 の
下方の、F-検定の危険率に対応する棄却点
の値
と上の F-値を比較する。
両群のデータの平均の計算
 第1群(男子)のデータの平均
x  (10  96  26    54) / 10  48.1
 第2群(女子)のデータの平均
y  (10  76  61    55) / 10  30.5
両群のデータの分散の計算
 第1群(男子)のデータの分散
s x2  (10 2  96 2    54 2 ) / 10  (48.1) 2  1233.89
 第2群(女子)のデータの分散
s  (10  76   55 ) / 10  (30.5)  583.45
2
y
2
2
2
2
平均値の差の検定に先立つ
分散の等質性の検定ー2
 ただし、実際のF-統計量の計算には、数表を用
いる場合、通常の F-分布表の特徴から、(5.4)
式ではなく (5.5) 式を用いる、すなわち
s N1 ( N 2  1)
F
s N 2 ( N1  1)
2
1
2
2
(3)平均値の差の検定に先立つ
分散の等質性の検定ー3
 しかし、F は両群のサンプル数 N1 及び N2 が等
しい時には、テキスト p.22 の (5.6) 式、すなわ
ち、
2
1
2
2
s
F
s
(5.6)
となり、両群のサンプルでの標本分散の比の形に
書ける。そこで、(5.6)式で計算すればよい。
平均値の差の検定に先立つ
分散の等質性の検定ー4
 ここで、この式の分子の分散と分母の分散は、
順に
2
2
s1 ,
s2 ,
であるが、前者は、2群の標本での不偏分散の
大きい方に対応する分散でないといけないので
、注意が必要である。ただし、2群のサンプル数
が等しい場合は、単純に分散の大きい方を分子
に、小さい方を分母に取ればよい。
F 統計量の計算
 そこで、上記2群の分散の大きい方を
分子にすると、
1233.89
F
 2.11
583.45
平均値の差の検定に先立つ
分散の等質性の検定ー5
 つぎに、分散の等質性の検定を行い、つぎ
に平均の差の検定を行う場合、両検定の全
体的危険率の考慮が必要である。
 とりわけ、両母集団の分散が等しい場合に
は、分散の等質性の検定統計量 F と、平均
値の差の通常の検定統計量 t とは、互いに
独立であることが知られている(Hogg,
1961)。
 この独立性が成り立つ場合には、両検定の
全体的危険率は、個々の危険率を α とする
と、ほぼ2倍にインフレする。
平均値の差の検定に先立つ
分散の等質性の検定ー6
これを避けるには、個々の検定の危険率 α
は、全体の危険率を α* として、
  1 1 * ,
にすればよい。これを実現するには、
(1)α* =0.05 ならば、αはおよそ 0.025 に、
(2)α*=0.01 ならば、 αはおよそ 0.005 に、
それぞれ取ればよい。
平均値の差の検定に先立つ
分散の等質性の検定ー7
 両群の標本数が共に10の場合、標本での F-値
が、つぎの棄却点の値(いずれか一方)
  0.05  F (0.025 / 2)  4.5552,
*
9
9
  0.01  F (0.005 / 2)  6.9875
*
9
9
未満ならば、等分散仮説を採択する。この場合、
分散は等しいとみなされる。
平均値の差の検定に先立つ
分散の等質性の検定ー8
 それに対して、標本での F-値が、演習時に指定
された危険率に対応する棄却点の値(いずれか一
方)
  0.05  F (0.025 / 2)  4.5552,
*
9
9
  0.01  F (0.005 / 2)  6.9875
*
9
9
以上ならば、等分散仮説を棄却する。この場
合、分散は異なるとみなされる。
具体的な分散の等質性の検定
そこで、既に計算した標本での F 統計量と
5%水準での棄却点の値を比較すると、
F  2.11  F9 (0.025 / 2)  4.5552
9
このことは、等分散仮説は5%水準で採
択されることを意味する。
等分散性採択の場合の
平均値の差の検定ー1
 (1)両群での分散が等しいとみなされる場合
テキスト pp.22-23 の t-統計量と対応する以下
に示した自由度を計算する。
すなわち、
t 
X Y
N x S x2  N y S y2
ここで、自由度は、
  N x  N y  2.
N x N y ( N x  N y  2)
Nx  Ny
,
当該標本での具体的な
平均値の差の検定結果
 当該標本では、等分散仮説が採択され
たので、その場合の t 統計量を計算す
ると、
48.1  30.5
10 10  (10  10  2)
t 
,
10  10
10 1233.89  10  583.45
 1.24,
また、  10  10  2  18.
等分散性採択の場合の
平均値の差の検定ー2
 t-統計量を計算し自由度を計算したら、標本
で
の t の値が、演習時に指定された危険率に対
応するつぎの棄却点の値(いずれか一方)
*
  0.05  t18 (0.025 / 2)  2.4450,
 *  0.01  t18 (0.005 / 2)  3.1966
未満ならば、等平均仮説を採択する。この
場合、両群の平均値は等しいとみなされる。
等分散性採択の場合の
平均値の差の検定ー3
 一方、標本での t の値が、授業中に指定された危
険
率に対応するつぎの棄却点の値(いずれか一方)
  0.05  t18 (0.025 / 2)  2.4450,
*
  0.01  t18 (0.005 / 2)  3.1966
*
以上ならば、等平均仮説を棄却する。この
場合、両群の平均値に差があることを意味す
る。
等分散性採択の場合の
具体例での平均値の差の検定
 上記標本での t 統計量の値と5%水準
での棄却点の値を比較すると、
t  1.24  t18 (0.025 / 2)  2.4450,
となり、等平均仮説は5%水準で採択され
ることを意味する。
等分散性棄却の場合の
平均値の差の検定ー1
 (2)両群の分散が異なるとみなされる場合
テキスト p.20 に書いたように、べーレン
ス・フィッシャー問題と呼ばれており、そのよう
な場合に平均値の差の検定を行うこと自体に無理
があると言う研究者もいる。
 また、この場合、F-統計量と t’-統計量は互いに独
立ではないので、2つの検定を続けて行う場合の
全体としての危険率の計算は困難であり、ここで
は危険率のコントロールは行わず、通常の F 分布
表の制約から次善の策として、t’ 検定の危険率は
α で行うこととする。
等分散性棄却の場合の
平均値の差の検定ー2
 両群での分散が異なるとみなされる場合は、テ
キスト pp.22-23 の t-統計量と対応する自由度を
計算する。すなわち、
t' 
X Y
,
Wx  W y
(5.9)
ここで、
2
x
Ux
S
Wx 

,
Nx
N x 1
Wy 
Uy
Ny

S y2
N y 1
.
等分散性棄却の場合の
具体的な平均値の差の検定
 当該標本の場合、等分散仮説は採択されたので、
ここでの計算は不要であるが、棄却されるよう
なデータであれば、うえの W は、つぎのように
計算する:
2
Sx
1233.89
Wx 

 137.10,
N x 1
10  1
S y2
583.45
Wy 

 64.83
N y  1 10  1
等分散性棄却の場合の
平均値の差の検定ー3
 つぎに、この場合の t’-分布の自由度は、テキスト
p.23 の下方にいろいろな方法が紹介してあるが、
その中で、SAS が標準として用いているところの
(b) Satterthwaite (1946) の方法による自由
度を計算すること、すなわち:

(Wx  W y )
2
 Wx2   W 


  


 N x 1   N y 1 
2
y
.
(5.12)
等分散性棄却の場合の
具体的な自由度の計算
 当該標本の場合、等分散仮説は採択された
ので、ここでの計算は不要であるが、棄却
されるようなデータであれば、うえの 自
由度 は、つぎのように計算する:
(137.10  64.83)

 15.956  16
2
2
 137.10   64.83 

  

 10  1   10  1 
2
等分散性棄却の場合の
平均値の差の検定ー4
 t’-統計量を計算し、自由度を計算したら、最後
に岩原の副読本の p.434 を開き、
(1)授業中に指定された危険率 α と
(2) (5.12) 式で計算した自由度に対応す
る棄却点の値を読み取る。
 標本での t’-値がこの棄却点の値未満ならば、等
平均仮説を採択する。この場合、平均値の差が
ないことを意味する。
等分散性棄却の場合の
平均値の差の検定ー5
 それに対して、標本での t’-値がこの棄却点の
値以上ならば、等平均仮説を棄却する。この
場合、両群の平均値に差があることを意味す
る。
(5)平均値の差の検定の再実習
 岩原テキスト末尾の乱数表から、各自のデータ
を抽出し、平均値の差の検定をおこなってみよ
う。
 今日は、標本数は各群とも10とし、各自の学
籍に対応する岩原テキストの乱数の位置から数
えて6つ下から始まるデータを用いよ。
 第1群の10個は p.445から、第2群の10
個はp.446の同位置から取り出すこと。
 検定の全体的危険率 α* は、0.05とせよ。