Transcript f 2
心理統計学 II
第9回 (11/27) 授業の目標
先週紹介した2×3分割表のデータ例をもとに、一般の r×s
分割表の場合のカイ二乗統計量及び期待度数の概念を理
解する。
一般の分割表の特殊形としての2×2分割表の場合のカイ
二乗統計量の形を知る。
2×2分割表の場合のカイ二乗検定の手順を理解する。
具体例による、 2×2分割表の場合のカイ二乗検定の手順
のまとめ
岩原テキストの乱数表からの分割表の作成方法
具体例での期待度数
の計算例1(復習)
同検定では、期待度数
という重要な概念があ
る(テキスト、p.33)。
例えば、右表の第2行
第1列すなわち(2、1)
セルの実度数 3 に対
する期待度数は、
もっと
厳しく
男 27
女 3
計 30
137 30
7.996 と計算した。
514
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
具体例での期待度数
の計算例1(復習)(続き)
このことは、第2行第1
列の期待度数を次のよ
うに計算することを意
味する:
第2行の
合計
第1列の
合計
137 30
7.996
514
総合計
もっと
厳しく
男 27
女 3
計 30
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
各セルの度数を一般的な記号で
表した場合の期待度数の計算例1
つぎに、上記の(2,1)
セルの実度数 3 に対し
て、これを一般的に表
すと第2行第1列なの
で、f21 と書くと、
右表の実度数 f21 に対
する期待度数 g21は、
f 2 f1
g21
N
もっと
厳しく
男
女
計
f11
f21
f•1
と計算される。
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
一般的な記号で表した場合の
期待度数の計算例1(続き)
このことは、第2行第1
列の期待度数を次のよ
うに計算することを意
味する:
第2行の
合計
第1列の
合計
f 2 f1
g21
N
総合計
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
具体例での期待度数
の計算例2(復習)
同様に、右表の(1、3)
セルの実度数75 に対
する期待度数は、
377 85
62.344,
514
と計算した。
もっと
厳しく
男 27
女 3
計 30
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
各セルの度数を一般的な記号で
表した場合の期待度数の計算例2
ここで、上記の(1, 3)セ
ルの実度数75に対し
て、これを一般的に表
すと第1行第3列なの
で、f13 と書くと、
右表の実度数 f13 に対
する期待度数 g13 はど
う書けるか?
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
期待度数の計算例2(続き)
右表の実度数 f13 に対
する期待度数 g13 は、
f1 f3
g13
,
N
と計算される。
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
r×s 分割表の場合のカイ二乗統計量
テキスト p.31 の表 7.1
の分割表は、r 行 s 列
分割表の場合のデータ
を示す。
行や列それぞれの合
計 f1•, f2•, …, fr•, 及び
f•1, f•2, …, f•s は、す
べて周辺度数と呼ばれ
る。
B1 B2 … Bs 計
A1 f11
f12 … f1s f1•
A2 f21 f22 … f2s f2•
:
:
:
:
:
:
Ar fr1
fr2 … frs
fr•
計 f•1
f•2 … f•s
N
r×s 分割表の第 i 行第 j 列の実度数
fij に対する期待度数の計算方法
上記期待度数は、テキスト p.33 の (7.2) 式に
あるように、
第 i 行の合計
fi f j
gij
N
総合計
第 j 列の合計
セルカイ二乗の定義とその意味
つぎに、上記第 i 行第 j 列の実度数 fij と、
それに対する期待度数 gij を用いたセルカ
イ二乗は、テキスト p.33 の (7.3) 式で定義
される:
hij ( fij gij ) / gij .
2
カイ二乗統計量と
セルカイ二乗との関係(1)
テキスト p.33 の (7.1) 式で表される r×s 分割
表の場合のカイ二乗統計量は、上記セルカイ二
乗を、すべてのセルについて計算し、足し合わ
せたものである。すなわち、
r
s
2 ( fij gij )2 / gij ,
i 1 j 1
( f11 g11) / g11 ( f12 g12) / g12
2
2
( fij gij )2 / gij ( f rs grs )2 / grs .
カイ二乗統計量と
セルカイ二乗との関係(2)
あるいは、(7.3) 式のセルカイ二乗 hij を用いれ
ば、つぎのようにも表せる:
2 ( f11 g11)2 / g11 ( f12 g12)2 / g12
( fij gij )2 / gij ( f rs grs )2 / grs ,
h11 h12
hij hrs .
セルカイ二乗の役割(1)
すなわち、セルカイ二乗値は、テキスト p.33
の中ほどに書いたように、
全体的なカイ二乗に対する各セルの寄与の程
度を表している。
一方、分割表のカイ二乗検定で我々が検討す
べき帰無仮説は、
「2つの属性(定性的変数)間に関連がない」
というものである。
セルカイ二乗の役割(2)
そこで、テキスト p.33 中ほどにあるように、
帰無仮説が棄却された場合には、上の期待
度数とこの量(セルカイ二乗) hij を同時に出
力できていれば、2つの属性 A, B のどこに、
とりわけ大きな独立性(関連無し)からのずれ
が、どの方向にあるのかを検討できる。
2×2 分割表の場合の検定
これまでは、一般の r×s 分割表のカイ二乗
検定について述べてきたが、ここからは、そ
の特別な場合としての 2×2 分割表のカイ二
乗検定の方法を述べる。
この場合には、一般の場合に定義されたテキ
スト p.33 の (7.1) 式のカイ二乗統計量は非
常に簡単になる。
2×2 分割表の一般形
まず、 2×2 分割表
の一般形を示すと、
右の表のような、テ
キスト p.31 表7.2
の形のものになる。
ここで、セル内の度
数は、fij のような形
でなく、簡単に a, b,
c, d と書くとする。
A/B
B1
B2
計
A1
a
b
a+b
A2
c
d
c+d
a+c
b+d
N
計
2×2 分割表の場合の
カイ二乗統計量の形
2×2 分割表の場合、(7.1) 式で定義される
カイ二乗統計量は、より簡単な形に書くこと
ができる。これが、テキスト p.33 の (7.4) 式
の統計量である:
N (ad bc)
.
(a c)(b d )(a b)(c d )
2
2
2×2 分割表の具体例
例えば、右の表
のような分割表
では、
A/B
A1
B1
13
B2
7
計
20
A2
計
12
25
18
25
30
50
50 (1318 7 12)
.
25 25 20 30
2
2
イエーツの修正(1)
ただし、いずれか1つのセルにでも、期待度
数5以下のセルがある場合には、テキスト
p.33 の (7.4) 式のすぐ下に書いたように、う
えのカイ二乗統計量を修正する必要がある。
この修正は、イエーツの修正と呼ばれ、つぎ
のようにカイ二乗統計量を修正するものであ
る(テキスト、p.33 下参照)。すなわち、
イエーツの修正(2)
(1)ad-bc > N/2 の時、(7.4) 式の分子の
ad-bc を ad-bc-(N/2) と修正する。
(2)-N/2 ≤ ad-bc ≤ N/2 の時、(7.4) 式の右
辺 をゼロ、すなわち χ2 = 0.0 とする。
(3)ad-bc < -N/2 の時、(7.4) 式の分子の
ad-bc を ad-bc+(N/2) と修正する。
イエーツの修正の具体例(1-1)
例えば、右の表の
ような分割表では、
まずカイ二乗統計
量計算の前に、各
セルの期待度数
を計算する必要
がある。
A/B
B1
計
B2
A1
3
6
9
A2
6
5
11
計
9
11
20
イエーツの修正の具体例(1-2)
例えば、右の表のような
分割表では、まずカイ二
乗統計量計算の前に、
各セルの期待度数を計
算する必要がある。例え
ば、(1,2) セルの実度
数 6 に対して、期待度
数は、
9 11
g12
4.95
20
A/B
B1
計
B2
A1
3
6
9
A2
6
5
11
計
9
11
20
イエーツの修正の具体例(1-3)
このようにして、カ
イ二乗統計量計算
の前に、この表の
各セルの期待度数
をすべて計算する
と、右の赤印の数
値となる。
A/B
B1
A1
3
6
4.05 4.95
6
5
4.95 6.05
9
11
A2
計
B2
計
9
11
20
イエーツの修正の具体例(2)
これらより、セル内の期待度数が5以下のセルが1
つ以上存在することがわかる。
さらに、イエーツの修正の条件を検討するために、
ad-bc の値を計算すると、
ad bc 3 5 6 6 21.
すなわち、-N/2 (=-20/2) =-10 より
も小さい。
イエーツの修正の具体例(3)
これは修正の条件の 3.にあたり、我々は
(7.4) 式の分子の ad-bc を ad-bc+(N/2)
と修正する必要があると言える。すなわち、
ad bc ( N / 2)
3 5 6 6 (20 / 2),
21 10 11.
イエーツの修正の具体例(4)
そこで、最後に、このケースにおける修正
後のカイ二乗統計量を計算すると、
N ad bc ( N / 2)
,
(a c)(b d )(a b)(c d )
2
2
20 11
0.2469.
9 11 9 11
2
岩原テキストの表の見方
このようにカイ二乗値を計算したら、われわ
れはこの検定のカイ二乗値の棄却点の値を
、岩原のテキスト、p.432-433 とりわけ p.433
の自由度1に対する5%棄却点の値を読み
取り、上で計算したカイ二乗値が棄却点の値
以上ならば帰無仮説を棄却する。さもなけれ
ば、採択する。
検定の結論
標本でのカイ二乗値が棄却点の値以上なら
ば、帰無仮説を棄却するが、そのことは、
2つの属性間には有意な関連があることを
意味する。
もし、カイ二乗値が棄却点の値未満ならば、
帰無仮説を採択するが、そのことは、
2つの属性間には有意な関連がないことを
意味する。
演習時の、データの作成方法
演習では、岩原テキスト pp.445-446 の乱数
表から、学籍番号に対応する各ページの先
頭から順に、
(p.445 の数値、p.446 の数値)
として20対取り出し、
それぞれの対の2つの数値を、すべて
(1)数値が50未満なら1に、
(2)数値が50以上なら2に
変換せよ。
演習時の検定手順(1)
このようにして得られた20対のデータを
もとに、2×2分割表を作成し、20対の
データが当該分割表の4つのセルのど
こに該当するかをカウントし、最終的な
分割表を作成する(講義テキスト、p.33
参照のこと)。
演習時の検定手順(2)
作成が完了したら、まず4つのセルそれ
ぞれの期待度数を計算する。
期待度数を見て、5以下のものが1つで
もあれば、イエーツの修正によるカイ二
乗統計量を、そうでなければ通常のカイ
二乗統計量を計算し、検定する。
WEB 用のデータは?
WEB 宿題では、入力データは分割表の各セ
ルのデータではなく、うえのようにして変換さ
れた20対のデータである:
(1、1)、(2、2)、(1、2)、… 、(1、2)
20対の架空データ
架空データの仮の解釈
このようにして得られた各対のデータは、仮に各被
験者の2つの属性、
1.性別(1.男子、2.女子)
2.向性(1.外交的、2.内向的)、
から成るとしよう。つまり、データは、
(性別、向性)
この時、分析の目的は、性別と向性の間に統計的
に有意な関連があるかを調べることである。