f 2

Transcript f 2

心理統計学 II
第９回 (11/27) 授業の目標





先週紹介した２×３分割表のデータ例をもとに、一般のｒ×ｓ
分割表の場合のカイ二乗統計量及び期待度数の概念を理
解する。
一般の分割表の特殊形としての２×２分割表の場合のカイ
二乗統計量の形を知る。
２×２分割表の場合のカイ二乗検定の手順を理解する。
具体例による、２×２分割表の場合のカイ二乗検定の手順
のまとめ
岩原テキストの乱数表からの分割表の作成方法
具体例での期待度数
の計算例１（復習）


同検定では、期待度数
という重要な概念があ
る（テキスト、p.33)。
例えば、右表の第２行
第１列すなわち（２、１）
セルの実度数３に対
する期待度数は、
もっと
厳しく
男 27
女 3
計 30
137 30
 7.996 と計算した。
514
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
具体例での期待度数
の計算例１（復習）（続き）
このことは、第２行第１
列の期待度数を次のよ
うに計算することを意
味する：
第２行の
合計
第１列の
合計
137 30
 7.996
514
総合計
もっと
厳しく
男 27
女 3
計 30
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
各セルの度数を一般的な記号で
表した場合の期待度数の計算例１


つぎに、上記の（２，１）
セルの実度数３に対し
て、これを一般的に表
すと第２行第１列なの
で、f21 と書くと、
右表の実度数 f21 に対
する期待度数 g21は、
f 2  f1
g21 
N
もっと
厳しく
男
女
計
f11
f21
f•1
と計算される。
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
一般的な記号で表した場合の
期待度数の計算例１（続き）
このことは、第２行第１
列の期待度数を次のよ
うに計算することを意
味する：
第２行の
合計
第１列の
合計
f 2  f1
g21 
N
総合計
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
具体例での期待度数
の計算例２（復習）
同様に、右表の（１、３）
セルの実度数75 に対
する期待度数は、
377 85
 62.344,
514
と計算した。
もっと
厳しく
男 27
女 3
計 30
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
各セルの度数を一般的な記号で
表した場合の期待度数の計算例２


ここで、上記の（1, 3）セ
ルの実度数７５に対し
て、これを一般的に表
すと第１行第３列なの
で、f13 と書くと、
右表の実度数 f13 に対
する期待度数 g13 はど
う書けるか？
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
期待度数の計算例２（続き）

右表の実度数 f13 に対
する期待度数 g13 は、
f1  f3
g13 
,
N
と計算される。
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
r×s 分割表の場合のカイ二乗統計量
テキスト p.31 の表 7.1
の分割表は、r 行 s 列
分割表の場合のデータ
を示す。
 行や列それぞれの合
計 f1•, f2•, …, fr•, 及び
f•1, f•2, …, f•s は、す
べて周辺度数と呼ばれ
る。

B1 B2 … Bs 計
A1 f11
f12 … f1s f1•
A2 f21 f22 … f2s f2•
:
:
:
:
:
:
Ar fr1
fr2 … frs
fr•
計 f•1
f•2 … f•s
N
r×s 分割表の第 i 行第 j 列の実度数
fij に対する期待度数の計算方法

上記期待度数は、テキスト p.33 の (7.2) 式に
あるように、
第 i 行の合計
fi f j
gij 
N
総合計
第 j 列の合計
セルカイ二乗の定義とその意味

つぎに、上記第 i 行第 j 列の実度数 fij と、
それに対する期待度数 gij を用いたセルカ
イ二乗は、テキスト p.33 の (7.3) 式で定義
される：
hij  ( fij  gij ) / gij .
2
カイ二乗統計量と
セルカイ二乗との関係（１）

テキスト p.33 の (7.1) 式で表される r×s 分割
表の場合のカイ二乗統計量は、上記セルカイ二
乗を、すべてのセルについて計算し、足し合わ
せたものである。すなわち、
r
s
 2   ( fij  gij )2 / gij ,
i 1 j 1
 ( f11  g11) / g11  ( f12  g12) / g12  
2
2
 ( fij  gij )2 / gij   ( f rs  grs )2 / grs .
カイ二乗統計量と
セルカイ二乗との関係（２）

あるいは、(7.3) 式のセルカイ二乗 hij を用いれ
ば、つぎのようにも表せる：
 2  ( f11  g11)2 / g11  ( f12  g12)2 / g12  
 ( fij  gij )2 / gij   ( f rs  grs )2 / grs ,
 h11  h12  
 hij   hrs .
セルカイ二乗の役割（１）
すなわち、セルカイ二乗値は、テキスト p.33
の中ほどに書いたように、
 全体的なカイ二乗に対する各セルの寄与の程
度を表している。
 一方、分割表のカイ二乗検定で我々が検討す
べき帰無仮説は、
「２つの属性（定性的変数）間に関連がない」
というものである。

セルカイ二乗の役割（２）

そこで、テキスト p.33 中ほどにあるように、
帰無仮説が棄却された場合には、上の期待
度数とこの量（セルカイ二乗） hij を同時に出
力できていれば、２つの属性 A, B のどこに、
とりわけ大きな独立性（関連無し）からのずれ
が、どの方向にあるのかを検討できる。
2×2 分割表の場合の検定
これまでは、一般の r×s 分割表のカイ二乗
検定について述べてきたが、ここからは、そ
の特別な場合としての 2×2 分割表のカイ二
乗検定の方法を述べる。
 この場合には、一般の場合に定義されたテキ
スト p.33 の (7.1) 式のカイ二乗統計量は非
常に簡単になる。

2×2 分割表の一般形


まず、 2×2 分割表
の一般形を示すと、
右の表のような、テ
キスト p.31 表7.2
の形のものになる。
ここで、セル内の度
数は、fij のような形
でなく、簡単に a, b,
c, d と書くとする。
A/B
B1
B2
計
A1
a
b
a+b
A2
c
d
c+d
a+c
b+d
N
計
2×2 分割表の場合の
カイ二乗統計量の形

2×2 分割表の場合、(7.1) 式で定義される
カイ二乗統計量は、より簡単な形に書くこと
ができる。これが、テキスト p.33 の (7.4) 式
の統計量である：
N (ad  bc)
 
.
(a  c)(b  d )(a  b)(c  d )
2
2
2×2 分割表の具体例
 例えば、右の表
のような分割表
では、
A/B
A1
B1
13
B2
7
計
20
A2
計
12
25
18
25
30
50
50 (1318  7 12)
 
.
25 25 20 30
2
2
イエーツの修正（１）
ただし、いずれか１つのセルにでも、期待度
数５以下のセルがある場合には、テキスト
p.33 の (7.4) 式のすぐ下に書いたように、う
えのカイ二乗統計量を修正する必要がある。
 この修正は、イエーツの修正と呼ばれ、つぎ
のようにカイ二乗統計量を修正するものであ
る（テキスト、p.33 下参照）。すなわち、

イエーツの修正（２）
（１）ad-bc > N/2 の時、(7.4) 式の分子の
ad-bc を ad-bc-(N/2) と修正する。
 （２）-N/2 ≤ ad-bc ≤ N/2 の時、(7.4) 式の右
辺をゼロ、すなわち χ2 = 0.0 とする。
 （３）ad-bc < -N/2 の時、(7.4) 式の分子の
ad-bc を ad-bc+(N/2) と修正する。

イエーツの修正の具体例（１-1）

例えば、右の表の
ような分割表では、
まずカイ二乗統計
量計算の前に、各
セルの期待度数
を計算する必要
がある。
A/B
B1
計
B2
A1
3
6
9
A2
6
5
11
計
9
11
20
イエーツの修正の具体例（１-2）

例えば、右の表のような
分割表では、まずカイ二
乗統計量計算の前に、
各セルの期待度数を計
算する必要がある。例え
ば、(１，２) セルの実度
数６に対して、期待度
数は、
9 11
g12 
 4.95
20
A/B
B1
計
B2
A1
3
6
9
A2
6
5
11
計
9
11
20
イエーツの修正の具体例（１-3）

このようにして、カ
イ二乗統計量計算
の前に、この表の
各セルの期待度数
をすべて計算する
と、右の赤印の数
値となる。
A/B
B1
A1
3
6
4.05 4.95
6
5
4.95 6.05
9
11
A2
計
B2
計
9
11
20
イエーツの修正の具体例（２）


これらより、セル内の期待度数が５以下のセルが１
つ以上存在することがわかる。
さらに、イエーツの修正の条件を検討するために、
ad-bc の値を計算すると、
ad  bc  3 5  6  6　 21.
すなわち、－Ｎ／２ (＝－２０／２) ＝－１０より
も小さい。
イエーツの修正の具体例（３）

これは修正の条件の３．にあたり、我々は
(7.4) 式の分子の ad-bc を ad-bc+(N/2)
と修正する必要があると言える。すなわち、
ad  bc  ( N / 2)
 3 5  6  6  (20 / 2),
 21 10  11.
イエーツの修正の具体例（４）

そこで、最後に、このケースにおける修正
後のカイ二乗統計量を計算すると、
N  ad  bc  ( N / 2)
 
,
(a  c)(b  d )(a  b)(c  d )
2
2
20 11

 0.2469.
9 11 9 11
2
岩原テキストの表の見方

このようにカイ二乗値を計算したら、われわ
れはこの検定のカイ二乗値の棄却点の値を
、岩原のテキスト、p.432-433 とりわけ p.433
の自由度１に対する５％棄却点の値を読み
取り、上で計算したカイ二乗値が棄却点の値
以上ならば帰無仮説を棄却する。さもなけれ
ば、採択する。
検定の結論
標本でのカイ二乗値が棄却点の値以上なら
ば、帰無仮説を棄却するが、そのことは、
２つの属性間には有意な関連があることを
意味する。
 もし、カイ二乗値が棄却点の値未満ならば、
帰無仮説を採択するが、そのことは、
２つの属性間には有意な関連がないことを
意味する。

演習時の、データの作成方法
演習では、岩原テキスト pp.445-446 の乱数
表から、学籍番号に対応する各ページの先
頭から順に、
（p.445 の数値、p.446 の数値）
として２０対取り出し、
 それぞれの対の２つの数値を、すべて
（１）数値が５０未満なら１に、
（２）数値が５０以上なら２に
変換せよ。

演習時の検定手順（１）
 このようにして得られた２０対のデータを
もとに、２×２分割表を作成し、２０対の
データが当該分割表の４つのセルのど
こに該当するかをカウントし、最終的な
分割表を作成する（講義テキスト、p.33
参照のこと）。
演習時の検定手順（２）
 作成が完了したら、まず４つのセルそれ
ぞれの期待度数を計算する。
 期待度数を見て、５以下のものが１つで
もあれば、イエーツの修正によるカイ二
乗統計量を、そうでなければ通常のカイ
二乗統計量を計算し、検定する。
WEB 用のデータは？

WEB 宿題では、入力データは分割表の各セ
ルのデータではなく、うえのようにして変換さ
れた２０対のデータである：
（１、１）、（２、２）、（１、２）、… 、（１、２）
２０対の架空データ
架空データの仮の解釈
このようにして得られた各対のデータは、仮に各被
験者の２つの属性、
１．性別（1.男子、2.女子）
２．向性（1.外交的、2.内向的）、
から成るとしよう。つまり、データは、
（性別、向性）
 この時、分析の目的は、性別と向性の間に統計的
に有意な関連があるかを調べることである。


f 2

Transcript f 2

Directory