Transcript カイ二乗検定
1
市場調査の手順
問題の設定
調査方法の決定
データ収集方法の決定
データ収集の実行
データ分析と解釈
1.
2.
3.
4.
5.
–
–
6.
データ入力
データ分析
報告書の作成
2
データ分析手法の分類
質的データ
量的データ
(名義、順序) (間隔、比例)
一変数の
集計
最頻値
(モード)
平均(ミーン)
分散
多変数間の 質×質 質×量
量×量
関連性
χ2検定 分散分析 回帰分析
マーケティング・リサーチ
データ分析手法2
χ2検定
3
4
質的データの例
回答者番号 性別
1
男性
2
男性
3
女性
…
99
女性
100
男性
購買
○
×
×
○
○
5
データの整理(二変数)
クロス集計表
性別
購買
男性
女性
計
○
56
4
60
×
24
16
40
計
80
20
100
6
関連が明らかな例
性別
購買
男性
女性
計
○
80
0
80
×
0
20
20
計
80
20
100
7
問題
性別と購買という二つの変数間に
関連性があるか?
8
「あした晴れるかどうか?」
「晴れる」かどうかを調べる代りに
「雨が降る」確率(降雨確率)を
(天気予報で)調べる
降雨確率が一定の基準(例えば
5%)以下かどうか?
9
降雨確率≦5%の時
「雨は降らない」(=晴れる)
と解釈する
「雨が降る」という帰無仮説が5%の有
意水準で棄却された
10
仮説検定(test)
「関連がある」事を直接証明せずに
「関連がない」という逆の仮説(帰無仮説)
が成立しないことを証明する
11
帰無仮説が成立しないことを証
明する方法
帰無仮説が成立する確率が、ある値
(有意確率)より小さければ良い
有意確率は一般には5%とする
「帰無仮説が成立する確率≦有意確率」
の場合
→帰無仮説は成立しない(棄却される)
→関連がある
12
「今日は晴れるかどうか」
の例
証明すべき命題
帰無仮説
「今日は晴れる」
「今日は雨が降る」
有意確率
5%
13
カイ二乗検定
質的データ同士の関連性を
検定するための方法
1.
帰無仮説に基づく値(期待値)
の計算
2.
カイ二乗値と自由度の計算
3.
帰無仮説が成立する確率の計算
14
期待値(expectation)
帰無仮説が成立する(正しい)と仮定
した場合の値
男性が全体の80%
購買した人が全体の60%
性別と購買に関連がなければ、
購買した男性は全体の48%(48人)
15
期待値の計算
性別
購買
男性
女性
計
○
48
12
60
×
32
8
40
計
80
20
100
16
カイ二乗値の計算
O : 実際の値、 E : 期待値
O1 E1
2
2
E1
O3 E3
E3
= 16.7
2
O2 E2
2
E2
O4 E4
E4
2
17
(O-E)2/E
性別
購買
男性
女性
○
1.3
5.3
×
2
8
18
自由度の計算
n 表頭の選択肢数 1
表側の選択肢数 1 1
19
χ2分布表(右上端)
a
n
0.050
0.025
確率
0.010
0.005
χ2値
自
1
由
度
3.841
5.024
6.635
7.879
2
5.991
7.378
9.210
10.60
20
χ2分布表の読み方
χ2値と自由度から、帰無仮説が成立する
確率を求める
χ2値 自由度
確率
7.38
2
2.5%
6.00
1
1~2.5%
16.7
1
0.5%以下
21
有意確率の計算と結論
「性別と購買には関連がない」という
帰無仮説のχ2値は16.7であり、成立
する確率は0.5%以下
帰無仮説は5%の有意水準で棄却さ
れる。
性別と購買には関連がある
22
参考図書
朝野煕彦 『いきなりわかる経営数学の基
礎』 講談社サイエンティフィク
朝野煕彦 『いきなりわかる多変量解析の
基礎』 講談社サイエンティフィク
大村 平 『多変量解析のはなし』 日科
技連
内田治 『すぐわかるEXCELによる統計解
析』 東京図書