男性のほうが女性に比べて人と違うファッションをし
Download
Report
Transcript 男性のほうが女性に比べて人と違うファッションをし
調査データ分析
analysis of survey data
第3回
香川大学経済学部
堀 啓造
1
帰無仮説(H0)
• 変わりない。
• (男女に)違いがない。同じだ。
• ->連関がない。
2
対立仮説(H1)
• 変わりがある。
• (男女に)違いがある。同じでない。
• ->連関がある。
• 5%水準(p<0.05) *
• 1%水準(p<0.01) **
• 0.1%水準(p<0.001) ***
3
自由度の考え方
• 統計学としてきわめて重要
4
2×3の表の場合
周辺度数は?
5割高以上5割未満高 それ以外
買物好き
136
28
34
買物嫌い
54
21
27
5
ある特定のセルが決まったとき
11
12
13
198
21
22
23
102
190 49 61 300
6
周辺度数が決まっていると
• 2×3の場合
• (2-1)×(3-1)=2
• 自由度=2
• 3×6の場合
• (3-1)×(6-1)=10
• 自由度=10
7
自由度が決まるとχ2値の分布が決
まる
• 次の分布図
8
山口和範『よくわかる統計解析の
基本と仕組み』秀和システム
9
5%水準の考え方
• 分布がわかると確率がわかる。χ2値からど
れくらいの確率で起こったことかわかるの
で稀な出来事ならH0を棄却する。
• 稀でないならH0を採択。
• 稀か稀でないかを5%基準で考える。これ
は統計学の慣習。絶対的な値の意味はな
いがまあ、そんなもんです。
10
11
岩原信九郎『教育と心理のための
推計学』文化科学社
12
13
岩原信九郎『教育と心理のための
推計学』文化科学社
14
2
χ 分布 (df= 6) 5%=12.5915774230691
0.15
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
確
率 0.1
密 0.05
度
0
2
χ値
15
以前のデータ
sex と 3(b )ファッションの個性 のクロス表
sex
男
女
合計
度数
sex の %
度数
sex の %
度数
sex の %
3(b)ファッションの個性
人と同じ 人と違う
68
40
63.0%
37.0%
64
29
68.8%
31.2%
132
69
65.7%
34.3%
合計
108
100.0%
93
100.0%
201
100.0%
16
帰無仮説を採択した場合
• 男女とファッションの個性において連関が
ない(χ2(1)=0.76, p>0.05)。
• 書き方に注意。検定方法,自由度,χ2値,
「p値または有意水準(5%水準)」を明かに
する。
• 5%水準で連関がない。
17
対立仮説を採択した場合
• 男女とファッションの個性において有意な
連関がある(χ2(1)=5.76, p<0.05)。すなわ
ち,男性のほうが女性に比べて人と違う
ファッションをしている。
• どのようになっているかはっきり記す。
• 5%水準で有意な連関がある。
18
4月23日課題:χ2検定を正しく
記せ(4月28日締め切り)
• 買物の好き嫌いと最もドキドキする買物の価格(博報
堂生活総合研究所「4つの価格」2002)
好き
嫌い
計
百万円単
わからな
位以上 それ以下 い
計
94
72
32 198
38
36
28 102
132
108
60 300
19
2×3の表の場合
もっともバカな買物と思うのは?
博報堂生活総合研究所調査「4つの価格」(2002)
5割高以上5割未満高それ以外
買物好き
136
28
34
買物嫌い
54
21
27
20
%を入れる
買物が好きか と 価格 のクロス表
買物が 好き
好きか
嫌い
合計
5割高以上
136
68.7%
54
52.9%
190
63.3%
価格
5割未満高
28
14.1%
21
20.6%
49
16.3%
その他
34
17.2%
27
26.5%
61
20.3%
合計
198
100.0%
102
100.0%
300
100.0%
21
期待値の計算
買物が好きか と 価格 のクロス表
買物が 好き
好きか
嫌い
合計
5割高以上
136
125.4
54
64.6
190
190.0
価格
5割未満高
28
32.3
21
16.7
49
49.0
その他
34
40.3
27
20.7
61
61.0
合計
198
198.0
102
102.0
300
300.0
22
χ2検定
カイ2乗検定
漸近有意確
率 (両側)
.027
.028
.011
値
自由度
Pearson のカイ2乗
7.211a
2
尤度比
7.121
2
線型と線型による連関
6.457
1
有効なケースの数
300
a. 0 セル (.0%) は期待度数が 5 未満です。最小期待度数は
16.66 です。
23
調整済み残差
(絶対値が2.0より大きいか?)
買物が好きか と 価格 のクロス表
5割高以上
買物が 好き 度数
136
好きか
調整済み残差
2.7
嫌い 度数
54
調整済み残差
-2.7
合計
度数
190
価格
5割未満高 その他
28
34
-1.4
-1.9
21
27
1.4
1.9
49
61
合計
198
102
300
24
調整済み残差と%
買物が好きか と 価格 のクロス表
買物が 好き
好きか
嫌い
合計
5割高以上
136
68.7%
2.7
54
52.9%
-2.7
190
63.3%
価格
5割未満高
28
14.1%
-1.4
21
20.6%
1.4
49
16.3%
その他
34
17.2%
-1.9
27
26.5%
1.9
61
20.3%
合計
198
100.0%
102
100.0%
300
100.0%
25
調整済み残差の計算
(覚えなくていい)
• (観測度数ー期待度数)/sqrt(期待度
数)/sqrt((1-ヨコの周辺度数/総度
数)・(1-タテの周辺度数/総度数))
• (セル11)2.680908
• (セル12)-1.43088
• (セル13)-1.89566
• 正規分布しているものとしてズレをチェック。
• p=0.05 -> 1.96=2.0, p=0.01 -> 2.57 =2.6
26
調整済み残差の利用
• χ2検定において有意な連関があった場合,
どのセルにおいて違いがあると言えるのか
を明らかにする。
• ただし,厳密な検定には他の方法を使う。
• SPSSにおいて出力され簡単に利用できる
のでこれを使う。これを使わない場合より
は精度が高い。
27
残差を含めた結果の記述
• 買物の好き嫌いとバカな買物と思う価格に
は有意な連関がある(χ2(2)=7.211, p<0.05)。
残差分析を行った結果,買物好きは買物
嫌いに比べ5割高以上の価格をバカな買
物と考える率が高い。
• (考察のところで,これは仮説に反する(と
一致する)ものである。などの考察を加え
る)。
28
「わからない」と「価格をいった」
群の2群に分けるとどういう結果
になるか
買物好きか と ドキドキする買物価格 のクロス表
買物
好き
か
合計
好き
嫌い
ドキドキする買物価格
価格あり わからない
166
32
83.8%
16.2%
74
28
72.5%
27.5%
240
60
80.0%
20.0%
合計
198
100.0%
102
100.0%
300
100.0%
29
調査と実験
• 実験は独立変数をコントロールする。
• 朝 コーヒーを飲ませる
• 朝 コーヒーを飲ませない
• 調査
• 朝 コーヒーを飲んだ人
• 朝 コーヒーを飲まなかった人
• 調査ではほかの要因が紛れていることが普通。
Ex 朝食を食べる、食べない
• 実験ではほかの要因が紛れることをなるべく少
なくする。
30