比率・相関の検定と推定

Download Report

Transcript 比率・相関の検定と推定

「社会言語学」第11回
比率の検定と推定
1.1標本の比率の検定
H0:頻度に差がない、と言えるか?⇒χ2乗適合度検定
A
B
計
観測度数O
8
12
20
期待度数E
10
10
20
χ2乗適合度検定
χ2値
 
2

(O  E )2
E
自由度df
df=カテゴリ数-1
P値(上側確率)
P(χ2≧検定統計量)
=chidist(χ2, df)
z分布を用いた1標本の比率検定
A
(成功、支持など)
B
(失敗、不支持など)
計
8
12
20
H0: p = 0.5の検定
検定統計量 u=(8-20*0.5) / sqrt(20*0.5*(1-0.5))=-0.894
上側確率P P(z≧-0.894)=0.814
(注意:1-normsdist(-0.894))
検定統計量 u
上側確率P
-0.894
0.814
検定統計量 χ2
自由度
上側確率P
0.8
1
0.701
(「H0: p = 0.5」を棄却できない。)
u2は、自由度1のχ2乗分布に従う
2.1標本の比率の区間推定
20人を調査したところ、8人が内閣を支持している。
母集団での支持率はどれくらいか推定したい。
母比率の95%信頼区間を求めよ。
問: 40人を調査したところ、16人が内閣を支持している。
母集団での支持率はどれくらいか推定したい。
母比率の95%信頼区間を求めよ。
20人中8人が支持のときの95%信頼区間と比較しなさい。
(解)
p^=16/40=0.4
SE=sqrt( p^*(1-p^) / n )=sqrt(0.4*0.6/40)=0.077
下限値=p^-1.96*SE=0.4-1.96*0.077=0.248
上限値=p^+1.96*SE=0.4+1.96*0.077=0.552
95%信頼区間は(0.248, 0.552)
20人中8人の時の95%信頼区間は(0.185, 0.615)
3. 2標本の比率差の検定
検定の際の条件:
1.各セルの期待値が10以上
2.母集団は各標本数の10倍以上ある。
3. 2標本の比率差の検定
問: 男性社員の昇進率と女性社員の昇進率の間に有意な
差があるだろうか?
昇進
昇進しない
計
男
196 (0.06)
3,074
3,270
女
4 (0.10)
36
40
計
200(0.060)
3,110
3,310
3. 2標本の比率差の検定
集計データより、
P^1 (女性昇進率)= 0.10,
p^2 (男性昇進率)= 0.06,
Ppooled (全体昇進率)= 200 / 3310 = 0.060
検定量 u0 = ( p^1 – p^2 ) / sqrt( Ppooled * (1-Ppooled) *
(1/n1 + 1/n2 ) ) = 1.059
上側確率 P( u >1.059 ) = 1-normsdist(1.059)=0.145
したがって、P>0.05より、有意ではない。
(昇進率に有意な差はない。)
4.2標本の比率の差の推定
5.順位データの相関係数
スピアマンの順位相関係数ρ
もとのデータを順位に変換し、Xiの順位とYiの順位との
差Dとすると、
6 ΣD2
ρ= 1 ---------------N3 – N
(NはX, Yの対の数)
i
変数X
変数Y
1
2.8
0.6
1
2
-1
1
2
3.4
3.0
2
4
-2
4
3
3.6
0.4
3
1
2
4
4
5.8
1.5
4
3
1
1
5
7.0
15.0
5
7
-2
4
6
9.5
13.4
6
6
0
0
7
10.2
7.6
7
5
2
4
8
12.3
19.8
8
10
-2
4
9
13.2
18.3
9
8
1
1
10
13.4
18.9
10
9
1
1
0
24
合計
Xの順 Yの順 順位の差
位
位
D
順位の差
の2乗D^2
スピアマンの相関係数
Σd^2 は2変数の順の一致性を表す指標
順序が完全に一致⇒Σd^2=0
順序が逆順に完全に一致⇒Σd^2=(n^3-n)/3
6 ΣD^2
rs= 1 - ---------------N^3 – N
(NはXとYの対の数)
-1 ≦rs≦1 となる。
相関係数rsの有意性検定
仮説 H0:母相関係数ρ=0
H1:母相関係数ρ≠0
1. 標本の大きさ(データの組数)を n,標本相関係数を rs と
する。
2. 検定量
t0は自由度n-2のt分布に従う。
境界値 α=0.05の時、=tinv(0.025, df)で求める。
3.有意確率Pr(|t|≧t0)は、=tdist(t0, df, 1or2)で求める。
(※両側検定のとき2、片側検定のとき1を指定する)
最終課題
1人または2人で、
函館校学生を対象に小規模な社会調査を行い、
最終日2月_日( )の授業において、調査結果を
PPTにまとめて、プレゼン(口頭発表)する。
2月28日までに最終課題のレポートを、メールに
ファイル添付で提出する。(調査用紙、元の個票
データもいっしょに提出すること)
函教大プチ社会調査
1.ランダム抽出された函教大生を対象に、質問紙法などによっ
て、何らかの社会(意識、実態)調査を行う。
(標本サイズは30以上が望ましい)
2.個票データと集計データ(分割表など)を作成する。
3.調査結果を図表で要約する。(記述統計)
4.調査項目間の関係、差を統計的に分析する。(検定と推定)
5.調査に関して、PPTで発表資料を作成する。
6.資料に基づいて、プレゼンテーションを行う。
7.調査に関して、レポートを作成し、メール添付で提出する。
(目的、方法、結果、考察)
(例)函館校学生のボランティア活動に関する調査
目的(1)学年・性別とボランティア活動の間に関連あるか?
(2)活動時間と活動充実度の間に関連あるか?
調査項目
1.あなたについて
性別:男・女 学年:1・2・3・4 専攻:____専攻
GPA(小数点以下2ケタまで):_______
2.あなたは最近1年間でボランティア活動をしたことがあり
ますか? はい いいえ
3.ボランティア活動の日数(最近1年間)を合計すると、
1:0日 2. 2日以下 3.7日以下 4.8日以上
4.そのボランティア活動は有意義でしたか?
1.無意味 2.やや無意味 3.やや有意義 4.有意義
5.あなたは今後の1年間のうちに、何らかのボランティア活
動をするつもりがありますか? はい いいえ