Transcript 比率・相関の検定と推定
「社会言語学」第11回 比率の検定と推定 1.1標本の比率の検定 H0:頻度に差がない、と言えるか?⇒χ2乗適合度検定 A B 計 観測度数O 8 12 20 期待度数E 10 10 20 χ2乗適合度検定 χ2値 2 (O E )2 E 自由度df df=カテゴリ数-1 P値(上側確率) P(χ2≧検定統計量) =chidist(χ2, df) z分布を用いた1標本の比率検定 A (成功、支持など) B (失敗、不支持など) 計 8 12 20 H0: p = 0.5の検定 検定統計量 u=(8-20*0.5) / sqrt(20*0.5*(1-0.5))=-0.894 上側確率P P(z≧-0.894)=0.814 (注意:1-normsdist(-0.894)) 検定統計量 u 上側確率P -0.894 0.814 検定統計量 χ2 自由度 上側確率P 0.8 1 0.701 (「H0: p = 0.5」を棄却できない。) u2は、自由度1のχ2乗分布に従う 2.1標本の比率の区間推定 20人を調査したところ、8人が内閣を支持している。 母集団での支持率はどれくらいか推定したい。 母比率の95%信頼区間を求めよ。 問: 40人を調査したところ、16人が内閣を支持している。 母集団での支持率はどれくらいか推定したい。 母比率の95%信頼区間を求めよ。 20人中8人が支持のときの95%信頼区間と比較しなさい。 (解) p^=16/40=0.4 SE=sqrt( p^*(1-p^) / n )=sqrt(0.4*0.6/40)=0.077 下限値=p^-1.96*SE=0.4-1.96*0.077=0.248 上限値=p^+1.96*SE=0.4+1.96*0.077=0.552 95%信頼区間は(0.248, 0.552) 20人中8人の時の95%信頼区間は(0.185, 0.615) 3. 2標本の比率差の検定 検定の際の条件: 1.各セルの期待値が10以上 2.母集団は各標本数の10倍以上ある。 3. 2標本の比率差の検定 問: 男性社員の昇進率と女性社員の昇進率の間に有意な 差があるだろうか? 昇進 昇進しない 計 男 196 (0.06) 3,074 3,270 女 4 (0.10) 36 40 計 200(0.060) 3,110 3,310 3. 2標本の比率差の検定 集計データより、 P^1 (女性昇進率)= 0.10, p^2 (男性昇進率)= 0.06, Ppooled (全体昇進率)= 200 / 3310 = 0.060 検定量 u0 = ( p^1 – p^2 ) / sqrt( Ppooled * (1-Ppooled) * (1/n1 + 1/n2 ) ) = 1.059 上側確率 P( u >1.059 ) = 1-normsdist(1.059)=0.145 したがって、P>0.05より、有意ではない。 (昇進率に有意な差はない。) 4.2標本の比率の差の推定 5.順位データの相関係数 スピアマンの順位相関係数ρ もとのデータを順位に変換し、Xiの順位とYiの順位との 差Dとすると、 6 ΣD2 ρ= 1 ---------------N3 – N (NはX, Yの対の数) i 変数X 変数Y 1 2.8 0.6 1 2 -1 1 2 3.4 3.0 2 4 -2 4 3 3.6 0.4 3 1 2 4 4 5.8 1.5 4 3 1 1 5 7.0 15.0 5 7 -2 4 6 9.5 13.4 6 6 0 0 7 10.2 7.6 7 5 2 4 8 12.3 19.8 8 10 -2 4 9 13.2 18.3 9 8 1 1 10 13.4 18.9 10 9 1 1 0 24 合計 Xの順 Yの順 順位の差 位 位 D 順位の差 の2乗D^2 スピアマンの相関係数 Σd^2 は2変数の順の一致性を表す指標 順序が完全に一致⇒Σd^2=0 順序が逆順に完全に一致⇒Σd^2=(n^3-n)/3 6 ΣD^2 rs= 1 - ---------------N^3 – N (NはXとYの対の数) -1 ≦rs≦1 となる。 相関係数rsの有意性検定 仮説 H0:母相関係数ρ=0 H1:母相関係数ρ≠0 1. 標本の大きさ(データの組数)を n,標本相関係数を rs と する。 2. 検定量 t0は自由度n-2のt分布に従う。 境界値 α=0.05の時、=tinv(0.025, df)で求める。 3.有意確率Pr(|t|≧t0)は、=tdist(t0, df, 1or2)で求める。 (※両側検定のとき2、片側検定のとき1を指定する) 最終課題 1人または2人で、 函館校学生を対象に小規模な社会調査を行い、 最終日2月_日( )の授業において、調査結果を PPTにまとめて、プレゼン(口頭発表)する。 2月28日までに最終課題のレポートを、メールに ファイル添付で提出する。(調査用紙、元の個票 データもいっしょに提出すること) 函教大プチ社会調査 1.ランダム抽出された函教大生を対象に、質問紙法などによっ て、何らかの社会(意識、実態)調査を行う。 (標本サイズは30以上が望ましい) 2.個票データと集計データ(分割表など)を作成する。 3.調査結果を図表で要約する。(記述統計) 4.調査項目間の関係、差を統計的に分析する。(検定と推定) 5.調査に関して、PPTで発表資料を作成する。 6.資料に基づいて、プレゼンテーションを行う。 7.調査に関して、レポートを作成し、メール添付で提出する。 (目的、方法、結果、考察) (例)函館校学生のボランティア活動に関する調査 目的(1)学年・性別とボランティア活動の間に関連あるか? (2)活動時間と活動充実度の間に関連あるか? 調査項目 1.あなたについて 性別:男・女 学年:1・2・3・4 専攻:____専攻 GPA(小数点以下2ケタまで):_______ 2.あなたは最近1年間でボランティア活動をしたことがあり ますか? はい いいえ 3.ボランティア活動の日数(最近1年間)を合計すると、 1:0日 2. 2日以下 3.7日以下 4.8日以上 4.そのボランティア活動は有意義でしたか? 1.無意味 2.やや無意味 3.やや有意義 4.有意義 5.あなたは今後の1年間のうちに、何らかのボランティア活 動をするつもりがありますか? はい いいえ