R での連関測度の計算方法

Download Report

Transcript R での連関測度の計算方法

R での連関測度の計算方法
寺尾 敦
青山学院大学社会情報学部
[email protected]
• 講義で使用しているテキスト(ボーンシュテッ
ト & ノーキ)で学習した分割表の連関測度を,
R で計算するには?
名義尺度での連関係数
• 最適予測係数(Guttman’s lambda)
– 分割表に対して電卓を使うように計算を実行する
か,自分で関数を定義する(それほどむずかしく
ない).
順序尺度での連関測度
• グッドマン=クラスカルの γ
– 分割表に対して,青木繁伸先生のウェブにある,
グッドマン・クラスカルのガンマを計算する関数を
利用する.
• ケンドールの順位相関係数 τb
– 分割表に対して,青木繁伸先生のウェブにある,
ケンドールのτb を計算する関数を利用する.
– 個票データ(講義テキスト9.3参照)の場合には,
cor 関数を使って method = “kendall” オプションを
つける(テキストp.127).
実習
• ボーンシュテット & ノーキの表9.2を行列とし
て入力し,グッドマン=クラスカルの γ とケン
ドールの順位相関係数 をそれぞれ計算す
る.青木先生が用意した関数 gamma2, tau.b
を使う.
– round 関数を使って適当なところでまるめてよい
– テキストではそれぞれ 0.349 と 0.233 である.実
習で得られた数値は符号が異なる.なぜか?
表9.2と操作仮説
性差別禁
止の支持
強く支持
やや支持
やや反対
強く反対
性役割態度:「女性は家を守るべき」という
意見に
強く賛成 賛成
反対
強く反対
34
91
104
39
89
281
200
27
33
116
41
9
49
55
11
2
H1:女性は家にいて家事をすべきだという意見に反対
する人ほど,性差別禁止の法可決をより強く支持する.
順序尺度での連関測度
• スチュアートの順位相関係数 τc
• ソマーズの係数 dyx
– 分割表に対して電卓を使うように計算を実行する
か,自分で関数を定義する(それほどむずかしく
ない).
順位データの連関測度
• スピアマンの順位相関係数 ρs
– 個票データに対して,cor 関数を使って method =
“spearman” オプションをつける(テキストp.127).
– もともと順位が記録されている個票データなら
ば,そのままピアソンの相関係数を計算すればよ
い.オプションをつける必要はない.
実習
• テキスト第5章練習問題 (3) に取り組む.
2 * 2 表での連関測度
• ユールの連関係数 Q
– 分割表から対角要素の積を計算して(テキストp.216217),その和(分母)と差(分子)を使う.
– 青木繁伸先生のウェブにある,グッドマン・クラスカル
のガンマを計算する関数を利用する.
• ファイ係数
– 方法1:個票データで2値のコード化(テキストp.67,
p.233)をして,cor 関数を使う.
– 方法2:分割表に対して,パッケージ vcd のassocstats
関数を用いる.ピアソンの一致性係数 C とクラメルの
V も出力される.
2 * 2 表での連関指数計算方法
• オッズ・条件つきオッズ
– 分割表から必要な要素を抜き出して計算する(テ
キストp.216-217)
• オッズ比
– 分割表に対して,パッケージ vcd のoddsratio 関
数を用いる.log=FALSE オプションをつける.
参考:藤井良宜『カテゴリカルデータ解析』(共立出版)第
4章
– Fisher の直接確率法(関数は fisher.test)では,オッズ比
が出力される.
実習
• ボーンシュテット & ノーキ『社会統計学』第9
章問題の15に取り組む.Q,ファイ,オッズ比を
計算.人口動態と地域のクロス表(1960-70年
の63都市データ).
人口動態
減少・不変 増加
地域
西部
西部以外
計
4
30
34
計
10
19
29
14
49
63