R での連関測度の計算方法

Download Report

Transcript R での連関測度の計算方法

R での連関測度の計算方法
寺尾 敦
青山学院大学社会情報学部
[email protected]
• 講義で使用しているテキスト(ボーンシュテッ
ト & ノーキ)で学習した分割表の連関測度を,
R で計算するには?
名義尺度での連関係数
• 最適予測係数(Guttman’s lambda)
– rapportパッケージをインストールし,lambda.test
関数を使う.
表9.1 信仰する宗教と校内礼拝の否認判決に対する意見のクロス表
宗教
合計
判決に
プロテスタント
カトリック
その他
賛成
338 (36.1%)
178 (42.1%)
114 (63.3%)
630 (41.1%)
反対
598 (63.9%)
245 (57.9%)
58 (33.7%)
901 (58.9%)
合計
936 (100.0%)
423 (100.0%)
172 (100.0%)
1531 (100.0%)
ボーンシュテット & ノーキ『社会統計学』第9章
コード
table9_1 <- matrix(c(338,598,178,245,114,58),
nrow=2, ncol=3,
dimnames=list(判決 = c("賛成", "反対"),
宗教 = c("プロテスタント","カトリック", "その他")))
table9_1 # クロス集計表を出力
lambda.test(table9_1,0)
# Guttman's lambda (Goodman & Kruskal's lambda)
# 第2引数
#
0: 行変数と列変数の両方に対してラムダを計算
#
1: 行変数から列変数を予測する(行ごとに最頻値に注目)
#
2: 列変数から行変数を予測する(列ごとに最頻値に注目)
出力
> table9_1 # クロス集計表を出力
宗教
判決
プロテスタント カトリック その他
賛成
338
178
114
反対
598
245
58
>
> lambda.test(table9_1,0)
$row
[1] 0
$col
[1] 0.08888889
順序尺度での連関測度
• グッドマン=クラスカルの γ
– 分割表に対して,青木繁伸先生のウェブにある,
グッドマン・クラスカルのガンマを計算する関数を
利用する.
• ケンドールの順位相関係数 τb
– 分割表に対して,青木繁伸先生のウェブにある,
ケンドールのτb を計算する関数を利用する.
– 個票データ(講義テキスト9.3参照)の場合には,
cor 関数を使って method = “kendall” オプションを
つける(テキストp.127).
実習
• ボーンシュテット & ノーキの表9.2を行列とし
て入力し,グッドマン=クラスカルの γ とケン
ドールの順位相関係数 をそれぞれ計算する.
青木先生が用意した関数 gamma2, tau.b を
使う.
– round 関数を使って適当なところでまるめてよい
– テキストではそれぞれ 0.349 と 0.233 である.実
習で得られた数値は符号が異なる.なぜか?
表9.2と操作仮説
性差別禁
止の支持
強く支持
やや支持
やや反対
強く反対
性役割態度:「女性は家を守るべき」という
意見に
強く賛成 賛成
反対
強く反対
34
91
104
39
89
281
200
27
33
116
41
9
49
55
11
2
H1:女性は家にいて家事をすべきだという意見に反対
する人ほど,性差別禁止の法可決をより強く支持する.
順序尺度での連関測度
• スチュアートの順位相関係数 τc
• ソマーズの係数 dyx
– 分割表に対して電卓を使うように計算を実行する
か,自分で関数を定義する(それほどむずかしく
ない).
順位データの連関測度
• スピアマンの順位相関係数 ρs
– 個票データに対して,cor 関数を使って method =
“spearman” オプションをつける(テキストp.127).
– もともと順位が記録されている個票データなら
ば,そのままピアソンの相関係数を計算すればよ
い.オプションをつける必要はない.
実習
• テキスト第5章練習問題 (3) に取り組む.
2 * 2 表での連関測度
• ユールの連関係数 Q
– 分割表から対角要素の積を計算して(テキストp.216217),その和(分母)と差(分子)を使う.
– 青木繁伸先生のウェブにある,グッドマン・クラスカル
のガンマを計算する関数を利用する.
• ファイ係数
– 方法1:個票データで2値のコード化(テキストp.67,
p.233)をして,cor 関数を使う.
– 方法2:分割表に対して,パッケージ vcd のassocstats
関数を用いる.ピアソンの一致性係数 C とクラメルの
V も出力される.
2 * 2 表での連関指数計算方法
• オッズ・条件つきオッズ
– 分割表から必要な要素を抜き出して計算する(テ
キストp.216-217)
• オッズ比
– 分割表に対して,パッケージ vcd のoddsratio 関
数を用いる.log=FALSE オプションをつける.
参考:藤井良宜『カテゴリカルデータ解析』(共立出版)第
4章
– Fisher の直接確率法(関数は fisher.test)では,オッズ比
が出力される.
実習
• ボーンシュテット & ノーキ『社会統計学』第9
章問題の15に取り組む.Q,ファイ,オッズ比を
計算.人口動態と地域のクロス表(1960-70年
の63都市データ).
人口動態
減少・不変 増加
地域
西部
西部以外
計
4
30
34
計
10
19
29
14
49
63