資料 - 行動統計科学研究分野

Download Report

Transcript 資料 - 行動統計科学研究分野

探索的因子分析における変数選択 (4)
SEFA の問題点
大阪大学大学院 人間科学研究科
宮本 友介
Contents
• 探索的因子分析における変数選択
– 経験則による基準
– Stepwise 法 (SEFA)による基準
• SEFA と従来法との比較
– モンテカルロ実験
• SEFA に対する批判的見解
– Stepwise 法全般
– 従来法との食い違い
• 例: 他の変数との相関が 低い / 高い 変数
日本心理学会 第67回大会@東京大学 ワークショップ
2
探索的因子分析
• 研究者が考慮すべき点
–
–
–
–
–
研究の目的
因子抽出法
因子数
因子回転の基準
変数の選択
日本心理学会 第67回大会@東京大学 ワークショップ
3
変数の選択
• 変数の「量」と「質」
– 内容的妥当性
– 実行可能性
• 項目は少ない方がよい
– 信頼性
• 共通性(因子負荷量)
項目は多い方がよい
日本心理学会 第67回大会@東京大学 ワークショップ
4
変数の選択
(rule of thumb)
• 経験則による変数選択基準
– 因子負荷量の大きさに着目
たとえば…
• .3 を超えるものを解釈せよ (Fidell, 1983)
• .71 → 「すばらしい」   
.63 → 「とてもよい」  
.55 → 「よい」 
.45 → 「まぁまぁ」 
.32 → 「うーん」 
(Comrey, 1973)
日本心理学会 第67回大会@東京大学 ワークショップ
5
変数の選択
• SEFA の変数選択基準
– 信頼性 ⇒ 因子分析モデルの前提
– 共通性の低い変数を除外しても,
モデルの適合度は向上するとは限らない
– より客観的な基準
適合度指標の利用
日本心理学会 第67回大会@東京大学 ワークショップ
6
SEFAアルゴリズム
• 尤度比検定
T
ˆ
ˆ
ˆ
ˆ
Σ    

ˆ
log
Σ
 log S
LRT  n

有意 ⇒ 変数減少 (backward)
非有意 ⇒ 変数増加 (forward)
(モデルに適合する限り、指標は多いほどよ
い)
日本心理学会 第67回大会@東京大学 ワークショップ
7
SEFAアルゴリズム
• Backward
– 異常変数の同定
 s11
s
 21
s12   11


S p 1   21
 21


T
Λp 1 Λp 1  Ψ p 1 
適合度を評価
日本心理学会 第67回大会@東京大学 ワークショップ
8
SEFAアルゴリズム
• Forward
– 異常変数の同定
 s11 s12 
S p 1  

s
S
21
p

T
 Λp 1 Λp 1  Ψ p 1
適合度を評価
日本心理学会 第67回大会@東京大学 ワークショップ
9
SEFAアルゴリズム
• Kano & Harada (2000)
– 計算量節約のため、LRT を LM 検定で代用
– 各ステップでは、一度のパラメータ推定をお
こなうだけで変数を増減したときの適合度を
推定できる
日本心理学会 第67回大会@東京大学 ワークショップ
10
従来法との比較
• 従来法
– 因子負荷量,共通性に注目
• SEFA
– 適合度に注目
Hogarty, et al., 2001(submitted)
モンテカルロ実験で比較
日本心理学会 第67回大会@東京大学 ワークショップ
11
SEFA に対する批判的見解
• Stepwise 法 全般に対するもの
– 重回帰分析,判別分析 …
• 従来法との食い違い
– 他の変数との相関が低い変数
– 他の変数との相関が高い変数
日本心理学会 第67回大会@東京大学 ワークショップ
12
Stepwise 法に対する批判
• 第1種の過誤の確率が増大
– 自由度が不正確
• 各ステップがそれまでのステップに依存
– 特定の大きさで最良の組み合わせを同定できない
• 標本誤差に依存
– 再現性に乏しい
( Huberty, 1989; Snyder, 1991; Thompson, 1995)
日本心理学会 第67回大会@東京大学 ワークショップ
13
• SEFA は…
– モデルに適合しているという制約のもとで
できるだけ多くの項目を採用しようとする
– 検出力が低いとき、異常変数をモデルに
含めてしまう
• cf. 一般的なステップワイズ法
(重回帰分析,判別分析)
– 有意性が得られるとき、変数を追加する
– 検出力が低いと重要な変数を取りこぼす
日本心理学会 第67回大会@東京大学 ワークショップ
14
従来法との食い違い
• 他の変数との相関が低い変数
– 因子負荷量,共通性,信頼性が低い
– 従来法では,除外対象
– SEFA では除外されない
(モデルに適合しているかぎり)
– 対策:
共通性の検定 (SEFA2002)
日本心理学会 第67回大会@東京大学 ワークショップ
15
• ダブルスタンダード?
– 信頼性(共通性)は因子分析モデルの前提
があってこそ有効
– もちろん内容的妥当性を重視
適合度基準
共通性基準
内容的妥当性
日本心理学会 第67回大会@東京大学 ワークショップ
16
従来法との食い違い
• 他の変数との相関が高い変数
– 因子負荷量,共通性,信頼性が高い
– 従来法では,採用対象
– SEFA では除外対象になることがある
• 誤差相関がある?
相関が高すぎる項目にも要注意!
cf. ヒライ メソッド
日本心理学会 第67回大会@東京大学 ワークショップ
17
はじめにチェック
• Input Correlation Matrix
X1
X2
X3
X4
X5
X6
もう少し
X7
X8
X9
X10
X11
細かく指定できない
.
.
.
.
.
かなぁ…
X12
X1
1.000
.
.
.
.
.
X2
0.257
1.000
.
.
.
.
.
.
.
.
.
.
X3
0.214
0.219
1.000
.
.
.
.
.
.
.
.
.
X4
0.301
0.124
0.270
1.000
.
.
.
.
.
.
.
.
X5
0.076
0.157
0.234
0.124
1.000
.
.
.
.
.
.
.
X6
0.261
0.286
0.250
0.252
0.418
1.000
.
.
.
.
.
.
X7
0.024
0.173
0.117
0.164
0.243
0.324
1.000
.
.
.
.
.
X8
0.232
0.230
0.377
0.267
0.234
0.332
0.389
1.000
.
.
.
.
X9
0.186
0.235
0.238
0.147
0.100
0.154
0.233
0.247
1.000
.
.
.
X10
0.142
0.072
0.236
0.183
0.308
0.241
0.191
0.217
0.392
1.000
.
.
X11
0.230
0.256
0.265
0.237
0.076
0.151
0.174
0.267
0.413
0.260
1.000
.
X12
0.250
0.376
0.369
0.311
0.196
0.320
0.369
0.332
0.427
0.441
0.332
1.000
日本心理学会 第67回大会@東京大学 ワークショップ
.
18
まとめ
• SEFA はモデル適合度を重視
– 客観的指標
• 変数選択の基準
– 内容的妥当性
– モデル適合度
– 信頼性・共通性
経験則
(Rule of thumbs)
統計的検定
(客観的評価)
日本心理学会 第67回大会@東京大学 ワークショップ
19