Transcript ppt file

1
SEMFAQ:
共分散構造分析に関する10の質問
三浦麻子×狩野裕
(大阪大学 大学院人間科学研究科)
配布資料
日本GD学会
第50回大会@京都
2
1.SEMによるパス解析は
“must”なのか?
 重回帰分析の繰り返しによるパス解析をした
論文を投稿したのですが,査読者から「SEMによ
るパス解析をやり直せ」と言われました
 なんとか実行はできたのですが,適合度が低く,と
てもじゃないですが論文に載せられたもんじゃあり
ません
 こんなとき,私はどうすればいいのでしょう?
論文取り下げ&もう一度データ取り直しなんでしょ
うか?
3
1.回答
 Yes. “must”である
 不適合の理由を特定し,モデルを改善する

モデルが不適切
直接効果の欠落
 未観測の剰余変数の存在
 層別を示唆(交互作用の存在)


偏相関が説明できていない

誤差共分散
4
誤差共分散の設定
 誤差間に共分散を設定する
5
2.標準化尺度のEFA・CFA
 質問紙調査の場合,既存の標準化された尺度を
使うことがよくあります
 このような場合にも,先行研究の構造が再現され
るかどうかを確認するために探索的因子分析をし
ていたのですが,なんだか変な気がします
 まず検証的因子分析をして構造を確認してから,
場合によっては探索的にやりなおす方がよいので
しょうか?
6
2.回答
 Yes and No
 Establishされている尺度については
EFA・CFAを行う必要はない



理屈上
日本でもestablishしているか
EFAやCFAによってサンプルの妥当性を
チェック
7
EFA versus CFA
 CFAでは より厳しいチェックが行われる

CFAをやるべきかどうかは,どこまで「厳しさ」を
要求するか,に依存
 尺度を吟味したあと


SEMへ移行するなら,CFAが必須
古典的方法を利用するなら,EFAでもよいので
はないか

合計得点を算出して分析するなど
8
しかし
 信頼性が不十分のとき

尺度分析の結果
 誤差の制御が必要

多重指標を利用したSEMで分析する必要
 尺度解析においてもCFAが必要に
9
3.適合度が悪いモデルは
「ダメダメ」なの?
 仮説モデルにしたがってSEMをすると,適合度が
いまいちよくありません.全然ダメなら捨てるので
すが,どうも微妙なラインなんです
 試行錯誤すると,どうやら仮説にやや合わないモ
デルの適合度が高いようです
 こんなとき,私はどちらのモデルを選べばよいの
でしょう? 本心を言えば,前者を選びたいのです
が…
10
3.回答
 気持ちはよくわかる
 仮説モデルの適合度を向上させるために
あらゆる手段を講じる
 このような事態はSEMに限ったことではない



e.g., 回帰分析で重要な変数の効果が非有意
統計解析における共通の悩み
それゆえ,分析は自動化できない
11
あらゆる手段

適合度を低めている部分の同定








モデルの部分評価
粗データの吟味
誤差相関
層別(交互作用)
未観測交絡変数
観測変数の選択
parceling
SEMの専門家に訊く
12
コメント
 適合度の小さいな違いは実質的な意味はない


適合度の良いモデルが複数個ある場合は,分析者の
責任において最終モデルを選択
ランダムな現象を扱うことの限界
 研究分野によって基準は異なる



各分野のコンセンサス
先行研究の適合度を参考にする
研究が積み重ねられている分野


More confirmatory nature.より厳しい基準
新しい研究分野

Less confirmatory nature.やや緩い基準
13
4.欠損値のあるデータの
処理方法
 いくつか欠損値が含まれたデータを用いてSEMを
やりたいと思っています
 欠損値の処理方法には場合によっていくつかある
ようですが,明らかに実施時に特殊な事情がある
場合以外はどうしたらいいのでしょう?
 また,欠損値の処理方法を論文に明記すべきで
しょうか? そこまで書いている論文を見たことが
(まだ)ありません
14
4.回答
 欠測が1割程度ならばLD
 相当数の欠測がある場合はFIMLを
用いる


欠測のプロセスに関してMARを仮定
MARの仮定が崩れていても,共分散構造分析
においては,そこそこ使える

経験則だが
 LD,FIMLは明示する必要あり
15
LDとFIML
 Listwise Deletion (LD)


一つでも欠測のあるobservationは,分析から外して
分析する
捨てられるデータがもったいない



統計的推測の精度が低くなる
欠測が多いと分析できないことがある
MCARである必要
 Full Information Maximum Likelihood (FIML)



観測されたデータにもとづく最尤法
AMOSなどSEMの代表的なプログラムで利用可
MARでよい
16
統計理論から
 Missing Completely At Random (MCAR)


どの値が欠測するかは完全にランダムである
LD, PDは,このときのみ使える
 Missing At Random (MAR)


どの値が欠測するかはデータに依存してもよいが,
欠測値には依存しない
FIMLの適用が薦められる
 Nonignorable Missing


どの値が欠測するかが欠測した値に依存する
欠測のメカニズムにモデリングが必要
17
5.調査データでの
「因果関係の同定」
 調査データの多くは,一時点で採取された認知
データであり,本来は因果関係は論ずることがで
きないことはよくわかっています
 しかし私たちはそれを知りつつも,SEMを使って因
果関係があるかのように議論を進めています
 こんなことをしていいのか?という根本的な疑問が
ふと頭をかすめることがあるのですが…
18
5.回答
 SEMは強力な因果推論の道具


交絡変数がないという前提
パス図が正しいという前提
 調査データにもとづく因果推論の限界

未観測交絡(剰余)変数の存在を否定できない
 因果の大きさ(因果関係のあるなし)


パス係数の推定と検定
第三変数のモデル化が容易
 因果の方向


適合度にもとづくモデル比較により,因果の方向を決定
当該モデルの適合と逆方向のモデルの不適合
19
実例
 「スマートさ」から「うつくしさ」への影響が強い
20
対応策
 十分な検討の下で,正確なパス図を作成

大幅なモデル探索はしない
 強い結論を主張しない

...という関係が示唆された
 縦断的データを取るデザインを考える
 調査データの分析は積み重ねることが大事
21
6.双方向因果モデル
(にわとりたまご)
 よくテキストで見るパスモデルは,因果の方
向が一定であることが多いようですが,双
方向の因果モデルというのはSEMでうまくモ
デリングできるのでしょうか? いわゆる鶏と
卵の関係のようなモデルです
22
6.回答
 YES
 縦断的データの場合

パス解析
 横断的データの場合

双方向因果モデル
 しかしながら

調査データにもとづく因果方向の決定は難しい
23
縦断的データの利用
 2時点でデータをとり,時間差を利用する

民主主義⇒経済発展 or 経済発展⇒民主主義
24
双方向因果モデル
25
政治的社会化モデル
出典:Asher(1976). Causal Modeling. Sage
26
7. 「不適解」地獄から
抜け出したい!!
 突然ですが,不適解に泣かされています
 データの打ち込みや読み込み,あるいはモ
デルの記述などつまらない原因はすべて探
りましたが,どれも問題ないようです
 こんなとき不適でない解を導き出す努力とし
て,私たちには一体何ができるのでしょう?
27
7.回答
 不適解とは(improper solutions)



誤差Eや撹乱項Dの分散が0または負の値に推定
相関の推定値が,絶対値1以下でない
基本的には,これらを最終解として報告してはな
らない
 原因を切り分けてから対応する
28
原因と対応
 不適解は何らかの不適切性を表す
1.
2.
3.
4.
単純ミスなど
モデルが不適切(model misspecification)
潜在変数モデル固有の問題
サンプル変動
1. この場合のみ,V(e)≧0などとして解を報告する
5. その他・不明
29
4. サンプル変動
 サンプル変動によって不運にも偶然
不適解となってしまった

残念!!
 不適解がサンプル変動によることが確定し
た場合は,V(e)=0 とおいた解を報告できる
場合がある
30
サンプル変動のための条件
 サンプル変動による不適解と判断できるためには




さらなるモデルの改良が考えられない
絶対値が大きすぎない.少しマイナス
V(e)±2SEが原点を含んでいる
測定モデルで不適解が生じた場合は,因子を合計得点で
置き換えてみて,推定値などが大きく変化しないことを確
かめる
 上記の条件が満たされていても,モデルが小さいと,
論文を出版するのは認められにくい
31
8.よりどりみどりすぎる
適合度指標
 AMOS(EQS,CALIS)を使っていますが,プログラ
ムを走らせると,大量の適合度指標が出てきます
 残念ながらすべての適合度指標を載せるだけの
紙幅は論文にありません
 私たちが主張したいことはこのモデルが正しいと
いうことに尽きるのですが,一体どの指標(たち)
を記述すれば必要かつ十分でしょうか?
32
8.回答
 適合度指標にはいくつかの側面がある

同じ性質を持つ指標を複数報告しない
 側面を代表する指標を報告する


カイ2乗値
GFI,CFI,RMSEA
 モデル局所評価も必要



適合度はモデルの全体的評価
パスの有意性
R^2の大きさ
33
使い方
 カイ2乗値

大標本のときは見ない
 GFI,CFI


一般に,0.90 or 0.95 以上を要求する
see Bentler & Bonnet (1980), Hu (1999)
 RMSEA



0.05以下⇒OK
0.10以上⇒不適
see Browne & Cudeck (1993)
34
Reference
 Hu, Li-tze and Bentler, P. M. (1999). Cutoff criteria for fit
indexes in covariance structure analysis: Conventional
criteria versus new alternatives. Structural Equation
Modeling, 6(1), 1-55.
 Bentler, P.M. & Bonnet, D.G. (1980). Significance tests
and goodness of fit in the analysis of covariance
structures. Psychological Bulletin, 107, 238-246
 Browne, M.W. & Cudeck, R. (1993) Alternative ways of
assessing model fit. In K.A. Bollen & J.S. Long [Eds.]
Testing Structural Equation Models. Beverley Hills, CA:
Sage, 132-162
35
9.適合度指標の
検定ってないの?
 私は今,SEMを使って書かれた論文の査読を依
頼されています
 あるモデルが「適合度が高い」とされているのです
が,その根拠として示されている適合度指標が本
当に高いのかどうかわかりません.論文によって
基準とする値にもばらつきがあるように思えてなり
ません
 適合度指標が本当に高いことを示せる検定など
はないのですか?
36
9.回答
 カイ2乗値による検定がそれにあたる
 歴史的には

カイ2乗検定の限界が指摘され,その代替と
して適合度指標が提案されてきた
37
RMSEA
 RMSEAは,点推定値だけでなく信頼上限と
下限を出力する(信頼率90%)
 信頼上限が0.10以下かどうかという判断
基準もよく用いられる
 以下の検定もできる


H0:RMSEA=0
(exact fit)
H0:RMSEA≦0.05 (close fit)
38
10.SEM論文の
「正しい」書き方
 さて,試行錯誤の艱難辛苦を乗り越えて,SEMを
おこなったモデリング結果を論文に書こうと思いま
す
 「すべてを丁寧に書く」のがベストなのは分かり
切っていますが,それだけの紙幅はありません
 論文を読む人のことを考えた場合にどのような情
報が必要かを,できれば優先順位つきで教えてく
ださい
39
10.回答
 必須項目


心理学・行動学の知見にもとづく初期(仮説)
モデルの記述
最終モデルの記述
適合度,パス係数の有意性
 読者がduplicateできるようにする


初期モデルと最終モデルとの違いを説明

モデルの変遷や経過を全て記述する必要はない
40
オプション
 直接効果なし

パスを引いても非有意
 因果の方向

対立モデルが適合しない
 男女差なし

多母集団同時分析
41
重要FAQ:詳細解説編
SEMによるパス解析が“must”な理
由
双方向因果モデルの構築
さまざまな適合度指標の特徴と適切
な使い方
42
FAQ1
SEMによるパス解析が“must”な理由
43
詳細:直接効果の欠落
 LM検定や適合度指標で改善のための
指針を得ることができる
44
未観測の剰余変数の存在
f1
f2
45
層別を示唆(交互作用の存在)
A+B:
適合度×
0.5
0.5
集団A:
適合度○
0.4
0.5
集団B:
適合度○
0.6
0.5
46
補足 交互作用と交絡_1
A+B:
適合度○
A+B:
適合度×
47
補足 交互作用と交絡_2
X21
X21
B
B r=0.4
r=0.6
0.4
A
r=0.4
X11
0.3
A
r=0.4
X11
48
誤差共分散_1
 誤差間に共分散を設定する
49
誤差共分散_解説
 パスの意味

直接効果を表現したもの
誤差共分散を置くことが多い
 偏相関が残ることが多いから


交絡要因として導入したもの
測定モデル
 誤差共分散なしが一般的

50
FAQ6
双方向因果モデル
(にわとりたまご)
51
相関係数から因果の方向は決まらない
---同値モデルの問題--相関構造
X
Y
X
1
r
Y
r
1
 データから区別できないモデルを同値モデルという
 「区別できない」とは適合度が同一であることをいう
52
因果の方向を決める:
操作変数法(Instrumental variable method)
相関構造
X
Y
Z
X
1
Y
b12
1
相関構造
Z
b13
0
1
X
Y
Z
X
1
Y
b21
1
Z
b13
b21b13
1
53
因果の方向を決める:適合度との関係
適合度が低い
適合度が高い
X→Y の因果関係が示唆される
54
双方向因果モデル
(非逐次モデル)
55
政治的社会化モデル
出典:Asher(1976). Causal Modeling. Sage
56
交絡変数はこわい
盛山(1986,行動計量
57
因果方向決定にも影響
X
Y
Z
X
1
Y
*
1
Z
*
0
1
誤ってY→Xと結論
してしまう
58
まとめ
 双方向の因果関係を同定するモデリングがある


縦断的データに対するパス解析
横断的データに対する非逐次モデル



“→”と“←”のモデルが同値にならないようなモデリング
推定可能なモデルを作成するには操作変数法が有効
欠点



交絡変数の影響を無視し得ない
操作変数となるための条件が満足されているか
成功例が少ない
 縦断的データに基づくモデリングの方が説得性が
高いと考えられている
59
FAQ8
さまざまな適合度指標の
意味と使い分け
60
詳細:考え方
 適合度評価の考え方


データの相関行列とモデルによる相関行列の食違いの
程度を評価...S-Σ^
多次元量を1次元に縮約するため多種多様な方法
 一般的なコンセンサスはない



開発者は自分が開発した指標を薦める
回帰分析におけるR2においても百家争鳴
査読者に求められたら,素直に報告する
 どの指標においても,そこそこの適合が得られて
いることが必要
61
いくつかの「側面」
 ベース


SとΣ^の食い違いを評価
cf. 回帰モデルの場合は,y-y^
 相対評価 vs 絶対評価


最小モデルを導入する
独立モデル,ゼロモデル
 自由度を考慮するか


けちの原理(parsimony)
自由度にくらべてどの程度の適合かをみる
62
好ましい性質
 nに依存しないことが望ましい
 自由度を考慮した方がよい?


自由度dが小さい(パラメータが多い)モデルは
適合が良いのはあたりまえ
しかし,回帰分析でもR2が活きている
 最小モデルの導入については両論ある


回帰分析では「一般平均のみ」の最小モデルを
導入している
指標が最小モデルの選択に依存する
63
比較
自由度による調整
なし
比
差
絶対評価 カイ
RMSEA F0, mk
2乗値
AIC
相対評価
B  O
GFI
AGFI
B  D
NFI
IFI
NNFI
RFI
CFI
64
補足:指標の定義
自由度による調整
なし

絶対評価
比
 nF
2
RMSEA 
差
F / d 1/ n
F 0  F  d / n, m k  e
1 / 2 ( F  d / n )
( AIC  nF  2 d )
B  O
GFI 
B  D
NFI 
IFI 
BO  F
BO
BD  F
AGFI 
NNFI 
BD
BD  F
RFI 
BD  d / n
BO / d O  F / d
BD
BD / d D  1/ n
BD / d D  F / d
1

S  ˆ ˆ  ,
1
   ,
1
 log | Diag( S ) |  log | S |, tr  S  Dˆ ˆ
2 
BO 
1
2

1
tr S ˆ
 ,
2
CFI 
B D
 d D / n   F  d / n 
BD  d D / n
BD / d D
1
1
F  log | ˆ |  log | S |  tr[ ˆ ( S  ˆ )], tr
2
BD
BO / d O
/dD  F /d
d O  p ( p  1) / 2
2
2
d  p ( p  1) / 2  q
d D  p ( p  1) / 2  p  p ( p  1) / 2
65
カイ2乗検定について
 統計的検定にもとづく方法論


統計的モデル評価の基本
H0: モデルが正しい H1: モデルが正しくない
 専門家の意見

Do not rely only on the chi-square test
Bollen & Long (1993). Testing Structural Equation
Models. Sage: CA (page.8)
66
カイ2乗検定の問題点
 検定力がnに依存する


第二種の過誤を評価していない
第一種の過誤を問題とする通常の検定と逆
 統計モデルは厳密にはデータの発生機構を
表さない
 データ分布に関する基礎仮定が厳しい
 nが小さいときはカイ2乗近似が正しくなく,大きい
ときは殆ど確実にモデルを棄却する