SEM(構造方程式モデル)説明スライド
Download
Report
Transcript SEM(構造方程式モデル)説明スライド
構造方程式モデリング入門
立教大学経営学部
山口和範
[email protected]
山口和範(自己紹介)
立教大学社会学部産業関係学科 教授
2006年4月 経営学部 へ
1996-1997にUCLA(Bentler教授の下)で訪問研究員
E-mail : [email protected]
九州大学大学院総合理工学研究科
情報システム学専攻で統計学と情報学を学ぶ
専門
頑健な推測、欠測値処理、EMアルゴリズム、MCMC
因子分析や潜在クラス分析モデルなどの潜在変数モデル
統計教育
著書
「The EM Algorithm and Related Statistical Models」(Dekker)
「EMアルゴリズムと不完全データの諸問題」(多賀出版)
「データ分析のための統計入門」(共立出版)
「よくわかる統計解析の基本と仕組み」(秀和システム)
「よくわかる多変量解析の基本と仕組み」(秀和システム)
今回セミナーの内容
初日:構造方程式モデリング(SEM)の基礎
回帰分析・主成分分析の復習
潜在変数を導入すること
因子分析+回帰分析=?
2日目:実践!構造方程式モデリング
モデルの評価や修正
事例:検証的因子分析など
初日の内容
SEMの歴史
SEM入門
1つの散布図から考えること
相関と因果
回帰モデルとは
因果モデルを考えること:潜在変数の導入
因子分析との関係
パス図について
SEM関連の歴史
1906 スピアマンによる因子分析
1966
1969
1978
1980
1984
1986
Bock & Bargmann:共分散構造
Jöreskog :検証的因子分析
LISREL model
ソフトウェアへの発展
Bentler-Weeks model
LISREL, EQS, AMOS
RAM model
COSAN model
SEMの目的
大阪大学 狩野氏コメントより
直接観測できない潜在変数を導入し,潜在変数と観測
変数との間の因果関係を同定することにより社会現象
や自然現象を理解するための統計的アプローチ.
研究者が想定した因果に関する仮説を
モデル化する.以下の情報が得られる
(i) モデル(仮説)の妥当性の検討
(ii) 因果の大きさ・強さの推定・検定
(iii) モデル(仮説)修正へのsuggestion
ある散布図から
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
モデル化すると…
回帰モデル
本塁打 = a + b ×三振
解釈は
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
相関モデル
本塁打
三振
解釈は、…
(背反な事象では)
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
多変量解析
複数の変数を同時に分析する手法の総称
目的変数がある場合の分析
線形回帰分析、
判別分析、ロジスティック回帰分析…
目的変数がない場合の分析
主成分分析、因子分析、対応分析、…
クラスター分析、多次元尺度構成法
目的変数のある分析
予測・判別
未知の結果について、利用できる情報を使っ
て、知ろうとすること
要因分析
因果についての考察を行うこと
目的変数のない分析
観測対象の分類
多変量の情報を使って、似ている対象を見つける
構造の探索(変数の分類)
現象の背景にある構造を探索する
潜在構造の探索において、因果の特定が必要では?
目的変数
「予測」をしたい変数 「従属変数」ともいう
「結果」としてとらえる変数
要因から影響されている変数
「目的変数」に影響を与える変数を
「説明変数」とか「独立変数」とよぶ
回帰分析
目的変数と独立変数間の関係式を求める
目的変数の予測
独立変数の影響の大きさを評価
….
データ形式
Y
X1
...
Xp
1
y1
x11
xp1
2
y2
x21
xp2
yN
x2N
xpN
...
N
目的変数
説明変数
回帰モデル
yi f (x1i , x2i ,, xpi ) ei
線形回帰モデル
yi 0 1x1i 2 x2i p xpi ei
定
数
項
(偏)回帰係数
事例1:ホテルの価格
ホテルの価格について、決定要因を探る
回帰分析
パス図の作成
グラフィカルモデリングの利用
回帰分析における回帰係数を正しく解釈する
ためのヒントを得る
主成分分析
情報の集約
新しい尺度の構築
構造の探索
現在の変数を組み合わせて
新しい変数をつくる
主成分
データ形式
X1
X2
・・・
Xp
1
x11
x21
・・・
xp1
2
x12
x22
・・・
xp2
・・・
n
・・・
x1n
x2n
・・・
xpn
主成分
線形結合
z a1x1 a2 x2 a p x p
主成分分析
変数1
変数2
変数3
変数4
主成分
事例2:テストのスコア
主成分分析による探索
2つの主成分とその解釈
因子分析のための準備
因子分析(Factor Analysis)
変数1
変数2
変数3
変数4
因子
因子分析(Factor Analysis)
英語
国語
算数
理科
学力
因子・潜在変数
直接観測・測定ができない
構成概念
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
長打力
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
長打力
走 力
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
盗
塁
長打力
走 力
因子分析モデル
X1 a11F1 a12F2 a1q Fq e1
X 2 a21F1 a22F2 a2q Fq e2
X p a p1F1 a p 2 F2 a pqFq e p
p個の変数
q個の因子
因子分析モデル
変数1
変数2
・・・
変数p
p個の変数
因子1
・・・
因子q
q個の因子
因子と因子負荷量
共通因子: F1, F2 ,, Fq
(変数)
独自因子: e1, e2 ,, ep
(変数)
因子負荷量: a11, a12,, apq
(推定すべき係数)
因子に関する仮定
共通因子:分散は1、独自因子
とは無相関
互いに無相関の
場合も多い
独自因子:互いに無相関
分散の大きさは推定
する
因子分析モデルにおいて
推定すべきもの
因子負荷量
独自因子の分散
(因子間の相関)
パラメータの推定方法
最小2乗法
重み付き最小2乗法
最尤推定法
正規分布を仮定
因子数の決定
固有値の情報(主成分分析との関連)
モデルの適合度が十分であるかどうかか
ら判断
データの共分散行列にモデルからの共分散
行列が十分近くなっているか?
適合度検定
最小2乗法
データから共分散行列を推定
因子分析モデルの下での理論上の
共分散行列
この2つの行列ができるだけ等しくなるように
因子負荷量などを決める
最小2乗法の原理
(共分散構造の利用)
s11
s21
s p1
s12
s22
s p2
s1 p 11 12
s2 p 21 22
s pp p1 p2
1 p
2p
pp
最小2乗法の原理
p
p
w (s
i 1 j 1
ij
ij
ij )
2
重みは s の分散を考慮して
決める
事例3:テストのスコア
探索的因子分析
1因子モデルと2因子モデルの比較
2因子モデルの妥当性を確認
相関モデル
本塁打
三振
解釈は、…
(背反な事象では)
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
相関モデル
三振
45
35
25
本塁打
本塁打
15
5
-5
20
40
60
80
100
三振
120
140
160
潜在変数間の関係のモデル化
観測変数ではなく概念同士の関係をモデル化した
い
潜在変数も観測変数も同じ確率変数
潜在変数を含む回帰モデル(連立方程式モデル)
Bentler-Weeks Model
SEMの発展
共分散構造分析
LISREL
Joreskog(1970), Joreskog & Sorbom(1976)
EQS
Bock & Bargmann(1966) Psychometrika
Bentler & Weeks (1980) Psychometrika
…
共分散構造分析からSEMへ
共分散構造分析
線形モデルではあるが、共分散構造だけを推
定の際に利用
多群の平均の検定を分散分析ということと同
じ
平均構造も考慮したモデルの登場
パス図での約束事
観測変数は四角形
潜在変数は円または楕円
誤差変数は記号のみか(楕)円
因果は片方矢印
相関関係は双方矢印
パス図の例
測定モデル
構造モデル
事例4:
測定モデル+回帰モデルの例
流動的知性(Fluid Intelligence:思考能力)
のはなし
3つの測定モデル
推論能力(低学年):F1
図形識別能力(低学年):F2
図形識別能力(高学年):F3
3つの因子間での回帰分析を行いたい
F3=b0+b1F1+b2F2
or F3=b0+b2F2 etc.
事例4:
3つの測定モデルと構造モデル
1
IND1
1
IND1
F1
F2
FR11
FR21
1
FR12
FR22
F3
FR13
IND1
FR23
3つの潜在変数間で回帰モデルを考える
仮説2
仮説1
F1
F2
F3
F1
F2
F3
モデル構築
従属変数にはパスを設定
影響を与える変数と誤差変数
独立変数には分散・共分散(相関)を設定
出力の設定
潜在変数の尺度を定める
潜在変数の数だけ1とおくものがある
当該潜在変数から出るパス係数を一つ,1に固定
独立潜在変数は,分散=1としてもよい
相関の挿入時の注意事項
注意:
目的変数でない変数間には相関を想定
誤差変数間の相関は通常ゼロに設定
上記以外の設定を行う場合、何らかの根
拠が望まれる
目的変数間には相関をいれない。誤差変数間の相関はOK。
×
モデルの全体の評価
仮説に基づき構成したモデルがデータに
十分適合しているかどうかをチェック
適合度検定(χ2検定)
適合度指標
GFI, AGFI, CFI…
情報量規準、RMSEA
適合度指標について
GFI、AGFI
CFI
0.9以上が望ましいといわれているが、変数の数が増
えると大きくすることが難しい。
1に近いほどよいモデル。独立モデルとフルモデルの
間のどの位置の適合度であるかを示す
RMSEA
自由度1あたりのモデルの乖離度を表す指標で、小さ
いほどよい。0.05以下が望ましい。
事例5:検証的因子分析1
独立な2因子モデル
モデル構築
適合度の評価
モデルの改良のための道具
モデルの改良とは?
どこかのパスを削り、どこかにパスを追加する
こと
パス係数の検定
回帰係数の検定とほぼ同じ
LM検定(Lagrange Multiplier Test)
パスを追加すればよい場所を教えてくれる
出力の見方と
モデルの最終吟味
引いたパスの有意性(ワルド検定)
パスを引かなかったところの非有意性
(LM検定)
標準誤差(SE)の大きさが揃っていること
事例6:検証的因子分析2
モデルの改良
Wald検定
LM検定
適合度の評価
モデルの解釈と
因果の確認での注意点
経験
理論
原因となる変数は分析者により選択される
要請
因果律は不定であり識別ができない
動機
データのみで因果の確認は不可能
分析者の要請によって、結果変数も選択される
豊田(1998)「共分散構造分析[入門編]」浅倉書店 より
最近の発展
平均構造モデル
潜在成長曲線モデル
多グループモデル
階層型モデル
分布に関する前提条件の崩壊
すべて、StatWorksで実現可能
参考文献
豊田(1998,2000,2003)「共分散構造分析
[入門編],[応用編] ,[疑問編] 」浅倉書店
豊田(1998)「共分散構造分析 [事例編] 」
北大路書房
狩野, 三浦(2002)グラフィカル多変量解析