SEM(構造方程式モデル)説明スライド

Download Report

Transcript SEM(構造方程式モデル)説明スライド

構造方程式モデリング入門
立教大学経営学部
山口和範
[email protected]
山口和範(自己紹介)





立教大学社会学部産業関係学科 教授
2006年4月 経営学部 へ
1996-1997にUCLA(Bentler教授の下)で訪問研究員
E-mail : [email protected]
九州大学大学院総合理工学研究科
情報システム学専攻で統計学と情報学を学ぶ
専門




頑健な推測、欠測値処理、EMアルゴリズム、MCMC
因子分析や潜在クラス分析モデルなどの潜在変数モデル
統計教育
著書
「The EM Algorithm and Related Statistical Models」(Dekker)
「EMアルゴリズムと不完全データの諸問題」(多賀出版)
「データ分析のための統計入門」(共立出版)
「よくわかる統計解析の基本と仕組み」(秀和システム)
「よくわかる多変量解析の基本と仕組み」(秀和システム)
今回セミナーの内容

初日:構造方程式モデリング(SEM)の基礎




回帰分析・主成分分析の復習
潜在変数を導入すること
因子分析+回帰分析=?
2日目:実践!構造方程式モデリング


モデルの評価や修正
事例:検証的因子分析など
初日の内容


SEMの歴史
SEM入門






1つの散布図から考えること
相関と因果
回帰モデルとは
因果モデルを考えること:潜在変数の導入
因子分析との関係
パス図について
SEM関連の歴史







1906 スピアマンによる因子分析
1966
1969
1978
1980
1984
1986
Bock & Bargmann:共分散構造
Jöreskog :検証的因子分析
LISREL model
ソフトウェアへの発展
Bentler-Weeks model
LISREL, EQS, AMOS
RAM model
COSAN model
SEMの目的
大阪大学 狩野氏コメントより
直接観測できない潜在変数を導入し,潜在変数と観測
変数との間の因果関係を同定することにより社会現象
や自然現象を理解するための統計的アプローチ.
研究者が想定した因果に関する仮説を
モデル化する.以下の情報が得られる
(i) モデル(仮説)の妥当性の検討
(ii) 因果の大きさ・強さの推定・検定
(iii) モデル(仮説)修正へのsuggestion
ある散布図から
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
モデル化すると…
回帰モデル
本塁打 = a + b ×三振
解釈は
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
相関モデル
本塁打
三振
解釈は、…
(背反な事象では)
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
多変量解析

複数の変数を同時に分析する手法の総称

目的変数がある場合の分析



線形回帰分析、
判別分析、ロジスティック回帰分析…
目的変数がない場合の分析


主成分分析、因子分析、対応分析、…
クラスター分析、多次元尺度構成法
目的変数のある分析

予測・判別


未知の結果について、利用できる情報を使っ
て、知ろうとすること
要因分析

因果についての考察を行うこと
目的変数のない分析

観測対象の分類


多変量の情報を使って、似ている対象を見つける
構造の探索(変数の分類)

現象の背景にある構造を探索する

潜在構造の探索において、因果の特定が必要では?
目的変数

「予測」をしたい変数 「従属変数」ともいう

「結果」としてとらえる変数

要因から影響されている変数
「目的変数」に影響を与える変数を
「説明変数」とか「独立変数」とよぶ
回帰分析




目的変数と独立変数間の関係式を求める
目的変数の予測
独立変数の影響の大きさを評価
….
データ形式
Y
X1
...
Xp
1
y1
x11
xp1
2
y2
x21
xp2
yN
x2N
xpN
...
N
目的変数
説明変数
回帰モデル
yi  f (x1i , x2i ,, xpi )  ei
線形回帰モデル
yi  0  1x1i  2 x2i   p xpi  ei
定
数
項
(偏)回帰係数
事例1:ホテルの価格

ホテルの価格について、決定要因を探る

回帰分析
パス図の作成

グラフィカルモデリングの利用


回帰分析における回帰係数を正しく解釈する
ためのヒントを得る
主成分分析



情報の集約
新しい尺度の構築
構造の探索
現在の変数を組み合わせて
新しい変数をつくる
主成分
データ形式
X1
X2
・・・
Xp
1
x11
x21
・・・
xp1
2
x12
x22
・・・
xp2
・・・
n
・・・
x1n
x2n
・・・
xpn
主成分
線形結合
z  a1x1  a2 x2 a p x p
主成分分析
変数1
変数2
変数3
変数4
主成分
事例2:テストのスコア

主成分分析による探索

2つの主成分とその解釈

因子分析のための準備
因子分析(Factor Analysis)
変数1
変数2
変数3
変数4
因子
因子分析(Factor Analysis)
英語
国語
算数
理科
学力
因子・潜在変数

直接観測・測定ができない
構成概念
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
長打力
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
長打力
走 力
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
盗
塁
長打力
走 力
因子分析モデル
X1  a11F1  a12F2   a1q Fq  e1
X 2  a21F1  a22F2    a2q Fq  e2

X p  a p1F1  a p 2 F2    a pqFq  e p
p個の変数
q個の因子
因子分析モデル
変数1
変数2
・・・
変数p
p個の変数
因子1
・・・
因子q
q個の因子
因子と因子負荷量
共通因子: F1, F2 ,, Fq
(変数)
独自因子: e1, e2 ,, ep
(変数)
因子負荷量: a11, a12,, apq
(推定すべき係数)
因子に関する仮定
共通因子:分散は1、独自因子
とは無相関
互いに無相関の
場合も多い
独自因子:互いに無相関
分散の大きさは推定
する
因子分析モデルにおいて
推定すべきもの
因子負荷量
 独自因子の分散
 (因子間の相関)

パラメータの推定方法

最小2乗法


重み付き最小2乗法
最尤推定法

正規分布を仮定
因子数の決定


固有値の情報(主成分分析との関連)
モデルの適合度が十分であるかどうかか
ら判断


データの共分散行列にモデルからの共分散
行列が十分近くなっているか?
適合度検定
最小2乗法


データから共分散行列を推定
因子分析モデルの下での理論上の
共分散行列
この2つの行列ができるだけ等しくなるように
因子負荷量などを決める
最小2乗法の原理
(共分散構造の利用)
 s11

 s21


 s p1

s12
s22

s p2




s1 p   11 12
 
s2 p    21  22




 
 


s pp   p1  p2




1 p 

2p 




 pp 
最小2乗法の原理
p
p
 w (s
i 1 j 1
ij
ij
  ij )
2
重みは s の分散を考慮して
決める
事例3:テストのスコア

探索的因子分析

1因子モデルと2因子モデルの比較

2因子モデルの妥当性を確認
相関モデル
本塁打
三振
解釈は、…
(背反な事象では)
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
相関モデル
三振
45
35
25
本塁打
本塁打
15
5
-5
20
40
60
80
100
三振
120
140
160
潜在変数間の関係のモデル化

観測変数ではなく概念同士の関係をモデル化した
い

潜在変数も観測変数も同じ確率変数

潜在変数を含む回帰モデル(連立方程式モデル)

Bentler-Weeks Model
SEMの発展

共分散構造分析


LISREL


Joreskog(1970), Joreskog & Sorbom(1976)
EQS


Bock & Bargmann(1966) Psychometrika
Bentler & Weeks (1980) Psychometrika
…
共分散構造分析からSEMへ

共分散構造分析



線形モデルではあるが、共分散構造だけを推
定の際に利用
多群の平均の検定を分散分析ということと同
じ
平均構造も考慮したモデルの登場
パス図での約束事

観測変数は四角形

潜在変数は円または楕円

誤差変数は記号のみか(楕)円

因果は片方矢印

相関関係は双方矢印
パス図の例
測定モデル
構造モデル
事例4:
測定モデル+回帰モデルの例


流動的知性(Fluid Intelligence:思考能力)
のはなし
3つの測定モデル




推論能力(低学年):F1
図形識別能力(低学年):F2
図形識別能力(高学年):F3
3つの因子間での回帰分析を行いたい
F3=b0+b1F1+b2F2
or F3=b0+b2F2 etc.
事例4:
3つの測定モデルと構造モデル
1
IND1
1
IND1
F1
F2
FR11
FR21
1
FR12
FR22
F3
FR13
IND1
FR23
3つの潜在変数間で回帰モデルを考える
仮説2
仮説1
F1
F2
F3
F1
F2
F3
モデル構築

従属変数にはパスを設定



影響を与える変数と誤差変数
独立変数には分散・共分散(相関)を設定
出力の設定




潜在変数の尺度を定める
潜在変数の数だけ1とおくものがある
当該潜在変数から出るパス係数を一つ,1に固定
独立潜在変数は,分散=1としてもよい
相関の挿入時の注意事項



注意:
目的変数でない変数間には相関を想定
誤差変数間の相関は通常ゼロに設定
上記以外の設定を行う場合、何らかの根
拠が望まれる
目的変数間には相関をいれない。誤差変数間の相関はOK。
×
モデルの全体の評価



仮説に基づき構成したモデルがデータに
十分適合しているかどうかをチェック
適合度検定(χ2検定)
適合度指標


GFI, AGFI, CFI…
情報量規準、RMSEA
適合度指標について

GFI、AGFI


CFI


0.9以上が望ましいといわれているが、変数の数が増
えると大きくすることが難しい。
1に近いほどよいモデル。独立モデルとフルモデルの
間のどの位置の適合度であるかを示す
RMSEA

自由度1あたりのモデルの乖離度を表す指標で、小さ
いほどよい。0.05以下が望ましい。
事例5:検証的因子分析1

独立な2因子モデル

モデル構築

適合度の評価
モデルの改良のための道具

モデルの改良とは?


どこかのパスを削り、どこかにパスを追加する
こと
パス係数の検定


回帰係数の検定とほぼ同じ
LM検定(Lagrange Multiplier Test)

パスを追加すればよい場所を教えてくれる
出力の見方と
モデルの最終吟味



引いたパスの有意性(ワルド検定)
パスを引かなかったところの非有意性
(LM検定)
標準誤差(SE)の大きさが揃っていること
事例6:検証的因子分析2

モデルの改良

Wald検定
LM検定

適合度の評価

モデルの解釈と
因果の確認での注意点

経験


理論


原因となる変数は分析者により選択される
要請


因果律は不定であり識別ができない
動機


データのみで因果の確認は不可能
分析者の要請によって、結果変数も選択される
豊田(1998)「共分散構造分析[入門編]」浅倉書店 より
最近の発展

平均構造モデル
潜在成長曲線モデル
多グループモデル
階層型モデル
分布に関する前提条件の崩壊

すべて、StatWorksで実現可能




参考文献



豊田(1998,2000,2003)「共分散構造分析
[入門編],[応用編] ,[疑問編] 」浅倉書店
豊田(1998)「共分散構造分析 [事例編] 」
北大路書房
狩野, 三浦(2002)グラフィカル多変量解析