SEM(構造方程式モデル)説明スライド

Transcript SEM(構造方程式モデル)説明スライド

構造方程式モデリング入門
立教大学経営学部
山口和範
[email protected]
山口和範(自己紹介）





立教大学社会学部産業関係学科教授
2006年4月経営学部へ
1996-1997にUCLA（Bentler教授の下）で訪問研究員
E-mail : [email protected]
九州大学大学院総合理工学研究科
情報システム学専攻で統計学と情報学を学ぶ
専門




頑健な推測、欠測値処理、EMアルゴリズム、MCMC
因子分析や潜在クラス分析モデルなどの潜在変数モデル
統計教育
著書
「The EM Algorithm and Related Statistical Models」(Dekker)
「EMアルゴリズムと不完全データの諸問題」（多賀出版）
「データ分析のための統計入門」（共立出版）
「よくわかる統計解析の基本と仕組み」（秀和システム）
「よくわかる多変量解析の基本と仕組み」（秀和システム）
今回セミナーの内容

初日：構造方程式モデリング（ＳＥＭ）の基礎




回帰分析・主成分分析の復習
潜在変数を導入すること
因子分析＋回帰分析＝？
2日目：実践！構造方程式モデリング


モデルの評価や修正
事例：検証的因子分析など
初日の内容


SEMの歴史
SEM入門






1つの散布図から考えること
相関と因果
回帰モデルとは
因果モデルを考えること：潜在変数の導入
因子分析との関係
パス図について
SEM関連の歴史







1906 スピアマンによる因子分析
1966
1969
1978
1980
1984
1986
Bock & Bargmann:共分散構造
Jöreskog :検証的因子分析
LISREL model
ソフトウェアへの発展
Bentler-Weeks model
LISREL, EQS, AMOS
RAM model
COSAN model
SEMの目的
大阪大学狩野氏コメントより
直接観測できない潜在変数を導入し，潜在変数と観測
変数との間の因果関係を同定することにより社会現象
や自然現象を理解するための統計的アプローチ．
研究者が想定した因果に関する仮説を
モデル化する．以下の情報が得られる
（i）モデル（仮説）の妥当性の検討
(ii) 因果の大きさ・強さの推定・検定
(iii) モデル（仮説）修正へのsuggestion
ある散布図から
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
モデル化すると…
回帰モデル
本塁打＝ a + b ×三振
解釈は
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
相関モデル
本塁打
三振
解釈は、…
(背反な事象では)
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
多変量解析

複数の変数を同時に分析する手法の総称

目的変数がある場合の分析



線形回帰分析、
判別分析、ロジスティック回帰分析…
目的変数がない場合の分析


主成分分析、因子分析、対応分析、…
クラスター分析、多次元尺度構成法
目的変数のある分析

予測・判別


未知の結果について、利用できる情報を使っ
て、知ろうとすること
要因分析

因果についての考察を行うこと
目的変数のない分析

観測対象の分類


多変量の情報を使って、似ている対象を見つける
構造の探索（変数の分類）

現象の背景にある構造を探索する

潜在構造の探索において、因果の特定が必要では？
目的変数

「予測」をしたい変数「従属変数」ともいう

「結果」としてとらえる変数

要因から影響されている変数
「目的変数」に影響を与える変数を
「説明変数」とか「独立変数」とよぶ
回帰分析




目的変数と独立変数間の関係式を求める
目的変数の予測
独立変数の影響の大きさを評価
….
データ形式
Y
X1
...
Xp
1
y1
x11
xp1
2
y2
x21
xp2
yN
x2N
xpN
...
N
目的変数
説明変数
回帰モデル
yi  f (x1i , x2i ,, xpi )  ei
線形回帰モデル
yi  0  1x1i  2 x2i   p xpi  ei
定
数
項
(偏)回帰係数
事例１：ホテルの価格

ホテルの価格について、決定要因を探る

回帰分析
パス図の作成

グラフィカルモデリングの利用


回帰分析における回帰係数を正しく解釈する
ためのヒントを得る
主成分分析



情報の集約
新しい尺度の構築
構造の探索
現在の変数を組み合わせて
新しい変数をつくる
主成分
データ形式
X1
X2
･･･
Xp
1
x11
x21
･･･
xp1
2
x12
x22
･･･
xp2
･･･
n
･･･
x1n
x2n
･･･
xpn
主成分
線形結合
z  a1x1  a2 x2 a p x p
主成分分析
変数１
変数２
変数３
変数４
主成分
事例２：テストのスコア

主成分分析による探索

2つの主成分とその解釈

因子分析のための準備
因子分析(Factor Analysis)
変数１
変数２
変数３
変数４
因子
因子分析(Factor Analysis)
英語
国語
算数
理科
学力
因子・潜在変数

直接観測・測定ができない
構成概念
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
長打力
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
長打力
走力
因子分析(Factor Analysis)
本塁打
三塁打
二塁打
犠
飛
盗
塁
長打力
走力
因子分析モデル
X1  a11F1  a12F2   a1q Fq  e1
X 2  a21F1  a22F2    a2q Fq  e2

X p  a p1F1  a p 2 F2    a pqFq  e p
p個の変数
q個の因子
因子分析モデル
変数１
変数２
・・・
変数ｐ
p個の変数
因子１
・・・
因子ｑ
q個の因子
因子と因子負荷量
共通因子： F1, F2 ,, Fq
(変数)
独自因子： e1, e2 ,, ep
(変数)
因子負荷量： a11, a12,, apq
(推定すべき係数)
因子に関する仮定
共通因子：分散は１、独自因子
とは無相関
互いに無相関の
場合も多い
独自因子：互いに無相関
分散の大きさは推定
する
因子分析モデルにおいて
推定すべきもの
因子負荷量
 独自因子の分散
 (因子間の相関)

パラメータの推定方法

最小２乗法


重み付き最小２乗法
最尤推定法

正規分布を仮定
因子数の決定


固有値の情報（主成分分析との関連）
モデルの適合度が十分であるかどうかか
ら判断


データの共分散行列にモデルからの共分散
行列が十分近くなっているか？
適合度検定
最小２乗法


データから共分散行列を推定
因子分析モデルの下での理論上の
共分散行列
この２つの行列ができるだけ等しくなるように
因子負荷量などを決める
最小２乗法の原理
（共分散構造の利用）
 s11

 s21


 s p1

s12
s22

s p2




s1 p   11 12
 
s2 p    21  22




 
 


s pp   p1  p2




1 p 

2p 




 pp 
最小２乗法の原理
p
p
 w (s
i 1 j 1
ij
ij
  ij )
2
重みは s の分散を考慮して
決める
事例３：テストのスコア

探索的因子分析

1因子モデルと2因子モデルの比較

2因子モデルの妥当性を確認
相関モデル
本塁打
三振
解釈は、…
(背反な事象では)
45
35
本塁打
25
15
5
-5
20
40
60
80
100
三振
120
140
160
相関モデル
三振
45
35
25
本塁打
本塁打
15
5
-5
20
40
60
80
100
三振
120
140
160
潜在変数間の関係のモデル化

観測変数ではなく概念同士の関係をモデル化した
い

潜在変数も観測変数も同じ確率変数

潜在変数を含む回帰モデル（連立方程式モデル）

Bentler-Weeks Model
SEMの発展

共分散構造分析


LISREL


Joreskog(1970), Joreskog & Sorbom(1976)
EQS


Bock & Bargmann(1966) Psychometrika
Bentler & Weeks (1980) Psychometrika
…
共分散構造分析からSEMへ

共分散構造分析



線形モデルではあるが、共分散構造だけを推
定の際に利用
多群の平均の検定を分散分析ということと同
じ
平均構造も考慮したモデルの登場
パス図での約束事

観測変数は四角形

潜在変数は円または楕円

誤差変数は記号のみか（楕）円

因果は片方矢印

相関関係は双方矢印
パス図の例
測定モデル
構造モデル
事例4：
測定モデル＋回帰モデルの例


流動的知性(Fluid Intelligence:思考能力）
のはなし
3つの測定モデル




推論能力（低学年）：F1
図形識別能力（低学年）：F2
図形識別能力（高学年）：F3
3つの因子間での回帰分析を行いたい
F3=b0+b1F1+b2F2
or F3=b0+b2F2 etc.
事例4：
３つの測定モデルと構造モデル
1
IND１
1
IND１
F1
F2
FR11
FR21
1
FR12
FR22
F3
FR13
IND１
FR23
３つの潜在変数間で回帰モデルを考える
仮説２
仮説１
F１
F２
F3
F１
F２
F3
モデル構築

従属変数にはパスを設定



影響を与える変数と誤差変数
独立変数には分散・共分散（相関）を設定
出力の設定




潜在変数の尺度を定める
潜在変数の数だけ１とおくものがある
当該潜在変数から出るパス係数を一つ，１に固定
独立潜在変数は，分散＝１としてもよい
相関の挿入時の注意事項



注意：
目的変数でない変数間には相関を想定
誤差変数間の相関は通常ゼロに設定
上記以外の設定を行う場合、何らかの根
拠が望まれる
目的変数間には相関をいれない。誤差変数間の相関はOK。
×
モデルの全体の評価



仮説に基づき構成したモデルがデータに
十分適合しているかどうかをチェック
適合度検定(χ2検定)
適合度指標


GFI, AGFI, CFI…
情報量規準、RMSEA
適合度指標について

GFI、AGFI


CFI


0.9以上が望ましいといわれているが、変数の数が増
えると大きくすることが難しい。
1に近いほどよいモデル。独立モデルとフルモデルの
間のどの位置の適合度であるかを示す
RMSEA

自由度１あたりのモデルの乖離度を表す指標で、小さ
いほどよい。0.05以下が望ましい。
事例5：検証的因子分析１

独立な2因子モデル

モデル構築

適合度の評価
モデルの改良のための道具

モデルの改良とは？


どこかのパスを削り、どこかにパスを追加する
こと
パス係数の検定


回帰係数の検定とほぼ同じ
LM検定（Lagrange Multiplier Test）

パスを追加すればよい場所を教えてくれる
出力の見方と
モデルの最終吟味



引いたパスの有意性（ワルド検定）
パスを引かなかったところの非有意性
（LM検定）
標準誤差（SE）の大きさが揃っていること
事例6：検証的因子分析２

モデルの改良

Wald検定
LM検定

適合度の評価

モデルの解釈と
因果の確認での注意点

経験


理論


原因となる変数は分析者により選択される
要請


因果律は不定であり識別ができない
動機


データのみで因果の確認は不可能
分析者の要請によって、結果変数も選択される
豊田（1998）「共分散構造分析[入門編]」浅倉書店より
最近の発展

平均構造モデル
潜在成長曲線モデル
多グループモデル
階層型モデル
分布に関する前提条件の崩壊

すべて、StatWorksで実現可能




参考文献



豊田（1998,2000,2003）「共分散構造分析
[入門編],[応用編] ,[疑問編] 」浅倉書店
豊田（1998）「共分散構造分析 [事例編] 」
北大路書房
狩野, 三浦(2002)グラフィカル多変量解析

SEM(構造方程式モデル)説明スライド

Transcript SEM(構造方程式モデル)説明スライド

Directory