第4節 混合モデル(Mixed Model)
Download
Report
Transcript 第4節 混合モデル(Mixed Model)
1
第4章 MIXED Model
4.1 MIXED Model とは
4.2 反復測定データの分析1
分割法タイプのデータ
4.3 反復測定データの分析2
Multi-level Models Growth Models
4.4 Discussion
2
4.1 MIXED Model とは
• “MIXED”は,固定効果の要因とランダム効果の
要因が混在した実験計画を意味
– ランダム効果の例
• ブロック因子
• 被験者要因
• 二段サンプリングで1次抽出単位の効果
• 反復測定データの分析が PROC GLM よりも
柔軟に行うことができる
• 特に経時データ・成長データの分析に威力
• SASでは MIXEDプロシージャで分析する
• SPSSはバージョン11からサポート
3
MIXED Model の特徴
• ランダム効果の要因をモデルに組み入れ
ることができる
• PROC GLMは固定効果要因のみ.固定効果要因
のモデルでランダム効果モデルを模している
• 被験者内分散共分散行列について様々な
指定が行える
• 欠測値があっても解析可能
• MANOVAだとobservation全体が除かれてしまう
• これ以外にも...
4
モデルの構造式
Mixed Modelの構造式
y Xβ Zu ε
一般線形モデル
(glm) の構造式
y Xβ ε
• u がランダム効果を表す要因
• Z は u のデザインを表す既知の行列
5
平均と分散
Mixed Modelの構造式
E[y] E[ Xβ Zu ε] Xβ
V [y] V [ Xβ Zu ε] ZV[u]Z 'V [ε]
cf. 一般線形モデル
(glm) の構造式
E[y] E[ Xβ ε] X
2
V [y] V [ Xβ ε] V [ε]
2
6
推定方法
• 最尤法(ML)もしくは制限付(or 残差)最尤法
(Restricted/residual ML)
• 反復法で数値的に解く
• 統計的推測は主に漸近理論に基づく
7
MIXED Modelの例
•
•
•
•
普通のANOVA
誤差分散が等質でない場合のANOVA
Random coefficient model
Multilevel analysis
– nest 構造のデータ解析
• 反復測定データ
• Linear growth model
– unconditional
– with a person-level covariate
• 他
8
4.2 MIXED Modelによる
反復測定データの分析1
分割法タイプのデータ
9
SASプログラムの要点
• DATA ステップは1変量型で作成
V [y] V [ Xβ Zu ε]
• MODEL ステートメント
– 固定効果要因を指定(X)
• RANDOM ステートメント
ZV[u]Z 'V [ε]
ZGZ' R
– ランダム効果要因を指定(Z, V[u])
• REPEATED ステートメント
– 誤差εの共分散構造V[ε]の指定
10
注:データのタイプ
1変量型
(ANOVA, MIXED)
OBS SUB
1
1
2
1
3
1
4
1
5
2
6
2
7
2
8
2
9 …
A
1
1
1
1
2
2
2
2
B
1
2
3
4
1
2
3
4
X
3
4
6
5
3
2
3
2
多変量型
(MANOVA; repeated)
OBS A B1 B2 B3 B4
1 1 3 4 6 5
2 2 3 2 3 2
3 …
被験者1
被験者2
被験者3
被験者4
被験者5
合計
(AB)
B1
3
3
1
3
5
B2
4
3
4
5
7
A1
B3
6
6
6
4
8
15
23
30
B4
5
7
8
7
9
36
B1
被験者6
3
被験者7
5
被験者8
2
被験者9
4
被験者1 0 6
合計
20
(AB)
B2
2
6
3
6
4
A2
B3
3
2
3
6
5
B4
2
3
3
4
6
21
19
18
data data323;
do sub=1 to 10;
input a @@;
do b=1 to 4;
input x @@;
output;
end; end;
cards;
13465
13367
11468
13547
15789
23232
25623
22333
24664
26456
;
11
SAS プログラム例
被験者1
被験者2
被験者3
被験者4
被験者5
合計
(AB)
B1
3
3
1
3
5
B2
4
3
4
5
7
A1
B3
6
6
6
4
8
15
23
30
B4
5
7
8
7
9
36
B1
被験者6
3
被験者7
5
被験者8
2
被験者9
4
被験者1 0 6
合計
20
(AB)
B2
2
6
3
6
4
A2
B3
3
2
3
6
5
B4
2
3
3
4
6
21
19
18
title '*** MIXED PROC for SPF_p.q' ***;
proc mixed data=data323;
class sub a b;
model x=a b a*b;
repeated b/type=cs subject=sub R;
run;
quit;
12
被験者内分散共分散行列の例
TYPE=UN
HF
CS
AR(1)
UN(1)
VC
…
/*
/*
/*
/*
/*
/*
自由に推定(無構造) */
球面性の構造 */
複合対称性 */
1次の自己相関構造 */
独立・異分散 */
独立・等分散 [CRF]*/
TYPE
B1
UN B2
B3
B4
B1
HF
B2
B3
B4
B1
CS
B2
B3
B4
B1
AR(1) B2
B3
B4
B1
UN(1) B2
B3
B4
B1
VC
B2
[CRF] B3
B4
B1
B2
B3
B4
2.25
1.50
0.88
1.13
2.30
1.18
1.01
1.12
2.40
1.14
1.14
1.14
2.38
1.18
0.59
0.29
2.25
0.00
0.00
0.00
2.40
0.00
0.00
0.00
1.50
2.75
0.90
1.10
1.18
2.60
1.16
1.26
1.14
2.40
1.14
1.14
1.18
2.38
1.18
0.59
0.00
2.75
0.00
0.00
0.00
2.40
0.00
0.00
0.88
0.90
2.35
1.33
1.01
1.16
2.25
1.09
1.14
1.14
2.40
1.14
0.59
1.18
2.38
1.18
0.00
0.00
2.35
0.00
0.00
0.00
2.40
0.00
1.13
1.10
1.33
2.25
1.12
1.26
1.09
2.46
1.14
1.14
1.14
2.40
0.29
0.59
1.18
2.38
0.00
0.00
0.00
2.25
0.00
0.00
0.00
2.40
Null Model
LRT Chi^2
Null Model
LRT DF
9.7885
9
8.4207
4
8.3407
1
7.1275
1
0.1120
3
0
0
13
の被
推験
定者
結内
果分
散
共
分
散
行
列
14
考察
• Null model LRT chi^2
– [CRF] (無相関)を基準として,各構造のように相
関を入れた場合に減少するカイ2乗値
• type=UN(自由) の推定結果に近い方が良い
– 自由度がなるべく小さいモデルが良いモデル
– このデータはCSだろう
• ANOVAによる反復測定データの分析でよい
15
要因の検定結果
モデル
UN
HF
CS
AR(1)
UN(1)
VC
VC[CRF]
MANOVA
ANOVA(GG)
ANOVA(HH)
ANOVA(球)
NDF
1
1
1
1
1
1
1
1
1
1
1
A
DDF
8
8
8
8
8
8
32
8
8
8
8
p値
0.1266
0.1266
0.1266
0.1002
0.0291
0.0291
0.0123
0.1266
0.1266
0.1266
0.1266
NDF
B
DDF
3
3
3
3
3
3
3
3
2.669
3
3
8
24
24
24
24
24
32
6
21.35
24
24
p値
0.0240
0.0066
0.0066
0.0510
0.0555
0.0658
0.0597
0.0660
0.0092
0.0066
0.0066
VC[CRF]:model x = a b a*b / ddfm=residual;
Type=UN とMANOVAは一致して欲しいが...
NDF
3
3
3
3
3
3
3
3
2.669
3
3
A*B
DDF
8
24
24
24
24
24
32
6
21.35
24
24
p値
0.0091
0.0007
0.0007
0.0142
0.0127
0.0155
0.0125
0.0322
0.0012
0.0007
0.0007
16
簡単なまとめ
• Mixed モデルはランダム効果を「正式」に
扱うためのモデル
• ランダム効果の分散共分散を分析者が指定
できる
• 成長データ・縦断的データの分析には重宝
• 自由度の指定は難しい?
17
4.3 MIXED Modelによる
反復測定データの分析2
Multi-level Models
Growth Models
18
二段抽出モデル
19
Random-effect model
学校をランダムにJ 校(school)選び,各学校からランダム
に Ij 人被験者を選んで数学のテスト(mathach)を行った
Yij j eij ( j 1,, J ; i 1,, I j )
j~N (0, ), eij~N (0, )
2
A
Proc mixed;
class school;
model mathach = ;
random school;
2
e
20
Multilevel model のセットアップ
Yij 0 j eij ( j 1,, J ; i 1,, I j )
0 j 00 u0 j
← レベル1
← レベル2
Yij 00 u0 j eij ( j 1,, J ; i 1,, I j )
Yij j eij ( j 1,, J ; i 1,, I j )
Proc mixed;
class school;
model mathach = /solution;
random intercept/subject=school;
21
メモ_11
• model statement は,いつも定数項を含む
• random statement は,いつも誤差項を含む
• random interceptはinterceptの係数がランダムであ
ることを意味
• その影響はschoolの値ごとにブロック化される
Yij 00 u0 j 1 eij ( j 1,, J ; i 1,, I j )
Proc mixed;
class school;
model mathach = /solution;
random intercept/subject=school;
22
メモ_12
Yij 00 u0 j 1 eij ( j 1,, J ; i 1,, I j )
Proc mixed;
class school;
model mathach = /solution;
random intercept/subject=school;
学
校
1
学
校
2
Y11 V (u) V (u) V (u)
Y21 V (u) V (u) V (u)
Y31 V (u) V (u) V (u)
Y12
V (u) V (u)
Y22
V (u) V (u)
O
O
V ( )
V ( )
V ( )
V ( )
V ( )
23
レベル2の共変量
• 学校の予算 budgetj を説明変数に付加
Yij 0 j eij ( j 1,, J ; i 1,, I j )
0 j 00 01budget j u0 j
Yij 00 01budget j u0 j eij
固定効果
ランダム効果
Proc mixed;
class school;
model mathach = budget/solution ddfm=bw;
random intercept/subject=school;
24
成長曲線モデル(予測変数なし)-1
Ytj 0 j 1 j TIMEtj etj ( j 1,, J ; t 1,, I j )
00 00 01
0 j
~N ,
1 j
10
11
10
25
成長曲線モデル(予測変数なし)-2
Ytj 0 j 1 j TIMEtj etj ( j 1,, J ; t 1,, I j )
00 00 01
0 j
~N ,
1 j
10 10 11
Ytj 0 j 1 j TIMEtj etj
0 j 00 u0 j
,
1 j 10 u1 j
u0 j
0 00 01
~N ,
0
u1 j
10
11
Ytj 00 10TIMEtj u0 j u1 j TIMEtj etj
固定効果
ランダム効果
26
成長曲線モデル(予測変数なし)-3
Ytj 00 10TIMEtj u0 j u1 j TIMEtj etj
固定効果
ランダム効果
Proc mixed;
class sub;
model y = time/solution ddfm=bw;
random intercept time/subject=sub type=un;
Intercept と time の係数がランダム
27
メモ_2
Proc mixed;
class sub;
model y = time/solution ddfm=bw;
random intercept time/subject=sub type=un;
被
験
者
1
被
験
者
2
Y11
Y21 Cov(u0 u1timet1, u0 u1timet '1 )
Y31
Y12
Y22
O
O
Cov(u0 u1timet 2 , u0 u1timet '2 )
type un
type vc
u0 00 01
u0 00
Var
Var
u
u
11
11
1 10
1
28
成長曲線モデル(予測変数あり)-1
29
成長曲線モデル(予測変数あり)-2
Ytj 0 j 1 j TIMEtj etj
0 j 00 01sex u0 j
,
1 j 10 11sex u1 j
u0 j
0 00 01
~N ,
0
u1 j
10
11
Ytj 00 10TIMEtj 01sex 11sex TIMEtj
固定効果
u0 j u1 j TIMEtj etj
ランダム効果
30
成長曲線モデル(予測変数あり)-3
Ytj 00 10TIMEtj 01sex 11sex TIMEtj
固定効果
u0 j u1 j TIMEtj etj
ランダム効果
Proc mixed;
class sub;
model y = time sex sex*time/solution ddfm=bw;
random intercept time/subject=sub type=un gcorr;
31
最終モデルでは?
---SAS and SPSS staffs help me---
32
4.4 Discussion
LCA versus MIXED
33
LCA vs MIXED Model_1
• LCAで可能,でもMIXEDで不可能?
– 分析モデル2
– 多変数のモデル
– モデル修正
34
LCA vs MIXED Model_2
• LCAで不可能,でもMIXEDで可能??
– 3要因交互作用(年齢*性別*親)の検出
– 観測時点が個体によって異なる場合
F
F
M
M
時間
親健康
時間
親アル中
35
参考文献
• Littell, R.C. et.al (1996). SAS System for Mixed
Models. SAS Institute Inc.
• 岸本淳司(1996). PROC MIXED 入門.SUGIJ’96/IDS Conference論文集. 179-197.
• Singer, J.D. (1998). Using SAS PROC MIXED to
fit multilevel models, hierarchical models, and
individual growth models. Journal of Educational
and Behavioral Statistics. 24, 323-355.