第4節 混合モデル(Mixed Model)

Download Report

Transcript 第4節 混合モデル(Mixed Model)

1
第4章 MIXED Model
4.1 MIXED Model とは
4.2 反復測定データの分析1
分割法タイプのデータ
4.3 反復測定データの分析2
Multi-level Models Growth Models
4.4 Discussion
2
4.1 MIXED Model とは
• “MIXED”は,固定効果の要因とランダム効果の
要因が混在した実験計画を意味
– ランダム効果の例
• ブロック因子
• 被験者要因
• 二段サンプリングで1次抽出単位の効果
• 反復測定データの分析が PROC GLM よりも
柔軟に行うことができる
• 特に経時データ・成長データの分析に威力
• SASでは MIXEDプロシージャで分析する
• SPSSはバージョン11からサポート
3
MIXED Model の特徴
• ランダム効果の要因をモデルに組み入れ
ることができる
• PROC GLMは固定効果要因のみ.固定効果要因
のモデルでランダム効果モデルを模している
• 被験者内分散共分散行列について様々な
指定が行える
• 欠測値があっても解析可能
• MANOVAだとobservation全体が除かれてしまう
• これ以外にも...
4
モデルの構造式
Mixed Modelの構造式
y  Xβ  Zu  ε
一般線形モデル
(glm) の構造式
y  Xβ  ε
• u がランダム効果を表す要因
• Z は u のデザインを表す既知の行列
5
平均と分散
Mixed Modelの構造式
E[y]  E[ Xβ  Zu  ε]  Xβ
V [y]  V [ Xβ  Zu  ε]  ZV[u]Z 'V [ε]
cf. 一般線形モデル
(glm) の構造式
E[y]  E[ Xβ  ε]  X
 2



V [y]  V [ Xβ  ε]  V [ε]  


2




6
推定方法
• 最尤法(ML)もしくは制限付(or 残差)最尤法
(Restricted/residual ML)
• 反復法で数値的に解く
• 統計的推測は主に漸近理論に基づく
7
MIXED Modelの例
•
•
•
•
普通のANOVA
誤差分散が等質でない場合のANOVA
Random coefficient model
Multilevel analysis
– nest 構造のデータ解析
• 反復測定データ
• Linear growth model
– unconditional
– with a person-level covariate
• 他
8
4.2 MIXED Modelによる
反復測定データの分析1
分割法タイプのデータ
9
SASプログラムの要点
• DATA ステップは1変量型で作成
V [y]  V [ Xβ  Zu  ε]
• MODEL ステートメント
– 固定効果要因を指定(X)
• RANDOM ステートメント
 ZV[u]Z 'V [ε]
 ZGZ'  R
– ランダム効果要因を指定(Z, V[u])
• REPEATED ステートメント
– 誤差εの共分散構造V[ε]の指定
10
注:データのタイプ
1変量型
(ANOVA, MIXED)
OBS SUB
1
1
2
1
3
1
4
1
5
2
6
2
7
2
8
2
9 …
A
1
1
1
1
2
2
2
2
B
1
2
3
4
1
2
3
4
X
3
4
6
5
3
2
3
2
多変量型
(MANOVA; repeated)
OBS A B1 B2 B3 B4
1 1 3 4 6 5
2 2 3 2 3 2
3 …
被験者1
被験者2
被験者3
被験者4
被験者5
合計
(AB)
B1
3
3
1
3
5
B2
4
3
4
5
7
A1
B3
6
6
6
4
8
15
23
30
B4
5
7
8
7
9
36
B1
被験者6
3
被験者7
5
被験者8
2
被験者9
4
被験者1 0 6
合計
20
(AB)
B2
2
6
3
6
4
A2
B3
3
2
3
6
5
B4
2
3
3
4
6
21
19
18
data data323;
do sub=1 to 10;
input a @@;
do b=1 to 4;
input x @@;
output;
end; end;
cards;
13465
13367
11468
13547
15789
23232
25623
22333
24664
26456
;
11
SAS プログラム例
被験者1
被験者2
被験者3
被験者4
被験者5
合計
(AB)
B1
3
3
1
3
5
B2
4
3
4
5
7
A1
B3
6
6
6
4
8
15
23
30
B4
5
7
8
7
9
36
B1
被験者6
3
被験者7
5
被験者8
2
被験者9
4
被験者1 0 6
合計
20
(AB)
B2
2
6
3
6
4
A2
B3
3
2
3
6
5
B4
2
3
3
4
6
21
19
18
title '*** MIXED PROC for SPF_p.q' ***;
proc mixed data=data323;
class sub a b;
model x=a b a*b;
repeated b/type=cs subject=sub R;
run;
quit;
12
被験者内分散共分散行列の例
TYPE=UN
HF
CS
AR(1)
UN(1)
VC
…
/*
/*
/*
/*
/*
/*
自由に推定(無構造) */
球面性の構造 */
複合対称性 */
1次の自己相関構造 */
独立・異分散 */
独立・等分散 [CRF]*/
TYPE
B1
UN B2
B3
B4
B1
HF
B2
B3
B4
B1
CS
B2
B3
B4
B1
AR(1) B2
B3
B4
B1
UN(1) B2
B3
B4
B1
VC
B2
[CRF] B3
B4
B1
B2
B3
B4
2.25
1.50
0.88
1.13
2.30
1.18
1.01
1.12
2.40
1.14
1.14
1.14
2.38
1.18
0.59
0.29
2.25
0.00
0.00
0.00
2.40
0.00
0.00
0.00
1.50
2.75
0.90
1.10
1.18
2.60
1.16
1.26
1.14
2.40
1.14
1.14
1.18
2.38
1.18
0.59
0.00
2.75
0.00
0.00
0.00
2.40
0.00
0.00
0.88
0.90
2.35
1.33
1.01
1.16
2.25
1.09
1.14
1.14
2.40
1.14
0.59
1.18
2.38
1.18
0.00
0.00
2.35
0.00
0.00
0.00
2.40
0.00
1.13
1.10
1.33
2.25
1.12
1.26
1.09
2.46
1.14
1.14
1.14
2.40
0.29
0.59
1.18
2.38
0.00
0.00
0.00
2.25
0.00
0.00
0.00
2.40
Null Model
LRT Chi^2
Null Model
LRT DF
9.7885
9
8.4207
4
8.3407
1
7.1275
1
0.1120
3
0
0
13
の被
推験
定者
結内
果分
散
共
分
散
行
列
14
考察
• Null model LRT chi^2
– [CRF] (無相関)を基準として,各構造のように相
関を入れた場合に減少するカイ2乗値
• type=UN(自由) の推定結果に近い方が良い
– 自由度がなるべく小さいモデルが良いモデル
– このデータはCSだろう
• ANOVAによる反復測定データの分析でよい
15
要因の検定結果
モデル
UN
HF
CS
AR(1)
UN(1)
VC
VC[CRF]
MANOVA
ANOVA(GG)
ANOVA(HH)
ANOVA(球)
NDF
1
1
1
1
1
1
1
1
1
1
1
A
DDF
8
8
8
8
8
8
32
8
8
8
8
p値
0.1266
0.1266
0.1266
0.1002
0.0291
0.0291
0.0123
0.1266
0.1266
0.1266
0.1266
NDF
B
DDF
3
3
3
3
3
3
3
3
2.669
3
3
8
24
24
24
24
24
32
6
21.35
24
24
p値
0.0240
0.0066
0.0066
0.0510
0.0555
0.0658
0.0597
0.0660
0.0092
0.0066
0.0066
VC[CRF]:model x = a b a*b / ddfm=residual;
Type=UN とMANOVAは一致して欲しいが...
NDF
3
3
3
3
3
3
3
3
2.669
3
3
A*B
DDF
8
24
24
24
24
24
32
6
21.35
24
24
p値
0.0091
0.0007
0.0007
0.0142
0.0127
0.0155
0.0125
0.0322
0.0012
0.0007
0.0007
16
簡単なまとめ
• Mixed モデルはランダム効果を「正式」に
扱うためのモデル
• ランダム効果の分散共分散を分析者が指定
できる
• 成長データ・縦断的データの分析には重宝
• 自由度の指定は難しい?
17
4.3 MIXED Modelによる
反復測定データの分析2
Multi-level Models
Growth Models
18
二段抽出モデル
19
Random-effect model
学校をランダムにJ 校(school)選び,各学校からランダム
に Ij 人被験者を選んで数学のテスト(mathach)を行った
Yij     j  eij ( j  1,, J ; i  1,, I j )
 j~N (0, ), eij~N (0, )
2
A
Proc mixed;
class school;
model mathach = ;
random school;
2
e
20
Multilevel model のセットアップ
Yij  0 j  eij ( j  1,, J ; i  1,, I j )
0 j   00  u0 j
← レベル1
← レベル2
Yij   00  u0 j  eij ( j  1,, J ; i  1,, I j )
Yij    j  eij ( j  1,, J ; i  1,, I j )
Proc mixed;
class school;
model mathach = /solution;
random intercept/subject=school;
21
メモ_11
• model statement は,いつも定数項を含む
• random statement は,いつも誤差項を含む
• random interceptはinterceptの係数がランダムであ
ることを意味
• その影響はschoolの値ごとにブロック化される
Yij   00  u0 j 1  eij ( j  1,, J ; i  1,, I j )
Proc mixed;
class school;
model mathach = /solution;
random intercept/subject=school;
22
メモ_12
Yij   00  u0 j 1  eij ( j  1,, J ; i  1,, I j )
Proc mixed;
class school;
model mathach = /solution;
random intercept/subject=school;
学
校
1
学
校
2
Y11 V (u) V (u) V (u)
Y21 V (u) V (u) V (u)

Y31 V (u) V (u) V (u)
Y12
V (u) V (u)
Y22
V (u) V (u)
O
O
V ( )
V ( )
V ( )
V ( )
V ( )
23
レベル2の共変量
• 学校の予算 budgetj を説明変数に付加
Yij   0 j  eij ( j  1,, J ; i  1,, I j )
0 j   00   01budget j  u0 j

Yij   00   01budget j  u0 j  eij
 

固定効果
ランダム効果
Proc mixed;
class school;
model mathach = budget/solution ddfm=bw;
random intercept/subject=school;
24
成長曲線モデル(予測変数なし)-1
Ytj  0 j  1 j TIMEtj  etj ( j  1,, J ; t  1,, I j )
 00   00  01 
0 j 

 ~N   , 





1 j 


10
11


10




25
成長曲線モデル(予測変数なし)-2
Ytj  0 j  1 j TIMEtj  etj ( j  1,, J ; t  1,, I j )
 00   00  01 
0 j 

 ~N   , 





 1 j 
  10   10 11 

Ytj  0 j  1 j TIMEtj  etj
0 j  00  u0 j
,

 1 j  10  u1 j
u0 j 
 0  00  01 

 ~N   , 




0
u1 j 


10
11





Ytj  00  10TIMEtj  u0 j  u1 j TIMEtj  etj
 

固定効果
ランダム効果
26
成長曲線モデル(予測変数なし)-3
Ytj  00  10TIMEtj  u0 j  u1 j TIMEtj  etj
 

固定効果
ランダム効果
Proc mixed;
class sub;
model y = time/solution ddfm=bw;
random intercept time/subject=sub type=un;
Intercept と time の係数がランダム
27
メモ_2
Proc mixed;
class sub;
model y = time/solution ddfm=bw;
random intercept time/subject=sub type=un;
被
験
者
1
被
験
者
2
Y11
Y21 Cov(u0  u1timet1, u0  u1timet '1 )
Y31
Y12
Y22
O
O
Cov(u0  u1timet 2 , u0  u1timet '2 )
type  un
type  vc
u0   00  01
u0   00

Var   
Var   





u
u
11 
11
 1   10
 1 
28
成長曲線モデル(予測変数あり)-1
29
成長曲線モデル(予測変数あり)-2
Ytj  0 j  1 j TIMEtj  etj
0 j  00  01sex  u0 j
,

 1 j  10  11sex  u1 j
u0 j 
 0  00  01 

 ~N   , 




0
u1 j 


10
11





Ytj  00  10TIMEtj  01sex  11sex  TIMEtj



固定効果
 u0 j  u1 j TIMEtj  etj


ランダム効果
30
成長曲線モデル(予測変数あり)-3
Ytj   00  10TIMEtj   01sex  11sex  TIMEtj



固定効果
 u0 j  u1 j TIMEtj  etj


ランダム効果
Proc mixed;
class sub;
model y = time sex sex*time/solution ddfm=bw;
random intercept time/subject=sub type=un gcorr;
31
最終モデルでは?
---SAS and SPSS staffs help me---
32
4.4 Discussion
LCA versus MIXED
33
LCA vs MIXED Model_1
• LCAで可能,でもMIXEDで不可能?
– 分析モデル2
– 多変数のモデル
– モデル修正
34
LCA vs MIXED Model_2
• LCAで不可能,でもMIXEDで可能??
– 3要因交互作用(年齢*性別*親)の検出
– 観測時点が個体によって異なる場合
F
F
M
M
時間
親健康
時間
親アル中
35
参考文献
• Littell, R.C. et.al (1996). SAS System for Mixed
Models. SAS Institute Inc.
• 岸本淳司(1996). PROC MIXED 入門.SUGIJ’96/IDS Conference論文集. 179-197.
• Singer, J.D. (1998). Using SAS PROC MIXED to
fit multilevel models, hierarchical models, and
individual growth models. Journal of Educational
and Behavioral Statistics. 24, 323-355.