Transcript Slides
Linear Mixed Model을 이용한
분석 결과
2013. 02. 16
권순선
1. Introduction
• Longitudinal data
– 특별히 같은 subject에서 시간에 따라 여러 번 (2번 이상) 반복
측정한 자료를 말한다.
– 이 때, subject가 집락이 된다.
– 집락 내 (within-subject or within-cluster)에 반복 측정된 자료들
은 서로 상관되어(correlated) 있다.
– 개체들 간(between subject or between cluster)에는 서로 독립
적(independent)이다.
– 여기서, 독립적이란 한 개체의 반복측정치들이 다른 개체의 측정
치에 관한 정보를 담고 있지 않다는 의미이다.
1. Introduction
• Longitudinal data or repeated data 분석 시 고려해야 할 사항
– 통계분석 방법에서 집락 혹은 개체 내 상관(within-cluster or withinsubject correlation)을 고려해 주어야 한다.
• 지금까지 배운 통계분석법들은 모든 측정치들이 서로 독립이라는
가정을 하였음.
• 개체 내 상관을 고려하지 않은 분석을 한 경우
– 관심 추정치에 대한 표준오차(standard error)가 일반적으로 과
소추정(underestimate)
– 제 1종의 오류 (Type I error) 증가
– P-value 는 작아지고 신뢰구간은 지나치게 좁아진다.
– 따라서, 부적절한 결과를 바탕으로 잘못된 해석을 내릴 수 있다.
2. Linear Mixed Model (LMM)
• 반복측정자료의 특성인 개체 내 상관을 고려하면서 분석을 할 수 있
는 분석법이 선형 혼합 모형(linear mixed model: LMM)이다.
• LMM은 고정효과(fixed effect)와 랜덤효과(random effect)로 구성되
어 있음.
– 개인이 평균(fixed) 결과로부터 랜덤으로 편차가 있음을 가정.
– Fixed effect model
• 모든 변동은 모형에 포함되는 독립변수로 설명 가능하다고 생각될
때
– Mixed effect model (or Random coefficient model)
• 독립변수에 의해 설명되지 않은 변동이 있다고 판단될 때
2. Linear Mixed Model (LMM)
선형회귀모형
y X
~ N (0, R)
Var ( y ) R
where
y = dependent variable
= residual error
X = design matrix for fixed effects
= fixed effects parameters
R = residual variance matrix
선형혼합모형
y X Z
~ N (0, G )
~ N (0, R)
V Var ( y ) ZGZ R
where
y = dependent variable
= residual error
X = design matrix for fixed effects
Z = design matrix for random effects
= fixed effects parameters
= random effects parameters
V = the covariance matrix
3. LMM analysis result
• Dependent variable : 밀린 거리
• Independent variable :
– Fixed effects : 몸무게, 키, crouch, 미는 힘, 실제 속도,
미는 중간 타이밍(발 위치)
– Random effects : subject
• Estimated method : Restricted maximum likelihood
estimation(REML) – unbiased estimator
• Covariance structure : variance components(vc)
3. LMM analysis result
Information Criteria
Model
AIC
BIC
Fixed effect model
1252.1
1253.3
Random intercept model
1202.8
1205.1
Random intercept and slope
1204.8
1208.4
The rule of thumb is smaller is better
Random intercept model이 제일 좋은 모형으로 나타남
•
•
AIC (Akaike Information Criterion) :
= 2k – 2ln(L) , k : # of parameters ,
L : likelihood function for the estimated model
BIC (Bayesian Information Criterion)
= -2ln(L) + k ln(n) , n : # of obs.
3. LMM analysis result
Type 3 Test of Fixed Effects
Effect
Num d.f.
Den d.f.
F-value
P-value
몸무게
1
84
1.23
0.2697
키
1
84
0.08
0.7783
Crouch
3
84
3.19
0.0278
미는 힘
1
84
3.54
0.0633
실제 속도
1
84
1.13
0.2913
미는 중간 타이밍
(발위치)
1
84
7.43
0.0078
3. LMM analysis result
Least Squares Means
Estimate
Standard
error
Crouch 20도
251.16
14.89
Crouch 30도
239.64
15.05
Crouch 60도
248.2
15.13
정상
299.1
18.67
Effect