Transcript Slides

Linear Mixed Model을 이용한
분석 결과
2013. 02. 16
권순선
1. Introduction
• Longitudinal data
– 특별히 같은 subject에서 시간에 따라 여러 번 (2번 이상) 반복
측정한 자료를 말한다.
– 이 때, subject가 집락이 된다.
– 집락 내 (within-subject or within-cluster)에 반복 측정된 자료들
은 서로 상관되어(correlated) 있다.
– 개체들 간(between subject or between cluster)에는 서로 독립
적(independent)이다.
– 여기서, 독립적이란 한 개체의 반복측정치들이 다른 개체의 측정
치에 관한 정보를 담고 있지 않다는 의미이다.
1. Introduction
• Longitudinal data or repeated data 분석 시 고려해야 할 사항
– 통계분석 방법에서 집락 혹은 개체 내 상관(within-cluster or withinsubject correlation)을 고려해 주어야 한다.
• 지금까지 배운 통계분석법들은 모든 측정치들이 서로 독립이라는
가정을 하였음.
• 개체 내 상관을 고려하지 않은 분석을 한 경우
– 관심 추정치에 대한 표준오차(standard error)가 일반적으로 과
소추정(underestimate)
– 제 1종의 오류 (Type I error) 증가
– P-value 는 작아지고 신뢰구간은 지나치게 좁아진다.
– 따라서, 부적절한 결과를 바탕으로 잘못된 해석을 내릴 수 있다.
2. Linear Mixed Model (LMM)
• 반복측정자료의 특성인 개체 내 상관을 고려하면서 분석을 할 수 있
는 분석법이 선형 혼합 모형(linear mixed model: LMM)이다.
• LMM은 고정효과(fixed effect)와 랜덤효과(random effect)로 구성되
어 있음.
– 개인이 평균(fixed) 결과로부터 랜덤으로 편차가 있음을 가정.
– Fixed effect model
• 모든 변동은 모형에 포함되는 독립변수로 설명 가능하다고 생각될
때
– Mixed effect model (or Random coefficient model)
• 독립변수에 의해 설명되지 않은 변동이 있다고 판단될 때
2. Linear Mixed Model (LMM)
 선형회귀모형
y  X  
 ~ N (0, R)
Var ( y )  R
where
y = dependent variable
 = residual error
X = design matrix for fixed effects
 = fixed effects parameters
R = residual variance matrix
 선형혼합모형
y  X  Z  
 ~ N (0, G )
 ~ N (0, R)
V  Var ( y )  ZGZ   R
where
y = dependent variable
 = residual error
X = design matrix for fixed effects
Z = design matrix for random effects
 = fixed effects parameters
 = random effects parameters
V = the covariance matrix
3. LMM analysis result
• Dependent variable : 밀린 거리
• Independent variable :
– Fixed effects : 몸무게, 키, crouch, 미는 힘, 실제 속도,
미는 중간 타이밍(발 위치)
– Random effects : subject
• Estimated method : Restricted maximum likelihood
estimation(REML) – unbiased estimator
• Covariance structure : variance components(vc)
3. LMM analysis result
Information Criteria
Model
AIC
BIC
Fixed effect model
1252.1
1253.3
Random intercept model
1202.8
1205.1
Random intercept and slope
1204.8
1208.4
 The rule of thumb is smaller is better
 Random intercept model이 제일 좋은 모형으로 나타남
•
•
AIC (Akaike Information Criterion) :
= 2k – 2ln(L) , k : # of parameters ,
L : likelihood function for the estimated model
BIC (Bayesian Information Criterion)
= -2ln(L) + k ln(n) , n : # of obs.
3. LMM analysis result
Type 3 Test of Fixed Effects
Effect
Num d.f.
Den d.f.
F-value
P-value
몸무게
1
84
1.23
0.2697
키
1
84
0.08
0.7783
Crouch
3
84
3.19
0.0278
미는 힘
1
84
3.54
0.0633
실제 속도
1
84
1.13
0.2913
미는 중간 타이밍
(발위치)
1
84
7.43
0.0078
3. LMM analysis result
Least Squares Means
Estimate
Standard
error
Crouch 20도
251.16
14.89
Crouch 30도
239.64
15.05
Crouch 60도
248.2
15.13
정상
299.1
18.67
Effect