대응표본 t-검정 - 한림대학교 의과대학

Download Report

Transcript 대응표본 t-검정 - 한림대학교 의과대학

연속변수에서
군간 평균값 차이 비교
한림대학교 의과대학 사회의학교실
김동현
관련 연구 가설

정상 성인에서는 혈중 총 콜레스테롤 수치는 비만여부(비만
/정상)에 따라 차이가 나는가 ?

Diabetic nephropathy 앓고 있는 환자 10명에게 captopril
을 8주 치료했을 때, 치료 전, 후 urinary protein 은 변화가
있는가 ?

대동맥 판막 이식수술 환자의 pulse pressure 가 연령군(40
대/50대/60대)별로 차이가 있는가 ?

정상 신생아에서 출생 직후 좌심실 확장기말용적이 시간(2,
12, 24, 120)에 따라 변화하는가 ?
목차
I.
독립표본 t-검정 (Student t-test)
II. 대응표본 t-검정 (Paired t-test)
III. 분산분석 (ANOVA)
IV. 반복측정자료의 분산분석
(Repeated measures ANOVA)
VI. 비모수검정기법 (Non-parametric test)
I. 독립표본 t- 검정(Two sample t-test)
■ 독립성 : 비교 집단이 독립적으로 관찰
■ 정규성 : 대표본, 척도 변환 (log, square root)
* 비모수 검정 : Wilcoxon rank sum test
■ 등분산성 : 검정 결과에 따라 해당되는 통계적 방법 적용
I-1. 독립표본 t- 검정 : 예제
■ 일개 지역 거주 중년과 노인 대상 건강수준 평가한 연구에
서 BMI(bmi07) 평균이 연령군(중년 vs 노년)간 차이가 있는가 ?
idnum
sex
age
bmi07
sbp07
dbp07
bmi04
C1438
1
1
20.5
90
61
30.1
C1226
2
1
16.4
93
69
25.3
C0350
2
1
24.3
98
64
27.6
C0586
1
2
24.6
100
57
24.7
C0596
2
1
26.9
101
59
25.3
C0154
2
2
19.4
101
62
20.2
C0178
1
2
24.2
102
69
26.5
C1359
2
2
18.4
105
69
24.7
C1183
1
2
16.6
107
69
25.1
I-2. 정규성 검토 – 기술 분포
I-3. 정규성 검토 : 정규성 검정
■ “정규분포한다” 는 귀무가설에 대한 통계적 검정
Age = 1
Age = 2
I-4. t-test : 최종 결과 표
II. 대응표본 t- 검정(Paired t-test)
■ 동일한 사람에게서 두 번 반복 측정치 비교
■ 정규성 : 전-후 차이의 분포를 검정
* 비모수적 : Wilcoxon signed rank test
■ 등분산성 : 무관
II-1. 대응표본 t- 검정 : 예제
■ 신약 투여 전후 콜레스테롤 수치의 변화가 통계적 유의 ?
II-2. 차이에 대한 정규성
■ 전후 콜레스테롤 수치의 차이값은 정규 분포 ?
III. Analysis of Variance (ANOVA)
■ 독립성
■ 정규성 : 각 집단내 종속변수의 분포
* 비모수 : Kruskcal Wallis test
■ 등분산성 : 집단내 종속변수의 분산의 동질성 확인
 Levene’s test for homogeneity
III-1. Analysis of Variance (ANOVA)
■ 세 군 이상에서 군간 평균치의 분산 비교
▶ 각 군내 분산의 합(Within group variance, SSwg)과 총 평
균과 개별 군의 평균 사이에서 생겨난 분산의 합(Between
group variance, SSbg)을 F-test 로 비교, MSbg >> MSwg 이면
“군간 평균값이 모두 같다” 는 귀무가설을 기각
σ2 = ( sum of squared deviates / degrees of freedom )
F ratio = [ MSbg = SSbg/df ] / [ MSwg = SSwg/df ]
III-2. Analysis of Variance (ANOVA)
■ 어떤 군 사이에 통계적 유의한 차이가 있는가 ?
▶ Inflation of type I error due to multiple comparisons
: type I error = α
: 95 % Confidence level = 1 - α
: overall confidence level
after n multiple testing = (1 - α )n
: final type I error = 1 - (1 - α )n = 1 – ( 1 – nα) = nα
▶ Need for adjustment of type I error in pair-wise
comparisons
: Bonferroni t-test, Tukey, Duncan, Scheffe, …
III-3. Analysis of Variance (ANOVA)
* 다중비교(multiple comparison)
III-4. ANOVA : 예제
■ 일개 지역 거주 중년과 노인 대상 건강수준 평가한 연구에서 체질량지
수(<23.0 / 23,0-24.9 / >=25) 수준에 따라 수축기 혈압에 차이가 있는가 ?
idnum
sex
age
bmi07
sbp07
dbp07
bmi04
C1438
1
1
20.5
90
61
30.1
C1226
2
1
16.4
93
69
25.3
C0350
2
1
24.3
98
64
27.6
C0586
1
2
24.6
100
57
24.7
C0596
2
1
26.9
101
59
25.3
C0154
2
2
19.4
101
62
20.2
C0178
1
2
24.2
102
69
26.5
C1359
2
2
18.4
105
69
24.7
C1183
1
2
16.6
107
69
25.1
III-5. 정규성 검토 – 기술 분포 (1)
1군 : BMI < 23
III-5. 정규성 검토 – 기술 분포 (2)
2군 : 23 =< BMI < 25
III-5. 정규성 검토 – 기술 분포 (3)
3군 : BMI >= 25
III-6. 집단간 분산 동질성 검정과 최종결과
IV. 반복측정자료의 분산분석
(Repeated measures ANOVA)
■ 동일대상자에게 3회 이상 연속적으로 반복하는 경우에 사용
▶ 시간 경과에 따라 결과변수의 변화 확인
■ 각 측정시점에서의 개별 측정값의 정규성, 각 측정시점간의
등분산성은 충족되어야 함.
■ 또한 동일 개체에서의 각 측정시점간의 상관관계를 나타내는
공분산이 일정하다는 가정이 요구
▶ balanced design with no missing observation
■ Within subject test vs Between subject test
IV-1. 반복측정자료의 분산분석 - 예제
■ 출생 후 신생아의 LVEDV 이 시간경과에 따라 변화하는가 ?
ID
TIME
LVEDV
1
2
3.40
1
12
2.80
1
24
2.70
1
120
2.80
2
2
3.60
2
12
2.90
2
24
3.00
2
120
2.90
3
2
3.80
3
12
3.10
3
24
3.00
3
120
3.00
IV-2. 각 측정시점에서 관측치의 정규성 검정
Time = 2
Time = 12
Time = 24
Time = 120
IV-3. 반복측정자료의 분산분석 - 도표
IV-4. 반복 측정 분산분석 예제 - 최종 결과 표
V. 군간 비교의 비모수적 통계기법
(Non-parametric tests)
I. Wilcoxon rank-sum test vs Two sample t test
- also called as Mann–Whitney U test
II. Wilcoxon signed rank test vs Paired t-test
III. Kruskcal-Wallis test vs ANOVA
- not assume normality or equal variances, and
- instead of comparing sample means as in ANOVA,
compares sample means of ranks.
it