정확도와 신뢰도

Download Report

Transcript 정확도와 신뢰도

ROC Method
기모란
을지의과대학교 예방의학교실
차례
 정확도(Validity)
 ROC 그래프 그리기
 SPSS
 MedCalc
 Excel
 민감도, 특이도 관련요인
 예측도(Predictive value)
 우도비(Likelihood ratios)
좋은 진단 검사란?
정확도와 신뢰도
진단검사: 질병을 가진 사람과 가지지 않은
사람을 구분하기 위해서 시행
 검사의 정확도
(타당도, validity, accuracy,)
 검사의 신뢰도
(정밀도, reliability, precision, reproducibility,
stability)

정확도가 높은 것은?
신뢰도가 높은 것은?
A
B





74

C
 


 




70
95
진단법의 정확도
(타당도, Validity, Accuracy)
정확도(validity)
 검사의 정확성: 질병이 있고 없고를 구분해내
는 능력
 민감도(sensitivity)와 특이도(specificity)
 민감도: 질병이 있는 사람을 질병이 있다고 판단
해내는 능력
 특이도: 질병이 없는 사람을 질병이 없다고 판단
해내는 능력
신뢰도 평가
 명목형, 순서형 척도
 카파 통계량(Kappa statistics), 스피어만의 상
관계수, 켄달계수, 스튜어트 계수
 연속형 척도
 피어슨의 상관계수(Pearson’s Correlation
coefficient)
Sensitivity & Specificity
Population
Test
Results
Positive
With
Disease
True +(a)
Without
Disease
False +(b)
Negative
False -(c)
True -(d)
Sensitivity = a / (a+c) = TP / (TP+FN)=TP rate
Specificity = d / (b+d)= TN / (FP+TN)=TN rate
Predictive value
Population
Test
Results
With
Disease
Without
Disease
Positive
True +(a)
False +(b)
+PV=a/(a+b)
=TP/(TP+FP)
Negative
False -(c)
True -(d)
-PV=d/(c+d)
=TN/(FN+TN)
Sensitivity = a / (a + c)
Specificity = d / (b + d)
Prevalence
Population
Test
Results
With
Disease
Without
Disease
Positive
True +(a)
False +(b)
+PV=a/(a+b)
Negative
False -(c)
True -(d)
-PV=d/(c+d)
Sensitivity = a / (a + c)
Specificity = d / (b + d)
P= a+c / (a+b+c+d)
Likelihood Ratios
Population
Test
Results
With
Disease
Without
Disease
Positive
True +(a)
False +(b)
Negative False -(c)
True -(d)
LR+ = Sen/(1-Spe)
=TP rate/FP rate
LR- = (1-Sen)/Spe
=FN rate/TN rate
예) 1,000명의 인구집단 (유병률 10%)
True characteristics in the pop.





Test Results
Disease
No Disease
Total
Positive
80
100
180
Negative
20
800
820
total
100
900
1,000
Sensitivity = a / (a + c)= 80 /100 = 80%
Specificity = d / (b + d) = 800/900 = 89%
+PV=a/(a+b) = 80/180= 44%, -PV=d/(c+d) = 800/820=98%
LR+= TP rate/FP rate = (80/100) / (100/900) = 7.2
LR-= FN rate/TN rate = (20/100) / (800/900) = 0.225
Sensitive test
 민감한 검사?
 질병이 있으면 거의 대부분 양성이 나오는 검사
 언제 중요?
 검사 결과가 음성일 때 가치가 있음.
 언제 사용?
 스크리닝 검사
 질병을 조기에 진단하지 못하고 놓쳤을 때 예후가 심각
하게 나빠지는 질병
 심각한 질환이나 치료방법이 있을 때
 예Tb, syphilis, Hodgkin’s disease, …
Specific test
 특이도가 높은 검사?
 질병이 없으면 양성결과가 거의 나오지 않는 검사
 언제 중요?
 검사 결과가 양성일 때 가치가 있음.
 언제 사용?
 확진 검사
 위양성이 환자에게 신체적으로, 정신적으로, 경제적으
로 크게 손해를 입히는 경우
 암수술 등의 치료를 시작하기 위해서는 조직검사를 시
행해야 함.
Trade-Offs between Sen. and Sp.
 진단검사 기준점(Cut-off point): between
normal and abnormal
 Too low cut-off: sensitivity specificity
 Too high cut-off: sensitivity specificity
Receiver Operating Characteristic
(ROC) curve.
Why ROC?
 World War II, radar images 분석을 위해 개
발된 “Signal Detection Theory”에서 시작
 Radar의 깜박거리는 물체가 아군인지, 적군
인지, 단순한 noise인지 구분해야 함
Radar receiver operators의 이러한 구분 능
력을 “Receiver Operating Characteristics”
라 부름
 1970’s 이후에 의학진단분야에 적용
Sensitivity and specificity for prostate specific antigen and prostate cancer
at various cutoff points, during 7 years of follow-up: Physicians’ Health
Study (203 cases and 609 controls). JAMA (1995) 273:292
Fasting glucose for diagnosing
diabetes mellitus (ng/dl)
The area under an ROC curve
 Accuracy





0.9-1.0
0.8-0.9
0.7-0.8
0.6-0.7
0.5-0.6
=
=
=
=
=
excellent (A)
good (B)
fair (C)
poor (D)
fail (F)
 Meaning
 Discrimination: 환자군과 대조군에서 각각 1명
씩 뽑아서 이들에게 검사를 시행하여 제대로 분
류할 확률
SPSS 활용 1
 자료 입력
 확진검사 결과
(환자/ 정상)
 검사결과는 한가지
또는 그 이상
SPSS 활용 2
 그래프ROC
곡선
 Graph ROC
curve
SPSS 활용 3
 상태변수 값:
환자 상태, 1
SPSS 활용 4
ROC 곡선
1.0
곡선의 소스
검사_1
검사_2
참조선
0.8
민감도
0.6
0.4
곡선 아 래 영역
0.2
근사 95% 신뢰구간
근사 유의
영역
표준 오차a
확률b
하한
상한
.947
.024
.000
.900
.994
.679
.053
.002
.574
.784
검정 결과 변수: 검사_1, 검사_2에는 양의 실제 상태 집단과 음의 실제 상태 집단
사이에 하나 이상의 동률이 있습니다. 통계량은 편향될 수 있습니다.
a. 비모수 가정 아래
b. 영가설: 실제 영역 = 0.5
검정 결과 변수
검사_1
검사_2
0.0
0.0
0.2
0.4
0.6
0.8
1.0
1 - 특이도
대각 세그먼트는 동률에 의해 생성됩니다.
MedCalc 1
MedCalc 4
MedCalc 6
Excel 활용 1
Excel 활용 2
Excel 활용 3
ROC curve by Excel
1.000
0.900
0.800
Sensitivity
0.700
0.600
0.500
0.400
0.300
0.200
0.100
0.000
0.000
0.200
0.400
0.600
1-Specificity
0.800
1.000
민감도, 특이도 관련요인 1.
1. Improper gold standard
 New test가 더 정확해도 기준보다 낮게 평가됨
2. Spectrum of Patients
 환자군의 질병수준: more severe ↑민감도
 정상군이 검사에 영향을 미치는 다른 질병 가짐.
: FP↑  특이도↓
예) CEA ↑ (Ulcerative colitis, cirrhosis)
민감도, 특이도 관련요인 2.
3. 유병률(Prevalence)
 이론적으로는 유병률과 독립적임
 실제: 낮은 유병률 검진 그룹의 환자들은 대
부분 earlier & less severe 상태
 민감도↓ 특이도 ↑
Breast Exam.(75000명)*
민감도
특이도
증상이 있는 그룹
85%
73%
증상이 없는 그룹
36%
96%
*Bobo et al. J Natl Cancer Inst 2000; 92:971-6.
민감도, 특이도 관련요인 3.
4. Bias
 검사자의 다른 정보를 알고 있는 경우
예)clinical impression을 알고 x-ray 판독을 하는
경우 정확도 증가
5. Chance
 Small sample size 95% CI을 확인해야 함
표본수별 95% CI: 민감도 75% 경우
N=10, 95% CI: 45%-100%
Predictive value
Population
Test
Results
Positive
Negative
With
Disease
True +(a)
False -(c)
Without
Disease
False +(b)
True -(d)
Bayes’ theorem of conditional probability
+PV=a/(a+b)
-PV=d/(c+d)
PV, 양성예측도
 지역사회에서 집단검진을 할 때:
 질병을 가진 사람이 얼마나 질병이 있다고 제
대로 확인될 것인가?(Sensitivity)
 임상의사가 환자를 볼 때:
 검사에서 양성으로 나왔을 때 이 환자가 진짜
로 병이 있을 확률이 얼마나 되는가? (positive
predictive value of the test)
예측도 관련요인
 유병률
 특이도
 민감도
Relationship of Disease
prevalence to Predictive Value
Sensitivity = 99%, specificity =95%
Disease
prevalence
Test
Results
Sick
Not Sick
Totals
1%
+
99
495
594
-
1
9405
9406
Totals
100
9900
10,000
+
495
475
970
-
5
9025
9303
Totals
500
9500
10,000
+
990
450
1,440
-
10
8,550
8,560
Totals
1,000
9,000
10,000
5%
10%
Predictive
Value
99/594=17%
495/970=51%
990/1,440=69%
Relationship between disease
prevalence and predictive value
(95% sensitivity
and 95% specificity).
민감도,
특이도
의 영향
정확도, 유병률, 양성예측도의 관계
이 의사의 판단은 옳은가?
 한 소방서의 담당의사가 최근에 저널을 읽
었다. 병원의 환자를 대상으로 검사해본 결
과 EKG결과의 예측도가 아주 높아서 증상
이 없어 인식하고 있지 못하던 심혈관 질환
을 미리 알 수 있다는 것이었다. 이 저널을
기초로 소방서의 의사는 소방서 직원의 검
진에서 많은 젊은 소방수들을 불합격 판정
하였다.
누구의 말이 옳은가?

한 의사가 정기검진을 받으러 그의 동내 주치의에게 갔다. 거기서 그는 대변의 잠혈반
응검사(stool occult blood test)를 받았다.

주치의는 3개의 stool specimen을 검사했는데 하나가 양성을 보였다. 주치의는 그의
의사환자에게 “이 결과는 별 의미가 없는 것입니다. 왜냐하면 저는 이런 경험을 많이 하
였는데 이 검사는 위양성이 상당히 높기 때문이지요”라고 하였다. 그리고 다시 검사하
였는데 이번에는 모두 음성이었다.

그런데 검사를 받은 의사는 아무래도 걱정이 되어 망설이고 있었다. 그래서 주치의는
종합병원의 위장질환전문의에게 이 환자를 의뢰하였다. 종합병원의 주치의는 검사결
과를 보고 “내 경험에 의하면 대변의 잠혈반응 양성은 아주 중요하고 심각한 결과입니다.
두번째 검사에서 음성으로 나온 것은 의미가 없습니다. 왜냐하면 암에 의한 bleeding은
간헐적으로 일어나기 때문이지요” 라고 하였다.
유병률을 증가시키는 요인
 Referral Process
 3차병원으로 갈수록 증가
 Selected Demographic Groups
 Atypical chest pain coronary artery
disease? 65세 남자가 30세 여자보다 15배 더
가능성
 Specifics of the Clinical Situation
 Symptoms, signs, risk factors, etc.
Multiple Tests
Two Serial testing
예) DM 유병률=5%, Pop. 10,000
Test 1
(Blood Sugar)
Sensitivity =70%,
Specificity = 80%
Diabetes
Test Results
+
-
Total
+
350
1900
2250
-
150
7600
7750
Total
500
9500
10,000
Test 2 (Glucose Tolerance Test)
Sen. =90%, Sp. = 90%
Diabetes
Test Results
+
-
+
315
190
-
35
1710
Total
350
1900
Net Sensitivity = 315 / 500 = 63%
Net Specificity = (7600+1710) /9500 = 98%
Total
2250
Likelihood Ratios
Population
Test
Results
With
Disease
Without
Disease
Positive
True +(a)
False +(b)
Negative False -(c)
True -(d)
LR+ = Sen/(1-Spe)
=TP rate/FP rate
LR- = (1-Sen)/Spe
=FN rate/TN rate
Likelihood Ratios
 LR+ 정의
 환자군에서 검사가 양성으로 나오는 것이 정상
군에서 양성으로 나오는 것의 몇배인가?
 (환자군에서 정상군보다 몇배나 더 많이 검사
양성이 나오는가?)
 4:1=80%, 7:2=7/9=78%
Hypothyroid에서 혈청Thyroxine분포
Rule of Thumb
Likelihood ratio
Approximate Change in
Disease Probability (%)
10
9
8
7
6
5
4
3
2
1
+ 45
+ 40
+35
+30
+25
+20
+15
No Change
감사합니다!