2011-12-15 Praktisk statistik

Download Report

Transcript 2011-12-15 Praktisk statistik

PRAKTISK STATISTISK ANALYSE
GIGO
DATAHÅNDTERING
DATATYPER
• Demografiske karakteristika
– Fx patientidentifikation, køn, alder, sociale oplysninger
• Spørgeskemaoplysninger
– Fx tidligere sygdomme, symptomer, livskvalitet
• Registeroplysninger
– Fx indlæggelsesdato, diagnose, dødsårsag
• Kliniske parametre
– Fx højde, vægt, blodtryk
• Laboratoriedata
– Fx blodprøveværdier, urindyrkninger
DATAHÅNDTERING
•
•
•
•
Per håndkraft
Elektronisk regneark
Database
Statistikprogram
fx kvadreret papir
fx Microsoft Excel
fx Microsoft Access
fx SPSS, SAS
DATABASE
Systematisk samling af data, typisk i digital form
• Rækker: Forsøgsindivider (personer, patienter, dyr)
• Kolonner
– Baggrundsvariable (ID, køn, alder, højde, vægt)
– Øvrige parametre (blodtryk, puls, alder ved diagnose)
• Så detaljeret og præcist som muligt
• Dikotome variable: 0 og 1
• Kontrol af:
– Outliers
– Manglende værdier (missing values) (9999)
• Obs. datoformat
DATABASE
Eksempel
ID-nr.
Fødeår
Køn
(m/k)
Vægt
(kg)
Højde BMI
(m) (kg/m2)
Blodtryk
(mmHg)
001
02.08.1956
1
67.3
167
24,1
120/80
002
1968
0
93
2,00
23,2
167/85
003
2002
M
56
1,87
16,0
135/77
005
03.11.19471234
0
1,78
80
25,2
145
DATABASE
Eksempel – find fejl/uhensigtsmæssigheder
ID-nr.
Fødeår
Køn
(m/k)
Vægt
(kg)
Højde BMI
(m) (kg/m2)
Blodtryk
(mmHg)
001
02.08.1956
1
67.3
167
24,1
120/80
002
1968
0
93
2,00
23,2
167/85
003
2002
M
56
1,87
16,0
135/77
005
03.11.19471234
0
1,78
80
25,2
145
DATABASE
Eksempel – find fejl/uhensigtsmæssigheder
ID-nr.
Fødeår
Køn
(m/k)
Vægt
(kg)
Højde BMI
(m) (kg/m2)
Blodtryk
(mmHg)
001
02.08.1956
1
67.3
167
24,1
120/80
002
1968
0
93
2,00
23,2
167/85
003
2002
M
56
1,87
16,0
135/77
005
03.11.19471234
0
1,78
80
25,2
145
STATISTIK
DESKRIPTIV STATISTIK
• Data indsamlet på forsøgsobjekter kaldes
observationer
• Observationer vedr. køn, alder, vægt etc.
kaldes variable
• Variable inddeles i to hovedkategorier:
– Kategoriske (kvalitative) variable
– Numeriske (kvantitative) variable
DESKRIPTIV STATISTIK
• Kategoriske (kvalitative) variable kan være:
– Dikotome
– Nominelle
– Ordinale
Udfald: A eller BMand eller kvinde
Udfald: A,B,C eller D
Blodtype
Udfald: A<B<C<D
NYHA-klasse
• Numeriske (kvantitative) variable kan være:
– Diskrete (heltal)
– Kontinuerte
80
79,6
Puls
Vægt
Valg af signifikanstests
Normalfordelte data

parametrisk statistik

non-parametrisk statistik
(kun numeriske variable)
Ikke-normalfordelte data
(kategoriske og numeriske variable)
Valg af signifikanstests
Normalfordelte data

parametrisk statistik

non-parametrisk statistik
(kun numeriske variable)
Ikke-normalfordelte data
(kategoriske og numeriske variable)
Hvordan er mine data fordelt ?
Statistiske fordelinger
Normalfordeling
Normalfordeling
Diskrete data
Kontinuerte data
90
Distribution of severe hypoglycaemia
in subjects with insulin-treated diabetes
80
70
% of patients
60
Type 1 diabetes
50
Type 2 diabetes, ins.beh.
40
30
20
10
0
0
1
2
3
4
5
6
7
8
9
10 >10
Severe hypoglycaemia, episodes per year
Normalfordelingen
 1 SD  68 %
 2 SD  95 %
 3 SD  99 %
Signifikanstests
Signifikans
tests
Kvalitative data
2x2
uparret
N ≤ 60
N > 60
Fisher
Chi2
Kvantitative data
nxm
2x2
nxm
parret
uparret
uparret
parret
uparret
parret
McNemar
Chi2
Mann
Whitney
Wilcoxon
KruskallWallis
Friedman
Uparret
t-test
Parret
t-test
ANOVA
ANOVA
Signifikanstests
Signifikans
tests
Kvalitative data
2x2
uparret
N ≤ 60
N > 60
Fisher
Chi2
Kvantitative data
nxm
2x2
nxm
parret
uparret
uparret
parret
uparret
parret
McNemar
Chi2
Mann
Whitney
Wilcoxon
KruskallWallis
Friedman
Uparret
t-test
Parret
t-test
ANOVA
ANOVA
Parametrisk statistik
DIKOTOME UDFALD
Tolkning af statistik - 1
Relativ versus absolut risiko
• X er et præparat, som ved behandling af personer med
AMI, over 5 år nedsætter dødeligheden med 29%.
• Y er et præparat, som på 5 år nedsætter dødeligheden
hos personer med AMI, fra 11,5 til 8,2%, altså med 3,3%.
• Z er et præparat, som ved behandling af 30 personer
med AMI i 5 år medfører 1 undgået dødsfald.
(Heebøll-Nielsen NC, Rationel Farmakoterapi 2011;12)
Tolkning af statistik - 1
Relativ versus absolut risiko
• X er et præparat, som ved behandling af personer med
AMI, over 5 år nedsætter dødeligheden med 29%.
= RRR
• Y er et præparat, som på 5 år nedsætter dødeligheden
hos personer med AMI, fra 11,5 til 8,2%, altså med 3,3%.
= ARR
• Z er et præparat, som ved behandling af 30 personer
med AMI i 5 år medfører 1 undgået dødsfald.
= NNT
(Heebøll-Nielsen NC, Rationel Farmakoterapi 2011;12 + 4S-resultat)
Tolkning af statistik - 2
“P-piller fordobler risikoen for blodprop”
(Hjertenyt, august 1993)
En dansk undersøgelse (Lidegaard et al 1993) fandt, at 497
kvinder i alderen 15-44 år i perioden 1985-1989 havde fået
blodprop i hjernen.
Risiko for 20-årige kvinder:
Risiko med p-piller:
2/100.000 = 0,002%
4/100.000 = 0,004%
(Heebøll-Nielsen NC, Rationel Farmakoterapi 2011;12 + 4S-resultat)
Tolkning af statistik - 2
“P-piller fordobler risikoen for blodprop”
(Hjertenyt, august 1993)
En dansk undersøgelse (Lidegaard et al 1993) fandt, at 497
kvinder i alderen 15-44 år i perioden 1985-1989 havde fået
blodprop i hjernen.
Risiko for 20-årige kvinder:
Risiko med p-piller:
2/100.000 = 0,002%
4/100.000 = 0,004%
Relativ risikoøgning
Absolut risikoøgning
100%
0,002%
(Heebøll-Nielsen NC, Rationel Farmakoterapi 2011;12 + 4S-resultat)
DIKOTOME UDFALD
Deskriptive begreber
•
•
•
•
•
•
ARR
RRR
RR
OR
NNT
NNH
Absolute Risk Reduction
Relative Risk Reduction
Relative Risk
Odds ratio
Number Needed to Treat
Number Needed to Harm
Udregning af dikotome udfald
2x2 tabel til vurdering af dikotome udfald
Udfald
Eksposition Ja
Nej
Total
Ja
Nej
Total
a
b
a+b
c
d
c+d
a+c
b+d
a+b+c+d
DIKOTOME UDFALD
Deskriptive begreber
•
•
•
•
•
•
ARR
RRR
RR
OR
NNT
NNH
c/(c+d)−a/(a+b)
ARR/(c/c+d) = (c/(c+d)−a/(a+b))/(c/c+d)
(a/a+b)/(c/c+d)
(a/c)/(b/d)
1/ARR = 1/(c/(c+d)−a/(a+b)) (hvis >0)
1/ARR = 1/(c/(c+d)−a/(a+b)) (hvis <0)
Udfald
Eksposition Ja
Nej
Total
Ja
a
c
Nej
b
d
Total
a+b
c+d
a+c
b+d
a+b+c+d
Absolute Risk Reduction (ARR)
ARR er nedsættelsen i sandsynligheden for et udfald
blandt eksponerede i forhold til hos ueksponerede.
6-års studie
Udfald
Eksposition Ja
Nej
Total
Ja
Nej
Total
15
100
135
150
150
250
115
285
400
ARR = c/(c+d)−a/(a+b) = 100/250−15/150 = 0,4-0,1
= 0,3 (30%)
Relative Risk Reduction (RRR)
RRR er nedsættelsen i sandsynligheden for et udfald
blandt eksponerede i forhold til blandt ueksponerede.
6-års studie
Udfald
Eksposition Ja
Nej
Total
Ja
Nej
Total
15
100
135
150
150
250
115
285
400
RRR = AAR/(c/c+d) = 0,3/(100/250) = 0,3/0,4
= 0,75 (75%)
Relative Risk (RR)
RR er forholdet mellem sandsynligheden for et udfald
blandt eksponerede i forhold til et udfald hos ueksponerede.
6-års studie
Udfald
Eksposition Ja
Nej
Total
Ja
Nej
Total
15
100
135
150
150
250
115
285
400
RR = (a/a+b)/(c/c+d) = (15/150)/(100/250) = 0,1/0,4
= 0,25 (25 %)
Odds Ratio (OR)
OR er forholdet mellem odds for udfaldet blandt
eksponerede og odds for udfaldet blandt ueksponerede.
6-års studie
Eksposition Ja
Nej
Total
Udfald
Ja
15
100
115
Nej
135
150
285
Total
150
250
400
OR = (a/c)/(b/d) = ad/bc = (15x150/135x100) = 2250/13500
= 0,167 (17 %)
Number Needed to Treat (NNT)
NNT er det antal eksponerede patienter, der skal
behandles for at få ét positivt udfald i et defineret tidsrum.
6-års studie
(Virkning)
Eksposition Ja
Nej
Total
Udfald
Ja
Nej
Total
15
100
115
135
150
285
150
250
400
NNT = 1/ARR = 1/((100/250)−15/150)) = 1/(0,4−0,1)
= 3,33 ptt. i 6 år eller 20 ptt. i 1 år
Number Needed to Harm (NNH)
NNH er det antal eksponerede patienter, der skal
behandles for at få ét negativt udfald i et defineret tidsrum.
6-års studie
Udfald
(Bivirkning)
Eksposition Ja
Nej
Total
Ja
Nej
Total
135
15
150
150
285
100
115
250
400
NNH = 1/ARR = 1/(c/(c+d)−a/(a+b)) = 1(150/250−135/150)
= 1/(0,6−0,9) = 1,11 ptt. i 6 år eller 6,67 ptt. i 1 år
ARR, RRR og NNT i JUPITER
Rosuvastatins forebyggende effekt på kardiovaskulær
sygdom og død hos raske med forhøjet hsCRP
1,9-års studie
Udfald (CVD composite)
Eksposition Ja
Nej
Total
Ja
Nej
Total
142
251
393
8901
8901
17802
9043
9152
18195
ARR = ???
RRR = ???
NNT = ???
(Ridker et al. N Engl J Med 2008;359:2195-207)
ARR, RRR og NNT i JUPITER
Rosuvastatins forebyggende effekt på kardiovaskulær
sygdom og død hos raske med forhøjet hsCRP
1,9-års studie
Udfald (CVD composite)
Eksposition Ja
Nej
Total
Ja
Nej
Total
142
251
393
8901
8901
17802
9043
9152
18195
ARR = c/(c+d)−a/(a+b) = 251/9152−142/9043 = 0,0117 (1,2%)
RRR = ARR/(c/(c+d)) = 0,0117/0,0274 = 0,42 (42%)
NNT = 1/ARR = 1/0,0117 = 85 i 1,9 år, 161 i 1 år.
(Ridker et al. N Engl J Med 2008;359:2195-207)
ARR og NNH i ACCORD
Effekt af intensiv glukosekontrol på død af enhver årsag
hos patienter med type 2 diabetes
3½-års studie
Udfald (død)
Eksposition Ja
Nej
Total
Ja
Nej
Total
257
203
460
4871
4920
9791
5128
5123
10251
ARR = ???
NNH = ???
(ACCORD Study Group, N Engl J Med 2008;358:2545-59)
ARR og NNH i ACCORD
Effekt af intensiv glukosekontrol på død af enhver årsag
hos patienter med type 2 diabetes
3½-års studie
Udfald (død)
Eksposition Ja
Nej
Total
Ja
Nej
Total
257
203
460
4871
4920
9791
5128
5123
10251
ARR = c/(c+d)−a/(a+b) = 203/5123−257/5128 = -0,0105 (-1,1%)
NNH= 1/ARR = 1/-0,0105 = 95 i 3,5 år eller 333 i 1 år.
(ACCORD Study Group, N Engl J Med 2008;358:2545-59)
ARR og NNT - ARBs
Effekt af losartan vs. candesartan på kardiovaskulære
hændelser hos patienter med hypertension, men uden CVD
2-års databasestudie
Udfald (CVD composite)
Eksposition Can
Los
Total
Ja
Nej
Total
575
676
1251
6754
6095
12849
7329
6771
14100
ARR = ???
RRR = ???
NNT = ???
(Kjeldsen at al, J Human Hypertens 2010;24:263)
ARR og NNT - ARBs
Effekt af losartan vs. candesartan på kardiovaskulære
hændelser hos patienter med hypertension, men uden CVD
2-års databasestudie
Udfald (CVD composite)
Eksposition Can
Los
Total
Ja
Nej
Total
575
676
1251
6754
6095
12849
7329
6771
14100
ARR = c/(c+d)−a/(a+b) = 676/6771−575/7329 = 0,0214 (2,1%)
RRR = ARR/(c/(c+d)) = 0,0214/0,0998 = 0,21 (21%)
NNT = 1/ARR = 1/0,0214 = 47 i 2 år eller 94 i 1 år på candesartan
(Kjeldsen at al, J Human Hypertens 2010;24:263)
PRAKTISK STATISTISK ANALYSE
GO GO !!