Transcript a 1

Medicinsk statistik III
Läkarprogrammet, Termin 5
HT 2013
Jonas Björk
E-post: [email protected]
Medicinsk statistik III
•
Mer om statistik för binära utfall
–
•
Kapitel 12
Dimensionering av studier
–
–
–
–
•
Statistisk styrka (power)
En grupp, två grupper
Kontinuerliga och binära utfall
Avsnitt 6.4, 8.4 och 10.4
Tolkning av p-värden
–
–
Statistiska vs. diagnostiska test
Avsnitt 9.2
Kapitel 12
Avsnitt 6.4, 8.4,
9.2 och 10.4
Webbplats
1. Binära utfall
Binära utfall
•
•
•
•
Sjuk / frisk
Positiv / negativ
Reaktion / ingen reaktion
...
• Dikotomiseringar
1. Binära utfall
Dikotomiseringar
• Kontinuerliga data
– CRP > 15
– Systoliskt blodtryck >160 mmHg
• Ordinaldata (data endast möjliga att rangordna)
Ex. Klassning av allergisk reaktion
+++, ++(+), ++, +(+), +, (+), ?, Information kastas bort – väsentlig eller ovidkommande?
1. Binära utfall
Binära utfall - Exempel
•
Alarm om glutenallergi bland barn
Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man
att 212 (2,9%) var glutenintoleranta
1. Hur stor är den statistiska felmarginalen
2. Kan vi vara ”säkra” på att den verkliga andelen
glutenintoleranta är över 2%?
1. Binära utfall
Konfidensintervall (KI) kring
en uppskattad andel
n = 7 207, a = 212 positiva
Prevalens q =a / n = 0,029 = 2,9%
Om a  5 och (n – a)  5 kan konfidensintervallet beräknas
på följande sätt (asymptotisk = ungefärlig metod):
95% konfidensgrad  c = 1,96, SE = Medelfel (Standard error)
SE 
q(1  q)
0,029  0,971

 0,0020
n
7207
q  c  SE  0,029  1.96  0,0020  0,029  0,004  2,9%  0,4%
Felmarginal ± 0,4%
95% KI: 2,5 - 3,3%
2. Dimensioneringsberäkningar - en grupp
Uppskatta en andel
Hur stor ska studien vara?
• Anta att vi vill skatta en andel q,
t.ex. en prevalens eller risk
• Hur stor studien bör vara bestäms av
– Andelen q (okänd för oss, men vi kan kanske gissa)
– Önskad felmarginal F
• Utnyttja formel för 95% KI, lös ut n:
I boken finns motsvarande formel
för ett medelvärde (formel 6.3)
1. Binära utfall
Jämförelse av två andelar
Två separata (oberoende) grupper: q1 = a1 / n1, q2= a2 / n2
• Differens q1 – q2
-Ex. prevalensdifferens, riskdifferens
• Kvot q1 / q2
-Ex. prevalenskvot, riskkvot (RR = relativ risk)
• Oddskvot OR = 1 / 2
Odds 1 = q1 / (1 – q1),
2 = q2 / (1 – q2)
1. Binära utfall
Jämförelser av andelar
Randomiserad studie av tamoxifen, strålbehandling och
återfall av bröstcancer under fem års uppföljning
(Overgaard et al. 1999)
Sjukdomsfri överlevnad i grupp 1:q1 = 357 / 686  0,52 = 52%
Sjukdomsfri överlevnad i grupp 1:q2 = 276 / 689  0,40 = 40%
Vad kan vi säga om skillnaden i
sjukdomsfri överlevnad (eller i återfallsrisk)?
1. Binära utfall
Differens mellan två andelar
Randomiserad studie av tamoxifen, strålbehandling och
återfall av bröstcancer bland kvinnor
Riskdifferens RD (absolut riskreduktion) = 357/ 686 – 276 / 689  0,12 =
12 fler sjukdomsfria per 100 behandlade
Medelfel
SE
q1 (1  q1 ) q2 (1  q2 )
0,520  0,480 0,401 0,599



 0,0267
n1
n2
686
689
Om a15, (n1 – a1)5, a2 5 och (n2 – a2)5 kan ett 95% KI för RD bildas som
RD  1.96  SE  0,12  1,96  0,0267  0,12  0,052
7 – 17 fler per 100
1. Binära utfall
Antal som behöver behandlas
NNT = Numbers Needed to Treat
Från föregående problem:
Riskdifferens RD = 357 / 689 – 276 / 686  0,12 = 12 fler sjukdomsfria per 100 behandlade
• NNT = 1 / RD  1 / 0,12  8,3
vilket innebär att ungefär 8 (8,3) patienter behöver behandlas
med kombinationsbehandlingen för att förhindra ett återfall i
genomsnitt
• 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172
1 / RD
• 95% KI för NNT: 6 till 15 patienter behöver behandlas
för att förhindra ett återfall i genomsnitt
1. Binära utfall
Kvot mellan två andelar
Randomiserad studie av tamoxifen, strålbehandling och
återfall av bröstcancer bland kvinnor
Relativ risk RR = (413 / 689) / (329 / 686)  1,25 gånger (25%) högre risk
om enbart tamoxifen ges
ln(RR) = ln(1,25)  0,223
Medelfel
SE
1
1
1
1



 0,0739
q1n1 q2 n2
0,480  686 0,599  689
95% KI för RR bildas på log-skalan som
ln(RR)  1,96  SE  0,223  1,96  0,0739  0,223  0,145
e0,2230,145  1,08
e0, 2230,145  1,44
1,08 – 1,44
gånger
högre risk
1. Binära utfall
Oddskvot (OR) i
fall-kontrollundersökningar
Odds för exponering bland fall: 630/101  6,2
Odds för exponering bland kontroller: 573/158  3,6
70% riskökning bland rökare
95 % KI: 1,3 till 2,3 (30 till 130% riskökning)
2. Dimensioneringsberäkningar - två grupper
Statistisk styrka
• Sannolikheten a priori att H0 kommer att
förkastas, givet en viss verklig skillnad
mellan de grupper som studeras
• Sensitiviteten hos det statistiska testet
(jämför sensitivitet hos diagnostiska test)
2. Dimensioneringsberäkningar
Dimensioneringsberäkningar
Två oberoende grupper,
medelvärdesjämförelse
(Kursboken s. 156)
2. Dimensioneringsberäkningar
Dimensionering av
två oberoende grupper
3. Dimensioneringsberäkningar
2.
Statistisk styrka
Gruppstorlek vs. effektstorlek
2. Dimensioneringsberäkningar
Syreupptagningsförmåga
Replikera tidigare resultat i en ny studie
Låg
Medel/Hög
2 5%
Percent
2 0%
1 5%
spooled  8
1 0%
5%
30
40
50
60
Statisticsa
Uppskattad maximal syreupptagningsförmåga [ml/(kg *min)]
N
Valid
36
Missing
9
Mean
38.50
Percentiles
25
33.00
50
38.50
75
43.00
a. Intensitetsnivå i konditionsträning = Låg
30
40
50
60
Statisticsa
Uppskattad maximal syreupptagningsförmåga [ml/(kg *min)]
N
Valid
99
Missing
30
Mean
43.82
Percentiles
25
38.00
50
43.00
75
49.00
a. Intensitetsnivå i konditionsträning = Medel/Hög
2. Dimensioneringsberäkningar
Dimensioneringsberäkning (enl. 1.)
Två oberoende grupper,
medelvärdesjämförelse
2


 s  k1  k 2 
n  2





5% signifikansgräns  k1 = 1.96
80% statistisk styrka  k2 = 0.84
• Ex. Syreupptagningsförmåga
  5.0, s  8,  / s  0.625
Standardiserad
effektstorlek
 8  1.96  0.84 
n A  nB  2  
  40 per
5
grupp


2
2. Dimensioneringsberäkningar
Dimensioneringsberäkningar - Allmänt
• Redovisas först och främst för primär frågeställning.
• Minst 80% statistisk styrka är ett vanligt krav om nya data ska
samlas in
• Gör beräkningen under olika antaganden om , s
Standardiserad effektstorlek =  / s avgörande
• Ibland enklare att uppskatta variationskoefficienten
(CV=Coefficient of variation, mätt i % av medelvärdet) än
standardavvikelsen
• Ta hänsyn till förväntad deltagandefrekvens
• Utnyttja tidigare studier inom området!
• I en överlevnadsanalys är det antal händelser (events) som
avgör. Avvägning: Uppföljningstid - Antal patienter
3 Statistisk
2.
Dimensioneringsberäkningar
styrka
Program för
dimensioneringsberäkningar
• PS Power and Sample Size Calculation
– Enkelt, lätt att använda
– Kan laddas ned gratis via
http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/
PowerSampleSize
• G*Power 3
– Mer avancerat, något svårare att använda
– Kan laddas ned gratis via
http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3
2. Dimensioneringsberäkningar
Diskutera med bänkgrannen...
Känslighetsanalys
Vad händer med minsta gruppstorlek i
exemplet på föregående bilder om
• Man vill kunna detektera en skillnad som är hälften
så stor, dvs  = 5 / 2 = 2,5 ?
• Standardavvikelsen s är 12 istället för 8 i båda
grupperna?
• 90% statistisk styrka krävs (k2 = 1,28)?
3. Dimensioneringsberäkningar
2.
Statistisk styrka
Förklara studiens storlek
Randomiserad studie av tamoxifen, strålbehandling
och återfall av bröstcancer
Författarna skrev så här
i metoddelen:
(Overgaard et al. 1999)
2. Dimensioneringsberäkningar
Fall-kontrollundersökning
Hur många fall och kontroller behövs?
• Förväntad OR =1.7 enligt tidigare studie
• Rökprevalens i den befolkning vi studerar?
• Utnyttja PS Power Sample Size
4. Tolkning av p-värden
3.
Statistiskt vs. Diagnostiskt test
• Statistisk styrka = Sensitivitet
• Signifikansgräns (; ofta 5%) = 1 - Specificitet
(Kursboken, s. 261)
3. Tolkning av p-värden
Tolkning av
p-värden
Sifting the evidence –
what’s wrong with significance tests?
Modernt förhållningssätt
•
P-värdet bör främst ses som ett index
(0-1) som svarar på följande fråga:
Vilka belägg mot nollhypotesen finns i
insamlade data?
•
Undvik skarp signifikansgräns
Ex. p = 0,04 och p =0,06 är två snarlika
resultat som båda ger ”måttliga” evidens
mot nollhypotesen
•
P-värdet är inte sannolikheten att
nollhypotesen är sann:
(Sterne & Smith
BMJ 2001;322:226-231)
3. Tolkning av p-värden
Testets prediktiva värden bestäms av
sjukdomsprevalensen
3. Tolkning av p-värden
Sannolikheten att H0 är sann
FPRP = False Positive Report Probability
P-värde
omkring
0,001
innebär i
allmänhet
starka
belägg för
ett
samband