Transcript a 1
Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013 Jonas Björk E-post: [email protected] Medicinsk statistik III • Mer om statistik för binära utfall – • Kapitel 12 Dimensionering av studier – – – – • Statistisk styrka (power) En grupp, två grupper Kontinuerliga och binära utfall Avsnitt 6.4, 8.4 och 10.4 Tolkning av p-värden – – Statistiska vs. diagnostiska test Avsnitt 9.2 Kapitel 12 Avsnitt 6.4, 8.4, 9.2 och 10.4 Webbplats 1. Binära utfall Binära utfall • • • • Sjuk / frisk Positiv / negativ Reaktion / ingen reaktion ... • Dikotomiseringar 1. Binära utfall Dikotomiseringar • Kontinuerliga data – CRP > 15 – Systoliskt blodtryck >160 mmHg • Ordinaldata (data endast möjliga att rangordna) Ex. Klassning av allergisk reaktion +++, ++(+), ++, +(+), +, (+), ?, Information kastas bort – väsentlig eller ovidkommande? 1. Binära utfall Binära utfall - Exempel • Alarm om glutenallergi bland barn Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta 1. Hur stor är den statistiska felmarginalen 2. Kan vi vara ”säkra” på att den verkliga andelen glutenintoleranta är över 2%? 1. Binära utfall Konfidensintervall (KI) kring en uppskattad andel n = 7 207, a = 212 positiva Prevalens q =a / n = 0,029 = 2,9% Om a 5 och (n – a) 5 kan konfidensintervallet beräknas på följande sätt (asymptotisk = ungefärlig metod): 95% konfidensgrad c = 1,96, SE = Medelfel (Standard error) SE q(1 q) 0,029 0,971 0,0020 n 7207 q c SE 0,029 1.96 0,0020 0,029 0,004 2,9% 0,4% Felmarginal ± 0,4% 95% KI: 2,5 - 3,3% 2. Dimensioneringsberäkningar - en grupp Uppskatta en andel Hur stor ska studien vara? • Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk • Hur stor studien bör vara bestäms av – Andelen q (okänd för oss, men vi kan kanske gissa) – Önskad felmarginal F • Utnyttja formel för 95% KI, lös ut n: I boken finns motsvarande formel för ett medelvärde (formel 6.3) 1. Binära utfall Jämförelse av två andelar Två separata (oberoende) grupper: q1 = a1 / n1, q2= a2 / n2 • Differens q1 – q2 -Ex. prevalensdifferens, riskdifferens • Kvot q1 / q2 -Ex. prevalenskvot, riskkvot (RR = relativ risk) • Oddskvot OR = 1 / 2 Odds 1 = q1 / (1 – q1), 2 = q2 / (1 – q2) 1. Binära utfall Jämförelser av andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning (Overgaard et al. 1999) Sjukdomsfri överlevnad i grupp 1:q1 = 357 / 686 0,52 = 52% Sjukdomsfri överlevnad i grupp 1:q2 = 276 / 689 0,40 = 40% Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)? 1. Binära utfall Differens mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Riskdifferens RD (absolut riskreduktion) = 357/ 686 – 276 / 689 0,12 = 12 fler sjukdomsfria per 100 behandlade Medelfel SE q1 (1 q1 ) q2 (1 q2 ) 0,520 0,480 0,401 0,599 0,0267 n1 n2 686 689 Om a15, (n1 – a1)5, a2 5 och (n2 – a2)5 kan ett 95% KI för RD bildas som RD 1.96 SE 0,12 1,96 0,0267 0,12 0,052 7 – 17 fler per 100 1. Binära utfall Antal som behöver behandlas NNT = Numbers Needed to Treat Från föregående problem: Riskdifferens RD = 357 / 689 – 276 / 686 0,12 = 12 fler sjukdomsfria per 100 behandlade • NNT = 1 / RD 1 / 0,12 8,3 vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt • 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172 1 / RD • 95% KI för NNT: 6 till 15 patienter behöver behandlas för att förhindra ett återfall i genomsnitt 1. Binära utfall Kvot mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Relativ risk RR = (413 / 689) / (329 / 686) 1,25 gånger (25%) högre risk om enbart tamoxifen ges ln(RR) = ln(1,25) 0,223 Medelfel SE 1 1 1 1 0,0739 q1n1 q2 n2 0,480 686 0,599 689 95% KI för RR bildas på log-skalan som ln(RR) 1,96 SE 0,223 1,96 0,0739 0,223 0,145 e0,2230,145 1,08 e0, 2230,145 1,44 1,08 – 1,44 gånger högre risk 1. Binära utfall Oddskvot (OR) i fall-kontrollundersökningar Odds för exponering bland fall: 630/101 6,2 Odds för exponering bland kontroller: 573/158 3,6 70% riskökning bland rökare 95 % KI: 1,3 till 2,3 (30 till 130% riskökning) 2. Dimensioneringsberäkningar - två grupper Statistisk styrka • Sannolikheten a priori att H0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras • Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test) 2. Dimensioneringsberäkningar Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse (Kursboken s. 156) 2. Dimensioneringsberäkningar Dimensionering av två oberoende grupper 3. Dimensioneringsberäkningar 2. Statistisk styrka Gruppstorlek vs. effektstorlek 2. Dimensioneringsberäkningar Syreupptagningsförmåga Replikera tidigare resultat i en ny studie Låg Medel/Hög 2 5% Percent 2 0% 1 5% spooled 8 1 0% 5% 30 40 50 60 Statisticsa Uppskattad maximal syreupptagningsförmåga [ml/(kg *min)] N Valid 36 Missing 9 Mean 38.50 Percentiles 25 33.00 50 38.50 75 43.00 a. Intensitetsnivå i konditionsträning = Låg 30 40 50 60 Statisticsa Uppskattad maximal syreupptagningsförmåga [ml/(kg *min)] N Valid 99 Missing 30 Mean 43.82 Percentiles 25 38.00 50 43.00 75 49.00 a. Intensitetsnivå i konditionsträning = Medel/Hög 2. Dimensioneringsberäkningar Dimensioneringsberäkning (enl. 1.) Två oberoende grupper, medelvärdesjämförelse 2 s k1 k 2 n 2 5% signifikansgräns k1 = 1.96 80% statistisk styrka k2 = 0.84 • Ex. Syreupptagningsförmåga 5.0, s 8, / s 0.625 Standardiserad effektstorlek 8 1.96 0.84 n A nB 2 40 per 5 grupp 2 2. Dimensioneringsberäkningar Dimensioneringsberäkningar - Allmänt • Redovisas först och främst för primär frågeställning. • Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in • Gör beräkningen under olika antaganden om , s Standardiserad effektstorlek = / s avgörande • Ibland enklare att uppskatta variationskoefficienten (CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen • Ta hänsyn till förväntad deltagandefrekvens • Utnyttja tidigare studier inom området! • I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter 3 Statistisk 2. Dimensioneringsberäkningar styrka Program för dimensioneringsberäkningar • PS Power and Sample Size Calculation – Enkelt, lätt att använda – Kan laddas ned gratis via http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/ PowerSampleSize • G*Power 3 – Mer avancerat, något svårare att använda – Kan laddas ned gratis via http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3 2. Dimensioneringsberäkningar Diskutera med bänkgrannen... Känslighetsanalys Vad händer med minsta gruppstorlek i exemplet på föregående bilder om • Man vill kunna detektera en skillnad som är hälften så stor, dvs = 5 / 2 = 2,5 ? • Standardavvikelsen s är 12 istället för 8 i båda grupperna? • 90% statistisk styrka krävs (k2 = 1,28)? 3. Dimensioneringsberäkningar 2. Statistisk styrka Förklara studiens storlek Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer Författarna skrev så här i metoddelen: (Overgaard et al. 1999) 2. Dimensioneringsberäkningar Fall-kontrollundersökning Hur många fall och kontroller behövs? • Förväntad OR =1.7 enligt tidigare studie • Rökprevalens i den befolkning vi studerar? • Utnyttja PS Power Sample Size 4. Tolkning av p-värden 3. Statistiskt vs. Diagnostiskt test • Statistisk styrka = Sensitivitet • Signifikansgräns (; ofta 5%) = 1 - Specificitet (Kursboken, s. 261) 3. Tolkning av p-värden Tolkning av p-värden Sifting the evidence – what’s wrong with significance tests? Modernt förhållningssätt • P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga: Vilka belägg mot nollhypotesen finns i insamlade data? • Undvik skarp signifikansgräns Ex. p = 0,04 och p =0,06 är två snarlika resultat som båda ger ”måttliga” evidens mot nollhypotesen • P-värdet är inte sannolikheten att nollhypotesen är sann: (Sterne & Smith BMJ 2001;322:226-231) 3. Tolkning av p-värden Testets prediktiva värden bestäms av sjukdomsprevalensen 3. Tolkning av p-värden Sannolikheten att H0 är sann FPRP = False Positive Report Probability P-värde omkring 0,001 innebär i allmänhet starka belägg för ett samband