Transcript t-toets
Statistische uitspraken over onbekende populatiegemiddelden Uitspraken over één populatiegemiddelde Het vergelijken van twee populatiegemiddelden Gepaarde waarnemingen Het vergelijken van meer dan twee populatiegemiddelden Statistische uitspraken over onbekende populatiegemiddelden Toets van de hypothese µ = µ0 Vraag: Is een aselecte steekproef van n elementen met gemiddelde van de meting <x> en spreiding s, afkomstig uit een normaal verdeelde populatie met populatiegemiddelde µ0 en met onbekende spreiding sigma ? Toetsing: toets van Student (Gosset) NB toetsingsgrootheden: gestandaardiseerd verschil NB vrijheidsgraden Statistische uitspraken over onbekende populatiegemiddelden Voorbeeld Vier onafhankelijke bepalingen van haemoglobinegehalte van een standaard bloedmonster. Het gehalte bedraagt 14,0 g% Resultaten: 14,1 14,4 14,2 14,2 Verkrijgt de analyst resultaten die systematisch ( # toeval) van het werkelijke gehalte verschillen ? Aanname: Meetresultaten normaal verdeeld, dus steekproef van een normaal verdeelde populatie Statistische uitspraken over onbekende populatiegemiddelden Uitspraken over één populatiegemiddelde Geen reden om te veronderstellen dat eventuele niet-toevallige afwijkingen een bepaalde richting zouden uitgaan tweezijdig toetsen Nulhypothese: Alternatieve hypothese: H0 : µ = 14,0 (g%) H1 : µ # 14,0 (g%) Kies onbetrouwbaarheidsdrempel: (meestal) p = 0,05 Toetsingsgrootheid: t = (<x> - 14,0)/ (S/sqrt4) = ... Vrijheidsgraden: n-1 = 3 Tabel Statistische uitspraken over onbekende populatiegemiddelden Uitspraken over één populatiegemiddelde Meestal is F niet gekend en wordt dan geschat als de steekproefstandaarddeviatie n X) 2 (X i s i 1 n 1 voor toetsting wordt sd(X) F n vervangen door de ‘standard error of the mean’ se(X) s n Statistische uitspraken over onbekende populatiegemiddelden Uitspraken over één populatiegemiddelde Dit leidt tot de toetsingsgrootheid t Xµ0 Xµ0 s se(X) n Het 1-alfa betrouwbaarheidsinterval voor µ wordt in het algemeen gegeven door: X t . s n < µ < X t. s n nb. bij df =< 30 is de spreiding van t sterker dan van Z Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van twee populatiegemiddelden Veronderstel twee populatiegemiddelden die normaal verdeeld zijn µX en µY X1,….Xn zijnde uitkomsten in een steekproef (grootte n) van de meetwaarden in de eerste populatie Y1,….Ym zijnde uitkomsten in een steekproef (grootte m) van de meetwaarden in de tweede populatie Gemiddelden X en Y normaal verdeeld, dan ook X-Y normaal verdeeld met 2 sd(X Y) 2 FX 2 FY FX n 2 FY m Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van twee populatiegemiddelden Meestal zijn de populatieparameters niet gekend. Als we mogen veronderstellen dat beide F‘s gelijk zijn, dan is sd(X Y) 1 1 n m F en kan deze geschat worden door se(X Y) s 1 1 n m de toetsting gebeurt door t X se(X Y X Y) s Y 1 1 n m Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van twee populatiegemiddelden Het 1-alfa betrouwbaarheidsinterval voor het verschil bedraagt: (XY) t s 1 1 < µX n m µY < (XY) ts 1 1 n m Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van twee populatiegemiddelden Voorbeeld: Vergelijking van fosfaatexcretie in twee groepen t E e N e e G a F , 1 S s T u f a V o n a l e r e E a e o e 2 p d F i t r w g r p f e e F E 5 2 8 1 7 0 5 5 5 a E 9 9 0 0 3 1 9 n Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Typisch voorbeeld: Is Captopril effectief bij de behandeling van hypertensie? Studieopzet: 15 patiënten met hypertensie worden behandeld. Wat ons interesseert is de systolische blooddruk voor en na de behandeling met CAPTOPRIL Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Is Captopril effectief bij de behandeling van hypertensie? Dataset: patient 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 SBPbef DBPbef SBPafter DBPafter 210 130 201 125 169 122 165 121 187 124 166 121 160 104 157 106 167 112 147 101 176 101 145 85 185 121 168 98 206 124 180 105 173 115 147 103 146 102 136 98 174 98 151 90 201 119 168 98 198 106 179 110 148 107 129 103 154 100 131 82 Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Grafische voorstelling: S y s to lis c h eb lo e d d ru k 2 2 0 Veel variatie in intercept Weinig variatie in slope 2 0 0 Bloeddruk(mmHg) 1 8 0 1 6 0 1 4 0 1 2 0 vo o r n a Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Voorbeeld voor-na metingen Cave metingen sterk gecorreleerd (hoog voor hoog na) Stuk van de variantie in de data niet relevant, m.n. de variantie van de eerste meting Onderzoeksvraag: wat is het verschil tussen de voor- en na- meting? H0: er is geen verschil m.a.w. meting voor - meting na = 0 Nota bene: het verschil is de richtingscoëfficiënt van de rechte die de voor- en na- meting verbindt. We zijn niet geïnteresseerd in de verklaring van de variantie van de intercepten van die rechten, wel in de beschrijving van de richtingscoëfficiënt (en van de mate waarin het toeval een rol speelt in de grootte van die coëfficiënt) Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Grafische voorstelling: S y s to lis c h eb lo e d d ru k 2 2 0 Veel variatie in intercept Veel variatie in slope 2 0 0 bloeddruk(mmHg) 1 8 0 1 6 0 1 4 0 1 2 0 vo o r n a Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Voorbeeld voor-na metingen Meest eenvoudig voorbeeld van longitudinale data Testing: Bereken voor elk paar het verschil (nieuwe ‘variabele’) Verschil van twee normaal verdeelde kenmerken is ook normaal verdeeld Voer een één steekproef t-test uit met als test waarde 0… Statistische software: doet alles in één keer (black box) l E e N e e P S 0 1 S 5 Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Voorbeeld voor-na metingen s N i l g P S m i f o n a l r e E p 2 e e e d w t p a a P S 3 7 1 3 3 3 4 0 p=0,00000115 Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Voorbeeld voor-na metingen Wat zouden de resultaten zijn als we i.p.v. een gepaarde t-test een gewone (niet gepaarde) t-test zouden hebben uitgevoerd? Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Voorbeeld voor-na metingen 220 t-test: variatie van beide metingen van belang 200 t 180 X Y X Y se ( X Y ) X2 Y2 n n 160 S SBPBEF 140 E e N e e G S 1 5 3 5 0 2 5 0 4 5 120 ,8 1,0 GROUP 1,2 1,4 1,6 1,8 2,0 2,2 Statistische uitspraken over onbekende populatiegemiddelden Het vergelijken van gepaarde populatiegemiddelden Voorbeeld voor-na metingen S s T u f a V o n a l e r e E a e o e 2 p d F i t r w g r p f e S E 1 6 6 8 6 3 8 0 7 a E 6 9 6 3 8 9 7 n p=0,016 Statistische uitspraken over onbekende populatiegemiddelden Niet-parametrische toetsen Tot zover: uitgangspunt normaal verdeelde populatiekenmerken Cave: Deze aanname is net altijd gewettigd Hoe de gewettigdheid bepalen ? Hetzij uit eigen data Hetzij uit eerder onderzoek of uit literatuur Indien niet gewettigd: NIET-PARAMETRISCHE METHODEN Statistische uitspraken over onbekende populatiegemiddelden Niet-parametrische toetsen Parametrische methoden en hun niet-parametrische alternatieven parametrische methode niet-parametrische methode t-toets voor twee steekproeven Wilcoxon’s twee-steekproeventoets Mann-Whitney t-toets voor gepaarde waarnemingen Wilcoxon’s rangtekentoets Statistische uitspraken over onbekende populatiegemiddelden Niet-parametrische toetsen fosfaat studie n N f G F , 0 1 0 T b a F M W Z A a E S t-test: p = 0,037 a N b G Statistische uitspraken over onbekende populatiegemiddelden Niet-parametrische toetsen Captopril studie n n N f R a S N 5 0 0 b P 0 0 0 c T 0 T 5 a S b S c S b a F t-test: p = 0,00000115 B a Z A a B b W Statistische uitspraken over onbekende populatiegemiddelden Voorbeelden C O U N T S h a p ro i -W kW l i = ,9 7 0 3 2 ,p < ,1 4 9 3 4 5 4 0 3 5 3 0 2 5 Noofobs 2 0 1 5 1 0 5 0 -1 0 0 0 1 0 0 2 0 0 3 0 0 4 0 0 U p p e rB o u n d a ri e s(x< = b o u n d a ry ) 5 0 0 6 0 0 E x p e c te d N o rm a l Statistische uitspraken over onbekende populatiegemiddelden Voorbeelden B o x& W h s i k e rP o l t: C O U N T 3 2 0 3 0 0 2 8 0 2 6 0 COUNT 2 4 0 2 2 0 2 0 0 1 8 0 ± 1 .9 6 * S td .E rr. ± 1 .0 0 * S td .E rr. M e a n 1 6 0 0 1 S A R C O M A STAT. Grouping: SARCOMA (sarc.sta) BASIC Group 1: G_1:0 STATS Group 2: G_2:1 Variable COUNT Mean G_1:0 239,0385 Mean G_2:1 279,1781 t-value df -1,62382 97 p ,107660 Valid N G_1:0 Valid N G_2:1 Std.Dev. G_1:0 26 73 135,0432 Statistische uitspraken over onbekende populatiegemiddelden Voorbeelden D IA M S h a p ro i -W kW l i = ,9 4 2 9 5 ,p < ,0 0 0 5 3 0 2 5 2 0 Noofobs 1 5 1 0 5 0 5 ,0 5 ,5 6 ,0 6 ,5 7 ,0 7 ,5 8 ,0 U p p e rB o u n d a ri e s(x< = b o u n d a ry ) 8 ,5 9 ,0 9 ,5 E x p e c te d N o rm a l Statistische uitspraken over onbekende populatiegemiddelden Voorbeelden B o x& W h s i k e rP o l t: D IA M 7 ,5 7 ,3 DIAM 7 ,1 6 ,9 6 ,7 6 ,5 ± 1 .9 6 * S td .E rr. ± 1 .0 0 * S td .E rr. M e a n 6 ,3 0 1 S A R C O M A STAT. Mann-Whitney U Test (sarc.sta) NONPAR By variable SARCOMA STATS Group 1: 0 Group 2: 1 variable DIAM t-test: Rank Sum Group 1 Rank Sum Group 2 919,0000 4031,000 p = ,004596 U 568,0000 Z -3,02948 p-level Z adjusted p-level ,002452 -3,03011 ,002447