Transcript File
STATISTIEK 2 Toetsen voor 2 populaties – afhankelijke steekproeven Hoofdstuk 6 type AV? aantal OV? type OV? niet in dit boek hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch one sample t-test / z-test chi-square goodness of fit onafh. independent t-test / z-test Rank-sum afh. dependent t-test Signed-ranks onafh. one way ANOVA Kruskal-Wallis afh. repeated measures ANOVA Friedman’s ANOVA Pearson correlation Spearman correlation 1 nominaal 2 1 >2 interval/ ordinaal interval/ ordinaal nominaal >1 nominaal 1 onafh. n-way ANOVA afh. repeated measures ANOVA gemengd mixed design ANOVA interval multiple regression gemengd multiple regression 1 onafh. chi-square goodness of fit ≥2 onafh. Pearson chi-square nominaal/ ordinaal VANDAAG T-toets voor afhankelijke steekproeven Wilcoxon Signed rank toets T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Belangrijk: afhankelijke steekproeven zoals bij herhaalde metingen, gematchte steekproeven 2. Voorwaarden steekproeven zijn afhankelijk populaties zijn normaal verdeeld Indien populaties niet normaal zijn verdeeld moet n1 > 30 en n2 > 30 (dus het aantal paren moet > 30) 4 Toetsen voor 2 populaties - afhankelijk T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN σ p o n 1 1 p e e n u l n σ a t n 2 i 2 e b s N e k e v n e d r d ? e e l d ? 1 2 3 J a J a J J a J a N ≥ t 1 0 0 < t 1 0 0 ≥ 4 a N e 1 e J 0 0 t ≥ t 5 e e a 1 0 0 6 N e e J N e e N ≥ t 1 0 0 a < 5 e J 1 - - Toetsen voor 2 populaties - afhankelijk N e 0 w e 3. Hypothesen V = verschil per paar (steekproef1 – steekproef2) Linkseenzijdig H0: µv ≥ 0 H1: µv < 0 Rechtseenzijdig H0: µv ≤ 0 H1: µv > 0 Tweezijdig H0: µv = 0 H1: µv ≠ 0 7 e n g n e n 1 3 0 0 l < t a 2 > e n t e n n l s n 3 a 2 l 0 1 t 8 e e a 1 0 0 N e e N e e < 1 - e 0 w 0 e n l n s - g < n 1 3 0 e e e t a 2 n n l > t n s n 3 a 2 0 l < s 1 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 4. Toetsingsgrootheid t-score van het gemiddelde verschil v V v tv sv aantal paren n standaarddeviatie van de verschilscores gemiddelde verschil steekproeven veronderstelde gemiddelde verschil tussen 2 populaties Kansverdeling? Student t-verdeling met df = n-1 6 Toetsen voor 2 populaties - afhankelijk T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pl (tv) ≤ α? Pr (tv) ≤ α? Pd (tv) ≤ α? >> linkseenzijdig >> rechtseenzijdig >> tweezijdig b. kritieke waarden : H0 verwerpen indien: vb. voor α = .01 en df = 25. (Andere α of df -> andere kritieke waarden!!) tv ≤ -2.485 tv ≥ +2.485 tv ≤ -2.787 of ≥ +2.787 7 Toetsen voor 2 populaties - afhankelijk >> linkseenzijdig >> rechtseenzijdig >> tweezijdig T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN Onderzoeksvraag: kunnen ratten door “herprogrammeren” van neuronen in de auditieve cortex van hun tinnitus verlost worden? 17 ratten worden voor en na het toepassen van de techniek getest. De afhankelijke variabele wordt bepaald door het aantal fouten dat de ratten maken in het onderscheiden van tonen, en wordt gemeten op intervalniveau. Stel dat de score op deze test in de populaties normaal verdeeld is. Navzer D. Engineer, Jonathan R. Riley, Jonathan D. Seale, Will A. Vrana, Jai A. Shetake, Sindhu P. Sudanagunta, Michael S. Borland, Michael P. Kilgard. Reversing pathological neural activity using targeted plasticity.Nature, 2011; DOI: 10.1038/nature09656 8 Toetsen voor 2 populaties - afhankelijk T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 1. Toetsingssituatie afhankelijke steekproeven (nl. per rat een paar: voor en na) 2. Voorwaarden 2 populaties bestudeerd, afhankelijke steekproeven, intervalvariabele, score is normaal verdeeld in de populatie t-toets voor afhankelijke steekproeven 3. Hypotheses? H0: µv = 0 H1: µv 0 v = voor – na 9 Toetsen voor 2 populaties - afhankelijk T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 4. t score berekenen P 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 V = .5569 10 hoe lager, hoe minder tinnitus Score op test voor na Verschil(voor-na) 4.52 4.12 .40 3.60 3.44 .16 3.88 1.92 1.96 4.36 4.08 .28 4.52 3.52 1.00 3.60 2.44 1.16 3.92 3.72 .20 3.72 3.33 .39 3.52 3.52 .00 3.68 3.08 .60 3.88 3.88 .00 4.52 4.00 .52 3.04 2.72 .32 3.96 3.28 .68 4.32 2.52 1.80 4.44 4.44 .00 3.96 3.96 .00 sv = .6023 Toetsen voor 2 populaties - afhankelijk t .5569 0 17 3.8123 .60230 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 5. Hypothese toetsen Kritieke t-waarde: bij alpha = 0.05 en df = 16 (17-1) is de rechter kritieke waarde gelijk aan 2.12 (zie tabel t-verdeling) Is tv ≥ kritieke t waarde? 3.8123 > 2.12 -> dus H0: µv = 0 verwerpen kritieke t waarde = 2.12 Conclusie De ratten scoren significant lager op de test na het toepassen van de techniek. 11 Toetsen voor 2 populaties - afhankelijk T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN Voorbeeld ratten en tinnitus in SPSS. 12 Toetsen voor 2 populaties - afhankelijk T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 6. Effectgrootte 7. Rapporteren Om na te gaan of de ratten beter presteerden op de frequentie-test na de behandeling werd een t-test voor afhankelijke steekproeven uitgevoerd. De ratten maakten significant minder fouten na (M = 3.41, SD = .69) dan voor de behandeling (M = 3.97, SD = .43), t(16) = 3.814, p = .002, r = .69 . 13 Toetsen voor 2 populaties - afhankelijk WILCOXON RANGTEKENTOETS 1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Belangrijk: afhankelijke steekproeven (zie les over steekproeven) zoals bij herhaalde metingen, gematchte steekproeven = nonparametrische variant van afhankelijke t-toets 2. Voorwaarden afhankelijke steekproeven minstens ordinaal meetniveau (achterliggende variabele is continu) scores hoeven niet normaal verdeeld te zijn 14 Toetsen voor 2 populaties - afhankelijk type AV? aantal OV? type OV? niet in dit boek hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch one sample t-test / z-test chi-square goodness of fit onafh. independent t-test / z-test Rank-sum afh. dependent t-test Signed-ranks onafh. one way ANOVA Kruskal-Wallis afh. repeated measures ANOVA Friedman’s ANOVA Pearson correlation Spearman correlation 1 nominaal 2 1 >2 interval/ ordinaal interval/ ordinaal nominaal >1 nominaal 1 onafh. n-way ANOVA afh. repeated measures ANOVA gemengd mixed design ANOVA interval multiple regression gemengd multiple regression 1 onafh. chi-square goodness of fit ≥2 onafh. Pearson chi-square nominaal/ ordinaal WILCOXON RANGTEKENTOETS 3. Hypotheses V = verschil binnen elk paar scores Linkseenzijdig H0: θv ≥ 0 H1: θv < 0 Rechtseenzijdig H0: θv ≤ 0 H1: θv > 0 Tweezijdig H0: θv = 0 H1: θv ≠ 0 concentratiescores hoger op woensdag dan op vrijdag? 16 H1: woensdag - vrijdag > 0 of θv > 0 H0: woensdag – vrijdag ≤ 0 of θv ≤ 0 Toetsen voor 2 populaties - afhankelijk WILCOXON RANGTEKENTOETS 4. Toetsingsgrootheid vrijdag 15 35 16 26 19 17 27 16 13 20 woensdag 28 35 35 22 39 32 27 29 36 35 verschil 13 0 19 -4 20 15 0 13 23 15 |verschil| 13 tie 19 4 20 15 tie 13 23 15 rang 2.5 Rang + 2.5 6 1 7 4.5 6 2.5 8 4.5 2.5 8 4.5 35 Toetsingsgrootheid = kleinste rangensom, hier: T- = 1 17 Toetsen voor 2 populaties - afhankelijk Rang - 1 7 4.5 1 WILCOXON RANGTEKENTOETS 5. Beslissingsregel overschrijdingskansen met z-toets 𝑧𝑇 = 𝑇−𝑇 𝑆𝐸 = 𝑛(𝑛+1) 4 𝑇− 𝑛 𝑛+1 (2𝑛+1) 24 = 8(8+1) 4 1− 8 8+1 (16+1) 24 met: T = kleinste van rangensommen n = aantal paren – aantal ties 18 Toetsen voor 2 populaties - afhankelijk = 1−18 7.14 =-2.38 WILCOXON RANGTEKENTOETS Demo SPSS: concentratiescores woensdag versus vrijdag Berekenen van de medianen via Analyze > Descriptive statistics > Frequencies > Statistics 19 Toetsen voor 2 populaties - afhankelijk WILCOXON RANGTEKENTOETS 6. Effectgrootte Opgelet: N = totaal aantal observaties, niet aantal paren! 7. Rapporteren Om na te gaan of de concentratiescores variëren in functie van het moment in de week werd een Wilcoxon signed rank toets uitgevoerd. De scores waren significant hoger op vrijdag (Mdn = 33.5) dan op woensdag (Mdn = 18), z = -2.39, p = .017, r = -.53 . 20 Toetsen voor 2 populaties - afhankelijk TOETSEN VOOR 2 AFH POPULATIES Demo SPSS: invloed van planten op aandachtscapaciteit 21 Toetsen voor 2 populaties - afhankelijk TOETSEN VOOR 2 AFH POPULATIES Demo SPSS: invloed van planten op aandachtscapaciteit Fig. 3. Percent correctly memorized words recalled in any order (panel A) and recalled in correct order (panel B) as a function of measuring time and the plant intervention. Data from the 4 and 6 sentence condition are collapsed. The error bars show standard errors. Raanaas, R. K., Evensen, K. H., Rich, D., Sjøstrøm, G., & Patil, G. (2011). Benefits of indoor plants on attention capacity in an office setting. Journal of Environmental Psychology, 31(1), 99-105. doi: 10.1016/j.jenvp.2010.11.005 22 Toetsen voor 2 populaties - afhankelijk