Transcript File

STATISTIEK 2
Toetsen voor 2 populaties – afhankelijke steekproeven
Hoofdstuk 6
type AV?
aantal OV?
type OV?
niet in dit boek
hoeveel
populaties?
categorieën
afhankelijk?
parametrisch
non-parametrisch
one sample t-test /
z-test
chi-square goodness
of fit
onafh.
independent t-test /
z-test
Rank-sum
afh.
dependent t-test
Signed-ranks
onafh.
one way ANOVA
Kruskal-Wallis
afh.
repeated measures
ANOVA
Friedman’s ANOVA
Pearson correlation
Spearman correlation
1
nominaal
2
1
>2
interval/
ordinaal
interval/
ordinaal
nominaal
>1
nominaal
1
onafh.
n-way ANOVA
afh.
repeated measures
ANOVA
gemengd
mixed design
ANOVA
interval
multiple regression
gemengd
multiple regression
1
onafh.
chi-square goodness
of fit
≥2
onafh.
Pearson chi-square
nominaal/
ordinaal
VANDAAG
T-toets voor afhankelijke steekproeven
Wilcoxon Signed rank toets
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
1. Toetsingssituatie
Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2
waaruit de steekproeven afkomstig zijn?
Belangrijk: afhankelijke steekproeven zoals bij herhaalde metingen, gematchte
steekproeven
2. Voorwaarden
steekproeven zijn afhankelijk
populaties zijn normaal verdeeld
Indien populaties niet normaal zijn verdeeld moet n1 > 30 en n2 > 30 (dus het
aantal paren moet > 30)
4
Toetsen voor 2 populaties - afhankelijk
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
σ
p
o
n
1
1
p
e
e
n
u
l
n
σ
a
t
n
2
i
2
e
b
s
N
e
k
e
v
n
e
d
r
d
?
e
e
l
d
?
1
2
3
J
a
J
a
J
J
a
J
a
N
≥
t
1
0
0
<
t
1
0
0
≥
4
a
N
e
1
e
J
0
0
t
≥
t
5
e
e
a
1
0
0
6
N
e
e
J
N
e
e
N
≥
t
1
0
0
a
<
5
e
J
1
-
-
Toetsen voor 2 populaties - afhankelijk
N
e
0
w
e
3. Hypothesen
V = verschil per paar (steekproef1 – steekproef2)
Linkseenzijdig
H0: µv ≥ 0
H1: µv < 0
Rechtseenzijdig H0: µv ≤ 0
H1: µv > 0
Tweezijdig
H0: µv = 0
H1: µv ≠ 0
7
e
n
g
n
e
n
1
3
0
0
l
<
t
a
2
>
e
n
t
e
n
n
l
s
n
3
a
2
l
0
1
t
8
e
e
a
1
0
0
N
e
e
N
e
e
<
1
-
e
0
w
0
e
n
l
n
s
-
g
<
n
1
3
0
e
e
e
t
a
2
n
n
l
>
t
n
s
n
3
a
2
0
l
<
s
1
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
4. Toetsingsgrootheid
t-score van het gemiddelde verschil v
V  v
tv 
sv
aantal paren
n
standaarddeviatie van de verschilscores
gemiddelde verschil
steekproeven
veronderstelde gemiddelde verschil tussen 2
populaties
Kansverdeling? Student t-verdeling met df = n-1
6
Toetsen voor 2 populaties - afhankelijk
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
5. Beslissingsregels
a. overschrijdingskansen - H0 verwerpen indien:
Pl (tv) ≤ α?
Pr (tv) ≤ α?
Pd (tv) ≤ α?
>> linkseenzijdig
>> rechtseenzijdig
>> tweezijdig
b. kritieke waarden : H0 verwerpen indien:
vb. voor α = .01 en df = 25. (Andere α of df -> andere kritieke waarden!!)
tv ≤ -2.485
tv ≥ +2.485
tv ≤ -2.787 of
≥ +2.787
7
Toetsen voor 2 populaties - afhankelijk
>> linkseenzijdig
>> rechtseenzijdig
>> tweezijdig
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
Onderzoeksvraag: kunnen ratten door “herprogrammeren” van neuronen in
de auditieve cortex van hun tinnitus verlost worden?
17 ratten worden voor en na het toepassen van de techniek getest. De
afhankelijke variabele wordt bepaald door het aantal fouten dat de
ratten maken in het onderscheiden van tonen, en wordt gemeten op
intervalniveau.
Stel dat de score op deze test in de populaties normaal verdeeld is.
Navzer D. Engineer, Jonathan R. Riley, Jonathan D. Seale, Will A. Vrana, Jai A. Shetake, Sindhu P.
Sudanagunta, Michael S. Borland, Michael P. Kilgard. Reversing pathological neural activity
using targeted plasticity.Nature, 2011; DOI: 10.1038/nature09656
8
Toetsen voor 2 populaties - afhankelijk
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
1. Toetsingssituatie
afhankelijke steekproeven (nl. per rat een paar: voor en na)
2. Voorwaarden
2 populaties bestudeerd, afhankelijke steekproeven, intervalvariabele,
score is normaal verdeeld in de populatie
 t-toets voor afhankelijke steekproeven
3. Hypotheses?
H0: µv = 0
H1: µv  0
v = voor – na
9
Toetsen voor 2 populaties - afhankelijk
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
4. t score berekenen
P
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
V = .5569
10
hoe lager, hoe minder tinnitus
Score op test
voor
na
Verschil(voor-na)
4.52
4.12
.40
3.60
3.44
.16
3.88
1.92
1.96
4.36
4.08
.28
4.52
3.52
1.00
3.60
2.44
1.16
3.92
3.72
.20
3.72
3.33
.39
3.52
3.52
.00
3.68
3.08
.60
3.88
3.88
.00
4.52
4.00
.52
3.04
2.72
.32
3.96
3.28
.68
4.32
2.52
1.80
4.44
4.44
.00
3.96
3.96
.00
sv = .6023 
Toetsen voor 2 populaties - afhankelijk
t
.5569  0
17  3.8123
.60230
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
5. Hypothese toetsen
Kritieke t-waarde:
bij alpha = 0.05 en df = 16 (17-1) is de rechter kritieke waarde gelijk aan
2.12 (zie tabel t-verdeling)


Is tv ≥ kritieke t waarde?
3.8123 > 2.12

-> dus H0: µv = 0 verwerpen








kritieke t waarde = 2.12
Conclusie
De ratten scoren significant lager op de test na het toepassen van de
techniek.
11
Toetsen voor 2 populaties - afhankelijk



T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
Voorbeeld ratten en tinnitus in SPSS.
12
Toetsen voor 2 populaties - afhankelijk
T-TOETS VOOR VERSCHIL TUSSEN 2
GEMIDDELDEN, AFH. STEEKPROEVEN
6. Effectgrootte
7. Rapporteren
Om na te gaan of de ratten beter presteerden op de frequentie-test
na de behandeling werd een t-test voor afhankelijke steekproeven
uitgevoerd. De ratten maakten significant minder fouten na (M =
3.41, SD = .69) dan voor de behandeling (M = 3.97, SD = .43), t(16) =
3.814, p = .002, r = .69 .
13
Toetsen voor 2 populaties - afhankelijk
WILCOXON RANGTEKENTOETS
1. Toetsingssituatie
Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2
waaruit de steekproeven afkomstig zijn?
Belangrijk: afhankelijke steekproeven (zie les over steekproeven) zoals bij
herhaalde metingen, gematchte steekproeven
= nonparametrische variant van afhankelijke t-toets
2. Voorwaarden
afhankelijke steekproeven
minstens ordinaal meetniveau (achterliggende variabele is continu)
scores hoeven niet normaal verdeeld te zijn
14
Toetsen voor 2 populaties - afhankelijk
type AV?
aantal OV?
type OV?
niet in dit boek
hoeveel
populaties?
categorieën
afhankelijk?
parametrisch
non-parametrisch
one sample t-test /
z-test
chi-square goodness
of fit
onafh.
independent t-test /
z-test
Rank-sum
afh.
dependent t-test
Signed-ranks
onafh.
one way ANOVA
Kruskal-Wallis
afh.
repeated measures
ANOVA
Friedman’s ANOVA
Pearson correlation
Spearman correlation
1
nominaal
2
1
>2
interval/
ordinaal
interval/
ordinaal
nominaal
>1
nominaal
1
onafh.
n-way ANOVA
afh.
repeated measures
ANOVA
gemengd
mixed design
ANOVA
interval
multiple regression
gemengd
multiple regression
1
onafh.
chi-square goodness
of fit
≥2
onafh.
Pearson chi-square
nominaal/
ordinaal
WILCOXON RANGTEKENTOETS
3. Hypotheses
V = verschil binnen elk paar scores
Linkseenzijdig
H0: θv ≥ 0
H1: θv < 0
Rechtseenzijdig
H0: θv ≤ 0
H1: θv > 0
Tweezijdig
H0: θv = 0
H1: θv ≠ 0
concentratiescores hoger op woensdag dan op vrijdag?
16
H1: woensdag - vrijdag > 0 of
θv > 0
H0: woensdag – vrijdag ≤ 0 of
θv ≤ 0
Toetsen voor 2 populaties - afhankelijk
WILCOXON RANGTEKENTOETS
4. Toetsingsgrootheid
vrijdag
15
35
16
26
19
17
27
16
13
20
woensdag
28
35
35
22
39
32
27
29
36
35
verschil
13
0
19
-4
20
15
0
13
23
15
|verschil|
13
tie
19
4
20
15
tie
13
23
15
rang
2.5
Rang +
2.5
6
1
7
4.5
6
2.5
8
4.5
2.5
8
4.5
35
Toetsingsgrootheid = kleinste rangensom, hier: T- = 1
17
Toetsen voor 2 populaties - afhankelijk
Rang -
1
7
4.5
1
WILCOXON RANGTEKENTOETS
5. Beslissingsregel
overschrijdingskansen met z-toets
𝑧𝑇 =
𝑇−𝑇
𝑆𝐸
=
𝑛(𝑛+1)
4
𝑇−
𝑛 𝑛+1 (2𝑛+1)
24
=
8(8+1)
4
1−
8 8+1 (16+1)
24
met:
T = kleinste van rangensommen
n = aantal paren – aantal ties
18
Toetsen voor 2 populaties - afhankelijk
=
1−18
7.14
=-2.38
WILCOXON RANGTEKENTOETS
Demo SPSS: concentratiescores woensdag versus vrijdag
Berekenen van de medianen via Analyze > Descriptive
statistics > Frequencies > Statistics
19
Toetsen voor 2 populaties - afhankelijk
WILCOXON RANGTEKENTOETS
6. Effectgrootte
Opgelet: N = totaal aantal observaties, niet aantal paren!
7. Rapporteren
Om na te gaan of de concentratiescores variëren in functie van het moment
in de week werd een Wilcoxon signed rank toets uitgevoerd. De scores
waren significant hoger op vrijdag (Mdn = 33.5) dan op woensdag (Mdn =
18), z = -2.39, p = .017, r = -.53 .
20
Toetsen voor 2 populaties - afhankelijk
TOETSEN VOOR 2 AFH POPULATIES
Demo SPSS: invloed van planten op aandachtscapaciteit
21
Toetsen voor 2 populaties - afhankelijk
TOETSEN VOOR 2 AFH POPULATIES
Demo SPSS: invloed van planten op aandachtscapaciteit
Fig. 3. Percent correctly memorized words recalled in any order (panel A) and recalled in correct order (panel B) as a function of measuring
time and the plant intervention. Data from the 4 and 6 sentence condition are collapsed. The error bars show standard errors.
Raanaas, R. K., Evensen, K. H., Rich, D., Sjøstrøm, G., & Patil, G. (2011). Benefits of indoor plants on
attention capacity in an office setting. Journal of Environmental Psychology, 31(1), 99-105. doi:
10.1016/j.jenvp.2010.11.005
22
Toetsen voor 2 populaties - afhankelijk