Transcript File
STATISTIEK II
Hoofdstuk 4: Toetsen voor één populatie
Vanhoomissen & Valkeneers, hoofdstuk 4
PREVIOUSLY ON STATISTIEK II
•
In wetenschappelijk onderzoek vertrekken we vanuit een onderzoeksvraag waaruit wordt afgeleid
wat de populatie is en wat de onderzoekseenheden zijn. Om die vraag te beantwoorden
verzamelen we data in de vorm van steekproeven omdat de hele populatie vaak moeilijk te
onderzoeken is. Die steekproeven worden volgens bepaalde regels getrokken.
•
Om via de verzamelde data de onderzoeksvraag te beantwoorden hebben we kansberekeningen
nodig: kansen stellen ons in staat om te beslissen of een observatie heel uitzonderlijk is of eerder
heel gewoon.
•
Om kansen te berekenen maken we gebruik van kansverdelingen: theoretische verdelingen van
mogelijke waarden en bijhorende kansen van een variabele. In de psychologie wordt de normale
verdeling vaak gebruikt, aangezien veel kenmerken van mensen als normaal verdeeld in de
populatie worden beschouwd.
•
Omdat voor elk kenmerk een normale verdeling met een ander gemiddelde en standaarddeviatie
geldt, is het onmogelijk om voor elke verdeling de exacte kansen te kennen. Daarom herleiden we
die normale verdeling naar een standaardnormale verdeling door z-scores te berekenen. Daarna
kunnen we de kansen van de z-scores aflezen uit een tabel.
•
Bij hypothesetoetsing gebruiken we de steekproevenverdeling van het gemiddelde als
kansverdeling. Ook hier zetten we waarden (gemiddelden!) om naar z-scores. We kunnen dan
beslissen of ons geobserveerde gemiddelde uitzonderlijk is of niet. Als het uitzonderlijk is – volgens
de verdeling die bij H0 hoort – dan verwerpen we H0.
2
Hoofdstuk 4: Toetsen voor 1 populatie
PREVIOUSLY ON STATISTIEK II
•
We zijn nooit helemaal zeker van de juistheid van onze conclusie na hypothesetoetsing: fouten zijn
mogelijk, en belangrijk is dat we weten hoe groot de kans is op een fout.
•
Bij hypothesetoetsing kan je overschrijdingskansen gebruiken, maar net zo goed kan je de kritieke
waarden berekenen die bij de overschrijdingskansen horen.
•
Hypotheses kunnen éénzijdig of tweezijdig getoetst worden. Eénzijdig toetsen geeft meer kans op
significante resultaten, maar mag enkel toegepast worden als er een duidelijk verantwoorde
richting in de hypothese zit.
3
Hoofdstuk 4: Toetsen voor 1 populatie
VANDAAG
Toetsen voor één populatie
Z-toets, T-toets, X²-toets
STRAMIEN TOETSEN
1. Toetsingssituatie
Bij welk soort onderzoeksvragen gebruik je deze toets?
2. Voorwaarden
Wanneer mag je deze toets wel/niet gebruiken?
3. Hypothesen
Hoe zien H0 en H1 eruit wanneer je deze toets gebruikt?
4. Toetsingsgrootheid
Welke grootheid bereken je en wat is de kansverdeling van die grootheid?
5. Beslissingsregels
Wanneer verwerp je H0: via overschrijdingskansen of kritieke waarden?
6. Effectgrootte
Hoe belangrijk is het gevonden effect?
7. Rapporteren
Hoe vermeld je op een juiste manier de resultaten?
5
Hoofdstuk 4: Toetsen voor 1 populatie
Z-TOETS VOOR HET GEMIDDELDE
1. Toetsingssituatie
Heeft het gemiddelde van de populatie waaruit de steekproef afkomstig
is een bepaalde waarde of niet?
Vb. Is de gemiddelde IQ score van de populatie van mensen die een
training gevolgd hebben meer dan 100?
2. Voorwaarden
σ is bekend en populatie is normaal verdeeld (ook bij kleine N)
σ is niet bekend en/of populatie is niet normaal verdeeld, maar N ≥ 100
Uitleg: als σ niet bekend is maar N ≥ 100 dan mag je s gebruiken
als populatie niet normaal verdeeld is maar N ≥ 100 dan mag je
aannemen dat steekproevenverdeling normaal verdeeld is
6
Hoofdstuk 4: Toetsen voor 1 populatie
Z-TOETS VOOR HET GEMIDDELDE
σ bekend?
populatie normaal
verdeeld?
n
7
1
Ja
Ja
2
Ja
Ja
3
Ja
Nee
4
Nee
ja
5
Nee
Nee
6
Ja
Nee
7
Nee
Ja
8
Nee
Nee
≥ 100
Z (σ)
< 100
Z (σ)
≥ 100
Z (σ)
≥ 100
Z (s)
≥ 100
Z (s)
< 100
Geen Z
< 100
Geen Z
< 100
Geen Z
Hoofdstuk 4: Toetsen voor 1 populatie
Z-TOETS VOOR HET GEMIDDELDE
3. Hypothesen
Linkseenzijdig
H0: µ ≥ µ0
H1: µ < µ0
Rechtseenzijdig
H0: µ ≤ µ0
H1: µ > µ0
Tweezijdig
H0: µ = µ0
H1: µ ≠ µ0
µ0 = veronderstelde waarde voor populatiegemiddelde µ
8
Hoofdstuk 4: Toetsen voor 1 populatie
Z-TOETS VOOR HET GEMIDDELDE
4. Toetsingsgrootheid
zx
X
x
X
X
N
N
te vervangen door s indien σ niet gekend is en N ≥ 100
Kansverdeling: Standaardnormale verdeling
9
Hoofdstuk 4: Toetsen voor 1 populatie
Z-TOETS VOOR HET GEMIDDELDE
5. Beslissingsregels
2 mogelijkheden:
a.
overschrijdingskansen
b.
kritieke waarden
a. H0 verwerpen indien:
Pl (z x) ≤ α?
>> linkseenzijdig
Pr (z x) ≤ α?
>> rechtseenzijdig
Pd (z x) = 2*Pl (z x) ≤ α? (als X < μ)
>> tweezijdig
2*Pr (z x) ≤ α? (als X > μ)
10
Hoofdstuk 4: Toetsen voor 1 populatie
Z-TOETS VOOR HET GEMIDDELDE
b. H0 verwerpen indien:
z x ≤ -1.64
>> linkseenzijdig
z x ≥ 1.64
>> rechtseenzijdig
z x ≤ -1.96 (als X < μ)
>> tweezijdig
≥ 1.96 (als X > μ)
Telkens bij α = .05 ! Bij een andere α veranderen ook de kritieke waarden!!
11
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
1. Toetsingssituatie
Heeft het gemiddelde van de populatie waaruit de steekproef afkomstig is een
bepaalde waarde of niet?
2. Voorwaarden
•
σ is niet bekend en populatie is normaal verdeeld en N < 100
•
N > 30 en populatie is niet normaal verdeeld
σ bekend?
p
n
o
p
u
l
a
t
i
e
N
v
e
r
d
e
e
l
d
?
1
2
3
4
J
a
J
a
J
N
J
a
J
a
N
≥
1
Z
(
0
σ
0
)
<
1
Z
(
0
σ
0
)
a
e
e
≥
1
Z
(
j
0
σ
0
)
5
e
e
a
≥
1
Z
(
0
s
0
)
6
7
N
N
e
e
J
N
e
e
N
≥
1
Z
(
0
s
0
)
a
e
<
1
-
G
-
W
3
12
Hoofdstuk 4: Toetsen voor 1 populatie
e
G
a
l
0
e
0
e
e
0
-
J
<
e
n
Z
l
t
n
e
s
e
<
n
a
l
1
s
0
0
t
<
e
a
<
n
8
1
-
G
-
W
0
e
0
e
e
e
e
N
e
e
<
n
l
N
Z
t
G
-
W
3
-
3
0
1
-
n
0
e
0
e
e
0
<
G
e
<
n
Z
l
t
n
e
3
<
n
a
1
t
0
l
0
a
s
0
l
s
T-TOETS VOOR HET GEMIDDELDE
3. Hypothesen
Linkseenzijdig
H0: µ ≥ µ0
H1: µ < µ0
Rechtseenzijdig
H0: µ ≤ µ0
H1: µ > µ0
Tweezijdig
H0: µ = µ0
H1: µ ≠ µ0
µ0 = veronderstelde waarde voor populatiegemiddelde µ
13
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
4. Toetsingsgrootheid
tx
X 0
s
X 0
N
s
N
cfr. Z-toets maar s ipv σ
Kansverdeling: Student t-verdeling
Vrijheidsgraden: df = N-1
14
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
Student t-verdeling
Lijkt sterk op de normale verdeling
- Symmetrisch
- Gemiddelde = 0
- Bij oneindig grote steekproef identiek
Verschillen:
- Iets platter, dikkere staarten
- Bepaald door grootte steekproef
-> Meerdere t-verdelingen: parameter df
15
Hoofdstuk 4: Toetsen voor 1 populatie
William Gosset,
zichtbaar tevreden
met het ontdekken
van de t-verdeling
T-TOETS VOOR HET GEMIDDELDE
Wat zijn vrijheidsgraden?
vrijheidsgraden = df = degrees of freedom
= het aantal observaties waarvan de waarden arbitrair kunnen
worden bepaald
In deze t-toets: df = N-1
Vb. gemiddelde van 5 getallen is 10
-> hoeveel getallen mag ik dan vrij kiezen?
Als ik 4 getallen arbitrair kies (bv. 5,11,3,8) dan ligt het 5e getal
namelijk vast (nl. 23) opdat er een gemiddelde van 10 zou zijn
Dus we hebben 5-1 of 4 vrijheidsgraden
16
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
Vrijheidsgraden in de t-toets:
Bij een t-toets gebruiken we s als schatter voor σ
s = een afwijkingsscore:
s²
(X
i
X )²
N 1
s
(X
i
X )²
N 1
We weten dat het gemiddelde van afwijkingsscores altijd 0 is.
Dus: als we met n (vb. 5) afwijkingsscores werken en het gemiddelde ligt
vast nl. 0, dan kunnen we N-1 (vb. 4) afwijkingsscores vrij kiezen.
Als de steekproefgrootte N is, dan is de t-verdeling voor het gemiddelde
gebaseerd op N-1 vrijheidsgraden
17
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
5. Beslissingsregels
a. overschrijdingskansen - H0 verwerpen indien:
Pl (t x) ≤ α?
>> linkseenzijdig
Pr (t x) ≤ α?
>> rechtseenzijdig
Pd (t x) = 2*Pl (t x) ≤ α? (als X < μ)
>> tweezijdig
2*Pr (t x) ≤ α? (als X > μ)
18
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
Rechtseenzijdig toetsen
H0: µ ≤ 100
x = 102.93 sx = 12.36 n = 29
H1: µ > 100
t x = 102.93 – 100 √29 = 1.28
12.36
df = 28
P r = 0.11
t x = 1.28
-> is P r (t x) ≤ α?
ja: verwerp H0
neen: verwerp H0 niet
19
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
Probleem met overschrijdingskansen: Er zijn net zoveel t-verdelingen als er
vrijheidsgraden zijn. Dan zouden er oneindig veel tabellen met
overschrijdingskansen beschikbaar moeten zijn.
-> toetsen met kritieke waarden
20
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
b. Toetsen met kritieke waarden
-> t waarde opzoeken die hoort bij significantieniveau α
-> Tabel kritieke waarden van de t-verdeling in bijlage 1
Rechtseenzijdig toetsen
bij α = 0.05 en df = 28 -> rechter kritieke waarde = 1.701
df = 28
P r = 0.05
t = 1.701
-> t x ≥ 1.701 ?
ja: verwerp H0
neen: verwerp H0 niet
21
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
Onderzoekshypothese: vaders van grote gezinnen vinden van zichzelf dat
ze geen gemiddelde intelligentie hebben. In de populatie is schatting
van IQ normaal verdeeld met µ = 100. De onderzoeker laat 29 vaders
in grote gezinnen hun IQ schatten.
Resultaat in deze steekproef: X = 102.93 en s = 12.36
1. Hoe zien H0 en H1 eruit?
H0: µ = 100
H1: µ ≠ 100
2. Welke toetsingsgrootheid?
σ is onbekend, populatie is normaal verdeeld, N < 100 -> t-toets
22
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
3. t score berekenen
tx
X µ
sx
N
102 . 93 100
29 1 . 28
12 . 36
4. Kritieke t waarde opzoeken in tabel
-> df = 29-1 = 28 en α = 0.05 en 2-zijdig
-> 2.048
23
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
5. t score vergelijken met kritieke t score
1.28 < 2.048 dus H0 niet verwerpen
-2.048
24
2.048
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
• Opmerking: SPSS gaat ervan uit dat σ niet gekend is en voert
steeds een t-toets uit (dus ook in situaties waar een Z-toets
toegelaten is)
• Maar: de overschrijdingskansen bij een t-toets zijn groter dan bij
een z-toets (zie ook dikkere staarten in t-verdeling in vergelijking
met z-verdeling)
• Gevolg: H0 zal minder snel verworpen worden bij een t-toets in
vergelijking met een z-toets:
1-β (P om H0 terecht te verwerpen - onderscheidingsvermogen)
neemt af
• We krijgen dus minder snel een significant resultaat bij een t-
toets in vergelijking met een z-toets. Daarom eventueel manuele
Z-toets gebruiken als aan de voorwaarden is voldaan.
25
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
• Demo SPSS: metalfans en haarlengte
• Hebben metalfans langere haren dan de gemiddelde volwassene?
26
Hoofdstuk 4: Toetsen voor 1 populatie
T-TOETS VOOR HET GEMIDDELDE
6. Effectgrootte
7. Rapporteren
Om na te gaan of metalfans langere haren hebben dan de algemene bevolking
werd een one sample t-test uitgevoerd. Gemiddeld hadden de metalfans uit de
steekproef langere haren (M = 9.83, SD = 2.62) dan de referentiewaarde 8.9 uit
de populatie, t(59) = 2.739, p = .008, r = .34.
27
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
Wat als niet voldaan is aan voorwaarden voor parametrisch
toetsen bij bestuderen van 1 populatie?
•
variabele niet normaal verdeeld in populatie?
•
steekproef < 30 ?
•
geen intervalvariabele?
χ²-toets voor frequenties
28
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
1. Toetsingssituatie
Stemmen de geobserveerde frequenties in de steekproef overeen met de
verwachte frequenties op basis van normen of eerder onderzoek?
Vb. Stemmen de frequenties leerlingen die lezen op niveau AVI-2, AVI-3,
AVI-4 en AVI-5 in het tweede leerjaar van een bepaalde school overeen
met de frequenties van deze leesniveaus in de algemene bevolking?
2. Voorwaarden
• de categorieën waarvan de frequenties bestudeerd worden moeten
elkaar uitsluiten.
• 20% of minder van de categorieën heeft een verwachte frequentie
kleiner dan 5;
• geen enkele categorie heeft een verwachte frequentie van minder dan
1;
• ordinale variabelen worden beschouwd als nominale variabelen.
29
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
3. Hypothesen
Enkel tweezijdig!
H0: π1 = π2 = … = πk
H1: niet H0
Of
H0: π1 = πA ; π2 = πB ; … ; πk = πK
H1: niet H0
30
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
4. Toetsingsgrootheid
met df = k – 1
fo = geobserveerde frequenties
fe = verwachte frequenties
k = aantal categorieën
31
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
5. Beslissingsregels
a. overschrijdingskansen
maar χ²-verdeling afhankelijk van df, dus teveel mogelijkheden om te
tabelleren, daarom:
b.
32
kritieke waarden
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
6. Effectgrootte (phi)
(interpreteerbaar zoals r)
7. Rapporteren
Verwachte en geobserveerde proportie, X², df, p-waarde.
33
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
Klas 2e leerjaar: 9 van 26 leerlingen lezen op niveau AVI-5. Ongewoon
veel? Meer dan verwacht?
Verwachte frequentie = 23% of 6/26
Geobserveerde frequentie = 35% of 9/26
Verschil groot genoeg om van significantie te spreken?
Hypotheses: H0: πminder dan AVI-5 = 20 ; πAVI-5 of meer = 6 en H1: niet H0
34
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
Hypotheses:
H0: πminder dan AVI-5 = 20 ; πAVI-5 of meer = 6 en H1: niet H0
Toetsingsgrootheid:
Beslissen:
Is 1.95 groter dan kritieke waarde? tabel kritieke X²-waarden
kritieke waarde bij α = .05 en df = 1 is gelijk aan 3.84.
Aangezien 1.95 < 3.84 wordt H0 niet verworpen.
35
Hoofdstuk 4: Toetsen voor 1 populatie
Χ²-TOETS VOOR FREQUENTIES
• Demo SPSS: voorkeur vrijetijdsactiviteit bij senioren.
• Een gemoedelijke Duitse gemeente wil in het kader van de
budgettering voor recreatie weten of de senioren in de gemeente
een uitgesproken voorkeur hebben voor een bepaalde
vrijetijdsactiviteit. Een steekproef van senioren wordt gevraagd een
keuze te maken tussen wandelen, fietsen of rotsklimmen.
36
Hoofdstuk 4: Toetsen voor 1 populatie
type AV?
aantal OV?
type OV?
niet in dit boek
hoeveel
populaties?
categorieën
afhankelijk?
parametrisch
non-parametrisch
one sample t-test /
z-test
chi-square goodness
of fit
onafh.
independent t-test /
z-test
Rank-sum
afh.
dependent t-test
Signed-ranks
onafh.
one way ANOVA
Kruskal-Wallis
afh.
repeated measures
ANOVA
Friedman’s ANOVA
Pearson correlation
Spearman correlation
1
nominaal
2
1
>2
interval/
ordinaal
interval/
ordinaal
nominaal
>1
nominaal
1
onafh.
n-way ANOVA
afh.
repeated measures
ANOVA
gemengd
mixed design
ANOVA
interval
multiple regression
gemengd
multiple regression
1
onafh.
chi-square goodness
of fit
≥2
onafh.
Pearson chi-square
nominaal/
ordinaal