Het vergelijken van twee populatiepercentages
Download
Report
Transcript Het vergelijken van twee populatiepercentages
Populatiegemiddelden: recap
se(X)
s
n
X
t .
s
< µ < X
n
t
Xµ0
se(X)
t.
s
n
Xµ0
s
n
O
V
m
d
F
S
a
i
f
g
B
8
2
4
7
1
W
2
7
5
T
0
9
Statistische uitspraken over
onbekende populatiepercentages
Uitspraken over één populatiepercentage
Het vergelijken van twee populatiepercentages
Het vergelijken van meer dan twee populatiepercentages
Statistische uitspraken over
onbekende populatiepercentages
Uitspraken over één populatiepercentage
Uitgangspunt
veronderstel: prevalentie in ‘populatie’= B
aselecte steekproef:
omvang n
aantal zieken: X
schatting prevalentie :
p= X/n
Vraag: wat zegt p over B ?
B ligt vast
p hangt van toeval af
Statistische uitspraken over
onbekende populatiepercentages
Uitspraken over één populatiepercentage
Aantal X:
binomiale verdeling met parameters n en B
n
Pr (X x ) ( x ) B x ( 1 B) n x
Kansverdeling p:
Als n groot genoeg, dan kan de binomiale verdeling benaderd worden
door de normale verdeling, met dezelfde verwachting en variantie.
als n.B > 5 en n(1- B) > 5
gemiddelde :p = B
en standaardeviatie
p
B(1
B)
n
Statistische uitspraken over
onbekende populatiepercentages
Uitspraken over één populatiepercentage
Schatting, precisie:
p
bij normale verdeling: uitkomst ligt met 95% kans tussen :p +/- 1.96
praktisch:
Toetsting:
Z = gestandaardiseerde verschil
Z
p
B0
sd(p)
p
B0
B0 (1
B0)
n
als Z >= 1.96 dan nul hypothese te verwerpen op basis van 95%
betrouwbaarheidsniveau
Statistische uitspraken over
onbekende populatiepercentages
Uitspraken over één populatiepercentage
Voorbeeld:
Veronderstel dat een ziekte de laatste jaren bij 20% van de mensen
voorkomt (geen toevalsvariatie meer)
Het laatste jaar wordt in een aselecte steekproef van 100 personen bij
25 personen de ziekte vastgesteld. Is dit toeval ?
B0 = 20%
p = 25%
n = 100
Bereken Z :
Wat is de probabiliteit dat Z gelijk is of groter dan deze waarde ?
Statistische uitspraken over
onbekende populatiepercentages
Uitspraken over één populatiepercentage
Betrouwbaarheidsinterval:
p
1.96
Hierbij is
p(1
p)
< B < p1.96
n
p(1
p)
n
p(1
p)
n
de geschatte standaarddeviatie van kansverdeling van p
of de standaardfout op het geobserveerde percentage (schatter voor
het populatiepercentage B)
Statistische uitspraken over
onbekende populatiepercentages
Uitspraken over één populatiepercentage
Opmerkingen:
normale benadering i.p.v. binomiaal
cave n =< 20
exacte betrouwbaarheidsintervallen op basis van tabellen
voor binomiaal verdeling
Eenzijdig vs. tweezijdig toetsen
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages
Voorbeeld:
kans ‘succes’
behande ling
A (geneesmidde l)
B (placebo )
Z
groepsgrootte
a antal successen
fractie successen
nA
XA
pA=XA/nA
nB
XB
pB=XB/nB
BA
BB
p Ap B
se(p Ap B)
se(p A p B)
p A(1 p A) p B(1 p B)
nA
nB
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages
Voorbeeld:
werk uit:
vergelijking van twee behandelingen :
A: 125 personen, aantal successen 100
B: 125 personen, aantal successen 70
Alternatief: (1-alfa) betrouwbaarheidsinterval op het verschil
(pA - pB) - Z.se (pA - pB) < (BA - BB) < (pA - pB) + Z.se (pA - pB)
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
3
7
10
‘placebo’
1
9
10
Totaal
4
16
20
Verwachting?
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
2
8
10
‘placebo’
2
8
10
Totaal
4
16
20
Afwijking?
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
3-2=1
7 - 8 = -1
10
‘placebo’
1 - 2 = -1
9-8=1
10
4
16
20
Totaal
Totale afwijking?
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
43
57
100
‘placebo’
21
79
100
Totaal
64
136
200
Verwachting?
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
32
68
100
‘placebo’
32
68
100
Totaal
64
136
200
Afwijking?
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
43 – 32
57 – 68
100
‘placebo’
21 – 32
79 – 68
100
64
136
200
Totaal
Totale afwijking?
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
?
succes
falen
Totaal
‘behandeld’
11
-11
100
‘placebo’
-11
11
100
Totaal
64
136
200
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
(11)²
(-11)²
100
‘placebo’
(-11)²
(11)²
100
64
136
200
Totaal
Welke belangrijkst ?
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
(11)²/43
(-11)²/57
100
‘placebo’
(-11)²/21
(11)²/79
100
64
136
200
Totaal
Som = G, heeft zgn. Chi-kwadraat verdeling (1 vrijheidsgraad) hieruit
p-waarde…
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
(11)²/43
(-11)²/57
100
‘placebo’
(-11)²/21
(11)²/79
100
64
136
200
Totaal
Som = 11.12, 1 df, p-waarde = 0.0009…
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Id., op basis van constructie 2X2-tabel
behande ling
aantal
successen
aantal
mislukkingen
totaa l
A (geneesmidde l)
a (XA)
b (nA - XA)
a+b (nA )
B (placebo )
c (XB)
d (nB - XB)
c+d (nB)
a+c
b+d
a+b+c+d (n)
tota al
geen verband:
waargenomen celfrequenties (O) gelijk aan de verwachte celfrequenties (E)
E = (rijtotaal x kolomtotaal) / n
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages
Voorbeeld:
tabel van verwachte aantallen E
aantal successen
aantal mislukkingen
A
(a+b)(a+c)/n
(a+b)(b+d)/n
B
(c+d)(a+c)/n
(c+d)(b+d)/n
maat voor aan te geven hoezeer de waargenomen aantallen O afwijken
van de verwachte aantallen E :
(O
E)2
E
2
nb. opnieuw een vorm van ‘gestandaardiseerd verschil’
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van twee populatiepercentages
Chi-kwadraat:
historisch belang
uit te breiden naar tabellen met meer rijen en kolommen
continuïteitscorrectie mogelijk (Yates)
Exacte p-waarde:
Fisher’s exacte test (op basis van hypergeometrische verdeling)
Statistische uitspraken over
onbekende populatiepercentages
Het vergelijken van meer dan twee populatiepercentages
behande ling
aantal
successen
aantal
mislukkingen
totaa l
A
100
25
125
B
70
55
125
C
80
45
125
tota al
250
125
375
(O
E)2
E
2
kansverdeling van chi-kwadraat hangt af van het aantal rijen (r) en het aantal
kolommen (k), en wel van (r-1).(k-1) wat men het aantal vrijheidsgraden noemt.
Aantal vrijheidsgraden is het aantal cellen waarvoor men het aantal vrij kan
kiezen bij vaste randtotalen, hier dus 2.
Statistische uitspraken over
onbekende populatiepercentages
Voorbeelden
STAT.
BASIC
STATS
2-Way Summary Table: Observed Frequencies (2.sta)
Marked cells have counts > 10
AREA2 : REGIO (0=ZUID, 1=CENTRUM)
G_1:0
Q5
G_1:0
Q5
G_2:1
Row
Totals
537*
96,41%*
20*
3,59%*
557
Row Percent
42*
7,49%*
561
Row Percent
519*
92,51%*
G_1:1
Totals
1056
62
p
Statistic
Chi-square
df
Pearson Chi-square
M-L Chi-square
Yates Chi-square
8,099062
8,271647
7,372361
df=1
df=1
df=1
p=,00443
p=,00403
p=,00662
1118
Statistische uitspraken over
onbekende populatiepercentages
Voorbeelden
STAT.
BASIC
STATS
2-Way Summary Table: Observed Frequencies (2.sta)
Marked cells have counts > 10
AREA2 : REGIO (0=ZUID, 1=CENTRUM)
G_1:0
GESLACHT
G_1:0
GESLACHT
G_2:1
Row
Totals
298*
53,41%*
558
Row Percent
260*
46,59%*
230*
40,85%*
333*
59,15%*
563
Row Percent
G_1:1
Totals
490
Statistic
Chi-square
df
Pearson Chi-square
M-L Chi-square
Yates Chi-square
3,755871
3,757942
3,526108
df=1
df=1
df=1
631
p
p=,05263
p=,05256
p=,06041
1121
Statistische uitspraken over
onbekende populatiepercentages
Betrouwbaarheid en onderscheidingsvermogen
betrouwbaarheid:
onderscheidingsvermogen:
ontbreken van fouten van de eerste soort (alfa)
ontbreken van fouten van de tweede soort (beta)
uitspraak van de toets
H0 niet verworpen
H0 verworpen
1-
H0 waar
werkelijkheid
H0 niet waar
STEEKPROEFGROOTTE ??
1-