Het vergelijken van twee populatiepercentages

Download Report

Transcript Het vergelijken van twee populatiepercentages

Populatiegemiddelden: recap
se(X) 
s
n
X
 t .
s
< µ < X
n
t

Xµ0
se(X)


t.
s
n
Xµ0
s
n
O
V
m
d
F
S
a
i
f
g
B
8
2
4
7
1
W
2
7
5
T
0
9
Statistische uitspraken over
onbekende populatiepercentages



Uitspraken over één populatiepercentage
Het vergelijken van twee populatiepercentages
Het vergelijken van meer dan twee populatiepercentages
Statistische uitspraken over
onbekende populatiepercentages

Uitspraken over één populatiepercentage
Uitgangspunt
veronderstel: prevalentie in ‘populatie’= B
aselecte steekproef:
omvang n
aantal zieken: X
schatting prevalentie :
p= X/n
Vraag: wat zegt p over B ?
B ligt vast
p hangt van toeval af
Statistische uitspraken over
onbekende populatiepercentages

Uitspraken over één populatiepercentage
Aantal X:
binomiale verdeling met parameters n en B
n
Pr (X  x ) ( x ) B x ( 1 B) n x
Kansverdeling p:
Als n groot genoeg, dan kan de binomiale verdeling benaderd worden
door de normale verdeling, met dezelfde verwachting en variantie.
als n.B > 5 en n(1- B) > 5
gemiddelde :p = B
en standaardeviatie
p
B(1
B)
n
Statistische uitspraken over
onbekende populatiepercentages

Uitspraken over één populatiepercentage
Schatting, precisie:
p
bij normale verdeling: uitkomst ligt met 95% kans tussen :p +/- 1.96
praktisch:
Toetsting:
Z = gestandaardiseerde verschil
Z
p
B0
sd(p)

p
B0
B0 (1
B0)
n
als Z >= 1.96 dan nul hypothese te verwerpen op basis van 95%
betrouwbaarheidsniveau
Statistische uitspraken over
onbekende populatiepercentages

Uitspraken over één populatiepercentage
Voorbeeld:
Veronderstel dat een ziekte de laatste jaren bij 20% van de mensen
voorkomt (geen toevalsvariatie meer)
Het laatste jaar wordt in een aselecte steekproef van 100 personen bij
25 personen de ziekte vastgesteld. Is dit toeval ?
B0 = 20%
p = 25%
n = 100
Bereken Z :
Wat is de probabiliteit dat Z gelijk is of groter dan deze waarde ?
Statistische uitspraken over
onbekende populatiepercentages

Uitspraken over één populatiepercentage
Betrouwbaarheidsinterval:
p
1.96
Hierbij is
p(1
p)
< B < p1.96
n
p(1
p)
n
p(1
p)
n
de geschatte standaarddeviatie van kansverdeling van p
of de standaardfout op het geobserveerde percentage (schatter voor
het populatiepercentage B)
Statistische uitspraken over
onbekende populatiepercentages

Uitspraken over één populatiepercentage
Opmerkingen:
normale benadering i.p.v. binomiaal
cave n =< 20
exacte betrouwbaarheidsintervallen op basis van tabellen
voor binomiaal verdeling
Eenzijdig vs. tweezijdig toetsen
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages
Voorbeeld:
kans ‘succes’
behande ling
A (geneesmidde l)
B (placebo )
Z
groepsgrootte
a antal successen
fractie successen
nA
XA
pA=XA/nA
nB
XB
pB=XB/nB
BA
BB
p Ap B
se(p Ap B)
se(p A p B) 
p A(1 p A) p B(1 p B)

nA
nB
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages
Voorbeeld:
werk uit:
vergelijking van twee behandelingen :
A: 125 personen, aantal successen 100
B: 125 personen, aantal successen 70
Alternatief: (1-alfa) betrouwbaarheidsinterval op het verschil
(pA - pB) - Z.se (pA - pB) < (BA - BB) < (pA - pB) + Z.se (pA - pB)
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
3
7
10
‘placebo’
1
9
10
Totaal
4
16
20
Verwachting?
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
2
8
10
‘placebo’
2
8
10
Totaal
4
16
20
Afwijking?
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
3-2=1
7 - 8 = -1
10
‘placebo’
1 - 2 = -1
9-8=1
10
4
16
20
Totaal
Totale afwijking?
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
43
57
100
‘placebo’
21
79
100
Totaal
64
136
200
Verwachting?
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
32
68
100
‘placebo’
32
68
100
Totaal
64
136
200
Afwijking?
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
43 – 32
57 – 68
100
‘placebo’
21 – 32
79 – 68
100
64
136
200
Totaal
Totale afwijking?
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
?
succes
falen
Totaal
‘behandeld’
11
-11
100
‘placebo’
-11
11
100
Totaal
64
136
200
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
(11)²
(-11)²
100
‘placebo’
(-11)²
(11)²
100
64
136
200
Totaal
Welke belangrijkst ?
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
(11)²/43
(-11)²/57
100
‘placebo’
(-11)²/21
(11)²/79
100
64
136
200
Totaal
Som = G, heeft zgn. Chi-kwadraat verdeling (1 vrijheidsgraad) hieruit
p-waarde…
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Dobbelsteen vs muntstuk: experiment 1: N = 20
succes
falen
Totaal
‘behandeld’
(11)²/43
(-11)²/57
100
‘placebo’
(-11)²/21
(11)²/79
100
64
136
200
Totaal
Som = 11.12, 1 df, p-waarde = 0.0009…
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages: chikwadraat
Voorbeeld:
Id., op basis van constructie 2X2-tabel
behande ling
aantal
successen
aantal
mislukkingen
totaa l
A (geneesmidde l)
a (XA)
b (nA - XA)
a+b (nA )
B (placebo )
c (XB)
d (nB - XB)
c+d (nB)
a+c
b+d
a+b+c+d (n)
tota al
geen verband:
waargenomen celfrequenties (O) gelijk aan de verwachte celfrequenties (E)
E = (rijtotaal x kolomtotaal) / n
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages
Voorbeeld:
tabel van verwachte aantallen E
aantal successen
aantal mislukkingen
A
(a+b)(a+c)/n
(a+b)(b+d)/n
B
(c+d)(a+c)/n
(c+d)(b+d)/n
maat voor aan te geven hoezeer de waargenomen aantallen O afwijken
van de verwachte aantallen E :
(O
E)2
 
E
2
nb. opnieuw een vorm van ‘gestandaardiseerd verschil’
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van twee populatiepercentages
Chi-kwadraat:
historisch belang
uit te breiden naar tabellen met meer rijen en kolommen
continuïteitscorrectie mogelijk (Yates)
Exacte p-waarde:
Fisher’s exacte test (op basis van hypergeometrische verdeling)
Statistische uitspraken over
onbekende populatiepercentages

Het vergelijken van meer dan twee populatiepercentages
behande ling
aantal
successen
aantal
mislukkingen
totaa l
A
100
25
125
B
70
55
125
C
80
45
125
tota al
250
125
375
(O
E)2
 
E
2
kansverdeling van chi-kwadraat hangt af van het aantal rijen (r) en het aantal
kolommen (k), en wel van (r-1).(k-1) wat men het aantal vrijheidsgraden noemt.
Aantal vrijheidsgraden is het aantal cellen waarvoor men het aantal vrij kan
kiezen bij vaste randtotalen, hier dus 2.
Statistische uitspraken over
onbekende populatiepercentages

Voorbeelden
STAT.
BASIC
STATS
2-Way Summary Table: Observed Frequencies (2.sta)
Marked cells have counts > 10
AREA2 : REGIO (0=ZUID, 1=CENTRUM)
G_1:0
Q5
G_1:0
Q5
G_2:1
Row
Totals
537*
96,41%*
20*
3,59%*
557
Row Percent
42*
7,49%*
561
Row Percent
519*
92,51%*
G_1:1
Totals
1056
62
p
Statistic
Chi-square
df
Pearson Chi-square
M-L Chi-square
Yates Chi-square
8,099062
8,271647
7,372361
df=1
df=1
df=1
p=,00443
p=,00403
p=,00662
1118
Statistische uitspraken over
onbekende populatiepercentages

Voorbeelden
STAT.
BASIC
STATS
2-Way Summary Table: Observed Frequencies (2.sta)
Marked cells have counts > 10
AREA2 : REGIO (0=ZUID, 1=CENTRUM)
G_1:0
GESLACHT
G_1:0
GESLACHT
G_2:1
Row
Totals
298*
53,41%*
558
Row Percent
260*
46,59%*
230*
40,85%*
333*
59,15%*
563
Row Percent
G_1:1
Totals
490
Statistic
Chi-square
df
Pearson Chi-square
M-L Chi-square
Yates Chi-square
3,755871
3,757942
3,526108
df=1
df=1
df=1
631
p
p=,05263
p=,05256
p=,06041
1121
Statistische uitspraken over
onbekende populatiepercentages

Betrouwbaarheid en onderscheidingsvermogen
betrouwbaarheid:
onderscheidingsvermogen:
ontbreken van fouten van de eerste soort (alfa)
ontbreken van fouten van de tweede soort (beta)
uitspraak van de toets
H0 niet verworpen
H0 verworpen
1-

H0 waar
werkelijkheid
H0 niet waar
STEEKPROEFGROOTTE ??

1-