Transcript t-toets

Statistische uitspraken over
onbekende populatiegemiddelden




Uitspraken over één populatiegemiddelde
Het vergelijken van twee populatiegemiddelden
Gepaarde waarnemingen
Het vergelijken van meer dan twee populatiegemiddelden
Statistische uitspraken over
onbekende populatiegemiddelden


Toets van de hypothese µ = µ0
Vraag: Is een aselecte steekproef van n elementen met
gemiddelde van de meting <x> en spreiding s, afkomstig uit
een normaal verdeelde populatie met populatiegemiddelde µ0
en met onbekende spreiding sigma ?

Toetsing: toets van Student (Gosset)

NB toetsingsgrootheden: gestandaardiseerd verschil
NB vrijheidsgraden

Statistische uitspraken over
onbekende populatiegemiddelden

Voorbeeld
Vier onafhankelijke bepalingen van haemoglobinegehalte van een
standaard bloedmonster.
Het gehalte bedraagt 14,0 g%
Resultaten:
14,1
14,4
14,2
14,2
Verkrijgt de analyst resultaten die systematisch ( # toeval) van het
werkelijke gehalte verschillen ?
Aanname: Meetresultaten normaal verdeeld, dus steekproef van een normaal
verdeelde populatie
Statistische uitspraken over
onbekende populatiegemiddelden

Uitspraken over één populatiegemiddelde
Geen reden om te veronderstellen dat eventuele niet-toevallige
afwijkingen een bepaalde richting zouden uitgaan
tweezijdig toetsen
Nulhypothese:
Alternatieve hypothese:
H0 : µ = 14,0 (g%)
H1 : µ # 14,0 (g%)
Kies onbetrouwbaarheidsdrempel:
(meestal) p = 0,05
Toetsingsgrootheid:
t = (<x> - 14,0)/ (S/sqrt4) = ...
Vrijheidsgraden:
n-1 = 3
Tabel
Statistische uitspraken over
onbekende populatiegemiddelden

Uitspraken over één populatiegemiddelde
Meestal is F niet gekend en wordt dan geschat als de steekproefstandaarddeviatie
n
X) 2
 (X i
s 
i 1
n
1
voor toetsting wordt
sd(X) 
F
n
vervangen door de ‘standard error of the mean’
se(X) 
s
n
Statistische uitspraken over
onbekende populatiegemiddelden

Uitspraken over één populatiegemiddelde
Dit leidt tot de toetsingsgrootheid
t

Xµ0

Xµ0
s
se(X)
n
Het 1-alfa betrouwbaarheidsinterval voor µ wordt in het algemeen gegeven
door:
X
 t .
s
n
< µ < X

t.
s
n
nb. bij df =< 30 is de spreiding van t sterker dan van Z
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van twee populatiegemiddelden
Veronderstel twee populatiegemiddelden die normaal verdeeld zijn
µX en µY
X1,….Xn zijnde uitkomsten in een steekproef (grootte n) van de meetwaarden in de eerste populatie
Y1,….Ym zijnde uitkomsten in een steekproef (grootte m) van de meetwaarden in de tweede populatie
Gemiddelden X en Y normaal verdeeld, dan ook X-Y normaal verdeeld
met
2
sd(X

Y)

2
FX

2
FY

FX
n
2

FY
m
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van twee populatiegemiddelden
Meestal zijn de populatieparameters niet gekend. Als we mogen
veronderstellen dat beide F‘s gelijk zijn, dan is
sd(X

Y)

1 1

n m
F
en kan deze geschat worden door
se(X

Y)

s
1 1

n m
de toetsting gebeurt door
t

X
se(X

Y

X

Y)
s

Y
1 1

n m
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van twee populatiegemiddelden
Het 1-alfa betrouwbaarheidsinterval voor het verschil bedraagt:
(XY)
 t
s
1 1

< µX
n m

µY < (XY)

ts
1 1

n m
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van twee populatiegemiddelden
Voorbeeld:
Vergelijking van fosfaatexcretie in twee groepen
t
E
e
N
e
e
G
a
F
,
1
S
s
T
u
f
a
V
o
n
a
l
e
r
e
E
a
e
o
e
2
p
d
F
i
t
r
w
g
r
p
f
e
e
F
E
5
2
8
1
7
0
5
5
5
a
E
9
9
0
0
3
1
9
n
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Typisch voorbeeld:
Is Captopril effectief bij de behandeling van hypertensie?
Studieopzet:
15 patiënten met hypertensie worden behandeld.
Wat ons interesseert is de systolische blooddruk voor en na de
behandeling met CAPTOPRIL
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Is Captopril effectief bij de behandeling van hypertensie?
Dataset:
patient
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
SBPbef DBPbef SBPafter DBPafter
210
130
201
125
169
122
165
121
187
124
166
121
160
104
157
106
167
112
147
101
176
101
145
85
185
121
168
98
206
124
180
105
173
115
147
103
146
102
136
98
174
98
151
90
201
119
168
98
198
106
179
110
148
107
129
103
154
100
131
82
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Grafische voorstelling:
S
y
s
to
lis
c
h
eb
lo
e
d
d
ru
k
2
2
0
Veel variatie in intercept
Weinig variatie in slope
2
0
0
Bloeddruk(mmHg)
1
8
0
1
6
0
1
4
0
1
2
0
vo
o
r
n
a
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Cave metingen sterk gecorreleerd (hoog voor hoog na)
Stuk van de variantie in de data niet relevant, m.n. de variantie van de
eerste meting
Onderzoeksvraag: wat is het verschil tussen de voor- en na- meting?
H0: er is geen verschil m.a.w. meting voor - meting na = 0
Nota bene: het verschil is de richtingscoëfficiënt van de rechte die de
voor- en na- meting verbindt. We zijn niet geïnteresseerd in de verklaring
van de variantie van de intercepten van die rechten, wel in de
beschrijving van de richtingscoëfficiënt (en van de mate waarin het
toeval een rol speelt in de grootte van die coëfficiënt)
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Grafische voorstelling:
S
y
s
to
lis
c
h
eb
lo
e
d
d
ru
k
2
2
0
Veel variatie in intercept
Veel variatie in slope
2
0
0
bloeddruk(mmHg)
1
8
0
1
6
0
1
4
0
1
2
0
vo
o
r
n
a
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Meest eenvoudig voorbeeld van longitudinale data
Testing:
Bereken voor elk paar het verschil (nieuwe ‘variabele’)
Verschil van twee normaal verdeelde kenmerken is ook normaal
verdeeld
Voer een één steekproef t-test uit met als test waarde 0…
Statistische software: doet alles in één keer (black box)
l
E
e
N
e
e
P
S
0
1
S
5
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
s
N
i
l
g
P
S
m
i
f
o
n
a
l
r
e
E
p
2
e
e
e
d
w
t
p
a
a
P
S
3
7
1
3
3
3
4
0
p=0,00000115
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
Wat zouden de resultaten zijn als we i.p.v. een gepaarde t-test een
gewone (niet gepaarde) t-test zouden hebben uitgevoerd?
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
220
t-test: variatie van beide metingen van belang
200
t
180
X Y
X Y

se ( X  Y )
 X2  Y2

n
n
160
S
SBPBEF
140
E
e
N
e
e
G
S
1
5
3
5
0
2
5
0
4
5
120
,8
1,0
GROUP
1,2
1,4
1,6
1,8
2,0
2,2
Statistische uitspraken over
onbekende populatiegemiddelden

Het vergelijken van gepaarde populatiegemiddelden
Voorbeeld voor-na metingen
S
s
T
u
f
a
V
o
n
a
l
e
r
e
E
a
e
o
e
2
p
d
F
i
t
r
w
g
r
p
f
e
S
E
1
6
6
8
6
3
8
0
7
a
E
6
9
6
3
8
9
7
n
p=0,016
Statistische uitspraken over
onbekende populatiegemiddelden

Niet-parametrische toetsen
Tot zover: uitgangspunt normaal verdeelde populatiekenmerken
Cave: Deze aanname is net altijd gewettigd
Hoe de gewettigdheid bepalen ?
Hetzij uit eigen data
Hetzij uit eerder onderzoek of uit literatuur
Indien niet gewettigd:
NIET-PARAMETRISCHE METHODEN
Statistische uitspraken over
onbekende populatiegemiddelden

Niet-parametrische toetsen
Parametrische methoden en hun niet-parametrische alternatieven
parametrische methode
niet-parametrische methode
t-toets voor twee steekproeven
Wilcoxon’s twee-steekproeventoets
Mann-Whitney
t-toets voor gepaarde
waarnemingen
Wilcoxon’s rangtekentoets
Statistische uitspraken over
onbekende populatiegemiddelden

Niet-parametrische toetsen
fosfaat studie
n
N
f
G
F
,
0
1
0
T
b
a
F
M
W
Z
A
a
E
S
t-test: p = 0,037
a
N
b
G
Statistische uitspraken over
onbekende populatiegemiddelden

Niet-parametrische toetsen
Captopril studie
n
n
N
f
R
a
S
N
5
0
0
b
P
0
0
0
c
T
0
T
5
a
S
b
S
c
S
b
a
F
t-test: p = 0,00000115
B
a
Z
A
a
B
b
W
Statistische uitspraken over
onbekende populatiegemiddelden
Voorbeelden
C
O
U
N
T
S
h
a
p
ro
i
-W
kW
l
i
=
,9
7
0
3
2
,p
<
,1
4
9
3
4
5
4
0
3
5
3
0
2
5
Noofobs

2
0
1
5
1
0
5
0
-1
0
0
0
1
0
0
2
0
0
3
0
0
4
0
0
U
p
p
e
rB
o
u
n
d
a
ri
e
s(x<
=
b
o
u
n
d
a
ry
)
5
0
0
6
0
0
E
x
p
e
c
te
d
N
o
rm
a
l
Statistische uitspraken over
onbekende populatiegemiddelden
Voorbeelden
B
o
x&
W
h
s
i
k
e
rP
o
l
t: C
O
U
N
T
3
2
0
3
0
0
2
8
0
2
6
0
COUNT

2
4
0
2
2
0
2
0
0
1
8
0
±
1
.9
6
*
S
td
.E
rr.
±
1
.0
0
*
S
td
.E
rr.
M
e
a
n
1
6
0
0
1
S
A
R
C
O
M
A
STAT. Grouping: SARCOMA (sarc.sta)
BASIC
Group 1: G_1:0
STATS
Group 2: G_2:1
Variable
COUNT
Mean
G_1:0
239,0385
Mean
G_2:1
279,1781
t-value
df
-1,62382
97
p
,107660
Valid N
G_1:0
Valid N
G_2:1
Std.Dev.
G_1:0
26
73
135,0432
Statistische uitspraken over
onbekende populatiegemiddelden
Voorbeelden
D
IA
M
S
h
a
p
ro
i
-W
kW
l
i
=
,9
4
2
9
5
,p
<
,0
0
0
5
3
0
2
5
2
0
Noofobs

1
5
1
0
5
0
5
,0
5
,5
6
,0
6
,5
7
,0
7
,5
8
,0
U
p
p
e
rB
o
u
n
d
a
ri
e
s(x<
=
b
o
u
n
d
a
ry
)
8
,5
9
,0
9
,5
E
x
p
e
c
te
d
N
o
rm
a
l
Statistische uitspraken over
onbekende populatiegemiddelden

Voorbeelden
B
o
x&
W
h
s
i
k
e
rP
o
l
t: D
IA
M
7
,5
7
,3
DIAM
7
,1
6
,9
6
,7
6
,5
±
1
.9
6
*
S
td
.E
rr.
±
1
.0
0
*
S
td
.E
rr.
M
e
a
n
6
,3
0
1
S
A
R
C
O
M
A
STAT. Mann-Whitney U Test (sarc.sta)
NONPAR
By variable SARCOMA
STATS
Group 1: 0 Group 2: 1
variable
DIAM
t-test:
Rank Sum
Group 1
Rank Sum
Group 2
919,0000
4031,000
p = ,004596
U
568,0000
Z
-3,02948
p-level
Z
adjusted
p-level
,002452
-3,03011
,002447