Transcript Test
Pojke
1 2 3 4 5 6 7 8 9 10 11 12
Ett stickprov kvantitativa data: t-test
Vikt
3655 3465 3900 3410 3720 4300 3570 4000 3625 4925 4190 4280 Nollhypotes H 0 : =3600 gram Alternativhypotes H 1 : 3600 gram Deskriptiv statistik:
Möjligheter till inferens: Konfidensintervall
Resultat: =3920 ± 281 3639< <4201 (95%)
X
t
Hypotestest (t-test):
Resultat t= 2,51 p=0,029
t
X s
0
n s n
Förutsättningar för t-test och motsvarande konfidensintervall Kvantitativa data Om stickprovet är litet måste variabeln som studeras vara normalfördelad Om stickprovet är stort fungerar analys trots avvikelse från normalfördelning (ju större stickprov desto större avvikelse kan accepteras).
Ett stickprov men förutsättningarna för t-test ej uppfyllda: teckentest är ett alternativ
Nollhypotes: median=3600 Teckentest (Sign test) Vikt
3655 3465 3900 3410
Om hypotesen stämmer borde hälften av differenserna vara negativa och hälften positiva.
3720 4300 3570 4000 3625
Resultat: 9 av 12 positiva.
p= 0,15 dvs ej signifikant
4925 4190 4280
Förväntat Differens
3600 55 3600 3600 -135 300 3600 3600 3600 -190 120 700 3600 3600 3600 3600 3600 3600 -30 400 25 1325 590 680
Tecken + + + + + + + + + [email protected]
Förutsättningar för teckentest Stickprov med lägst ordinaldata Test av median (om symmetri är median=väntevärde (populationsmedel) Inga antagandet om fördelningsform Mycket generellt test, men om det är normalfördelat är styrkan mycket lägre än t-test (ca 60% effektivitet vid normalfördlening).
Ett stickprov men förutsättningarna för t-test ej uppfyllda: tecken-rang test är ett annat alternativ
Wilcoxon tecken rang-test Summera rangerna för värden med positivt tecken (eller negativt).
Resultat=65 (13)
Vikt
3655 3465 3900 3410 3720 4300 3570 4000 3625 4925 4190 4280 p=0,041 Alltså signifikans!
Förväntat Differens
3600 3600 55 -135 3600 3600 3600 3600 300 -190 120 700 3600 3600 3600 3600 3600 3600 -30 400 25 1325 590 680
Rang
3 5 7 6 4 11 2 8 1 12 9 10
Tecken + + + + + + + + +
Förutsättningar för tecken-rang-test Stickprov med kvantitativa data Fördelningen för differenserna ska vara symmetrisk (behöver dock ej vara normalfördelad) Test av median eller väntevärde (populationsmedelvärde) Ingen större effektivitetsförlust (ca 95% effektivitet givet normalfördelning)
Ett stickprov kvantitativa data, sammanfattande råd: t-test är att föredra. Fungerar om variabeln är normalfördelad eller stickprovet stort. Använd så ofta som möjligt.
Ibland kan transformering göra datamaterialet mer lämpligt för t-test Teckentest är ett alternativ som fungerar oavsett fördelning Om fördelningen kan antas vara symmetrisk och stickprovet är under 20 kan tecken-rang-test vara ett bra alternativ
Två stickprov ”parade observationer”
pre post diff 5260 3910 1350 5470 4220 1250 5640 3885 1755 6180 5160 1020 6390 5645 745 6515 4680 1835 6805 5265 1540 7515 5975 1540 7515 6790 725 8230 6900 1330 8770 7335 1435 Nollhypotes:
d =0 Deskriptiv statistik
:
d
1320 , 5 se( d ) sd(d)/ n
Konfidensintervall
: 110 , 6
d
d
t se
(
d
) Resultat:
d
1320 .
5 246 .
4
Parat t-test:
t
d
0
se
(
d
) Resultat: t=11,9 p<0,001
Två stickprov parade observationer- ej normalfördelat
pre post diff rang 5260 3910 1350 6 5470 4220 1250 5640 3885 1755 6180 5160 1020 6390 5645 745 6515 4680 1835 6805 5265 1540 7515 5975 1540 7515 6790 725 8230 6900 1330 8770 7335 1435 4 10 3 2 11 8,5 8,5 1 5 7 [email protected]
Två alternativ: Teckentest: Alla differenser positiva p=0,001 Tecken-rang-test Rangsumman för plus=66 P=0,003
Parade observationer kvantitativa data, sammanfattande råd: Parat t-test är att föredra. Fungerar om differenserna är normalfördelade eller stickprovet stort. Använd så ofta som möjligt.
Ibland kan transformering göra datamaterialet mer lämpligt för t-test Teckentest är ett alternativ som fungerar oavsett fördelning Om fördelningen av differenserna kan antas vara symmetrisk och stickprovet är under 20 kan tecken-rang-test vara ett bra alternativ
Två oberoende stickprov
7,05 7,48 7,48 7,53 7,58 7,9 8,08 8,09 8,11 8,4 10,15 10,88 Lean Obese 6,13 8,79 9,19 9,21 9,68 9,69 9,97 11,51 11,85 12,79
• •
Konfidensintervall
1 2
X
1 •
Resultat t=3.95
•
p=0,001
X
2
tSE
(
X
1 •
Resultat: 2.23
1.18 (95%) Hypotestest, testfunktion:
X
2 )
t
X
1
se
(
X
1
X
2
X
2 0 )
Förutsättningar för t-test mellan två oberoende stickprov Kvantitativa data, två oberoende stickprov Om stickproven är små måste variabeln vara normalfördelad i respektive population (ju större stickprov desto större avvikelse kan accepteras) De två studerade populationerna ska vara lika homogena (samma standardavvikelse). Detta antagande är inte viktigt om stickproven är ungefär lika stora. Om villkoret ej är uppfyllt kan Welsh test användas
Två oberoende stickprov, men villkoren för t-test ej uppfyllda…
Lean rank Obese rank 6,13 7,05 7,48 7,48 7,53 7,58 7,9 8,08 1 2 3,5 3,5 5 6 7 8 8,09 8,11 8,4 10,15 9 10 11 18 10,88 19 103 [email protected]
8,79 9,19 9,21 9,68 9,69 9,97 11,51 11,85 12,79 12 13 14 15 16 17 20 21 22 150
• • • •
Rangsummetest Jämför rangsummorna Resultat: 150 vs 103 p=0,001
Förutsättningar för rangsummetest Två oberoende stickprov, lägst ordinaldata Vanligt antagande: Populationerna ska ha samma fördelning (spridning och form), men kan skilja sig i läge Tänkbara nollhypoteser: Populationerna har samma median Populationerna har samma väntevärde
Transformer...
Vanligast är att logaritmera data.
Transformen kan ge mindre skevhet samt mindre skillnader i varians.
Två oberoende stickprov kvantitativa data, sammanfattande råd: Oberoende t-test är att föredra. Fungerar om variabeln är normalfördelad i respektive population eller stickproven stora. Vidare ska populationerna vara lika homogena (ej väsentligt om stickproven är lika stora). Är populationerna inte lika homogena och stickproven olika stora (men i övrigt lämpliga för t test) är Welsh test ett alternativ.
Ibland kan transformering göra datamaterialet mer lämpligt för t-test Ett icke-parametriskt alternativ är rangsummetest
Kategoridata ett stickprov
Andelen lyckade försök=p Parameter= Om np(1-p)>5 gäller:
p
z p
( 1
p
)
n
z=1.96 ger 95% konfidensgrad Under samma villkor, testfunktion:
z
0
p
( 1 0 0 )
n
Två stickprov
1 Om np(1-p)>5 i båda stickproven gäller: 2
p
1
p
2
z p
1 ( 1
n
1
p
1 )
p
2 ( 1
n
2
p
2 ) Under samma villkor; testfunktion (för att testa hypotesen att proportionerna är lika):
z
p
( 1
p
1
p
2 1
p
)(
n
1 1
n
2 )
Analys av frekvenstabell (korstabell, kontingenstabell)
Chi-två test Ex: Tomte Ej Tomte Tot Män 16 9 25 Kvinnor Tot 10 26 15 25 24 50 Testfunktion: 2
allaceller
" " (
observerat
förväntat
) 2
förväntat
Analys av frekvenstabeller med parade data
Före kampanj Ekologisk Konventionell Efter kampanj Ekologisk Konventionell 22 18 4 46
Teckentest (eller McNemar)
Uppgift
Vi vill undersöka om populationen ”bingolotto-tittare utan lott” skiljer sig vad det gäller genomsnittlig IQ Formalisera Vad är nollhypotesen?
Vilken information behövs?
Stickprovsstorlek (Sample Size)
Baserat på ett test
Följande information behövs: Signifikansnivå (vanligen 5%) Styrka ( minst 80%) Variabilitet SD,SEM Skillnad att upptäcka (realistisk och intressant?)
Baserat på konfidensintervall
Följande information behövs: Konfidensgrad Variabilitet SD,SEM Önskad säkerhetsmarginal •Baserat på test eller K.I.?
•Om inte all information finns?
•Styrkefunktionens utseende
Länk: www.studysize.com