Transcript Test

Pojke

1 2 3 4 5 6 7 8 9 10 11 12

Ett stickprov kvantitativa data: t-test

Vikt

3655 3465 3900 3410 3720 4300 3570 4000 3625 4925 4190 4280 Nollhypotes H 0 :  =3600 gram Alternativhypotes H 1 :   3600 gram Deskriptiv statistik:

Möjligheter till inferens: Konfidensintervall

Resultat:  =3920 ± 281 3639<  <4201 (95%)  

X

t

Hypotestest (t-test):

Resultat t= 2,51 p=0,029

t

X s

  0

n s n

[email protected]

Förutsättningar för t-test och motsvarande konfidensintervall    Kvantitativa data Om stickprovet är litet måste variabeln som studeras vara normalfördelad Om stickprovet är stort fungerar analys trots avvikelse från normalfördelning (ju större stickprov desto större avvikelse kan accepteras).

[email protected]

Ett stickprov men förutsättningarna för t-test ej uppfyllda: teckentest är ett alternativ     

Nollhypotes: median=3600 Teckentest (Sign test) Vikt

3655 3465 3900 3410

Om hypotesen stämmer borde hälften av differenserna vara negativa och hälften positiva.

3720 4300 3570 4000 3625

Resultat: 9 av 12 positiva.

p= 0,15 dvs ej signifikant

4925 4190 4280

Förväntat Differens

3600 55 3600 3600 -135 300 3600 3600 3600 -190 120 700 3600 3600 3600 3600 3600 3600 -30 400 25 1325 590 680

Tecken + + + + + + + + + [email protected]

Förutsättningar för teckentest     Stickprov med lägst ordinaldata Test av median (om symmetri är median=väntevärde (populationsmedel) Inga antagandet om fördelningsform Mycket generellt test, men om det är normalfördelat är styrkan mycket lägre än t-test (ca 60% effektivitet vid normalfördlening).

[email protected]

Ett stickprov men förutsättningarna för t-test ej uppfyllda: tecken-rang test är ett annat alternativ     

Wilcoxon tecken rang-test Summera rangerna för värden med positivt tecken (eller negativt).

Resultat=65 (13)

Vikt

3655 3465 3900 3410 3720 4300 3570 4000 3625 4925 4190 4280 p=0,041 Alltså signifikans!

[email protected]

Förväntat Differens

3600 3600 55 -135 3600 3600 3600 3600 300 -190 120 700 3600 3600 3600 3600 3600 3600 -30 400 25 1325 590 680

Rang

3 5 7 6 4 11 2 8 1 12 9 10

Tecken + + + + + + + + +

Förutsättningar för tecken-rang-test    Stickprov med kvantitativa data Fördelningen för differenserna ska vara symmetrisk (behöver dock ej vara normalfördelad) Test av median eller väntevärde (populationsmedelvärde)  Ingen större effektivitetsförlust (ca 95% effektivitet givet normalfördelning)

[email protected]

Ett stickprov kvantitativa data, sammanfattande råd:     t-test är att föredra. Fungerar om variabeln är normalfördelad eller stickprovet stort. Använd så ofta som möjligt.

Ibland kan transformering göra datamaterialet mer lämpligt för t-test Teckentest är ett alternativ som fungerar oavsett fördelning Om fördelningen kan antas vara symmetrisk och stickprovet är under 20 kan tecken-rang-test vara ett bra alternativ

[email protected]

Två stickprov ”parade observationer”

pre post diff 5260 3910 1350 5470 4220 1250 5640 3885 1755 6180 5160 1020 6390 5645 745 6515 4680 1835 6805 5265 1540 7515 5975 1540 7515 6790 725 8230 6900 1330 8770 7335 1435 Nollhypotes:

d =0 Deskriptiv statistik

:

d

 1320 , 5 se( d )  sd(d)/ n

Konfidensintervall

:  110 , 6 

d

d

t se

(

d

) Resultat: 

d

 1320 .

5  246 .

4

Parat t-test:

t

d

 0

se

(

d

) Resultat: t=11,9 p<0,001

[email protected]

Två stickprov parade observationer- ej normalfördelat

pre post diff rang 5260 3910 1350 6 5470 4220 1250 5640 3885 1755 6180 5160 1020 6390 5645 745 6515 4680 1835 6805 5265 1540 7515 5975 1540 7515 6790 725 8230 6900 1330 8770 7335 1435 4 10 3 2 11 8,5 8,5 1 5 7 [email protected]

 Två alternativ:  Teckentest:  Alla differenser positiva  p=0,001  Tecken-rang-test  Rangsumman för plus=66  P=0,003

Parade observationer kvantitativa data, sammanfattande råd:     Parat t-test är att föredra. Fungerar om differenserna är normalfördelade eller stickprovet stort. Använd så ofta som möjligt.

Ibland kan transformering göra datamaterialet mer lämpligt för t-test Teckentest är ett alternativ som fungerar oavsett fördelning Om fördelningen av differenserna kan antas vara symmetrisk och stickprovet är under 20 kan tecken-rang-test vara ett bra alternativ

[email protected]

Två oberoende stickprov

7,05 7,48 7,48 7,53 7,58 7,9 8,08 8,09 8,11 8,4 10,15 10,88 Lean Obese 6,13 8,79 9,19 9,21 9,68 9,69 9,97 11,51 11,85 12,79

• •

Konfidensintervall

 1   2 

X

1 •

Resultat t=3.95

p=0,001

X

2 

tSE

(

X

1 •

Resultat: 2.23

1.18 (95%) Hypotestest, testfunktion:

X

2 )

t

X

1

se

( 

X

1

X

 2 

X

2 0 )

[email protected]

Förutsättningar för t-test mellan två oberoende stickprov  Kvantitativa data, två oberoende stickprov  Om stickproven är små måste variabeln vara normalfördelad i respektive population (ju större stickprov desto större avvikelse kan accepteras)  De två studerade populationerna ska vara lika homogena (samma standardavvikelse). Detta antagande är inte viktigt om stickproven är ungefär lika stora. Om villkoret ej är uppfyllt kan Welsh test användas

[email protected]

Två oberoende stickprov, men villkoren för t-test ej uppfyllda…

Lean rank Obese rank 6,13 7,05 7,48 7,48 7,53 7,58 7,9 8,08 1 2 3,5 3,5 5 6 7 8 8,09 8,11 8,4 10,15 9 10 11 18 10,88 19 103 [email protected]

8,79 9,19 9,21 9,68 9,69 9,97 11,51 11,85 12,79 12 13 14 15 16 17 20 21 22 150

• • • •

Rangsummetest Jämför rangsummorna Resultat: 150 vs 103 p=0,001

Förutsättningar för rangsummetest  Två oberoende stickprov, lägst ordinaldata  Vanligt antagande: Populationerna ska ha samma fördelning (spridning och form), men kan skilja sig i läge  Tänkbara nollhypoteser:  Populationerna har samma median  Populationerna har samma väntevärde

[email protected]

Transformer...

 

Vanligast är att logaritmera data.

Transformen kan ge mindre skevhet samt mindre skillnader i varians.

[email protected]

Två oberoende stickprov kvantitativa data, sammanfattande råd:     Oberoende t-test är att föredra. Fungerar om variabeln är normalfördelad i respektive population eller stickproven stora. Vidare ska populationerna vara lika homogena (ej väsentligt om stickproven är lika stora). Är populationerna inte lika homogena och stickproven olika stora (men i övrigt lämpliga för t test) är Welsh test ett alternativ.

Ibland kan transformering göra datamaterialet mer lämpligt för t-test Ett icke-parametriskt alternativ är rangsummetest

[email protected]

Kategoridata ett stickprov

   Andelen lyckade försök=p Parameter=  Om np(1-p)>5 gäller:  

p

z p

( 1 

p

)

n

  z=1.96 ger 95% konfidensgrad Under samma villkor, testfunktion:

z

  0

p

 ( 1   0  0 )

n

[email protected]

Två stickprov

  1 Om np(1-p)>5 i båda stickproven gäller:   2 

p

1 

p

2 

z p

1 ( 1 

n

1

p

1 ) 

p

2 ( 1 

n

2

p

2 )  Under samma villkor; testfunktion (för att testa hypotesen att proportionerna är lika):

z

p

( 1 

p

1 

p

2 1

p

)(

n

1  1

n

2 )

[email protected]

Analys av frekvenstabell (korstabell, kontingenstabell)

  Chi-två test Ex: Tomte Ej Tomte Tot Män 16 9 25 Kvinnor Tot 10 26 15 25 24 50  Testfunktion:  2  

allaceller

" " (

observerat

förväntat

) 2

förväntat

[email protected]

[email protected]

Analys av frekvenstabeller med parade data

Före kampanj Ekologisk Konventionell Efter kampanj Ekologisk Konventionell 22 18 4 46

Teckentest (eller McNemar)

[email protected]

Uppgift

  Vi vill undersöka om populationen ”bingolotto-tittare utan lott” skiljer sig vad det gäller genomsnittlig IQ Formalisera  Vad är nollhypotesen?

 Vilken information behövs?

[email protected]

Stickprovsstorlek (Sample Size)

 

Baserat på ett test

Följande information behövs:     Signifikansnivå (vanligen 5%) Styrka ( minst 80%) Variabilitet SD,SEM Skillnad att upptäcka (realistisk och intressant?)  

Baserat på konfidensintervall

Följande information behövs:    Konfidensgrad Variabilitet SD,SEM Önskad säkerhetsmarginal •Baserat på test eller K.I.?

•Om inte all information finns?

•Styrkefunktionens utseende

[email protected]

Länk: www.studysize.com