Transcript Document

KAPITEL 7
Jämförelse av två populationer
Sid 186-209
Konfidensintervall för jämförelse av
populationsmedelvärden
• Krav
• Två oberoende OSU
• Samplingfördelningarna för de två stickprovsmedelvärdena går att betrakta
som normalfördelade
• Känd
 x1 

x 2   z 1  / 2
• Okänd
1
2
n1
n2
 1   2   x1  x 2   z 1 
1
2
2
2
2

2
2

n1
n2

 x 1  x 2   t n *  1;1  / 2
 1   2   x1  x 2   z 1 
1
2
2
n1
2

s2
n2

n1
 1   2   x 1  x 2   t n *  1;1 
s1
2
 1   2   x1  x 2   t n *  1;1 
n2
2
s1
2

n1
n2
2
s1
n1
s2
2

s2
n2
Exempel
• För att planera för personalåtgång i en sportaffär dras ett
OSU av 25 måndagar och ett OSU av 25 lördagar från en
population (baserad på data från många år).
Medelförsäljningen var 10780 kr på måndagar med
standardavvikelse 6330 kr och 9082 kr på lördagar med
standardavvikelse 4698 kr. Är försäljningen lägre på
lördagar än på måndagar? Beräkna ett lämpligt 95%-igt
konfidensintervall för att besvara frågeställningen.
• Vilka antaganden behöver göras?
Hypotesprövning för jämförelse av
populationsmedelvärden
• Krav
• Två oberoende OSU
• Samplingfördelningarna för de två stickprovsmedelvärdena går att betrakta
som normalfördelade
• Nollhypotes
• H0: µ1 - µ2 = d0
• Testvariabler
• Om  är känd
Om  är okänd
z 
 x1 
x2   d 0
1
2
n1

t 
 x1 
x2   d 0
2
2
s1
n2
n1
2
2

s2
n2
• Kritiska värden
• För Ha: µ1 - µ2 ≠ d0 är kritiskt område både till vänster om zα/2 resp. tn*-1; α/2 och
till höger om z1-α/2 resp. tn*-1; 1-α/2
• För Ha: µ1 - µ2 < d0 är kritiskt område till vänster om z α resp. tn*-1; α
• För Ha: µ1 - µ2 > d0 är kritiskt område till höger om z 1-α resp tn*-1; 1-α
Exempel forts.
• Hypotestesta på 5% signifikansnivå om den
genomsnittliga försäljningen är lägre på lördagar än på
måndagar.
• Vilka antaganden behöver göras?
Konfidensintervall för jämförelse av
populationsandelar
• Krav
• Två oberoende OSU
• np(1-p) > 5 för båda stickproven
• Dubbelsidigt och enkelsidiga konfidensintervall med
konfidensgrad 1 - :
 p1
 p 2   z 1  / 2
 1   2   p 1  p 2   z 1 
 1   2   p 1  p 2   z 1 
p 1 1  p 1 

n1
p 1 1  p 1 
n2

n1
p 1 1  p 1 
n1
p 2 1  p 2 
p 2 1  p 2 
n2

p 2 1  p 2 
n2
Exempel
• I SIFOs väljarbarometer från i mars 2014 svarade 50.5%
av 1934 tillfrågade att dom skulle rösta på någon av de
rödgröna partierna om det var val i dag. Motsvarande
siffror i februari var 52.8% av 1933. Beräkna ett 95%-igt
dubbelsidigt konfidensintervall för förändringen i andel
mellan februari och mars.
• Vilka antagande behöver göras?
• Ligger förändringen inom den statistiska felmarginalen?
Hypotesprövning för jämförelse av populationsandelar
• Krav
• Två oberoende OSU
• np(1 – p) > 5 för båda stickproven
• Nollhypotes
• H0: 1 - 2 = d0
• Testvariabel
z 
 p1 
p2   d 0
 1
1 

p p 1  p p 


n
n
2 
 1
där
pp 
antal lyckade utfall i båda stickprove n
n1  n 2
• Kritiska värden
• För Ha: µ1 - µ2 ≠ d0 är kritiskt område både till vänster om zα/2 och till höger om z1-α/2
• För Ha: µ1 - µ2 < d0 är kritiskt område till vänster om z α
• För Ha: µ1 - µ2 > d0 är kritiskt område till höger om z 1-α
Exempel forts.
• Testa, på 5% signifikansnivå, om andelen som skulle
rösta på någon av de rödgröna partierna har förändrats
mellan februari och mars.
Parvisa observationer
• Två beroende stickprov
• Samma enhet studeras vid två tillfällen (”före”, ”efter”)
• Enheter i de två stickproven är ”parade” (tex man och hustru)
• Metoderna vi hittills använt har antagit oberoende stickprov och kan
inte användas
• Skapa en ny variabel, D, som är differensen mellan
värdena i de två stickproven, per enhet/parade enheter
• Samma metoder som för ”inferens om en population” kan
nu användas!
Exempel
• Forskare ville undersöka varför vi
minns innehåll från en viss typ av
reklam bättre än en annan typ av
reklam. 10 slumpmässigt utvalda
personer fick se en reklamsnutt
som klassificerats som ”lätt att
minnas” och en reklamsnutt som
klassificerats som ”svår att
minnas”. Forskarnas hypotes var
att hjärnaktiviteten är högre under
reklam vi minns och att det är
därför vi lättare minns den. Testa,
på 5% signifikansnivå, om
hjärnaktiviteten är högre under
”lätt att minnas”-reklam.
• Vilka antaganden behöver göras?
Person
”Lätt” ”Svår”
1
141
55
2
139
116
3
87
83
4
129
88
5
51
36
6
50
68
7
118
91
8
161
115
9
61
90
10
148
113