Föreläsning 11

Download Report

Transcript Föreläsning 11

Föreläsning 11
732G81
Statistik för internationella civilekonomer
[email protected]
1
Dagens föreläsning
o
Enkel linjär regression
•
•
•
•
•
Tolka Minitabutskrift
Testa signifikant lutning
Intervall för lutning
Förklaringsgrad
Prognosticering
•
•
Skillnad konfidens- och prognosintervall
När används regression?
732G81
2
Enkel linjär regression
Dagens exempel
Idag kommer vi arbeta med siffror från NHL, säsongen
2011/2012. Finns det något samband mellan de 30 lagens
lönekostnad för spelare i miljoner dollar (eng. payroll) och
antalet tagna poäng i seriespelet? Vi ser den aktuella
säsongen som ett urval av alla säsonger i NHL.
Lag
Lönekostnad Poäng
Philadelphia Flyers
71,0725
103
Buffalo Sabres
69,83
89
Chicago Blackhawks 69,49
101
Vancouver Canucks
111
68,211
Washington Capitals 66,5875
92
Pittsburgh Penguins
66,35
108
Toronto Maple Leafs
65,01
80
…
…
…
Colorado Avalanche
40,62
88
732G81
New York Islanders
29,5735
79
3
Enkel linjär regression
Visuell analys
732G81
4
Enkel linjär regression
Visuell analys
732G81
5
Enkel linjär regression
Visuell analys
732G81
6
Enkel linjär regression
Visuell analys
732G81
7
Enkel linjär regression
Tolka SPSS-utskrift
Förklaringsgraden (𝑟 2 )
𝑦𝑖 − 𝑦𝑖
2
=
𝑒𝑖2
Residualspridningen
n-2
n-1
Information om 𝑏0
Information om 𝑏1
732G81
8
Enkel linjär regression
Tolka Minitabutskrift
Regression Analysis: Poäng versus Lönekostnad
The regression equation is
Poäng = 61,7 + 0,534 Lönekostnad
Predictor
Constant
Lönekostnad
Coef
61,74
0,5341
S = 10,6857
Residualspridningen
SE Coef
11,66
0,2029
R-Sq = 19,8%
732G81
P
0,000
0,014
Information om 𝑏0
Information om 𝑏1
R-Sq(adj) = 17,0%
Förklaringsgraden (𝑟 2 )
Analysis of Variance
Source
DF
SS
Regression
1
790,9
Residual Error 28 3197,1
Total
29 3988,0
n-2
n-1
T
5,29
2,63
𝑦𝑖 = 𝑏0 + 𝑏1 ∗ 𝑥𝑖
MS
790,9
114,2
F
6,93
𝑦𝑖 − 𝑦𝑖
9
P
0,014
2
=
𝑒𝑖2
Enkel linjär regression
Lutningen (𝛽1 )
Först och främst testas om lutningen är signifikant:
𝐻0 : 𝛽1 = 0
𝐻𝑎 : 𝛽1 ≠ 0
Detta test behöver dock inte vara dubbelsidigt:
𝐻0 : 𝛽1 ≤ 0
𝐻𝑎 : 𝛽1 > 0
Det går även att göra intervall för lutningen, och detta
intervall kan på vanligt sätt relateras till hypotesprövningen.
𝑠
𝑏1 ± 𝑡𝑛−2;1−𝛼 2 ∗
𝑥𝑖 − 𝑥 2
732G81
10
Enkel linjär regression
Förklaringsgrad
Vid enkel linjär regression gäller att förklaringsgraden (𝑟 2 ) är
korrelationskoefficienten (𝑟) i kvadrat.
S = 10,6857
R-Sq = 19,8%
R-Sq(adj) = 17,0%
Mer allmänt kan man räkna ut förklaringsgraden på följande
sätt.
Analysis of Variance
Source
DF
SS
Regression
1
790,9
Residual Error 28 3197,1
Total
29 3988,0
Förklarad variation
MS
F
P
790,9 6,93 0,014
114,2
Total variation i y
Oförklarad variation
732G81
11
Enkel linjär regression
Prognosticering
Med hjälp av regression kan prognoser göras på nya
värden.
•
•
Konfidensintervall: intervall för ett medelvärde
Prognosintervall: intervall för en enskild enhet
Exempel
Ett NHL-lag planerar att lägga 60 miljoner dollar på
spelarlöner kommande säsong, hur många poäng kan de
då förväntas spela in under seriespelet?
𝑥 = 56,55
𝑥𝑖 − 𝑥
2
= 2772,21
732G81
12
Enkel linjär regression
Prognosticering
Predicted Values for New Observations
New Obs
1
Fit
93,79
SE Fit
2,07
95% CI
(89,55; 98,02)
95% PI
(71,49; 116,08)
Values of Predictors for New Observations
New Obs Lönekostnad
1
60,0
732G81
13
Enkel linjär regression
När används regression?
Regression är oftast ingen metod man planerar sig av att
använda.
Ett stort datamaterial kan ha insamlats och man börjar
intressera sig för samband mellan olika variabler i detta
datamaterial. Då kan först och främst korrelationskoefficienterna observeras, och utifrån dessa kan olika
regressionsmodeller skapas.
Vid mer planerade experiment kan en metod med namnet
ANOVA (ANalysis Of VAriance) användas. Det ingår dock
inte i denna kurs.
732G81
14
Tärningskast
Tänk dig att du kastar en tärning med två givna händelser
som du ska beräkna sannolikheten för.
A = Tärningen visar en tre prickar
B = Tärningen visar ett udda antal prickar
Vad är P(A), P(B), P(A|B), P(B|A), P(A U B), P(A ∩ B)?
732G81
15
Tärningskast forts.
Tänk dig att du kastar samma tärning 10 gånger. Beräkna
sannolikheten att slå minst 4 sexor.
732G81
16
Tack för mig!
17