Transcript slajdy

Regresja ciąg dalszy
Badania Operacyjne
Współczynnik R2
Wzór współczynnika R2:
TSS – total sum of squares
SSE – sum of square errors
Zawsze w przedziale [0,1]
Wada: dodanie zmiennej zawsze poprawi wartość współczynnika
Stąd skorygowany współczynnik R2, który uwzględnia liczbę zmiennych:
Model – istotność statystyczna
Model 1: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)
Zmienna zależna (Y): Avgseatsales
const
Avgprice
Avgoppprice
Avgincome
Współczynnik
28,8438
-2,1235
1,03456
3,08937
Błąd stand.
174,665
0,34039
0,466527
0,998893
t-Studenta
0,1651
-6,2384
2,2176
3,0928
Średn.aryt.zm.zależnej
Suma kwadratów reszt
Wsp. determ. R-kwadrat
F(3, 12)
Logarytm wiarygodności
Kryt. bayes. Schwarza
Autokorel.reszt - rho1
87,24375
2616,380
0,776492
13,89645
-63,47868
138,0477
0,405714
Odch.stand.zm.zależnej
Błąd standardowy reszt
Skorygowany R-kwadrat
Wartość p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna
Stat. Durbina-Watsona
wartość p
0,87159
0,00004
0,04664
0,00931
***
**
***
27,93562
14,76590
0,720615
0,000329
134,9574
135,1156
1,111409
1) Statystyka F: łączna istotność statystyczna parametrów przy wszystkich zmiennych – wartość p
2) Statystyka t-studenta: istotność statystyczna poszczególnych zmiennych (zależy od liczby obserwacji)
Idea: usuwamy KOLEJNO (po jednym) zmienne, które odpowiadają parametrom statystycznie
nieistotnym poczynając od najmniej istotnej.
Czyli usuwamy zmienną Const.
Istotność statystyczna
Model 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)
Zmienna zależna (Y): Avgseatsales
Avgprice
Avgoppprice
Avgincome
Współczynnik
-2,1184
1,10189
3,1993
Błąd stand.
0,326056
0,218123
0,716326
Średn.aryt.zm.zależnej
Suma kwadratów reszt
Wsp. determ. R-kwadrat
F(3, 13)
Logarytm wiarygodności
Kryt. bayes. Schwarza
Autokorel.reszt - rho1
87,24375
2622,326
0,980356
216,2550
-63,49684
135,3115
0,407666
Odch.stand.zm.zależnej
Błąd standardowy reszt
Skorygowany R-kwadrat
Wartość p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna
Stat. Durbina-Watsona
Teraz wygląda dobrze
t-Studenta
-6,4970
5,0517
4,4663
wartość p
0,00002
0,00022
0,00064
27,93562
14,20273
0,977333
2,43e-11
132,9937
133,1124
1,099873
***
***
***
Zaokrąglone wartości
Liczymy statystykę t dla hipotezy, że współczynnik
przy zmiennej Avgoppprice jest równy 1
Ponieważ wartość ta jest istotnie mniejsza od 2, to
hipoteza zyskuje mocne poparcie.
To samo dla reszty współczynników
Otrzymujemy równanie:
Avgseatsales = -2 Avgprice + 1 Avgoppprice +3
Avgincome
Specyfikacja równania
• Być może zależności nie są liniowe
• Np.
• Po zlogarytmowaniu
Jest jeszcze lepiej
Model 2: OLS, using observations 2013:1-2016:4 (T = 16)
Dependent variable: l_Avgseatsale
coefficient std. error t-ratio p-value
------------------------------------------------------------l_Avgprice
−7.63739 1.01895 −7.495 4.53e-06 ***
l_Avgoppprice 3.66443 0.649140 5.645 8.00e-05 ***
l_Avgincome
5.64535 1.01230 5.577 8.97e-05 ***
Mean dependent var 4.407235 S.D. dependent var 0.389005
Sum squared resid 0.420587 S.E. of regression 0.179869
R-squared
0.998656 Adjusted R-squared 0.998450
F(3, 13)
3221.034 P-value(F)
6.55e-19
Log-likelihood
6.406527 Akaike criterion −6.813054
Schwarz criterion −4.495288 Hannan-Quinn
−6.694365
rho
0.411095 Durbin-Watson
1.123173
Log-likelihood for Avgseatsales = −64.1092
Autokorel.reszt - rho1
0,407666
Stat. Durbina-Watsona
1,099873
Współliniowość: Dodajemy zmienną
Wydatki na marketing
Rok
Kwartał
Rok 1
Kw. I
Kw. II
Kw. III
Kw. IV
Kw. I
Kw. II
Kw. III
Kw. IV
Kw. I
Kw. II
Kw. III
Kw. IV
Kw. I
Kw. II
Kw. III
Kw. IV
Rok 2
Rok 3
Rok 4
Przeciętna liczba
sprzedanych biletów na
jeden lot
64,8
33,6
37,8
83,3
111,7
137,5
109,5
96,8
59,5
83,2
90,5
105,5
75,7
91,6
112,7
102,2
Przeciętna
cena
(w PLN)
250
265
265
240
230
225
225
220
230
235
245
240
250
240
240
235
Przeciętna
cena
konkurenta
250
250
240
240
240
260
250
240
240
250
250
240
220
230
250
240
Przeciętny
dochód
(wskaźnik)
104,0
101,5
103,0
105,0
100,0
96,5
93,3
95,0
97,0
99,0
102,5
105,0
108,5
108,5
108,0
109,0
Wydatki na
marketing
95
100
101
85
71
65
64
60
72
81
92
86
95
86
87
81
Współczynnik korelacji pomiędzy przeciętną ceną i wydatkami na marketing: 0,954445755
Model 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16)
Zmienna zależna (Y): Avgseatsales
Avgprice
Avgoppprice
Avgincome
Marketing
Współczynnik
-1,8416
0,954767
3,19366
-0,362965
Błąd stand.
0,661585
0,377211
0,738443
0,747255
t-Studenta
-2,7836
2,5311
4,3249
-0,4857
Średn.aryt.zm.zależnej
Suma kwadratów reszt
Wsp. determ. R-kwadrat
F(4, 12)
Logarytm wiarygodności
Kryt. bayes. Schwarza
Autokorel.reszt - rho1
87,24375
2571,762
0,980734
152,7176
-63,34108
137,7725
0,401994
Odch.stand.zm.zależnej
Błąd standardowy reszt
Skorygowany R-kwadrat
Wartość p dla testu F
Kryt. inform. Akaike'a
Kryt. Hannana-Quinna
Stat. Durbina-Watsona
wartość p
0,01654
0,02636
0,00099
0,63591
27,93562
14,63945
0,975918
3,52e-10
134,6822
134,8404
1,135021
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji
Avgprice 21,761
Avgoppprice 1,436
Avgincome 4,592
Marketing 31,078
**
**
***
Heteroskedatsyczność reszt
heteroskedastyczność:
U nas nie ma:
Normalność składnika losowego
U nas nie jest
źle: