Transcript slajdy
Regresja ciąg dalszy Badania Operacyjne Współczynnik R2 Wzór współczynnika R2: TSS – total sum of squares SSE – sum of square errors Zawsze w przedziale [0,1] Wada: dodanie zmiennej zawsze poprawi wartość współczynnika Stąd skorygowany współczynnik R2, który uwzględnia liczbę zmiennych: Model – istotność statystyczna Model 1: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16) Zmienna zależna (Y): Avgseatsales const Avgprice Avgoppprice Avgincome Współczynnik 28,8438 -2,1235 1,03456 3,08937 Błąd stand. 174,665 0,34039 0,466527 0,998893 t-Studenta 0,1651 -6,2384 2,2176 3,0928 Średn.aryt.zm.zależnej Suma kwadratów reszt Wsp. determ. R-kwadrat F(3, 12) Logarytm wiarygodności Kryt. bayes. Schwarza Autokorel.reszt - rho1 87,24375 2616,380 0,776492 13,89645 -63,47868 138,0477 0,405714 Odch.stand.zm.zależnej Błąd standardowy reszt Skorygowany R-kwadrat Wartość p dla testu F Kryt. inform. Akaike'a Kryt. Hannana-Quinna Stat. Durbina-Watsona wartość p 0,87159 0,00004 0,04664 0,00931 *** ** *** 27,93562 14,76590 0,720615 0,000329 134,9574 135,1156 1,111409 1) Statystyka F: łączna istotność statystyczna parametrów przy wszystkich zmiennych – wartość p 2) Statystyka t-studenta: istotność statystyczna poszczególnych zmiennych (zależy od liczby obserwacji) Idea: usuwamy KOLEJNO (po jednym) zmienne, które odpowiadają parametrom statystycznie nieistotnym poczynając od najmniej istotnej. Czyli usuwamy zmienną Const. Istotność statystyczna Model 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16) Zmienna zależna (Y): Avgseatsales Avgprice Avgoppprice Avgincome Współczynnik -2,1184 1,10189 3,1993 Błąd stand. 0,326056 0,218123 0,716326 Średn.aryt.zm.zależnej Suma kwadratów reszt Wsp. determ. R-kwadrat F(3, 13) Logarytm wiarygodności Kryt. bayes. Schwarza Autokorel.reszt - rho1 87,24375 2622,326 0,980356 216,2550 -63,49684 135,3115 0,407666 Odch.stand.zm.zależnej Błąd standardowy reszt Skorygowany R-kwadrat Wartość p dla testu F Kryt. inform. Akaike'a Kryt. Hannana-Quinna Stat. Durbina-Watsona Teraz wygląda dobrze t-Studenta -6,4970 5,0517 4,4663 wartość p 0,00002 0,00022 0,00064 27,93562 14,20273 0,977333 2,43e-11 132,9937 133,1124 1,099873 *** *** *** Zaokrąglone wartości Liczymy statystykę t dla hipotezy, że współczynnik przy zmiennej Avgoppprice jest równy 1 Ponieważ wartość ta jest istotnie mniejsza od 2, to hipoteza zyskuje mocne poparcie. To samo dla reszty współczynników Otrzymujemy równanie: Avgseatsales = -2 Avgprice + 1 Avgoppprice +3 Avgincome Specyfikacja równania • Być może zależności nie są liniowe • Np. • Po zlogarytmowaniu Jest jeszcze lepiej Model 2: OLS, using observations 2013:1-2016:4 (T = 16) Dependent variable: l_Avgseatsale coefficient std. error t-ratio p-value ------------------------------------------------------------l_Avgprice −7.63739 1.01895 −7.495 4.53e-06 *** l_Avgoppprice 3.66443 0.649140 5.645 8.00e-05 *** l_Avgincome 5.64535 1.01230 5.577 8.97e-05 *** Mean dependent var 4.407235 S.D. dependent var 0.389005 Sum squared resid 0.420587 S.E. of regression 0.179869 R-squared 0.998656 Adjusted R-squared 0.998450 F(3, 13) 3221.034 P-value(F) 6.55e-19 Log-likelihood 6.406527 Akaike criterion −6.813054 Schwarz criterion −4.495288 Hannan-Quinn −6.694365 rho 0.411095 Durbin-Watson 1.123173 Log-likelihood for Avgseatsales = −64.1092 Autokorel.reszt - rho1 0,407666 Stat. Durbina-Watsona 1,099873 Współliniowość: Dodajemy zmienną Wydatki na marketing Rok Kwartał Rok 1 Kw. I Kw. II Kw. III Kw. IV Kw. I Kw. II Kw. III Kw. IV Kw. I Kw. II Kw. III Kw. IV Kw. I Kw. II Kw. III Kw. IV Rok 2 Rok 3 Rok 4 Przeciętna liczba sprzedanych biletów na jeden lot 64,8 33,6 37,8 83,3 111,7 137,5 109,5 96,8 59,5 83,2 90,5 105,5 75,7 91,6 112,7 102,2 Przeciętna cena (w PLN) 250 265 265 240 230 225 225 220 230 235 245 240 250 240 240 235 Przeciętna cena konkurenta 250 250 240 240 240 260 250 240 240 250 250 240 220 230 250 240 Przeciętny dochód (wskaźnik) 104,0 101,5 103,0 105,0 100,0 96,5 93,3 95,0 97,0 99,0 102,5 105,0 108,5 108,5 108,0 109,0 Wydatki na marketing 95 100 101 85 71 65 64 60 72 81 92 86 95 86 87 81 Współczynnik korelacji pomiędzy przeciętną ceną i wydatkami na marketing: 0,954445755 Model 2: Estymacja KMNK, wykorzystane obserwacje 2013:1-2016:4 (N = 16) Zmienna zależna (Y): Avgseatsales Avgprice Avgoppprice Avgincome Marketing Współczynnik -1,8416 0,954767 3,19366 -0,362965 Błąd stand. 0,661585 0,377211 0,738443 0,747255 t-Studenta -2,7836 2,5311 4,3249 -0,4857 Średn.aryt.zm.zależnej Suma kwadratów reszt Wsp. determ. R-kwadrat F(4, 12) Logarytm wiarygodności Kryt. bayes. Schwarza Autokorel.reszt - rho1 87,24375 2571,762 0,980734 152,7176 -63,34108 137,7725 0,401994 Odch.stand.zm.zależnej Błąd standardowy reszt Skorygowany R-kwadrat Wartość p dla testu F Kryt. inform. Akaike'a Kryt. Hannana-Quinna Stat. Durbina-Watsona wartość p 0,01654 0,02636 0,00099 0,63591 27,93562 14,63945 0,975918 3,52e-10 134,6822 134,8404 1,135021 Ocena współliniowości VIF - czynnika powiększania wariancji Minimalna możliwa wartość = 1.0 Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji Avgprice 21,761 Avgoppprice 1,436 Avgincome 4,592 Marketing 31,078 ** ** *** Heteroskedatsyczność reszt heteroskedastyczność: U nas nie ma: Normalność składnika losowego U nas nie jest źle: