Współliniowość. Standaryzacja i współczynniki beta

Download Report

Transcript Współliniowość. Standaryzacja i współczynniki beta

Ekonometria stosowana
Wykład 5
WSPÓŁLINIOWOŚĆ
WSPÓŁCZYNNIKI BETA
Andrzej Torój - Lato 2013/2014
1
Porównywalność
współczynników regresji
uzytecznosci  stałt  0,6  winoi  4,0  kobietyi  5,1 śpiewi   i
[deklarowane j]
[l]
[szt.]
[min]
 jak interpretujemy poszczególne współczynniki?
 który z trzech czynników wpływa na użyteczność najbardziej?
 a jeżeli śpiew zaczniemy mierzyć w godzinach, a wino w liczbie
półlitrowych butelek?
 wartość współczynnika wynika z:
– siły oddziaływania na zmienną objaśnianą
– skali zmienności regresora, przy którym stoi
2
Współczynniki beta (1)
 standaryzujemy zmienne (wystarczy podzielić przez
odchylenie standardowe):
y* 
y
s( y)
xk 
*
xk
s( xk )
dla każdego k = 1, …, K
 szacujemy równanie za pomocą MNK:
yi  0  1x1i  ... K xKi   i
*
*
*
x
x
y
  0  1 1i  ...   K Ki   i
s( y)
s( x1i )
s( xKi )
s( y )
s( y )
yi   0  1
x1i  ...   K
xKi   i
s( x1i )
s( xKi )
3
Współczynniki beta (2)
yi  0  1 x1i  ...  K xKi   i
s( y )
s( y )
yi   0  1
x1i  ...   K
xKi   i
s( x1i )
s( xKi )
s( xk )
s( y)
k  k
 k  k
s( xk )
s( y)
 WNIOSEK: równoważną metodą jest skorygowanie
współczynników zwykłej regresji o iloraz odchyleń
standardowych zmiennej objaśnianej i objaśniających
4
Ćwiczenie
Plik powiaty.
Rozważamy czynniki wpływające na
wysokość dochodów samorządów.
Który z nich ma największy wpływ?
Czym jest współliniowość?
niektóre
kombinacją
liniową
pozostałych
XTX
będzie
macierzą
osobliwą (->
Matematyka)
regresory
nie są
niezależne
niektóre
wysoko
skorelowane
elementy
diagonalne
XTX blisko 0
nie obliczymy

ˆ  X T X

1
XT y
ze względu na
nieodwracalność XTX
elementy diagonalne
(XTX)-1 i s2(XTX)-1
wysokie, a więc
wysokie także błędy
standardowe
oszacowań i precyzja
szacunku niska
Diagnostyka współliniowości
1.
2.
macierz korelacji
–
Gretl: widok – macierz korelacji
–
pokazuje tylko bilateralne związki
–
brak jasnej granicy, powyżej której uznajemy problem za poważny
czynnik inflacji wariancji dla j-tego regresora
VIF j 
Gretl: testy –
test
współliniowości 3.
w oknie modelu
1
1 R2 j

gdzie R2j to R2 z regresji j-tego regresora względem pozostałych (ze stałą)

umowna wartość graniczna: 10, powyżej - współliniowość
indeks warunkowy
1/ 2


 max 

  
 min 
gdzie l to wartości własne macierzy powstałej z macierzy XTX przez podzielenie każdej
jej komórki (i,j) przez iloczyn pierwiastków jej elementów diagonalnych (i,i) i (j,j)
umowna wartość graniczna: 20, powyżej - współliniowość
Ćwiczenie
czy w naszym modelu dochodów
samorządów skala współliniowości jest
znacząca?
Co robić?
 wzmocnić precyzję szacunku przez rozszerzenie
próby, usunięcie zmiennej, nałożenie warunków
na parametry lub rezygnację z estymacji
parametru (wyniki innych badań itp.)
 „ręcznie” zwiększyć wartości diagonalnych
elementów macierzy XTX (regresja grzbietowa)
 ze współliniowych zmiennych „wycisnąć”
wspólną zmienność i zapisać ją w mniejszej
liczbie nowych, niezależnych zmiennych
(metoda głównych składowych)
Metoda głównych składowych
 n silnie skorelowanych regresorów
 jeżeli silnie skorelowane, to wśród nich istnieje pewien obszar
wspólnej zmienności
 znaczną część wariancji n skorelowanych zmiennych można
wyrazić za pomocą mniejszej liczby zmiennych niezależnych
od siebie
 te niezależne zmienne (główne składowe) można potem
wykorzystać w regresji, eliminując problem współliniowości
 zmienne będą kombinacjami liniowymi wyjściowych
zmiennych; współczynniki tych kombinacji będą dobierane
tak, aby w jak najmniejszej liczbie składowych zawrzeć jak
największy procent wariancji zmiennych wyjściowych
– szczegóły na Metodach statystycznych (część prof. Rószkiewicz)
Ćwiczenie
 Spróbujmy zastosować metodę głównych
składowych do naszego modelu.
 Widok – główne składowe. Naciskamy znak „+”,
aby zapisać składowe w bazie danych. Decyzja o
ich liczbie jest arbitralna, ogólna zasada jest taka,
aby jak najmniejsza ich liczba obejmowała jak
najwięcej wariancji zmiennych wyjściowych.
 Obserwujemy, jak skonstruowane są główne
składowe. Jak je interpretować?
 Spróbujmy zastąpić 14 regresorów trzema
składowymi. Czy wyniki są satysfakcjonujące?
Regresja grzbietowa
ˆ
skoro estymator MNK
OLS

 X X
T

1
XTy
traci efektywność ze względu na niskie
wartości diagonalne macierzy XTX...
to powiększmy je wszystkie o g:
ˆ
ORR

 X X  gI
T

1
XT y
ten estymator jest efektywniejszy od MNK
ale:
– jest za to obciążony – coś za coś...
– skąd wziąć g?
Ćwiczenie
korzystając z przygotowanego pliku
powiaty.xls, porównaj wyniki regresji
grzbietowej dla różnych g, w tym dla
estymatora MNK (g=0)
Literatura do wykładu 5
 Welfe, rozdział 5 (cały!)
 Dla chętnych:
– Maddala, rozdział 7
Andrzej Torój - Metody
ekonometryczne - Wiosna 2007/2008
14