Współliniowość. Standaryzacja i współczynniki beta
Download
Report
Transcript Współliniowość. Standaryzacja i współczynniki beta
Ekonometria stosowana
Wykład 5
WSPÓŁLINIOWOŚĆ
WSPÓŁCZYNNIKI BETA
Andrzej Torój - Lato 2013/2014
1
Porównywalność
współczynników regresji
uzytecznosci stałt 0,6 winoi 4,0 kobietyi 5,1 śpiewi i
[deklarowane j]
[l]
[szt.]
[min]
jak interpretujemy poszczególne współczynniki?
który z trzech czynników wpływa na użyteczność najbardziej?
a jeżeli śpiew zaczniemy mierzyć w godzinach, a wino w liczbie
półlitrowych butelek?
wartość współczynnika wynika z:
– siły oddziaływania na zmienną objaśnianą
– skali zmienności regresora, przy którym stoi
2
Współczynniki beta (1)
standaryzujemy zmienne (wystarczy podzielić przez
odchylenie standardowe):
y*
y
s( y)
xk
*
xk
s( xk )
dla każdego k = 1, …, K
szacujemy równanie za pomocą MNK:
yi 0 1x1i ... K xKi i
*
*
*
x
x
y
0 1 1i ... K Ki i
s( y)
s( x1i )
s( xKi )
s( y )
s( y )
yi 0 1
x1i ... K
xKi i
s( x1i )
s( xKi )
3
Współczynniki beta (2)
yi 0 1 x1i ... K xKi i
s( y )
s( y )
yi 0 1
x1i ... K
xKi i
s( x1i )
s( xKi )
s( xk )
s( y)
k k
k k
s( xk )
s( y)
WNIOSEK: równoważną metodą jest skorygowanie
współczynników zwykłej regresji o iloraz odchyleń
standardowych zmiennej objaśnianej i objaśniających
4
Ćwiczenie
Plik powiaty.
Rozważamy czynniki wpływające na
wysokość dochodów samorządów.
Który z nich ma największy wpływ?
Czym jest współliniowość?
niektóre
kombinacją
liniową
pozostałych
XTX
będzie
macierzą
osobliwą (->
Matematyka)
regresory
nie są
niezależne
niektóre
wysoko
skorelowane
elementy
diagonalne
XTX blisko 0
nie obliczymy
ˆ X T X
1
XT y
ze względu na
nieodwracalność XTX
elementy diagonalne
(XTX)-1 i s2(XTX)-1
wysokie, a więc
wysokie także błędy
standardowe
oszacowań i precyzja
szacunku niska
Diagnostyka współliniowości
1.
2.
macierz korelacji
–
Gretl: widok – macierz korelacji
–
pokazuje tylko bilateralne związki
–
brak jasnej granicy, powyżej której uznajemy problem za poważny
czynnik inflacji wariancji dla j-tego regresora
VIF j
Gretl: testy –
test
współliniowości 3.
w oknie modelu
1
1 R2 j
gdzie R2j to R2 z regresji j-tego regresora względem pozostałych (ze stałą)
umowna wartość graniczna: 10, powyżej - współliniowość
indeks warunkowy
1/ 2
max
min
gdzie l to wartości własne macierzy powstałej z macierzy XTX przez podzielenie każdej
jej komórki (i,j) przez iloczyn pierwiastków jej elementów diagonalnych (i,i) i (j,j)
umowna wartość graniczna: 20, powyżej - współliniowość
Ćwiczenie
czy w naszym modelu dochodów
samorządów skala współliniowości jest
znacząca?
Co robić?
wzmocnić precyzję szacunku przez rozszerzenie
próby, usunięcie zmiennej, nałożenie warunków
na parametry lub rezygnację z estymacji
parametru (wyniki innych badań itp.)
„ręcznie” zwiększyć wartości diagonalnych
elementów macierzy XTX (regresja grzbietowa)
ze współliniowych zmiennych „wycisnąć”
wspólną zmienność i zapisać ją w mniejszej
liczbie nowych, niezależnych zmiennych
(metoda głównych składowych)
Metoda głównych składowych
n silnie skorelowanych regresorów
jeżeli silnie skorelowane, to wśród nich istnieje pewien obszar
wspólnej zmienności
znaczną część wariancji n skorelowanych zmiennych można
wyrazić za pomocą mniejszej liczby zmiennych niezależnych
od siebie
te niezależne zmienne (główne składowe) można potem
wykorzystać w regresji, eliminując problem współliniowości
zmienne będą kombinacjami liniowymi wyjściowych
zmiennych; współczynniki tych kombinacji będą dobierane
tak, aby w jak najmniejszej liczbie składowych zawrzeć jak
największy procent wariancji zmiennych wyjściowych
– szczegóły na Metodach statystycznych (część prof. Rószkiewicz)
Ćwiczenie
Spróbujmy zastosować metodę głównych
składowych do naszego modelu.
Widok – główne składowe. Naciskamy znak „+”,
aby zapisać składowe w bazie danych. Decyzja o
ich liczbie jest arbitralna, ogólna zasada jest taka,
aby jak najmniejsza ich liczba obejmowała jak
najwięcej wariancji zmiennych wyjściowych.
Obserwujemy, jak skonstruowane są główne
składowe. Jak je interpretować?
Spróbujmy zastąpić 14 regresorów trzema
składowymi. Czy wyniki są satysfakcjonujące?
Regresja grzbietowa
ˆ
skoro estymator MNK
OLS
X X
T
1
XTy
traci efektywność ze względu na niskie
wartości diagonalne macierzy XTX...
to powiększmy je wszystkie o g:
ˆ
ORR
X X gI
T
1
XT y
ten estymator jest efektywniejszy od MNK
ale:
– jest za to obciążony – coś za coś...
– skąd wziąć g?
Ćwiczenie
korzystając z przygotowanego pliku
powiaty.xls, porównaj wyniki regresji
grzbietowej dla różnych g, w tym dla
estymatora MNK (g=0)
Literatura do wykładu 5
Welfe, rozdział 5 (cały!)
Dla chętnych:
– Maddala, rozdział 7
Andrzej Torój - Metody
ekonometryczne - Wiosna 2007/2008
14