1.Ekonometria

Download Report

Transcript 1.Ekonometria

EKONOMETRIA
Prof. dr hab. Grażyna Karmowska
[email protected]
Tematyka wykładów
1. Etapy budowy modelu ekonometrycznego. Dobór
zmiennych objaśniających do modelu.
2. Szacowanie parametrów modeli liniowych MNK.
Weryfikacja modeli liniowych.
3. Modele nieliniowe sprowadzalne do liniowych. Badanie
własności odchyleń losowych.
Literatura
1. B. Borkowski, H. Dudek, W. Szczęsny
Ekonometria. Wybrane zagadnienia. PWN
2003
2. E. Nowak S., Zarys metod ekonometrii.
Zbiór zadań.PWN 1999.
3. Wprowadzenie do ekonometrii w
przykładach i zadaniach. Pod red. K.
Kukuły, PWN 2000
Czym jest ekonometria?
Ekonometria - zastosowanie metod
statystycznych i matematycznych do
analizy danych empirycznych, w celu
dostarczenia teoriom ekonomicznym
materiału empirycznego oraz weryfikacji
lub obalenia tych teorii.
Termin „ekonometria” - 1910, Paweł Ciompa
„Przegląd ekonometrii i rzeczywistej teorii
buchalterii”.
Ragnar Frish, 1926, wprowadził termin
„ekonometria”.
Cele ekonometrii
# Formułowanie modeli ekonometrycznych, czyli
formułowanie modeli ekonomicznych w formie
pozwalającej je empirycznie testować.
# Estymowanie i testowanie modeli
ekonometrycznych na danych obserwacjach.
# Wykorzystanie modeli do analizy oraz celów
prognostycznych
Model
Model - uproszczone przedstawienie
rzeczywistych procesów.
Szczegółowość modelu
– prosty (Karl Popper, Milton Friedman),
– złożony (T.C. Koopmans, Jimmy Savage: „model
powinien być duży jak słoń”).
W praktyce: uwzględniamy w modelu
wszystkie czynniki, które uważamy za
ważne dla naszego problemu, a
pomijamy wszystkie pozostałe.
Model ekonomiczny - zbiór założeń,
które w przybliżeniu opisują
zachowanie się gospodarki.
Model ekonometryczny - pojedyncze
równanie, bądź układu równań, które
przedstawia zasadnicze powiązania
ilościowe między rozpatrywanymi
zjawiskami ekonomicznymi.
Co najmniej jedno z równań modelu
jest równaniem stochastycznym tj.
zawierającym składnik losowy.
Budowa modelu ekonometrycznego
problem ekonomiczny
wybór zmiennych
budowa modelu
szacowanie
testowanie hipotez
weryfikacja
nie
Model
poprawny?
tak
Analiza
Prognozowanie
Dane do modelu
Podstawowe źródła danych:
– publikacje GUS (Roczniki i Biuletyny Statystyczne),
– publikacje NBP,
– dane przedsiębiorstw, giełdowe, itp.
Szereg czasowy - zestaw liczb odpowiadających
wartościom, jakie przybrało rejestrowane zjawisko
w kolejnych, jednakowo odległych, momentach
czasu (np. latach, kwartałach, miesiącach) w
danym obiekcie.
Szereg przekrojowy (strukturalny) - dane
wyrażające stan zjawiska w ustalonym okresie
czasu, ale w odniesieniu do różnych obiektów.
Cele stosowania analizy regresji
# Analiza efektów zmian wartości pojedynczych
zmiennych objaśniających.
# Badanie, czy jakakolwiek zmienna objaśniająca
ma istotny wpływ na zmienną objaśnianą.
# Prognoza wartości zmiennej objaśnianej (y) dla
danego zestawu wartości zmiennych
objaśniających.
Dobór zmiennych objaśniających do
modelu ekonometrycznego
Eliminacja zmiennych quasi stałych
Obliczamy współczynniki zmienności dla
poszczególnych zmiennych „kandydatek” na
zmienne objaśniające.
Si
vi 
xi
Za zmienną quasi stałą uznaje się tą która spełnia
warunek:
vi  v
*
I jest ona eliminowana ze zbioru potencjalnych
zmiennych objaśniających
Gdzie odpowiednio:
Średnia arytmetyczna dla danej zmiennej i:
1
xi   xti
n t
Odchylenie standardowe dla danej zmiennej i:
1
2
Si 
(
x

x
)
 ti i
n
Przykład 1.
Do opisu produkcji przedsiębiorstwa w mld zł (Y)
zaproponowano cztery zmienne:
X1 – zatrudnienie w tys. osób
X2 – wartość maszyn i urządzeń w mln zł
X3 – czas przestoju maszyn w dniach
X4 – nakłady inwestycyjne w mln zł.
Przy założonym poziomie wartości krytycznej współczynnika
zmienności v*=0,15 należy sprawdzić, czy ww. zmienne
odznaczają się odpowiednio wysoką zmiennością.
Na podstawie danych z 10 lat otrzymano dla tych
zmiennych następujące wartości średnie oraz odchylenia
standardowe
x1  10
S1  2,51
x 2  12
S 2  3,688
x3  20
S 3  4,382
x 4  12
S 4  1,265
I otrzymano współczynniki zmienności:
v1  0,251
v2  0,307
v3  0,219
v4  0,105
jedynie
v4  v
*
Czyli nakłady inwestycyjne oznaczają
się niskim poziomem zmienności.
Z pozostałych zmiennych wybieramy zmienne
do modelu stosując
METODĘ POJEMNOŚCI INFORMACYJNEJ
Y - zmienna objaśniana (zależna, endogeniczna)
X = {X1, X2, ..., Xm} - zbiór „kandydatek” na zmienne
objaśniające (niezależne, egzogeniczne)
rij - współczynnik korelacji liniowej Pearsona między
„kandydatkami” na zmienne objaśniające,
rj - współczynnik korelacji liniowej Pearsona między
zmiennymi Xj i Y,
s = 1, 2, ..., 2m-1
- numer niepustych kombinacji
zmiennych ze zbioru X,
Cs - zbiór numerów zmiennych tworzących s-tą
kombinację.
Współczynnik korelacji liniowej między
zmiennymi Y i X


( xi  x )( yi  y)

rj 
 2
 2
 ( xi  x )  ( yi  y)
Współczynnik korelacji liniowej między
zmiennymi Xi i Xj

 ( xti  xi )( xtj  x j )
rij 
 2
2
 ( xti  xi )  ( xtj  x j )
Wektor współczynników korelacji między zmienną Y
a zmiennymi X (parami)
r1 
r 
2
R0  . 
 
. 
rm 
Macierz współczynników korelacji między zmiennymi X
(parami)
 1 r12 ... r1m 
r

1 ... r2 m
21

R
 .
.
.
. 


rm1 rm 2 ... 1 
Metoda Hellwiga badania
pojemności informacyjnej
Indywidualna pojemność informacyjna nośnika Xj w s-tej
2
kombinacji:
hsj 
rj
r
ij
iC s
Integralna pojemność informacyjna s-tej kombinacji:
Hs 
Reguła decyzyjna:
h
sj
jC s


Copt : H opt  max H s : s  1,2,..., 2 m  1
Przykład 2. (cd. P1)
Dla pozostałych zmiennych tworzymy macierze
współczynników korelacji:
0,973 
R0  0,968 


 0,932 
0,939  0,863
 1


R  0,939
1
 0,948


 0,863  0,948
1 
Możliwe kombinacje między
zmiennymi X
L  2 1
3
L  2 1  8 1  7
m
C1=(X1)
C2=(X2)
C3=(X3)
C4=(X1, X2)
C5=(X1, X3)
C6=(X2, X3)
C7=(X1, X2, X3)
2
2
H1  h1  r1  0,973  0,946729
2
2
H 2  h2  r2  0,968  0,937024
2
2
H 3  h3  r3  (0,932)  0,868624
r12
r22
H 4  h41  h42 


1  r12 r21  1
0,9732
0,9682



1  0,939 0,939  1
 0,4882563  0,483251  0,971507
r12
r32
H 5  h51  h53 


1  r13 r31  1
0,973
(0,932)



1   0,863  0,863  1
2
2
 0,508174  0,466250  0,974424
r22
r32
H 6  h62  h63 


1  r23 r32  1
0,968 2
(0,932) 2



1   0,948  0,948  1
 0,481018  0,445906  0,926924
r12
r22
r32
H 7  h71  h72  h73 



1  r12  r13 r21  1  r23 r31  r32  1
0,9732
0,968 2
(0,932) 2




1  0,939   0,863 0,939  1   0,948  0,863   0,948  1
 0,337876  0,324567  0,309009  0,971452
Kombinacja piąta zawiera najwięcej informacji.
Jej pojemność wynosi 0,974424 tzn. że należy
zbudować model liniowy ze zmiennymi
niezależnymi X1 i X3
yt  0  1x1   2 x3
METODA WYBORU ZMIENNYCH ZA
POMOCĄ WSPÓŁCZYNNIKA
KORELACJI WIELORAKIEJ
det(Wi )
Ri  1 
det(Ri )
det (R) wyznacznik macierzy R współczynników korelacji
zmiennych objaśniających X1, X2, ..., Xk
det (W) wyznacznik macierzy W
1
Wi  
 R0i
R0 wektor współczynników korelacji liniowej między
zmienną Y a zmiennymi X
T
R0i 

Ri 
PRZYKŁAD
Na podstawie danych z 10 lat zbudowano wektor
współczynników korelacji miedzy zmiennymi Y i X, oraz macierz
współczynników korelacji między zmiennymi X łączonych
parami o postaciach:
0,8057 
0,7325 

R0  
0,8687 


 0,2679 
0,8140 0,8353
0,0136 
 1
:
0,8140
1
0,5549
0,1290 

R
 0,8353 0,5549
1
 0,1511


1 
0,0136 0,1290  0,1511
Na podstawie współczynnika korelacji wielorakiej wybieramy
optymalną kombinację zmiennych spośród dwuelementowych
kombinacji potencjalnych zmiennych objaśniających:






K1=X1, X2
K2=X1, X3
K3=X1, X4
K4=X2, X3
K5=X2, X4
K6=X3, X4_
Dla kombinacji K1:
0,8057 
R01  

0
,
7325


0,8057 0,7325
 1
W1  0,8057
1
0,8140 


0,7325 0,8140
1 
0,814 
 1
R1  

0
,
814
1



Współczynnik korelacji wielorakiej między zmienną
objaśnianą Y a zmiennymi objaśniającymi X1 i X2:
det(W1 )
0,1125
R1  1 
 1
 0,81643
det( R1 )
0,3374
Dla pozostałych kombinacji otrzymujemy:
R2=0,88083
R3=0,85261
R4=0,91939
R5=0,81858
R6=0,87965
Maksymalna wartość wskaźnika dla R4 oznacza, że należy
zbudować model liniowy ze zmiennymi X2 i X3
EFEKT KATALIZY W MODELU
EKONOMETRYCZNYM



Oznacza on silne skorelowanie zmiennej objaśnianej ze
zmiennymi objaśniającymi.
Eliminuje się zmienne objaśniające powodujące efekt
katalizy.
Regularna para korelacyjna (R, R0) - jeżeli współczynniki
korelacji w wektorze R0 są dodatnie oraz uporządkowane
niemalejąco.
28
MACIERZ NEUTRALNA
 1
q
Q   21
 .

qm1
q12
1
.
qm 2
... q1m 
... q2 m 
.
. 

... 1 
ri
qij  q ji 
rj
29
ZMIENNA KATALITYCZNA Xi
(KATALIZATOR)
rij  0
ri
rij 
rj
Wskaźnik integralnej pojemności informacyjnej l-tej
kombinacji zmiennej.
U l  Rl2  H l
30
Przykład




Y – wartość sprzedaży usług hoteli
X1 – zatrudnienie
X2 – średnia cena miejsca w hotelu
X3 - liczba miejsc w hotelu
0,43
R0  0,50
0,79
0,25 0,74
 1
R  0,25 1
0,40
0,74 0,40
1 
31
r1 0,43
q12  q21  
 0,86
r2 0,50
r1 0,43
q13  q31  
 0,54
r3 0,79
r2 0,50
q23  q32  
 0,63
r3 0,79
0,86 0,54
 1


Q  0,86 1
0,63
0,54 0,63 1 
32
Dla kombinacji:
C1  ( X 1 , X 3 )
0,43
R01  

0
,
79


0,74
 1
R1  

0
,
74
1


r13  0,74
q13  0,54
ponieważ r13  q13 w modelu z X1 i X 3 występujeefekt katalizy
i zmienna X1 jest zmienną katalityczną.
33
R1  0,856
H1  0,465
U1  R12  H1  (0,856) 2  0,465  0,268
Jest to wartość znacznie różniąca się od zera, co potwierdza
istnienie efektu katalizy
34
Dla kombinacji:
C2  ( X 2 , X 3 )
0,50
R02  

0
,
79


0,40
 1
R2  

0
,
40
1


r23  0,40
q23  0,63
ponieważ r23  q23 nie ma podstaw do przypuszczenia, że w
modelu z X 2 i X 3 występuje efekt katalizy
R 2  0,815
H 2  0,624
U 2  R22  H 2  (0,815) 2  0,624  0,040
35
Zadania
do samodzielnego
rozwiązania
Zad. 1.
Do budowy liniowego modelu ekonometrycznego
zaproponowano 4 zmienne: X1, X2, X3, X4.Wektor
współczynników korelacji między zmienną Y (wartość
sprzedaży) i zmiennymi X1, X2, X3, X4 oraz macierz
współczynników korelacji między zmiennymi X1, X2,
X3, X4 przedstawiają się następująco:
0,7 
 0,9

R0  
0,1 


0,5 
0,8  0,2 0,4 
 1
 0,8

1
0
,
1
0
,
6

R
 0,2 0,1
1
 0,3


1 
 0,4 0,6  0,3
Zaproponuj zestaw zmiennych, najpełniej opisujący
wartość sprzedaży.
Zad.2.
Dobierz zestaw dwóch zmiennych, spośród
proponowanych poniżej 4, mając dany wektor
współczynników
korelacji
między
Y
a
zmiennymi Xi oraz macierz współczynników
korelacji między zmiennymi Xi.
0,8
 0,72 0,47 
0,84 
 1
 0,82
 0,8

1
0
,
99

0
,
65



R0 
R
 0,83
 0,72 0,99
1
 0,66




1 
0,80 
 0,47  0,65  0,66
Zad. 3.
Do budowy liniowego modelu ekonometrycznego (Y)
zaproponowano 4 zmienne: X1, X2, X3, X4. Wektor
współczynników korelacji między zmienną Y i zmiennymi
X1, X2, X3, X4 oraz macierz współczynników korelacji
między zmiennymi X1, X2, X3, X4 przedstawiono poniżej.
Która kombinacja zmiennych, zawierających X3 i X4,
powinna być użyta do budowy modelu?
0,7 
0,9 

R0  
 0,1


0,5 
0,8  0,2  0,4
 1
 0,8

1
0,1
0,6

R
 0,2 0,1
1
0,3 


1 
 0,4 0,6 0,3
DO ZOBACZENIA
40