Prognozowanie z wykorzystaniem modeli ekonometrycznych

Download Report

Transcript Prognozowanie z wykorzystaniem modeli ekonometrycznych

Prognozowanie z
wykorzystaniem modeli
ekonometrycznych
Plan wykładu
I.
II.
Modelowanie ekonometryczne
1. Konstrukcja modelu
2. Weryfikacja modelu
Prognozowanie ekonometryczne
1. Założenia prognozy
2. Prognoza punktowa
3. Ocena dopuszczalności prognozy
4. Prognoza przedziałowa
Definicja modelu ekonometrycznego
Konstrukcja formalna, przedstawiająca za pomocą
jednego równania lub układu równań zależność
wyróżnionego zjawiska ekonomicznego od innych
zjawisk je objaśniających.
Istotą modelowania ekonometrycznego jest konstrukcja
modelu mającego na celu wyjaśnienie mechanizmu
zmian zachodzących w prognozowanym zjawisku.
Model ekonometryczny
Y = f (X, ξ)
Y – wektor zmiennych objaśnianych
X – macierz zmiennych objaśniających
Liczba zmiennych objaśnianych jest
równa liczbie równań modelu
Zmienne w modelu ekonometrycznym
zmienne
endogeniczne
(objaśniane)
nieopóźnione
zmienne łącznie
współzależne
opóźnione
egzogeniczne
(objaśniające)
nieopóźnione
opóźnione
zmienne z góry ustalone
Model liniowy jednorównaniowy
y  α0  α1x1  α 2 x 2    α m x m  ξ
Etapy budowy modelu
ekonometrycznego




Wybór zmiennych objaśniających modelu
Określenie postaci analitycznej
Estymacja parametrów
Weryfikacja modelu
Dobór zmiennych do modelu
1.
2.
Merytoryczna analiza zjawiska
Formalne metody statystyczne
Dobór zmiennych do modelu
Analiza macierzy współczynników korelacji
n
ry,x 
 y
t 1
n
 y
t 1
t
 y x t  x 
 y
2
t
n
 x
t 1
 x
2
t
Analiza macierzy współczynników
korelacji
R0
R
y
x1
x2
xm
 ry,x1 
r 
 y,x 2 
  


ry,x m 
t α2
r*  2
tα  n  2
x1
x1
x2
xm
x2
 1
r
 x1 , x 2
 

rx1 , x m
tα -
rx1 , x 2
1

rx 2 , x m
xm
 rx1 , x m 
 rx 2 , x m 

 


1 
rozkład t-Studenta,
n-2 stopnie swobody,
poziom istotności α
Analiza macierzy współczynników
korelacji
1. Usunięcie zmiennych Xi, dla których zachodzi: |ry,xi| ≤ r*.
2. Wybór zmiennej Xj najsilniej skorelowanej z Y.
3. Usunięcie zmiennych Xi, dla których zachodzi: |rxj,xi| ≥ r*.
4. Powtarzanie kroków 2 i 3 aż do wyczerpania zbioru zmiennych.
Wybór postaci analitycznej modelu


Merytoryczna analiza zjawiska
Ocena wykresów korelacyjnych
Zależność liniowa
Zależność nieliniowa
y
y
x
x
Szacowanie parametrów
1
a  ( X X) X y
T
é1 x1,1 L
éa 0 ù
ê
ê ú
ê1 x
êa ú
1 ú
1,2 L
ê
ê
a= ê ú
X= ê
ê Mú
êM M O
êa ú
ê1 x
êë m úû(m+ 1)´ 1
êë
1,n L
T
x m,1 ù
 y1 
ú
y 
x m,2 úú
2

y

M úú

 
x m,n úú
ûn´ (m+ 1)
 y n  n1
Weryfikacja modelu


Dopasowanie modelu do danych empirycznych
Oceny parametrów modelu:




statystyczna istotność,
stabilność w czasie (test Chowa),
koincydencja oraz zgodność z teorią.
Rozkład reszt modelu




losowość,
normalność,
autokorelacja,
heteroskedatyczność (test Harrisona – McCabe’a).
Dopasowanie modelu do danych
empirycznych
n
Współczynnik
determinacji
R2 
2
ˆ
(
y

y
)
 i
i 1
n
2
(y

y
)
 i
i 1
Skorygowany
współczynnik
determinacji
~2
R  1
n 1
(1  R 2 )
n  m 1
Dopasowanie modelu do danych
empirycznych
Współczynnik zmienności
losowej
se
W  100%
y
se2 – wariancja błędu modelu:
n
s e2 
e
t 1
t
n  m 1
e t  y t  yˆ t
T
e
e
2
se 
n  m 1
e  y  Xa
Ocena istotności parametrów
y  α0  α1x1    0  x i    α m x m  ξ
H0: αi = 0
H1: αi ≠ 0
| ti | ≤ t*  H0
| ti | > t*  H1
ai
ti 
D(a i )
t* –
rozkład t-Studenta,
n – m – 1 stopni swobody,
poziom istotności α
ai
ti 
D(a i )
D2 (a)  s e2 ( XT X) 1
 D 2 (a 0 )
cov(a 0 , a1 )

2
cov(a
,
a
)
D
(a 1 )
0
1




2
D (a)  
 cov(a 0 , a i ) cov(a 1 , a i )




cov(a 0 , a m ) cov(a i , a m )
D 2 (a i )
 D(a i )
 cov(a 0 , a i )
 cov(a 1 , a i )



D 2 (a i )


 cov(a i , a m )
 cov(a 0 , a m )

 cov(a i , a m ) 




 cov(a i , a m ) 




2

D (a m ) 
Koincydencja
sgn(ai) = sgn(ry,xi)
Rozkład reszt: losowość
Test serii:
H0: reszty są losowe
H1: reszty nie są losowe
1. Obliczamy reszty et.
2. Reszty równe 0 są pomijane, resztom dodatnim nadaje się symbol A,
resztom ujemnym symbol B.
3. Wyznaczamy:
AAA
BBB AAA B A BB A
AAABBBAAABABBA
- k – liczbę serii,
k=7
- n1 – liczbę symboli A ,
n1 = 8
- n2 – liczbę symboli B .
n =6
2
4. Z tablic liczby serii odczytuje się dwie wartości krytyczne:
kD (α/2, n1, n2 ) i kG (1 – α/2, n1, n2 ) .
kD < k < k G  H0
k ≥ kG v k ≤ kD  H1 (np. zła postać analityczna, autokorelacja)
Rozkład reszt: normalność
Test Shapiro – Wilka
H0: F(ξ) ~ FN
H1: F(ξ) ≠ FN
1. Reszty porządkujemy niemalejąco w ciąg: e(1), e(2), … e(n).
2. Obliczamy statystykę empiryczną:
  n2 

 

  a n  t 1 (e (n  t 1)  e (t) ) 
 t 1


W
n
 (e
t 1
t
 e) 2
W ≥ W *  H0
W < W *  H1
2
ai są stablicowane
W* – z tablic Shapiro – Wilka dla
przyjętego poziomu istotności
Rozkład reszt: autokorelacja
Test Durbina – Watsona:
H0: ρ1 = 0
H1: ρ1 ≠ 0
Z tablic testu Durbina – Watsona dla
przyjętego poziomu istotności α, liczby
obserwacji n oraz liczby zmiennych m
odczytujemy dwie wartości: dl i du.
Autokorelacja dodatnia
n
d
2


e

e
 t t 1
t 2
n
2
e
 t
t 1
Autokorelacja ujemna
d’ = 4 – d
d > du  H0
d < dl  H1
dl ≤ d ≤ du  brak możliwości podjęcia decyzji
Założenia prognozy ekonometrycznej





Znany jest „dobry model” w sensie wcześniej podanych kryteriów
(dopasowania, istotności parametrów, rozkładu reszt).
Występuje stabilność relacji strukturalnych w czasie. Oznacza to,
że postać modelu i wzajemne oddziaływanie zmiennych są stałe,
aż do momentu lub okresu prognozowanego włącznie (związki
między badanymi zmiennymi występujące w przeszłości będą
takie same w przyszłości).
Składnik losowy ma stały rozkład w czasie (nie pojawią się nowe
ważne zmienne oddziałujące na prognozowane zjawisko,
dotychczasowe zaś nie zmienią swego oddziaływania).
Znane są wartości (lub prognozy) zmiennych objaśniających w
momencie prognozowanym.
Można ekstrapolować model poza próbę.
Źródła wartości dla zmiennych objaśniających
a)
b)
c)
d)
e)
f)
decyzyjnych - decyzje sejmu, rządu, innych organów administracji,
regulatorów poszczególnych rynków, także decyzje kierownictwa
przedsiębiorstwa,
niedecyzyjnych makroekonomicznych – istniejące prognozy lub
założenia, które określają ich przyszłe wielkości (np. wskaźnik
inflacji, stopa bezrobocia, wskaźnik koniunktury),
niedecyzyjnych mikroeokonomicznych – prognoz budowane przez
przedsiębiorstwo,
opóźnionych w czasie – rzeczywiste wartości o ile opóźnienie nie
jest mniejsze od horyzontu prognozy,
zmiennych zero-jedynkowych – wartości 0 lub 1,
czasowej - numer okresu, na który wyznaczana jest prognoza
Prognoza punktowa
y  a0  a x
*
T
*
1 1,T
  a mx
y x a
*
T
*
T

x  1 x
*
T
*
1, T
x
*
2, T
 x
*
m, T

*
m, T
Ocena dopuszczalności
m
m 1 m
v T2  s e2   x *i,2T D 2 (a i )  2  x *i,T x *j,T cov(a i , a j )
i 0
i 0 ji 1
v T2  s e2  x*T D2 (a) x*T
T
vT
ηT  * 100%
yT
ηT ≤ η*  prognoza dopuszczalna
ηT > η*  prognoza niedopuszczalna
Prognoza przedziałowa
P{ y*T – uvT ≤ yT ≤ y*T + uvT} = p
u – rozkład t-Studenta n – m – 1 stopni swobody,
poziom istotności α = 1 – p