04.cviceni-metodolog_postup_AKT

Download Report

Transcript 04.cviceni-metodolog_postup_AKT

ZÁKLADY EKONOMETRIE
4. cvičení
METODOLOGICKÝ POSTUP ŘEŠENÍ
EKONOMETRICKÉHO PROBLÉMU
1
1.
2.
3.
Náhodná složka
G-M předpoklady
Vlastnoti bodové odhadové
funkce
2
Náhodná složka
Gauss-Markovy předpoklady:
E(u) = 0
Náhodné vlivy se vzájemně vynulují
E(u uT) = σ2 In
Konečný a konstantní rozptyl = homoskedasticita
→ Porušení: Heteroskedasticita
Náhodné složky jsou sériově nezávislé
→ Porušení: Autokorelace
X je nestochastická matice – E(XTu) = 0
Veškerá náhodnost je obsažena v náhodné složce
X má plnou hodnost k
matice X neobsahuje žádné perfektně lineárně závislé
sloupce pozorování vysvětlujících proměnných
→ Porušení: Multikolinearita
3
Vlastnosti bodové odhadové funkce
- Malý výběr
Počet pozorování n < 30
Nevychýlený = nestranný odhad:
E (b) = β
b – získáme z více výběrových vzorků
pokud E(b) > β – odhady jsou nadhodnoceny,
E(b) < β – odhady jsou podhodnoceny
Vydatný odhad: standardní chyba regresního koeficientu sb
musí být minimální ze všech jiných postupů
- to způsobuje, že intervalové odhady jsou nejmenší. Jako nevychýlený
odhad může sloužit více statistik, z nichž nejvhodnější je ta, která má
minimální rozptyl.
4
Nestrannost odhadu
f(b )
N e s tra n n o s t
ß
b
5
Vydatnost odhadu
f(b )
V y d a tn o s t
ß
b
6
Vlastnosti bodové odhadové funkce
- Velký výběr
počet pozorování n ≥ 30
Konzistentní – bodový odhad b je konzistentním odhadem,
jestliže jeho hodnota s rostoucím počtem pozorování n konverguje
ke skutečnému=populačnímu parametru
p lim b  
n
Asymptoticky nestranný – je to slabší vlastnost,
(pokud je odhad konzistentní, tak je i asymptoticky nestranný)
p lim E ( b )  
n
Asymptotická vydatnost – rozptyl konverguje k nule
rychleji než s použitím jiné odhadové funkce
7
Asymptotická nestrannost
A sym p to tická n e stra n n o st
f(b )
n=500
n=200
ß
E (b )
8
Asymptotická vydatnost
A s y m p to tic k á v y d a tn o s t
f(b )
n=500
n=200
ß
b
9
Konzistence
Konzistence
n=1000
n=500
f(b)
n=200
β
b
10
Příklad
Vraťme se k příkladu z minulého cvičení,
podívejme se, zda je odhad nestranný?
Víme, že v celé populaci platí závislost:
Y  5  10 X  u
Proveďte simulaci – 500krát odhadněte model.
Jaká byla nejvyšší hodnota odhadu parametru
β?
A jaká byla nejnižší hodnota?
Soubor: 1.cviceni_LRM_s_resenim.xlsx
11
Možná otázka do závěrečného testu
Odvození bodové odhadové funkce a její
vlastnosti (rozdělit pro malé a velké výběry).
Princip metody MNČ.
Gaussovy-Markovovy předpoklady
12
Metodologický postup
1.
2.
3.
4.
Specifikace modelu
Odhad parametrů (tj. kvantifikace)
Verifikace
Aplikace
13
1. Specifikace modelu
Orientace v dané ekonomické problematice
Určení proměnných
Určení vzájemných vazeb mezi proměnnými
Formulace hypotéz – v podobě algebraických
vztahů (tj. jedné či více rovnic)
Specifikace náhodných vlivů
14
Specifikace modelu
1.
Ekonomický model


2.
Stanovení základní hypotézy (tj. které proměnné
použijeme, jak budou působit, jejich intenzita, apod.)
Slovní vyjádření
Ekonomicko-matematický model

převedení slovního vyjádření do podoby
jedné rovnice (jednorovnicový model)
soustavy rovnic (vícerovnicový model)
3.
Ekonometrický model

zahrnutí faktoru nejistoty v podobě náhodné složky
15
Náhodná složka u
modely obvykle pracují s 3 či 4 vysvětlujícími
proměnnými – působení ostatních
nepodstatných vlivů je zahrnuto v náhodné
složce
o náhodné složce se předpokládá, že má
normální rozdělení se střední hodnotou 0 a
rozptylem σ2
u ~ N(0; σ2)
16
Matematická vs. ekonometrická fce
Matematická funkce:
1 vysvětlující proměnná:
y = f (x)
více vysvětlujících proměnných:
y = f (x1, x2, …)
Ekonometrická funkce:
1 vysvětlující proměnná:
y = f (x) + u
více vysvětlujících proměnných:
y = f (x1, x2, …) + u
17
Druhy proměnných v modelu
Endogenní
• tj. vysvětlované, závisle proměnné
• hodnoty jsou generovány systémem či modelem
Exogenní
• tj. vysvětlující, nezávisle proměnné
• působí na zkoumaný systém, samy systémem nejsou
ovlivňovány
• jejich hodnoty jsou determinovány mimo systém
Predeterminované
• Exogenní + endogenní-zpožděné
18
Metodologický postup
1.
2.
3.
4.
Specifikace modelu
Odhad parametrů (tj. kvantifikace)
Verifikace
Využití
19
2. Odhad parametrů
Využití disponibilní (tj. výběrové) informace z
dat
Použití vhodné odhadové techniky
20
Metodologický postup
1.
2.
3.
4.
Specifikace modelu
Odhad parametrů (tj. kvantifikace)
Verifikace
Využití
21
3. Verifikace
Aneb jak se odhadnutý model shoduje s teorií a
napozorovanými daty
Ekonomická (jestli proměnné modelu mají správný
směr a intenzitu)
Statistická (ověření přesnosti a významnosti
výsledků)
Ekonometrická (zda byly dodrženy podmínky pro
použití dané odhadové techniky a statistických testů)
22
Metodologický postup
1.
2.
3.
4.
Specifikace modelu
Odhad parametrů (tj. kvantifikace)
Verifikace
Využití
23
4. Využití
Kvalitativní a kvantitativní analýza minulého
vývoje
Předpovědi (predikce, prognózy)
Volba hospodářské politiky
analýza různých scénářů
simulační experimenty
24
Příklad 1 – eko1.xls
Odhadněte závislost maloobchodního obratu na
disponibilním příjmu a cenovém indexu.
Y – maloobchodní obrat potřeb pro domácnost
v mld. CZK
X1 – disponibilní příjem v mld. CZK
X2 – cenový index
Proveďte predikci bodovou a intervalovou. Ověřte,
zda je model vhodný k predikci.
25
Příklad 2 – data.in7
Odhadněte závislost spotřeby (CONS) na
disponibilním důchodu (INC).
Proveďte
Specifikaci
Kvantifikaci
Verifikaci
Aplikaci
Použijte datový soubor data.in7
26
A. Specifikace
CONS – endogenní proměnná (vysvětlovaná)
INC – exogenní proměnná (vysvětlující)
Forma závislosti:
CONSt = β0 + β1INCt +ut
Ekonomický předpoklad:
S růstem důchodu, roste spotřeba – kladné znaménko
u koeficientu β1,
β1 náleží do intervalu (0,1) – v dlouhodobém horizontu
platí: nemůžu spotřebovat více, než vydělám
27
B. Kvantifikace
Pomocí výběru n = 159, budeme odhadovat
model
CONSt = b0 + b1INCt + et
CONSt^ = b0 + b1INCt
Použijeme PcGive a MNČ
1
b  (X X) X y
T
T
28
B. Kvantifikace
29
B. Kvantifikace
Odhadnutý regresní model:
CONSt = -181,27 + 1,186 INCt +et
CONSt^ = -181,27 + 1,186 INCt
Intervalový odhad parametrů
P  bi  s bi t1   / 2 ( n  k  1)   i  i bi  s bi t1   / 2 ( n  k  1)  ,
t1  / 2 ( n  k  1)  t 0 ,975 (157 )  2, 042,
b1  s b1t1  / 2 ( n  k  1)  1,186  0, 034 * 2, 042
 1  1,1 1 7;1, 2 5 5
30
C. Verifikace ekonomická
b1 náleží do intervalu (0,1) ? – nesplňuje!
Absolutní pružnost
ˆ
b1  dY / dX
Zvýší-li se důchod (INC) o jednu jednotku, tzn. o jednu
miliardu, zvýší se spotřeba (CONS) v průměru o 1,186
miliard, ceteris paribus
Relativní pružnost q x  dY X  b1 X
dX Y
Y
Bere se vždy vzhledem k nějakému datu, v %!
Např. pro období 1954-2, Y = 884,528, X = 894,831,
qx= 1,1865*884,528/894,831 = 1,173
Zvýší-li se v druhém čtvrtletí roku 1954 disponibilní důchod o
jedno %, poté se spotřeba zvýší v průměru o 1,173%.
31
C. Verifikace statistická
Standard Error
Standardní chyba regresních koeficientů podle
následujícího vztahu
Slouží k určení významnosti parametrů, k intervalovým
odhadům
S (b )  s ( X X )
2
T
1
s je odhad σ – u nás ve výstupu je to sigma
T
s
e e
nk
32
Verifikace statistická – významnost proměnných
T-statistika, t-value, t-prob
t statistika slouží k určení významnosti jednotlivých
parametrů v modelu.
H0: βj = 0 ... Nevýznamná proměnná
bj   j
tj 
H1: βj ≠ 0 ... Významná proměnná
s bj
Obecně pro t-statistiku platí
tj 
bj
s bj

coefficent
st .error
t j  t *1   / 2
popř. p-hodnota ≤ α → zamítám hypotézu
H0 o nevýznamnosti proměnné v modelu, proměnná je
tedy významná
t j  t *1   / 2 popř. p-hodnota > α → nepodařilo si mi
zamítnout hypotézu H0 o nevýznamnsoti proměnné v
modelu, proměnná je nevýznamná
Na hladině významnosti 5 % zamítáme nulovou hypotézu
o nevýznamnosti proměnné INC. Proměnná disponibilní
důchod je v modelu významná.
33
C. Verifikace statistická
Pro úrovňovou konstantu neprovádíme
statistické vyhodnocení, ale vždy ji ponecháme
v modelu.
Part. R2 – parciální (dílčí) korelační koeficient
Určuje, jak daná proměnná vysvětluje závislou
proměnnou bez ohledu na ostatní exogenní proměnné
34
C. Verifikace statistická
Koeficient vícenásobné determinace R2
Hodnotí celkovou kvalitu modelu, určuje, jak se model
shoduje s daty
Rozptyl Y = Vysvětlený rozptyl + nevysvětlený rozptyl
Rozptyl empirických hodnot
2
n – 1 stupně volnosti
v obrázku a + b
CSC 
 (y
VSC 
 ( yˆ
NSC 

Rozptyl vyrovnaných hodnot ..
k – 1 stupně volnosti
v obrázku a
Reziduální rozptyl (RSS=NSČ) ..
n – k stupně volnosti
v obrázku b
Y
 y)
i
i
 y)
2
2
( y i  yˆ i )
Y
b
Yˆ
a
Y
X
35
C. Verifikace statistická
Vícenásobný koeficient determinace
2
R  0,1 , pokud 1 – dokonalý model
R 
2
V SC
 1
C SC
N SC
C SC
Korigovaný koeficient vícenásobné determinace
Používá se pro srovnávání více modelů s jiným počtem
vysvětlujících proměnných
R  1  1  R
2
2
n 1
 n  ( k  1)
36
C. Verifikace statistická – významnost modelu
F-poměr
testuje statistickou významnost modelu (využívá se Fischerovo
rozdělení)
Používá se pokud máme v modelu dvě a více exogenní proměnné.
H0: R2 statisticky nevýznamné, β0 = β1 =... βj = 0
H1: R2 statisticky významné, βj ≠ 0
F 
R
n  ( k  1)
2
1 R
2
.
k
… odmítáme H0 ve prospěch H1.
[0.000] - počítá nám p-value
F > F(k – 1, n – k – 1)*
[číslo] ≤ α → zamítám hypotézu H0, model je tedy významný
[číslo] > α → nepodařilo se mi zamítnout hypotézu H0, model je
tedy nevýznamný
Protože máme v modelu pouze jednu exogenní
proměnnou nemusíme vyhodnocovat statistickou
významnost modelu
37
C. Verifikace statistická – zbylý výstup
Sigma – Odhad směrodatné chyba (odchylka)
náhodné složky u
RSS - residua sum of squares, aneb naše NSČ – je
to vlastně hodnota naší účelovou funkci, kterou
minimalizujeme.
Log-likelihood – věrohodnostní poměr –
alternativa metody minimálních čtverců, je metoda
maximální věrohodnosti
38
C. Verifikace ekonometrická
Ověřuje splnění podmínek pro použití MNČ
Testuje se heteroskedasticita, autokorelace,
mulikolinearita
DW – Durbin-Watson – testuje autokorelaci
prvního řádu, budeme řešit později !!!
39
D. Aplikace
Predikce apod. , ukládání vyrovnaných
hodnot, reziduí...
Predikce – dosazení konkrétních hodnot do
regresní funkce
C Oˆ N S 1953 1   181, 27  1,186 * 908, 212  895, 534
40
Závěry plynoucí z analýzy
Koeficient u proměnné INC nesplňuje
ekonomický předpoklad, protože je větší než 1.
Z pohledu statistické verifikace je model v
pořádku.
K tomu, abychom statistickou verifikaci mohli
považovat za „právoplatnou“, potřebujeme ověřit,
zda byly splněny podmínky pro použití MNČ
Toto řešení tedy není úplné, je potřeba doplnit
ekonometrickou verifikaci a model se nezdá příliš
vhodný z důvodu nesplnění ekonomických
předpokladů.
41
Predikce
1.
2.
Predikce bodová a intervalová
Ex ante a ex post
42
Predikce
Cílem predikce (předpovědi) je kvantitativní
odhad endogenní proměnné mimo interval
pozorování s využitím minulé i současné
informace
Ex-ante - podmíněná
Ex-post - pseudopředpověď
43
Predikce Ex-Ante
Podmíněná volbou vysvětlující proměnné
vysvětlující proměnnou máme buď zadanou, nebo zadanou ve
formě procentuálního nárůstu
Predikce může být bodová
nebo intervalová
Yˆ
Yˆ  
44
Predikce Ex-post
Vyřadím určitý počet pozorování z modelu, poté
odhadnu model, předpovím pozorování a
zkontroluji s jejich skutečnou hodnotou.
Chyba odhadu
H0: Chyba není statisticky významná(model je vhodný
k predikci)
H1: Chyba je statisticky významná
Testujeme pomocí t-statistiky
45