SimultanniRovnice
Download
Report
Transcript SimultanniRovnice
Simultánní
rovnice
Tomáš Cahlík
Obsah
Úvod
Metoda nejmenších čtverců (OLS)
Nestrannost OLS odhadové funkce
Irelevantní a chybějící proměnné
Rozptyl OLS estimátorů
Gauss-Markovova (G-M) věta a
vydatnost OLS estimátorů
Shrnutí
Doporučené samostudium
Úvod
3.6
Terminologie:
y:
závislá proměnná, vysvětlovaná proměnná
xi: nezávislé proměnné, vysvětlující proměnné,
regresory
u: náhodná složka, disturbance
Beta0: intercept, úrovňová konstanta
Maticový zápis
Úvod
Příklad 1: 3.1
wage
je mzda, educ je vzdělání (education), exper jsou
zkušenosti (experience) (měřené délkou všech
zaměstnání) u zahrnuje všechny další nepozorované
faktory
Příklad 2: 3.7
salary
je plat, sales jsou tržby, ceoten je délka
zaměstnání (tenure), u zahrnuje všechny další
nepozorované faktory
Úvod
Příklad 3: Problém C37
bwght
je váha při narození (birth weight), cigs je počet
vykouřenýxh cigaret, npvis je počet návštěv matky u
lékaře (prenatal visits), u zahrnuje všechny další
nepozorované faktory
Úvod
Vícenásobná regresní analýza oproti jednoduché
regresní analýze umožňuje:
Lepší
analýzu ceteris paribus, protože explicitně
umožňuje kontrolovat ostatní faktory, které simultánně
ovlivňují vysvětlovanou proměnnou
Vytvořil lepší model pro predikci vysvětlované
proměnné
Zahrnout obecnější funkční formy
Metoda nejmenších čtverců
(OLS)
Princip zůstává stejný jako u
jednoduché regrese
Z maticového zápisu je jednoduché
získat maticový zápis odhadové funkce
koeficientů:
Metoda nejmenších čtverců
(OLS)
Příklad 1
. regress wage educ
Source
SS
df
MS
Model
Residual
1179.73204 1 1179.73204
5980.68225 524 11.4135158
Total
7160.41429 525 13.6388844
wage
Coef. Std. Err.
educ
_cons
.5413593 .053248
-.9048516 .6849678
t
Number of obs =
F( 1, 524) =
Prob > F
=
R-squared =
Adj R-squared =
Root MSE
=
P>|t|
10.17 0.000
-1.32 0.187
526
103.36
0.0000
0.1648
0.1632
3.3784
[95% Conf. Interval]
.4367534
-2.250472
.6459651
.4407687
Metoda nejmenších čtverců
(OLS)
Příklad 1
. regress wage educ exper
Source
SS
df
MS
Model
Residual
1612.2545
2 806.127251
5548.15979 523 10.6083361
Total
7160.41429 525 13.6388844
wage
educ
exper
_cons
Coef. Std. Err.
.6442721 .0538061
.0700954 .0109776
-3.390539 .7665661
t
Number of obs
F( 2, 523)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
526
75.99
0.0000
0.2252
0.2222
3.257
P>|t|
[95% Conf. Interval]
11.97 0.000
6.39 0.000
-4.42 0.000
.5385695 .7499747
.0485297 .0916611
-4.896466 -1.884613
Metoda nejmenších čtverců
(OLS)
Příklad 2
. regress salary ceoten
Source
SS
df
MS
Model
Residual
1241694.06 1 1241694.06
59524270.7 175 340138.69
Total
60765964.7 176 345261.163
salary
Coef. Std. Err.
ceoten
_cons
11.74613 6.14774
772.4263 65.67567
t
Number of obs =
F( 1, 175) =
Prob > F
=
R-squared =
Adj R-squared =
Root MSE
=
P>|t|
1.91 0.058
11.76 0.000
177
3.65
0.0577
0.0204
0.0148
583.21
[95% Conf. Interval]
-.387127
642.8079
23.87939
902.0446
Metoda nejmenších čtverců
(OLS)
Příklad 2
. regress salary ceoten sales
Source
SS
df
MS
Model
Residual
10522179.1
2 5261089.56
50243785.6 174 288757.389
Total
60765964.7 176 345261.163
salary
ceoten
sales
_cons
Coef. Std. Err.
13.92561 5.677433
.0378012 .0066679
621.6709 66.09745
t
Number of obs
F( 2, 174)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
2.45 0.015
5.67 0.000
9.41 0.000
=
=
=
=
=
=
177
18.22
0.0000
0.1732
0.1637
537.36
[95% Conf. Interval]
2.720113
.0246409
491.215
25.13111
.0509615
752.1269
Metoda nejmenších čtverců
(OLS)
Příklad 2
. regress logsalary logsales ceoten ceotensqr
Source
SS
df
MS
Model
Residual
20.951824
3 6.98394134
43.694389 173 .252568723
Total
64.6462131 176 .367308029
logsalary
logsales
ceoten
ceotensqr
_cons
Coef. Std. Err.
.2278004
.0450131
-.0012162
4.71635
.0264767
.0142767
.0004801
.2083994
t
8.60
3.15
-2.53
22.63
Number of obs
F( 3, 173)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
177
27.65
0.0000
0.3241
0.3124
.50256
P>|t|
[95% Conf. Interval]
0.000
0.002
0.012
0.000
.1755415 .2800593
.0168342 .0731919
-.0021639 -.0002686
4.305018 5.127683
Metoda nejmenších čtverců
(OLS)
Příklad 3
. regress bwght cigsreal npvisreal
Source
SS
df
MS
Model
Residual
7749051.42
2 3874525.71
537418717 1653 325117.191
Total
545167768 1655 329406.506
bwght
cigsreal
npvisreal
_cons
Coef. Std. Err.
-10.71611 3.320213
13.23817 3.744587
3267.984 45.92275
t
Number of obs
F( 2, 1653)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
1656
11.92
0.0000
0.0142
0.0130
570.19
P>|t|
[95% Conf. Interval]
-3.23 0.001
3.54 0.000
71.16 0.000
-17.22838 -4.203842
5.893539
20.5828
3177.911 3358.057
Nestrannost OLS odhadové
funkce
Všechny příklady v této prezentaci jsou na průřezová
data.
U průřezových dat obvykle předpokládáme:
1. (Populační) model je lineární v parametrech
2. Výběrový soubor o velikosti n je získán z populace
náhodným výběrem
3. Neexistuje perfektní kolinearita mezi regresory
(U jednoduché regrese jsme měli formulaci:
Výběrový rozptyl regresoru je větší než nula)
4. Podmíněná střední hodnota náhodné složky je nula
5. Podmíněný rozptyl náhodné složky je konstantní a
konečný (tzv. homoskedasticita)
Nestrannost OLS odhadové
funkce
Pokud jsou splněny předpoklady 1 až 4, je vlastností OLS
estimátoru nestrannost.
Předpoklad 3 zakazuje pouze perfektní korelaci, ale
umožňuje korelaci mezi regresory. Ta je naprosto běžná.
Předpoklad 5 není pro nestrannost nutný
Irelevantní a chybějící proměnné
Pokud zahrneme do modelu irelevantní proměnnou
(přespecifikujeme model), nemá žádný efekt na
nestrannost (očekávaná hodnota příslušného
koeficientu je nula)
Ale pozor, může mít efekt na rozptyl
estimátorů)
Pokud nezahrneme do modelu relevantní
proměnnou (model podspecifikujeme), estimátory
mohou být vychýlené
Oboje jsou příklady chybné specifikace modelu
Irelevantní a chybějící proměnné
Příklad misspecifikační analýzy: rovnice 3.40
Odchylka závisí na znaménku koeficientu beta2 a znaménku
u korelace mezi regresory. Při stejných znaménkách je
odchylka pozitivní, při rozdílných negativní. Pokud je
koeficient či korelace nulová, odhad beta1 zůstává
nestranný
Př. 3.42
př. Str. 99
Když vynecháme abil, jsou vychýlené estimátory jak beta1
tak beta2, i když předpokládáme, že exper není korelováno s
abil
Rozptyl OLS odhadové funkce
Pokud jsou splněny předpoklady 1 až 5, jsou výběrové
rozptyly estimátorů dány vztahem
3.51
Rozptyl každého parametru se zvyšuje s rozptylem náhodných
složek a se zvyšující lineární závislosti mezi příslušnou
proměnnou a ostatními regresory
Rozptyl každého parametru se snižuje s výběrovým rozptylem
příslušné proměnné
Multikolinearita: vysoká korelace mezi dvěma či více
vysvětlujícími proměnnými (je vlastností konkrétního
výběru)
Rozptyl OLS odhadové funkce
Jednoduchá regrese je pouze speciální případ vícenásobné
regrese
vzorec
Na čem závisí rozptyly estimátorů, je možné rozšifrovat i z
maticového zápisu
Co když model podspecifikujeme?
Rozptyl OLS odhadové funkce
Pokud jsou splněny předpoklady 1 až 5, je nestranný
estimátor rozptylu náhodné složky dán vztahem
3.56
Standardní chyba regrese SER (standard error of the
regression)
Standardní chyba odhadu
G-M věta a vydatnost OLS
odhadové funkce
Pokud jsou splněny předpoklady 1 až 5, jsou OLS
estimátory betajse stříškou nejlepšími lineárními
nestrannými odhady parametrů beta – BLUE (best linear
unbiased estimator)
Lineární znamená, že může být vyjádřen jako 3.59, což 3.22
splňuje
Nejlepší znamená, že má mezi všemi lineárními
nestrannými estimátory nejmenší rozptyl
Shrnutí
Úvod - příklady
Metoda nejmenších čtverců (OLS)
Nestrannost OLS odhadové funkce
Irelevantní a chybějící proměnné
Rozptyl OLS estimátorů
Gauss-Markovova (G-M) věta a
vydatnost OLS estimátorů
Doporučené samostudium
Ve skriptech „Základy ekonometrie v
příkladech“ si prostudujte kap. 4.4 až
4.7
Na počítači se udělejte všechny
regrese z této prezentace. Pak si
přidávejte i jiné vysvětlující proměnné a
dívejte se, co dělají standardní chyby a
koeficienty determinace. (wage2,
ceosal2, bwght2)