SimultanniRovnice

Download Report

Transcript SimultanniRovnice

Simultánní
rovnice
Tomáš Cahlík
Obsah
Úvod
 Metoda nejmenších čtverců (OLS)
 Nestrannost OLS odhadové funkce
 Irelevantní a chybějící proměnné
 Rozptyl OLS estimátorů
 Gauss-Markovova (G-M) věta a
vydatnost OLS estimátorů
 Shrnutí
 Doporučené samostudium

Úvod
3.6

Terminologie:
 y:
závislá proměnná, vysvětlovaná proměnná
 xi: nezávislé proměnné, vysvětlující proměnné,
regresory
 u: náhodná složka, disturbance
 Beta0: intercept, úrovňová konstanta

Maticový zápis
Úvod

Příklad 1: 3.1
 wage
je mzda, educ je vzdělání (education), exper jsou
zkušenosti (experience) (měřené délkou všech
zaměstnání) u zahrnuje všechny další nepozorované
faktory

Příklad 2: 3.7
 salary
je plat, sales jsou tržby, ceoten je délka
zaměstnání (tenure), u zahrnuje všechny další
nepozorované faktory
Úvod

Příklad 3: Problém C37
 bwght
je váha při narození (birth weight), cigs je počet
vykouřenýxh cigaret, npvis je počet návštěv matky u
lékaře (prenatal visits), u zahrnuje všechny další
nepozorované faktory
Úvod
Vícenásobná regresní analýza oproti jednoduché
regresní analýze umožňuje:

 Lepší
analýzu ceteris paribus, protože explicitně
umožňuje kontrolovat ostatní faktory, které simultánně
ovlivňují vysvětlovanou proměnnou
 Vytvořil lepší model pro predikci vysvětlované
proměnné
 Zahrnout obecnější funkční formy
Metoda nejmenších čtverců
(OLS)
Princip zůstává stejný jako u
jednoduché regrese
 Z maticového zápisu je jednoduché
získat maticový zápis odhadové funkce
koeficientů:

Metoda nejmenších čtverců
(OLS)

Příklad 1
. regress wage educ
Source
SS
df
MS
Model
Residual
1179.73204 1 1179.73204
5980.68225 524 11.4135158
Total
7160.41429 525 13.6388844
wage
Coef. Std. Err.
educ
_cons
.5413593 .053248
-.9048516 .6849678
t
Number of obs =
F( 1, 524) =
Prob > F
=
R-squared =
Adj R-squared =
Root MSE
=
P>|t|
10.17 0.000
-1.32 0.187
526
103.36
0.0000
0.1648
0.1632
3.3784
[95% Conf. Interval]
.4367534
-2.250472
.6459651
.4407687
Metoda nejmenších čtverců
(OLS)

Příklad 1
. regress wage educ exper
Source
SS
df
MS
Model
Residual
1612.2545
2 806.127251
5548.15979 523 10.6083361
Total
7160.41429 525 13.6388844
wage
educ
exper
_cons
Coef. Std. Err.
.6442721 .0538061
.0700954 .0109776
-3.390539 .7665661
t
Number of obs
F( 2, 523)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
526
75.99
0.0000
0.2252
0.2222
3.257
P>|t|
[95% Conf. Interval]
11.97 0.000
6.39 0.000
-4.42 0.000
.5385695 .7499747
.0485297 .0916611
-4.896466 -1.884613
Metoda nejmenších čtverců
(OLS)

Příklad 2
. regress salary ceoten
Source
SS
df
MS
Model
Residual
1241694.06 1 1241694.06
59524270.7 175 340138.69
Total
60765964.7 176 345261.163
salary
Coef. Std. Err.
ceoten
_cons
11.74613 6.14774
772.4263 65.67567
t
Number of obs =
F( 1, 175) =
Prob > F
=
R-squared =
Adj R-squared =
Root MSE
=
P>|t|
1.91 0.058
11.76 0.000
177
3.65
0.0577
0.0204
0.0148
583.21
[95% Conf. Interval]
-.387127
642.8079
23.87939
902.0446
Metoda nejmenších čtverců
(OLS)

Příklad 2
. regress salary ceoten sales
Source
SS
df
MS
Model
Residual
10522179.1
2 5261089.56
50243785.6 174 288757.389
Total
60765964.7 176 345261.163
salary
ceoten
sales
_cons
Coef. Std. Err.
13.92561 5.677433
.0378012 .0066679
621.6709 66.09745
t
Number of obs
F( 2, 174)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
2.45 0.015
5.67 0.000
9.41 0.000
=
=
=
=
=
=
177
18.22
0.0000
0.1732
0.1637
537.36
[95% Conf. Interval]
2.720113
.0246409
491.215
25.13111
.0509615
752.1269
Metoda nejmenších čtverců
(OLS)

Příklad 2
. regress logsalary logsales ceoten ceotensqr
Source
SS
df
MS
Model
Residual
20.951824
3 6.98394134
43.694389 173 .252568723
Total
64.6462131 176 .367308029
logsalary
logsales
ceoten
ceotensqr
_cons
Coef. Std. Err.
.2278004
.0450131
-.0012162
4.71635
.0264767
.0142767
.0004801
.2083994
t
8.60
3.15
-2.53
22.63
Number of obs
F( 3, 173)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
177
27.65
0.0000
0.3241
0.3124
.50256
P>|t|
[95% Conf. Interval]
0.000
0.002
0.012
0.000
.1755415 .2800593
.0168342 .0731919
-.0021639 -.0002686
4.305018 5.127683
Metoda nejmenších čtverců
(OLS)

Příklad 3
. regress bwght cigsreal npvisreal
Source
SS
df
MS
Model
Residual
7749051.42
2 3874525.71
537418717 1653 325117.191
Total
545167768 1655 329406.506
bwght
cigsreal
npvisreal
_cons
Coef. Std. Err.
-10.71611 3.320213
13.23817 3.744587
3267.984 45.92275
t
Number of obs
F( 2, 1653)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
1656
11.92
0.0000
0.0142
0.0130
570.19
P>|t|
[95% Conf. Interval]
-3.23 0.001
3.54 0.000
71.16 0.000
-17.22838 -4.203842
5.893539
20.5828
3177.911 3358.057
Nestrannost OLS odhadové
funkce
Všechny příklady v této prezentaci jsou na průřezová
data.
 U průřezových dat obvykle předpokládáme:
1. (Populační) model je lineární v parametrech
2. Výběrový soubor o velikosti n je získán z populace
náhodným výběrem
3. Neexistuje perfektní kolinearita mezi regresory
(U jednoduché regrese jsme měli formulaci:
Výběrový rozptyl regresoru je větší než nula)
4. Podmíněná střední hodnota náhodné složky je nula
5. Podmíněný rozptyl náhodné složky je konstantní a
konečný (tzv. homoskedasticita)

Nestrannost OLS odhadové
funkce
Pokud jsou splněny předpoklady 1 až 4, je vlastností OLS
estimátoru nestrannost.

Předpoklad 3 zakazuje pouze perfektní korelaci, ale
umožňuje korelaci mezi regresory. Ta je naprosto běžná.


Předpoklad 5 není pro nestrannost nutný
Irelevantní a chybějící proměnné
Pokud zahrneme do modelu irelevantní proměnnou
(přespecifikujeme model), nemá žádný efekt na
nestrannost (očekávaná hodnota příslušného
koeficientu je nula)
 Ale pozor, může mít efekt na rozptyl
estimátorů)


Pokud nezahrneme do modelu relevantní
proměnnou (model podspecifikujeme), estimátory
mohou být vychýlené
 Oboje jsou příklady chybné specifikace modelu
Irelevantní a chybějící proměnné

Příklad misspecifikační analýzy: rovnice 3.40
Odchylka závisí na znaménku koeficientu beta2 a znaménku
u korelace mezi regresory. Při stejných znaménkách je
odchylka pozitivní, při rozdílných negativní. Pokud je
koeficient či korelace nulová, odhad beta1 zůstává
nestranný
 Př. 3.42
 př. Str. 99
Když vynecháme abil, jsou vychýlené estimátory jak beta1
tak beta2, i když předpokládáme, že exper není korelováno s
abil
Rozptyl OLS odhadové funkce
Pokud jsou splněny předpoklady 1 až 5, jsou výběrové
rozptyly estimátorů dány vztahem
3.51



Rozptyl každého parametru se zvyšuje s rozptylem náhodných
složek a se zvyšující lineární závislosti mezi příslušnou
proměnnou a ostatními regresory
Rozptyl každého parametru se snižuje s výběrovým rozptylem
příslušné proměnné
Multikolinearita: vysoká korelace mezi dvěma či více
vysvětlujícími proměnnými (je vlastností konkrétního
výběru)

Rozptyl OLS odhadové funkce
Jednoduchá regrese je pouze speciální případ vícenásobné
regrese
 vzorec

Na čem závisí rozptyly estimátorů, je možné rozšifrovat i z
maticového zápisu


Co když model podspecifikujeme?
Rozptyl OLS odhadové funkce

Pokud jsou splněny předpoklady 1 až 5, je nestranný
estimátor rozptylu náhodné složky dán vztahem
3.56
Standardní chyba regrese SER (standard error of the
regression)


Standardní chyba odhadu
G-M věta a vydatnost OLS
odhadové funkce
Pokud jsou splněny předpoklady 1 až 5, jsou OLS
estimátory betajse stříškou nejlepšími lineárními
nestrannými odhady parametrů beta – BLUE (best linear
unbiased estimator)

Lineární znamená, že může být vyjádřen jako 3.59, což 3.22
splňuje
 Nejlepší znamená, že má mezi všemi lineárními
nestrannými estimátory nejmenší rozptyl

Shrnutí
Úvod - příklady
 Metoda nejmenších čtverců (OLS)
 Nestrannost OLS odhadové funkce
 Irelevantní a chybějící proměnné
 Rozptyl OLS estimátorů
 Gauss-Markovova (G-M) věta a
vydatnost OLS estimátorů

Doporučené samostudium
Ve skriptech „Základy ekonometrie v
příkladech“ si prostudujte kap. 4.4 až
4.7
 Na počítači se udělejte všechny
regrese z této prezentace. Pak si
přidávejte i jiné vysvětlující proměnné a
dívejte se, co dělají standardní chyby a
koeficienty determinace. (wage2,
ceosal2, bwght2)
