Transcript Document

操作変数法
Instrumental Variables Method
誤差項と説明変数の相関
• 説明変数の誤差
• 説明変数から省かれた変数の影響誤差項
• 説明変数が内生変数であるとき
– 連立方程式モデル
• 誤差項と説明変数の間に相関がある場合に
は,係数の推定値はバイアスを持つ
– 操作変数法(Instrumental Variable Method)
説明変数の誤差
真のモデル
yi    x  ui
*
i
説明変数xi*は観察できない:そのかわりxiが観察できる
xi  xi*  vi
Evi   0, cov(ui , v j )  0 forall i, j
yi     xi  vi   ui    xi  ui  vi 
   xi  wi
誤差項wiの期待値は0,分散は一定。しかし,wiとxiには相
関がある
説明変数の誤差(2)
• 説明変数の誤差誤差項と説明変数の相関
• 最少二乗推定量
b  ( X ' X )1 X ' y    ( X ' X )1 X ' w
• 特に単回帰の場合
cov(x, w)
cov(x*  v, u  v)
plimb   

var(x)
var(x*  v)
 v

2
2
 x*   v
2
  x* 2 

   2
2 
  x*   v 
説明変数の誤差(3)
• 例)恒常所得仮説
Ci  kYi P  ui
Yi  Yi P  YiT
 




E YiT  0, cov Yi P , Yi T  cov YiT , ui  0
Y:観察される所得, YP: 恒常所得, YT:変動所得
消費は観察不可能な恒常所得に比例する(kはほぼ1に近い)
消費関数を推計すると,消費性向はケインズ型消費関数の消費性向(0.6~
0.7)と推定される
説明変数の誤差操作変数法(Instrumental Variables Method)
連立方程式モデル
• 例)Keynes型マクロモデル
C    Y  u
Y  C  I G
上のモデルからYの均衡値を求めると
1
1
  I  G  
Y
u
1 
1 
Yが上のようにきまるとき,ケインズ型消費関数の説明変数は内生変数
Yとuの相関は0ではないcov(Y,u)=2/(1-) ≠0
回帰分析の前提が満たされないOLSの推定はバイアスを持つ
連立方程式 (2)
社会資本の生産性
ln Yi    1 ln Li   2 ln K   3 ln K  Z i  ui
P
i
G
i
Y:県民所得,L:労働力,KP:民間資本,KG:社会資本
社会資本の生産性に関する多くの研究では,低い(場合によっ
てはマイナスの)3の値が報告されている
KGは政治的に決定されているかもしれない(過疎地や低所得
地域に手厚い再分配) KGは内生変数
ln KiG   0  1 ln Yi   2 ln POPi    vi
omitted variables
• 回帰分析の説明変数から省かれた変数の存在
• 例)教育と賃金の関係
真のモデル
ln wage = a + b* educ + c* ability + u
educ: 教育年数,ability :能力(ただし観察不可能)
このとき
ln wage = a + b* educ + u
というモデルを推定すれば,誤差項uには観察不可能な
abilityという変数の影響が含まれる
しかし,一般に能力の高い人は高い教育を受けることが期
待される誤差項とeducに相関
推定されたbは,教育の影響を過大に評価
操作変数法
Instrumental Variable Method
y    x  u
cov(x, u )  0
説明変数と誤差項に相関がある状
況を考える
操作変数zを考える。zは次の性質を満たす変数である
cov(z , u )  0
cov(z , x)  0
IV法の推定
cov(z, y ) cov(z,   x  u )
ˆ


cov(z, x)
cov(z, x)
cov(z, u )


cov(z, x)
操作変数法(2)
• 賃金方程式の場合
ln wage = a + b* educ + u
誤差項uは能力を表す変数が反映
• 操作変数として望ましい性質
(a) u(能力等)と無相関
(b) educ と相関
• どの変数が望ましいかはわからない。cov(u,z)≠0をテストする
ことはできない。
• 操作変数の候補
–
–
–
–
誕生日
(b)が満たされない
父親・母親の学歴 (a)が満たされない
兄弟の数
(a) も (b)も満たされる?
兄弟の数educと相関あり(マイナスの相関),能力と無相関
操作変数法(3)
重回帰の場合
操作変数の満たすべき条件
1  
plim Z X   O
n

1

plim Z u   0
n

y  X  u
操作変数法とOLSによる推定量の比較
bIV  Z X  Z y    Z X  Z u
1
bOLS
1
1
1



  X X  X y     X X  X u
誤差項と説明変数に相関がある場合,操作変数法による推定量はバイアスを持
たない(標本数が大きいとき;もちろん,誤差項と相関を持たない操作変数が選べ
ればの話)。一方,OLSの推定量はバイアスを持つ。
2段階最小二乗法
Two Stage Least Square Method
• 内生変数を外生変数について解き,通常の
回帰分析を行う
• その予測値を説明変数にして回帰分析
– ケインズ型モデルの場合
– 消費関数の説明変数にYを用いるのではなく,Y
を外生変数(I,G等)に回帰してその予測値を説
明変数に用いる
• 操作変数法の1種
操作変数法による推定 (wage2.raw)
Quick /Estimate
Equation で
Estimation
settingsのMethod
でTSLS
を選択すると,
Instrument list
を記入するダイア
ローグが表れる。
ここに操作変数を
記入
操作変数のリストに
は自動的に定数項
が含まれる(入れな
い場合には,Inclde
a constantのチェッ
クをはずす)
OLSの結果
操作変数法
推定方法が Two-Stage
Least Squres
操作変数として,
SIBS(兄弟姉妹の数)
を使った
R2やadj. R2がマイナス
になっている(E-Views
の計算方法のため)
操作変数法の場合,気
にしなくてよい
操作変数法では,EDUCの係数が大きくなっている(0.060.122).
またs.eも.0.0059が0.026と4倍以上になっている
注意
• 操作変数の選択基準
– 説明変数と相関
• これはデータからチェックできる)
– 誤差項と無相関
• データからチェックできない
• そう考えるのがもっともらしい
• 操作変数の数 推定する方程式の説明変数と(少
なくとも)同じ数を指定
• wage2.raw のデータで,educ を被説明変数,sibs
を説明変数にした回帰分析を行って,sibsとeducに
相関があることを確かめよ。
操作変数法による推定(重回帰)
• card.raw
– Card(1995)
• 被説明変数: ln(wage)
• 説明変数: 教育年数(educ),経験(exper),
expersq, 黒人ダミー,地域ダミー(smsa, south,..)
• educは誤差項と相関あり
– omitted variablesの問題あるいはeducを決める方程式
があって,educは内生変数
• near4c(大学の近隣に居住していた)
– 教育年数と相関あり
問題
card.rawのデータを用い,次の賃金方程式を推計す
る。
– 被説明変数 ln(wage)
– 説明変数 教育年数(educ),経験(exper), expersq, 黒人ダミー,
地域ダミー(smsa, south,..)
– educは誤差項と相関があるという想定
– 操作変数 経験(exper), expersq, 黒人ダミー,地域ダ
ミー(smsa, south,..),near4c
OLSと操作変数法によって推計し,結果を比較せよ。