回帰分析の諸問題(1)

Download Report

Transcript 回帰分析の諸問題(1)

Slide 1

第4章 回帰分析の諸問題(1)
ー 計量経済学 ー


Slide 2

第1節 多重共線性
1 多重共線性

第2節 系列相関






系列相関
系列相関の判定 -ダービン・ワトソン比-
系列相関への対処法(2) -コクラン・オーカット法-
系列相関への対処法(1) -一般化最小2乗法-
ダービンのh統計量

第3節 不均一分散





不均一分散
不均一分散の判定
不均一分散の解決法(1)
不均一分散の解決法(2) -加重最小2乗法-


Slide 3

• 前章までの回帰分析では、パラメータ推定値を求める際
に、最小2乗法を用いてきた。しかし、この章で示す
(1) 多重共線性
(2) 系列相関
(3) 不均一分散
といった状況が起こっているときには、最小2乗法によるパ
ラメータ推定値は信頼できない。
そこで、これらの状況が起こっている、[原因][症状][判
定法][対処法]について示す。


Slide 4

たとえば風邪を引いた場合を例に考えてみよう
[原因]
• 寒い中薄着で人混みに出かけた
[症状]
• 発熱、せき、くしゃみ、鼻水
[判定法]
• のどを見ると赤くはれている。
• 体温を測ると、38度ある。
[対処法]
• ゆっくり休む。(根治療法)
• ウイルスを殺す薬を飲む(対処療法)
• 熱を下げる薬を飲む(対処療法)


Slide 5

多重共線性あり

第1節 多重共線性
1 多重共線性
多重共線性とは、重回帰分析に
おいて、説明変数間に強い相関
が見られることである。
Y
W
×

多重共線性なし

×
×

×

回帰平面 Y=a+bX+cW

X


Slide 6

[原因]
• モデルの中に強い相関関係をもつ複数の説明変数を入れてしまった。
[症状]
• 推定値の符号が理論に一致しない。
• 決定係数R2は大きいのに、個々のt値が小さい。
• データの値を少し変えたり、少し追加・削除すると、係数推定値が大きく
変化する。
• 説明変数を増減すると、推定値が大きく変化する。


Slide 7

<完全な多重共線性>
Y=a+bX+cW+u
というモデルを考える。このモデルにおいて、W=αXとい
う関係があったとする。
このとき、正規方程式は次のようになる。
 Y  n aˆ  bˆ  X   cˆ  X
 XY  aˆ  X  bˆ  X   cˆ  X
  XY   aˆ  X   bˆ  X   cˆ 
2

2

2

2

X

2

3本目の方程式は2本目の方程式をα倍したものとなり、
実質的には2本の連立方程式である。
未知数は aˆ , bˆ , cˆ の3つであるのに対し、方程式は2つで
あるので、解を一意に決定することはできない。


Slide 8

(数値例について)
数値例について次のようなことがいえる。
• R2は大きいのに、t値は有意ではない。
• データを少し変化させたときに、係数推定値は大きく変化する。
• Wの係数の符号は負となるので、分析結果からはWが大きくなるとき、
Yは小さくなるという結論が導き出されるが、データをみるとその逆で
ある。(YとWには正の相関がある。R=0.7)

これらが多重共線性の[症状]である。
多重共線性を幾何的に考
えると、1枚の平面を1本
の直線で支えることによっ
ておきる不安定性である。
(右図)


Slide 9

[判定法]
• 相関係数行列
• VIF値
※ VIF(Variance Inflation Factor)値について
VIF値は個々の説明変数について、次のように定義される。
VIF i 

1
1  Ri

2

ここで、R2i はi番目の説明変数を他の説明変数に対して
回帰した場合の決定係数であり、説明変数が2つのみの
場合には、単相関係数の2乗となる。
このVIFが10を超えるような場合には、多重共線性の疑
いがあるという判断をする。


Slide 10

[対処法]
• 相関の高い説明変数のいずれかを除去する。(根治療法)
• データの期間を延長する、あるいは年次データでだめなら四半期
データや月次データなどを用いて、データの数を増やす。
• 説明変数や被説明変数を階差あるいは比率の形にする。
• 相関の高い説明変数を合成し、新しい説明変数を作る。
• 主成分回帰やリッジ回帰などの方法を用いる。(非常手段)

多重共線性が起こっている場合、相関の高い複数(ここで
は2つとする)の変数のうち、1つをとり除くことが根本的
な解決法である。
しかし、経済理論から考えて、1つをとり除くことが不可能
なこともあり、その場合には下のいくつかの対処法をとる
ことになる。


Slide 11

第2節 系列相関
1 系列相関
撹乱項utには次のような仮定をおいてきた。
① utは正規分布にしたがう。
② utの平均は0である。
③ utの分散は一定値σ2である。
④ 撹乱項utは相互に独立である。

このうちの④の仮定が満たされないことが系列相関である。
すなわち、時系列データにおいて、異なる2時点の撹乱項
utとusの間に相関があるということである。


Slide 12

[原因]
• 重要な説明変数の欠落
• 経済行動における習慣性やショックの影響の継続
• データの加工時
[症状]
• 回帰係数の推定値はBLUEではなく、標準誤差を過小推定してしまう。
⇒ t値、F値、R2などを大きめに計算してしまい、本当は有意でないも
のを誤って有意とみなす。
⇒ 本当は妥当でないモデルを、誤って妥当であると結論づけてしまう
危険がある。

[判定法]
• 残差プロット
• ダービン・ワトソン比(利用できない場合もある)


Slide 13

2 系列相関の判定 -ダービン・ワトソン比-
Yt=a+bXt+ut
というモデルを考える。このモデルの誤差項に
ut= ρut-1 +εt
という系列相関が存在していたとする。(これを1階の自己
相関という)
H0: ρ= 0 (系列相関なし)
H1: ρ≠ 0 (系列相関あり)
という検定が考えられる。このH0: ρ= 0を検定する代わり
に用いられるのがダービン・ワトソン(DW)比である。
このとき


Slide 14

ダービン・ワトソン比は残差e1,e2,…,enを用いて次のように
表すことができる。
( e 2  e1 )  ( e 3  e 2 )    ( e n  e n 1 )
2

DW 

2

2

e1  e 2    e n
2

2

2

この統計量は
ut= ρut-1 +εt
のutをetでおきかえて最小2乗法を適用した推定値をˆ と
すると、nが十分に大きいとき、
DW≒2(1- ˆ )
という関係が成り立つ。 ˆ  0 のとき、DW=2であることか
ら、DWの値が2に近ければ系列相関が存在しないという
判断をする。
正の
系列相関

0

判定
不能

dL

dU

系列相関なし

2

判定
不能

負の
系列相関

4-dU 4-dL

4


Slide 15

<正の系列相関の例>
• ρ>0 ⇔ DW<2
• 正の系列相関がある場合は、残差が同じ符号のまま、ある程度の期
間続く。

標準化残差

正の系列相関の例(DW=0.306)
2
1.5
1
0.5
0
-0.5 0
-1
-1.5
-2
-2.5

5

10

15

20

25

30 時点


Slide 16

<負の系列相関の例>
• ρ<0 ⇔ DW>2
• 負の系列相関がある場合は、残差の符号が+,-, +,-, ・・・とある
程度交互に続く。

標準化残差

負の系列相関の例(DW=3.390)
2.5
2
1.5
1
0.5
0
-0.5 0
-1
-1.5
-2
-2.5

5

10

15

20

25

30 時点


Slide 17

<系列相関のない例>
• ρ≒0 ⇔ DW≒2
• 系列相関がない場合は、正の系列相関と負の系列相関のちょうど中
間になる。
系 列 相 関 な し の 例 (D W = 2 .2 5 6 )
3

標準化残差

2
1
0
-1
-2
-3

0

5

10

15

20

25

30

時点


Slide 18

[対処法]
• 重要な説明変数を追加する(根治療法)
• 関数形が正しいか確認する
• ショックの影響がないか確認する(影響がある場合にはダミー変数を
用いる)
以上のようなモデルの妥当性を検証した後で、モデルが妥当である
にもかかわらず、系列相関が存在する場合には、通常の最小2乗法
の代わりに次のような推定法を用いて、係数の推定を行う。
• コクラン・オーカット法
• 一般化最小2乗法
• 最尤法


Slide 19

5 系列相関への対処法(2) -コクラン・オーカット法-
Yt=a+bXt+ut
ut= ρut-1 +εt,
という誤差項に1階の自己相関を持つモデルを考える。
(主要参考書のαは、ここでのρに対応します)
ここで、Yt - ρYt-1を考えると
Yt   Yt 1  a  bX t  u t   ( a  bX
Yt



Y t  Y t   Y t 1
X


t

 X t   X t 1

 u t 1 )

 a (1   )  b ( X t   X t 1 )  u t   u t 1




t 1

Xt

t

とおき、Yt*をXt*に対して回帰すれば、

誤差項から系列相関の影響が取り除かれる。


Slide 20

<手順1>
YtをXtに回帰し、推定値 aˆ , bˆ を求める。
<手順2>
Yˆt  aˆ  bˆ X t を計算し、 e t  Y t  Yˆt を求める。
e t  ˆ e t 1   t とし、ˆ を求める。
etをutの代わりに用い、
<手順3、4>

Y t  Y t  ˆ Y t 1

X


t

 X t  ˆ X t 1

とし、Yt*をXt*に対して回帰すれば、

誤差項から系列相関の影響が取り除かれる。
※ 問題点
最初の期のデータは取り除かれてしまう。


Slide 21

4 系列相関への対処法(1) -一般化最小2乗法-
(ここではプレイス・ウインステン変換による一般化最小2乗法を取り上げる)

<コクラン・オーカット法との相違>
• 1期目のデータを作成する
• 定数項を変数とみなし、定数項なしの回帰分析を適用する。
Yt   Yt 1  a  bX t  u t   ( a  bX
Yt



Y t  Y t   Y t 1


X t  X t   X t 1

 u t 1 )

 a (1   )  b ( X t   X t 1 )  u t   u t 1




t 1

Zt



Xt

t

とおき、Yt*をXt*とZt*に対して回帰すれば、



Zt  1 

誤差項から系列相関の影響が取り除かれる。


Slide 22

コクラン・オーカット法

一般化最小2乗法


Slide 23

3 ダービンのh統計量
系列相関があるかないかの判定基準として、ダービン・ワトソン比が
用いられるが、DW比では正確な判定ができないケースがある。
それは、
Yt  a  b X t  cY t 1  u t

というように、説明変数として被説明変数の過去の値(ラグつき内生
変数という)を含む場合である。
この場合、DW比は2に偏りを持つ(本当は系列相関のあるモデルを、
誤って「系列相関なし」と判断してしまう)ので、代わりにダービンのh
統計量を用いる。


Slide 24

<ダービンのh統計量>
h  ˆ

n: 標本数
2
s cˆ :パラメータ cˆ の分散の推定値

n
1  ns cˆ

2

hは標準正規分布にしたがうので、有意水準5%で次のようになる。
負の
系列相関

系列相関なし

-1.96

0

正の
系列相関

1.96


Slide 25

第3節 不均一分散
1 不均一分散
撹乱項utには次のような仮定をおいてきた。
① utは正規分布にしたがう。
② utの平均は0である。
③ utの分散は一定値σ2である。
④ 撹乱項utは相互に独立である。

このうちの③の仮定が満たされないことが不均一分散で
ある。


Slide 26

[原因]
• 変数のレベルが上昇することに伴って、分散が増大することが多い。
(例) 平均が10倍になれば、それにともなって分散も増える。

[症状]
• 回帰係数の標準誤差を過小推定してしまう。
⇒ t値、F値、R2などを大きめに計算してしまい、本当は有意でないも
のを誤って有意とみなす。
⇒ 本当は妥当でないモデルを、誤って妥当であると結論づけてしまう
危険がある。

[判定法]
• 残差プロット
• 各種検定





ゴールドフェルド・クォントの検定
ブローシュ・ペーガンの検定
ホワイトの検定
ラグランジュ乗数(LM)検定


Slide 27

企 業 に お け る管 理 者 数 と雇 用 者 数
(デ ー タ出 典 :チャタジ ー ・プライス 『回 帰 分 析 の 実 際 』第 2 章 )

管理者数(人)

250
200
150
100
50
0
0

500

1000

1500

2000

雇 用 者 数 (人 )

残 差 プロット
3

標準化残差

2
1
0
-1
-2
-3
0

500

1000
雇用者数

1500

2000


Slide 28

2 不均一分散の判定
不均一分散の判定は、残差プロットを見ることや、さまざま
な検定をおこなうことによる。
不均一分散の検定の1つにゴールドフェルド・クォントの検
定がある。この検定はデータの期間をいくつかに分割し、
それぞれの期間ごとの誤差項の分散が均一かどうかを
検定するものである。
※ 不均一分散の検定は一般に
H 0 :  i   ( i  1, 2 ,  )
2

2

を考える。すなわち、「誤差項の分散が均一である」ということが帰無
仮説であり、「均一分散の検定」といったほうが適切である。


Slide 29

<検定の手順>
• データをXの大きさの順に並べる(重回帰の場合には



の大きさの

順が適当であろう)。
• 全体をn個としたとき、(n-m)/2, m, (n-m)/2 個の3つに分割する。こ
こでmは全体の2割弱程度が適当である。
X1, X2 , ・・・,
・・・ , ・・・, X n-1, Xn
Y1, Y2 , ・・・,
・・・ , ・・・, Y n-1, Yn
└Ⅰ┘
└Ⅱ┘
└Ⅲ┘
• ⅠのグループとⅢのグループで個別に回帰分析をおこない、それぞ
れの残差分散s2をもとめる。Ⅰのグループの残差分散s12とⅢのグ
ループの残差分散s32の比を考えると、その値は自由度((n - m)/2 k, (n - m)/2 - k)のF分布にしたがう。
• よってこの統計量について仮説検定をおこなえばよい。

[対処法]
• 説明変数と被説明変数について、対数変換など変換をおこなう。
• 加重最小2乗法または最尤法を用いる。


Slide 30

3 不均一分散の解決法(1)
撹乱項の分散について


2
1

 X
2

2
1

Y1  a  bX 1  u 1

2  X2
2

2

2

Y 2  a  bX





2
n

 X
2

u1
X1

, ,  n 

Y n  a  bX

X

 u2

Y2

un
Xn

a
X1



X2

a
X2

 b  1
 b  2


n

 un

Yn
Xn



a
Xn

 b  n

説明変数と被説明変数をそれぞれXiで割ると、
このように変形できる。
であるので、このモデルの撹乱項の分散はすべてσ2と

なる。
Y
1
よって、 を に回帰すればよい。
X

2



X1



2
n

というように、説明変数
の2乗に比例していると
仮定する。

ここで、  1 

Y1


Slide 31

4 不均一分散の解決法(2) -加重最小2乗法-
撹乱項の分散がすべて既知であったとする。
このとき、加重2乗和
G 



1

2


2
2
(Y1  aˆ  bˆ X 1 )    2 (Y n  aˆ  bˆ X n )

n

を最小とするものである。
このモデルは、変数をすべて  i2 で割ったものである。
このように、Y を X に回帰すればよい。