第四章放宽基本假定的模型2

Download Report

Transcript 第四章放宽基本假定的模型2

§4.2
序列相关性
一、序列相关性的概念
二、实际经济问题中的序列相关性
三、序列相关性的后果
四、序列相关性的检验
五、序列相关性的补救
六、案例
一、序列相关性的概念
对于模型:
Yi=0+1X1i+2X2i+…+kXki+i
i=1,2, …,n
如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某
种相关性,即:
Cov(i , j)≠0
ij, i,j=1,2, …,n
则认为出现了序列相关性(serial correlation)。
# 序列相关性下的方差-协方差阵
在其他假设仍成立的条件下,序列相关即意味着
E ( i  j )  0
此时,随机误差项之间的方差-协方差阵为:
 2
 2
 E ( 1  n ) 



Cov (μ )  E (μμ )  



  
 E (  ) 


2

n 1


 n1
 Ω  I
2
2



 1n 

 
 2 
# 自相关(autocorrelation)
• 序列相关经常出现在以时间序列数据为样本的模型中,此时,不同样
本点的区别仅在于时间的不同
• 这意味着,此时的序列相关性表现为不同时间上的随机误差项存在相
关,这一情形下的序列相关也通常称之为自相关
• 为此,本节将表示不同样本点的下标 i
改为 t 。
# 一阶自相关(first-order autocorrelation)
•
如果仅存在:
cov(t ,t-1)=E(tt-1)  0
t = 2, …,n
即:随机误差项只与其前一期值有关(或者说,仅是相邻的随机误
差项之间存在相关),则称为一阶自相关。
•
一阶序列相关时,随机误差项可以表示为:
t = t-1+t
-1<<1
称为一阶自回归形式,记为AR(1),其中:
 : 被 称 为 一 阶 自 相 关 系 数 ( first-order coefficient of
autocorrelation)
i:满足标准的OLS假定的随机干扰项
# 高阶自相关(high-order autocorrelation)

序列相关的一般形式可以表示成:
t  1t 1  2 t 2 
  p t  p   t
称为P阶自回归形式,记为AR(p), 表示模型存在P阶自相关。

t-1、 t-2、…、 t-p分别表示t的前1期、前2期、…、前p期项,
又称为滞后1期、滞后2期、…、滞后p期项。
1、 2、…, p称为1阶、2阶、…,p阶自相关系数。
二、实际经济问题中的序列相关性
序列相关性往往出现在以时间序列数据为样本的模型中,产生这一问
题的原因主要来自三个方面:
1、经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列
不同时间的前后关联上。
例如:绝对收入假设下居民总消费函数模型:
Ct=0+1Yt+t
t=1,2,…,n
由于消费习惯的影响被包含在随机误差项中,则可能出现序列
相关性(往往是正相关 )。
2、经济行为的滞后性
许多经济行为存在滞后效应,即当期的经济行为不仅影响当期的有
关结果,而且也会对以后若干期的结果存在影响,这使得作为结果
变量的经济变量在不同时间上呈现出序列相关性。
例如:
• 固定资产的形成,不仅与当期的固定资产投资有关,也与前期
多年的固定资产投资有关
• 今年的家庭消费水平,不仅与今年的收入有关,也与前期多年
的收入有关以及前期多年的消费支出有关
• 企业当期的销售收入,同样会受到前期的商品销售水平有关
3、模型设定的偏误
所谓模型设定偏误(Specification error)是指所设定的模型
“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数
形式有偏误。
例如:本来应该估计的模型为:
Yt=0+1X1t+ 2X2t + 3X3t + t
但在模型设定中做了下述回归:
Yt=0+1X1t+ 1X2t +
vt
因此:vt=3X3t + t,
如果X3确实影响Y,则出现序列相关。
这是横截面数据也可能存在序列相关性的重要原因
4、数据的处理
在实际经济问题中,有些数据是通过已知数据生成的。因 此,
新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
例如:

季度数据来自月度数据的简单平均,这种平均的计算减弱了每月
数据的波动性,从而使随机干扰项出现序列相关。

还有就是两个时间点之间的“内插”技术往往导致随机项的序列
相关性。
三、序列相关性的后果
1、参数估计量仍然无偏,但非有效
因为:在有效性证明中利用了:
E(NN’)=2I
即同方差性和互相独立性条件。
而且:在大样本情况下,参数估计量虽然具有一致性,但仍然不具
有渐近有效性。
* 通常情形下,采用OLS将会低估参数估计量的标准差,
也会低估随机误差项的方差б2
2、变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上
的,这只有当随机误差项具有同方差性和互相独立性时才能成立。
通常情况下,存在序列相关性时,参数估计值的样本方差往往会
被低估,此时变量t检验和方程F检验的显著性容易被夸大!
3、模型的预测失效

参数估计值非有效(真实方差往往被低估),失去最优性,样本估计
式失准

随机误差项的方差一般会被低估

区间预测与参数估计量的方差和随机误差项的方差均有关

在方差有偏误的情况下,使得预测估计不准确,预测可信度降低。

所以,当模型出现序列相关性时,它的预测功能失效。
四、序列相关性的检验
基本思路 :
首先,采用 OLS 法估计模型,以求得随机误差项的
“近似估计量”
,用e~i 表示:
~  Y  (Yˆ )
e
i
i
i 0 ls
然后,通过分析这些“近似估计量”之间的相关性,以
判断随机误差项是否具有序列相关性。
(一)图示检验法
et  t
et  et 1
(二)回归检验法
~
~
e
以 et 为被解释变量,
以各种可能的相关量,
诸如以
t 1
~
~2
e
t  2 、et
等为解释变量,建立各种方程:
~  e
~ 
e
t
t 1
t
~ e
~  e
~ 
e
t
1 t 1
2 t 2
t
……
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序
列相关性。
优点:(1)能够确定序列相关的形式;(2)适用于任何类型序列相关
性问题的检验。
缺点:工作量大,计算复杂,检验繁琐
、
(三)杜宾-瓦森检验法(DW检验)
D-W 检 验 是 杜 宾 ( J.Durbin ) 和 瓦 森 (G.S. Watson) 于
1951年提出的一种检验序列自相关的方法


该方法只适用于检验一阶自相关
(1)解释变量X非随机;
假
定
条
(2)随机误差项t为一阶自回归形式:
t =  t-1 + t
(3)回归模型中不应含有滞后因变量作为解释变量,即不应
出现下列形式:
Yt=0+1X1t+kXkt+Yt-1+t
件
(4)回归含有截距项
# D.W.检验统计量
杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构造如下
统计量:
n
D.W . 
~ e
~ )2
(
e
 t
t 1
t 2
n
~2
e
 t
t 1
• 该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精
确的分布很难得到。
• 但是,他们成功地导出了临界值的下限 dL 和上限 dU ,且这些上下
限只与样本的容量 n 和解释变量的个数 k 有关,而与解释变量X的
取值无关。
D.W.检验步骤
(1)提出假设:H0:ρ=0(不存在一阶自相关)H1:ρ≠0
(2)计算DW值
(3)给定,由n 和(k+1)的大小查DW分布表,得临界值dL和dU
(4)比较、判断
0 < D.W. < dL
存在
正自相关
dL < D.W. < dU
不能确
定
dU < D.W. < 4-dU
4-dU < D.W. < 4- dL
无自相关
不能确定
# DW检验的图示
不
能
确
定
正
相
无自相关
不
能
确
定
关
0
负
相
关
dL
dU
2
4-dU
4-dL
# D.W.检验统计量的说明
DW检验表明:当D.W.值在2左右时,模型不存在一阶自相关
证明:展开D.W.统计量:
n
D.W . 
 e~
t 2
t
n
2
~
 e
2
t 1
t 2
n
~e
~
 2 e
t t 1
t 2
(*)
n
~2
e
 t
t 1
n
D.W .  2(1 
 ~e ~e
t 2
n
t
t 1
 ~et 2
t 1
其中:ρ为一阶自相关系数
)  2(1   )
一阶自回归模型:i=i-1+i
的参数估计。
由于自相关系数的值介于-1和+1之间,因此:
0≤DW≈2(1-ρ)≤4
如果存在完全一阶正相关,即=1,则 D.W. 0
完全一阶负相关,即= -1, 则 D.W. 4
完全不相关,即=0,则 D.W.2
不
能
确
定
正
相
无自相关
关
0
dL
dU
2
不
能
确
定
4-dU
负
相
关
4-dL
# 使用D.W.检验时需要注意的问题

DW检验是最常用的自相关性的检验方法,在报告回归分析的结果时,
一般将DW值连同R2、t值等一起标明。但在应用DW检验时需要注意:
1)DW值接近于2时,只能说明模型不存在一阶线性自相关,但并
不意味着模型不存在高阶自相关或者非线性相关
2)DW值落入两个无法判断的区域时,需要采用其它检验方法
3)不适用于联立方程组模型中各单一方程随机误差项序列相关的
检验
4)DW检验不适用于模型中含有滞后被解释变量的情况,即不适用
于如下模型
Yt =0 + 1 X1t+  + k Xkt +  Yt-1 + t
# DH统计量
针对滞后变量模型:
Yt =0 + 1 X1t+  + k Xkt +  Yt-1 + t
上述模型,Durbin提出Durbin-h统计量:
DW
n
h  (1 
)
2
1  n  var(ˆ )

N (0,1)
(四)拉格朗日乘数检验(Lagrange Multiplier)
• LM检验是由布劳殊(Breusch)与戈弗雷(Godfrey)于
1978年提出的,也被称为GB检验。
• 拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序
列相关以及模型中存在滞后被解释变量的情形。
对于模型
Yt  0  1 X1t   2 X 2t 
  k X kt  t
如果怀疑随机扰动项存在p阶序列相关,即随机误差项存在:
t  1t 1  2t 2   p t  p  t
则构造以下辅助回归模型:
et  0  1 X1t 
在原假设: H0:
  k X kt  1et 1 
  pet  p   t
1=2=…=p =0(无序列相关)成立时,有:
LM  nR
2
 ( p)
2
其中:n为辅助回归样本容量,R2为辅助回归的可决系数:
给定,查临界值2(p),与LM值比较,如果超出则拒绝H0
实际检验中,可从1阶、2阶、…逐次向更高阶检验。
# 使用GB检验时需要注意的问题

检验时需要事先确定准备检验的阶数P,实际检验中,可从1阶、2
阶、…逐次向更高阶检验。

检验结果显著时,可以说明存在序列相关,但是并不一定代表序列
相关的阶数一定能够达到所检验的阶数。
◦ 低阶序列相关的存在往往会导致高阶序列相关检验的显著性
◦ 具体阶数的判断,需要结合辅助回归中自相关系数的显著性
e~t  6.692 0.0003GDP  1.108e~t 1  0.819e~t 2  0.032e~t 3
(0.22)
(0.087)
(-0.497)
(4.541)
R2=0.6615
( -1.842 )
五、序列相关性的补救

如果模型被检验证明存在序列相关性,则首先需要分析其
原因,对症下药:
◦ 如果产生序列相关的原因是变量选择失准(如遗漏了重要的解释
变量等),则应调整变量;如果是模型设定不当,应当调整模型
形式。——虚假的序列相关问题
◦ 如果原因在于客观经济现象的自身特点,如经济变量的惯性作用
等,则需要发展新的估计方法
• 最常用的方法是广义最小二乘法(GLS: Generalized
least squares)和广义差分法(GD,Generalized
Difference)。
(一)广义最小二乘法
广义最小二乘法(GLS)是最具有普遍意义的最小二乘法,普
通最小二乘法(OLS)和加权最小二乘法(WLS)是其特例
对于模型:
Y=X+ 
(X为设计矩阵,Y、β、μ为
列向量)
如果存在序列相关,同时存在异方差,即有:
  12  12 

2



21
2



Cov(μ μ
, )  E (μ μ
, )

 

 n1  n 2 
 1n 

 2n 


 n2 
是一对称正定矩阵,存在一可逆矩阵D,使得: =DD’
  2Ω
变换原模型(D-1左乘):
D-1Y=D-1X  +D-1
即:
Y*=X* + *
(*)
(*) 模型具有同方差性和无序列相关性,因为:
1
1
1


E (μ*μ* )  E (D μμD )  D E (μμ)D
1 2
1
 D  ΩD  D 1 2 DDD 1

1
 I
2
(*)式的OLS估计:
ˆ *  (X* X* ) 1 X* Y*
β
1
1
1
1


 ( X D D X) X D D 1 Y
 ( XΩ1 X) 1 XΩ1 Y
此即原模型的广义最小二乘估计量(GLSE),是无偏的、有效的估计量。
# 如何得到矩阵?——近似估计

矩阵是原模型随机误差项的方差-协方差阵。

获得的一种方法是采用随机误差项的近似估计量
var( i )  ei
 e12

e2 e1

ˆ



 en e1
ei
构造
cov( i ,  j )  ei e j
2
e1e2
e22
en e2
e1en 

e2 en 


2 
en 
# 如何得到矩阵?——精确估计

获取的更精确的方法是根据原模型序列相关的具体形式进行估计

常见的是假设随机误差项具有一阶序列相关性,即:
i =  i-1 + i
(-1 <  < 1)
此时,可以证明:
 1

2
  
cov(   ) 
1 2 
 n 1


1
 n 2
 n 1 
n 2 
 


1 
  2 
证明:
由:
有:
i =  i-1 + i
(-1 <  < 1)
t  t 1   t   ( t  2   t 1 )   t   2 t  2   t 1   t
  3 t  3   2 t  2   t 1   t =
即:
由:
有:
t   t   t 1   2 t  2 
  i t i 
E( i )  0, var( i )   2 ,cov( i ,  j )  0
E(t )  E( t   t 1   2 t 2 
  i t i 
)0
var( t )  var( t   t 1   2 t  2 
=var( t )   2 var( t 1 ) 
= 2 (1   2   4 
t   s t s   s1 t s1 
  i t  i 
)
  2 i var( t  i ) 
  2i 
)=  2 (1   2 )  2
  t   s t s  f ( t  j , j  0,1, , s  1)
cov( t , t  s )  cov(  s  t  s  f ( t  j , j  0,1,
, s  1), t  s )
= s var(  t  s )  cov[ f ( t  j , j  s, s  1,
f ( t  j , j  0,1,
2


= s 2   s
1 2
),
, s  1)]
(二)广义差分法
广义差分法是利用广义差分变换将原模型变换为满足基本
假设的差分模型,再进行OLS估计。是一类克服序列相关性
的有效方法,被广泛采用。
对于模型:
Yt   0  1 X1t   2 X 2t 
  k X kt  t
将模型滞后一期,有:
Yt 1  0  1 X1,t 1   2 X 2,t 2 
  k X k ,t 2  t 1
同理,模型滞后p期的形式为:
Yt  p  0  1 X1,t  p   2 X 2,t  p 
  k X k ,t  p  t  p
如果模型存在:
t  1t 1  2 t 2 
  p t  p   t
对模型施行广义P阶差分变换,有:
Yt -1Yt 1 -
- pYt  p   0 (1  1 
 p )
  1 ( X 1t -1 X1, t 1 -
- p X1, t  p )

  k ( X kt -1 X k , t 1  (  t  1  t  1 
即:
Yt*  A  1 X1*t 
- p X k , t  p )
  p t  p )
*
  k X kt
  t , t  p  1,
该模型为原模型的广义差分模型,不存在序列相关问题,可进行OLS估计,
从而获得原模型的最佳估计量,
其中:ˆ0= A(1  1 
p)
# GD和GLS的关系
广义差分法实质上与广义最小二乘法是一致的,只是GD法中损失了部
分样本观测值。
如:一阶序列相关的情况下,广义差分是估计
Yt  Yt 1  0 (1   )  1 ( X1t  X1t 1 )    k ( X kt  X kt 1 )   t
t  2,3,, n
这相当于GLS中的D-1去掉第一行后左乘原模型:Y=X+ 
 1  2

 

0
1 
D 
 

 0
 0

0
1


0
0
0
0
1

0
0
 0
0
 0
0
 0
0
 

  1
 0 
0 
0

0


0
1 
即运用了GLS法,但第一次观测值被排
除了。
如令:Y1*  1   2 Y1 , X *j 1  1   2 X j 1
(普莱斯-温斯特变换)
则GD与GLS完全等价。
(三)随机误差项的自相关系数ρ的估
计

应用广义最小二乘法或广义差分法,必须已知随机误差项的自相关
系数1, 2, … , L 。

实际上,人们并不知道它们的具体数值,所以必须首先对它们进行
估计。

常用的估计方法有:
(1)利用DW统计量进行近似估计
(2)科克伦-奥科特(Cochrane-Orcutt)迭代法。
(3)杜宾(durbin)两步法
(1)利用DW统计量进行估计

对于一阶自相关:t  t 1   t
由: DW  2(1   )
有:
DW
  1
2

仅适用于一阶自相关情形,用于构建一阶差分模型。所估计的为一阶
自相关系数
(2)科克伦-奥科特迭代法
以一元线性模型为例。
1)首先采用OLS法估计原模型:Yt=0+1Xt+t
得到的i的“近似估计值”et(1),
2)以et(1)作为观测值使用OLS法估计下式:
t=1t-1+2t-2+pt-p+t
得到:
ˆ1(1) , ˆ 2(1) ,
ˆ p(1)
,
作为随机误差项的相关系数的第一次估计值
ˆ1(1) , 
ˆ 2( 2) ,
ˆ p(1)
,
3)利用 
构造广义
差分模型:
Yi  1Yi 1    l Yi l   0 (1  ˆ1    ˆ l )  1 ( X i  ˆ1 X i 1    ˆ l X i l )   i
进行OLS估计,得到回归系数的估计
ˆ ( 2) , ˆ ( 2)
4)将 
0
1
ˆ0( 2) , ˆ1( 2)
代回原模型: Yt=0+1Xt+t
求出i新的“近似估计值” et(2)
5)重复步骤2),得到相关系数的第二次估计值:
ˆ1( 2) , 
ˆ 2( 2) ,

ˆ p( 2)
,
6)重复上述步骤,可得相关系数的多次迭代值。
注:具体迭代次数,可根据具体问题来定。一般可事先规定一个精度δ,
当
时,迭代终止。实际中一般
ˆ (n  1)  ˆ (n)  
只需要迭代两次即可。因此上述方法又称为科克伦-奥科特两步法。
# 科克伦-奥科特迭代法图示
Yt   0  1 X t  t
 0(1) , 1(1) ;
et (1)
t  1t 1  2 t 2  ...   p t  p   t
ˆ1(1) , ˆ 2(1) ,
Yt *  0 (1  1 
ˆ p(1)
,
 p )  1 X t *  t *
ˆ0( 2) , ˆ1( 2)
(3)杜宾(durbin)两步法
第一步:变换差分模型为下列形式
Yt  1Yt 1 
  pYt  p   0 (1  1 
 p )
  1 ( X 1t -1 X1, t 1 -
- p X1, t  p ) 
  k ( X kt -1 Xk , t 1 -
- p X k , t  p )   t
进行OLS估计,得各Yj(j=t-1, t-2, …,t-p)前的系数1,2, , p
的估计值
第二步:将估计的
型:
ˆ 1Yt 1 
Yt  
代入差分模
ˆ pYt  p   0 (1  ˆ 1 

  1 ( X 1t -ˆ 1 X1, t 1 ˆ 1 X k , t 1   k ( X kt -
采用OLS法估计,得到参数
记为:
 0* , 1* ,
 0 (1  ˆ1 
 ˆ p )
-ˆ p X1, t  p ) 
-ˆ p X k , t  p )   t
 ˆ p ), ˆ1 ,
ˆk
,  k*
于是:
0  0* (1  ˆ1 
 ˆ k ),  *j   j , j  1,
,k
# Eviews中的广义差分法

在 Eviews 软 件 包 下 , 广 义 差 分 采 用 了 科 克 伦 - 奥 科 特
(Cochrane-Orcutt)迭代法估计。

在解释变量中引入AR(1)、AR(2)、…,即可得到参数和 ρ1 、
ρ2、…的估计值,即命令格式:
LS

Y
c
X1
X2
…
AR(1) AR(2)…
其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完
成了ρ1、ρ2、…的迭代。

实际过程中引入到几阶自回归(m=?),可以根据检验情况而
定,如DW检验、GB检验等。
# 可行的广义最小二乘
法

如果能够找到一种方法,求得Ω或各序列相关系数j的估计量,使得
GLS能够实现,则称为可行的广义最小二乘法(FGLS, Feasible
Generalized Least Squares)。

FGLS估计量,也称为可行的广义最小二乘估计(feasible general
least squares estimators)。

可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科
克伦-奥科特迭代法下,估计量也具有渐近有效性。

前面提出的方法,就是FGLS
六、案例:中国商品进口模型
经济理论指出,商品进口主要由进口国的经济发展
水平,以及商品进口价格指数与国内价格指数对比因素
决定的。
由于无法取得中国商品进口价格指数,我们主要研
究中国商品进口与国内生产总值的关系。(下表)。
表 4.2.1 1978~2001 年中国商品进口与国内生产总值
国内生产总值 商品进口
GDP
M
(亿元)
(亿美元)
国内生产总值
GDP
(亿元)
商品进口
M
(亿美元)
1978
1979
3624.1
4038.2
108.9
156.7
1990
1991
18547.9
21617.8
533.5
637.9
1980
1981
1982
1983
1984
4517.8
4862.4
5294.7
5934.5
7171.0
200.2
220.2
192.9
213.9
274.1
1992
1993
1994
1995
1996
26638.1
34634.4
46759.4
58478.1
67884.6
805.9
1039.6
1156.1
1320.8
1388.3
1985
1986
1987
1988
8964.4
10202.2
11962.5
14928.3
422.5
429.1
432.1
552.7
1997
1998
1999
2000
74462.6
78345.2
82067.46
89442.2
1423.7
1402.4
1657
2250.9
1989
16909.2
591.4
2001
95933.3
2436.1
资料来源:《中国统计年鉴》(1995、2000、2002)。
1. 通过OLS法建立如下中国商品进口方程:
ˆ  152.91  0.02GDP
M
t
t
(2.32) (20.12)
2. 进行序列相关性检验
• DW检验
取=5%,由于n=24,k=2(包含常数项),查表得:
dl=1.27,du=1.45
由于DW=0.628< dl ,故: 存在正自相关。
• 拉格朗日乘数检验
1) 2阶滞后:
e~t  6.593 0.0003GDPt  1.094e~t 1  0.786e~t 2
(0.23)(-0.50)
(6.23)
(-3.69)
R2=0.6614
于是:LM=220.6614=14.55。取=5%, LM > 20.05(2)=5.991,
故: 存在序列相关,且由于et-1、et-2的系数均显著,说明存在2阶相关
2) 3阶滞后:
e~t  6.692 0.0003GDP  1.108e~t 1  0.819e~t 2  0.032e~t 3
(0.22)
(0.087)
(-0.497)
(4.541)
( -1.842 )
R2=0.6615
于是:LM=210.6614=13.89
取=5%,2分布的临界值20.05(3)=7.815
有:
LM > 20.05(3)
表明: 存在自相关;
但ět-3的参数不显著,说明不存在3阶序列相关性。
3、运用广义差分法进行自相关的处理

在Eviews软包下,输入:LS M c GDP ar(1) ar(2)
得到2阶广义差分模型的拟合结果:
Mˆ t  169.32  0.020GDPt  1.108AR[1]  0.801AR[2]
(3.81)
(18.45)
(6.11)
(-3.61)
取=5% ,DW>du=1.66(样本容量:22)
表明:广义差分模型已不存在序列相关性。
【注】:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;
采用3阶广义差分,变换后的模型不再有自相关性,但AR(3)
的系数的t值不显著。