Transcript Y t-1

第六章 动态经济模型:自回归
模型和分布滞后模型
第一节 引言
第二节 分布滞后模型的估计
第三节 部分调整模型和适应预期模型
第四节 自回归模型的估计
第五节 阿尔蒙多项式分布滞后
第六节
格兰杰因果关系检验
第一节 引言
很多经济过程的实现需要若干周期的时间,因此
需要在我们的计量经济模型中引入一个时间维,通
常的作法是将滞后经济变量引入模型中。让我们用
两个简单的例子说明之。
例1.
Yt = α+βXt-1 + ut,
t = 1,2,…,n
本例中Y的现期值与X的一期滞后值相联系,比较一
般的情况是:
Yt = α+β0Xt +β1Xt-1 +……+βsXt-s + ut,
t = 1,2,…,n
即Y的现期值不仅依赖于X的现期值,而且依赖于X的
若干期滞后值。这类模型称为分布滞后模型,因为X
变量的影响分布于若干周期。
例2.Yt = α+βYt-1 + ut,
t = 1,2,…,n
本例中Y的现期值与它自身的一期滞后值相联系,
即依赖于它的过去值。一般情况可能是:
Yt = f (Yt-1, Yt-2, … , X2t, X3t, … )
即Y的现期值依赖于它自身若干期的滞后值,还依赖
于其它解释变量。
在本例中,滞后的因变量(内生变量)作为解释变
量出现在方程的右端。这种包含了内生变量滞后项
的模型称为自回归模型。
动态经济模型
我们上面列举了模型中包含滞后经济变量的两种
情况。第一种是仅包含滞后外生变量的模型,第二
种是包含滞后内生变量的模型。在两种情况下,都
通过一种滞后结构将时间维引入了模型,即实现了
动态过程的构模。
第二节 分布滞后模型的估计
我们在上一节引入了分布滞后模型:
Yt =α+β0Xt +β1Xt-1 +……+βsXt-s + ut
(1)
在这类模型中,由于在X和它的若干期滞后之间
往往存在数据的高度相关,从而导致严重多重共线
性问题。因此,分布滞后模型极少按(1)式这样的
一般形式被估计。通常采用对模型各系数βj施加某
种先验的约束条件的方法来减少待估计的独立参数
的数目,从而解决多重共线性问题。这方面最著名
的两种方法是科克(Koyck)方法和阿尔蒙(Almon)方
法。
一、科克分布滞后模型
科克方法简单地假定解释变量的各滞后值的系数
(有时称为权数)按几何级数递减,即:
Yt     X t    X t 1    X t  2  ......  u t
2
(2)
t  1, 2, ..., n
其中
0<λ<1
这实际上是假设无限滞后分布,由于0<λ<1,X
的逐次滞后值对Y的影响是逐渐递减的。
(2)式中仅有三个参数:α、β和λ。但直接估
计(2)式是不可行的。这是因为,首先,估计无
限多个系数不可行。其次,从回归结果中很可能得
不到β和λ的唯一估计值。
估计科克模型的方法
幸运的是,我们有同时解决上述两方面问题的方
法。它们是:
• 非线性最小二乘法
• 科克变换法
非线性最小二乘法
非线性最小二乘法实际上是一种格点搜索法。
首先定义λ的范围(如0-1),指定一个步长(如
0.01 ) , 然 后 每 次 增 加 一 个 步 长 , 依 次 考 虑
0.01,0.02,……0.99。步长越小,结果精确度越高,
当然计算的时间也越长。由于目前计算机速度已不
是个问题,你可以很容易达到你所要求的精度。
非线性最小二乘法步骤
(1) 对于λ的每个值,计算
Zt=Xt+λXt-1+λ2Xt-2+…+λPXt-P
(3)
P的选择准则是,λP充分小,使得X的P阶以后
滞后值对Z无显著影响。
(2)然后回归下面的方程:
Yt =α+βZt + ut
(4)
(3) 对λ的所有取值重复执行上述步骤,选择回归
上述(4)式时产生最高的R2的λ值,则与此λ值相
对应的α和β的估计值即为该回归所得到的估计值。
科克变换法
回到科克模型:
Yt     X t    X t 1    X t  2  ......  u t
2
(2)
t  1, 2, ..., n
第二种方法是采用科克变换,(2)式两端取一期
滞后,得:
Yt-1 =α+βXt-1 +βλXt-2 +βλ2Xt-3 +…+ ut-1
两端乘以λ,得:
λYt-1 =λα+βλXt-1+βλ2Xt-2 +βλ3Xt-3 +…+λut-1 (5)
(2)-(5),得
Yt-λYt-1 =α(1-λ)+βXt + ut-λut-1
(6)
所有的X滞后项都消掉了,因此
Yt =α(1-λ)+βXt + λYt-1 + ut-λut-1
(7)
(7)式称为自回归模型,因为因变量的滞后作为
解释变量出现在方程右边。这一形式使得我们可以
很容易分析该模型的短期和长期动态特性(短期乘
数和长期乘数)。
短期乘数和长期乘数
在短期内(即期),Yt-1可以认为是固定的,X的变动
对Y的影响为β(短期乘数为β)。从长期看,在忽略
扰动项的情况下,如果Xt趋向于某一均衡水平 X , 则Yt和
Yt-1也将趋向于某一均衡水平 Y ,
Y   (1   )   X   Y
这意味着
Y  
(8)

1 
X
(9)
因此,X对Y的长期影响(长期乘数)为β/(1-λ),若
λ位于0和1之间,则β/(1-λ)>β,即长期影响大
于短期影响。
从实践的观点来看,科克变换模型很有吸引力,
一个OLS回归就可得到α、β和λ的估计值。这显
然比前面介绍的格点搜索法要省时很多,大大简化
了计算。
可是,科克变换后模型的扰动项为 ut-λut-1 ,
这带来了自相关问题(这种扰动项称为一阶移动平
均扰动项)。并且,解释变量中包含了Yt-1 ,它是
一个随机变量,从而使得高斯—马尔柯夫定理的解
释变量非随机的条件不成立。此问题的存在使得
OLS估计量是一个有偏和不一致估计量。这可以说
是按下葫芦起了瓢。我们将在第四节中讨论科克模
型的估计问题。
第三节 部分调整模型和适应预期模型
有两个著名的动态经济模型,它们最终可化成与
上一节(2)式相同的几何分布滞后形式,因此都
是科克类型的模型。它们是:
•
部分调整模型
(Partial adjustment model, PDM)
•
适应预期模型
(Adaptive expectations model, AEM)
一、部分调整模型
在部分调整模型中,假设行为方程决定的是因变
量的理想值(desired value)或均衡值Yt* ,而不
是其实际值Yt:
Yt* =α+βXt+ut
(1)
由于Yt*不能直接观测,因而采用 “部分调整假
说” 确定之,即假定因变量的实际变动(Yt–Yt* –Y
),与其理想值和前期值之间的差异(Y
1
t
t-1 )
成正比:
Yt – Yt-1=δ(Yt* - Yt-1)
(2)
0≤δ≤1,
δ称为调整系数。
(2)式
Yt – Yt-1=δ(Yt* - Yt-1)
(2)
可改写为:
Yt =δYt* +(1-δ) Yt-1
(3)
从(3)式可看出,Yt是现期理想值和前期实际值
的加权平均 。δ的值越高,调整过程越快。如果
δ=1,则Yt=Yt*,在一期内实现全调整。若δ=0,则
根本不作调整。
(1)式
Yt* =α+βXt+ut 代入(3)式
Yt =δYt* +(1-δ) Yt-1 ,得到
Yt=αδ+βδXt+(1-δ)Yt-1+δut
(4)
用此模型可估计出α、β和δ的值。
与科克模型类似,这里也存在解释变量为随机变
量的问题(Yt-1).区别是科克模型中,Yt-1与扰动项
(ut-λut-1)同期相关,而部分调整模型不存在同期
相关。在这种情况下,用OLS法估计,得到的参数估
计量是一个一致的估计量。
不难看出,(4)式
Yt=αδ+βδXt+(1-δ)Yt-1+δut
(4)
与变换后的科克模型的形式相似,我们也不难通过对
(4)式中Yt-1进行一系列的置换化为几何分布滞后的
形式:
(4)式两端取一期滞后,得
Yt 1       X t 1  (1   )Yt  2   u t 1
(5)
将此式代入(4)式,得到(为简单起见,省略扰动
项):
Yt    [1  (1   )]    X t  (1   )   X t 1  (1   ) Yt  2
2
我们可以用同样的方法置换Yt-2,以及随后的Yt-3,
Yt-4,…,直至无穷,结果是将Yt表示为X的当前值和滞
后值的一个滞后结构,系数为科克形式的几何递减权
数,具体形式为:
Yt     [ X t  (1   ) X t 1  (1   ) X t  2  ......]   t
2
其中
 t   u t   (1   ) u t 1   (1   ) u t  2  ......
2
令λ=1-δ,β’=βδ,则得
2
Yt       X t   X t 1   X t  2  ...    t
与上节(2)式形式完全一样。
(6)
例
林特纳(lintner)的股息调整模型
J.Lintner建立的股息调整模型是应用部分调整模
型的一个著名实例。
在对公司股息行为的研究中,Lintner发现,所有
股份公司都将其税后利润的一部分以股息的形式分配
给股东,其余部分则用作投资。
当利润增加时,股息一般也增加,但通常不会将增
加的利润都用作股息分配,这是因为:
(1)利润的增加可能是暂时的;
(2)可能有很好的投资机会。
为了建立一个描述这种行为的模型,Lintner假设各
公司有一个长期的目标派息率γ,理想的股息Dt*与现
期利润Πt有关,其关系为
Dt*=γΠt
而实际股息服从部分调整机制
 D t   ( D t  D t 1 )  U t
*
其中Ut为扰动项。因此
D t  D t 1   ( D  D t 1 )  U t
*
t
   t   D t 1  U t
即
D t    t  (1   ) D t 1  U t
使用美国公司部门1918—1941年数据,得到如下回
归结果:
Dˆ t  352 . 3  0 . 15  t  0 . 70 D t 1
各系数在1%显著水平下都显著异于0。
从回归结果可知,(1-λ)的估计值为0.70,因而
调整系数λ的估计值为0.30,即调整速度为0.30。由
于Πt的系数是γλ的估计值,除以0.30,则得到长
期派息率(γ)的估计值为0.50。
.
二、适应预期模型
1、在模型中考虑预期的重要性
预期(expectation)的构模往往是应用经济学家
最重要和最困难的任务,在宏观经济学中更是如此。
投资、储蓄等都是对有关未来的预期很敏感的。如
果政府实施一项扩张政策,这将影响工商界人士有
关未来经济总状况的预期,特别是关于盈利能力的
预期,因而影响他们的投资计划。
例如,如果存在很可观的失业,则政府支出增加
被认为是有益的,并将刺激投资。另一方面,如果
经济正接近充分就业,则政府的扩张政策被认为将
导致通货膨胀,结果是工商界的信心受挫,投资下
降。
2、适应预期模型
由上所述,可知在模型中考虑预期的重要性。不
幸的是,在宏观经济领域,不存在令人满意的直接
计量预期的方法。作为一种权宜之计,某些模型使
用一种称为适应预期过程的间接方法。
适应预期过程是一种简单的学习过程,其机制是,
在每一时期中,将所涉及变量的当前观测值与以前
所预期的值相比较,如果实际观测值大,则将预期
值向上调整,如果实际观测值小,则预期值向下调
整。调整的幅度是其预测误差的一个分数,即:
X X
e
t
e
t 1
  (Xt  X
e
t 1
)
0   1
(8)
(8)式可写成
X   X t  (1   ) X
e
t
e
t 1
0   1
(9)
上式表明,X的预期值是其当前实际值和先前预期
值的加权平均。γ的值越大,预期值向X的实际发
生值调整的速度越快。
适应预期和部分调整之间当然有很多明显的类
似之处,可是从适应预期模型的最初形式导出仅
包含可观测变量的模型(可操作模型)不象在部
分调整模型的情况那么简单。
假设你认为因变量Yt与某个变量X的预期值Xte有关,
则可写出模型
Yt     X t  u t
e
(10 )
若假定Xte 用适应预期机制确定,这就是一个适应
预期模型,其中解释变量Xte是不可观测的,必须用可
观测变量取代之。
我们用“降阶”法来解决这个问题。如果(9)式
成立,则对于t-1期,它也成立,即:
X
e
t 1
  X t 1  (1   ) X
e
t2
(11 )
将(11)式
代入(9)式
X
e
t 1
  X t 1  (1   ) X
e
t2
X t   X t  (1   ) X t 1 ,得
e
e
X t   X t   (1   ) X t 1  (1   ) X t  2
e
2
e
我们可以用类似的方法,消掉(12)式中的 X
这一过程可无限重复下去,最后得到:
X t   [ X t  (1   ) X t 1  (1   ) X t  2  ...]
e
2
(12 )
e
t2
,
(13 )
将(13)式 X te   [ X t  (1   ) X t 1  (1   ) 2 X t  2  ...]
代入(10)式
Yt     X  u t ,得
e
t
Yt      [ X t  (1   ) X t 1  (1   ) X t  2  ...]  u t
2
(14)
不难看出,此式与上节中科克分布(2)的形式相
同。该模型的参数可用上一节介绍的非线性方法估
计。对(14)式施加科克变换,将简化模型的数学
形式,但由于与科克模型同样的理由,不宜直接用
OLS法估计。施加科克变换的适应预期模型为:
Yt     X t  (1   )Yt 1  ( u t  (1   ) u t 1 )
3、例子:Friedman的持久收入假说
1957年,弗里德曼对传统消费函数提出批评,
提出了自己的消费模型。在他的模型中,第i个消
费 者 在 第 t 期 的 消 费 与 持 久 性 收 入 ( permanent
income)YitP 有关,而不是与当期的收入Yit 有关。
持久性收入是一种长期收入概念,它表示在考虑了
各种可能的波动的情况下,某人大体上可以依靠的
收入。
持久收入是根据最近的经验和有关未来的预期而
主观决定的,由于是主观的,因而无法直接计量。任
何一年中的实际收入可能高于或低于持久收入,取决
于该年中的特别因素。实际收入和持久收入之差称为
暂时性收入 (transitory income),记为YitT ,
我们有:
Y it  Y it  Y
p
T
it
(15 )
他以同样方式区分了持久性消费、实际消费和暂
时性消费的概念。持久性消费是与持久性收入的水
平相对应的消费水平。实际消费可能与持久消费有
差异,原因是出现了某些特殊的未预料到的情况
(如未预料到的医疗费用),或者是冲动性购买的
结果。二者之差称为暂时性消费,记为CitT:
C it  C it  C it
p
T
(16 )
YitT和CitT被假定为具有0均值和常数方差的随机
变量,它们相互独立,且与YitP和CitP无关。
弗里德曼进一步假定持久消费与持久收入成正比:
C
P
it
 Y
P
it
(17 )
上式中持久收入YitP不可观测,为解决这一问题,
弗里德曼假设持久收入遵从适应预期过程,也就是说
,如果某人的现期收入高于(或低于)其先前的持久
收入概念,则他将增加(或减少)后者,增加(或减
少)的幅度是二者之差乘以λ:
Y
P
it
  (Y it  Y
P
it 1
)
(18 )
λ一般位于0和1之间。因此人们在实际收入增加时
将调整他们的持久收入概念,但不会做全额调整,
这是因为认识到实际收入的变动或许有一部分是由
于收入的暂时分量变动的结果。
(18)式可改写为:
Y it  Y it 1   (Y it  Y it 1 )
P
即
Y
P
it
P
  Y it  (1   )Y
P
P
it  1
(19 )
( 20 )
此式表明,在第t年,消费者将持久收入估计为
实际收入和以前的持久性收入概念的加权平均。
如果λ接近于1,则该消费者将绝大部分权重给了
实际收入,YP 迅速向Y调整,若λ接近0,则很小
部分权重给了实际收入,调整过程将很缓慢。
将(17)式
C
P
it
 Y
P
it
(17 )
代入(16)式
C it  C
我们有:
p
it
C it   Y
C
P
it
T
it
C
(16 )
T
it
( 21 )
至此,我们得到了实际消费和持久收入之间的关系
式,即消费函数的弗里德曼模型。式中CitT起着扰动
项的作用。
为了估计这个模型,弗里德曼用(20)式(适应
预期机制)将持久收入表示成实际收入的现期值和
各期滞后值:
Y
P
it
  Y it  (1   )Y
P
it  1
  Y it   (1   )Y it 1  (1   ) Y
2
P
it  2
 
  Y it   (1   )Y it 1   (1   ) Y it  2   (1   ) Y it  3    
2
3
( 22 )
若0<λ<1,这就是一个合理的假设,现期收入的权数
最大,上一年次之,随着时间往回推,影响逐年衰减
。最后,权数变得非常之小,使得无需考虑该年之前
那些过去值。
弗里德曼采用的估计方法是我们前面介绍过的非
线性方法,即首先试位于0和1区间内的大量λ值,
为每个λ值计算相应的持久收入时间序列,然后用
消费对每个持久收入数据集回归,根据R2选出最佳
λ值。
为了与传统消费函数相比较,弗里德曼用美国
1905—1951(战争期间除外)的人均实际消费和人
均可支配收入数据进行了回归。在格点搜索计算中,
他将持久收入计算为现期收入和16个滞后收入项的
加权平均值,λ的最优值为0.37,得到消费函数中
β的估计值为0.88。
第四节 自回归模型的估计
上两节中,我们讨论了下列三个模型:
科克模型
Yt   (1   )   X t   Yt 1  ( u t   u t 1 )
(1)
部分调整模型
Yt     X t  (1   )Yt 1   u t
(2)
适应预期模型
Yt     X t  (1   )Yt 1  ( u t  (1   ) u t 1 )
(3)
这三个模型具有一种共同的形式,即:
Y t   0   1 X t   2 Y t 1  V t
(4)
这种解释变量中包括因变量的滞后值的模型称为
自回归模型。由于在解释变量中包含了因变量的滞
后值,我们就可以动态地考察该变量在若干周期中的
变动,因此称为动态模型。
在自回归模型(4)中,由于随机解释变量的存
在和序列相关的可能性这双重原因,OLS法不能直
接应用,因此我们必须研究这类模型的估计问题。
一、自回归模型的估计问题
OLS法的应用,要求解释变量Xt为非随机的。在自
回归模型中,由于Yt-1作为解释变量,这一条件已无
法满足,这是因为,由于
Y t   0   1 X t   2 Y t 1  V t
因此:
Y t 1   0   1 X t 1   2 Y t  2  V t 1
这表明,Yt-1 是随着随机扰动项Vt-1 的变动而变
动的,即Yt-1部分地由Vt-1决定,因而Yt-1是随机变量。
1. 解释变量为随机变量时OLS估计量的统计性质
由第五章,当X为非随机量这一条不满足时
(1)若每一个Xt都独立于所有的扰动项ut,即
cov(Xs,ut)=0, s=1,2,…,n t=1,2,…n
则OLS估计量仍为无偏估计量。
(2)若解释变量Xt独立于相应的扰动因素ut,即随
机解释变量与扰动项同期无关 :
Cov(Xt,ut)=0, t=1,2,…,n
则OLS估计量为一致估计量。
(3)若上述两条均不满足,则OLS估计量既是有偏
的,又是不一致的。
2、自回归模型的估计问题
在自回归模型的情况下,第(1)条已无法满足,因
为Yt-1显然可以表示为Vt-1,Vt-2,…,V1等的函数,因而依
赖于Vt-1和所有早期的扰动因子。
现在让我们来看是否有可能满足解释变量与扰动项
同期无关的条件,从而得到一个一致的估计量。
在自回归模型(4)的情况下:
Yt   0   1 X t   2Yt 1  V t
也就是要求Yt-1独立于Vt,或
Cov(Yt-1,Vt)=0
不难看出,只要扰动项Vt是序列独立的(即自回
归模型(4)的各期扰动项相互独立),我们就可以
假定Yt-1独立于所有未来的扰动因子(包括Vt),在
这种假定下,Yt-1与Vt无关,我们对(4)式应用OLS
得到的参数估计量是一致估计量。
让我们回到本节开始时列出的三个模型,看看我们
关于Yt-1独立于所有未来的扰动因子,特别是Yt-1与Vt
无关的假定是否能成立。
在科克模型和适应预期模型中,扰动因子序列独立
的条件不成立,以科克模型为例,扰动项
Vt = ut-λut-1
假定ut满足标准假设条件,则容易证明
E (V tV t 1 )  E [( u t   u t 1 )( u t 1   u t  2 )]
 E [ u t u t 1   u t u t  2   u



  
2
2
该式非0,即Vt序列相关。
2
t 1
  u t 1u t  2 ]
2
我们还不难证明
Cov (Yt 1 , V t )  Cov [Yt 1 , ( u t   u t 1 )]
  
2
即Yt-1与Vt相关。适应预期模型的情况与此类似。
因此,对于科克模型和适应预期模型,应用OLS
法不仅得不到无偏估计量,而且也得不到一致估计
量。也就是说,即使样本容量无限增大,参数估计
量也不趋向于其总体值。因此,不宜采用OLS法估计
上述两种模型。
但是,部分调整模型不同,在该模型中,
Vt=δut ,若ut 满足标准假设条件,则Vt 也满足。因
此,可用OLS法直接估计部分调整模型,将产生一致
估计值。
综上所述,OLS法可用于部分调整模型的估计,并
提供一致的估计值。而科克模型和适应预期模型,则
由于其扰动项存在序列相关,用OLS进行估计得到的
估计量既是有偏的,也是不一致的。
二、工具变量法(IV法,Instrumental Variable)
OLS法不能应用于科克模型和适应预期模型的原
因是解释变量Yt-1 与扰动项Vt 相关,如果这种相关
能够被消除的话,我们就可以用OLS得到一致估计
值。如何实现这一点呢?利维顿(Liviatan)提出
的工具变量法是一种解决方法。
工具变量法的基本思路是当扰动项u与解释变量X
相关时,设法找到另一个变量Z,Z与X高度相关,而
与扰动项u不相关,在模型中,用Z替换X,然后用
OLS法估计,变量Z称为工具变量。
只要工具变量的选取能够保证Z与X高度相关,而与
u不相关,则我们得到的将是一致估计量。Z与X的相
关程度越高,这种替代的效果就越好。我们下面回到
科克模型和适应预期模型,研究工具变量的选取。
我们的模型为
Y t   0   1 X t   2 Y t 1  V t
这里X是唯一的外生变量,而Y的行为部分地依赖
于X的行为,Yt-1的取值部分地取决于Xt-1的数值。因
此,这里Xt-1就是一个比较理想的工具变量,即用滞
后外生变量作为滞后内生变量的工具:
Zt=Xt-1 ,
t=1,2,…,n
来估计
Yt   0   1 X t   2 Z t  V t
t  1, 2 ,..., n
在实践中,自回归模型还可以用极大似然法估计,
得到的估计量是一致估计量。
当然,对于本节所涉及的三种模型,由于它们都
是几何滞后模型,因而都可以用前面介绍的非线性
方法进行估计,该方法尽管费时,但没有估计问题。
第五节 阿尔蒙多项式分布滞后
(Almon Polynomial Distributed Lags)
科克分布假定滞后解释变量的系数按几何级数
递减。对于很多应用问题来说,这是一种令人满
意的近似,但对于另一些应用问题,这种假设就
未必符合现实情况。例如,在某些情况下较现实
的假设是,因变量对解释变量变动的响应是,开
始小,然后随时间变大,尔后再次衰减,如下图
所示。
t
滞后的权数
阿尔蒙滞后分布的基本假设
阿尔蒙滞后分布为这类行为的构模提供了灵活
的选择,同时使待估计的参数数目大大减少。
基本假设是,如果Y依赖于X的现期值和若干期
滞后值,则权数由一个多项式分布给出。由于这个
原因,阿尔蒙滞后也称为多项式分布滞后。最简单
的例子是二次和三次多项式的情况,如下图所示:
图2
二次函数
图3 三次函数
一般情况下,在分布滞后模型
Yt     0 X t   1 X t 1       m X t  m  u t
中,假定:
 i  a 0  a1i  a 2 i      a p i
2
p
其中p为多项式的阶数,如图2中p=2,图3中p=3。
也就是用一个p阶多项式来拟合分布滞后,该多项
式曲线通过滞后分布的所有点。
由用户选择最大滞后周期m和多项式阶数p。
例:若你根据一实际问题设定下面的模型:
Yt     0 X t   1 X t 1   2 X t  2   3 X t  3   4 X t  4  u t
(1)
这表明,你所选择的最大滞后周期m=4,模型中共
有6个参数。若决定用二次式进行拟合,即p=2,则
 i  a 0  a1i  a 2 i
2
我们有:
 0  a0
 1  a 0  a1  a 2
 2  a 0  2 a1  4 a 2
 3  a 0  3a1  9 a 2
 4  a 0  4 a 1  16 a 2
代入原模型,得
Y t     0 X t   1 X t 1   2 X t  2   3 X t  3   4 X t  4  u t
4
 

i
X t i  u t
i0
4
 
 (a
 a1i  a 2 i ) X t  i  u t
2
0
i0
4
4
   a 0  X t  i  a1  iX
i0
令:
i0
4
 a 2  i X t i  u t
2
t i
i0
Z0t=∑Xt-i, Z1t=∑iXt-i, Z2t=∑i2Xt-i
显然,Z0t,Z1t和Z2t可以从现有观测数据中得出,
使得我们可用OLS法估计下式:
Yt    a 0 Z 0 t  a1 Z 1 t  a 2 Z 2 t  u t
(2)
(2)式中有4个参数,比(1)式的6个少了两个,
估计出, a0,a1,a2 的值之后,我们可以转换为βi的
估计值,公式为:
ˆ
i
 aˆ 0  aˆ 1 i  aˆ 2 i
2
应用阿尔蒙滞后的关键在于如何选择最大滞后周期
m和多项式的阶数P。
在实践中,人们期望m尽量小一些,如果有10年的
数据,通常滞后取二至三期。
对于P,我们可直接由(2)式用t检验法检验 H0:
aP = 0,如果接受原假设,我们就可以去掉aP,然后用
(P-1)阶来估计(2)式,如果H0: aP = 0被拒绝,
我们可以试(p+1)阶,并检验 H0: aP+1= 0,等等。
一般说来,采用高阶多项式,拟合效果要好一些,
但出现多重共线性问题的可能性要比二阶、三阶多项
式大。一般情况下,三次多项式是一个不错的选择。
*第六节 格兰杰因果关系检验
(Granger Causality Test)
相关并不意味着必定存在因果关系。然而,许多经济
变量之间存在单向或双向的影响关系。例如,宏观经
济学经常会问到的一个问题是:是GDP“引起”货币供
给M,还是货币供给M “引起” GDP?
格兰杰因果关系检验法要检验的就是这类的因果关
系是否存在,比如说,X是否为Y的因?检验思路是,
用当前的Y对Y的若干期滞后及X的若干期滞后回归,
然后检验X的这些滞后变量作为一个整体是否改善了回
归结果,如果回答是肯定的,则X被称为Y的格兰杰原
因 (X Granger causes Y)。
值得注意得是,这种因果关系往往是双向的, X
是Y的格兰杰原因,Y又是X的格兰杰原因。
格兰杰因果关系检验要求进行以下两个回归:
m
Yt 

m
i
X t i 
i 1
 Y
i
i 1
i
t i
 u 1t
(1)
i 1
m
Xt 
Y
m
t i


i 1
下面分四种情形讨论:
i
X t i  u 2t
(2)
1. 如果(1)式中诸X滞后项的系数整体统计上异于0,
而(2)式中诸Y滞后项的系数整体统计上为0,则
表明有从X到Y的单向因果关系;
2. 如果(2)式中诸Y滞后项的系数集统计上异于0,
而(1)式中诸X滞后项的系数集统计上为0,则表
明有从Y到X的单向因果关系;
3. 如果X和Y的滞后项的系数集在两个回归中都是统
计上异于0的,则表明存在X与Y的双向因果关系;
4. 如果X和Y的滞后项的系数集在两个回归中都是统
计上为0,则表明X和Y之间不存在因果关系。
格兰杰因果关系检验的具体做法与我们在第四章
中介绍的涉及多个系数的联合假设检验类似,即首先
进行约束回归和无约束回归,然后用得到的两个残差
平方和计算F检验量,进行检验。
例如,假设我们要检验X是不是Y的格兰杰原因。
原假设H0:X不是Y的格兰杰原因
备择假设Ha: X是Y的格兰杰原因
事实上,我们要检验的原假设就是:
H 0 :  1   2  ......   m  0
要检验原假设是否成立,我们分别做包含与不包含
X滞后项的回归(无约束回归与约束回归),记前者
的残差平方和为RSSU,后者的残差平方和为RSSUR,
计算F统计量:
F 
( R SS U R  R SS U ) / m
R SS U /( N  k )
式中,m为X的滞后项的个数,n为观测值个数,k
为无约束回归中待估计参数的个数。
如果计算的F值大于给定的显著性水平α下的F
临界值Fα(m, n-k),则拒绝原假设,认为X是Y的格
兰杰原因。