时间序列分析

Download Report

Transcript 时间序列分析

时间序列分析
西安交通大学经济与金融学院统计系
赵春艳
本课程内容体系:
第一章:平稳时间序列分析导论
第二章:平稳时间序列分析的基础知识
第三章:平稳时间序列模型的建立
第四章:协整理论导论
第五章:单位根过程
第六章:单位根过程的假设检验
第七章:协整理论
参考书目:
1、陆懋祖,高等时间序列经济计量学,上海人民出版
社,1999年版;
2、王振龙主编,时间序列分析,中国统计出版社,
2000;
3、王耀东等编,经济时间序列分析,上海财经大学出
版社,1996;
4、马薇,协整理论与应用,南开大学出版社,2004;
5、王少平,宏观计量的若干前沿理论与应用,南开大
学出版社,2003。
第一章
平稳时间序列分析导论
一、时间序列
1、含义:指被观察到的依时间为序排列的数
据序列。
2、特点:
(1)现实的、真实的一组数据,而不是数
理统计中做实验得到的。既然是真实的,它
就是反映某一现象的统计指标,因而,时间
序列背后是某一现象的变化规律。
(2)动态数据。
二、时间序列分析
1、 时间序列分析:是一种根据动态数据揭示
系统动态结构和规律的统计方法。其基本思
想:根据系统的有限长度的运行记录(观察
数据),建立能够比较精确地反映序列中所
包含的动态依存关系的数学模型,并借以对
系统的未来进行预报(王振龙)
2、计量经济学中的建模方法和思想
3、理论依据:尽管影响现象发展的因素无法探
求,但其结果之间却存在着一定的联系,可
以用相应的模型表示出来,尤其在随机性现
象中。
三、确定性时间序列分析与随机性时间序列分
析
时间序列依据其特征,有以下几种表现形式,
并产生与之相适应的分析方法:
(1)长期趋势变化
受某种基本因素的影响,数据依时间变化时
表现为一种确定倾向,它按某种规则稳步地
增长或下降。
使用的分析方法有:移动平均法、指数平滑
法、模型拟和法等;
(2)季节性周期变化
受季节更替等因素影响,序列依一固
定周期规则性的变化,又称商业循环。
采用的方法:季节指数;
(3)循环变化
周期不固定的波动变化。
(4)随机性变化
由许多不确定因素引起的序列变化。它所使用的分析
方法就是我们要讲的时间序列分析。
确定性变化分析
趋势变化分析
周期变化分析
循环变化分析
时间序列分析
随机性变化分析 AR、MA、ARMA模型
四、发展历史
1、时间序列分析奠基人:
20世纪40年代分别由Norbort Wiener
和Andrei Kolemogoner 独立给出的,他
们对发展时间序列的参数模型拟和和推
断过程作出了贡献,提供了与此相关的
重要文献,促进了时间序列分析在工程
领域的应用。
2、时间序列分析在经济领域的应用
20世纪70年代,G.P.Box 和G.M.Jenkins发表专
著《时间序列分析:预测和控制》,使时间
序列分析的应用成为可能。
3、现代时间序列分析的发展趋势
(1)单位根检验(2)协整检验
2003年度诺贝尔经济学奖的获得者是美国经济
学家罗伯特.恩格尔和英国经济学家克莱夫.格
兰杰。
获奖原因:“今年的获得者发明了处理许多经
济时间序列两个关键特性的统计方法:时间
变化的变更率和非平稳性。”两人是时间序
列经济学的奠基人。
时间变化的变更率指方差随时间变化而变化的
频率,这主要是指恩格尔在1982年发表的条
件异方差模型(ARCH),最初主要用于研
究英国的通货膨胀问题,后来广泛用作金融
分析的高级工具;
传统的计量经济学研究中,通常假定经济数据
和产生这些数据的随机过程是平稳的。格兰
杰的贡献主要是在非平稳过程假定下所进行
的严格计量模型的建立。(协整检验)
第二章
平稳时间序列分析的基础知识
第一节
随机序列
一、随机过程
1、定义:
在数学上,随机过程被定义为一组随机变量,
即,zt , t  T 
其中,T表示时间t的变动范围,对每个固定的时刻 t
而言,Zt是一随机变量,这些随机变量的全体就构成
一个随机过程。
2、特征
(1)随机过程是随机变量的集合
(2)构成随机过程的随机变量是随时间产生
的,在任意时刻,总有随机变量与之相对
应。
二、随机序列(时间序列)
1、当 t  0,1,2,...
时,即时刻t只取整数时,随机过程 zt , t  T 
可写成 zt , t  0,1,2,...
此类随机过程 称为随机序列,也成时间序列。
可见
(1)随机序列是随机过程的一种,是将连续时
间的随机过程等间隔采样后得到的序列;
(2)随机序列也是随机变量的集合,只是与这
些随机变量联系的时间不是连续的、而是离
散的。
三、时间序列的分布、均值、协方差 函数
1、分布函数
(1)一维分布函数:随机序列中每个随机变量的分
布函数.
F1(z) ,F2(z) ,…, Ft-1(z) , Ft(z)
(2)二维分布函数:随机序列中任意两个随机变量
的联合分布函数
Fi,j(zi,zj).i,j=…,-2,-1,0,1,2,…
(3)柯尔莫哥洛夫定理与有限维概率分布
柯尔莫哥洛夫定理表明,一个随机序列的特征,可
以用它的有限维分布表示出来。
2、均值函数
对随机序列中的任一随机变量取期望。
ut  Ezt   zt dFt ( z )   zt f t ( z )dz
当t取遍所有可能整数时,就形成了离散时间的函数ut
称ut 为时间序列的均值函数。
3、自协方差函数和自相关函数
r (t , s )  E[( zt  ut )( z s  us )] 
 ( z
r ( t , t )  E ( z t  ut ) 2  D ( z t )
r ( s, s )  E ( z s  u s ) 2  D ( z s )
t
ut )( z s  us )dFt ,s ( zt , z s )
自相关函数:
 (t , s ) 
r (t , s )
r ( t , t ) r ( s, s )
当t,s取遍所有可能的整数时,就形成了时间序
列的自相关函数,它描述了序列的自相关结
构。它的本质等同于相关系数。
第二节 平稳时间序列
一、平稳时间序列
1、定义:时间序列{zt}是平稳的。如果{zt}有有
穷的二阶中心矩,而且满足:
(1)ut= Ezt =c;
(2)r(t,s) = E[(zt-c)(zs-c)] = r(t-s,0)
则称{zt}是平稳的。
含义:
a有穷二阶矩意味着期望和自协方差存在;
b平稳时间序列任意时刻所对应的随机变量的均值相
等;
c自协方差函数只与时间间隔有关,而与时间起点无
关。
二、平稳时间序列的均值、自协方差和自相关
函数
1、均值函数:平稳时间序列均值为常数,为分
析方便,假定E zt=0,当均值不为零时,给每
个值减去均值后再求均值,即等于0。
2、自协方差函数:平稳时间序列的自协方差
仅与时间间隔有关,而与具体时刻无关,所
以,自协方差函数仅表明时间间隔即可。
rk  E[(Z t  EZt )(Z t  k  EZt  k )]
 EZt Z t  k ( EZt  0)
r0  E ( Z t  EZt )  EZ  DZt
2
2
t
3、自相关函数ρk
 (t , s) 
r (t , s)

r (t , t ) r ( s, s)
rk
r0
rk
  k
r0 r0
平稳时间序列自协方差仅与时间隔有关,当
间隔为 零时,自协方差应相等:
4、自协方差与自相关函数的性质
(1) rk=r-k ρk= ρ-k
k、-k仅是时间先后
顺序上的差异,它们代表的间隔是相同的。
(2)
rk
  1,  1  rk  r0
r0
三、偏自相关函数(PACF)
1、偏自相关函数用来考察扣除zt 和zt+k之间
zt+1 , zt+2,…, zt+k-1影响之后的zt 和zt+k之间
的相关性。
2、偏自相关函数的定义
设{zt}为零均值平稳序列, zt+1 , zt+2,…, zt+k-1对zt
和zt+k 的线性估计为:
zˆt  1zt 1   2 zt  2     k 1zt  k 1
zˆt  k  1zt 1   2 zt  2     k 1zt  k 1
φkk表示偏自相关函数,则:
cov[(zt  zˆt ), ( zt k  zˆt k )
kk 
var(zt  zˆt ) var(zt k  zˆt k )
3、PACF的涵义
设有zt+1,zt+2,zt+3
zt 3  1zt  2  at
zˆt 3  1zt  2
cov[zt 1, ( zt 3  zˆt 3 )]  cov(zt 1,at )
4、pacf的推导
11  1
k
k
j 1
j 1
 k 1, k 1  (  k 1    k 1 j kj )(1    j kj ) 1
 k 1, j   kj   k 1, k 1 k , k 1 j , j  1,2,...,k
 2  111
11  1 ,  22 
,  21  11   22
1  111
 3   2 21  1 22
 33 
1  1 21   2 22
11
四、 随机序列的特征描述
(1)样本均值
1 n
z   zt  c
n t 1
(2)样本自协方差函数
rk
rk
r0
rk
rk
1 nk
  ( zt  z )(zt  k  z )或
n t 1
1 nk

( zt  z )(zt  k  z )

n  k t 1
1 n
2
  ( zt  z )
n t 1
 E ( zt  Ezt )(zt  k  Ezt  k )
  ( zt  Ezt )(zt  k  Ezt  k )( zt zt  k )dzt dzt  k
(3)样本自相关函数
rk
k  
r0
 ( z  z )(z
 ( z  z)
t k
t
t
2
 z)
(4)样本偏自相关函数
11  1
k
k
j 1
j 1
 k 1,k 1  (  k 1    k 1 j kj )(1    j kj )
 k 1, j   kj   k 1,k 1 k ,k 1 j , j  1,2,...,k
1
例1、设动态数据16,12,15,10,9,17,
11,16,10,14,求样本均值、样本自相关
函数(SACF)和偏自相关函数(SPACF)
(各求前三项)
1
(1) z   zt  13
10
1
( z  z )(zt 1  z )
r1 n  t
(2) 1  
 0.53
1
r0
2
(
z

z
)
 t
n
r2
 2   0.24
r0
r3
 3   0.218
r0
(16  13)(12  13)  (12  13)(15  13)    (10  13)(14  13)
1 
(16  13) 2  (12  13) 2    (14  13) 2


(3)11  1  0.53
 2  111
 22 
 0.057
1  111
3   2 21  1 22
33 
 0.169
1  1 21   2 22
 21  11   2211  0.560
第三节 线性平稳时间序列模型
一、自回归过程(A R (p))
1、
形如zt  1 zt 1   2 zt 2  ...   p zt  p  at , 且满足:
(1){at }为白噪声序列;
(2) p  0, 且Ezt as  0, t  s; Ezt at   2
(3) p ( B)  0的根在单位圆外,即B  1,
 p ( B)  1  1 B   2 B 2  ...   p B P,B为后项算子,B P zt  zt  p
模型的简化形式为: p ( B) zt  at
2、AR(P)模型的ACF、PACF特征
以AR(1)为例
zt  1zt 1  at 或(1  1B) zt  at
(1)为满足平稳性,
 ( B) (1  1B) 0的根必须在单位圆外, 则
1
B
 1  1  1
1
(2) AR (1)的ACF
rk  E ( zt  k zt )  E (1zt 1zt  k )  E ( zt  k at )  1rk 1(k  1)
 ...  1k r0
rk
k
 k   1 ,
r0
 1  1,当k增大时,即序列之间的 间隔增大时,
 k 减小,且以指数速度减 小,这种现象称为拖尾 ,
越来越与0接近,
按照PACF 的递推公式有:
 2  111
11  1; 22 
1  111

12  12
1  12
0
 21  11   2211  1
3   2 21  1 22
33 
1  1 21   2 22

13  121  0
1  12  0
0
当k  2时, kk  0,这种现象称为截尾现 象。
例:用AR(1)过程(1  1B)(zt  10)  at , 1  0.9, 模拟产生250个观察值,
{at }为白噪声序列,利用250个观察值计算ACF、PACF如下:
k
1
2
3
k
0.88 0.76 0.67
4
5
6
0.57 0.48 0.4
7
8
0.34 0.28
9
10
0.21
0.17
kk 0.88 0.01 -0.01 0.11 0.02 -0.01 0.01 -0.02 -0.06 0.05
计算结果表明,ACF逐渐衰减,但不等于零;
PACF在k=1后,与零接近,是截尾的。
结论:ACF呈指数衰减,是拖尾的;PACF在一
步后为零,是截尾的。
二、滑动平均模型(MA(q))
1、形如zt=at-1at-1- 2at-2 -…- qat-q模型为滑动平
均模型,
其中,简化形式zt=(B)at
(B)= 1-1B- 2B2 -…- qBq,满足(B)= 0的根在单
位圆外,即‫׀‬B‫>׀‬1,此时该过程是可逆的。
2、MA模型的ACF及PACF
zt  at  1at 1  (1  1B ) at
(1)可逆性:
(1  1B )  0  B 
B  1  1  1
1
1
( 2) ACF (以MA(1)为例)
zt  at  1at 1,
两边同乘 zt  k,并取期望得:
rk  E ( zt zt  k )
 E ( at zt  k )  1E ( at 1 zt  k )

 1 a 2 ( k  1)
当k  1时, rk  

0( k  2)
当k  0时,
r0  E ( zt zt )  E ( at zt )  1E ( at 1 zt )
zt  at  1at 1 ,
两边同乘 at 1 , 取期望得:
E ( zt at 1 )
 E ( at at 1 )  1E ( at 12 )  1 a 2
代入r0中,
r0   a
2
 1 (1 a )
2
2
  a (1  1 )
2
  1
( k  1)
rk

所以,  k 
  1  12
r0
0( k  2)

 k 是截尾的。
(3)PACF
根据PACF 的递推公式有:
11  1

 1
(1  12 )
 22

 1 (1  12 )
1  14
 2  111

1  111
12
 12 (1  12 )


2
1  1
1  16

3   2 21  1 22
33 
1  1 21   2 22
3
1
3
2
 1 (1  1 )


2
8
1  2 1
1  1
2 3
1  1, 1, 1 , 1 ...顺次减小,
分母增大,分子减小,
且增大的速度大于分子
从总体上看,  kk是减小的,呈拖尾现象 。
例:用zt=(1-0.5B)at模拟产生250个观察值,at为
白噪声序列,得到序列自相关和偏自相关函
数如下:
k
1
2
3
4
5
6
7
8
9
10
ACF
-0.44
0
0.02
-0.03
-0.01
0.05
0.04
0.03
0.03
0.02
PACF
-0.44
0.24
-0.11
-0.08
-0.07
0.12
0.06
0.07
-0.1
0.08
可见,ACF在一步后截尾,PACF是拖尾的。
结论:MA(q)的ACF是截尾的,PACF是拖尾的。
三、自回归滑动平均模型(AR M A (p, q))
1、
zt  1zt 1  2 zt  2  ...   p zt  p
 at  1at 1  ...   q at  q
满足(1){at }为白噪声序列;
(2)平稳性和可逆性条件,
即 p ( B)  0和 q ( B)  0的根在单位圆外。
称为自回归滑动平均模 型。
模型的简化形式为:
 p ( B) zt   q ( B)at
其中:
 p ( B)  1  1B  2 B  ...   p B
2
 q ( B)  1  1B   2 B  ...   q B
2
q
p
2、ARMA(p,q)的ACF和PACF
以ARMA (1,1)为例:
(1  1B ) zt  (1  1B ) at
(1)为满足平稳性和可逆性 的要求,
1  1, 1  1。
(2)ACF、PACF均是拖尾的
例:(1-0.9B)zt=(1-0.5B)at模拟产生250个观察值,
ACF、PACF如下表所示:
k
1
2
3
4
5
6
7
8
9
10
acf
0.5
7
0.5
0.47
0.35
0.3
1
0.25
0.2
1
0.1
8
0.1
0.1
2
pacf 0.5
7
0.2
6
0.18
-0.03
0.0
1
0.01
0.0
1
0.0
1
0.08
0.0
5
本节介绍了三类模型的形式、特性及自相关和
偏自相关函数的特征,现绘表如下:
AR(p)
MA(q)
ARMA(p,q)
模型方程
(B)=at
zt=(B)at
(B)zt= (B) at
平稳性条件
(B)=0的根在
单位圆外
无
(B)=0的根在单位圆外
可逆性条件
无
(B)=0的根在
单位圆外
(B)=0的根在单位圆外
自相关函数
拖尾
Q步截尾
拖尾
偏自相关函数
P步截尾
拖尾
拖尾
第三章 平稳时间序列模型的建立
第一节 模型识别与定阶
一、模型识别
1、含义:对一个观察序列,选择一个与其实际
过程相吻合的模型结构。
2、方法:利用序列的acf、pacf识别。判断截
尾、拖尾的主观性较大,只是初步识别。
二、模型定阶
(一)a c f、p a c f方法
(1)M A (q):
Bartlett公式:当k>q时,N充分大,
 k的分布为渐近正态分布 N (0,

1
(1  2
N
由正态分布的3原则知,
q
l 1
N充分大时,下面的等式 近似成立:
P(  k 
q

1
或P (  k 
1 2
N
 l 2 )  6 8.3%
l 1
2
N
q

1 2
l 1
 l 2 )  9 5.4 5%
 l 2 )).
对于每一个 q,
计算ˆ q 1, ˆ q  2 ,....,ˆ q  M ,考察其中
满足P (  k 
P(  k 
2
N
q

1
1 2
N
l 2 )或
l 1
q

1 2
l 2 )
l 1
的个数是否占 M的68.3%或95.5%(M一般取 N )
(2)AR(P):
当k  p时,  kk
1
 N(0, )
N
(二)残差方差图:
(1)残差:在多元回归y=a1x1+ a2x2+….+ an x n
+at,存在自变量x的选择问题。如果x选择不够,
模型拟合不足,表现为y与ŷ 差异较大;若x
选择多,则过度拟合,y与ŷ差异减小速度很
慢。
将(y- ŷ)称为残差,多元回归就是利用此确定模
型的自变量,即新增或减少变量是否会显著
影响残差。
(2)将该思想应用到时间序列模型定阶上。
以ARMA ( p, q )为例,
zt 为序列真值, zˆt 为根据模型
阶数(p, q)得到的估计值。
利用(zt  zˆt)在不同
阶数下是否显著来判定 模型阶数。
为此引入残差方差  a .
2
模型的剩余平方和
a 
实际观察值个数  模型的参数个数
2
模型的剩余平方和
2
N
Q

( zt  zˆt )
t 1
实际观察值个数  N 自回归阶数
Q
对于 AR ( p ): a 
( N  P)  P
Q
2
MA( q ) :  a 
N q
Q
2
ARMA ( p , q ) :  a 
( N  P)  ( P  q)
2
(3)利用a2的变化规律,确定模型阶数。
随着模型阶数的增大,分母减小;
分子在不足拟合时,一直减小,速度较快;过
拟合时,分子虽减小,但速度很慢,几乎不变。
a2取决于分子、分母减小的速度。
在不足拟合时, a2一直减小;过拟合时,a2却
增大。
选择a2的最低点为模型的最优阶数。
(三)F 检验定阶法:
(1)F分布:
若x1,x2,
....,xv相互独立,且服从标准正态分布
v
则X   xt , X ~ X (v)
t 1
2
2
2
若X ~ X (v1 ),Y ~ X 2 (v2 ), X与Y相互独立
X / v1
F
~ F (v1 , v2 )
Y / v2
(2)用F分布检验两个回归模型是否有显著差
异。
设yt  a1 x1  a2 x2  ...  ar xr  
Q0 
N
2
(
y

a
x

a
x

...

a
x
)
 t 1 1 2 2
r r
t 1
现舍弃后面S个变量,得到新的回归
模型:
yt  a1 x1  a2 x2  ...  ar  s xr  s   
残差平方和
Q1 
N
2



(
y

a
x

a
x

...

a
x
)
 t 1 1 2 2
r s r s
t 1
现检验xr  s 1, xr  s  2 ,....,xr 对Y是否显著影响。
若有显著影响,则第一 个模型成立;
否则,第二个模型成立 。
H 0:ar  s 1  ar  s  2  ...  ar  0
H1 : ar  s 1  0, ar  s  2  0,...,ar  0
Q0 ~  a 2 X 2 ( N  r )
( a 2为残差方差,r为模型参数个数 )
若H 0成立,
Q1  Q0 ~  a 2 X 2 ( s ),
且Q0与(Q1  Q0)独立
(Q1  Q0)
/s
则F 
~ F ( s, N  r )
Q0 / N  r
给定显著性水平 ,
若H 0成立,
(Q1  Q0)
/s
F 
 F ( s , N  r )
Q0 / N  r
(Q1  Q0)
/s
若F 
 F ( s , N  r ),
Q0 / N  r
则H1成立。
(3)对于ARMA(p,q)模型定阶
例如:在ARMA(p,q)和ARMA(p-1,q-1)选择。
H 0 :  p  0,  q  0
H 1 :  p  0,  q  0
2
Q0 ~  a X 2 ( N  p  ( p  q ))
2
2
Q1  Q0 ~  a X (3)
2
[注:Q1 ~  a X 2 ( N  ( p  1)  ( p  1  q  1))]
(Q1  Q0)/ 3
F
~ F (3, N  2 p  q )
Q0 / N  2 p  q
给定,比较F与F的关系,判定H 0是否成立。
例:每隔20分钟进行一次观察的造纸过程入口
开关调节器的观察值(第241页,18)
1、series Mean S.D Max Min
z
32.02 0.74 34 30.7
令z1=z –32.02
2、
1
2
3
4
5
6
7
8
9 10
acf 0.868 0.782 0.708 0.663 0.627 0.617 0.594 0.559 0.5 0.48
pacf 0.868 0.115 0.028 0.099 0.055 0.122 0.01 –0.04 -0.099 0.1
3、定阶
(1)acf、pacf:
从 acf、pacf可知, acf拖尾,pacf截尾,初
步识别为AR模型。
具体阶数:
若p  1,当k  p时, kk ~ N (0,1 / N )
取k  p  1, p  2,...., p  M ( M  N )
2
看P(  kk 
)  95.45%,
N
2
即M个 kk中小于
的
N
比例是否达到95.45%.
N  160, N  12.6  13,
2
 0.159, k  2,3,...,14
N
 kk 全部小于0.159,原假设成立。( p  1)
若p  2, 取k  3,
4,
.....,15( M  N  13)
看P(  kk 
2
)  95.45%是否成立。
N
 kk 全部小于0.159,原假设成立。( p  2)
(2)残差方差:
19.33
当p  1,Q  19.33,  a 
 0.122
160 2  1
18.23
2
p  2,Q  18.23,  a 
 0.117
160 2  2
18.19
2
p  3,Q  18.19,  a 
 0.118
160 2  3
17.88
2
p  4,Q  17.88,  a 
 0.118
160 2  4
AR(2)合适。
2
(3)F检验:
(1)看AR (1)与AR (2)是否显著差异
H 0: 2  0
Q0为AR (2)剩余平方和, Q0 ~  a 2 X 2 ( N  4)
Q1为AR (1)剩余平方和, Q1 ~  a 2 X 2 ( N  2)
Q1  Q0 ~  a 2 X 2 ( 2)
F 
(Q1  Q0 ) / 2
~ F ( 2,1 5 6)
Q0 / 1 6 0  4
(1 9.3 3  1 8.2 3) / 2
 3.4 4
1 8.2 3 / 1 5 6
取  0.0 5, F ( 2,1 5 6)  3

F  F , 原假设不成立,
两个模型显著差异,最 优为AR ( 2)
( 2)看AR (2)与AR (3)是否显著差异
H 0:3  0
Q0为AR (3)剩余平方和, Q0 ~  a 2 X 2 ( N  6)
Q1为AR (2)剩余平方和, Q1 ~  a 2 X 2 ( N  4)
Q1  Q0 ~  a 2 X 2 ( 2)
(Q1  Q0 ) / 2
F 
~ F ( 2,154)
Q0 / 160  6
(18.23  18.19) / 2

 0.169
18.19 / 154
取  0.05, F ( 2,154)  3
F  F , 原假设成立,
两个模型无显著差异, 最优为AR ( 2)
(四)最佳准则函数定阶法
1、基本思想:确定一个函数,该函数既要考虑
用某一模型拟合原始数据的接近程度,同时又
考虑模型中所含参数的个数。当该函数取最小
值时,就是最合适的阶数。
衡量模型拟合数据的接近程度的指标是残差方
2
差。残差方差=
ˆ
(
z

z
)
 t t
2
E ( zt  zˆt ) 
N  参数个数
2、最佳准则函数包括FPE、AIC、BIC准则。
3、AIC准则
(1)该准则既适合于AR,也适合于ARMA模型。
(2)设{xt : 1  t  N }为随机序列,
2
ˆ
 a 是拟合模型的残差方差,
定义AIC 函数为:
p
2
AIC ( p)  ln ˆ a ( p)  2
N
随着模型阶数的增加,
右边第一项先减小,后 增大
(模型的最佳阶数时达 到最小),
第二项增大,当阶数增 大时,
第一项减小的速度大于 第二项增大的速度, AIC 减小;
因此,AIC 有最小值,对应的阶数 为最佳阶数。
(3)对于ARMA ( p, q )模型,其AIC ( p, q)定义为:
pq
2
AIC ( p )  ln ˆ a ( p )  2
N
• 关于ARMA模型的定阶
1、ACF、PACF都呈现一定的拖尾性,试拟合
ARMA模型。Pandit-Wu于1977年提出了不同
于Box-Jenkins的系统建模方法。该方法认为,
任一平稳序列总可以用一个ARMA(n,n-1)表
示,AR(n)、MA(m)、ARMA(n,m)都是
ARMA(n,n-1)的特例。
2、建模思想:逐渐增加模型阶数,直到剩余平
方和不再减小为止。
3、如何在不同模型之间取舍
H 0 :  2 n 1   2 n  0;
 2 n  2   2 n 1  0
设ARMA ( 2n,2n  1)的
剩余平方和为 Q0,
Q0 ~  a x [ N  2n  ( 4n  1)]
2 2
ARMA ( 2n  2,2n  3)的
剩余平方和为 Q1,
2 2
Q1 ~  a x [ N  (2n  2)  (4n  5)]
2
Q1  Q0 ~ x (6)
(Q1  Q0 ) / 6
F
~ F (6, N  (6n  1))
Q0 / N  (6n  1)
取,若F  F (6, N  (6n  1)),
则拒绝H 0。
第四章 协整理论绪论
一、协整理论产生的背景
1、20世纪70年代以前的建模技术以时间序列平
稳为前提设计的。
2、理论假定与现实的矛盾。
3、协整理论的产生---计量经济学方法研究的新
阶段
---Granger首先提出了伪回归问题(1974);
----1978年,Engle—Granger发表论文“协整与
误差修正”,正式提出“协整”
(cointegration)概念
二、与协整检验有关的两个问题:单位根和误
差修正模型
1、单位根:
协整检验处理的是非平稳时间序列,单位根检
验就是要说明一个时间序列的平稳性。
包括DF和ADF检验
2、误差修正模型(Error Correction Model,
ECM):
ECM由、Hendry、Srba于1978年提出的。
三、本部分的体系
单位根检验----协整检验----误差修正模型
第五章 单位根过程
第一节 单位根过程的定义
一、随机游动过程的定义
1、随机过程{y t ,t=1,2,…},
若y t=yt-1+εt,
其中{εt}为独立同分布序列,E( εt )=0,
D( εt )=E( εt 2)=σ2<∞
则称{y t}为随机游动过程。
2、随机游动过程是一非平稳过程
(1) y t=yt-1+εt
=yt-2+εt-1+εt
=yt-3+εt-2+εt-1+εt
=….
=y0+ε1+ε2+…+εt
E (y t)=y0
(2)D(yt)=E(yt-y0)2=E(ε1+ε2+…+εt)2=tσ2
二、单位根过程的定义
1、随机过程{y t ,t=1,2,…},
若y t=ρyt-1+ μt ,
其中ρ=1,
{μt }为稳定过程,E( μ t )=0,
Cov( μ t ,μt - s )= μ s<∞, s=0,1,2,…
则称{y t}为单位根过程。
10
y=y(-1)+u
5
0
-5
-10
20
40
60
80 100 120 140 160 180 200
2、单整
若一个随机过程{y t}经过d次差分后才能变成一
个平稳过程,则称{y t}是d阶单整过程,用
y t~ I (d)表示。
单位根过程实际上是1阶单整过程。
3、单位根过程名称的由来
y t=ρyt-1+ μt ,
(1- ρ B) y t= μt
平稳性要求φ(B)= (1- ρ B) =0
B=1/ ρ,当ρ=1时,B=1
即有一个单位根,称为单位根过程。
当 ︱B︳>1时, ︱ ρ ︳<1时,就是平稳过程。
4、单位根过程与稳定过程的本质区别
yt  t 1   t
  1,  t 为独立同分布序列
E ( t )  0, D( t )   2  
T
y
t 1 yt
ˆ  t  2
T

yt 12
t 2
T
T
y
t 1 ( t 1   t )
 t 2
t 2
t 1 t
   t 2
T

y
T
yt 12

t 2
yt 12
T
E(
y
t 1 t )
t 2
T
E ( ˆ )   
E(


yt 12 )
t 2
当T  时,ˆ是的一致估计值。
T ( ˆ   ) ~ N (0,  2 (1   2 ))
H 0 : ˆ   ; H1 : ˆ   ;
Z
T ( ˆ   )
~ N (0,1)
 1 2
当未知时,
t
T ( ˆ   )
s 1 2
~ t ( N  2)
2
当ˆ  1时,T(ˆ  )~ N(0, (
1  )2)
变成了 T(ˆ  1)~ N(0,
0)
第二节 与单位根过程形式接近的几种模型
一、带常数项的随机游动过程
1、 yt    yt 1   t
  0,   1,
{ t }是独立同分布序列
yt    yt 1   t
2、
   (  yt  2   t 1 )   t
 2  (  yt 3   t  2 )   t 1   t
 ...
 t  y0  1   2  ...   t
t
 t 
  (令y  0)
i
i 1
0
2200
120
100
2000
y=0.1+y(-1)+u
80
1800
60
1600
40
1400
20
0
1200
50
100
150
200
250
深圳股票综合指数
300
-20
100 200 300 400 500 600 700 800 900 1000
20
y=-0.1+y(-1)+u
0
-20
-40
-60
-80
-100
100 200 300 400 500 600 700 800 900 1000
二、长期趋势
1、形如 yt  c  rt  t 称为确定趋势模型。
2、前两类模型的图形接近。
3、判别单位根的必要性。
30
25
with deterministic trend
20
15
10
5
0
-5
50
100
150
yt = 0.1 t + ut 生成的序列 图
200
250
三、含随机趋势和确定性趋势的混合随机过程
1、
yt    t  yt 1   t
{ t }是独立同分布序列
 1
180
160
140
120
100
80
60
400
450
500
550
600
650
700
750
yt = 0.1+ 0.1t + yt-1+ ut生成的序列 图
800
四、近单位根过程
1、 y  y

t
 1
t 1
t
第六章 单位根过程的假设检验
第一节 迪基---福勒(DF)检验法
一、DF检验法产生的背景
1、DF检验法是由Dickey、Fuller在20世纪70、80年代
的一系列文章中建立起来的。
2、 AR (1) : yt  yt 1   t
H 0 :   0 ; H1 :   0
ˆT  0
tT 
~ t (T  1)
ˆT
ˆT 是的估计值,ˆT 是ˆT 的标准差
显著性水平 , tT  t  , 接受H 0。
2
3、这种方法不能用来检验H0:ρ=1,当零假设成
立时,t T不再服从t分布,因而无法得到临界
值。
此时,只能用模拟方法得到临界值。
DF检验中用到两个统计量:
T( ρ T-1)和t T,它们不存在小样本分布,只
有当样本容量T足够大时,它们的极限分布才
有实际的应用价值。
二、情况一的DF检验
1、假设数据由 yt  yt 1   t 产生,并在其中检验
H0:ρ=1; H1:ρ<1
2、适用于数据是非平稳且没有趋势的情况。
3、例:利用1947年第二季度到1989年第一季度的数据
对美国财政部债券利息率作不带常数的一阶自回归
如下:
it  0.99694it 1
(0.01059)
H 0 :   1; H1 :   1
(1)T ( ˆ  1)  168(0.99694 1)  0.51
  0.05, 临界值为  7.9,0.51  7.9
接受H 0。
ˆT 1 0.99694 1
(2)tT 

 0.29
T
0.01059
  0.05, 临界值为  1.95,0.29  1.59
接受H 0
三、情况二的DF检验
1、假设数据由 yt  yt 1   t 产生,在
yt    yt 1   t中检验
H 0:  0,  1
H1:  0,  1
一般先检验ρ=1,若接受H0,再检验α=0。若 α=0,则
yt  yt 1   t,若α ≠ 0,则为
yt    yt 1   t
为
2、情况二适用的数据图形是有趋势,但不稳定的情
况。这时,就在随机性非平稳及有漂移趋势的非平
稳之间选择。
3、例:仍利用美国财政部债券利率数据,估计带常数
项的一阶自回归模型:
it  0.211 0.96691it 1
(0.112)
(0.01933)
(1)T ( ˆT 1)  168(0.96691 1)  5.56
  0.05, 临界值  13.7,
 5.56  13.7, H 0
ˆT  1 0.96691 1
(2)tT 

 1.71
T
0.01933
  0.05, 临界值  2.89
 1.71  2.89, H 0 .
H 0:  0的检验
~2
ˆ 2)
(R
 R
/2
F 
~ F ( 2, T  2)
2
ˆ
R
/(T  2)
~2
R

ˆ2 
R
T

( yt 

( yt 
t 1
T
yt 1 ) 2
  yt 1 ) 2
t 1
由前知
yt  0.9 9 6 9 4yt 1
yt  0.2 1 1 0.9 6 6 9 1
yt 1
F  1.8 1
,F0.05
(2,1 6 6
)
 4.6 7
1.8 1  4.6 7, H 0
四、情况三的DF检验
1、情况三的DF检验
(1)假设数据是由带常数项的单位根过程
yt    yt 1   t生成
H 0:  1
H1:  1
(2)缺陷
五、情况四的DF检验
1、 y    y
t
t 1  t   t
H 0:  1,   0
H1:  1,   0
若H 0成立,则为单位根过程 。
先检验   1,若  0,则为
yt    yt 1   t;
若  0,则为
yt    yt 1  t   t;
H 0:  0的检验
~2 ˆ 2
(R  R )/ 2
~ F (2, T  3)
F
Rˆ 2 /(T  3)
~2
R 
2
ˆ
R 
T

( yt    yt 1)

( yt    yt 1  t )
2
t 1
T
t 1
2
(2)适用于序列有趋势的情况
3、例:美国1947年一季度至1989年第二季度GNP的实
际值,对图中数据进行模型拟合。
解:(1)图中数据有明显的长期趋势;
(2)这类图形可能适合的模型有:
yt    yt 1   t 和yt    yt 1  t   t
(3)
yt    yt 1  t   t
H 0:  1,   0
H1:  1,   0
yt  27.34  0.96252yt 1  0.02753t
(13.53)
(0.0193)
(0.0152)
(1)T ( ˆT 1)  168(0.96252 1)  6.3
  0.05, 临界值  20.7,
 6.3  20.7, H 0
ˆT  1 0.96252 1
(2)tT 

 1.94
T
0.0193
  0.05, 临界值  3.44
 1.94  3.44, H 0 .
H 0:  0的检验
~2 ˆ 2
(R  R )/ 2
~ F (2, T  3)
F
2
ˆ
R /(T  3)
F  2.44
(2,165) 6.45
F0.05
2.44  6.45, H 0
六、DF检验小结
第二节 增广的迪基---福勒(ADF)检验法
一、ADF检验法(Augmented Dickey—Fuller
Test)
1、ADF检验法是由迪基(Dickey)和福勒
(Fuller)在1979年提出的,是DF方法的推
广。DF假定{εt}是独立同分布序列,ADF假
定随机扰动项{μt}是稳定过程。
2、原理:
ADF假设数据服从有单位根的P阶自回归过程,即
yt  yt 1  1yt 1   2 yt  2  ...   p yt  p   t
 t 是独立同分布序列。
设随机过程{ yt }服从p阶自回归过程 AR ( p ),
 ( B ) yt  (1  1B   2 B  ...   P B ) yt   t
2
它的特征方程为:
1  1   22  ...   P  p  0
p
有一个单位根B  1,其余根在单位圆外,令
  1   2  ...   P
 j  ( j 1  ...   P ), j  1,2,..., p  1
这样, ( B)  (1  1B  2 B 2  ...   P B p )
(1  B) (1  1B   2 B 2  ...   P 1B p 1(
) 1  B)
证明:
(1  1B   2 B  ...   p B )  (1B   2 B 2  ...   p 1B p 1 )
 (1B 2   2 B 3  ...   p 1B p )
 1  1B   2 B  ...   p B  1B  (1   2 ) B 2  ( 2  3 ) B 3
 ...  ( p  2   p 1 ) B p 1   p 1B p
 1  1B   2 B  ...   p B   2 B  3 B  ...   p B
  2 B 2  3 B 3  ...   p B P
 1  1B   2 B 2  ...   p B p
 ( B ) yt   t
(
[ 1  B) (1  1B   2 B 2  ...   P 1B p 1(
) 1  B)
] yt   t
yt  yt 1  1 yt 1   2 yt  2  ...   P 1 yt  p 1
 1 yt  2   2 yt 3  ...   P 1 yt  p   t
yt  yt 1  1yt 1   2 yt  2  ...   P 1yt  p 1   t
 yt  yt 1  1yt 1   2yt  2  ...   P 1yt  p 1   t
二、情况二的ADF检验
1、yt    yt 1  1yt 1   2yt  2  ...   P 1yt  p 1   t
检验统计量为:
T(ˆT 1)
ˆT 1
和
1  1   2  ...   P 1
ˆT
这样与DF检验统计量的极限分布 一致。
2、例:利用ADF检验法对美国财政部债券利率进行单
位根检验。
解:H0:ρ=1;H1:ρ<1
it  0.335it 1  0.388it  2  0.276it 3  0.107it  4  0.195  0.96904it 1
(0.0788)
(0.0808)
(0.0800)
(0.0794)
(0.109)
T ( ˆT  1)
164(0.96904 1)

 5.74
1  1   2  ... p 1 1  0.335  0.388  0.276  0.107
临界值为  13.8,5.74  13.8, H 0 .
ˆT  1 0.96904 1
tT 

 1.66
ˆT
0.01860
临界值为  2.88,1.66  2.88, H 0 .
(0.01860)
第七章 协整理论
第一节 协整理论的建立和意义
一、协整理论的建立
1、1987年,Engle---Granger发表论文“协整与
误差修正,描述、估计与检验”,正式提出
“协整”概念。
Johansen(1995 )等人逐步发展完善。
2、意义
20世纪70年代以前的建模方法都假定时间序列
是平稳的,而现实的时间序列数据绝大多数
是非平稳的,这就会带来伪回归、参数估计
精度降低等问题。
传统的计量经济学面临三大问题:
 如何检验时间序列的非平稳性;
 如何修正和检验传统的计量经济模型;
 如何把时间序列变量引入经济计量分析领域。
20世纪70年代以后,上述问题逐步得到解决:
 1976年,迪基—福勒提出了检验非平稳时序
的方法:DF检验法;1979、1980又提出
ADF;
 当经济时间序列是非平稳时,可能存在伪回
归问题,由变量间的统计关系推断它们之间
是否存在因果关系十分困难。协整理论应运
而生,为了识别在非平稳时间序列中是否真
正存在因果关系;
 误差修正模型(ECM)产生。ECM由
Davidson、Hendry、Srba于1978年提出。它是
对传统计量模型形式的一次改革。
 Granger认为,如果变量间存在协整关系,它
们可以等价地用误差修正模型形式表示。
二、伪回归—协整理论产生的根源
1、伪回归:对两个无任何联系的变量拟合模型,
所有的统计检验都能通过。
2、原因:单位根
3、证明:
(1)考虑两个不相关的随机 游走模型:
yt
xt
2
 yt 1  ut , ut ~ iin(0, 1 )
 xt 1  vt , vt ~ iin(0,  22 )
E (ut vt )  0
对yt、xt 进行回归得:
yt   0  1xt   t
(3)
(1)
(2)
(2)为分析方便,设回归模型不含截距项。
yt  yt 1  ut , ut ~ iin(0, 12 )
(1)
xt  xt 1  vt , vt ~ iin(0,  2 2 )
E (ut vt )  0
(2)
对yt、xt 进行回归得:
yt  1xt   t
(4)
yt \ xt由(1)(2)产生,并假定y0  x0  0
t
 t  yt  1xt 
t
u   v
i
i 1
1
i
(5)
i 1
2
2
Var ( t )  t1  t 2  (当t  )
(3)从分布理论上认识伪回归
Phillips证明,当两个变量服从单位根时,t、F检验的分
布已经发生改变,需要用维纳过程和泛函中心极限
定理来解释它们的分布。
对(4)进行参数估计有:
y (x  x)

ˆ 
 (x  x)
(T  y x )  T
y (T

T x T x
t
t
1
2
t
2
1 / 2
t t
2
t
2
1 2
1 / 2
x)
由维纳过程的性质知
1
T 1 / 2 y   u
w
u ( r )d r
0
T 2

1
xt 2   v

[ wv ( r )] 2 d r
0
1
T 1x 2   v
w
v ( r )d r
0
T 2
y x
t
t 
1
 u v
w
u ( r )wv ( r ) d r
0
带入1的表达式中有:
ˆ    
1
u
v
结论:在理论上β1应该收敛于0,但是,在单位
根情况下,它收敛于一个非退化的分布。因
此,基于β1的常规统计推断全部失效。
同理,F检验:T-1F----非退化分布
t检验: T-1/2t----非退化分布
第二节 两变量协整关系的检验
一、协整概念
1、单整(integration)
一个具有非确定性分量的时间序列X t,如果d次
差分后是平稳序列,则称X t是d阶单整的,
记为X t ~I(d)
2、协整
若x1t , x2t , ,..., xkt都是d阶单整的,
若存在一个向量,  (1, 2 ,..., k)
,

使得z  X ~ I (d  b)
t
t
其中,b  0, X t  ( x1t , x2t , ,..., xkt )
则认为
x1t , x2t , ,..., xkt是协整的, 为协整向量。
当k  2时,协整向量 是唯一的,
k  2时,可能存在多个协整 向量,
3、几点说明:
 目前的协整研究是基于d=1展开的;
 协整关系可以表述为:若两个时间序列变量
是非平稳的,但它们的某种线性组合是平稳
的,则存在协整关系;
 协整概念同经济学中的长期均衡概念有本质
上的联系;
 只有当两个变量的单整阶数相同时,才可能
存在协整关系。
 从定义看,将因、自变量放在一起,它们的
组合等于某个值,而这个值实际上就是随机
扰动项,因此,是否存在协整关系就是检验
残差项是否平稳。
二、两变量的Engle---Granger检验
1、EG检验是协整检验的开创性研究。
2、 假定两变量yt \ xt 满足:
yt  xt  ut (1)
第一步,用OLS估计模型(1),得yˆ t  xˆt
uˆt  yt  xt
第二步,检验ut的单整性
若uˆt ~ I(0),协整关系成立,
uˆt ~ I(1),伪回归。
3、EG检验的缺陷
 仿真试验表明,即使样本长度为100时,协整
向量的OLS估计仍是有偏的。一般应该用极
大似然估计。
 EG检验一般只假定有一个协整关系,这就可
能忽略其他协整关系。
4、协整关系的检验可归为三类:
类型一、自变量、因变量回归模型不带常数和时间趋
势,
y1t  r2 y2t  r3 y3t  ...  rn ynt  ut
用OLS估计模型参数,
对残差uˆt 用DF、ADF 检验单整性,
查表4.5中情况一。
类型二、回归方程含常数项
y1t    r2 y2t  r3 y3t  ...  rn ynt  ut
用OLS估计模型参数,
对残差uˆt 用DF、ADF 检验单整性,
查表4.5中情况二。
类型三、回归方程含常数项,且{yt}是带非零常数的
单位根向量
y1t    r2 y2t  r3 y3t  ...  rn ynt  ut
用OLS估计模型参数,
对残差uˆt 用DF、ADF 检验单整性,
查表4.5中情况三。
第三节 多变量协整关系的检验
一、Johansen的协整检验
1、对于多变量之间的协整关系, Johansen
(1988)以及Johansen与Juselius(1990)提出了
一种向量自回归模型进行检验的方法。
二、向量自回归过程(Vector autoregressive
process)
1、20世纪90年代,Hendry吸纳、整合了协整理
论、误差修正模型等,创立了动态计量经济
学。在该理论中阐明为什么协整检验要从建
立向量自回归过程开始。
2、Hendry认为,应该从经济理论和数据提供的
信息为基础进行建模。
从能够代表数据生成过程的自回归分布滞后模
型开始——对模型中变量进行单整和协整检
验,逐步回归,剔除明显不显著的变量,得
到简化的模型——将简化模型写成误差修正
模型形式,得到包含长期均衡与短期波动的
简单模型。
3、数据生成过程(Data Generating Process,
DGP)
是要描述已经得到的变量观测值是如何产生
的。
 时间序列是随机变量的集合,整个时间序列的
数据生产过程可以用所有随机变量的联合概
率密度函数来表示。
 对于只能得到实际值的时间序列而言,得到
联合概率密度函数是很困难的。如果能够将
概率密度函数简单化,而又不失其中的信
息,则是可取的。
这就是动态计量经济学的约化理论。在经过一
系列约化处理后,概率密度函数就转化为如
下模型:
q
yt  0 

i 0
p
 i zt i 

ri yt i   t ,  t ~ N (0,  2 )
i 1
y t为内生变量,z t 为外生变量,模型称为自回
归分布滞后模型(autoregressive distributed
lag ,ADL)。
 ADL是Jorgenson(1966)提出的,从其形式看,
它是用解释变量及被解释变量的若干滞后期
值来描述当期被解释变量的模型。
 向量自回归过程就是在ADL模型基础上扩展
的,它已成为协整检验的基础,是分析多变
量时间序列的有力工具。
4、向量自回归过程
n维随机向量y t服从p阶向量自回归过程,记Var(p),则
yt     1 yt 1   2 yt  2  ...   p yt  p   t (1)
其中,为n维常数向量,
 s ( s  1,2,..., p)为n  n维矩阵,
{ t }为n维独立同分布随机向量
E ( )  0, D( )  E (   )  
t
t
t t
(2)Var的变形
(1)等价地表示为:
( I n   1L   2 L2  ...   p L p ) yt     t
令   1   2  ...   p
 s  [ s 1  s  2  ...   p ]
s  1,2,...p
 I n   1L   2 L2  ...   p L p
 ( I n  L)  (1L   2 L2  ...   p 1L p 1)(1  L)( 2)
这样,(I n   1L   2 L2  ...   p L p ) yt
 [( I n  L)  (1L   2 L2  ...   p 1L p 1)(1  L)] yt
 yt  yt 1  1yt 1   2 yt  2 ...   p 1yt  p 1     t
 yt    yt 1  1yt 1   2 yt  2 ...   p 1yt  p 1   t
三、JJ检验
1、
2、具体步骤
第一步:用OLS估计Δyt的一个(p-1)阶Var
yt  ˆ 0  ˆ1yt 1  ˆ 2 yt  2 ...  ˆ p 1yt  p 1  uˆt
 i为n  nOLS系数估计矩阵;
用OLS估计yt 1的(p  1)阶Var
y  ˆ  ˆ y  ˆ y ...  ˆ
t 1
1
t 1
2
t 2
p 1yt  p 1  vˆt
第二步:计算典型相关系数
利用OLS估计得到残差 uˆt \ vˆt ,计算样本协方差矩
阵。
1
1


vv 
vˆt vˆt  ;
 T
 
T
1

uˆt vˆt  ;
uv
T
uu 
vu
uˆt uˆt 
uv
   
求矩阵
的特征值。
1
vv
vu
1
uu
uv
这些特征值按从大到小的顺序排列为:
ˆ1  ˆ2  ...  ˆn
设定似然函数为:
1
 T
2
n
ln(1   )
i
i 1
当存在h个协整关系时,对数似然函数是h个最大特征
值的函数,即:
1
 T
2
h
ln(1   )
i
i 1
第三步:协整关系的检验
(1)JJ检验之一:特征值轨迹检验
H0:Xt中有r个独立的协整关系
H1:Xt中有多于r个独立的协整关系
(r=0,1,…,n-1)
构造统计量:
n
r  T
ln(1   )
i
i  r 1
当H0成立时,
r  0
(2)JJ检验之一:最大特征值检验
若已知λr+1=0,则可推出
λr+2=λr+3=…= λn-1=0
因此,有最大特征值检验方法。
 r  T ln(1  r 1 )
 r  临界值, H 0;
 r  临界值, H1.
第四步:计算参数的最大似然估计值
令aˆ1, aˆ 2 ,...,aˆ n是h个最大特征值相应的特 征向量
Johansen建议正规化这些向量, 使得
aˆ 
aˆ  1
i

vv i
~
将前h个正规化向量作一个( n  h)矩阵A
~
A (aˆ1, aˆ 2 ,...,aˆ h)
则 0的MLE估计为:
~~
ˆ0 
A
uv A

i的MLE估计为
ˆi  ˆi   0ˆi , i  1,2,..., p  1
deMLE估计为:
ˆ  ˆ 0  ˆ0ˆ
例:1973.1~1989.10美、意月度消费者物价指数pt、
pt*,汇率st,检验它们之间是否存在协整关系。
解:1、将
*
pt、st 和pt (t  1,2,...,T )列入随机向量矩阵 X t ,

*
X  ( p 、s , p )
t
t
t
t
并分别以X t 和X t 1对X t 1,X t  2,
...,X t  k 1
作回归,得到残差 uˆt 和vˆt
2、利用样本数据可得:



 0.0435 0.0316 0.0154 


0.03198
uu    0.0316 4.686
 0.0154 0.03198 0.1799 


 427.366  370.699 805.812 


vv    370.699 424.083  709.036
 805.812  709.036 1525.45 


  0.485 0.499  0.838 


uu    1.814  2.959  2.469 
  1.808 1.469  3.5899


矩阵
   
1
vv
vu
1
uu
uv
的特征值为:λ1=0.1105,λ2=0.05603, λ3=0.03039
3、检验
H0:系统中无协整关系(r=0)
H1:系统中有一个协整关系(r>0)
3
0  T
 ln(1   )
i
i 1
 189[ln(1  0.1105)  ln(1  0.05603)  ln(1  0.03039)]
 38.85
查表6,α=0.05,情况三,临界值为29.509,
38.85>29.509,拒绝H0。
 0  T ln(1  1 )  22.12
查表 7,临界值为20.78,
22.12  20.78, 拒绝H 0
(2)
H 0 : r  1; H1 : r  1
3
1  T

ln(1  i )
i 2
 16.73
临界值为15.2,16.73  15.2
拒绝H 0,至少有两个协整关系 。
1  T ln(1  2 )  10.9
临界值为14,
10.9  14, 接受H 0。
最终选择认为有一个协 整关系。
4、协整向量
最大特征值 λ1=0.1105对应的特征向量就是协整向量,
有

ˆ
1

vvˆ1  1

ˆ
1  ( 0.7579 0.0280 0.4220)
将其第一个元素规范为1,得

ˆ
  (1  0.04  0.56)
1
即pt  0.04st  0.56 pt
*
第四节 误差修正模型(ECM)
一、协整系统的表述
1、若y  ( y1, y2 ,..., yn , ), 且yi ~ I (1)
i  1,2,...,n, 称y为向量单位根过程。
若y有VAR ( p )形式,即
yt    1 yt 1  2 yt  2  ...   p yt  p   t (1)
其中,i是n  n矩阵,E ( t )  0, D( t )  ;
 ( L)  I n  1L  2 L2  ...   p LP
I n为n阶单位阵,则(1)可表示为:
 ( L) yt     t
令  1  2  ...   p
s  [s 1  s  2  ...   p ], s  1,2,..., p  1
则(1)可表示为:
yt  yt 1    1yt 1  ...   p 1yt  p 1   t (2)
2、由于yt 为向量单位根过程,
故(1)的特征方程有一个根 等于1,其余大于1
I n  1L  2 L2  ...   p L p  0,
有 Li  1, L j  1, i  j
因此有   1  2  ...   p  I n
 yt ~ I (1), yt ~ I (0),
令E (yt )  
ut   yt   , 假定ut 可以用 MA()表示,即
ut   t  1 t 1   2 t  2  ...   p t  p   ( L) t
即yt  ut     ( L) t  (3)
以(L)右乘(3)有
(1  L) ( L) yt   ( L) ( L) t   ( L)
由(1)得:
 ( L) yt     t
(1  L)
(   t)  ( L) ( L) t   ( L)
上式左边为(1  L) t ,
 ( L)  0,  ( L) ( L)  (1  L)( 4)
这样,
t
yt  y0  t   ( L)
    
i
i 1
t
0
假定yt的元素之间存在k个独立的协整关系,且协整向
量为  i , 对应的协整向量矩阵为
A (1,  2 , ...  k )
Ayt ~ I (0)
令ut   ( L) t
t
t
 u   ( L )     
则
i
i
i 1
i 1

t 
 
j t j
j 0
 j  ( j 1   j  2  ...)
由(3)得:
t
0
t
yt  y0  t   ( L)
    
i
t
0
i 1
t
故Ayt  Ay0  At  A ( L)

 i  A(t  0 )
i 1
Ayt ~ I (0)的充要条件是:
A  0,A ( L)  (
0 5)
由(4)(L) ( L)  1  L,当L  1,
(L) ( L)  0
因此,(1)的行向量亦满足 yt的协整充要条件
A ( L)  0  A (1)  0
(1) (1)  0  A  (1)
令 是(1)的第i个行向量,由    0,
i
 i (1)  0
i
 i为协整向量,因此,  i可由A线性表示,即
 i  Abi  (1  2 ...  k )bi
(i  1,2,...,n)
最后由(1) BA
B  (b1 b2 ... bk ), r ( B)  k
式(2)两端同减 yt 1,
令0    I n  [ I n  1  2  ...   p ]
  (1)   BA
即有误差修正形式:
yt    0 yt 1  1yt 1  ...   p 1yt  p 1   t
   BAyt 1  1yt 1  ...   p 1yt  p 1   t (6)
二、Granger表述定理
设 yt是n维I(1)随机过程,若yt中有k个协整关系,即存
在n*k阶矩阵A,r(A)=k,使得
zt  Ayt ~ I (0), 且A(1) 0
若yt的VAR (p)表述为式(1),且存在
n  k矩阵B,满足(1) BA,使得(2)
等价地由误差修正形式(6)给出。
三、误差修正模型(ECM)
1、ECM的主要形式是由Davidson、Hendry、Srba和
Yeo于1978年提出。它将变量之间的短期与长期联
系有机地结合在一起。
2、ECM的形式
(1)对于(1,1)阶自回归分布滞后模型
yt   0  1zt   2 yt 1  3 zt 1   t (1)
两边同减yt 1
yt   0  1zt  (  2  1) yt 1  3 zt 1   t
右边出现zt
yt   0  1zt  1zt 1  1zt 1  (  2  1) yt 1  3 zt 1   t
  0  1zt  (  2  1) yt 1  ( 1   3 ) zt 1   t
  0  1zt
  0  1zt
1  3
 (  2  1)( yt 1 
2  1
1  3
 (  2  1)( yt 1 
1  2
zt 1)   t
zt 1)   t (2)
1  3
式(2)为误差修正模型,( yt 1  1   zt 1)
2
为误差修正项。
(2)对模型的理解
 ECM的被解释变量是Δyt,因此,实际上是一
个短期模型,反映了yt的短期波动Δyt是如何
被决定的。
 若y与z之间存在长期均衡关系,即y=az,在
式(1)中,若
Ez  z
则,不考虑常数项
yt  1zt   2 yt 1   3 zt 1   t
两边同取期望,设 E ( yt )  y得:
y  1z   2 y   3 z
1  3
y
z
1  2
1   3
这与误差修正项 yt 1 
zt 1形式接近。
1  2
所以,它反映了长期均 衡对短期波动的影响。
于是,被解释变量 yt的波动可以分解为两部 分:短期波动、长期均 衡。
 误差修正模型的含义:
——Δy t受另一变量的Δz t的影响;
——受(yt-1- y )的影响。均值对一序列而言是
恒定的,实际序列值与均值离差对Δy t的的影
响,表示一种恒定力量对Δy t的作用,称为长
期均衡影响。
1  3
y

z 表明 y 是由

z 决定的,也就是
1  2
说,y与z之间有长期均衡关系,它们的均值之
间才会存在稳定关系。
y