EViews软件应用基本回归模型

Download Report

Transcript EViews软件应用基本回归模型

计量软件实验:EViews
软件应用
基本回归模型
1
第二章 基本回归模型
本章介绍EViews中基本回归技术的使用,说明并估计一个
回归模型,并对回归结果进行简单分析和说明。
2
§2.1
方程对象
EViews中的单方程回归估计是用方程对象来完成的。为了创建一个方
程 对 象 : 从 主 菜 单 选 择 Object/New Object/Equation 或 Quick/Estimation
Equation…,或者在命令窗口中输入关键词equation。
在随后出现的方程说明对话框中说明要建立的方程,并选择估计方法。
下面我们详细介绍在EViews中如何说明方程。EViews将在方程窗口中估计
方程并显示结果。估计结果会作为方程对象的一部分存储起来以便随时提取。
这样我们只需打开方程对象来显示简要结果,或者利用EViews工具来处理方
程对象的结果。
3
§2.2 在EViews中对方程进行说明
当创建一个方程对象时,会出现如下对话框:
在这个对话框中需要说明三件事:方程说明,估计方法,和该估计使用的
样本。在最上面的编辑框中,可以说明方程:因变量(左边)和自变量(右边)
以及函数形式。
有两种说明方程的基本方法:列表法和公式法。列表法简单但是只能用于
4
不严格的线性说明;公式法更为一般,可用于说明非线性模型或带有参数约束
的模型。
§2.2.1
列表法
线性方程编辑最简单的方法是列出方程中要使用的变量。首先是因变量
或表达式名,然后是自变量列表。例如,要说明一个线性消费函数CS,用
一个常数和inc对其作回归,在方程说明对话框上部输入:
cs c inc
注意回归变量列表中的序列c。这是EViews用来说明回归中的常数而建
立的序列。EViews在回归中不会自动包括一个常数,因此必须明确列出作为
回归变量的常数。内部序列c不出现在工作文档中,除了说明方程外不能使
用它。
注意到在工作文档中有一个预先定义的对象C。这是缺省系数向量——
当通过列出变量名的方式说明方程时,EViews会根据变量在列表中出现的顺
序在这个向量中存储估计系数。在上例中,常数存储于c(1),inc的系数存储
于c(2),即回归方程形式为:cs = c(1)+c(2)*inc。
5
在统计操作中会用到滞后序列,可以使用与滞后序列相同的名字来
产生一个新序列,把滞后值放在序列名后的括号中。
例如:cs cs(-1) c inc
该语句命令EViews使用cs的滞后值、常数和inc对cs作回归。cs滞后的
系数将存放在c(1)中,常数系数在c(2)中,inc的系数在c(3)中,即回归方程
形式为:cs = c(1)*cs(-1)+c(2)+c(3)*inc。
通过在滞后中使用关键词 to 可以包括一个连续范围的滞后序列。例
如:
cs c cs(-1 to -4) inc
这里cs关于常数,cs(-1),cs(-2),cs(-3),cs(-4),和inc的回归。
6
如果写成: cs c inc(to –2) inc(-4) 表示cs关于常数,inc,inc(-1),
inc(-2),和inc(-4)的回归,即回归方程形式为:
cs = c(1)+c(2)*inc+c(3)*inc(-1) +c(4)*inc(-2) +c(5)*inc(-4)
在变量列表中也可以包括自回归序列。例如:
log(cs) c log(cs(-1)) ((inc+inc(-1))/2)
说明了cs的自然对数关于常数,其滞后值和inc的两项移动平均的回归,
即回归方程形式为:
log(cs) = c(1)+c(2)*log(cs(-1))+c(3)*log((inc+inc(-1))/2)
7
§2.2.2
公式法说明方程
当列表方法满足不了要求时,可以用公式来说明方程。许
多估计方法(但不是所有的方法)允许使用公式来说明方程。
EViews中的公式是一个包括回归变量和系数的数学表达式。
要用公式说明一个方程,只需在对话框中变量列表处输入表达
式即可。EViews会在方程中添加一个随机附加扰动项并用最小
二乘法估计模型中的参数。
8
用列表说明方程时,EViews会将其转换成等价的公式形式。例如,下
面的列表:
log(cs) c log(cs(-1)) log(inc)
EViews会理解为,
log(cs) = c(1)+c(2)*log(cs(-1)) + c(3)*log(inc)
这种形式并不是必须的,= 符号可以出现在公式的任何地方,如:
log(urate) + c(1)*dmr = c(2)
这个方程的残差为:
ε = log(urate)+c(1)dmr-c(2)
EViews将最小化残差平方和。
9
估计严格的非线性的方程或带有参数约束的方程必须用公式法说明。例
如,假如要约束变量x, 使x及其滞后变量的系数和为1。可以采用带参数约束
的线性模型:
y = c(1) + c(2) * x + c(3) * x(-1) + c(4) * x(-2) +(1 - c(2) - c(3) - c(4)) * x(-3)
估计一个非线性模型,只需输入非线性公式。EViews会自动检测非线性并
用非线性最小二乘估计模型。
用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量,
选择Object/New Object… 并从主菜单中选择Matrix-Vector-Coef , 为系数向量
输入一个名字。然后,选择OK。在New Matrix对话框中,选择Coefficient
Vector 并说明向量中应有多少行。带有系数向量图标β的对象会列在工作文
档目录中,在方程说明中就可以使用这个系数向量。例如,假设创造了系数向
量A和BETA,各有一行。则可以用新的系数向量代替C:
10
log(cs)= a(1)+ beta(1)* log(cs(-1))
§2.3
在EViews中估计方程
§2.3.1 估计方法
说明方程后,现在需要选择估计方法。单击Method:进入对话框,会看
到下拉菜单中的估计方法列表:
标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。
采用OLS,TSLS,GMM,和ARCH方法估计的方程可以用一个公式说明。
非 线 性 方 程 不 允 许 使 用 binary , ordered , censored , count 模 型 , 或 带 有
11
ARMA项的方程。
§2.3.2 估计样本
可以说明估计中要使用的样本。EViews会用当前工作文档样本来填充对
话框,可以通过在编辑框中输入样本字符或对象来改变样本。改变估计样本
不会影响当前工作文件样本。
如果估计中使用的任何一个序列的数据丢失了,EViews会临时调整观测
值的估计样本以排除掉这些观测值。EViews通过在样本结果中报告实际样本
来通知样本已经被调整了。
Dependent Variable: Y
Method: Least Squares
Date: 08/19/02 Time: 10:24
Sample(adjusted): 1959:04 1989:12
Included observations: 369 after adjusting endpoints
在方程结果的顶部, EViews报告样本已经得到了调整。从59.01-89.12期间的
372个观测值中, EViews使用了369个观测值和所有相关变量的观测值。
12
如果在回归中包括了滞后变量,样本的调整程度会不同,这取决于样
本期前的数据是否可得到。如假设M1和IP是两个没有丢失数据的序列,样
本区间为59.01-89.12 而且回归说明为
m1 c ip ip(-1) ip(-2) ip(-3)
如果设定估计样本区间为60.01-89.12, EViews会把样本调整为:
Dependent Variable:M1
Method:Least Squares
Date:08/19/02 Time:10:49
Sample: 1960:01 1989:12
Included observation: 360
因为直到1959年4月ip(-3) 才有数据。然而,如果把估计样本区间定为
60.01-89.12,EViews不会对样本进行任何调整,因为在整个样本估计期间
ip(-3)的值都是可以得到的。一些操作不允许样本中间有数据丢失,如带MA
和ARCH项的估计。当执行这些步骤时,如果在样本中间遇到一个NA就会
13
出现一错误信息而且执行过程也会停止。
§2.3.3 估计选项
EViews提供很多估计选项。这些选项允许进行以下操
作:对估计方程加权,计算异方差性,控制估计算法的各
种特征。
§2.4
方程输出
在方程说明对话框中单击OK钮后,EViews显示估计结果:
14
根据矩阵的概念, 标准的回归可以写为:
y  X  
y是因变量观测值的T维向量,X是解释变量观测值的T*k维矩阵,β是k维系数
向量,ε是T维扰动项向量,T是观测值个数,k是解释变量个数。在上面的结
果中, y是log(M1), X包括三个变量c、log(IP)、TB3, 其中T =372 , k =3。
15
§2.4.1 系数结果
1、 回归系数 (Coefficient)
系数框描述了系数的估计值。最小二乘估计的系数b是由以下的公式计
算得到的
b  ( X X ) 1 X y
如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如
果是使用公式法来说明方程,EViews会列出实际系数 c(1), c(2), c(3) 等等。
对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变
量对因变量的边际收益。如果存在的话,系数c是回归中的常数或者截距--它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设
所有其它变量都不变,相应的自变量和因变量之间的斜率关系。
16

例如,简单的消费方程:cst=c0+c1inct+εt,其中cs是消费;
inc是收入。方程中c0代表自发消费,表示收入等于零时的
消费水平;而c1代表了边际消费倾向,0<c1<1,即收入每
增加1元,消费将增加c1元,若c1等于0.6,则收入每增加
1元,消费将增加0.6元。如果在消费方程中加上实际利率
rs,即cst=c0+c1inct+c2rst+εt,从经济学角度看c2应是负数,
实际利率下降将使消费增加。

如果使用线性对数方程,估计得到的参数本身就是该变量
的弹性。如在 log(Qt)=α+βlog(Pt)的估计式中,P增加1%
时,Q大约增加β%,所以β相当于价格弹性。
17
2、标准差 (Std.Error)
标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信
性----标准差越大,估计中的统计干扰越大。
估计系数的协方差矩阵是由以下公式计算得到的:
var(  )  s 2 ( X X ) 1
其中
s 2  ˆ ˆ /(T  k )
ˆ  y  Xb,
这里 ˆ 是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。
可以通过选择View/Covariance Matrix项来察看整个协方差矩阵。
18
3、t-统计量
t 统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系
数为零的假设的。
4、概率(p值)
结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的
假设下, 指出 t 统计量与实际观测值一致的概率。这个概率称为边际显著性
水平或p值。给定一个p值,可以一眼就看出是拒绝还是接受实际系数为零的
双边假设。例如,如果显著水平为5% ,p值小于0.05就可以拒绝系数为零的
原假设。
19
§2.4.2 统计量总结
1、 R 2统计量
R 2 统计量衡量在样本内预测因变量值的回归是否成功。R 2 是自变量所解
释的因变量的方差。如果回归完全符合,统计值会等于1。如果结果不比因
变量的均值好,统计值会等于0。 R 2可能会由于一些原因成为负值。例如,
回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二
乘法或ARCH方法。
EViews计算 R 2的公式为:
R  1
2
ˆ ˆ

y  y y  y
ˆ  y  Xb,
T
y   yt T
t 1
其中,ˆ 是残差, y 是因变量的均值。
20
2、调整后的R2
调整后R2的通常解释为 R 2 ,消除 R2 中对模型没有解释力的新增变量。
计算方法如下:

R 2  1 1 R2
TT  1k
2
R 2 从不会大于R ,随着增加变量会减小,而且对于很不适合的模型还可能是负值。
21
3、回归标准差 (S.E. of regression)
回归标准差是在残差的方差的估计值基础之上的一个总结。
计算方法如下:
s  ˆ ˆ T  K 
ˆ  y  Xb
4、残差平方和
残差平方和可以用于很多统计计算中,为了方便,现在将
它单独列出:
t
2
ˆ
ˆ

     yi  X i b
i 1
22
5、对数似然函数值
EViews可以作出根据系数的估计值得到的对数似然函数值
(假设误差为正态分布)。似然比检验可通过观察方程严格形
式和不严格形式的对数似然值之间的差异来进行。
对数似然计算如下:
T
   1  log 2   log ˆ ˆ T 
2
23
6、Durbin-Watson 统计量
D-W 统计量衡量残差的序列相关性,计算方法如下:
T
DW   ˆi  ˆi 1 
i 2
2
T
 ˆi
2
i 1
参见 Johnston 和DiNardo(1997)作出的D-W统计量分布的显著性水平的
列表。
作为一个规则,如果 DW值小于2,证明存在正序列相关。在我们的结
果中,DW值非常接近于1,表明残差中存在序列相关。关于Durbin-Watson
统计量和残差序列相关更详细的内容参见“序列相关理论”。
对于序列相关还有更好的检验方法。在 “序列相关的检验”中,我们
讨论Q统计量和Breusch-Godfrey LM检验,这些都是比DW统计量更为一般
序列相关检验方法。
24
7、因变量均值和标准差(S.D)
y的均值和标准差由下面标准公式算出:
T
y   yi T
sy 
i 1
2


T  1
y

y
t 1 i
T
8、AIC准则(Akaike Information Criterion)
计算公式如下:
AIC   2l T  2k T
其中是对数似然值
T
   1  log 2   log ˆ ˆ T 
2
我们进行模型选择时,AIC值越小越好。例如,可以通过选择最小AIC值
来确定一个滞后分布的长度。
25
9、Schwarz准则
Schwarz准则是AIC准则的替代方法:
SC   2l T  k log T  T
10、F统计量和边际显著性水平
F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通
最小二乘模型,F统计量由下式计算:
R 2 k  1
F
1  R 2 T  k 


在原假设为误差正态分布下,统计量服从 F k  1, T  k 分布。
26
F统计量下的P值,即Prob(F-statistic), 是F检验的边际显
著性水平。如果P值小于所检验的边际显著水平,比如说0.05,
则拒绝所有系数都为零的原假设。对于上面的例子,P值为
零,因此,我们拒绝回归系数为零的原假设。注意F检验是
一个联合检验,即使所有的t统计量都是不显著的,F统计量
也可能是高度显著的。
27
§2.4.3
回归统计
估计结果中的回归统计存储在方程中,通过特殊的“@函数”可以得到。
可以使用函数的各种表达形式 genr, scalar, matrix得到任何统计量以深入分析。
如果对于给定的估计方法某一统计量没有计算,会返回NA。
@函数有两种:返回标量和返回矩阵或向量。
1、返回标量的函数:
@r2
R 2 统计量
@rbar2
调整 R 2 统计量
@se
回归标准差
@ssr
残差平方和
@dw
Durbin-Watson 统计量
28
@f
F-统计量
@logl
对数似然函数值
@aic
Akaike信息准则
@schwarz
Schwarz信息准则
@regobs
回归中观测值数
@meandep
因变量均值
@sddep
因变量标准差
@ncoef
被估计系数数目
@coefs(i)
系数i
@stderrs(i)
系数i的标准差
@tstats(i)
系数i的t-统计量
@coefcov(i,j)
系数i和 j的协方差
29
2、返回向量或矩阵对象的函数:
@coefs
向量的系数值
@stderrs
系数向量的标准差
@tstats
系数与标准差比例变量(t统计量)
@cefcov
含有系数协方差的矩阵
30
如果使用这些函数而没有方程对象,EViews会使用缺省方程。如命令:
scalar a = @dw 创建了标量a并指定了缺省方程的Durbin-Watson统计值。
然而,我们强烈推荐使用方程对象名和一个“.”作为统计量的关键词。这样
可以使命名的方程得到合适的统计量。例如指定方程EQ01的D-W值:
scalar a=eq01.@dw
返回向量或矩阵对象的函数应指定相应的对象类型。例如,对一个向量指
定系数的t统计量结果:
vector ts = eq1. @tstats
对协方差矩阵应指定矩阵:
matrix mycov = eq1.@cov
也可以获取这些统计量的单个元素:
scalar var1 = eq1.@covariance(1,1)
31
§2.5
方程操作
§13.5.1 方程视图
以三种形式显示方程:EViews命令形式,带系数符号的代数方程,和有
系数估计值的方程。
32
可以将这些结果剪切和粘贴到支持Windows剪贴板的应用文档中。
· Estimation Output显示方程结果。
· Actual, Fitted, Residual以图表和数字的形式显示因变量的实际值和拟合值
及残差。实际值。Actual, Fitted, Residual Table 以表的形式来显示这些值。
注意,实际值是拟合值和残差的和。Actual, Fitted, Residual Graph显示了实
际值,拟合值,残差的标准EViews图。Residual Graph只描绘残差,而
Standardized Residual Graph描绘残差除以残差标准差的估计值后标准化了的图。
33
· Gradients and Derivatives...描述目标函数的梯度和回归函数的导数计算
的信息。详细内容参见附录E, “梯度和导数”。
· Covariance Matrix以表的形式显示系数估计值的协方差矩阵。要以矩阵
对象保存协方差矩阵,可以使用@cov函数。
· Coefficient Tests, Residual Tests, and Stability Tests
这些是 “定义和诊断检验”中要详细介绍的内容。
34
§2.5.2 方程过程
· Specify/Estimate... 提出方程说明对话框以修改说明。可以编辑方程说明或
改变估计方法或估计样本。
· Forecast ... 用估计方程预测,参见“预测”一章 。
· Make Modle 创建一个与被估计方程有关的未命名模型。这个模型可用通
常的方法求解。关于如何使用模型进行预测和模拟,参见“模型”一章。
· Update Coefs from Equation 把方程系数的估计值放在系数向量中。可以使
用这种方法来初始化各种估计过程的初始值。
· Make Regressor Group 创建一个包含方程中使用的所有变量的未命名组(常
数除外)。
· Made Residual Series... 在工作文档中以序列形式保存回归中的残差。根据
估计方法的不同,可以选择三种不同的残差:普通的,标准化的,和广义的。
对于普通最小二乘估计,只能存储普通残差。
· Make Derivative Group 创建一个包含回归函数关于其系数的导数的组。
35
· Made Gradient Group 创建一个包含目标函数关于模型的系数的斜率的组。
§2.5.3 缺省方程
随着估计进行,EViews会计算一个未命名方程对象的系数估计值,协
方差矩阵,残差,和其他统计量。这些结果在以后的大量计算中可以使用,
包括“定义和诊断检验”一章中介绍的详细说明和特征检验,“方程预测”
一章介绍的预测和模型模拟计算, “模型”一章介绍的“模型”。
未命名方程不能储存在工作文档中。可以使用方程工具栏中的Name钮
来命名方程。工作文档被存储时,方程也会被存储。一旦命名后,可以随
时获取方程中的信息,即使刚刚估计完其他模型,或长期没有对工作文档
进行操作。
为了方便起见,EViews跟踪缺省方程。缺省方程是被激活的方程或者
最近一次被激活的方程。缺省方程名位于工作文档窗口的右上角。
36
§2.5.4 方程的残差
缺省方程的残差存储于一个称为RESID的序列对象中。除了估计外,
RESID可以象普通序列一样直接使用。
当估计方程时RESID会被重写,而且会包括最新估计方程的残差。要
保存某个方程的残差供以后分析,应该将它们保存在一个不同的序列中,
这样下一个估计命令不会覆盖它。例如,可以使用以下命令将残差拷贝到
一个称为RES1的普通序列中:series res1 = resid 即使已经覆盖了RESID序
列,如果存在方程对象,还可以使用EViews的构建步骤创建需要的残差序
列。方程名为EQ1,打开方程窗口并选择 Procs/Make Residual Series,或者
输入命令eq1.makeresid res1 来创建需要的序列。
37
§2.5.5 回归统计量
可以通过@函数指向前面描述的各种回归统计量。例如,产生一个新
序列等于FIT加上上一个回归的标准差的2倍,可以使用以下命令:
series plus = fit + 2*eq1.@se
要从方程EQ1中得到第二个系数的t-统计量应用以下说明:
scalar t2 =eq1.@tstats (2)
38
§2.5.6 存储和获取一个方程
方程可以和其他对象一起以数据或数据库文件形式存放在磁盘中。也
可以从这些文件中取出方程。
方程也可以从文档或数据库中拷贝粘贴出来或拷贝粘贴到数据库或文
档中。
EViews甚至允许直接从数据库或工作文档中获取方程。可以估计方程,
存在数据库中,在几个工作文档中使用它来预测。
39
§2.5.7 使用系数的估计值
方程系数列在说明窗口中。缺省时, EViews 会使用系数
向量C。但在定义方程时,也可以使用其它系数向量。 在
产生序列时,这些存储的数据可作为标量使用。还有更简单
的方法来产生合适的数值,为了进行说明,我们可以使用系
数来生成一个方程的拟合值:
series cs = eq1.c(1)+ eq1.c(2)*gdp
从目标方程EQ1的自变量和普通最小二乘估计系数中得
到CS的拟合值。
40



注意EViews会接受生成不指向命名方程一个序列:
series cs= c(1)+c(2)*gdp
并将使用C系数向量的已有值,我们强烈推荐使用命名方程来标识适当的
系数。总体上来说,只有在刚刚估计之后或系数更新后,系数向量C中才会
含有正确的系数值。使用命名的方程或选择Procs/Update coefs from
equation, 确保了使用正确的系数值进行估计。

指向系数向量的另一种方法是使用方程中的@coefs 元素,上例可写作:

series cs = eq1.@coefs(1) +eq1.@coefs(2)*gdp

EViews根据系数出现在方程中的顺序为每个系数指定索引。
41
§2.6
估计中存在的问题
如果自变量具有高度共线性,EViews 在计算回归估计时会遇到困难。在
这种情况下,EViews会产生一个显示错误信息对话框 “奇异矩阵”。出现这
个错误信息后,应该检查回归变量是否是共线的。如果一个回归变量可以写
作其他回归变量的线性组合,则回归变量是完全共线的。在完全共线的情况
下,回归变量矩阵X不是列满秩的,不能计算OLS估计值。
当在回归中使用虚拟变量时,应注意完全共线性。相互排除的虚拟变量
与常数项是完全共线的。例如,假设有季度虚拟变量seas(i),进行以下回归
y c x @seas(1) @seas(2) @seas(3) @seas(4)
EViews会返回“奇异矩阵”的错误对话框,因为常数项与四个季度虚拟
变量之间有以下关系:
c = @seas(1) + @seas(2) + @seas(3) + @seas(4)
在这种情况下,只需去掉常数项或一个虚拟变量即可。
一些教科书对共线性问题进行了更广泛的讨论。
42
§2.7
命令
要产生一个新的方程,可使用下面的带有方程对象名称的命令:
equation eq1
要用OLS估计方程,只需在方程名后面加点和“ls”或“est”,因变量
名和自变量名,每一个名字之间要有一个空格:
eq1.ls cs c gdp cpi
对cs做关于常数,gdp和cpi的回归。
可以使用带等号的公式来描述方程
eq1.ls cs = c(1) + c(2)*gdp + c(3)*cpi
也可以使用一个命令行定义并估计一个方程:
equation eq_sale.ls sales c trend orders industry_growth
估计给定方程并用一个名为eq_sale的方程来存储结果。
43