1736-经济数据分析第二讲

Transcript 1736-经济数据分析第二讲

第一部分
背景知识
常用软件入门
发展研究院
一、背景知识






（一）因果关系及其余条件不变分析
举例：工资的决定
（1）一个变量的变化会引起另一个变量的变动吗？
（2）模型假设保持其他因素固定不变，建立因果
关系，但是这种因果关系确实存在吗？
在多数对经济理论的检验中,经济学家的目标就是要
推定一个变量对另一个变量的因果性效应.
其他条件不变——意味着其他因素保持不变的概念
在因果分析中的重要作用。
发展研究院
计量经济学方法可以有效的保持其他因素不变：
 怎样做呢？
 关注平均或期望的响应上，即
估计y关于x与C的条件期望E( y x, c) ,向量c是控制变量
 存在的问题是什么？
 选定正常控制一览表困难，运用不同的控制能够
导致y与x之间因果关系的不同结果，这正是确立
因果性复杂的地方。（信息集的影响）
 其他问题也会妨碍对因果关系的估计。例如：有C
的元素适当的测量值，但是仍然没有y或w的适合
的测量值。

发展研究院





（二）随机设置与渐近分析
随机抽样假定（1）设立一个总体模型
（2）i.i.d样本可以从总体中抽取出来
分析重点：与有限样本性质相反的估计量的渐近
性质。
例：工资报价函数
log(wage)  0  1educ  2 exp er  3married  u

公司溢出效应
log(outputt )  t  1 log(labort )  2 log(capitalt )  3spillovert  quality  ut , t  1,2,3
发展研究院




（二）条件期望（均值）概念
1、为什么条件期望是重要的？
统计学的视角
假定利用过去的信息It-1预测Yt。令g(It-1）是Yt
的预测算子，则预测误差为：
ut  Yt  g ( It 1 )


如何判断模型的预测效果？
对预测误差的判断
发展研究院


常用的统计标准：
MSE
MSE  E[Yt  g ( It 1 )]
2

定理：根据MSE标准对于Yt而言，条件均值就
是Yt最好的估计量。即：
t  arg min MSE ( g )
g (.)
这里t  E (Yt / I t 1 )


问题：线性回归的局限性？例：消费函数
结论：条件期望是一个最优的预测算子。
发展研究院

至此，可以写成下式：
Yt  t   t 这里E( t / It 1 )  0(MDS )

也可以写成下式：
Yt  tt 这里E(t / It 1 )  1而E(1 t 1 )为MDS过程.

例：持续失业时间、股票价格变动时间（ACD模
型）
发展研究院

如果判断误差的标准不是MSE，则最优的预测算
子不是MSE，目标函数变为MAE则最优的预测算
子则是条件中位数。
MAE( g )  E Yt  g (It 1 )


这时最优的估计量为：条件中位数
g *(Qt 1 )  Qt (1/ 2)
例：线性指数模型（损失成本）
L(et )  exp( et )  1   et
et  1  g ( I t 1 )
发展研究院


经济学视角：
例：消费平滑：理性预期与Hall的随机游走理论
（Random walk)

max Et   jU (Ct  j ),0    1
{Ct }
t 0
s.t. At 1  Rt 1 ( At  Yt  Ct )
常见的u (.)的形式
1 U (Ct )  a  bCt  cCt2 b  0, C.0
2 (CRRA) U (Ct )  (Ct  1) /    0
u(Ct )
 
u(Ct )
3 U (Ct )  ln(Ct )
4 U (Ct )   exp( Ct )
发展研究院

我们有

由此出发推导霍尔（1978）的随机游走：
Et [U (Ct 1 ) Rt 1 ]  u(Ct )
Et [U (Ct ) Rt ]  u(Ct 1 )
Ct  Ct 1   t


假设收益率是固定的：Rt=R>0
则消费的跨期效用可以写为：
1

Et [U (Ct )t 1 / I t 1 ]  (  R) u (Ct 1 )
上式可以写为:
u(Ct )  (  R) 1 u (Ct 1 )   t
这里 : E ( t / I t 1 )  0
发展研究院

考虑一种消费函数形式：CRRA
如果u (Ct )  Ct 1 , 有 :
E (Ct 1 / I t 1 )  (  R) 1 Ct11
Ct 1  (  R)1 Ct11   t

考虑另一种消费函数形式：二项式
如果u (Ct )  a  bCt  cCt2 , 有 :
u(Ct )  b  2cCt
E (U (Ct ))  (  R) 1U (Ct 1 )  
Ct   0  1Ct 1   t
如果 R  1 有Ct  Ct 1   t
E (Ct | I t 1 )  Ct 1
发展研究院
2、条件期望的特征

定义：
设y表示一个随机变量, 设xk  ( x1, x2 , x3..., xk )表示1 K的解释变量的随机向量.
若E( y )  , 那么存在一个函数, 例如 :  : R K  R, 使得:
E( y| x1, x2 , x3..., xk ) = ( x1, x2 , x3..., xk )

例如：若y是工资，且x包括各种各样的个体特征，
如教育、经历以及IQ，则E（wage|educ,exper,IQ）
表示给定educ值、exper值以及IQ值时工资水平
wage的平均值。
发展研究院
发展研究院
部分效应、弹性及半弹性


确定y=f(x)
寻找x变化时y是如何变化的？
E ( y | x) 
 ( x)
x j x1 ,....., x j 1 , x j 1 ,......xK固定不变
x j
E ( y | x)对x j的偏导数通常称为x j 对E ( y | x)的部分效应.
例 : E ( y | x1 , x2 )  0  1 x1  2 x2
E ( y | x)
E ( y | x)
可以得出:
 1
 2
x1
x2
例 : E ( y | x1 , x2 )  0  1 x1  2 x2  3 x2 2
可以得出 :
E ( y | x)
E ( y | x)
 1
 2  23 x2
x1
x2
发展研究院

有时对部分效应的特殊函数感兴趣。如弹性。
y x j f ( x) x j



x j y
x j
f ( x)



为什么要用右式？
当y与x都是随机变量时， f ( x)   ( x)
则有： E ( y | x)  x j   ( x)  x j
x j
E ( y | x)
x j
 ( x)
其中E ( y | x)  0, 且x j  0, 上式与
[log E ( y | x)]
是相同的
 log( x j )
发展研究院

若弹性的定义取一个自然对数是线性的模型，若
y>0,xj>0, 我们可以将弹性定义为
E[log( y ) | x]
 log( x j )
若 log( y)  g ( x)  u E (u / x)  0,

则两种弹性定义的表达式相同吗?
在很大程度上，当y>0时，期望的对数和对数的期
望处理成相同是没有什么损失的，只要log(y)与
log(xj)定义恰当。
发展研究院


条件期望的若干性质：
期望迭代定律（law of iterate expectation,LIE)
E ( y )  E[ E ( y | x)]  E[  ( x)]
假定w是一个随机向量, y是一个随机变量.设x是w
某一函数的一个随机向量,比如说x  f ( w).这一表
述意味着一旦知道w的结果, 就可以得出x的结果.
则LIE的表述是 :
E[ y | x]  E[ E ( y | w) | x]
E[ y | x]  E[ E ( y | x) | w]
发展研究院

出于多种目的考虑，需要用LIE的一般特例：
如果x, z是任意的随机向量, 那么
E (Y | x)  E[ E (Y | x, z ) | x]
或者, 定义1 ( x, z )  E ( y | x, z )以及2 ( x)  E ( y | x)
2 ( x)  E[ 1 ( x, z ) | x]

LIE的一般形式中还有一些其他的有益应用。假
定对某一个（向量）函数地f(x)与一个实值函数
g(.)来说，
E ( y | x)  g ( f ( x))
于是E[ y | f ( x)]  E ( y | x)  g[ f ( x)]
发展研究院

例：如果一个工资方
程是：
E (wage / educ,exp er )   0  1educ   2 exp er  3 exp er 2
  4educ  exp er

则：
E(wage / educ, exp er, exp er 2 , educ  exp er )  ?
发展研究院
 3、条件期望的误差形式
y  E ( y | x)  u
E (u | x)  0
E (u | x)  0具有重要含义 :
(1) E(u)  0
 2 u与x1 , x2 ......xk的任何函数不相关
发展研究院
4、线性投影
定义经x  ( x1 ,....xk )为一个1 K向量, 并且假定x的K  K 方差矩阵
是非奇异的. 则有y在1, x1 , x2 ....xk 上的线性投影总是存在的, 且是
唯一的:
L( y| 1, x1 , x2 ....xk )  L( y |1, x)  0  1 x1   2 x2  ......   K xK  0  x
给定上式的线性投影，总可以写成：
y   0  1 x1   2 x2  ......   K xK  u
其中误差项u具有下述性质 : E (u )  
2
且E (u )  0, COV ( x j , u )  0, j  1, 2....., K
发展研究院
二、常用软件

Eview(3.0,5.0,6.0)

EViews是在大型计算机的TSP (Time Series Processor)
软件包基础上发展起来的新版本，是一组处理时间序列数
据的有效工具， 1981 年 Micro TSP 面世， 1994 年 QMS
(Quantitative Micro Software) 公司在Micro TSP基础
上直接开发成功EViews并投入使用。虽然EViews是由经济
学家开发的并大多在经济领域应用，但它的适用范围不应
只局限于经济领域。
发展研究院

Stata(8.0,9.0,10.0)
 能够进行大多数统计分析（回归分析，logistic回归，生存
分析，方差分析，因子分析，以及一些多变量分析）。
Stata最大的优势可能在于回归分析（它包含易于使用的
回归分析特征工具），logistic回归（附加有解释logistic回
归结果的程序，易用于有序和多元logistic回归）。Stata
也有一系列很好的稳健方法，包括稳健回归，稳健标准误
的回归，以及其他包含稳健标准误估计的命令。此外，在
调查数据分析领域，Stata有着明显优势，能提供回归分
析，logistic回归，泊松回归，概率回归等的调查数据分析。
它的不足之处在于方差分析和传统的多变量方法（多变量
方差分析，判别分析等）。
 http://www.cpc.unc.edu/services/computer/presentations/
statatutorial
 http://www.stata.com/
发展研究院

Sas
 能够进行大多数统计分析（回归分析，logistic回归，

生存分析，方差分析，因子分析，多变量分析）。
SAS的最优之处可能在于它的方差分析，混合模型分
析和多变量分析，而它的劣势主要是有序和多元
logistic回归（因为这些命令很难），以及稳健方法
（它难以完成稳健回归和其他稳健方法）。尽管支持
调查数据的分析，但与Stata比较仍然是相当有限的。
matlab
 空间计量、非参
发展研究院
参考文献
Yongmiao Hong, Advanced Econometrics,
Lecture Note
 伍德里奇，横截面与面板数据的经济计量
分析，中国人民大学出版社，2007年
 高铁梅，计量经济分析与建模：EVIEW应
用与实例，清华大学出版社

发展研究院

1736-经济数据分析第二讲

Transcript 1736-经济数据分析第二讲

Directory