1736-经济数据分析第二讲

Download Report

Transcript 1736-经济数据分析第二讲

第一部分
背景知识
常用软件入门
发展研究院
一、背景知识






(一)因果关系及其余条件不变分析
举例:工资的决定
(1)一个变量的变化会引起另一个变量的变动吗?
(2)模型假设保持其他因素固定不变,建立因果
关系,但是这种因果关系确实存在吗?
在多数对经济理论的检验中,经济学家的目标就是要
推定一个变量对另一个变量的因果性效应.
其他条件不变——意味着其他因素保持不变的概念
在因果分析中的重要作用。
发展研究院
计量经济学方法可以有效的保持其他因素不变:
 怎样做呢?
 关注平均或期望的响应上,即
估计y关于x与C的条件期望E( y x, c) ,向量c是控制变量
 存在的问题是什么?
 选定正常控制一览表困难,运用不同的控制能够
导致y与x之间因果关系的不同结果,这正是确立
因果性复杂的地方。(信息集的影响)
 其他问题也会妨碍对因果关系的估计。例如:有C
的元素适当的测量值,但是仍然没有y或w的适合
的测量值。

发展研究院





(二)随机设置与渐近分析
随机抽样假定(1)设立一个总体模型
(2)i.i.d样本可以从总体中抽取出来
分析重点:与有限样本性质相反的估计量的渐近
性质。
例:工资报价函数
log(wage)  0  1educ  2 exp er  3married  u

公司溢出效应
log(outputt )  t  1 log(labort )  2 log(capitalt )  3spillovert  quality  ut , t  1,2,3
发展研究院




(二)条件期望(均值)概念
1、为什么条件期望是重要的?
统计学的视角
假定利用过去的信息It-1预测Yt。令g(It-1)是Yt
的预测算子,则预测误差为:
ut  Yt  g ( It 1 )


如何判断模型的预测效果?
对预测误差的判断
发展研究院


常用的统计标准:
MSE
MSE  E[Yt  g ( It 1 )]
2

定理:根据MSE标准对于Yt而言,条件均值就
是Yt最好的估计量。即:
t  arg min MSE ( g )
g (.)
这里t  E (Yt / I t 1 )


问题:线性回归的局限性?例:消费函数
结论:条件期望是一个最优的预测算子。
发展研究院

至此,可以写成下式:
Yt  t   t 这里E( t / It 1 )  0(MDS )

也可以写成下式:
Yt  tt 这里E(t / It 1 )  1而E(1 t 1 )为MDS过程.

例:持续失业时间、股票价格变动时间(ACD模
型)
发展研究院

如果判断误差的标准不是MSE,则最优的预测算
子不是MSE,目标函数变为MAE则最优的预测算
子则是条件中位数。
MAE( g )  E Yt  g (It 1 )


这时最优的估计量为:条件中位数
g *(Qt 1 )  Qt (1/ 2)
例:线性指数模型(损失成本)
L(et )  exp( et )  1   et
et  1  g ( I t 1 )
发展研究院


经济学视角:
例:消费平滑:理性预期与Hall的随机游走理论
(Random walk)

max Et   jU (Ct  j ),0    1
{Ct }
t 0
s.t. At 1  Rt 1 ( At  Yt  Ct )
常见的u (.)的形式
1 U (Ct )  a  bCt  cCt2 b  0, C.0
2 (CRRA) U (Ct )  (Ct  1) /    0
u(Ct )
 
u(Ct )
3 U (Ct )  ln(Ct )
4 U (Ct )   exp( Ct )
发展研究院

我们有

由此出发推导霍尔(1978)的随机游走:
Et [U (Ct 1 ) Rt 1 ]  u(Ct )
Et [U (Ct ) Rt ]  u(Ct 1 )
Ct  Ct 1   t


假设收益率是固定的:Rt=R>0
则消费的跨期效用可以写为:
1

Et [U (Ct )t 1 / I t 1 ]  (  R) u (Ct 1 )
上式可以写为:
u(Ct )  (  R) 1 u (Ct 1 )   t
这里 : E ( t / I t 1 )  0
发展研究院

考虑一种消费函数形式:CRRA
如果u (Ct )  Ct 1 , 有 :
E (Ct 1 / I t 1 )  (  R) 1 Ct11
Ct 1  (  R)1 Ct11   t

考虑另一种消费函数形式:二项式
如果u (Ct )  a  bCt  cCt2 , 有 :
u(Ct )  b  2cCt
E (U (Ct ))  (  R) 1U (Ct 1 )  
Ct   0  1Ct 1   t
如果 R  1 有Ct  Ct 1   t
E (Ct | I t 1 )  Ct 1
发展研究院
2、条件期望的特征

定义:
设y表示一个随机变量, 设xk  ( x1, x2 , x3..., xk )表示1 K的解释变量的随机向量.
若E( y )  , 那么存在一个函数, 例如 :  : R K  R, 使得:
E( y| x1, x2 , x3..., xk ) = ( x1, x2 , x3..., xk )

例如:若y是工资,且x包括各种各样的个体特征,
如教育、经历以及IQ,则E(wage|educ,exper,IQ)
表示给定educ值、exper值以及IQ值时工资水平
wage的平均值。
发展研究院
发展研究院
部分效应、弹性及半弹性


确定y=f(x)
寻找x变化时y是如何变化的?
E ( y | x) 
 ( x)
x j x1 ,....., x j 1 , x j 1 ,......xK固定不变
x j
E ( y | x)对x j的偏导数通常称为x j 对E ( y | x)的部分效应.
例 : E ( y | x1 , x2 )  0  1 x1  2 x2
E ( y | x)
E ( y | x)
可以得出:
 1
 2
x1
x2
例 : E ( y | x1 , x2 )  0  1 x1  2 x2  3 x2 2
可以得出 :
E ( y | x)
E ( y | x)
 1
 2  23 x2
x1
x2
发展研究院

有时对部分效应的特殊函数感兴趣。如弹性。
y x j f ( x) x j



x j y
x j
f ( x)



为什么要用右式?
当y与x都是随机变量时, f ( x)   ( x)
则有: E ( y | x)  x j   ( x)  x j
x j
E ( y | x)
x j
 ( x)
其中E ( y | x)  0, 且x j  0, 上式与
[log E ( y | x)]
是相同的
 log( x j )
发展研究院

若弹性的定义取一个自然对数是线性的模型,若
y>0,xj>0, 我们可以将弹性定义为
E[log( y ) | x]
 log( x j )
若 log( y)  g ( x)  u E (u / x)  0,

则两种弹性定义的表达式相同吗?
在很大程度上,当y>0时,期望的对数和对数的期
望处理成相同是没有什么损失 的,只要log(y)与
log(xj)定义恰当。
发展研究院


条件期望的若干性质:
期望迭代定律(law of iterate expectation,LIE)
E ( y )  E[ E ( y | x)]  E[  ( x)]
假定w是一个随机向量, y是一个随机变量.设x是w
某一函数的一个随机向量,比如说x  f ( w).这一表
述意味着一旦知道w的结果, 就可以得出x的结果.
则LIE的表述是 :
E[ y | x]  E[ E ( y | w) | x]
E[ y | x]  E[ E ( y | x) | w]
发展研究院

出于多种目的考虑,需要用LIE的一般特例:
如果x, z是任意的随机向量, 那么
E (Y | x)  E[ E (Y | x, z ) | x]
或者, 定义1 ( x, z )  E ( y | x, z )以及2 ( x)  E ( y | x)
2 ( x)  E[ 1 ( x, z ) | x]

LIE的一般形式中还有一些其他的有益应用。假
定对某一个(向量)函数地f(x)与一个实值函数
g(.)来说,
E ( y | x)  g ( f ( x))
于是E[ y | f ( x)]  E ( y | x)  g[ f ( x)]
发展研究院

例:如果一个工资方
程是:
E (wage / educ,exp er )   0  1educ   2 exp er  3 exp er 2
  4educ  exp er

则:
E(wage / educ, exp er, exp er 2 , educ  exp er )  ?
发展研究院
 3、条件期望的误差形式
y  E ( y | x)  u
E (u | x)  0
E (u | x)  0具有重要含义 :
(1) E(u)  0
 2 u与x1 , x2 ......xk的任何函数不相关
发展研究院
4、线性投影
定义经x  ( x1 ,....xk )为一个1 K向量, 并且假定x的K  K 方差矩阵
是非奇异的. 则有y在1, x1 , x2 ....xk 上的线性投影总是存在的, 且是
唯一的:
L( y| 1, x1 , x2 ....xk )  L( y |1, x)  0  1 x1   2 x2  ......   K xK  0  x
给定上式的线性投影,总可以写成:
y   0  1 x1   2 x2  ......   K xK  u
其中误差项u具有下述性质 : E (u )  
2
且E (u )  0, COV ( x j , u )  0, j  1, 2....., K
发展研究院
二、常用软件

Eview(3.0,5.0,6.0)

EViews是在大型计算机的TSP (Time Series Processor)
软件包基础上发展起来的新版本,是一组处理时间序列数
据 的 有 效 工 具 , 1981 年 Micro TSP 面 世 , 1994 年 QMS
(Quantitative Micro Software) 公司在Micro TSP基础
上直接开发成功EViews并投入使用。虽然EViews是由经济
学家开发的并大多在经济领域应用,但它的适用范围不应
只局限于经济领域。
发展研究院

Stata(8.0,9.0,10.0)
 能够进行大多数统计分析(回归分析,logistic回归,生存
分析,方差分析,因子分析,以及一些多变量分析)。
Stata最大的优势可能在于回归分析(它包含易于使用的
回归分析特征工具),logistic回归(附加有解释logistic回
归结果的程序,易用于有序和多元logistic回归)。Stata
也有一系列很好的稳健方法,包括稳健回归,稳健标准误
的回归,以及其他包含稳健标准误估计的命令。此外,在
调查数据分析领域,Stata有着明显优势,能提供回归分
析,logistic回归,泊松回归,概率回归等的调查数据分析。
它的不足之处在于方差分析和传统的多变量方法(多变量
方差分析,判别分析等)。
 http://www.cpc.unc.edu/services/computer/presentations/
statatutorial
 http://www.stata.com/
发展研究院

Sas
 能够进行大多数统计分析(回归分析,logistic回归,

生存分析,方差分析,因子分析,多变量分析)。
SAS的最优之处可能在于它的方差分析,混合模型分
析和多变量分析,而它的劣势主要是有序和多元
logistic回归(因为这些命令很难),以及稳健方法
(它难以完成稳健回归和其他稳健方法)。尽管支持
调查数据的分析,但与Stata比较仍然是相当有限的。
matlab
 空间计量、非参
发展研究院
参考文献
Yongmiao Hong, Advanced Econometrics,
Lecture Note
 伍德里奇,横截面与面板数据的经济计量
分析,中国人民大学出版社,2007年
 高铁梅,计量经济分析与建模:EVIEW应
用与实例,清华大学出版社

发展研究院