1736-经济数据分析第二讲
Download
Report
Transcript 1736-经济数据分析第二讲
第一部分
背景知识
常用软件入门
发展研究院
一、背景知识
(一)因果关系及其余条件不变分析
举例:工资的决定
(1)一个变量的变化会引起另一个变量的变动吗?
(2)模型假设保持其他因素固定不变,建立因果
关系,但是这种因果关系确实存在吗?
在多数对经济理论的检验中,经济学家的目标就是要
推定一个变量对另一个变量的因果性效应.
其他条件不变——意味着其他因素保持不变的概念
在因果分析中的重要作用。
发展研究院
计量经济学方法可以有效的保持其他因素不变:
怎样做呢?
关注平均或期望的响应上,即
估计y关于x与C的条件期望E( y x, c) ,向量c是控制变量
存在的问题是什么?
选定正常控制一览表困难,运用不同的控制能够
导致y与x之间因果关系的不同结果,这正是确立
因果性复杂的地方。(信息集的影响)
其他问题也会妨碍对因果关系的估计。例如:有C
的元素适当的测量值,但是仍然没有y或w的适合
的测量值。
发展研究院
(二)随机设置与渐近分析
随机抽样假定(1)设立一个总体模型
(2)i.i.d样本可以从总体中抽取出来
分析重点:与有限样本性质相反的估计量的渐近
性质。
例:工资报价函数
log(wage) 0 1educ 2 exp er 3married u
公司溢出效应
log(outputt ) t 1 log(labort ) 2 log(capitalt ) 3spillovert quality ut , t 1,2,3
发展研究院
(二)条件期望(均值)概念
1、为什么条件期望是重要的?
统计学的视角
假定利用过去的信息It-1预测Yt。令g(It-1)是Yt
的预测算子,则预测误差为:
ut Yt g ( It 1 )
如何判断模型的预测效果?
对预测误差的判断
发展研究院
常用的统计标准:
MSE
MSE E[Yt g ( It 1 )]
2
定理:根据MSE标准对于Yt而言,条件均值就
是Yt最好的估计量。即:
t arg min MSE ( g )
g (.)
这里t E (Yt / I t 1 )
问题:线性回归的局限性?例:消费函数
结论:条件期望是一个最优的预测算子。
发展研究院
至此,可以写成下式:
Yt t t 这里E( t / It 1 ) 0(MDS )
也可以写成下式:
Yt tt 这里E(t / It 1 ) 1而E(1 t 1 )为MDS过程.
例:持续失业时间、股票价格变动时间(ACD模
型)
发展研究院
如果判断误差的标准不是MSE,则最优的预测算
子不是MSE,目标函数变为MAE则最优的预测算
子则是条件中位数。
MAE( g ) E Yt g (It 1 )
这时最优的估计量为:条件中位数
g *(Qt 1 ) Qt (1/ 2)
例:线性指数模型(损失成本)
L(et ) exp( et ) 1 et
et 1 g ( I t 1 )
发展研究院
经济学视角:
例:消费平滑:理性预期与Hall的随机游走理论
(Random walk)
max Et jU (Ct j ),0 1
{Ct }
t 0
s.t. At 1 Rt 1 ( At Yt Ct )
常见的u (.)的形式
1 U (Ct ) a bCt cCt2 b 0, C.0
2 (CRRA) U (Ct ) (Ct 1) / 0
u(Ct )
u(Ct )
3 U (Ct ) ln(Ct )
4 U (Ct ) exp( Ct )
发展研究院
我们有
由此出发推导霍尔(1978)的随机游走:
Et [U (Ct 1 ) Rt 1 ] u(Ct )
Et [U (Ct ) Rt ] u(Ct 1 )
Ct Ct 1 t
假设收益率是固定的:Rt=R>0
则消费的跨期效用可以写为:
1
Et [U (Ct )t 1 / I t 1 ] ( R) u (Ct 1 )
上式可以写为:
u(Ct ) ( R) 1 u (Ct 1 ) t
这里 : E ( t / I t 1 ) 0
发展研究院
考虑一种消费函数形式:CRRA
如果u (Ct ) Ct 1 , 有 :
E (Ct 1 / I t 1 ) ( R) 1 Ct11
Ct 1 ( R)1 Ct11 t
考虑另一种消费函数形式:二项式
如果u (Ct ) a bCt cCt2 , 有 :
u(Ct ) b 2cCt
E (U (Ct )) ( R) 1U (Ct 1 )
Ct 0 1Ct 1 t
如果 R 1 有Ct Ct 1 t
E (Ct | I t 1 ) Ct 1
发展研究院
2、条件期望的特征
定义:
设y表示一个随机变量, 设xk ( x1, x2 , x3..., xk )表示1 K的解释变量的随机向量.
若E( y ) , 那么存在一个函数, 例如 : : R K R, 使得:
E( y| x1, x2 , x3..., xk ) = ( x1, x2 , x3..., xk )
例如:若y是工资,且x包括各种各样的个体特征,
如教育、经历以及IQ,则E(wage|educ,exper,IQ)
表示给定educ值、exper值以及IQ值时工资水平
wage的平均值。
发展研究院
发展研究院
部分效应、弹性及半弹性
确定y=f(x)
寻找x变化时y是如何变化的?
E ( y | x)
( x)
x j x1 ,....., x j 1 , x j 1 ,......xK固定不变
x j
E ( y | x)对x j的偏导数通常称为x j 对E ( y | x)的部分效应.
例 : E ( y | x1 , x2 ) 0 1 x1 2 x2
E ( y | x)
E ( y | x)
可以得出:
1
2
x1
x2
例 : E ( y | x1 , x2 ) 0 1 x1 2 x2 3 x2 2
可以得出 :
E ( y | x)
E ( y | x)
1
2 23 x2
x1
x2
发展研究院
有时对部分效应的特殊函数感兴趣。如弹性。
y x j f ( x) x j
x j y
x j
f ( x)
为什么要用右式?
当y与x都是随机变量时, f ( x) ( x)
则有: E ( y | x) x j ( x) x j
x j
E ( y | x)
x j
( x)
其中E ( y | x) 0, 且x j 0, 上式与
[log E ( y | x)]
是相同的
log( x j )
发展研究院
若弹性的定义取一个自然对数是线性的模型,若
y>0,xj>0, 我们可以将弹性定义为
E[log( y ) | x]
log( x j )
若 log( y) g ( x) u E (u / x) 0,
则两种弹性定义的表达式相同吗?
在很大程度上,当y>0时,期望的对数和对数的期
望处理成相同是没有什么损失 的,只要log(y)与
log(xj)定义恰当。
发展研究院
条件期望的若干性质:
期望迭代定律(law of iterate expectation,LIE)
E ( y ) E[ E ( y | x)] E[ ( x)]
假定w是一个随机向量, y是一个随机变量.设x是w
某一函数的一个随机向量,比如说x f ( w).这一表
述意味着一旦知道w的结果, 就可以得出x的结果.
则LIE的表述是 :
E[ y | x] E[ E ( y | w) | x]
E[ y | x] E[ E ( y | x) | w]
发展研究院
出于多种目的考虑,需要用LIE的一般特例:
如果x, z是任意的随机向量, 那么
E (Y | x) E[ E (Y | x, z ) | x]
或者, 定义1 ( x, z ) E ( y | x, z )以及2 ( x) E ( y | x)
2 ( x) E[ 1 ( x, z ) | x]
LIE的一般形式中还有一些其他的有益应用。假
定对某一个(向量)函数地f(x)与一个实值函数
g(.)来说,
E ( y | x) g ( f ( x))
于是E[ y | f ( x)] E ( y | x) g[ f ( x)]
发展研究院
例:如果一个工资方
程是:
E (wage / educ,exp er ) 0 1educ 2 exp er 3 exp er 2
4educ exp er
则:
E(wage / educ, exp er, exp er 2 , educ exp er ) ?
发展研究院
3、条件期望的误差形式
y E ( y | x) u
E (u | x) 0
E (u | x) 0具有重要含义 :
(1) E(u) 0
2 u与x1 , x2 ......xk的任何函数不相关
发展研究院
4、线性投影
定义经x ( x1 ,....xk )为一个1 K向量, 并且假定x的K K 方差矩阵
是非奇异的. 则有y在1, x1 , x2 ....xk 上的线性投影总是存在的, 且是
唯一的:
L( y| 1, x1 , x2 ....xk ) L( y |1, x) 0 1 x1 2 x2 ...... K xK 0 x
给定上式的线性投影,总可以写成:
y 0 1 x1 2 x2 ...... K xK u
其中误差项u具有下述性质 : E (u )
2
且E (u ) 0, COV ( x j , u ) 0, j 1, 2....., K
发展研究院
二、常用软件
Eview(3.0,5.0,6.0)
EViews是在大型计算机的TSP (Time Series Processor)
软件包基础上发展起来的新版本,是一组处理时间序列数
据 的 有 效 工 具 , 1981 年 Micro TSP 面 世 , 1994 年 QMS
(Quantitative Micro Software) 公司在Micro TSP基础
上直接开发成功EViews并投入使用。虽然EViews是由经济
学家开发的并大多在经济领域应用,但它的适用范围不应
只局限于经济领域。
发展研究院
Stata(8.0,9.0,10.0)
能够进行大多数统计分析(回归分析,logistic回归,生存
分析,方差分析,因子分析,以及一些多变量分析)。
Stata最大的优势可能在于回归分析(它包含易于使用的
回归分析特征工具),logistic回归(附加有解释logistic回
归结果的程序,易用于有序和多元logistic回归)。Stata
也有一系列很好的稳健方法,包括稳健回归,稳健标准误
的回归,以及其他包含稳健标准误估计的命令。此外,在
调查数据分析领域,Stata有着明显优势,能提供回归分
析,logistic回归,泊松回归,概率回归等的调查数据分析。
它的不足之处在于方差分析和传统的多变量方法(多变量
方差分析,判别分析等)。
http://www.cpc.unc.edu/services/computer/presentations/
statatutorial
http://www.stata.com/
发展研究院
Sas
能够进行大多数统计分析(回归分析,logistic回归,
生存分析,方差分析,因子分析,多变量分析)。
SAS的最优之处可能在于它的方差分析,混合模型分
析和多变量分析,而它的劣势主要是有序和多元
logistic回归(因为这些命令很难),以及稳健方法
(它难以完成稳健回归和其他稳健方法)。尽管支持
调查数据的分析,但与Stata比较仍然是相当有限的。
matlab
空间计量、非参
发展研究院
参考文献
Yongmiao Hong, Advanced Econometrics,
Lecture Note
伍德里奇,横截面与面板数据的经济计量
分析,中国人民大学出版社,2007年
高铁梅,计量经济分析与建模:EVIEW应
用与实例,清华大学出版社
发展研究院