第7章面板数据回归分析

Download Report

Transcript 第7章面板数据回归分析

第7章
面板数据回归分析
面板数据回归分析
7.1 面板数据模型
7.1.1 面板数据
7.1.2 面板数据模型
7.2 固定效应模型估计
7.2.1 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
面板数据回归分析
7.3 随机效应模型估计
7.3.1 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模
型
7.4 固定效应还是随机效应?
—Hausman检验
7.4.1 Hausman检验原理
7.4.2用EViews7.2进行Hausman检验
重要概念
面板数据回归分析
7.1 面板数据模型
7.1.1 面板数据
7.1.2 面板数据模型
7.1 面板数据模型
7.1.1 面板数据
N
面板数据有横截面和时间两个维度,
T 个观测时期,样本个体表
个横截面个体、
N
T
示为
远大于
,称之为短面板,
Yit ,若
本书只讨论短面板。
Y11 Y21  YN 1
Y12 Y22  YN 2




Y1T Y2T  YNT
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
将Excel中数据导入EViews,排列方式为无结
构/不按日期的数据(Unstructured/Undated)
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
点击工作文件界面上的按钮Range,
在弹出的Workfile Structure对话框的Workfile
type栏内选择Dated Panel,
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
并在Panel identifier series(面板识别变量)下的
第一栏Cross section ID series(横截面识别变量)
内输入变量名dq(地区),在第二栏Date series
(日期识别变量)内输入变量名year:
点击OK,数据按面板数据排列:
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
7.1 面板数据模型
7.1.2 面板数据模型
Yit  i  0  1 X1it  2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
i
为个体的异质性,不可观测
假设1:
E(uis | X1it , X 2it , X 3it )  0,
s, t  1,2,, T , i  1,2,, N
7.1 面板数据模型
7.1.2 面板数据模型
Yit  i  0  1 X1it  2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
 假设 2: Var (u )   2 ,
it
u
Cov(uit , uis )  E(uituis )  0, t  s,
Cov(uit , u jt )  E(uitu jt )  0, i  j ,
Cov(uit , u js )  E(uitu js )  0, (i, t )  ( j , s),
i  1,2,, N ; t  1,2,, T
7.1 面板数据模型
7.1.2 面板数据模型
面板数据模型
不可观测的个体异质性
例子7.1 经济发展与污水排放
log(POL2it )  i  0  1 log(GDPit / POPit )
  2 log(CONSPit )  3 log(POPit )  u
例子7.2 教育的回报
Lwagei  abli   0  1educi   2experi  3experi 2   4unioni
 5 Blacki   6 Hoursi  ui i  1,2,, N
• 由于不可观测的地区和个人能力带来的内生性,
使上述估计不一致。
面板数据模型
固定效应模型和随机效应模型
Yit   i  0  1 X1it   2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
定义7.1 固定效应和随机效应
上述模型中的不可观测变量 i
(1)与回归自变量相关,称之为固定效应模型;
(2)与回归自变量不相关,称之为随机效应模型。
• 固定效应将 i
消掉,随机效应则将其
放入误差项,然后探索方差结构。
7.2 固定效应模型估计
7.2.1 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
7.2 固定效应模型估计
7.2.1 固定效应模型估计
核心是消掉个体异质性变量 i
Yit   i   0  1 X 1it   2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
Yi  i  0  1 X1i  2 X 2i  3 X 3i  ui ,
i  1,2,, N
Yit  Yi  1 ( X1it  X1i )   2 ( X 2it  X 2i )  3 ( X 3it  X 3i )  uit  ui ,
i  1,2,, N ; t  1,2,, T
上述模型的OLS估计称之为固定效应估计
(Fixed effect)
7.2 固定效应模型估计
7.2.1 固定效应模型估计
例子7.1 经济发展与污水排放
例子7.2 教育的回报
Lwageit  abli   0  1educit   2experit  3experit2   4unionit
  5 Blackit   6 Hoursit  uit
i  1,2,, N ; t  1,2,, T
• 若采用普通的FE方法,教育变量会被消除掉,
故不能被估计教育的回报。但若采用教育
变量和年份虚拟变量相乘的方法,则可以
估计:
7.2 固定效应模型估计
7.2.1 固定效应模型估计
例子7.2 教育的回报
定义虚拟变量
1, 198t
d 8t  
, t  1,2,,7
0, otherwise
Lwageit  abli   0  1educit  d81  1educit  d82    1educit  d87
  2experit  3experit2   4unionit   6 Hoursit  uit
i  1,2,, N ; t  1,2,, T
此时相减不至于消去教育变量,但是此时i 表示
的是相对于1980年,教育对收入的影响大小。
7.2 固定效应模型估计
7.2.1 固定效应模型估计
FD估计(First Difference):
Yit  1X1it  2X 2it  3X 3it  uit
其中, Zit  Zit  Zi,t1
如果变量取值不随时间变化,差分后的模型在消
去i 的同时,也将该变量消去,对应的回归系数
无法估计。
FD估计导致变量变化减少,估计出参数方
差较大,效率比FE低。
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作:
在工作文件界面选中参与回归的变量并以组打开,
在文件表格界面点击Proc→Make Equation进入模
型设定界面完成模型设定。
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作:
点击Panel Options选项,进入面板数据模型设定界
面。第一栏选择固定效应(fixed),第二栏选择
无时间异质性 变量(none),第三栏选择GLS时
的权重(Cross-section weight),
第四栏选择协方差估计
方法(White cross-section),
最后一栏选择是否调整自由度
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作:
完成选择后点击OK得出参数估计输出结果:
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.2 教育的回报
EViews操作:
为避免教育变量被消掉,采用前面介绍的虚拟
变量与教育变量相乘作为新的自变量,并将不关
心的不随时间变化的自变量去掉(否则无法估
计!),如种族变量 black,然后按上面的操作,
最终输出结果:
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.2 教育的回报
EViews操作:
7.3 随机效应模型估计
7.3.1 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 随机效应假设了 i 与模型自变量不相关,
因此关心的问题不再是内生性,而是如何
提高估计的有效性,即探索复合误差项
vit  i  uit 的方差结构。
7.3 随机效应模型估计
7.3.1 随机效应模型估计
假设3:不可观测异质性满足
(1)i , i  1,2,, N
独立;
uit
(2) i 与
独i  1,2,, N , t  1,2,,T
立,E(i )  0 ; Var(i )  2 , i  1,2,, N
(3)
。
;
7.3 随机效应模型估计
7.3.1 随机效应模型估计
结论1:随机效应模型复合误差项的性质
如果面板数据模型的误差项 uit 和个体异质
性 i 满足假设1-假设3,则 vit 满足
(1)对任何的 i, j 和 t, s ,vit 与 X1 js , X 2 js , X 3 js
不相关;
(2)对任何的 i 和 t, s 有
 v2  Var (vit )  2   u2 ; Cov(vit , vis )  2 , t  s
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 上述模型不存在内生性,OLS估计有一致性,但是 vit
不满足不相关假设,OLS估计不是最优估计,要获得
最优估计,需要作变换
Yit  Yi   0 (1   )  1 ( X 1it  X 1i )   2 ( X 2it  X 2i )  3 ( X 3it  X 3i )   it
 it  vit  vi  (1   ) i  (uit  ui ) (习题7.6证明)
i  1,2,, N ; t  1,2,, T
• 上述模型的OLS估计称之为随机效应模型估计
(random effect)
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 随机效应与固定效应估计相似,
固定效应处
 1
随机效应处
u
1
  1 2
 1
2
2
2
1  T (  /  u )
 u  T 
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 估计随机效应,首先要估计  ,故先要估
计  2 和  u2
2
2
• 估计   和  u 的方法有三种:
Swamy-Arora、Wallace-Hussain和WansbeekKapteyn方法,常用第一种方法
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
数据导入、数据结构转换以及模型设定与
固定效应模型估计一样,不同的是在panel
2

option的cross section中选Random,还有 
2

和u 的估计方法
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
例子7.1 输出结果:
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
由于随机效应模型不再消掉不随时间
变化的自变量,故这些解释变量都可以在模
型中保留下来。
例子7.2的EViews回归结果
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
例子7.2的EViews回归结果
7.4 固定效应还是随机效应?
——Hausman检验
7.4.1 Hausman检验原理
7.4.2用EViews7.2进行Hausman检验
7.4 固定效应还是随机效应?
——Hausman检验
7.4.1 Hausman检验原理
比较随机效应和固定效应下参数估计是否有
差别,若差别显著,则认为应采用固定效应
(稳健优先):若不显著,则认为应采用随
机效应(效率优先)。
Hausman检验构造的统计量只对斜率系数进
行比较。
7.4 固定效应还是随机效应?
——Hausman检验
7.4.1 Hausman检验原理
Yit  i  0  1 X1it  2 X 2it  3 X 3it  uit
假设三个斜率参数的固定效应估计和随机
FE ˆ FE ˆ FE
RE ˆ RE ˆ RE
ˆ
ˆ

,

,


效应估计分别为 1 2 3 和 1 , 2 , 3
• 可以对整体模型进行Hausman检验,如:用
(ˆ FE  ˆ RE )2
1
1
(ˆ FE  ˆ RE )2
2
2
(ˆ FE  ˆ RE )2
、3
3
2
、
构造
分布
• 也可对单个参数进行Hausman检验,如:
ˆ1FE  ˆ1RE
t1 
Var(Diff)
~ ( a ) N (0,1)
7.4 固定效应还是随机效应?
——Hausman检验
7.4.2 用EViews7.2进行Hausman检验
首先进行随机效应模型估计,在估计结果界面进行
相应的操作,在随机效应估计结果界面点击
View→Fixed/Random Effects Testing→Correlated
Random Effects-Hausman Test,弹出如下检验结果
7.4 固定效应还是随机效应?
——Hausman检验
7.4.2 用EViews7.2进行Hausman检验
•
Hausman检验需要对固定效应模型进行检
验,因此不能包含不随时间变化的自变量
(除了个体异质性)。所以不能对例子7.2进
行
Hausman检验。
重要概念
1. 横截面上若干多个时期的观测值形成面板数据。
由于来自两个维度,面板数据在增加样本量的同时,
也比单纯的横截面数据具有更为复杂的结构。
2. 板数据模型包含个体不可观测异质性i
,并 i
根据 与模型自变量的关系将模型分为固定效应模
型和随机效应模型。
3. i
与自变量相关时,面板数据模型称为固定
i
效应模型。
并入误差项会引起自变量的内生性,
导致回归系数的OLS估计不是一致估计。要估计固
i
定效应模型,需要将
消掉,固定效应估计方
i
法采用将模型变量减去组内均值的方法消
掉
。
重要概念
4. i 与自变量不相关时,面板数据模型称为
i
随机效应模型。
并入误差项不会引起自变
量的内生性,回归系数的OLS估计不一致估计。
随机效应估计方法的核心,是利用复合误差
项的特殊结构,更加有效地估计回归系数。
随机效应估计方法首先对模型变量进行变换,
将变量减去权重系数 
乘以组内均值,然
后对变换后变量形成的模型实施OLS估计。随
机效应模型估计中,权重系数的计算是关键。
权重系数  的计算有三种不同方法,
EViews操作可以进行选择。
重要概念
5. 确定采用固定效应模型还是随机效应模型
时,需要进行Hausman检验。Hausman检验
的想法是将两种模型的参数估计结果进行
比较,以确定是否有显著差别,如果有,
则认为固定效应模型是合适模型,如果没
有则可以采用随机效应模型。