第7章面板数据回归分析

Transcript 第7章面板数据回归分析

第7章
面板数据回归分析
面板数据回归分析
7.1 面板数据模型
7.1.1 面板数据
7.1.2 面板数据模型
7.2 固定效应模型估计
7.2.1 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
面板数据回归分析
7.3 随机效应模型估计
7.3.1 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模
型
7.4 固定效应还是随机效应？
—Hausman检验
7.4.1 Hausman检验原理
7.4.2用EViews7.2进行Hausman检验
重要概念
面板数据回归分析
7.1 面板数据模型
7.1.1 面板数据
7.1.2 面板数据模型
7.1 面板数据模型
7.1.1 面板数据
N
面板数据有横截面和时间两个维度，
T 个观测时期，样本个体表
个横截面个体、
N
T
示为
远大于
，称之为短面板，
Yit ，若
本书只讨论短面板。
Y11 Y21  YN 1
Y12 Y22  YN 2




Y1T Y2T  YNT
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据：
将Excel中数据导入EViews，排列方式为无结
构/不按日期的数据（Unstructured/Undated）
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据：
点击工作文件界面上的按钮Range，
在弹出的Workfile Structure对话框的Workfile
type栏内选择Dated Panel，
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据：
并在Panel identifier series（面板识别变量）下的
第一栏Cross section ID series（横截面识别变量）
内输入变量名dq（地区），在第二栏Date series
（日期识别变量）内输入变量名year：
点击OK，数据按面板数据排列:
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据：
7.1 面板数据模型
7.1.2 面板数据模型
Yit  i  0  1 X1it  2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
i
为个体的异质性，不可观测
假设1：
E(uis | X1it , X 2it , X 3it )  0,
s, t  1,2,, T , i  1,2,, N
7.1 面板数据模型
7.1.2 面板数据模型
Yit  i  0  1 X1it  2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
 假设 2： Var (u )   2 ,
it
u
Cov(uit , uis )  E(uituis )  0, t  s,
Cov(uit , u jt )  E(uitu jt )  0, i  j ,
Cov(uit , u js )  E(uitu js )  0, (i, t )  ( j , s),
i  1,2,, N ; t  1,2,, T
7.1 面板数据模型
7.1.2 面板数据模型
面板数据模型
不可观测的个体异质性
例子7.1 经济发展与污水排放
log(POL2it )  i  0  1 log(GDPit / POPit )
  2 log(CONSPit )  3 log(POPit )  u
例子7.2 教育的回报
Lwagei  abli   0  1educi   2experi  3experi 2   4unioni
 5 Blacki   6 Hoursi  ui i  1,2,, N
• 由于不可观测的地区和个人能力带来的内生性，
使上述估计不一致。
面板数据模型
固定效应模型和随机效应模型
Yit   i  0  1 X1it   2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
定义7.1 固定效应和随机效应
上述模型中的不可观测变量 i
（1）与回归自变量相关，称之为固定效应模型；
（2）与回归自变量不相关，称之为随机效应模型。
• 固定效应将 i
消掉，随机效应则将其
放入误差项，然后探索方差结构。
7.2 固定效应模型估计
7.2.1 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
7.2 固定效应模型估计
7.2.1 固定效应模型估计
核心是消掉个体异质性变量 i
Yit   i   0  1 X 1it   2 X 2it  3 X 3it  uit ,
i  1,2,, N ; t  1,2,, T
Yi  i  0  1 X1i  2 X 2i  3 X 3i  ui ,
i  1,2,, N
Yit  Yi  1 ( X1it  X1i )   2 ( X 2it  X 2i )  3 ( X 3it  X 3i )  uit  ui ,
i  1,2,, N ; t  1,2,, T
上述模型的OLS估计称之为固定效应估计
（Fixed effect）
7.2 固定效应模型估计
7.2.1 固定效应模型估计
例子7.1 经济发展与污水排放
例子7.2 教育的回报
Lwageit  abli   0  1educit   2experit  3experit2   4unionit
  5 Blackit   6 Hoursit  uit
i  1,2,, N ; t  1,2,, T
• 若采用普通的FE方法，教育变量会被消除掉，
故不能被估计教育的回报。但若采用教育
变量和年份虚拟变量相乘的方法，则可以
估计：
7.2 固定效应模型估计
7.2.1 固定效应模型估计
例子7.2 教育的回报
定义虚拟变量
1, 198t
d 8t  
, t  1,2,,7
0, otherwise
Lwageit  abli   0  1educit  d81  1educit  d82    1educit  d87
  2experit  3experit2   4unionit   6 Hoursit  uit
i  1,2,, N ; t  1,2,, T
此时相减不至于消去教育变量，但是此时i 表示
的是相对于1980年，教育对收入的影响大小。
7.2 固定效应模型估计
7.2.1 固定效应模型估计
FD估计（First Difference）：
Yit  1X1it  2X 2it  3X 3it  uit
其中， Zit  Zit  Zi,t1
如果变量取值不随时间变化，差分后的模型在消
去i 的同时，也将该变量消去，对应的回归系数
无法估计。
FD估计导致变量变化减少，估计出参数方
差较大，效率比FE低。
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作：
在工作文件界面选中参与回归的变量并以组打开，
在文件表格界面点击Proc→Make Equation进入模
型设定界面完成模型设定。
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作：
点击Panel Options选项，进入面板数据模型设定界
面。第一栏选择固定效应（fixed），第二栏选择
无时间异质性变量（none），第三栏选择GLS时
的权重（Cross-section weight），
第四栏选择协方差估计
方法（White cross-section），
最后一栏选择是否调整自由度
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作：
完成选择后点击OK得出参数估计输出结果:
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.2 教育的回报
EViews操作：
为避免教育变量被消掉，采用前面介绍的虚拟
变量与教育变量相乘作为新的自变量，并将不关
心的不随时间变化的自变量去掉（否则无法估
计！），如种族变量 black，然后按上面的操作，
最终输出结果：
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.2 教育的回报
EViews操作：
7.3 随机效应模型估计
7.3.1 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 随机效应假设了 i 与模型自变量不相关，
因此关心的问题不再是内生性，而是如何
提高估计的有效性，即探索复合误差项
vit  i  uit 的方差结构。
7.3 随机效应模型估计
7.3.1 随机效应模型估计
假设3：不可观测异质性满足
（1）i , i  1,2,, N
独立；
uit
（2） i 与
独i  1,2,, N , t  1,2,,T
立，E(i )  0 ; Var(i )  2 , i  1,2,, N
（3）
。
；
7.3 随机效应模型估计
7.3.1 随机效应模型估计
结论1：随机效应模型复合误差项的性质
如果面板数据模型的误差项 uit 和个体异质
性 i 满足假设1-假设3，则 vit 满足
（1）对任何的 i, j 和 t, s ，vit 与 X1 js , X 2 js , X 3 js
不相关；
（2）对任何的 i 和 t, s 有
 v2  Var (vit )  2   u2 ； Cov(vit , vis )  2 , t  s
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 上述模型不存在内生性，OLS估计有一致性，但是 vit
不满足不相关假设，OLS估计不是最优估计，要获得
最优估计，需要作变换
Yit  Yi   0 (1   )  1 ( X 1it  X 1i )   2 ( X 2it  X 2i )  3 ( X 3it  X 3i )   it
 it  vit  vi  (1   ) i  (uit  ui ) （习题7.6证明）
i  1,2,, N ; t  1,2,, T
• 上述模型的OLS估计称之为随机效应模型估计
（random effect）
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 随机效应与固定效应估计相似，
固定效应处
 1
随机效应处
u
1
  1 2
 1
2
2
2
1  T (  /  u )
 u  T 
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit   0  1 X 1it   2 X 2it  3 X 3it  vit ,
vit   i  uit , i  1,2,, N ; t  1,2,, T
• 估计随机效应，首先要估计  ，故先要估
计  2 和  u2
2
2
• 估计   和  u 的方法有三种：
Swamy-Arora、Wallace-Hussain和WansbeekKapteyn方法，常用第一种方法
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
数据导入、数据结构转换以及模型设定与
固定效应模型估计一样，不同的是在panel
2

option的cross section中选Random，还有 
2

和u 的估计方法
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
例子7.1 输出结果：
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
由于随机效应模型不再消掉不随时间
变化的自变量，故这些解释变量都可以在模
型中保留下来。
例子7.2的EViews回归结果
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
例子7.2的EViews回归结果
7.4 固定效应还是随机效应？
——Hausman检验
7.4.1 Hausman检验原理
7.4.2用EViews7.2进行Hausman检验
7.4 固定效应还是随机效应？
——Hausman检验
7.4.1 Hausman检验原理
比较随机效应和固定效应下参数估计是否有
差别，若差别显著，则认为应采用固定效应
（稳健优先）：若不显著，则认为应采用随
机效应（效率优先）。
Hausman检验构造的统计量只对斜率系数进
行比较。
7.4 固定效应还是随机效应？
——Hausman检验
7.4.1 Hausman检验原理
Yit  i  0  1 X1it  2 X 2it  3 X 3it  uit
假设三个斜率参数的固定效应估计和随机
FE ˆ FE ˆ FE
RE ˆ RE ˆ RE
ˆ
ˆ

,

,


效应估计分别为 1 2 3 和 1 , 2 , 3
• 可以对整体模型进行Hausman检验，如：用
(ˆ FE  ˆ RE )2
1
1
(ˆ FE  ˆ RE )2
2
2
(ˆ FE  ˆ RE )2
、3
3
2
、
构造
分布
• 也可对单个参数进行Hausman检验，如：
ˆ1FE  ˆ1RE
t1 
Var(Diff)
~ ( a ) N (0,1)
7.4 固定效应还是随机效应？
——Hausman检验
7.4.2 用EViews7.2进行Hausman检验
首先进行随机效应模型估计，在估计结果界面进行
相应的操作，在随机效应估计结果界面点击
View→Fixed/Random Effects Testing→Correlated
Random Effects-Hausman Test，弹出如下检验结果
7.4 固定效应还是随机效应？
——Hausman检验
7.4.2 用EViews7.2进行Hausman检验
•
Hausman检验需要对固定效应模型进行检
验，因此不能包含不随时间变化的自变量
(除了个体异质性)。所以不能对例子7.2进
行
Hausman检验。
重要概念
1. 横截面上若干多个时期的观测值形成面板数据。
由于来自两个维度，面板数据在增加样本量的同时，
也比单纯的横截面数据具有更为复杂的结构。
2. 板数据模型包含个体不可观测异质性i
，并 i
根据与模型自变量的关系将模型分为固定效应模
型和随机效应模型。
3. i
与自变量相关时，面板数据模型称为固定
i
效应模型。
并入误差项会引起自变量的内生性，
导致回归系数的OLS估计不是一致估计。要估计固
i
定效应模型，需要将
消掉，固定效应估计方
i
法采用将模型变量减去组内均值的方法消
掉
。
重要概念
4. i 与自变量不相关时，面板数据模型称为
i
随机效应模型。
并入误差项不会引起自变
量的内生性，回归系数的OLS估计不一致估计。
随机效应估计方法的核心，是利用复合误差
项的特殊结构，更加有效地估计回归系数。
随机效应估计方法首先对模型变量进行变换，
将变量减去权重系数 
乘以组内均值，然
后对变换后变量形成的模型实施OLS估计。随
机效应模型估计中，权重系数的计算是关键。
权重系数  的计算有三种不同方法，
EViews操作可以进行选择。
重要概念
5. 确定采用固定效应模型还是随机效应模型
时，需要进行Hausman检验。Hausman检验
的想法是将两种模型的参数估计结果进行
比较，以确定是否有显著差别，如果有，
则认为固定效应模型是合适模型，如果没
有则可以采用随机效应模型。

第7章面板数据回归分析

Transcript 第7章面板数据回归分析

Directory