Transcript 第7章面板数据回归分析
第7章
面板数据回归分析
面板数据回归分析
7.1 面板数据模型
7.1.1 面板数据
7.1.2 面板数据模型
7.2 固定效应模型估计
7.2.1 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
面板数据回归分析
7.3 随机效应模型估计
7.3.1 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模
型
7.4 固定效应还是随机效应?
—Hausman检验
7.4.1 Hausman检验原理
7.4.2用EViews7.2进行Hausman检验
重要概念
面板数据回归分析
7.1 面板数据模型
7.1.1 面板数据
7.1.2 面板数据模型
7.1 面板数据模型
7.1.1 面板数据
N
面板数据有横截面和时间两个维度,
T 个观测时期,样本个体表
个横截面个体、
N
T
示为
远大于
,称之为短面板,
Yit ,若
本书只讨论短面板。
Y11 Y21 YN 1
Y12 Y22 YN 2
Y1T Y2T YNT
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
将Excel中数据导入EViews,排列方式为无结
构/不按日期的数据(Unstructured/Undated)
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
点击工作文件界面上的按钮Range,
在弹出的Workfile Structure对话框的Workfile
type栏内选择Dated Panel,
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
并在Panel identifier series(面板识别变量)下的
第一栏Cross section ID series(横截面识别变量)
内输入变量名dq(地区),在第二栏Date series
(日期识别变量)内输入变量名year:
点击OK,数据按面板数据排列:
7.1 面板数据模型
7.1.1 面板数据
EViews中存放面板数据:
7.1 面板数据模型
7.1.2 面板数据模型
Yit i 0 1 X1it 2 X 2it 3 X 3it uit ,
i 1,2,, N ; t 1,2,, T
i
为个体的异质性,不可观测
假设1:
E(uis | X1it , X 2it , X 3it ) 0,
s, t 1,2,, T , i 1,2,, N
7.1 面板数据模型
7.1.2 面板数据模型
Yit i 0 1 X1it 2 X 2it 3 X 3it uit ,
i 1,2,, N ; t 1,2,, T
假设 2: Var (u ) 2 ,
it
u
Cov(uit , uis ) E(uituis ) 0, t s,
Cov(uit , u jt ) E(uitu jt ) 0, i j ,
Cov(uit , u js ) E(uitu js ) 0, (i, t ) ( j , s),
i 1,2,, N ; t 1,2,, T
7.1 面板数据模型
7.1.2 面板数据模型
面板数据模型
不可观测的个体异质性
例子7.1 经济发展与污水排放
log(POL2it ) i 0 1 log(GDPit / POPit )
2 log(CONSPit ) 3 log(POPit ) u
例子7.2 教育的回报
Lwagei abli 0 1educi 2experi 3experi 2 4unioni
5 Blacki 6 Hoursi ui i 1,2,, N
• 由于不可观测的地区和个人能力带来的内生性,
使上述估计不一致。
面板数据模型
固定效应模型和随机效应模型
Yit i 0 1 X1it 2 X 2it 3 X 3it uit ,
i 1,2,, N ; t 1,2,, T
定义7.1 固定效应和随机效应
上述模型中的不可观测变量 i
(1)与回归自变量相关,称之为固定效应模型;
(2)与回归自变量不相关,称之为随机效应模型。
• 固定效应将 i
消掉,随机效应则将其
放入误差项,然后探索方差结构。
7.2 固定效应模型估计
7.2.1 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
7.2 固定效应模型估计
7.2.1 固定效应模型估计
核心是消掉个体异质性变量 i
Yit i 0 1 X 1it 2 X 2it 3 X 3it uit ,
i 1,2,, N ; t 1,2,, T
Yi i 0 1 X1i 2 X 2i 3 X 3i ui ,
i 1,2,, N
Yit Yi 1 ( X1it X1i ) 2 ( X 2it X 2i ) 3 ( X 3it X 3i ) uit ui ,
i 1,2,, N ; t 1,2,, T
上述模型的OLS估计称之为固定效应估计
(Fixed effect)
7.2 固定效应模型估计
7.2.1 固定效应模型估计
例子7.1 经济发展与污水排放
例子7.2 教育的回报
Lwageit abli 0 1educit 2experit 3experit2 4unionit
5 Blackit 6 Hoursit uit
i 1,2,, N ; t 1,2,, T
• 若采用普通的FE方法,教育变量会被消除掉,
故不能被估计教育的回报。但若采用教育
变量和年份虚拟变量相乘的方法,则可以
估计:
7.2 固定效应模型估计
7.2.1 固定效应模型估计
例子7.2 教育的回报
定义虚拟变量
1, 198t
d 8t
, t 1,2,,7
0, otherwise
Lwageit abli 0 1educit d81 1educit d82 1educit d87
2experit 3experit2 4unionit 6 Hoursit uit
i 1,2,, N ; t 1,2,, T
此时相减不至于消去教育变量,但是此时i 表示
的是相对于1980年,教育对收入的影响大小。
7.2 固定效应模型估计
7.2.1 固定效应模型估计
FD估计(First Difference):
Yit 1X1it 2X 2it 3X 3it uit
其中, Zit Zit Zi,t1
如果变量取值不随时间变化,差分后的模型在消
去i 的同时,也将该变量消去,对应的回归系数
无法估计。
FD估计导致变量变化减少,估计出参数方
差较大,效率比FE低。
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作:
在工作文件界面选中参与回归的变量并以组打开,
在文件表格界面点击Proc→Make Equation进入模
型设定界面完成模型设定。
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作:
点击Panel Options选项,进入面板数据模型设定界
面。第一栏选择固定效应(fixed),第二栏选择
无时间异质性 变量(none),第三栏选择GLS时
的权重(Cross-section weight),
第四栏选择协方差估计
方法(White cross-section),
最后一栏选择是否调整自由度
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.1 的EViews操作:
完成选择后点击OK得出参数估计输出结果:
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.2 教育的回报
EViews操作:
为避免教育变量被消掉,采用前面介绍的虚拟
变量与教育变量相乘作为新的自变量,并将不关
心的不随时间变化的自变量去掉(否则无法估
计!),如种族变量 black,然后按上面的操作,
最终输出结果:
7.2 固定效应模型估计
7.2.2 用EViews7.2估计固定效应模型
例子7.2 教育的回报
EViews操作:
7.3 随机效应模型估计
7.3.1 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit 0 1 X 1it 2 X 2it 3 X 3it vit ,
vit i uit , i 1,2,, N ; t 1,2,, T
• 随机效应假设了 i 与模型自变量不相关,
因此关心的问题不再是内生性,而是如何
提高估计的有效性,即探索复合误差项
vit i uit 的方差结构。
7.3 随机效应模型估计
7.3.1 随机效应模型估计
假设3:不可观测异质性满足
(1)i , i 1,2,, N
独立;
uit
(2) i 与
独i 1,2,, N , t 1,2,,T
立,E(i ) 0 ; Var(i ) 2 , i 1,2,, N
(3)
。
;
7.3 随机效应模型估计
7.3.1 随机效应模型估计
结论1:随机效应模型复合误差项的性质
如果面板数据模型的误差项 uit 和个体异质
性 i 满足假设1-假设3,则 vit 满足
(1)对任何的 i, j 和 t, s ,vit 与 X1 js , X 2 js , X 3 js
不相关;
(2)对任何的 i 和 t, s 有
v2 Var (vit ) 2 u2 ; Cov(vit , vis ) 2 , t s
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit 0 1 X 1it 2 X 2it 3 X 3it vit ,
vit i uit , i 1,2,, N ; t 1,2,, T
• 上述模型不存在内生性,OLS估计有一致性,但是 vit
不满足不相关假设,OLS估计不是最优估计,要获得
最优估计,需要作变换
Yit Yi 0 (1 ) 1 ( X 1it X 1i ) 2 ( X 2it X 2i ) 3 ( X 3it X 3i ) it
it vit vi (1 ) i (uit ui ) (习题7.6证明)
i 1,2,, N ; t 1,2,, T
• 上述模型的OLS估计称之为随机效应模型估计
(random effect)
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit 0 1 X 1it 2 X 2it 3 X 3it vit ,
vit i uit , i 1,2,, N ; t 1,2,, T
• 随机效应与固定效应估计相似,
固定效应处
1
随机效应处
u
1
1 2
1
2
2
2
1 T ( / u )
u T
7.3 随机效应模型估计
7.3.1 随机效应模型估计
Yit 0 1 X 1it 2 X 2it 3 X 3it vit ,
vit i uit , i 1,2,, N ; t 1,2,, T
• 估计随机效应,首先要估计 ,故先要估
计 2 和 u2
2
2
• 估计 和 u 的方法有三种:
Swamy-Arora、Wallace-Hussain和WansbeekKapteyn方法,常用第一种方法
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
数据导入、数据结构转换以及模型设定与
固定效应模型估计一样,不同的是在panel
2
option的cross section中选Random,还有
2
和u 的估计方法
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
例子7.1 输出结果:
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
由于随机效应模型不再消掉不随时间
变化的自变量,故这些解释变量都可以在模
型中保留下来。
例子7.2的EViews回归结果
7.3 随机效应模型估计
7.3.2 用EViews7.2估计随机效应模型
例子7.2的EViews回归结果
7.4 固定效应还是随机效应?
——Hausman检验
7.4.1 Hausman检验原理
7.4.2用EViews7.2进行Hausman检验
7.4 固定效应还是随机效应?
——Hausman检验
7.4.1 Hausman检验原理
比较随机效应和固定效应下参数估计是否有
差别,若差别显著,则认为应采用固定效应
(稳健优先):若不显著,则认为应采用随
机效应(效率优先)。
Hausman检验构造的统计量只对斜率系数进
行比较。
7.4 固定效应还是随机效应?
——Hausman检验
7.4.1 Hausman检验原理
Yit i 0 1 X1it 2 X 2it 3 X 3it uit
假设三个斜率参数的固定效应估计和随机
FE ˆ FE ˆ FE
RE ˆ RE ˆ RE
ˆ
ˆ
,
,
效应估计分别为 1 2 3 和 1 , 2 , 3
• 可以对整体模型进行Hausman检验,如:用
(ˆ FE ˆ RE )2
1
1
(ˆ FE ˆ RE )2
2
2
(ˆ FE ˆ RE )2
、3
3
2
、
构造
分布
• 也可对单个参数进行Hausman检验,如:
ˆ1FE ˆ1RE
t1
Var(Diff)
~ ( a ) N (0,1)
7.4 固定效应还是随机效应?
——Hausman检验
7.4.2 用EViews7.2进行Hausman检验
首先进行随机效应模型估计,在估计结果界面进行
相应的操作,在随机效应估计结果界面点击
View→Fixed/Random Effects Testing→Correlated
Random Effects-Hausman Test,弹出如下检验结果
7.4 固定效应还是随机效应?
——Hausman检验
7.4.2 用EViews7.2进行Hausman检验
•
Hausman检验需要对固定效应模型进行检
验,因此不能包含不随时间变化的自变量
(除了个体异质性)。所以不能对例子7.2进
行
Hausman检验。
重要概念
1. 横截面上若干多个时期的观测值形成面板数据。
由于来自两个维度,面板数据在增加样本量的同时,
也比单纯的横截面数据具有更为复杂的结构。
2. 板数据模型包含个体不可观测异质性i
,并 i
根据 与模型自变量的关系将模型分为固定效应模
型和随机效应模型。
3. i
与自变量相关时,面板数据模型称为固定
i
效应模型。
并入误差项会引起自变量的内生性,
导致回归系数的OLS估计不是一致估计。要估计固
i
定效应模型,需要将
消掉,固定效应估计方
i
法采用将模型变量减去组内均值的方法消
掉
。
重要概念
4. i 与自变量不相关时,面板数据模型称为
i
随机效应模型。
并入误差项不会引起自变
量的内生性,回归系数的OLS估计不一致估计。
随机效应估计方法的核心,是利用复合误差
项的特殊结构,更加有效地估计回归系数。
随机效应估计方法首先对模型变量进行变换,
将变量减去权重系数
乘以组内均值,然
后对变换后变量形成的模型实施OLS估计。随
机效应模型估计中,权重系数的计算是关键。
权重系数 的计算有三种不同方法,
EViews操作可以进行选择。
重要概念
5. 确定采用固定效应模型还是随机效应模型
时,需要进行Hausman检验。Hausman检验
的想法是将两种模型的参数估计结果进行
比较,以确定是否有显著差别,如果有,
则认为固定效应模型是合适模型,如果没
有则可以采用随机效应模型。