Transcript 第7章面板数据回归分析
第7章 面板数据回归分析 面板数据回归分析 7.1 面板数据模型 7.1.1 面板数据 7.1.2 面板数据模型 7.2 固定效应模型估计 7.2.1 固定效应模型估计 7.2.2 用EViews7.2估计固定效应模型 面板数据回归分析 7.3 随机效应模型估计 7.3.1 随机效应模型估计 7.3.2 用EViews7.2估计随机效应模 型 7.4 固定效应还是随机效应? —Hausman检验 7.4.1 Hausman检验原理 7.4.2用EViews7.2进行Hausman检验 重要概念 面板数据回归分析 7.1 面板数据模型 7.1.1 面板数据 7.1.2 面板数据模型 7.1 面板数据模型 7.1.1 面板数据 N 面板数据有横截面和时间两个维度, T 个观测时期,样本个体表 个横截面个体、 N T 示为 远大于 ,称之为短面板, Yit ,若 本书只讨论短面板。 Y11 Y21 YN 1 Y12 Y22 YN 2 Y1T Y2T YNT 7.1 面板数据模型 7.1.1 面板数据 EViews中存放面板数据: 将Excel中数据导入EViews,排列方式为无结 构/不按日期的数据(Unstructured/Undated) 7.1 面板数据模型 7.1.1 面板数据 EViews中存放面板数据: 点击工作文件界面上的按钮Range, 在弹出的Workfile Structure对话框的Workfile type栏内选择Dated Panel, 7.1 面板数据模型 7.1.1 面板数据 EViews中存放面板数据: 并在Panel identifier series(面板识别变量)下的 第一栏Cross section ID series(横截面识别变量) 内输入变量名dq(地区),在第二栏Date series (日期识别变量)内输入变量名year: 点击OK,数据按面板数据排列: 7.1 面板数据模型 7.1.1 面板数据 EViews中存放面板数据: 7.1 面板数据模型 7.1.2 面板数据模型 Yit i 0 1 X1it 2 X 2it 3 X 3it uit , i 1,2,, N ; t 1,2,, T i 为个体的异质性,不可观测 假设1: E(uis | X1it , X 2it , X 3it ) 0, s, t 1,2,, T , i 1,2,, N 7.1 面板数据模型 7.1.2 面板数据模型 Yit i 0 1 X1it 2 X 2it 3 X 3it uit , i 1,2,, N ; t 1,2,, T 假设 2: Var (u ) 2 , it u Cov(uit , uis ) E(uituis ) 0, t s, Cov(uit , u jt ) E(uitu jt ) 0, i j , Cov(uit , u js ) E(uitu js ) 0, (i, t ) ( j , s), i 1,2,, N ; t 1,2,, T 7.1 面板数据模型 7.1.2 面板数据模型 面板数据模型 不可观测的个体异质性 例子7.1 经济发展与污水排放 log(POL2it ) i 0 1 log(GDPit / POPit ) 2 log(CONSPit ) 3 log(POPit ) u 例子7.2 教育的回报 Lwagei abli 0 1educi 2experi 3experi 2 4unioni 5 Blacki 6 Hoursi ui i 1,2,, N • 由于不可观测的地区和个人能力带来的内生性, 使上述估计不一致。 面板数据模型 固定效应模型和随机效应模型 Yit i 0 1 X1it 2 X 2it 3 X 3it uit , i 1,2,, N ; t 1,2,, T 定义7.1 固定效应和随机效应 上述模型中的不可观测变量 i (1)与回归自变量相关,称之为固定效应模型; (2)与回归自变量不相关,称之为随机效应模型。 • 固定效应将 i 消掉,随机效应则将其 放入误差项,然后探索方差结构。 7.2 固定效应模型估计 7.2.1 固定效应模型估计 7.2.2 用EViews7.2估计固定效应模型 7.2 固定效应模型估计 7.2.1 固定效应模型估计 核心是消掉个体异质性变量 i Yit i 0 1 X 1it 2 X 2it 3 X 3it uit , i 1,2,, N ; t 1,2,, T Yi i 0 1 X1i 2 X 2i 3 X 3i ui , i 1,2,, N Yit Yi 1 ( X1it X1i ) 2 ( X 2it X 2i ) 3 ( X 3it X 3i ) uit ui , i 1,2,, N ; t 1,2,, T 上述模型的OLS估计称之为固定效应估计 (Fixed effect) 7.2 固定效应模型估计 7.2.1 固定效应模型估计 例子7.1 经济发展与污水排放 例子7.2 教育的回报 Lwageit abli 0 1educit 2experit 3experit2 4unionit 5 Blackit 6 Hoursit uit i 1,2,, N ; t 1,2,, T • 若采用普通的FE方法,教育变量会被消除掉, 故不能被估计教育的回报。但若采用教育 变量和年份虚拟变量相乘的方法,则可以 估计: 7.2 固定效应模型估计 7.2.1 固定效应模型估计 例子7.2 教育的回报 定义虚拟变量 1, 198t d 8t , t 1,2,,7 0, otherwise Lwageit abli 0 1educit d81 1educit d82 1educit d87 2experit 3experit2 4unionit 6 Hoursit uit i 1,2,, N ; t 1,2,, T 此时相减不至于消去教育变量,但是此时i 表示 的是相对于1980年,教育对收入的影响大小。 7.2 固定效应模型估计 7.2.1 固定效应模型估计 FD估计(First Difference): Yit 1X1it 2X 2it 3X 3it uit 其中, Zit Zit Zi,t1 如果变量取值不随时间变化,差分后的模型在消 去i 的同时,也将该变量消去,对应的回归系数 无法估计。 FD估计导致变量变化减少,估计出参数方 差较大,效率比FE低。 7.2 固定效应模型估计 7.2.2 用EViews7.2估计固定效应模型 例子7.1 的EViews操作: 在工作文件界面选中参与回归的变量并以组打开, 在文件表格界面点击Proc→Make Equation进入模 型设定界面完成模型设定。 7.2 固定效应模型估计 7.2.2 用EViews7.2估计固定效应模型 例子7.1 的EViews操作: 点击Panel Options选项,进入面板数据模型设定界 面。第一栏选择固定效应(fixed),第二栏选择 无时间异质性 变量(none),第三栏选择GLS时 的权重(Cross-section weight), 第四栏选择协方差估计 方法(White cross-section), 最后一栏选择是否调整自由度 7.2 固定效应模型估计 7.2.2 用EViews7.2估计固定效应模型 例子7.1 的EViews操作: 完成选择后点击OK得出参数估计输出结果: 7.2 固定效应模型估计 7.2.2 用EViews7.2估计固定效应模型 例子7.2 教育的回报 EViews操作: 为避免教育变量被消掉,采用前面介绍的虚拟 变量与教育变量相乘作为新的自变量,并将不关 心的不随时间变化的自变量去掉(否则无法估 计!),如种族变量 black,然后按上面的操作, 最终输出结果: 7.2 固定效应模型估计 7.2.2 用EViews7.2估计固定效应模型 例子7.2 教育的回报 EViews操作: 7.3 随机效应模型估计 7.3.1 随机效应模型估计 7.3.2 用EViews7.2估计随机效应模型 7.3 随机效应模型估计 7.3.1 随机效应模型估计 Yit 0 1 X 1it 2 X 2it 3 X 3it vit , vit i uit , i 1,2,, N ; t 1,2,, T • 随机效应假设了 i 与模型自变量不相关, 因此关心的问题不再是内生性,而是如何 提高估计的有效性,即探索复合误差项 vit i uit 的方差结构。 7.3 随机效应模型估计 7.3.1 随机效应模型估计 假设3:不可观测异质性满足 (1)i , i 1,2,, N 独立; uit (2) i 与 独i 1,2,, N , t 1,2,,T 立,E(i ) 0 ; Var(i ) 2 , i 1,2,, N (3) 。 ; 7.3 随机效应模型估计 7.3.1 随机效应模型估计 结论1:随机效应模型复合误差项的性质 如果面板数据模型的误差项 uit 和个体异质 性 i 满足假设1-假设3,则 vit 满足 (1)对任何的 i, j 和 t, s ,vit 与 X1 js , X 2 js , X 3 js 不相关; (2)对任何的 i 和 t, s 有 v2 Var (vit ) 2 u2 ; Cov(vit , vis ) 2 , t s 7.3 随机效应模型估计 7.3.1 随机效应模型估计 Yit 0 1 X 1it 2 X 2it 3 X 3it vit , vit i uit , i 1,2,, N ; t 1,2,, T • 上述模型不存在内生性,OLS估计有一致性,但是 vit 不满足不相关假设,OLS估计不是最优估计,要获得 最优估计,需要作变换 Yit Yi 0 (1 ) 1 ( X 1it X 1i ) 2 ( X 2it X 2i ) 3 ( X 3it X 3i ) it it vit vi (1 ) i (uit ui ) (习题7.6证明) i 1,2,, N ; t 1,2,, T • 上述模型的OLS估计称之为随机效应模型估计 (random effect) 7.3 随机效应模型估计 7.3.1 随机效应模型估计 Yit 0 1 X 1it 2 X 2it 3 X 3it vit , vit i uit , i 1,2,, N ; t 1,2,, T • 随机效应与固定效应估计相似, 固定效应处 1 随机效应处 u 1 1 2 1 2 2 2 1 T ( / u ) u T 7.3 随机效应模型估计 7.3.1 随机效应模型估计 Yit 0 1 X 1it 2 X 2it 3 X 3it vit , vit i uit , i 1,2,, N ; t 1,2,, T • 估计随机效应,首先要估计 ,故先要估 计 2 和 u2 2 2 • 估计 和 u 的方法有三种: Swamy-Arora、Wallace-Hussain和WansbeekKapteyn方法,常用第一种方法 7.3 随机效应模型估计 7.3.2 用EViews7.2估计随机效应模型 数据导入、数据结构转换以及模型设定与 固定效应模型估计一样,不同的是在panel 2 option的cross section中选Random,还有 2 和u 的估计方法 7.3 随机效应模型估计 7.3.2 用EViews7.2估计随机效应模型 例子7.1 输出结果: 7.3 随机效应模型估计 7.3.2 用EViews7.2估计随机效应模型 由于随机效应模型不再消掉不随时间 变化的自变量,故这些解释变量都可以在模 型中保留下来。 例子7.2的EViews回归结果 7.3 随机效应模型估计 7.3.2 用EViews7.2估计随机效应模型 例子7.2的EViews回归结果 7.4 固定效应还是随机效应? ——Hausman检验 7.4.1 Hausman检验原理 7.4.2用EViews7.2进行Hausman检验 7.4 固定效应还是随机效应? ——Hausman检验 7.4.1 Hausman检验原理 比较随机效应和固定效应下参数估计是否有 差别,若差别显著,则认为应采用固定效应 (稳健优先):若不显著,则认为应采用随 机效应(效率优先)。 Hausman检验构造的统计量只对斜率系数进 行比较。 7.4 固定效应还是随机效应? ——Hausman检验 7.4.1 Hausman检验原理 Yit i 0 1 X1it 2 X 2it 3 X 3it uit 假设三个斜率参数的固定效应估计和随机 FE ˆ FE ˆ FE RE ˆ RE ˆ RE ˆ ˆ , , 效应估计分别为 1 2 3 和 1 , 2 , 3 • 可以对整体模型进行Hausman检验,如:用 (ˆ FE ˆ RE )2 1 1 (ˆ FE ˆ RE )2 2 2 (ˆ FE ˆ RE )2 、3 3 2 、 构造 分布 • 也可对单个参数进行Hausman检验,如: ˆ1FE ˆ1RE t1 Var(Diff) ~ ( a ) N (0,1) 7.4 固定效应还是随机效应? ——Hausman检验 7.4.2 用EViews7.2进行Hausman检验 首先进行随机效应模型估计,在估计结果界面进行 相应的操作,在随机效应估计结果界面点击 View→Fixed/Random Effects Testing→Correlated Random Effects-Hausman Test,弹出如下检验结果 7.4 固定效应还是随机效应? ——Hausman检验 7.4.2 用EViews7.2进行Hausman检验 • Hausman检验需要对固定效应模型进行检 验,因此不能包含不随时间变化的自变量 (除了个体异质性)。所以不能对例子7.2进 行 Hausman检验。 重要概念 1. 横截面上若干多个时期的观测值形成面板数据。 由于来自两个维度,面板数据在增加样本量的同时, 也比单纯的横截面数据具有更为复杂的结构。 2. 板数据模型包含个体不可观测异质性i ,并 i 根据 与模型自变量的关系将模型分为固定效应模 型和随机效应模型。 3. i 与自变量相关时,面板数据模型称为固定 i 效应模型。 并入误差项会引起自变量的内生性, 导致回归系数的OLS估计不是一致估计。要估计固 i 定效应模型,需要将 消掉,固定效应估计方 i 法采用将模型变量减去组内均值的方法消 掉 。 重要概念 4. i 与自变量不相关时,面板数据模型称为 i 随机效应模型。 并入误差项不会引起自变 量的内生性,回归系数的OLS估计不一致估计。 随机效应估计方法的核心,是利用复合误差 项的特殊结构,更加有效地估计回归系数。 随机效应估计方法首先对模型变量进行变换, 将变量减去权重系数 乘以组内均值,然 后对变换后变量形成的模型实施OLS估计。随 机效应模型估计中,权重系数的计算是关键。 权重系数 的计算有三种不同方法, EViews操作可以进行选择。 重要概念 5. 确定采用固定效应模型还是随机效应模型 时,需要进行Hausman检验。Hausman检验 的想法是将两种模型的参数估计结果进行 比较,以确定是否有显著差别,如果有, 则认为固定效应模型是合适模型,如果没 有则可以采用随机效应模型。