Transcript 多元回归分析:推断
多元回归分析:推断 y = b0 + b1x1 + b2x2 + . . . bkxk + u 计量经济学导论 刘愿 1 关于假设检验 考虑一个选举问题:假定在一次选举中有两个 候选人A和B。据报道,候选人A已得到42%的 选票,候选人B得到58%的选票。姑且把这个 百分比看成选民总体的真正百分比。候选人A 深信更多的民众会投他的票,因此想调查选举 是否有作弊情况,并雇用一个咨询机构随机抽 取100名选举人的样本,所收集的样本中有53 人投了候选人A的票。这一样本估计值53%明 显超过所报告的总体值42%,候选人A应否据 此作出结论说选举存在作弊? 计量经济学导论 刘愿 2 设立一个假设检验(hypothesis test),令Θ 代表赞成候选人A的总体真实比例,令所报告 的结果为真实的假设,陈述为: H0: Θ=0.42 虚拟假设(null hypothesis) H1: Θ>0.42 对立假设(alternative hypothesis) 在上例中,100个随机样本中究竟有多少人投 候选人A的票才能够足以使A能否作出H0错误 而H1正确的结论?(合理的勿容置疑的证据) 计量经济学导论 刘愿 3 假设检验中会犯的两种错误: 第Ⅰ类错误:拒绝一个其实是真实的虚拟假设 第Ⅱ类错误:未拒绝一个实际上是错误的虚拟 假设 检验的显著性水平:犯第Ⅰ类错误的概率 P 拒绝H0 |H0 其含义为:当H0为真实时拒绝H0的概率 计量经济学导论 刘愿 4 经典的假设检验要求设定a值,从而量化我们 对第Ⅰ类错误的容忍度。通常a值有0.10, 0.05,0.01。 一旦选定显著水平,检验的目标是把第Ⅱ类错 误的概率减到最小。即对所有有意义的对立情 况使一个检验的功效最大。一个检验的功效是 1减去第Ⅱ类错误的概率。数学上表示为: P 拒绝H0 | =1-P 第II类错误| 计量经济学导论 刘愿 5 检验关于正态总体均值的假设 为了相对于一个对立假设而检验一个虚拟假设, 需要挑选一个检验统计量和一个临界值。 给定一个统计量,即可定义一个拒绝规则来决 定什么时候舍弃H0而选取H1.所有拒绝规则都 是拿一个检验统计量的值t来同一个临界值c做 比较作为依据的。 拒绝域:所有导致拒绝虚拟假设的t值的全体。 计量经济学导论 刘愿 6 检验来自一个 Normal , 2 总体的关于均值 的假设。 H0: 0 虚拟假设 H1: 0 H1: 0 单侧对立假设 H1: 0 双侧对立假设 计量经济学导论 刘愿 7 H1: 0 0 当样本均值 y “足够”地大于 时,我们便 应拒绝H0而接受H1。如何确定 已大到足以 y 在选定的显著水平上拒绝H0? 检验统计量t:在虚拟假设下,随机变量t有一 个tn-1分布。 t n y 0 s y 0 se y 临界值c:5%的显著水平 P t>c|H0 =0.05 计量经济学导论 刘愿 8 拒绝规则: t>c (c为tn-1分布中的第100(1-a)百分位数) 计量经济学导论 刘愿 9 双尾检验(two tailed test) 拒绝规则: | t |>c 给出100a%显著水平的检验 (c为tn-1分布中的第100(1-a/2)百分位数) 计量经济学导论 刘愿 10 经典线性模型假定 给定高斯-马尔科夫假定,OLS是最优线性无 偏估计。 为了做经典的假设检验,我们需要添加额外一 个假定,即MLR.6:u 独立于x1, x2,…, xk ,且u 服从标准正态分布,即u ~ Normal(0,2) MLR.1-MLR.6: 经典线性模型假设(CLM) 计量经济学导论 刘愿 11 经典线性回归假设(续) 在经典线性回归假设下,OLS 不仅是最优线性无偏的, 而且是方差最小的无偏估计。 经典线性回归总体假设: y|x ~ Normal(b0 + b1x1 +…+ bkxk, 2) 虽然我们假设u服从正态分布,但有时候并非如此: u中的众多因素可能各有极为不同的总体分布; u是不可观测因素的一个复杂函数,而非线性可加; 假定u的正态性,实际上是一个经验性问题。 大样本能够让u近似的满足正态性。 计量经济学导论 刘愿 12 简单回归的同方差正态分布 y f(y|x) . E(y|x) = b + b x 0 . 1 Normal distributions x1 x2 计量经济学导论 刘愿 13 定理4.1 正态抽样分布 在经典线性回归假设下,以自变量样本值为条件,有: bˆ j ~ Normal b j , Var bˆ j , 则 bˆ j b j sd bˆ j ~ Normal 0,1 bˆ 服从标准正态分布,因为它是误差的线性组合: j n ˆ ˆ b j b j wij u j rij SSR j i 1 计量经济学导论 刘愿 14 定理4.1推广: 1. bˆ0 , bˆ1 , , bˆk的任何线性组合也都是正态分布的; 2. bˆ j的任何一个子集也都有一个联合正态分布。 计量经济学导论 刘愿 15 4.2 t检验 定理4.1 (标准化参数估计值的t分布) 在经典线性回归假设下, bˆ b se bˆ ~ t j j n k 1 j 注意这是t分布(与正态分布相对应), 因为需要通过ˆ 2 估计 2,所以自由度为 n k 1. sd bˆ j se bˆ j SST j 1 R 1/ 2 2 j ˆ SST j 1 R 2 j 1/ 2 计量经济学导论 刘愿 16 t检验(续) 标准化参数的样本分布使得我们可以进行假设 检验。 从虚拟假设开始,如H0: bj=0;如果接受虚拟 假设,则意味着在控制其他因素不变的情况下, xj 对 y没有效应。 计量经济学导论 刘愿 17 t检验(续) 为了进行我们的检验,首先需要形成b j的t统计量: tbˆ bˆ j se bˆ j j 根据t统计量及一个拒绝规则来决定是否接受虚拟假设H 0 . 计量经济学导论 刘愿 18 t检验:单侧备选假设 除了虚拟假设H0之外,我们还需要一个备选假 设H1和一个显著性水平或当H0为真时拒绝它的 概率。 H1可以是单侧的,也可以是双侧的。 H1: bj > 0 及 H1: bj < 0 都是单侧备选假设; H1: bj 0 是双侧备选假设。 如果我们想在5%的概率下拒绝一个为真的虚 拟假设H0,那么我们的显著性水平为5%。 计量经济学导论 刘愿 19 单侧备选假设(续) 选定一个显著性水平 ,在一个自由度为n-k-1 的t分布中将得到(1 – )th 百分数,称之为临界 值 c。 我们可以拒绝虚拟假设,如果t统计量大于临 界值C. t bˆ c j 如果t小于临界值C,则无法拒绝虚拟假设。 t bˆ c j 计量经济学导论 刘愿 20 单侧备选假设(续) yi = b0 + b1xi1 + … + bkxik + ui H0: bj = 0 H1: bj > 0 无法拒绝 拒绝 1 0 计量经济学导论 刘愿 c 21 单侧还是双侧假设 t分布是对称的,检验H1: bj < 0 是非常直观的, 临界值变成负数。 我们可以拒绝虚拟假设,如果t < –c, 如果t > – c,则我们无法拒绝虚拟假设。 当bj 的符号在理论中是不明确的话,双侧对立 假设就是有用的。 对双侧检验来说,我们是根据/2来确定临界 值,如果t的绝对值大于C,则拒绝H1: bj 0 。 计量经济学导论 刘愿 22 双侧对立假设 yi = b0 + b1Xi1 + … + bkXik + ui H0: bj = 0 H1: bj≠0 无法拒绝 拒绝 拒绝 1 /2 -c 0 计量经济学导论 刘愿 /2 c 23 总结:H0: bj = 0 除非特别说明,对立假设均假定为双侧的。 如果我们拒绝虚拟假设,通常我们会说:“在 %的水平上, xj 在统计上显著异于零。” 如果我们无法拒绝虚拟假设,通常我们说 “在 % 的水平上,xj 在统计上不显著。” 计量经济学导论 刘愿 24 例子4.2:学生成绩及学校规模 计量经济学导论 刘愿 25 tbˆ 例子4.3 大学城GPA的决定因素 0.083 / 0.026 3.19 2.58 (1%显著性水平的临界值) skipped 比较一个没有逃课的学生及一个一周逃课5次的学生,保持其 他因素不变,两人的GPA预测值相差多少? 计量经济学导论 刘愿 26 检验其他假设 T检验的更一般形式是:H0: bj = aj 在这种情况下,t统计量的表述是 t bˆ j a j se bˆ j where a j 0 for the standard test 计量经济学导论 刘愿 27 例子:校园犯罪与注册人数 H0:b1=1; H1:b1>1 由4.14可见,犯罪对注册人数的估计弹性1.27在对立假 设b1 >1的方向上。但是否有足够的证据断定b1 >1呢? t 1.27 1 0.11 0.27 0.11 2.45 1.66 计量经济学导论 刘愿 28 计算t检验的p值 事前指定一个显著性水平的不足之处: 不存在一个“正确的”的显著性水平; 可能隐藏假设检验结果方面的有用信息 t=1.85, c(40,5%)=2.021, c(40,10%)=1.684, 检验p值:给定t统计量的观测值,能拒绝虚拟 假设的最小显著性水平是多少? 计量经济学导论 刘愿 29 H0 :β j =0; H1:β j 0 P T t 1.t表示一个自由度为n-k-1的t分布随机变量;t表 示该检验统计量的数值。 2.p值的解释:观察到一个t统计量至少和虚拟假设 正确时的t统计量一样大的概率:(以t为临界值时 的显著性水平) 小p值是拒绝虚拟假设的证据; 大p值不能提供拒绝虚拟假设的证据。 计量经济学导论 刘愿 30 df 40, t 1.85 p值=P T >1.85 =2P T>1.85 =2 0.0359 =0.0718 计量经济学导论 刘愿 31 一般情况的拒绝规则 a表示检验的显著性水平; p值<a,则拒绝虚拟假设;否则,在100a%的显著性 水平下,就不能拒绝H0。 单侧对立假设检验p值: 1.考虑参数估计值方向与对立假设的关系; H1 : b j 0, 检验H 0:b j 0。 若bˆ 0,计算p值无关紧要。 j 2.将双侧对立假设的p值除以2即得到单侧对立假设的 p值。 计量经济学导论 刘愿 32 统计检验值得注意的问题 当H0未被拒绝时,应该如何表述: 我们通常说“在a%的水平上我们不能拒绝H0” 而不能说“在a%的水平上我们接受了H0。” H 0 :β nox =-1, t βˆ =0.393 H 0 :β nox =-0.9, t βˆ =0.462 计量经济学导论 刘愿 33 经济或实际显著性与统计显著性 统计显著性:t值 经济显著性: bˆ j 1.统计显著并不意味着实际作用显著 2.实际作用显著并不意味着统计显著 3.大样本选择较小的显著性水平,反之亦然。 t bˆ j se bˆ j 计量经济学导论 刘愿 34 例子4.6: 401(K)养老金计划的参与率 ttotemp 0.00013 / 0.00004 3.25 如果一个企业增加10000个雇员, 参与率下降10000 (0.00013) 1.3% 计量经济学导论 刘愿 35 例子4.7 在职培训津贴对企业废品率的影响 thrsemp 0.028/ 0.019 1.47 计量经济学导论 刘愿 36 总结 检查统计显著性:如果该变量是统计显著的, 讨论系数的大小,以对其实际或经济上的重要 性有所认识。 如果一个变量在通常的显著性水平上不是统计 显著的,仍需考察该变量对y是否有预期的影 响及其实际的经济重要性,如果重要则计算p 值。 一个显著的变量却拥有非预期的符号,并且在 经济上具有重要性,则问题更加麻烦。 计量经济学导论 刘愿 37 置信区间 使用经典统计检验的另一个方法是用在双侧检验中同 样的临界值构建一个置信区间Another way to use classical statistical testing is 。 一个 对未知参数(1 - ) % 的置信区间定义如下: bˆ j c se bˆ j 其中,c 为自由度为n-k-1的t分布中的 1- 百分位数。 2 计量经济学导论 刘愿 38 置信区间的上界和下界是: b j bˆ j c se bˆ j b j bˆ j c se bˆ j 置信区间的含义:如果一次又一次地获得随机样本,每次计算出 上界和下界,那么未知的总体参数将在95%的置信区间中出现。 计量经济学导论 刘愿 39 如何构建一个置信区间 需要三个量: bˆ j , se bˆ j , 和 c 对于95%显著性水平的置信区间,一个简单的 拇指法则是: bˆ j 2 se bˆ j 双侧对立假设的置信区间检验规则: aj 是否 落入95%水平的置信区间,落入则无法拒绝, 未落入则拒绝。 计量经济学导论 刘愿 40 Example 4.8 Hedonic Price Model for Houses H 0 : bbdrms 0, CI bbdrms : 0.066 2.131 0.059 or 0.192, 0.06 H 0 : blog sqrft 0, CI blog sqrft : 0.634 2.131 0.184 or 0.242,1.026 计量经济学导论 刘愿 41 检验关于参数的一个线性组合 假设现在不是检验 b1 等于一个常数,而是是否等于 另一个参数,即H0 : b1 = b2, and H1 : b1 < b2。 计量经济学导论 刘愿 42 使用同样的基本程序形成t统计量: bˆ1 bˆ 2 t se bˆ1 bˆ 2 计量经济学导论 刘愿 43 检验线性组合(续) Var bˆ bˆ Var bˆ Var bˆ 2Cov bˆ , bˆ se bˆ bˆ se bˆ se bˆ 2s 其中 s 是Cov bˆ , bˆ 的一个估计值。 se bˆ1 bˆ2 Var bˆ1 bˆ2 , then 1 2 1 2 2 1 2 12 1 1 1 1 2 2 2 2 12 2 计量经济学导论 刘愿 44 检验线性组合(续) 需要s12,但标准的输出结果没有这一项。 很多统计软件包有选项获取这一协方差,或者 直接进行检验。 在Stata中,执行y对x1, x2, … xk的回归, 键入“test x1 = x2”可得该检验的p值。 更一般地,我们可以重新表述这个问题来进行 检验。 计量经济学导论 刘愿 45 定义一个新的参数,新的检验是: 1 b1 b2 计量经济学导论 刘愿 46 t1 0.26/ 0.018 1.44 针对单侧对立假设4.19, p值大概是0.075,因 此有证据但不是很强的证据拒绝虚拟假设4.18。 计量经济学导论 刘愿 47 对多个线性约束的检验:F检验 目前我们仅涉及检验一个单一的线性约束,如 b1 = 0或b1 = b2 。 然而,我们希望对参数的多个假设进行联合检 验。 经典例子是检验“排除性约束” :一组参数 是否等于零。 计量经济学导论 刘愿 48 检验排除性约束 虚拟假设H0: bk-q+1 = 0, ... , bk = 0; 对立假设是H1: H0 不正确(即至少有一个参 数不为零). 可否单独检验每一个t统计量? 由于我们希望了 解q个参数的联合显著性,单独检验t无法做到 这一点。 计量经济学导论 刘愿 49 排除性约束检验(续) 分别估计受约束模型和不受约束模型。 直观的,我们希望了解两个模型残差平方和的变化是 否足够大以确定是否应该包括被排除掉的变量xkq+1,, …, xk.。 SSRr SSRur q F SSRur n k 1 其中 r 是受约束模型,ur代表不受约束模型。 计量经济学导论 刘愿 50 F 统计量 F 统计量总是为正,既然受限制模型的残差平 方SSR和不可能小于不受限制的残差平方和。 事实上,F统计量衡量的是残差平方和SSR从 不受限制模型到受限制模型的相对增加。 q 限制条件个数, dfr – dfur n – k – 1 = dfur 计量经济学导论 刘愿 51 F 统计量(续) 为了决定残差平方和的这一增加是否足够大以 拒绝这一限制性条件,我们需要了解F统计量 的样本分布。 F ~ Fq,n-k-1, 其中q 指F统计量分子的自由度, n – k – 1指分母的自由度。 计量经济学导论 刘愿 52 F分布 X1 / k1 令X1 x 和X2 x , 并假定X1和X 2独立,则随机变量F X 2 / k2 有一个自由度为 k1 , k2 的F分布。记为:F Fk k 2 k1 2 k2 1 2 计量经济学导论 刘愿 53 F分布(续) f(F) 在 显著性水平下 拒绝H0 ,如果F > c 无法拒绝 1 0 c 拒绝 F 计量经济学导论 刘愿 54 例子:运动员表现及其薪水 H 0 : b3 0, b 4 1, b5 0. H1 : H 0不正确。 计量经济学导论 刘愿 55 198.311 183.186 F 183.186 347 3 9.55 2.60(3,347,5%) 计量经济学导论 刘愿 56 因为F统计量大于临界值2.6,因此,我们拒绝 bavg,hrunsyr和rbisyr对薪水没有影响的假设。 为何bavg,hrunsyr和rbisyr三变量的参数估计 值未通过t检验,而其F检验却是显著的? 当自变量存在多重共线性时,模型结果难以发 现每个变量的偏效应,但却可能发现联合显著 性。 t bˆ j se bˆ j bˆ j ˆ SSTj 1 R 2 j 计量经济学导论 刘愿 1/ 2 57 F统计量与t统计量的关系 当F统计量检验单个变量的排除性时,等于对 应的t统计量的平方。 给定对立假设为双侧, t2n-k-1与F1,n-k-1 拥有同 样的分布,两种方法的结果一致。 计量经济学导论 刘愿 58 F统计量的R2 型 SSR很大程度上依赖于度量单位, 可以用R2计算F统 计量。 依据SSR = SST(1 – R2) ,F统计量的R2型为: F R 2 ur R 2 r q 2 1 R ur n k 1 , 其中,r 代表受限制模型,ur代表不受限制模型。 计量经济学导论 刘愿 59 续上例,F统计量的R2型为 0.6278 0.5971 F 1 0.6278 347 9.54 3 计量经济学导论 刘愿 60 计算F检验的p值 在F检验的背景下,p值被定义为 p值=P f F : 给定虚拟假设正确,观察到的F值至少 和我们所得到的F值一样大的概率。 其中,f 表示一个自由度为 q, n k 1的F堆积变量, F是检验统计量的实际值。 计量经济学导论 刘愿 61 f(F) 在显著性水平 上拒绝H0,如果 if > F 。 无法拒绝 1 0 拒绝 F 计量经济学导论 刘愿 62 回归整体显著性的F统计量 排除性约束的一个特例是检验H0: b1 = b2 =…= bk = 0,即假设模型中没有任何一个解释变量对y 有作用。 既然只有截距项的模型R2 等于零,则整体显著性 的F统计量为: 2 R k F 2 1 R n k 1 计量经济学导论 刘愿 63 如果H0被拒绝,则我们得到结论认为模 型中的变量的确对y有解释力,意味着 回归是总体显著的。 相反,如果我们无法拒绝H0,则没有证据 表明模型中的任何一个变量有助于解释 y,我们必须需找其他变量来解释y。 因此,我们必须计算F统计量来检验联 合显著性,而非仅仅看R2的大小。 计量经济学导论 刘愿 64 检验一般的线性约束 F统计量的基本形式可适用于任何的线性约束, 而非仅仅是排除性约束。 先估计受约束模型,再估计不受约束模型,然 后记录两个模型的残差平方和 施加约束可以变得很有技巧,类似于重新定义 变量。 计量经济学导论 刘愿 65 例子:住房评估价是否理性? log price b 0 b1 log asses b 2 log lotsize b3 log( sqrft ) b 4bdrms u 假设我们想检验:住房的评估价值是否为理性定价。 如果是这样,那么asses变化1%,price将变化1%,即 b1 1;此外,一旦控制了评估价值asses, lotsize, sqrft 和bdrms应该无助于解释 log( price). H 0:b1 1,b 2 0,b3 0,b 4 0 计量经济学导论 刘愿 66 不受约束模型 y b 0 b1 x1 b 2 x2 b3 x3 b 4 x4 u SSRur 1.822 受约束模型: y b 0 x1 u,即y x1 b 0 u SSRr 1.880 1.880 1.822 F 0.661 2.50 4,83 1.822* 83 4 因此,我们无法拒绝虚拟假设。 计量经济学导论 刘愿 67 F 统计量总结 与t统计量一样,F检验的p值可以通过查询F分 布图的百分位数计算得到。 输入如下命令,Stata会执行F检验: display fprob(q, n – k – 1, F)。 当只有一个排除性约束需检验时,F = t2,p值 相等。 计量经济学导论 刘愿 68