Transcript 多元回归分析:推断
多元回归分析:推断
y = b0 + b1x1 + b2x2 + . . . bkxk + u
计量经济学导论 刘愿
1
关于假设检验
考虑一个选举问题:假定在一次选举中有两个
候选人A和B。据报道,候选人A已得到42%的
选票,候选人B得到58%的选票。姑且把这个
百分比看成选民总体的真正百分比。候选人A
深信更多的民众会投他的票,因此想调查选举
是否有作弊情况,并雇用一个咨询机构随机抽
取100名选举人的样本,所收集的样本中有53
人投了候选人A的票。这一样本估计值53%明
显超过所报告的总体值42%,候选人A应否据
此作出结论说选举存在作弊?
计量经济学导论 刘愿
2
设立一个假设检验(hypothesis test),令Θ
代表赞成候选人A的总体真实比例,令所报告
的结果为真实的假设,陈述为:
H0: Θ=0.42 虚拟假设(null hypothesis)
H1: Θ>0.42 对立假设(alternative hypothesis)
在上例中,100个随机样本中究竟有多少人投
候选人A的票才能够足以使A能否作出H0错误
而H1正确的结论?(合理的勿容置疑的证据)
计量经济学导论 刘愿
3
假设检验中会犯的两种错误:
第Ⅰ类错误:拒绝一个其实是真实的虚拟假设
第Ⅱ类错误:未拒绝一个实际上是错误的虚拟
假设
检验的显著性水平:犯第Ⅰ类错误的概率
P 拒绝H0 |H0
其含义为:当H0为真实时拒绝H0的概率
计量经济学导论 刘愿
4
经典的假设检验要求设定a值,从而量化我们
对第Ⅰ类错误的容忍度。通常a值有0.10,
0.05,0.01。
一旦选定显著水平,检验的目标是把第Ⅱ类错
误的概率减到最小。即对所有有意义的对立情
况使一个检验的功效最大。一个检验的功效是
1减去第Ⅱ类错误的概率。数学上表示为:
P 拒绝H0 | =1-P 第II类错误|
计量经济学导论 刘愿
5
检验关于正态总体均值的假设
为了相对于一个对立假设而检验一个虚拟假设,
需要挑选一个检验统计量和一个临界值。
给定一个统计量,即可定义一个拒绝规则来决
定什么时候舍弃H0而选取H1.所有拒绝规则都
是拿一个检验统计量的值t来同一个临界值c做
比较作为依据的。
拒绝域:所有导致拒绝虚拟假设的t值的全体。
计量经济学导论 刘愿
6
检验来自一个 Normal , 2 总体的关于均值 的假设。
H0: 0
虚拟假设
H1: 0
H1: 0
单侧对立假设
H1: 0
双侧对立假设
计量经济学导论 刘愿
7
H1: 0
0
当样本均值 y “足够”地大于
时,我们便
应拒绝H0而接受H1。如何确定
已大到足以
y
在选定的显著水平上拒绝H0?
检验统计量t:在虚拟假设下,随机变量t有一
个tn-1分布。
t n y 0 s y 0 se y
临界值c:5%的显著水平
P t>c|H0 =0.05
计量经济学导论 刘愿
8
拒绝规则: t>c
(c为tn-1分布中的第100(1-a)百分位数)
计量经济学导论 刘愿
9
双尾检验(two tailed test)
拒绝规则: | t |>c 给出100a%显著水平的检验
(c为tn-1分布中的第100(1-a/2)百分位数)
计量经济学导论 刘愿
10
经典线性模型假定
给定高斯-马尔科夫假定,OLS是最优线性无
偏估计。
为了做经典的假设检验,我们需要添加额外一
个假定,即MLR.6:u 独立于x1, x2,…, xk ,且u
服从标准正态分布,即u ~ Normal(0,2)
MLR.1-MLR.6: 经典线性模型假设(CLM)
计量经济学导论 刘愿
11
经典线性回归假设(续)
在经典线性回归假设下,OLS 不仅是最优线性无偏的,
而且是方差最小的无偏估计。
经典线性回归总体假设:
y|x ~ Normal(b0 + b1x1 +…+ bkxk, 2)
虽然我们假设u服从正态分布,但有时候并非如此:
u中的众多因素可能各有极为不同的总体分布;
u是不可观测因素的一个复杂函数,而非线性可加;
假定u的正态性,实际上是一个经验性问题。
大样本能够让u近似的满足正态性。
计量经济学导论 刘愿
12
简单回归的同方差正态分布
y
f(y|x)
. E(y|x) = b + b x
0
.
1
Normal
distributions
x1
x2
计量经济学导论 刘愿
13
定理4.1 正态抽样分布
在经典线性回归假设下,以自变量样本值为条件,有:
bˆ j ~ Normal b j , Var bˆ j , 则
bˆ j b j sd bˆ j ~ Normal 0,1
bˆ 服从标准正态分布,因为它是误差的线性组合:
j
n
ˆ
ˆ
b j b j wij u j rij SSR j
i 1
计量经济学导论 刘愿
14
定理4.1推广:
1. bˆ0 , bˆ1 , , bˆk的任何线性组合也都是正态分布的;
2. bˆ j的任何一个子集也都有一个联合正态分布。
计量经济学导论 刘愿
15
4.2 t检验
定理4.1 (标准化参数估计值的t分布)
在经典线性回归假设下,
bˆ b se bˆ ~ t
j
j
n k 1
j
注意这是t分布(与正态分布相对应),
因为需要通过ˆ 2 估计 2,所以自由度为 n k 1.
sd bˆ j
se bˆ j
SST j 1 R
1/ 2
2
j
ˆ
SST j 1 R
2
j
1/ 2
计量经济学导论 刘愿
16
t检验(续)
标准化参数的样本分布使得我们可以进行假设
检验。
从虚拟假设开始,如H0: bj=0;如果接受虚拟
假设,则意味着在控制其他因素不变的情况下,
xj 对 y没有效应。
计量经济学导论 刘愿
17
t检验(续)
为了进行我们的检验,首先需要形成b j的t统计量:
tbˆ bˆ j se bˆ j
j
根据t统计量及一个拒绝规则来决定是否接受虚拟假设H 0 .
计量经济学导论 刘愿
18
t检验:单侧备选假设
除了虚拟假设H0之外,我们还需要一个备选假
设H1和一个显著性水平或当H0为真时拒绝它的
概率。
H1可以是单侧的,也可以是双侧的。
H1: bj > 0 及 H1: bj < 0 都是单侧备选假设;
H1: bj 0 是双侧备选假设。
如果我们想在5%的概率下拒绝一个为真的虚
拟假设H0,那么我们的显著性水平为5%。
计量经济学导论 刘愿
19
单侧备选假设(续)
选定一个显著性水平 ,在一个自由度为n-k-1
的t分布中将得到(1 – )th 百分数,称之为临界
值 c。
我们可以拒绝虚拟假设,如果t统计量大于临
界值C.
t bˆ c
j
如果t小于临界值C,则无法拒绝虚拟假设。
t bˆ c
j
计量经济学导论 刘愿
20
单侧备选假设(续)
yi = b0 + b1xi1 + … + bkxik + ui
H0: bj = 0
H1: bj > 0
无法拒绝
拒绝
1
0
计量经济学导论 刘愿
c
21
单侧还是双侧假设
t分布是对称的,检验H1: bj < 0 是非常直观的,
临界值变成负数。
我们可以拒绝虚拟假设,如果t < –c, 如果t > –
c,则我们无法拒绝虚拟假设。
当bj 的符号在理论中是不明确的话,双侧对立
假设就是有用的。
对双侧检验来说,我们是根据/2来确定临界
值,如果t的绝对值大于C,则拒绝H1: bj 0 。
计量经济学导论 刘愿
22
双侧对立假设
yi = b0 + b1Xi1 + … + bkXik + ui
H0: bj = 0
H1: bj≠0
无法拒绝
拒绝
拒绝
1
/2
-c
0
计量经济学导论 刘愿
/2
c
23
总结:H0: bj = 0
除非特别说明,对立假设均假定为双侧的。
如果我们拒绝虚拟假设,通常我们会说:“在
%的水平上, xj 在统计上显著异于零。”
如果我们无法拒绝虚拟假设,通常我们说 “在
% 的水平上,xj 在统计上不显著。”
计量经济学导论 刘愿
24
例子4.2:学生成绩及学校规模
计量经济学导论 刘愿
25
tbˆ
例子4.3 大学城GPA的决定因素
0.083 / 0.026 3.19 2.58
(1%显著性水平的临界值)
skipped
比较一个没有逃课的学生及一个一周逃课5次的学生,保持其
他因素不变,两人的GPA预测值相差多少?
计量经济学导论 刘愿
26
检验其他假设
T检验的更一般形式是:H0: bj = aj
在这种情况下,t统计量的表述是
t bˆ j a j
se bˆ
j
where a j 0 for the standard test
计量经济学导论 刘愿
27
例子:校园犯罪与注册人数
H0:b1=1; H1:b1>1
由4.14可见,犯罪对注册人数的估计弹性1.27在对立假
设b1 >1的方向上。但是否有足够的证据断定b1 >1呢?
t 1.27 1 0.11 0.27 0.11 2.45 1.66
计量经济学导论 刘愿
28
计算t检验的p值
事前指定一个显著性水平的不足之处:
不存在一个“正确的”的显著性水平;
可能隐藏假设检验结果方面的有用信息
t=1.85,
c(40,5%)=2.021,
c(40,10%)=1.684,
检验p值:给定t统计量的观测值,能拒绝虚拟
假设的最小显著性水平是多少?
计量经济学导论 刘愿
29
H0 :β j =0; H1:β j 0
P T t
1.t表示一个自由度为n-k-1的t分布随机变量;t表
示该检验统计量的数值。
2.p值的解释:观察到一个t统计量至少和虚拟假设
正确时的t统计量一样大的概率:(以t为临界值时
的显著性水平)
小p值是拒绝虚拟假设的证据;
大p值不能提供拒绝虚拟假设的证据。
计量经济学导论 刘愿
30
df 40, t 1.85
p值=P T >1.85 =2P T>1.85 =2 0.0359 =0.0718
计量经济学导论 刘愿
31
一般情况的拒绝规则
a表示检验的显著性水平;
p值<a,则拒绝虚拟假设;否则,在100a%的显著性
水平下,就不能拒绝H0。
单侧对立假设检验p值:
1.考虑参数估计值方向与对立假设的关系;
H1 : b j 0, 检验H 0:b j 0。
若bˆ 0,计算p值无关紧要。
j
2.将双侧对立假设的p值除以2即得到单侧对立假设的
p值。
计量经济学导论 刘愿
32
统计检验值得注意的问题
当H0未被拒绝时,应该如何表述:
我们通常说“在a%的水平上我们不能拒绝H0”
而不能说“在a%的水平上我们接受了H0。”
H 0 :β nox =-1, t βˆ =0.393
H 0 :β nox =-0.9, t βˆ =0.462
计量经济学导论 刘愿
33
经济或实际显著性与统计显著性
统计显著性:t值
经济显著性: bˆ j
1.统计显著并不意味着实际作用显著
2.实际作用显著并不意味着统计显著
3.大样本选择较小的显著性水平,反之亦然。
t
bˆ j
se bˆ j
计量经济学导论 刘愿
34
例子4.6: 401(K)养老金计划的参与率
ttotemp 0.00013 / 0.00004 3.25
如果一个企业增加10000个雇员,
参与率下降10000
(0.00013) 1.3%
计量经济学导论 刘愿
35
例子4.7 在职培训津贴对企业废品率的影响
thrsemp 0.028/ 0.019 1.47
计量经济学导论 刘愿
36
总结
检查统计显著性:如果该变量是统计显著的,
讨论系数的大小,以对其实际或经济上的重要
性有所认识。
如果一个变量在通常的显著性水平上不是统计
显著的,仍需考察该变量对y是否有预期的影
响及其实际的经济重要性,如果重要则计算p
值。
一个显著的变量却拥有非预期的符号,并且在
经济上具有重要性,则问题更加麻烦。
计量经济学导论 刘愿
37
置信区间
使用经典统计检验的另一个方法是用在双侧检验中同
样的临界值构建一个置信区间Another way to use
classical statistical testing is 。
一个 对未知参数(1 - ) % 的置信区间定义如下:
bˆ j c se bˆ j
其中,c 为自由度为n-k-1的t分布中的 1- 百分位数。
2
计量经济学导论 刘愿
38
置信区间的上界和下界是:
b j bˆ j c se bˆ j
b j bˆ j c se bˆ j
置信区间的含义:如果一次又一次地获得随机样本,每次计算出
上界和下界,那么未知的总体参数将在95%的置信区间中出现。
计量经济学导论 刘愿
39
如何构建一个置信区间
需要三个量:
bˆ j , se bˆ j , 和 c
对于95%显著性水平的置信区间,一个简单的
拇指法则是:
bˆ j 2 se bˆ j
双侧对立假设的置信区间检验规则: aj 是否
落入95%水平的置信区间,落入则无法拒绝,
未落入则拒绝。
计量经济学导论 刘愿
40
Example 4.8 Hedonic Price Model for Houses
H 0 : bbdrms 0, CI bbdrms : 0.066 2.131 0.059 or 0.192, 0.06
H 0 : blog sqrft 0, CI blog sqrft : 0.634 2.131 0.184 or 0.242,1.026
计量经济学导论 刘愿
41
检验关于参数的一个线性组合
假设现在不是检验 b1 等于一个常数,而是是否等于
另一个参数,即H0 : b1 = b2, and H1 : b1 < b2。
计量经济学导论 刘愿
42
使用同样的基本程序形成t统计量:
bˆ1 bˆ 2
t
se bˆ1 bˆ 2
计量经济学导论 刘愿
43
检验线性组合(续)
Var bˆ bˆ Var bˆ Var bˆ 2Cov bˆ , bˆ
se bˆ bˆ se bˆ se bˆ 2s
其中 s 是Cov bˆ , bˆ 的一个估计值。
se bˆ1 bˆ2 Var bˆ1 bˆ2 , then
1
2
1
2
2
1
2
12
1
1
1
1
2
2
2
2
12
2
计量经济学导论 刘愿
44
检验线性组合(续)
需要s12,但标准的输出结果没有这一项。
很多统计软件包有选项获取这一协方差,或者
直接进行检验。
在Stata中,执行y对x1, x2, … xk的回归,
键入“test x1 = x2”可得该检验的p值。
更一般地,我们可以重新表述这个问题来进行
检验。
计量经济学导论 刘愿
45
定义一个新的参数,新的检验是:
1 b1 b2
计量经济学导论 刘愿
46
t1 0.26/ 0.018 1.44
针对单侧对立假设4.19, p值大概是0.075,因
此有证据但不是很强的证据拒绝虚拟假设4.18。
计量经济学导论 刘愿
47
对多个线性约束的检验:F检验
目前我们仅涉及检验一个单一的线性约束,如
b1 = 0或b1 = b2 。
然而,我们希望对参数的多个假设进行联合检
验。
经典例子是检验“排除性约束” :一组参数
是否等于零。
计量经济学导论 刘愿
48
检验排除性约束
虚拟假设H0: bk-q+1 = 0, ... , bk = 0;
对立假设是H1: H0 不正确(即至少有一个参
数不为零).
可否单独检验每一个t统计量? 由于我们希望了
解q个参数的联合显著性,单独检验t无法做到
这一点。
计量经济学导论 刘愿
49
排除性约束检验(续)
分别估计受约束模型和不受约束模型。
直观的,我们希望了解两个模型残差平方和的变化是
否足够大以确定是否应该包括被排除掉的变量xkq+1,, …, xk.。
SSRr SSRur q
F
SSRur n k 1
其中 r 是受约束模型,ur代表不受约束模型。
计量经济学导论 刘愿
50
F 统计量
F 统计量总是为正,既然受限制模型的残差平
方SSR和不可能小于不受限制的残差平方和。
事实上,F统计量衡量的是残差平方和SSR从
不受限制模型到受限制模型的相对增加。
q 限制条件个数, dfr – dfur
n – k – 1 = dfur
计量经济学导论 刘愿
51
F 统计量(续)
为了决定残差平方和的这一增加是否足够大以
拒绝这一限制性条件,我们需要了解F统计量
的样本分布。
F ~ Fq,n-k-1, 其中q 指F统计量分子的自由度,
n – k – 1指分母的自由度。
计量经济学导论 刘愿
52
F分布
X1 / k1
令X1 x 和X2 x , 并假定X1和X 2独立,则随机变量F
X 2 / k2
有一个自由度为 k1 , k2 的F分布。记为:F Fk k
2
k1
2
k2
1 2
计量经济学导论 刘愿
53
F分布(续)
f(F)
在 显著性水平下
拒绝H0 ,如果F > c
无法拒绝
1
0
c
拒绝
F
计量经济学导论 刘愿
54
例子:运动员表现及其薪水
H 0 : b3 0, b 4 1, b5 0.
H1 : H 0不正确。
计量经济学导论 刘愿
55
198.311 183.186
F
183.186 347
3
9.55 2.60(3,347,5%)
计量经济学导论 刘愿
56
因为F统计量大于临界值2.6,因此,我们拒绝
bavg,hrunsyr和rbisyr对薪水没有影响的假设。
为何bavg,hrunsyr和rbisyr三变量的参数估计
值未通过t检验,而其F检验却是显著的?
当自变量存在多重共线性时,模型结果难以发
现每个变量的偏效应,但却可能发现联合显著
性。
t
bˆ j
se bˆ j
bˆ j
ˆ SSTj 1 R
2
j
计量经济学导论 刘愿
1/ 2
57
F统计量与t统计量的关系
当F统计量检验单个变量的排除性时,等于对
应的t统计量的平方。
给定对立假设为双侧, t2n-k-1与F1,n-k-1 拥有同
样的分布,两种方法的结果一致。
计量经济学导论 刘愿
58
F统计量的R2 型
SSR很大程度上依赖于度量单位, 可以用R2计算F统
计量。
依据SSR = SST(1 – R2) ,F统计量的R2型为:
F
R
2
ur
R
2
r
q
2
1
R
ur n k 1
,
其中,r 代表受限制模型,ur代表不受限制模型。
计量经济学导论 刘愿
59
续上例,F统计量的R2型为
0.6278 0.5971
F
1 0.6278
347
9.54
3
计量经济学导论 刘愿
60
计算F检验的p值
在F检验的背景下,p值被定义为
p值=P f F : 给定虚拟假设正确,观察到的F值至少
和我们所得到的F值一样大的概率。
其中,f 表示一个自由度为 q, n k 1的F堆积变量,
F是检验统计量的实际值。
计量经济学导论 刘愿
61
f(F)
在显著性水平
上拒绝H0,如果
if > F 。
无法拒绝
1
0
拒绝
F
计量经济学导论 刘愿
62
回归整体显著性的F统计量
排除性约束的一个特例是检验H0: b1 = b2 =…=
bk = 0,即假设模型中没有任何一个解释变量对y
有作用。
既然只有截距项的模型R2 等于零,则整体显著性
的F统计量为:
2
R k
F
2
1 R n k 1
计量经济学导论 刘愿
63
如果H0被拒绝,则我们得到结论认为模
型中的变量的确对y有解释力,意味着
回归是总体显著的。
相反,如果我们无法拒绝H0,则没有证据
表明模型中的任何一个变量有助于解释
y,我们必须需找其他变量来解释y。
因此,我们必须计算F统计量来检验联
合显著性,而非仅仅看R2的大小。
计量经济学导论 刘愿
64
检验一般的线性约束
F统计量的基本形式可适用于任何的线性约束,
而非仅仅是排除性约束。
先估计受约束模型,再估计不受约束模型,然
后记录两个模型的残差平方和
施加约束可以变得很有技巧,类似于重新定义
变量。
计量经济学导论 刘愿
65
例子:住房评估价是否理性?
log price b 0 b1 log asses b 2 log lotsize
b3 log( sqrft ) b 4bdrms u
假设我们想检验:住房的评估价值是否为理性定价。
如果是这样,那么asses变化1%,price将变化1%,即
b1 1;此外,一旦控制了评估价值asses, lotsize, sqrft
和bdrms应该无助于解释 log( price).
H 0:b1 1,b 2 0,b3 0,b 4 0
计量经济学导论 刘愿
66
不受约束模型
y b 0 b1 x1 b 2 x2 b3 x3 b 4 x4 u SSRur 1.822
受约束模型:
y b 0 x1 u,即y x1 b 0 u SSRr 1.880
1.880 1.822
F
0.661 2.50 4,83
1.822* 83 4
因此,我们无法拒绝虚拟假设。
计量经济学导论 刘愿
67
F 统计量总结
与t统计量一样,F检验的p值可以通过查询F分
布图的百分位数计算得到。
输入如下命令,Stata会执行F检验: display
fprob(q, n – k – 1, F)。
当只有一个排除性约束需检验时,F = t2,p值
相等。
计量经济学导论 刘愿
68