第四章多元正态总体的统计推断

Download Report

Transcript 第四章多元正态总体的统计推断

第四章 多元正态总体的统计推断
第一节 一元正态总体的统计推断
推断统计: 利用样本统计量对总体某些性质或数
量特征进行推断。
统计推断分为参数估计和假设检验两种,
主要区别在于其推断的目的不同。参数估计回
答诸如“未知参数 的值有多大”之类的问
题,
而假设检验回答诸如“未知参数
0

的值是
总体参数 
的值是多大?
推断估计
参数估计
随机原则
假设检验
检验未知参数
的值是 0 吗
抽样分布
统计量
一、参数估计
参数估计分为点估计和区间估计两种。
点估计:用某一具体的值去估计某一未知参数
区间估计:给出未知参数在一定把握程度
(概率或置信度下的取值区间,也称为置信
区间。
对总体的未知参数 作区间估计,就是要给出
ˆ (ˆ  ˆ )。它们都
区间的下限 ˆ和上限
U
L
U
是只依赖于样本 x1 , x2 ,, x
的统计量,可以表
n
)
示为 ˆL  ˆL ( x1, x2 ,, xn和
ˆU  ˆU ( x1, x2 ,,。
xn )
ˆ
ˆ


估计 在  L 和 U 之间,可以写成 ˆL    ˆU
(或 ˆL
   ˆU
)。  包含在随机区间 (ˆL ,ˆU )
内的概率称为置信度,它表明估计的可靠程度,
记为 1   (0    1) 。也就是 P(ˆL    ˆU )  1 
称随机区间 (ˆL ,ˆU )是未知参数  的置信度为
1   的置信区间,它表明可以有 100(1   )%
的把握说明这个区间包含未知参数

。
评价置信区间好坏的准则:1、置信度;2、精
确度。
样本容量一定的情况下,准则之间相互矛盾,
奈曼建议的妥协方案:在保证置信度达到指定
要求的前提下,尽可能地提高精确度。
(一)单个正态总体均值的置信区间
2
x
,
x
,

,
x
设 1 2
n 是取自正态总体 N (  ,  )
的一个样本。给定置信度 1   ,当  已知
2

时, 的置信度为1   的置信区间为 x  u 2
n
u 2 为 N (0,1)
的上  / 2 分位点。当  未
知时,在上式中用
代替
2
s 代替  ,且用 t
 /2
(n 1)
u 2 ,即可得到  的 1   置信区间为
s
x  t 2 (n  1)
n
n
2
1
2
t / 2 (n 1)
( xi  x ) 为样本方差,
这里 s 

n  1 i 1
为 t (n  1) 的上
 / 2 分位点。
2、两个正态总体均值之差的置信区间
2
设 x1 , x2 ,, xn1 是取自总体 N (1 , 1 ) 的容量
2
y
,
y
,

,
y
n
为 1的样本, 1 2
n2是取自总体 N ( 2 ,  2 )
的容量为 n2 的样本,且两个样本相互独立。
令
n1
1
x   xi
n1 i 1
,
1
y
n2
n2
y
i 1
i
则当  和  已知时,1   2 的 1   置信区
2
1
间为
2
2
( x  y )  u 2

2
1
n1


2
2
n2
     时,
 和
1   2 的 1   置信区间为
1 1
( x  y )  t 2 (n1  n2  2) s p

n1 n2
当
2
1
2
都未知时,但
2
2
1
2
2
2
其中
(n1  1)s  (n2  1)s
s 
n1  n2  2
2
1
2
p
2
2
n1
1
2
s 
( xi  x)

n  1 i 1
2 1
2
1
该式中
和
n2
1
2
2
s2 
( yi  y) 集中了各自样本中有关 

n2  1 i 1 2
的信息, s p 能够将两者所含的信息很好地结
合起来,它是一个联合无偏估计。
二
基本思
想
检验规
则
假设检验
检验
步骤
常见的假
设检验
基本思想
小
概
率
原
理
如果对总体的某种假设是真实的,那么不利
于或不能支持这一假设的事件A(小概率事
件)在一次试验中几乎不可能发生的;要是
在一次试验中A竟然发生了,就有理由怀疑
该假设的真实性,拒绝这一假设。
总 体
(某种假设)
抽样
样 本
(观察结果)
(接受)检验(拒绝)
小概率事件未发生
小概率事件发生
假设的形式:
H0——原假设, H1——备择假设
双尾检验:H0:μ=μ0 ,
H1:μ≠μ0
单尾检验: H0:μ≥μ0 , H1:μ<μ0
H0:μ≤μ0 , H1:μ>μ0
假设检验就是根据样本观察结果对原假
设(H0)进行检验,接受H0,就否定H1;拒
绝H0,就接受H1。
检验规则
确定检验规则
检验过程是比较样本观察结果与总体假设
的差异。差异显著,超过了临界点,拒绝H0;
反之,差异不显著,接受H0
差 异
临界点
判 断
| X  0 | c
拒绝H0
| X   0 |< c
接受H0
怎样确定c?
两类错误:接受或拒绝H0,都可能犯错误
I类错误——弃真错误, 发生
的概率为α
II类错误——取伪错误,发生
的概率为β
检验决策
拒绝H0
接受H0
H0为真
H0非真
犯I类错误(α) 正确
正确
犯II类错误(β)
α大β就小,α小β就大
基本原则:力求在控制α前提下减少β
α——显著性水平,取值:0.1, 0.05, 0.001, 等。
如果犯I类错误损失更大,为减少损失,α值取
小;如果犯II类错误损失更大,为减少损失,α
值取大。
确定α,就确定了临界点c。
1、随机抽样:样本均值
2、 X 标准化:
3、确定α值
4、查概率表,知临界值 | Z  |
2
5、计算Z值,作出判断
检验步骤
1
建立总体假设
H0,H1
2
抽样得到样
本观察值
3
选择统计量
确定H0为真
时的抽样分布
6
4
根据具体决策
要求确定α
5
计算检验统
确定分布上的临
计量的数值
界点C和检验规则
7
比较并作出检验判断
几种常见的假设检验
条件 检验条件量
正态
总体
σ2已
知
x  0
u
 n
H0、H1
(1) H0:μ=μ0
H1:μ≠μ0
拒绝域


2
2
 Z 0 Z

2
(2) H0:μ≤μ0
H1:μ>μ0
(3) H0:μ≥μ0
H1:μ<μ 0
2
z

0 Z
z


Z- 0
z
条件 检验条件量
正态
总体
σ2未
知(n
<30)
H0、H1
(1) H0:μ=μ0
H1:μ≠μ0
x  0
t
s n
拒绝域


2
2
 t 0 t 
2
2
(2) H0:μ≤μ0
H1:μ>μ0

t
0
(3) H0:μ≥μ0
H1:μ<μ 0
t

t-0

t
t
条件
非正态
总体
n≥30
σ2已知
或未知
检验条件量
x  0
u
 n
x  0
u
S n
H0、H1
(1) H0:μ=μ0
H1:μ≠μ0
拒绝域


2
2
 Z 0 Z
2
(2) H0:μ≤μ0
H1:μ>μ0
(3) H0:μ≥μ0
H1:μ<μ0
z
2

0 Z
z


Z- 0
z
条件 检验条件量
两个
正态 u  x  y
2
2
总体
1  2
 ,
2
1
已知
2
2
n1

n2
H0、H1
(1) H0: μ1=μ2
H1: μ1 ≠ μ2
拒绝域


2
2
 Z 0 Z
2
(2) H0:μ1 ≤ μ2
H1: μ1 > μ2
(3) H0: μ1 ≥ μ2
H1:μ1 < μ2
z
2

0 Z
z


Z- 0
z
条件
检验条件量
两个正
态总体 t 
 ,
2
1
2
2
Sp
n1 n2

1 1
H0、H1
(1) H0: μ1 = μ2
H1: μ1 ≠ μ2
x y
未知,


2
2
 t 0
2
(2) H0: μ≤ μ2
H1: μ> μ2
(n1  1)S1  (n2  1)S 22
但相等 S p 
n1  n2  2
(3) H0: μ1≥ μ2
2
拒绝域
H1: μ1< μ2
t
t
2
0

t
t

t-0

t
条件
两个
非正
态体
n1≥30
n2≥30
检验条件量
u
x y
 

n1 n2
2
1
 , u  x  y
2
2
1
2
2
2
2
已知或
未知
S1 S 22

n1 n2
H0、H1
(1) H0:μ1 = μ2
H1:μ1 ≠ μ2
拒绝域


2
2
 Z 0 Z
2
2

(2) H0:μ1 ≤ μ2
H1:μ1 > μ2
(3) H0:μ1 ≥ μ2
H1:μ1 < μ2
z
0 Z
z


Z- 0
z
条件 检验条件量

np≥5
p  p0
nq≥5 u 
p0 q0
n
H0、H1
(1) H0:P=P0
H1:P≠P0
拒绝域


2
2
 Z 0 Z
2
2

(2) H0:P≤P0
H1:P>P0
0
(3) H0:P≥P0
H1:P<P0
z
Z
z


Z- 0
z
条件 检验条件量
n1p1≥5
n1q1≥5n2 u 
p2≥5
n2q2≥5

H0、H1
(1) H0:P1=P2
H1:P1 ≠P2

p1  p 2
 
 
pq pq

n1 n2



2
2
z
 Z 0 Z
2
2

(2) H0: P1 ≤P2
H1:P1 > P2
0

n1 p1  n2 p2
p
(3) H0:P1 ≥P2
n1  n2
H1:P1 <P2

拒绝域
Z
z


Z- 0
z
关于检验的 p 值
以 U表示随机变量时的
u , u本身表示
u,则称 P( U  u ) 为检验的 p值,
p 。由于 u  u / 2当且仅当
取值时的
记为
p  P( U  u )  P( U  u / 2 )   ,
所以
当
p 
当
p 
时,拒绝 H 0 ;
时,接受 H 0 。
三、假设检验与置信区间的关系
假设检验与置信区间有着密切的联系。
例如在已知方差的检验中,如果在显著性水
平  下接受
u  u / 2 
x  0
/ n
H0 :   0
,即有
 u / 2  x  u / 2

n
 u0  x  u / 2
0 落在  的 1   置信区间内。通常可
以通过构造未知参数置信区间的方法来进行
假设检验。

n
四、多个总体均值的比较检验(方差
分析)
设有 k 个总体  1 ,  2 ,,  k ,它们的分布分
别是 N (1 ,  ) , N (2 ,  ),, N (k ,  ) ,
2
2
2
今从每一总体中各自独立地抽取一个样本,取
自总体  i 的样本为
xi1 , xi 2 ,, xini
i  1,2,, k 。现欲检验
H 0 : 1   2     k ,
H1 : i   j , 至少存在一对i  j
,
令
ni
k
SST   ( xij  x)
2
i 1 j 1
k ni
SSE   ( xij  xi ) 2
i 1 j 1
k
SSTR   ni ( xi  x)
2
i 1
k
ni
1 k
其中 x   xij,n   ni ,xi   xij (i  1,2,, k )
j 1
i 1
n i 1 j 1
ni
则容易验证 SST  SSE  SSTR
SST 称为总平方和,自由度为 n  1 ,它
反映了所有
n 个数据 xij 之间的总波动程度;
SSE称为误差(或组内)平方和,具有自由
度
n  k,它反映了各总体内数据的波动程度;
SSTR 称为处理(或组间)平方和,具有自
由度
k  1 ,当原假设不真时,它反映了各总
体均值间的差异程度。
可以构造检验统计量
SSTR /(k  1)
F
SSE /(n  k )
当原假设 H 0 为真时,F ~ F (k 1, n  k ) ,检验
规则为:
当
当
F  F (k 1, n  k ) 时,拒绝 H 0 ;
F  F (k 1, n  k ) 时,接受 H 0 。
其中 F (k 1, n  k ) 为 F (k  1, n  k ) 的
上
 分位点。
第二节
单个总体均值的检验
一 均值向量的检验
设 x 1 , x 2 ,, x n 是取自多元正态总体 N P  , 
的一个样本,这里
 0, n  p
,现欲检验
H :    0 , H1 :    0
1 总体协方差矩阵已知
由于样本均值
 1

x ~ N p  ,  
 n

,
由 (x   )  (x   ) ~  ( p),当 H 0为真时,
T
1
2

T0  x   0
2

 n x  0

T
1

  
n

1
x   
0
  x   
T
1
0
2
2
p

服从自由度为 的卡方分布,即 T0 ~   p。
可作为检验统计量,对给定的显著性水平
检验规则为
 p时,拒绝H 0 ;
2
2
当 T0    p时,接受H0。
2
2
其中   p 是   p  的上  分位点。
当 T0  
2
2
显然,当 p  1时,T0  
2
2
。
,
2 总体协方差矩阵


 未知

T
1 n
S
x i  x x i  x 是 的一个无偏估计,

n  1 i 1
T
2
在 T0  n x   0  1 x   0 中用 S 代替  得





T  n x  0
2

T

S 1 x   0

称它为霍特林(Hotelling)统计量。当 P  1
2
n
(
x


)
2
2
0
时,上式退化为 t 
,因此 T 统
2
s
计量是 t 统计量在多元情形下的一种推广。
n p 2
T 服从
当原假设 H 0 为真时,统计量
pn  1
自由度为 p 和 n  p 的 F 分布。
对给定的显著性水平  ,检验规则为:
n p 2
T  F  p, n  p  时,拒绝 H 0;
当
pn  1
当
n p 2
T  F  p, n  p  时,接受 H 。
0
pn  1
其中 F  p, n  p  是 F  p, n  p  的上  分位
点。
pn  1
F  p, n  p 以上检验规则可记为
若 T 
n p
2
当 T  T 时,拒绝 H 0 ;
2
2
当 T  T 时,接受 H 0 。
2
2
例 4.2.1 对某地区农村的6名2周岁男婴的身高,
胸围,上半臂进行测量,得样本数据如表4.1所
示。根据以往资料,该地区2周岁男婴的这三项
指标的均值   90,58,16 ,现欲检验该地区农
T
村男婴是否与城市男婴有相同的均值。
这是假设检验问题:
H 0 :   0 , H1 :   0
表4.1 某地区农村男婴的体格测量数据
男婴
身高(cm)胸围(cm)上半臂(cm)
1
2
3
4
5
6
78
76
92
81
81
84
60.6
58.1
63.2
59.0
60.8
59.5
16.5
12.5
14.5
14.0
15.5
14.0
经计算
 82.0 
  8.0 




x   60.2 , x   0   2.2 
 14.5 
  1.5 




0 0 5.0 0 4 0.8 0 0 6.1 3 


0 1 3.1 2 7 1.3 0 4 0.8   S
0 0 9.1 0 1 3.1 0 0 5.0 


 4.3107  14.6210 8.9464 

1 
1
S  23.13848   14.6210 59.7900  37.3760
 8.9464  37.3760 35.5936 




T
T  n x  0 S
2
1
x   
0
 6 * 70.0741 420.4447
查表得 F0.01 3,3  29.5 ,于是
3*5
T0.01 
F0.01 3,3  147 .5
3
所以,在显著性水平   0.01 下,拒绝原假
2
设 H 0 ,即认为农村与城市的2周岁男婴上述
三项指标的均值不相等
 p  0.002
。
T 的简洁计算方法 :令 y  S
2


1
x   
0
则 S  y  x  0 ,于是得到如下的方程组
31.600y1  8.040y2  0.500y3  8.0

 8.040y1  3.172y2  1.310y3  2.2
 0.500y  1.310y  1.900y  1.5
1
2
2

解得 y1  3.4605, y2  13.162, y3  8.954

 x     nx    y
T
故而 T  n x  0 S
2
T
1
0
 6 * 70.0738 420.4430
0
二 置信区间
T
2
1



x   0 
T

n
x


S
用未知的真值 代替
0
中的 0 ,得

 x   
T
T  n x S
2
1
n  p  T
服从自由度为 p和 n  p的 F分布,
pn  1


n

p
即
T ~ F ( p, n  p) ,从而
pn  1
2
2
 n  p  2

P
T  F  p, n  p   1  
 pn  1

即


T
P n x S
1
x     T

2
 1 
pn  1
F  p, n  p 
其中 T 
n p
由此得到  的置信度为 1   的置信区间
2
 : nx    S
(confidence region)为
T
1
x     T

2

当 p  1 时,它是一个区间;当 p  2 时 ,它是
一个椭圆,这时可将其在坐标平面上画出;当
p  3 时,它是一个椭球;当 p  3 时,它是一
个超椭球。
三 联合置信区间
将


n a (x   0 )
maxt  max
T
a0
a0
a Sa
T
1
2
 n( x   0 ) S ( x   0 )  T
2
a
式中的  用代替
再根据


T
0
P n x S
1
T
2
,
x     T

2
 1 
 

2


T
可得: p max n a x    T 2   1  
a 
T
 a  0
a Sa



T
T


n |a xa  |
P max
 T   1  
T
a0
a Sa


  n | aT x  aT  |

P  
 T    1  
T
 a0

a
Sa

 
所以


T
T
T
T
T
P  a x  T a Sa / n  a   a x  T a Sa / n   1  
a



即
a x  T a Sa / n  a   a x  T a Sa / n
T
T
T
T
T
以 1   的概率对一切   R 成立,称它为
p

一切线性组合 a , a  R
T
p
 的置信度为 1  
的联合置信区间(simultaneous confidence
intervals)
有时。我们希望获得的只是少数几个线性组


合 ai , i  1,2,, k 的 1   联合置信区间。
T
由


T
T
T
T
T
P  a x  T a Sa / n  a   a x  T a Sa / n   1  
a

可得




k T

T
T
T
T
P  a x  T a i Sai / n  ai   ai x  T ai Sai / n   1  
 i1

当
k 很小时,联合 T 2
置信区间
ai x  T a Sai / n  ai   ai x  T ai Sai / n
T
2
i
T
T
i  1,2,, k
的置信度一般会明显的大于 1   。
T
这时,可以考虑采用邦弗伦尼(Bonferroni)联
合置信区间:
aiT x  t / 2 k n  1 aiT Sai / n  aiT   aiT x  t / 2 k n  1 aiT Sai / n
i  1,2,, k
它的置信度至少为 1   。
这是因为,若令

Ei  aiT  t / 2 k n  1 aiT Sai / n  aiT   aiT x  t / 2 k n  1 aiT Sai / n
i  1,2,, k
则
T
T

|

a

x
i
ia | n

, k /   1  1  n k 2 / t 
T

a
S
i
ia

k , ,2,1  i

P   EP
i


所以,邦弗伦尼联合置信区间的置信度
 
k
 k 
 k 
P  Ei   1  P  Ei   1   P Ei
i 1
 i 1 
 i 1 
k
 1   / k  1  
i 1

例 4.2.2 为评估某职业培训中心的教学成果,
随机抽取8名受训者,进行甲和乙两个项目的测
T
试,其数据列于表4.2.2。假定 x  x1 , x2  服从
二元正态分布。
表4.2.2
两个项目的测试成绩
1
2
3
4
5
6
7
8
编号
甲项成绩 x1 62 80 66 84 75 80 54 79
乙项成绩 x2 70 77 75 87 87 91 61 84
该例中,n=8,p=2 取   1 ,查 F 分布表得,
于是 F0.1 2,6  3.46 。经计算得
2 7
2
T0.1 
F0.1 2,6  8.073, T0.1  2.841
6
 72.5 
112.5714 96.1429
 , S  
x  
 79 
 96.1429 103.1429
 0.0436  0.0406
1

S  
  0.0406 0.0475


 





由  : n x   T S 1 x    T 2 ,可得

 的95%的置信区域为
 0.0436  0.0406 72.5  1 
  8.073

8  72.5  1 ,79  2 
  0.0406 0.0475 79  2 
也就是
0.0436 1  72.5  0.0812 1  72.5 2  79
2
 0.0475  279  1.009
2
1和 2 的95%联合 T 2 置信区间为
72.5  2.841 112.5714/ 8  1  72.5  2.841 112.5714/ 8
79  2.841 103.1429/ 8   2  79  2.841 103.1429/ 8
即
61.84  1  83.16
68.80   2  89.20
这两个区间分别正是椭圆在 1 和 2 轴上的投
影。而
1和 2 的95%邦弗伦尼联合置信区间
为(查表得, t0.025 7  2.3646 )
72.5  2.3646 112.5714/ 8  1  72.5  2.3646 112.5714/ 8
79  2.3646 103.1429/ 8   2  79  2.3646 103.1429/ 8
即
63.63  1  81.37
70.51  2  87.49
2
显然,这个联合置信区间在精度方面要好于 T
联合置信区间。
第三节 单个总体均值分
量间结构关系的检验
设 x1 , x2 ,, xn 是取自多元正态总体 N p , 

的一个样本,   0, n  p, ,检验均值向量
的分量之间的结构关系,也就是欲检验
H0 : C  , H1 : C  
(4.3.1)
其中 C 为一已知的 k  p 矩阵,k  p, rankC   k ,

为已知的
k 维向量。
根据多元正态分布的性质知

Cx ~ Nk C, CCT
由于

(4.3.2)
1
1 T
1





T
2
2
2
rank C  C  rankC   C     rank C    rankC   k ,


 




故 CCT  0 。因此,我们可以用上一节检
验假设 H0 :   0 的方法来检验上述假设。
   
 nC x    CSC  C x   
T
由 T  n x   S 1 x   知,检验统计量为
2
T
2
T
T 1
(4.3.3)
当原假设 H 0为真时,
nk 2
T
k n  1
服从自由度为
(4.3.4)
k 和 n  k 的 F 分布。
对给定的显著性水平  ,检验规则为:
nk 2
当
T  F k , n  k 时,拒绝H 0;
k n  1
nk 2
当
T  F k , n  k 时,接受H 0
(4.3.5)
k n  1
或等价地为:
当T 2  T2时,拒绝H 0 ;
当T 2  T2时,接受H 0。
(4.3.6)
k n  1
其中 T 
F k , n  k 
(4.3.7)
nk
F k , n  k  是 F k , n  k  的上  分位点。
2
特别地,若(4.3.1)式中的   0, 即欲检验
H0 : C  0, H1 : C  0
则(4.3.3)式的 T 2 可简化为
T

T

T 1
T  nx C CSC
2
Cx
(4.3.9)
设 x ~ N p  ,  ,   1 , 2 ,,  p  ,
T
例 4.3.1
 0, x , x ,, x
1
欲检验
令
2
n
是取自该总体的一个样本,
H 0 : 1  2     p
H1 : i   j , 至少存在一对i  j
1

1
C 


1

1 0  0

0 1  0
 


0 0   1
则假设可表达为 H0 : C  0, H1 : C  0
由于 C 为  p 1 p 矩阵且 rankC   p  1 ,因
此检验统计量为
T

T

T 1
T  nx C CSC
2
Cx
检验规则为:
当T  T 时,拒绝H 0 ;
2
2
当T 2  T2时,接受H 0。
其中
T
2

p  1n  1

F   p  1, n  p  1
n  p 1
例4.3.2 在例4.2. 1中,假定人类有这样一
个一般的规律:身高、胸围和上半臂围的平均
尺寸比例为6:4:1,我们希望检验表4.1中的
数据是否符合这一规律,也就是欲检验
1
1
H 0 : 1   2  3
6
4
1
1
H1 : 1 ,  2 , 3 至少有两个不等
6
4
令
2 3 0 

C  
 1 0  6
则上面的表达式为
H0 : C1  0,
H1 : C  0
经计算
  16.6 

C x  
  4.0 
 58.468 56.660

CSC  
 55.660 94.000
T
从而
CSC 
T 1
 94.000  56.660

 2285.636 4
  56.660 58.468 
故
n  k  T 2  4  50.7001 20.28  18.0  F 2,4
0.01
k n  1
25
T


T  nx C CSC C x  6  8.450023 50.7001
2
T
T
所以拒绝原假设 H 0 ,即认为这句数据与人
类的一般规律不一致(p=0.008).
上述的 C 也可以选择为
 0 1  4
*

C  
1 0  6
检验的结果不变
第四节 两个总体均值的比较
一、两个独立样本的情形
设从两个总体 N P 1 ,  和 N P 2 , 
中各自独立地抽取一个样本 x1 , x2 , xn1 和
y1, y2 ,, yn2 ,   0, n1  p, n2  p,
检验
H0 : 1  2 , H1 : 1  2
(4.4.1)
根据上述两个样本可以得到 1 , 2 的无
偏估计
1 n1
x   xi
n1 i 1
1 n2
, y   yi
n1 i 1
和  的联合无偏估计

n1  1S1  n2  1S 2
Sp 
n1  n2  2
  
  y  y y  y 
n1
T
i 1
n2
T
其中 n1  1S1   xi  x xi  x
n2  1S2
i 1
i
i
作为一元情况下两样本
t
检验统计量的
2
推广,用似然比方法可以求得霍特林 T 检
验统计量
1

 
 


T 1
1
1 1
T     x  y S p x  y
 n1 n2 
T 1
n1n2

x  y Sp x  y
(4.4.2)
n1  n2
n1 n2
Sp

2
当 p  1时, T 就退化为
1 1 式
t

x y
的 t 2。
2

当原假设 H 0 为真时,统计量
n1  n2  p  1 2
T
pn1  n2  2
(4.4.3)
服从自由度为 p 和 n1  n2  p  1 的 F 分布,
即
n1  n2  p  1 2
T ~ F  p, n1  n2  p  1
pn1  n2  2
对事先给定的显著性水平  ,检验规则为:
当T  T 时,拒绝H 0;
2
2
当T , T 时,接受H 0。
2
2
(4.4.4)
其中
pn1  n2  2
T 
F  p, n1  n2  p  1
n1  n2  p  1
2
(4.4.5)
F  p, n1  n2  p 1是F  p, n1  n2  p 1 的上

分位点。
a    , a  R 的 1  
T
p
1

2

a x  y  T
T


n1  n2 T
T
a S p a  a 1   2 
n1n2
 a x  y  t / 2 k n1  n2  2 
T
i
联合置信区间为
n1  n2 T
ai S p ai
n1n2
(4.4.6)
当 k 很小时,可采用邦弗伦尼不等式给出
a    , i  1,2,, k 的 1   联合置信区间
T
i

1
2

a x  y  t / 2 k n1  n2  2
T
i


n1  n2 T
ai S p ai  aiT 1   2 
n1n2
 a x  y  t / 2 k n1  n2  2
T
i
n1  n2 T
ai S p ai
n1n2
(4.4.7)
例 4.4.1(例 4.2.1续) 表4.4.1给出了相应于
表4.2.1的9名2周岁女婴的数据。我们欲在多元
正态性假设下检验2周岁的男婴与女婴的均值
向量有无明显差异。
从例4.2.1得 n1  6, x  82.0,60.2,14.5
T
158.00 40.20 2.50

n1  1S1   40.20 15.86 6.55
 2.50 6.55 9.50






表 4.4.1
编号(cm)
1
2
3
4
5
6
7
8
9
某地区农村女婴的体格测量数据
身高(cm)
80
75
78
75
79
78
75
64
80
胸围(cm) 上半臂围(cm)
58.4
14.0
59.2
15.0
60.3
15.0
57.4
13.0
59.5
14.0
58.1
14.5
58.0
12.5
55.5
11.0
59.2
12.5
从上表4.4.1计算得
n2  9, y  76.0,58.4,13.5
T
196.00

n2  1S 2   45.10
 34.50

所以
45.10
15.76
11.65
x  y  6.0,1.8,1.0
T
Sp

n1  1S1  n2  1S 2

n1  n2  2
34.50

11.65 
14.50 

 27.2308 6.5615 2.8462


  6.5615 2.4323 1.4000 
 2.8462 1.4000 1.8462 


T 1
n1n2
2
T 
x  y S p x  y  5.312
n1  n2
由(4.4.5)式知
pn1  n2  2 
2
T0.05 
F 0.05  p, n1  n2  p  1
n1  n2  p  1
3 13
3 13

 F0.05 3,11 
 3.59  12.728
11
11

 

因 T T
2
2
0.05
,故不能拒绝原假设 H 0,
即认为两个均值向量无显著差异( =0.27)。
p
二 成对试验的 T 统计量
2
x , y , i  1,2,, nn  p 是成对试验的数据,令
i
i
di  xi  y i , i  1,2,, n
又设 d1 , d 2 ,, d n独立同分布于N p  ,  , 其中 0,
  1   2 , 1和 2分别是总体 x 和总体 y
的均值向量。
我们希望检验的假设 H0 : 1  2 ,H 1: 1  2
等价于 Ho :   0, H1 :   0
(4.4.8)
这样,两个总体的均值比较问题就可以化为一
个总体的情形。

由 T  n x  0
2
 S x   
T
1
T
T  nd S d1 d
2
知,检验统计量
0
(4.4.9)
其中 d  x  y



T
1 n
S d
d i  d di  d

n  1 i 1
当原假设 H o :   0 为真时,统计量
n p 2
T
pn  1
(4.4.10)
服从自由度为 p 和 n  p 的 F 分布。
对给定的显著性水平
,
检验规则为:
当T 2  T2时,拒绝H 0;
当T 2  T2时,接受H 0。
其中
pn  1
T 
F  p, n  p 
n p
2
(4.4.12)
第五节 两个总体均值分量
间结构关系的检验
设两个独立的样本 x1 , x2 ,, xn1 和
y1, y 2 ,, y n2 分别取自总体 N p 1 ,  和总
体 N p 2 ,  ,  0 , n1  n2  2  p
我们希望检验
H0 : C(1  2 )  ,
H 1: C(1  2 )  
(4.5.1)
其中 C 为一已知的 k  p 矩阵,k  p,rank(C ) ,
k
 为一已知的 k 维向量。
检验统计量为
n1n2
T
T 1
T 
[C (x  y )   ] (CS pC ) [C (x  y )   ]
n1  n2
2
其中 S p 是
(4.5.2)
 的联合无偏估计。
(n1  n2  k  1)T
当原假设 H 0 为真时, k (n  n  2)
服从
1
2
自由度为 k 和 (n1  n2  k 1) 的 F 分布。
2
对于给定的显著性水平  ,检验规则为:
当T  T 时,拒绝H 0;
2
2
当T  T 时,接受H 0。
2
2
其中
k (n1  n2  2)
T 
F (k , n1  n2  k  1)
n1  n2  k  1
2
F (k , n1  n2  k 1) 为 F (k , n1  n2  k  1)
的上  分位点。
例4.5.1
某种产品有甲、乙两种品牌,从甲产品批和
乙产品批中分别随机抽取 5 个样品,测量相同的 5 个
指标,数据见下表。在多元正态性假定下,试问甲、
乙两种品牌产品的每个指标间的差异是否有显著的不
同?
建立假设:H0 : C(乙  甲)  0,
其中
H 1: C(乙  甲)  0
 1 1 0 0 0 


 0 1 1 0 0 
C 
0 0 1 1 0 


 0 0 0 1  1


甲、乙两种品牌产品的指标值
指标
1
2
3
4
5
1
2
3
4
5
11
33
20
18
22
18
27
28
26
23
15
31
27
18
22
18
21
23
18
16
15
17
19
9
10
均值
20.8
24.4
22.6
19.2
14.0
乙 1
2
3
4
5
18
31
14
25
36
17
24
16
24
28
20
31
17
31
24
18
26
20
26
26
18
20
17
18
29
均值
24.8
21.8
24.6
23.2
20.4
样品
甲
由(4.5.2)式知,检验统计量为
n1n2
T 
(x乙  x甲 )T C T (CS pC T ) 1 C (x乙  x甲 )
n1  n2
2
经计算
x乙  x甲  (4.0 ,  2.6 , 2.0 , 4.0 , 6.4)
 72.700

 33.025
S p   41.650

 18.675
 22.300

T
33.025 41.650 18.675 22.300

21.250 21.300 12.725 11.925
21.300 41.300 16.350 9.850 

12.725 16.350 11.450 10.200

11.925 9.850 10.200 21.650
C(x乙  x甲)  (6.6 ,  4.6 ,  2.0 ,  2.4)T
 27.900

  8.575
T
CS p C  
14.400

  4.425

 8.575 14.400  4.425

 19.950  16.375  5.750
 16.375 20.050 5.250 

 5.750 5.250 12.700 
 0.0918  0.0310  0.1076 0.0625 


  0.0310 0.1667 0.1589  0.0017
T 1
(CS p C )  
 0.1976 0.1589 0.2782  0.0812


 0.0625  0.0017  0.0812 0.1334 


y  (CS p C T ) 1 C (x乙  x甲 )
 (0.8136,  1.2855,  1.8028, 0.2628)
T
(x乙  x甲)T CT y  14.2582
5 5
2
14.2582  35.645
所以 T 
55
k (n1  n2  2)
T 
F0.05 (k , n1  n2  k  1)
n1  n2  k  1
2
4  (5  5  2)

F0.05 (4,5)  6.4  5.19  33.216
5  5  4 1
由于 T  T ,所以在显著性水平   0.05
2
2
下拒绝原假设 H 0 ( p  0.044) 。
第六节 多个总体均值的比较检验
(多元方差分析)
设有 k 个总体  1 ,  2 ,,  k ,它们的分布分
别是 N p 1 ,  , N p 2 , ,, N p (k , ) ,今从
这
k 个总体中各自独立地抽取一个样本,取自
总体  i 的样本为 xi1 , xi 2 ,, xini ,i  1,2,, k 。
现欲检验
H0 : 1  2    k
H1 : i   j , 至少存在一对i  j
k

ni


T
令 SST 
 xij  x xij  x
(4.6.2)
i 1 j 1
ni
k
k
1
其中 x   xij , n   ni
n i 1 j 1
i 1
再令
则
1
xi 
ni
k
ni
x
j 1
ni

ij

SST   xij  x xij  x
i 1 j 1

T
ni
k


  x ij  x i  x i  x x ij  x i  x i  x

T
i 1 j 1
ni
k


  x ij  x i x ij  x i
i 1 j 1
   n x  xx  x
k
T
i 1
T
i
i
i
其中交叉乘积项
 x
ni
k
i 1 j 1
ij


k
ni


 xi xi  x   xi  x xij  xi
T

T
i 1 j 1
k




T
    xij  ni xi  xi  x   xi  x   xij  ni xi 
i 1  j 1
i 1

 j 1

 00  0
k
ni




ni
T
记
ni
k




SSE   xij  xi xij  xi

T
(4.6.3)
i 1 k 1
k
SSTR   ni xi  x xi  x

T
(4.6.4)
i 1
则
SST  SSE  SSTR
(4.6.5)
称SST,SSE和SSTR分别为总平方和及交叉乘
积和,误差(或组内)平方和及交叉乘积和和
处理(或组内)平方和及交叉乘积和,它们分
别具有自由度
n 1, n  k 和k 1
。
采用似然比方法可以得到威尔克斯(wilks)
统计量
 p.k 1,nk
| SSE |
| SSE |


| SSE  SSTR| | SST |
4.6.6
对给定的显著性水平  ,检验规则为:
当 p ,k 1,n k   p ,k 1,n  k ,时,拒绝H 0;
当 p ,k 1,n k   p ,k 1,n k ,时,接受H 0。
(4.6.7)
其中临界值  p,k 1,nk , 满足:当原假设H 0为真
时, P
(4.6.8)
p,k 1,nk   p,k 1,nk ,   
例4.6.1 为了研究销售方式对商品 销售额的
影响,选择四种商品(甲、乙、丙和丁)按三
种不同的销售方式( 、和 )进行销售。
这四种商品的销售额分别为 x1 , x2 , x3 , x4 ,其
数据见表4.6.1。
表4.6.1
编
号
1
2
3
4
5
6
7
8
9
10

销售方式
x1
x2
x3
x4
125
60
80
51
51
65
45
60
66
54
77
338
233
260
429
403
350
585
273
585
507
210
330
203
150
205
190
200
250
240
270
119
63
65
130
69
46
146
87
110
销售额数据
销售方式 
x1
66
82
65
40
67
38
42
113
80
76
x2
x3
x4
54
45
65
51
54
50
45
40
55
60
455
403
312
477
481
468
351
390
520
507
310
210
280
280
293
210
190
310
200
189
销售方式 
x1
x2
x3
x4
65 33 480 260
100
65
117
114
55
64
110
60
110
34
63
48
63
30
51
90
62
69
468 295
416 265
468 250
395 380
546 235
507 320
442 225
440 248
377 260
续表4.6.1
编
号
11
12
13
14
15
16
17
18
19
20
销售方式
销售方式
x1
x2
x3
x4
x1
x2
x3
x4
107 60 364 200 94 33 260 280
130 61 391 200 60 51 429 190
80
45 429 270 55 40 390 295
60
50 442 190 65 48 481 177
81
54 260 280 69 48 442 225
135 87 507 260 125 63 312 270
57
48 400 285 120 56 416 280
75
52 520 260 70 45 468 370
76
65 403 250 62 66 416 224
55
42 411 170 69 60 377 280
销售方式
x1
x2
88 78
73 63
114 55
103 54
100 33
140 61
80 36
135 54
130 69
60 57
x3
x4
299 360
390 320
494 240
416 310
273 312
312 345
286 250
468 345
325 360
273 260
该题中,我们需要检验
H0 : 1  2  3 , H1 : 1, 2 , 3中至少有两个不相等
其中
1, 2 , 3
分别为销售方式  ,  和
 的总体均值向量,在进行检验时,我们假
定这三个总体均为多元正态总体,并且它们
的协方差矩阵相同。
据题意
p  4, k  3, n1  n2  n3  20, n  n1  n2  n3  60
经计算
 90.80 
 72.90 
 94.15 






 58.65 
 51.45 
 55.15 
x1  
, x2  
, x3  


404.50
417.45
403.75






 230.65
 253.15
 292.00






 85.9500 


1 3
1 3
 55.0833 
x   ni x i   xi  
408.6667
n i 1
3 i 1


 258.6000


3
SSTR   ni xi x i  nxx
T
T
i 1
 5221.30 1305.20  3581.25 4188.90 


1305.20 518.53  963.83  1553.20 

 3581.25  963.83 2480.83  1945.25 


 4188.90  1553.20  1945.25 38529.30


3
ni
SST   x ij x ij  nx x
T
T
i 1 j 1
 49290.85 8992.25  36444.00 28906.80



 8992.25 9666.58  4658.33 4859.90


 36444.00  4658.33 429509.33  58114.60


 28906.80 4859.00  58114.00 175644.40 


SSE  SST  SSTR
 44069.55 7687.05  32862.75 24717.90



 7687.05 9148.05  3694.50 6412.20


 32862.75  3694.50 427028.50  56168.75


 24717.90 6412.20  56168.75 137115.10 


于是  4,2,57 
1.646410

 0.6663
19
SST 2.470810
SSE
19
由附录4-3 中的(4-3.4)式可得

57  4  11 
F

0.6663
 3.039
4  0.6663
查 F 分布表得, F0.01 8,108  2.68  3.039 ,从
而在   0.01 的水平下拒绝原假设 H 0  p  0.004
,
因此可认为三种销售方式的销售额有十分显
著的差异。
为了解这三种销售方式的显著差异究竟是由
哪些商品引起的,我们对这 四种商品分别用
一元方差分析方法进行检验分析。由
SSTR /(k  1)
F
SSE /(n  k )
并利用SSTR和SSE这两种矩阵对角线上的
元素有
5221.30 / 2
F1 
 3.337
44069.55 / 57
518.53 / 2
F2 
 1.615
9148.05 / 57
2480.83 / 2
F3 
 0.166
427028.50 / 57
2480.83 / 2
F4 
 8.008
137115.10 / 57
查 F 分布表得,F0.05 2,57  3.16, F0.01 2,57  5.01
故甲商品有显著差异  p  0.041 。丁商品有十
分显著的差异  p  0.001 ,而乙与丙商品无显
著差异  p  0.208和 p  0.848 。如果剔除
丁商品,然后再对其他三种商品用  统计量
进行检验,则有
3, 2,57
1.383110


 0.8695
14
SST 1.590610
SSE

57  3  11 
F
14

0.8695
 1.328
3  0.8695
查表得,F0.05 6,110  2.18  1.328 ,不显著,
因此说明对甲,乙,丙这三种商品,销售方
式  , 和  的总体均值向量之间无显著差
异  p  0.251
第七节
总体相关系数的推断
设 x1 , x 2 ,, x 4 是取自总体 N p ,  的一
个样本,样本协方差矩阵 S  (sij )
。
一、简单相关系数的推断
现欲检验
H0 : ij  0,
从样本相关系数 rij 
验统计量。
sij
sii sjj
H 1: ij  0
出发来构造检
n  2 rij
当 ij  0 时,统计量
1 r
2
ij
服从自由度为 n  2 的
t 分布,可将其作为
检验统计量。
对于给定的显著性水平
当
当
n  2 rij
1  rij
n  2 rij
1  rij
 ,检验规则为:
 t / 2 n  2时。拒绝H 0 ;
 t / 2 n  2时。接受H 0。
(4.7.4)
如果希望检验
H0 : ij  ij0 , H1 : ij  ijo
(4.7.5)
则可以使用一种近似的方法。在 n 很大的情
1 1  rij
 1 1   ij 1 
 。
,
况下, 2 ln 1  r 近似服从 N  ln

2
1


n

2
ij
ij


利用这一结论可构造检验统计量为
1  ij 0 
n  2  1  rij

ln
 ln
2  1  rij
1  ij 0 
(4.7.6)
当原假设 H0 : ij  ijo 为真时,它近似地服
从 N 0,1,对于给定的显著性水平  ,检验
规则为:
1  ij 0
n  2 1  rij
当
ln
 ln
 u / 2时,拒绝H 0;
2
1  rij
1   ij 0
1  ij 0
n  2 1  rij
当
ln
 ln
 u / 2时,接受H 0;
2
1  rij
1  ij 0
(4.7.7)
在(4.7.7)式中,若用 ij来代替 0 ji  ,则可
得到 ij 的 1   置信区间,即


1  ij 0
n  2 1  rij
ln
 ln
 u / 2 
ij :
2
1  rij
1  ij 0


等价于
其中
g1  1
h1  1
 ij 
g1  1
h1  1
1  rij
 2u / 2 
g1 
exp 

1  rij
n2 

1  rij
 2u / 2 
h1 
exp

1  rij
 n2 
(4.7.9)
(4.7.8)
二 偏相关系数的判断
将 x, , S 作如下剖分:
  11
 x1 
x    ,  

x
 2  p k
  21
 12  , S   S11
S

 22  pk  21
k
样本偏相关系数为
rij.k 1,, p 
k
k
p k
sij.k 1,, p

其中 S11.2  S11  S S S  sij.k 1,, p
S12 

S 22  p k
k
p k
(4.7.10)
sii.k 1,, p s jj.k 1,, p
1
12 22 21
k

。
欲检验
H0 : ij.k 1,, p  0,H 1: ij.k 1,, p  0
(4.7.11)
为此构造检验统计量为
n  p  k  2rij.k 1,, p
1 r
2
ij.k 1,, p
(4.7.12)
当 H0 : ij.k 1,, p  0 为真时,它服从自
由度为 n  p  k  2 的
t 分布 。
对于给定的显著性水平 ,检验规则为:
当
当
n  p  k  2 rij.k 1,, p
1  rij2.k 1,, p
n  p  k  2 rij.k 1,, p
1  rij2.k 1,, p
 t / 2 n  p  k  2时。拒绝H 0
 t / 2 n  p  k  2时。接受H 0
1 1  rij.k 1,, p
在样本容量 n很大的情况下, 2 ln 1  r
ij.k 1,, p
 1 1  ij.k 1,, p

1

N  ln
,
近似服从  2 1  ij.k 1,, p n  p  k  2 


。
由此可以求得
ij.k 1,, p 的 1   置信区间,并
可在显著性水平 下检验
H 0: ij.k 1,, p  ijo.k 1,, p
H1 : ij.k 1,, p  ij 0.k 1,, p
(4.7.14)
与 (4.7.9)式类似, ij.k 1,, p 的 1   置信
区间为
g2 1
h2  1
 ij.k 1,, p 
g2  1
h2  1
(4.7.15)
其中
g2 
h2 
1  rij.k 1,, p
i  rij.k 1,, p
1  rij.k 1,, p
i  rij.k 1,, p


2
u

/
2

exp 


n

p

k

2




2
u

/
2

exp
 n pk 2 


在显著性水平  下对(4.7.14)式作检验时,
若 ij.k 1,, p 落在(4.7.15)式的区间内,则接
受 H 0;否则 ,就拒绝 H 0 。
三 复相关系数的推断
将 x, , S
剖分如下:
 x1   11
x   , 

x
 2   21

 s11
, S  
s

 22   12

T
12
s 

s22 
T
12
样本复相关系数为
r1.23 p
1/ 2
 s12T S 22 s12 

 

s
11


1
(4.7.16)
其平方为
2
1.23 p
r
欲检验
1
T
12 22
12
s S s

s11
H0 : 1.23,p  0, H1 : 1.23p  0
(4.7.17)
(4.7.18) _
检验统计量为
n p r
2
p 1 1  r1.23p
2
1.23 p
(4.7.19)
当
H0 : 1.23,p  0 为真是,它服从自由度
n  p 的 F 分布,对于给定的
显著性水平  ,检验规则为:
为  p  1 和
2
r
n  p 1.23 p
当
 F  p  1, n  p 时,拒绝H 0;
2
p  1 1  r1.23 p
n p r
当
p 1 1  r
2
1.23 p
2
1.23 p
 F  p  1, n  p 时,接受H 0。 (47.20)
二 似然比原则
考虑假设检验问题 H 0 :   0 , H1 :   0
样本的似然函数
L ,    2 
 np / 2
| |

n / 2




参数空间   ,  :   R ,   0
对应的子集


T 
 1 1
etr  A  n x   x   
 2

p
  0 ,  :   0
在  上, 和  的极大似然估计为





T
1
1 n
 A   xi  x xi  x
n
n i 1
  x 和
在 上,  0, 的极大似然估计为
~
1 n
T
xi   0 xi  0 
  n
i 1
T
1 n
  x i  x x i  x  n x   0 x   0
n  i 1
T
1
 A  n x  0 x  0
n










T



所以
  
  L  ,  


max L , 

 2 
 np / 2
~

 L 0 , 

 2 
 np / 2
| A | N / 2 n np / 2e np / 2 max L , 








T n / 2
| A  n x  0 x  0 |

n np / 2e np / 2
故而似然比统计量
max L , 

| A|


max L ,   | A  nx   x    |
n/2

T n/2


0


 

0
T n / 2
| I p  nA x  0 x  0 |
1


T
 1  n x  0 A x  0
1
n / 2

T 
 1 

 n  1
2
n / 2
(因为 | I p  AB || I q  BA |, 其中A : p  q, B : q  p )。
检验规则为:
当    时,拒绝
当
  
时,接受
H0
H0
;
。
其中临界值 满足:当 H 为真时,P  0   由于  是关于
T
2
0
的严格递减函数,所以(4.2.10)式的检验规则等价
于(4.2.7)式,也等价于(4.2.6)式。故而(4.2.4)和(4.2.5)
式给出的是似然比统计量。