第八章 假设检验

Download Report

Transcript 第八章 假设检验

概率论与数理统计
课件制作:应用数学系
概率统计课程组
假设检验
WZZ
§8.1
假设检验的基本概念
一、何谓假设检验?
假设检验是指施加于一个或多个总体的概率
分布或参数的假设. 所作的假设可以是正确的,
也可以是错误的.
为判断所作的假设是否正确, 从总体中抽
取样本, 根据样本的取值, 按一定的原则进行
检验, 然后, 作出接受或拒绝所作假设的决定.
二、假设检验的内容
参数检验
非参数检验
总体均值、均值差的检验
总体方差、方差比的检验
分布拟合检验
符号检验
秩和检验
三、假设检验的理论依据
假设检验所以可行,其理论背景为实际推
断原理,即“小概率原理”
下面通过引例来说明 问题
引例1 某产品的出厂检验规定: 次品率 p 不超
过4%才能出厂. 现从一万件产品中任意抽查12件
发现3件次品, 问该批产品能否出厂?若抽查结果
发现1件次品, 问能否出厂?
p  0.04 代入
解
假设 p  0.04 P12 (3)  C p (1  p)  0.0097  0.01
3
12
3
9
这是 小概率事件, 一般在一次试验中是不会发生
的, 现一次试验竟然发生, 故可认为原假设不成立,
即该批产品次品率p  0.04 , 则该批产品不能出厂.
1 1
11
P12 (1)  C12 p (1  p)  0.306  0.3 这不是 小概率事件,
没理由拒绝原假设, 从而接受原假设,即该批产品
可以出厂.
1
 0.083  0.04
直接算
注
12
若不采用假设检验, 按理也不能够出厂.
上述出厂检验问题的数学模型
对总体 X ~ f ( x ; p)  p x (1  p)1 x x  0,1 提出假设
H 0 : p  0.04 ; H1 : p  0.04
要求利用样本观察值
( x1 , x2 ,  , x12 )
12
(  xi  3 or 1 )
i 1
对提供的信息作出接受 H 0 (可出厂) , 还是接受
H1 (不准出厂) 的判断.
引例2 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N (  ,3.6 2 ).
若 E ( X ) =  = 68, 则认为这批螺钉符合要
求,否则认为不符合要求.为此提出如下假设:
H0 :  = 68
称为原假设或零假设
原假设的对立面:
H1 :   68
称为备择假设
现从该厂生产的螺钉中抽取容量为 36 的样本,
其样本均值为 x  68.5,问原假设是否正确?
若原假设正确, 则
2
3.6
X ~ N (68 ,
)
36
因而E ( X )  68,即 X 偏离68不应该太远,偏离较远
是小概率事件, 由于
故
X  68
3.6
6
X  68
~ N (0,1)
3.6
6
取较大值是小概率事件
规定 为小概率事件的概率大小,通常取
= 0.05, 0.01,…
因此,可以确定一个常数 c ,使得


 X  68

P
 c  
 3.6



6


例如,
取 = 0.05 ,
则
c  z  z0.025  1.96

2
X  68
由
3.6
6
 1.96
X  69.18 或
X  66.824
称 X 的取值区间
(66.824 , 69.18)
为检验的接受域 (实际上没理由拒绝), 而区间
(  ,66.824 ) 与 ( 69.18 , + )
为检验的拒绝域
现 x  68.5落入接受域,则接受原假设 H0: = 68
由引例 2 可见,在给定  的前提下,接受还
是拒绝原假设完全取决于样本值, 因此所作检验
可能导致以下两类错误的产生:
第一类错误
弃真错误
第二类错误
取伪错误
假设检验的两类错误
所作判断
接受 H0
拒绝 H0
真实情况
H0 为真
H0 为假
正确
第二类错误
(取伪)
第一类错误
(弃真)
正确
犯第一类错误的概率通常记为 
犯第二类错误的概率通常记为 
希望所用的检验方法尽量少犯错误,但不
能完全排除犯错误的可能性.理想的检验方法
应使犯两类错误的概率都很小,但在样本的容
量给定的情形下, 不可能使两者都很小,降低
一个, 往往使另一个增大.
假设检验的指导思想是控制犯第一类错误
的概率不超过,然后,若有必要,通过增大样本
容量的方法来减少  .
引例2 中
犯第一类错误的概率
=P(拒绝H0|H0为真)  P ( X  66.824  X  69.18 )
   0.05
若H0为真, 则
2
3.6
X ~ N (68 ,
)
36
所以,拒绝 H0 的概率为 , 又称为显著性
水平,  越大,犯第一类错误的概率越大, 即
越显著.
下面计算犯第二类错误的概率 
 = P ( 接受 H0 | H0不真 )
H0 不真,即  68, 可能小于68,也可能大于
68,  的大小取决于  的真值的大小.
2
设  = 66, n = 36, X ~ N (66, 3.6 )
36
  66  P( 66.82  X  69.18   66 )
 69.18  66   66.82  66 
 
 

 0.6   0.6 
  (5.3)   (1.37)  1  0.9147  0.0853
2
3
.
6
若  = 69,n = 36, X ~ N ( 69,
)
36
  69  P ( 66.82  X  69.18   69 )
 69.18  69 
 66.82  69 
 


0.6 
0.6 


  (0.3)   (3.63)
 0.6179  0.0002  0.6177
取伪的概率较大.
0.12
0.1
0.08
0.06
/2
/2
0.04
H0 真
0.02
60
62.5
0.12
0.1
0.08
0.06
0.04
0.02
65
67.5
70

72.5
75
H0 不真
67.5 70 72.5 75 77.5 80 82.5
现增大样本容量,取 n = 64,  = 66, 则
3.6 2
X ~ N (66,
)
64
仍取  = 0.05,则
c  z   z 0.025  1.96
2
由
X  68
3.6
8
 1.96 可以确定拒绝域为
(  , 67.118 ) 与 ( 68.882 , + )
因此,接受域为 (67.118, 68.882)
   66  P ( 67.118  X  68.882   66 )
 68.88  66 
 67.12  66 
 
 

 0.45 
 0.45 
  (6.4)   (2.49)
 1  0.9936  0.0064  0.0853
   69  P ( 67.12  X  68.88   69 )
 0.3936  0.6177
(   0 ,   1   )
命题 当样本容量确定后,犯两类错误的概率
不
可能同时减少.
证 设 X ~ N (  ,  02 ) 在水平 给定下,检验假设
H0 :   0 ; H1 :   0
此时犯第二类错误的概率为
  P( 接受H 0 H 0 伪 )  P( X  0  k   1 )
 PH ( X  0  k )  PH ( X  1  k  ( 1  0 ))
1
1
 PH (
1
X  1
0
n

k  ( 1  0 )
0
n
)  (
k  ( 1  0 )
0
n
)
k
0
n 
z
 z
 ( z 
1  0
0
)
n
1
又 
 2 e dx   ( z )
1  0
n
 z  
  z  即 z  z   ( 1  0 )
x2
2
0
n
0
由此可见,当 n 固定时
1) 若
2) 若
  z  z   
  z  z   
注
一般,作假设检验时,先控制犯第一类
1º 错误的概率 , 在保证  的条件下使 
尽量地小.要降低  一般要增大样本容量.
当H0不真时,参数值越接近真值,  越大.
注
2º 备择假设可以是单侧,也可以是双侧的.
引例2中的备择假设是双侧的.如果根据以往
的生产情况,0=68.现采用了新工艺,关心的
是新工艺能否提高螺钉强度,越大越好.此
时, 可作如下的假设检验:
原假设 H0 :  = 68;备择假设 H1 :  > 68
当原假设H0 :  = 0 = 68 为真时,
X   0 取较大值的概率较小
当备择假设H1:  > 68 为真时,
X   0 取较大值的概率较大


 X  0

 z   
给定显著性水平 , 根据 P 



n


可确定拒绝域

x  ( 0  z
,  )
n

因而, 接受域 x  (   , 0  z )
n
称这种检验为右边检验.
H0:   68
备择假设 H1:  > 68
另外,可设 原假设
X ~ N ( ,

2
n
) , E( X )  
若原假设正确, 则
 X 



P
 z   
 



n


但现不知 的真值,只知   0 = 68
 X 
  X 


0
 


 z   
 z 
 
  


 

n

  n

 X 


0

P
 z   
 



n


故取拒绝域 (  0  z
—— 小概率事件

n
,)显著性水平不超过
注
3º
关于零假设与备择假设的选取
H0与H1地位应平等,但在控制犯第一类错误
的概率  的原则下,使得采取拒绝H0 的决
策变得较慎重,即H0 得到特别的保护.
因而,通常把有把握的、有经验的结论作为
原假设,或者尽可能使后果严重的错误成为
第一类错误.
假设检验的步骤
1、 根据实际问题所关心的内容,建立H0与H1
2、在H0为真时,选择合适的统计量V,由H1确
定拒绝域形式
给定显著性水平,其对应的拒绝域
双侧检验 (V  V1 )  (V  V )
其中
(V  V1 )
左边检验
右边检验


2
2
(V  V )
P(V  V )  
3、根据样本值计算,并作出相应的判断.
假设检验
WZZ
§8.2
正态总体参数的假设检验
一、一个正态总体
1、关于 的检验
拒绝域的推导
给定显著性水平与样本值(x1,x2,…,xn )
设 X ~N (  2),2 已知,需检验:
H0 :   0 ; H1 :   0
构造统计量
X  0
U
~ N (0,1)

n
P(拒绝H0|H0为真)
 P ( X  0  k   0 )  PH 0 ( X  0  k )
X  0
X  0
k
 Z )  
 PH 0 (

)  PH 0 (
2



n
n
n

取 k  Z
n
2
所以本检验的拒绝域为
0: U  z 
2
U 检验法
U 检验法 (2 已知)
原假设
H0
备择假设
H1
  0
 0
检验统计量及其
H0为真时的分布
U 
  0
 < 0
  0
 > 0
X 0

n
~ N ( 0,1)
拒绝域
U  z
2
U   z
U  z
T 检验法 (2 未知)
原假设
H0
备择假设
H1
  0
  0
  0
 < 0
  0
 > 0
检验统计量及其
H0为真时的分布
X  0
T
S
n
~ t ( n  1)
拒绝域
T  t
2
T  t
T  t
例1 某厂生产小型马达, 其说明书上写着: 这
种小型马达在正常负载下平均消耗电流不会
超过0.8 安培.
现随机抽取16台马达试验, 求得平均消耗
电流为0.92安培, 消耗电流的标准差为0.32安
培.
假设马达所消耗的电流服从正态分布,
取显著性水平为 = 0.05, 问根据这个样本,
能否否定厂方的断言?
解 根据题意待检假设可设为
H0 :   0.8 ;
H1 :  > 0.8
 未知, 故选检验统计量:
X 
T
~ T (15)
S / 16
查表得 t0.05(15) = 1.753, 故拒绝域为
0.32
x  0.8
 0.94
 1.753  x  0.8  1.753
4
s/ n
现 x  0.92  0.94
故接受原假设, 即不能否定厂方断言.
解二 H0 :   0.8 ;
H1 :  < 0.8
选用统计量:
X 
T
~ T (15)
S / 16
查表得 t0.05(15) = 1.753, 故拒绝域
0.32
x  0.8
 1.753  x  0.8  1.753
 0.66
s/ n
4
现 x  0.92  0.66
故接受原假设, 即否定厂方断言.
由例1可见: 对问题的提法不同(把哪个
假设作为原假设),统计检验的结果也会不同.
由于假设检验是控制犯第一类错误的概率,
使得拒绝原假设 H0 的决策变得比较慎重, 也就
是 H0 得到特别的保护. 因而, 通常把有把握的,
经验的结论作为原假设, 或者尽量使后果严重
的错误成为第一类错误.
上述两种解法的立场不同,因此得到不同
的结论.第一种假设是不轻易否定厂方的结论;
第二种假设是不轻易相信厂方的结论.
2、关于 
2
 检验法
2
的检验
原假设 备择假设 检验统计量及其在
H0为真时的分布
H0
H1
拒绝域
 
2

2= 2
0

2  2
0
n
 
2

2 2
0

2< 2
0
 2 02  2> 02
(Xi   )
i 1

2
0
~  2 ( n)
(  已知)
2
2
1 2
( n)
或  2   2 (n)
2
   ( n)
2
2
1
   ( n)
2
2

原假设 备择假设 检验统计量及其在
H0为真时的分布
H0
H1
 2  12  (n  1)
 2= 02  2 02
2
(n  1) S
 
2
0
2
2
 2 02  2< 02
 2 02  2> 02
拒绝域
~  (n  1)
2
(  未知)
或  2   2 (n  1)
2
   (n  1)
2
2
1
   (n  1)
2
2

例2
某汽车配件厂在新工艺下对加工好的
25个活塞的直径进行测量,得样本方差S2=0.00066.
已知老工艺生产的活塞直径的方差为0.00040. 问
进一步改革的方向应如何?
解 一般进行工艺改革时, 若指标的方差显著
增大, 则改革需朝相反方向进行以减少方差;若
方差变化不显著, 则需试行别的改革方案.
设测量值
X ~ N (  ,  2 )  2  0.00040
需考察改革后活塞直径的方差是否步大于改革前
的方差?故待检验假设可设为:
H0 :  2  0.00040 ; H1 :  2 > 0.00040.
此时可采用效果相同的单边假设检验
H0 :  2 = 0.00040 ; H1 :  2 > 0.00040.
2
(
n

1
)
S
2
2 
~

(n  1)
2
0
取统计量
拒绝域 0:    (n  1)   02.05 (24)  36.415
2
2
24  0.00066
0 
 39.6  36.415
0.00040
2
落在0内, 故拒绝H0. 即改革后的方差显著大于
改革前的方差, 因此下一步的改革应朝相反方向
进行.
二、两个正态总体
设
X ~ N ( 1  1 2 ), Y ~ N ( 2  2 2 ),
两样本 X , Y 相互独立,
样本
(X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym )
样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym ),
显著性水平
1、关于均值差 1 – 2 的检验
原假设
H0
备择假设
H1
1 – 2 =  1 – 2  
1 – 2   1 – 2 < 
1 – 2   1 – 2 > 
检验统计量及其在
H0为真时的分布
U
X Y 
 12

 22
n
m
~ N (0,1)
( 12,22 已知)
拒绝域
U  z
2
U   z
U  z
原假设
H0
备择假设 检验统计量及其在
H1
H0为真时的分布
1 – 2 =  1 – 2  
1 – 2   1 – 2 < 
1 – 2   1 – 2 > 
其中
Sw 
X Y 
T
1 1
 Sw
n m
~ T ( n  m  2)
12, 22未知
12 =  22
2
(n  1) S1
2
 (m  1) S 2
nm2
拒绝域
T  t
2
T  t
T  t
2、关于方差比 12 / 22 的检验
原假设
H0
备择假设 检验统计量及其在
H0为真时的分布
H1
 12 =  22  12  22
 12  22  12 <  22
2
1
2
2
F  F1 (n  1, m  1)
2
S
F ~
S
或 F  F (n  1, m  1)
F (n  1, m  1)
F  F1 (n 1, m 1)
1,  2 均未知
 12  22  12 >  22
拒绝域
2
F  F (n  1, m  1)
例3 杜鹃总是把蛋生在别的鸟巢中,现从两种
鸟巢中得到杜鹃蛋24个.其中9个来自一种鸟巢, 15
个来自另一种鸟巢, 测得杜鹃蛋的长度(mm)如下:
n=9
21.2 21.6 21.9 22.0 22.0 x  22.20
22.2 22.8 22.9 23.2
s12  0.4225
19.8 20.0 20.3 20.8 20.9
m = 15 20.9 21.0 21.0 21.0 21.2
21.5 22.0 22.0 22.1 22.3
y  21.12
s22  0.5689
试判别两个样本均值的差异是仅由随机因素
造成的还是与来自不同的鸟巢有关(  0.05 ).
解
H0 :  1 =  2 ; H1 :  1   2
取统计量
X Y
T
~ T (n  m  2)
1 1
 Sw
n m
拒绝域 0: T  t0.025 (22)  2.074
(n  1) S  (m  1) S
Sw 
 0.718
nm2
2
1
2
2
统计量的值 T0  3.568  2.074 落在0内,因此
拒绝H0 即杜鹃蛋的长度与来自不同的鸟巢有关.
例4 假设机器 A 和机器 B 都生产钢管, 要
检验 A 和 B 生产的钢管的内径的稳定程度.
设它们生产的钢管内径分别为 X 和 Y , 都服
从正态分布
X ~ N (1, 12) ,
Y ~ N (2, 22)
现从A生产的钢管中抽出18 根, 测得 s12 = 0.34,
从B生产的钢管中抽出13 根, 测得 s22 = 0.29,
设两样本相互独立. 问是否能认为两台机器生
产的钢管内径的稳定程度相同? ( 取 = 0.1 )
解 H0 :  12 =  22 ; H1 :  12   22
2
1
2
2
S
~ F (17, 12 )
S
查表得 F0.05( 17, 12 ) = 2.59,
1
1
F0.95( 17, 12 ) =

 0.42
F0.05 (12,17) 2.38
拒绝域为:
2
S12
S
1
或

2
.
59
 0.42
2
2
S2
S2
s12 0.34
 1.17 , 落在拒绝域外,
由给定值算得: 2 
s2 0.29
故接受原假设, 即认为内径的稳定程度相同.
三、假设检验与区间估计的联系
同一函数
假
设
检
验
统计量
枢轴量
接受域
置信区间

1
对偶关系
区
间
估
计
正态总体  的双侧假设检验与置信区间对
照
备择假设 检验统计量及其在
H0为真时的分布
H1
原假设
H0

0
  0
待估参数

X  0
U
~ N (0,1)

n
( 2 已知)
接受域
x  0

 z
2
n
枢轴量及其分布
置信区间
X  0
U
~ N (0,1)

n
( 2 已知)


(x  z , x  z )
n
n

2

2
原假设
H0
备择假设 检验统计量及其在
H0为真时的分布
H1
0
0
X  0
T
~ T (n  1)
S
n
( 2未知)
待估参数

枢轴量及其分布
X  0
T
~ T (n  1)
S
n
( 2未知)
接受域
x  0
s
 t
2
n
置信区间
( x  t
2
s
,
n
s
x  t )
2
n
原假设 备择假设 检验统计量及其在
H0
H0为真时的分布
H1
 2= 02  2 02
待估参数
2
接受域
2
2
(
n

1
)
S
2
2
(
n

1
)
S
2
  2 ~  (n  1)  2 




2
0
1
0
2
2
(未知)
枢轴量及其分布
置信区间
2
(
n

1
)
S
 2  2 ~  2 (n  1) (n  1)s 2 (n  1)s 2
0
( 2
, 2
)
 (n  1) 1 (n  1)
(未知)

2

2
例 5 新设计的某种化学天平,其测量的误差
服从正态分布,现要求 99.7% 的测量误差不超过
0.1mg, 即要求 3  0.1。现拿它与标准天平相比,
得10个误差数据,其样本方差s2 =0.0009. 试问在
 = 0.05的水平上能否认为满足设计要求?
解一
H0:   1/30 ; H1:  1/30
2


 未知, 故选检验统计量
9S 2
 02
2
9
S
2
2
  0.05 (9)  16.919
拒绝域:  
1 / 900
~  2 (9)
2
9S
 7.29  16.919 落在拒绝域外
现  
1 / 900
2
故接受原假设, 即认为满足设计要求.
解二
 2的单侧置信区间为
(n  1) S 2
0.0081
( 0, 2
)  ( 0,
)  ( 0 , 0.0024 )
 1 (n  1)
3.325
1
 0.0011  0.0024 , 则H0 成立
H0中的    
900
2
2
0
从而接受原假设, 即认为满足设计要求.
四、样本容量的选取
虽然当样本容量 n 固定时, 我们不能
同时控制犯两类错误的概率, 但可以适当
选取 n 的值, 使犯取伪错误的概率  控制
在预先给定的限度内.
样本容量 n 满足 如下公式:
n  ( z  z  ) / 
单边检验
n  ( z  z  ) / 
双边检验
2
小结
假设检验步骤(三部曲)
 根据实际问题所关心的内容,建立H0与H1
 在H0为真时,选择合适的统计量V,由H1确
定拒绝域形式
给定显著性水平,其对应的拒绝域
双侧检验 (V  V1 )  (V  V )
其中
(V  V1 )
左边检验
P(V  V )  
(V  V )
右边检验
 根据样本值计算,并作出相应的判断.


2
2
课堂练习
设某次概率统计考试考生的成绩
X ~ N ( , 2), 从中随机地抽取 36 位考生
的成绩,算得平均成绩为66.5分,标准差
为15分.
问在显著性水平0.05下,是否可
以认为这次考试的平均成绩为70分?
并给出检验过程 .
解
H 0 :   70 ; H1 :   70 .
X  70
 t  (n  1)  2.0301
拒绝域: T 
2
S/ n
66.5  70
T 
 1.4  2.0301
15 / 36
落在拒绝域外,接受 H 0
即认为这次考试的平均成绩为70分.
4 用包装机包装洗衣粉. 在正常情况下,
每袋重量为1000克,标准差不能超过15克.
假设每袋净重 X ~ N ( ,  2 ). 某天为检查机器
工作是否正常,随机抽取10袋得其净重的
均值 X  998 ,方差 S  (30.23) .
2
问该天包装机工作是否正常?(
解
2
  0.05 ).
H0:  = 1000 ; H1:  1000
取统计量
X 
T
~ t (n  1)
S/ n
拒绝域 0: T  t0.025 (9)  2.2622
998  1000
T 
 0.209  2.2622
30.23/ 10
落在拒绝域外,接受 H 0
即认为该天包装机工作正常.
本题只做了一半,还应继续做下去
解 (2)设 H 0 :  2  225; H1 :  2  225
(n  1) S
2
 
~  (n  1)
2

2
取统计量
2
拒绝域 0:   
2
2
0.05
(9)  16.919
9  (30.23)
 
 36.55  16.919
2
15
落在拒绝域内,拒绝 H 0
2
2
0
综合(1)(2),虽然平均净重合格, 但方差
偏大,故包装机工作不太正常.