参数估计

Transcript 参数估计

第二节
参数估计
●参数的点估计
● 参数的区间估计
首页
上页
返回
下页
结束
铃
第二节
矩估计法
数字特征
法
点
估
计
参数估计
估
计
量
的
评
选
置信区间和上下限
无偏性
有效性
正态总
体均值
方差的
置信区
间与上
下限
求置信区间
的步骤
教学要求
了解：了解参数估计的意义与方法。理解矩估计
量的概念与构造方法，理解估计量的评判
标准。
掌握：掌握矩估计法，掌握期望与方差在不同情
况下的区间估计法。
重点：矩估计法，区间估计法。
难点：不同参数所满足的不同统计量。
9.2.1 参数的点估计
参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数或者参数的某些函数.
估计新生儿的平均体重
估计废品率
估计湖中鱼数
估计平均降雨量
…
…
参数估计问题的一般提法
在参数估计问题中，假定总体分布
形式已知，未知的仅仅是一个或几个
参数.
设有一个统计总体，总体的分布函数
为 F( x , ) ，其中
 为未知参数。
现从该总体中抽取样本
X1 , X 2 ,, X n
要依据该样本对参数  作出估计，或估计
 的某个已知函数 g ( ).
这类问题称为参数估计.
1、点估计的概念
设总体 X 的分布函数形式已知, 但它的一个或
多个参数为未知, 借助于总体X的一个样本来估计
总体未知参数的问题称为点估计问题.
点估计问题就是要构造一个适当的统计量
ˆ ( X 1 , X 2 ,, X n ), 用它的观察值ˆ ( x1 , x2 ,, xn )
来估计未知参数 .
ˆ ( X 1 , X 2 ,, X n )称为 的估计量. 通称估计,

ˆ.
简记为

ˆ

 ( x1 , x2 ,, xn )称为 的估计值.
例9-9 在某纺织厂细纱机上的断头次数X是一个
随机变量, 假设它服从以  0为参数的泊松分布,
参数为未知, 现检查了150只纱锭在某一时间段
内断头的次数, 数据如下, 试估计参数 .
断头次数k
断头k次的纱锭数nk
0 1 2 3 4 5 6
45 60 32 9 2 1 1 150
解先确定一个统计量X , 再计算出X的观察值x ,
把 x 作为参数的估计值.
x  1.133 . 的估计值为1.133 .
2.点估计的评价标准
对于同一个参数, 用不同的估计方法求出的估
计量可能不相同,那么哪一个估计量好？好坏的
标准是什么?
下面介绍两个常用标准.
无偏性、有效性
（1）无偏估计
若 X1 , X 2 ,, X n 为总体 X 的一个样本，
 是包含在总体X 的分布中的待估参数,
(是 的取值范围)
定义若估计量ˆ  (X1 , X 2 ,, X n ) 的数学期望
E(ˆ )存在, 且对于任意   有 E(ˆ )  , 则称
ˆ 是 的无偏估计量.
无偏估计的实际意义:
无系统误差.
设总体 X 的k 阶矩 k  E ( X k ) ( k  1)存在,
又设 X 1 , X 2 ,, X n 是 X 的一个样本，试证明不论
1 n k
总体服从什么分布, k 阶样本矩 Ak   X i 是
n i 1
k 阶总体矩 k的无偏估计.
证
因为 X1 , X 2 ,, X n 与 X 同分布，
故有 E ( X )  E ( X )   k , i  1,2,, n.
k
i
k
1 n
即 E ( Ak )   E ( X ik )   k .
n i 1
故 k 阶样本矩 Ak 是 k 阶总体矩  k 的无偏估计.
例9-10 设(X1 , X 2 ,, X n ),是来自总体X的样本.证明：样本均值
n
1 n
1
2
X   X i与样本方差S2 
(X

X
)
分别是总体均值

i
n i 1
n  1 i 1
和总体方差的无偏估计
.
n
n
1
1
证 E( X)  E(  X )  E( X )  1 nE(X)  E(X),
i
i
n i 1
n i 1
n
X是总体均值的无偏估量
.
n
n
1
1
2
S 
(Xi  X ) 
( X 2i  nX 2 ),

n  1 i 1
n  1 i 1
2
n
n
1
1
2
2
 E (S )  E (
( X i  nX )) 
E ( X 2i  nX 2 )
n  1 i 1
n 1
i 1
2
n
1

[ E ( X 2i )  nE( X 2 )]
n 1
i 1
n

[ E ( X 2 )  E ( X 2 )]
n 1
E ( X 2 )  D( X )  [ E ( X )]2 , E ( X 2 )  D( X )  [ E ( X )]2
n
 E (S2 ) 
D( X )  [ E ( X )]2  D( X )  [ E ( X )]2
n 1
n 
D( X )

2

D
(
X
)

[
E
(
X
)]

 [ E ( X )]2 

n 1 
n

n
n 1


D( X )  D( X ).
n 1
n

2
S
即
是总体方差的无偏估计量.

（2）最小方差无偏估计（有效性）
定义设ˆ1  ˆ1 (X 1 , X 2 , , X n )
与ˆ2  ˆ2 (X 1 , X 2 , , X n )
都是 的无偏估计量, 若有
D(ˆ1 )  D(ˆ2 ),
则称 ˆ 较 ˆ 有效.
1
2
由于方差是随机变量取值与其数学期望的
偏离程度,
所以无偏估计以方差小者为好.
例9-11 设总体X的期望E(X)与方差D(X)均存在，
X 1 , X 2 , X n 是X的一个样本，试证明下列统
计量都是E(X)的无偏估计，并说明哪个有效。
1
3
1 ( X 1 , X 2 )  X 1  X 2
4
4
1
2
2 ( X 1 , X 2 )  X 1  X 2
3
3
解
3
3
1
 1
E 1 ( X 1 , X 2 )   E  X 1  X 2   E ( X 1 )  E ( X 2 )
4
4
4
 4
1
3
 E( X )  E( X )  E( X )
4
4
2
1

E  2 ( X 1 , X 2 )   E  X 1  X 2 
3
3

1
2
 E( X )  E( X )  E( X )
3
3
可见上统计量都是E(X)的无偏估计
3  1
1
D 1 ( X 1 , X 2 )   D  X 1  X 2   2 D( X 1 )
4  4
4
32
1 9
 2 D( X 2 )  (  ) D( X )  0.625E ( X )
4
16 16
1 4
D 2 ( X 1 , X 2 )   (  ) E ( X )  0.556 E ( X )
9 9
由于方差更小，所以第二个比第一个更有效。
3.求点估计量的方法
由于估计量是样本的函数, 是随机变量,
故对不同的样本值, 得到的参数值往往不同,
求估计量的问题是关键问题.
估计量的求法: (两种)
数字特征法和矩估计法.
（1）数字特征法
它是用样本的数字特征作为总体相应数字
特征的点估计量，是求点估计量常用的方法.
以样本均值作为总体均值的点估计量，即：
1 n
ˆ  X   Xi
n i 1
(9 -10)
以样本方差作为总体方差的点估计量，即：
1 n
2
ˆ  S 
(X

X
)
 i
n  1 i 1
2
2
X ~ e() 参数
例9-12 已知总体
用数字特征法求
解
(9 - 11)

的点估计量.
1
 E ( X )  ,  
,
E(X)
1
ˆ
 E (X )  X ,   .
X

未知，
例9-13 设总体 X 的分布密度为
(  1) x 
f (x)  
0
0  x 1
其他
求未知参数 的点估计量.
解
  1  2 1   1
 E(X)   x (  1) x dx 
x 0
,
0
2
2
2E(X)- 1
1
 

 2,
1 - E(X) 1 - E(X)
1

用X作E(X)的点估计量，得的点估计为
1
ˆ 
 2.
1 - E(X)
（2）矩估计法
它是基于一种简单的“替换”
思想建立起来的一种估计方法 .
是英国统计学家K.皮尔逊最早提出的 .
其基本思想是用样本矩估计总体矩 .
设 X1 , X2 ,, Xn 是来自总体的样本
记总体k阶原点矩为
k阶中心矩为
 k  E( X )
k
E[X  E(X)]
k
用样本矩来估计总体矩,用样本矩的连续函数
来估计总体矩的连续函数,从而得出参数估计，
这种估计法称为矩估计法.
矩估计法的具体步骤:
(1).求出a j  E(X )  g j (1 ,  2 , ,  k )
j
即
j  1,2, k
a1  E(X1 )  g1 (1 ,  2 , ,  k )

2
a 2  E(X )  g 2 (1 ,  2 , ,  k )



a  E(X k )  g ( ,  ,,  )
k
1
2
k
 k
解方程得：
1  h1 (a1 , a 2 , , a k )
  h (a , a ,, a )
 2
2
1
2
k



 k  h k (a1 , a 2 ,, a k )
这是一个包含
k 个未知参数
1 , 2 ,, k 的方程组.
1 n l
(2).令 a j  aˆ j  A j , A j   Xi ; j  1,2,, k
n i 1
得
ˆ 1  h1 (aˆ 1 , aˆ 2 , , aˆ k )

ˆ 2  h 2 (aˆ 1 , aˆ 2 ,, aˆ k )



ˆ
 k  h k (aˆ 1 , aˆ 2 , , aˆ k )
(3).用方程组的解ˆ 1 , ˆ 2 ,, ˆ k 分别作为1 , 2 ,, k的
估计量, 这个估计量称为矩估量
.
设总体X服从泊松分布 P ( ) 求参数
例 9-14

解：设
的估计量.
X 1 , X 2 , X n 是总体 X 的一个
样本,由于 E (X )  
ˆ 
1
n
n
,可得
 Xi  X
i 1
例9 - 15 设总体X 在[a, b] 上服从均匀分布, 其中a,
b 未知, (X1 , X 2 ,, X n ) 是来自总体X的样本, 求a,
b 的矩估计量.
解
1  E(X )  a  b ,
2
2
2
2
 2  E ( X )  D( X )  [ E ( X )]2  a  b  a  b ,
12
4
ab
1 n
令
 A1   X i ,
2
n i 1
n
2
2
1
2
(a  b) (a  b)

X

 A2

i ,
n i 1
12
4

a  b  2 A1
即 
2

b  a  12( A2  A1 )
解方程组得到a, b的矩估计量分别为
3 n
2
(
X

X
)
,
aˆ  A1  3( A2  A1 )  X 

i
n i 1
2
n
3
2
ˆb  A1  3( A2  A12 )  X 
(
X

X
)
,

i
n i 1
例9 - 16
设总体X服从几何分布, 即有分布律
P{X  k}  p(1  p) k 1 (k  1,2,),
其中p (0  p  1)未知, (X1 , X 2 ,, X n )是来自总
体X的样本, 求p的矩估计量.

解
  E ( X )   k p(1  p)
k 1
k 1
1
 ,
p
1
令  A1  X ,
pˆ
1
 pˆ 
为所求p的矩估计量.
X
例9 - 17 设总体X 的均值 和方差 2 都存在, 且有
  0, 但 和 均为未知, 又设X1 , X 2 ,, X n是
2
2
一个样本, 求 和 2 的矩估计量.
解
1  E(X )   ,
2
2
2




,

D
(
X
)

[
E
(
X
)]
2  E ( X )
   A1
令 2
2



 A2

解方程组得到矩估计量分别为 ˆ  A1  X ,
2
n
n
1
1
ˆ 2  A2  A1   X i 2  X 2   ( X i  X )2 .
n i 1
n i 1
2
总体均值与方差的矩估计量的表达式，
不因不同的总体分布而异.
例 X ~ N (  , 2 ),  , 2未知, 即得 , 2的矩估计量
n
1
2
2
ˆ  X ,

(
X

X
)
.
ˆ

i
n i 1
一般地:
1 n
用样本均值X   X i 作为总体X的均值的矩估计
,
n i 1
1 n
用样本二阶中心矩B2   ( X i  X )2 作为总体
n i 1
X的方差的矩估计.
矩法的优点是简单易行
缺点是，当总体类型已知时，没有
充分利用分布提供的信息 . 一般场合下,
矩估计量不具有唯一性 .
9.2.2
参数的区间估计
前面，我们讨论了参数的点估计. 它是用
样本算得的一个值去估计未知参数. 但是
点估计值仅仅是未知参数的一个近似值，
它没有反映出这个近似值的误差范围，使
用起来把握不大. 区间估计正好弥补了点
估计的这个缺陷 .
1. 置信区间的定义
设总体 X 的分布函数 F ( x; ) 含有一个未知
参数 , 对于给定值  (0    1)若由样本X1 , X 2 ,
, X 确定的两个统计量ˆ  ˆ ( X , X , , X )
n
1
1
1
2
n
和ˆ2  ˆ2 ( X1 , X 2 , , X n ) 满足
P{ˆ    ˆ }  1  
1
2
则称随机区间[ˆ1 , ˆ2 ]是 的置信度为1   的置信区
间, ˆ 和 ˆ 分别称为置信度为1   的双侧置信区间
1
2
的置信下限和置信上限, 1   为置信度.
关于定义的说明
被估计的参数
虽然未知, 但它是一个常数
,
没有随机性
, 而区间[ˆ , ˆ ]是随机的.
1
2
因此定义中以下表达式
P{ˆ    ˆ }  1  
1
2
的本质是:
随机区间[ˆ 1 , ˆ 2 ]以 1  的概率包含着参数
的真值,
而不能说参数
以 1  的概率落入随机区间
[ˆ 1 , ˆ 2 ].
区间估计的两个要求
1. 要求  以很大的可能被包含在区间 [ˆ1 ,ˆ2 ]
ˆ
ˆ
P
{





内，就是说，概率 1
2 } 要尽可能大.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间
长度 ˆ2  ˆ1 尽可能短，或能体现该要求的其
它准则.
可靠度与精度是一对矛盾，
一般是在保证可靠度的条件下
尽可能提高精度.
2. 求置信区间的一般步骤(共3步)
(1) 寻求一个样本X 1 , X 2 ,, X n 的函数 :
Z  Z ( X 1 , X 2 ,, X n ; )
其中仅包含待估参数 , 并且Z的分布已知
且不依赖于任何未知参数(包括 ).
( 2) 对于给定的置信度
1  , 决定出两个常数
a , b,
使P{a  Z ( X 1 , X 2 ,, X n ; )  b}  1  .
(3) 若能从a  Z ( X 1 , X 2 , , X n ; )  b 得到等价的
不等式 ˆ    ˆ , 其中ˆ  ˆ ( X , X , , X ),
1
2
1
1
1
2
n
ˆ2  ˆ2 ( X 1 , X 2 , , X n )都是统计量, 那么[ˆ1 , ˆ2 ]就是
的一个置信度为
1  的置信区间
.
一般有
样本容量
n固定, 置信度1  增大, 置信区间
长度增大, 可信程度增大
, 区间估计精度降低
.
置信度
1  固定, 样本容量n增大, 置信区间
长度减小, 可信程度不变
, 区间估计精度提高
.
3.正态总体均值与方差的区间估计
设给定置信度为1  , 并设X1 , X 2 ,, X n 为
总体N(,  )的样本, X, S 分别是样本均值和
修正样本方差.
2
2
均值 的区间估计
(1)  为已知,
2
X 
~ N (0,1),
因为 X 是  的无偏估计, 且 U 
/ n
由标准正态分布的上  分位点的定义知
 X 

P
 u / 2   1   ,
 / n





即 P X 
u / 2    X 
u / 2   1   ,
n
n


期望的置信区间
于是得的一个置信度为1  的置信区间




u/2 , X 
u  / 2 .
X 
n
n





u / 2 .
这样的置信区间常写成  X 
n


其置信区间的长度为 2 

n
u / 2 .
例9-18 某车间生产的零件长度服从正态分
布 N(,0.22 ) ,从当日产品中随机抽取5个，测得
长度单位分别为22.0，21.4，21.8，22.3，21.5.试
求零件长度的数学期望的置信度为99%的置信区
间.
解
  0.2, n  5,
计算得 X  21.8,
置信度1    0.99时,   0.01
查表得u  / 2  u 0.005  2.58

X
u  / 2  21.57
n

X
u  / 2  22.03
n
即 的置信度为99%的置信区间为
[21.57, 22.03].
例9-19 包糖机某日开工包了12包糖,称得重量(单
位:克)分别为506,500,495,488,504,486,505,
513,521,520,512,485. 假设重量服从正态分布,
且标准差为  10, 试求糖包的平均重量 的 1  
置信区间(分别取  0.10 和   0.05).
解
  10, n  12,
计算得 x  502.92,
(1) 当  0.10时, 1    0.95,
2
查表得 u / 2  u0.05  1.645,
x
x


u / 2  502.92  10  1.645  498.17,
n
12
n
u / 2
10
 502.92 
 1.645  507.67,
12
即 的置信度为90%的置信区间为
[498.17, 507.67].
( 2) 当  0.05时,
查表得
1

2
 0.975,
u / 2  u0.025  1.96,
同理可得的置信度为95%的置信区间为
[497.26, 508.58].
从此例可以看出,
当置信度 1  较大时, 置信区间也较大;
当置信度 1  较小时, 置信区间也较小.
（2）  为未知
2
S


的置信度为1  的置信区间  X 
t  / 2 (n  1) .
n


注意



由于区间 X 
u / 2 中含有未知参数 , 不能
n


直接使用此区间,
但因为S2 是2 的无偏估计, 可用S替换,
由第九章定理三，
X 
~ t (n  1)
S/ n


X 
故P t  (n  1) 
 t  (n  1)  1  ,
S/ n


S
S


即PX 
t  (n  1)    X 
t  (n  1)  1  ,
n
n


于是得 的置信度为1   的置信区间
S


t  (n  1) .
X 
n


例9-20 测得自动车床加工的10个零件尺寸与规
定的偏差为：2，1，-2，3，2，4，-2，5，3，4，
并且被测总体近似服从正态分布，求零件尺寸
偏差的数学期望的置信区（   0.05
）.
解
此时未知, n  10,
10
1
  0.05, x  2, s 2   ( x i  2) 2  5.78,
9 i 1
查 t ( n  1) 分布表可知:
t 0.05 (9)  2.262
s
5.78
于是 x - t  (n  1)  2 
 2.262  0.28,
10
n
s
5.78
x
t  (n  1)  2 
 2.262  3.72.
10
n
得的  0.05的置信区间(0.28, 3.72).
2.方差 的区间估计
2
根据实际需要, 只介绍  未知的情况.
方差 的置信度为 1  的置信区间
2
 (n  1)S2
(n  1)S2 
 2
.
, 2
  / 2 (n  1) 1 / 2 (n  1) 
推导过程如下:
因为S 是 的无偏估计,
2
2
由第九章定理二知
(n  1)S2
2
~

(n  1),
2

方差的置信区间
 2

(n  1)S2
2
故 P1 / 2 (n  1) 
  / 2 (n  1)  1  ,
2



2
 (n  1)S2

(
n

1
)
S
2
即 P 2
  2
  1  ,
1 / 2 (n  1) 
   / 2 (n  1)
于是得方差 2 的置信度为1   的置信区间
 (n  1)S2
(n  1)S2 
 2
.
, 2
   / 2 (n  1) 1 / 2 (n  1) 
进一步可得:
标准差 的一个置信度为1   的置信区间

n  1S

,
  2 (n  1)
 /2

.
12 / 2 (n  1) 
n  1S
注意: 在密度函数不对称时,
如  2 分布和 F分布,
习惯上仍取对称的分位点来
确定置信区间(如图).
例9-21
随机的取某种炮弹9发作实验，测得
炮口速度的样本标准差S=11(m/s).设炮口速度
X ~ N(, 2 ) ,求这种炮弹的炮口速度的标准差的置
信度95%的置信区间.
解


 0.025, 1   0.975,
n  1  8,
2
2
2
2
 0.025 (8)  17.535,  0.975 (8)  2.18, S  11(m / s),
 的95%的置信区间为(7.4,18.59).
例9-22 有一大批糖果,现从中随机地取16袋, 称
得重量(克)如下:
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
设袋装糖果的重量服从正态分布, 试求总体标准
差的置信度为0.95的置信区间.
解
计算得 x  503.75, s  6.2022,
*
n

2
 0.025,
1

2
 0.975,
n  1  15,
标准差的置信区间
查  2 (n  1) 分布表可知:
 02.025 (15)  27.488,
 02.975 (15)  6.262,
代入公式得标准差的置信区间 [4.58, 9.60].
本讲要求掌握
掌握矩估计的方法，会判别估计量的
好坏。针对不同情况会套用置信区间的公
式。
练习
2
1.设总体X～ N (2,4 ), X 1 , X 2
Xn
为X的样本，则下面结果正确的是（）
（A） X  2 ~ N(0,1)
4
X 2
（B） 16 ~ N(0,1)
X 2
（C）
~ N(0,1)
2
X 2
（D） 4 ~ N(0,1)
n
X1  X 2
2. 设总体X～ N ( ,  2 ) ，其中  已知，
 2 未知， X1 , X 2 , X 3 , X 4 为X的样本，
则以下哪个不是统计量（
（A） X1  X 2
4
k
（C）  X k
k 1 10
）
（B）X1   X 4
X 
（D）
/ 4
3. 设
1
与
 2 都是总体未知参数 
的无偏估计量， 1 比
1
与
 2 更有效，则
 2 的方差应满足
。
4．对于相同的置信度，置信区间的长度
越小，表示估计的精确度越
低）。
（高/
答案
1.（D）
2.（D）
3. D( 1 )  D( 2 )
4. 高
作业
练习9-2
1、2、6

参数估计

Transcript 参数估计

Directory