Transcript 参数估计
第二节
参数估计
●参数的点估计
● 参数的区间估计
首页
上页
返回
下页
结束
铃
第二节
矩估计法
数字特征
法
点
估
计
参数估计
估
计
量
的
评
选
置信区间和上下限
无偏性
有效性
正态总
体均值
方差的
置信区
间与上
下限
求置信区间
的步骤
教学要求
了解:了解参数估计的意义与方法。理解矩估计
量的概念与构造方法,理解估计量的评判
标准。
掌握:掌握矩估计法,掌握期望与方差在不同情
况下的区间估计法。
重点:矩估计法,区间估计法。
难点:不同参数所满足的不同统计量。
9.2.1 参数的点估计
参数估计问题是利用从总体抽样得到的信息
来估计总体的某些参数或者参数的某些函数.
估计新生儿的平均体重
估计废品率
估计湖中鱼数
估计平均降雨量
…
…
参数估计问题的一般提法
在参数估计问题中,假定总体分布
形式已知,未知的仅仅是一个或几个
参数.
设有一个统计总体,总体的分布函数
为 F( x , ) ,其中
为未知参数。
现从该总体中抽取样本
X1 , X 2 ,, X n
要依据该样本对参数 作出估计,或估计
的某个已知函数 g ( ).
这类问题称为参数估计.
1、点估计的概念
设总体 X 的分布函数形式已知, 但它的一个或
多个参数为未知, 借助于总体X的一个样本来估计
总体未知参数的问题称为点估计问题.
点估计问题就是要构造一个适当的统计量
ˆ ( X 1 , X 2 ,, X n ), 用它的观察值ˆ ( x1 , x2 ,, xn )
来估计未知参数 .
ˆ ( X 1 , X 2 ,, X n )称为 的估计量. 通称估计,
ˆ.
简记为
ˆ
( x1 , x2 ,, xn )称为 的估计值.
例9-9 在某纺织厂细纱机上的断头次数X是一个
随机变量, 假设它服从以 0为参数的泊松分布,
参数为未知, 现检查了150只纱锭在某一时间段
内断头的次数, 数据如下, 试估计参数 .
断头次数k
断头k次的纱锭数nk
0 1 2 3 4 5 6
45 60 32 9 2 1 1 150
解 先确定一个统计量X , 再计算出X的观察值x ,
把 x 作为参数的估计值.
x 1.133 . 的估计值为1.133 .
2.点估计的评价标准
对于同一个参数, 用不同的估计方法求出的估
计量可能不相同,那么哪一个估计量好?好坏的
标准是什么?
下面介绍两个常用标准.
无偏性、有效性
(1)无偏估计
若 X1 , X 2 ,, X n 为总体 X 的一个样本,
是包含在总体X 的分布中的待估参数,
(是 的取值范围)
定义 若估计量ˆ (X1 , X 2 ,, X n ) 的数学期望
E(ˆ )存在, 且对于任意 有 E(ˆ ) , 则称
ˆ 是 的无偏估计量.
无偏估计的实际意义:
无系统误差.
设总体 X 的k 阶矩 k E ( X k ) ( k 1)存在,
又设 X 1 , X 2 ,, X n 是 X 的一个样本,试证明不论
1 n k
总体服从什么分布, k 阶样本矩 Ak X i 是
n i 1
k 阶总体矩 k的无偏估计.
证
因为 X1 , X 2 ,, X n 与 X 同分布,
故有 E ( X ) E ( X ) k , i 1,2,, n.
k
i
k
1 n
即 E ( Ak ) E ( X ik ) k .
n i 1
故 k 阶样本矩 Ak 是 k 阶总体矩 k 的无偏估计.
例9-10 设(X1 , X 2 ,, X n ),是来自总体X的样本.证明:样本均值
n
1 n
1
2
X X i与样本方差S2
(X
X
)
分别是总体均值
i
n i 1
n 1 i 1
和总体方差的无偏估计
.
n
n
1
1
证 E( X) E( X ) E( X ) 1 nE(X) E(X),
i
i
n i 1
n i 1
n
X是总体均值的无偏估量
.
n
n
1
1
2
S
(Xi X )
( X 2i nX 2 ),
n 1 i 1
n 1 i 1
2
n
n
1
1
2
2
E (S ) E (
( X i nX ))
E ( X 2i nX 2 )
n 1 i 1
n 1
i 1
2
n
1
[ E ( X 2i ) nE( X 2 )]
n 1
i 1
n
[ E ( X 2 ) E ( X 2 )]
n 1
E ( X 2 ) D( X ) [ E ( X )]2 , E ( X 2 ) D( X ) [ E ( X )]2
n
E (S2 )
D( X ) [ E ( X )]2 D( X ) [ E ( X )]2
n 1
n
D( X )
2
D
(
X
)
[
E
(
X
)]
[ E ( X )]2
n 1
n
n
n 1
D( X ) D( X ).
n 1
n
2
S
即
是总体方差的无偏估计量.
(2)最小方差无偏估计(有效性)
定义 设ˆ1 ˆ1 (X 1 , X 2 , , X n )
与ˆ2 ˆ2 (X 1 , X 2 , , X n )
都是 的无偏估计量, 若有
D(ˆ1 ) D(ˆ2 ),
则称 ˆ 较 ˆ 有效.
1
2
由于方差是随机变量取值与其数学期望的
偏离程度,
所以无偏估计以方差小者为好.
例9-11 设总体X的期望E(X)与方差D(X)均存在,
X 1 , X 2 , X n 是X的一个样本,试证明下列统
计量都是E(X)的无偏估计,并说明哪个有效。
1
3
1 ( X 1 , X 2 ) X 1 X 2
4
4
1
2
2 ( X 1 , X 2 ) X 1 X 2
3
3
解
3
3
1
1
E 1 ( X 1 , X 2 ) E X 1 X 2 E ( X 1 ) E ( X 2 )
4
4
4
4
1
3
E( X ) E( X ) E( X )
4
4
2
1
E 2 ( X 1 , X 2 ) E X 1 X 2
3
3
1
2
E( X ) E( X ) E( X )
3
3
可见上统计量都是E(X)的无偏估计
3 1
1
D 1 ( X 1 , X 2 ) D X 1 X 2 2 D( X 1 )
4 4
4
32
1 9
2 D( X 2 ) ( ) D( X ) 0.625E ( X )
4
16 16
1 4
D 2 ( X 1 , X 2 ) ( ) E ( X ) 0.556 E ( X )
9 9
由于方差更小,所以第二个比第一个更有效。
3.求点估计量的方法
由于估计量是样本的函数, 是随机变量,
故对不同的样本值, 得到的参数值往往不同,
求估计量的问题是关键问题.
估计量的求法: (两种)
数字特征法和矩估计法.
(1)数字特征法
它是用样本的数字特征作为总体相应数字
特征的点估计量 ,是求点估计量常用的方法.
以样本均值作为总体均值的点估计量,即:
1 n
ˆ X Xi
n i 1
(9 -10)
以样本方差作为总体方差的点估计量,即:
1 n
2
ˆ S
(X
X
)
i
n 1 i 1
2
2
X ~ e() 参数
例9-12 已知总体
用数字特征法求
解
(9 - 11)
的点估计量.
1
E ( X ) ,
,
E(X)
1
ˆ
E (X ) X , .
X
未知,
例9-13 设总体 X 的分布密度为
( 1) x
f (x)
0
0 x 1
其他
求未知参数 的点估计量.
解
1 2 1 1
E(X) x ( 1) x dx
x 0
,
0
2
2
2E(X)- 1
1
2,
1 - E(X) 1 - E(X)
1
用X作E(X)的点估计量,得的点估计为
1
ˆ
2.
1 - E(X)
(2)矩估计法
它是基于一种简单的“替换”
思想建立起来的一种估计方法 .
是英国统计学家K.皮尔逊最早提出的 .
其基本思想是用样本矩估计总体矩 .
设 X1 , X2 ,, Xn 是来自总体的样本
记总体k阶原点矩为
k阶中心矩为
k E( X )
k
E[X E(X)]
k
用样本矩来估计总体矩,用样本矩的连续函数
来估计总体矩的连续函数,从而得出参数估计,
这种估计法称为矩估计法.
矩估计法的具体步骤:
(1).求出a j E(X ) g j (1 , 2 , , k )
j
即
j 1,2, k
a1 E(X1 ) g1 (1 , 2 , , k )
2
a 2 E(X ) g 2 (1 , 2 , , k )
a E(X k ) g ( , ,, )
k
1
2
k
k
解方程得:
1 h1 (a1 , a 2 , , a k )
h (a , a ,, a )
2
2
1
2
k
k h k (a1 , a 2 ,, a k )
这是一个包含
k 个未知参数
1 , 2 ,, k 的方程组.
1 n l
(2).令 a j aˆ j A j , A j Xi ; j 1,2,, k
n i 1
得
ˆ 1 h1 (aˆ 1 , aˆ 2 , , aˆ k )
ˆ 2 h 2 (aˆ 1 , aˆ 2 ,, aˆ k )
ˆ
k h k (aˆ 1 , aˆ 2 , , aˆ k )
(3).用方程组的解ˆ 1 , ˆ 2 ,, ˆ k 分别作为1 , 2 ,, k的
估计量, 这个估计量称为矩估量
.
设总体X服从泊松分布 P ( ) 求参数
例 9-14
解:设
的估计量.
X 1 , X 2 , X n 是总体 X 的一个
样本,由于 E (X )
ˆ
1
n
n
,可得
Xi X
i 1
例9 - 15 设总体X 在[a, b] 上服从均匀分布, 其中a,
b 未知, (X1 , X 2 ,, X n ) 是来自总体X的样本, 求a,
b 的矩估计量.
解
1 E(X ) a b ,
2
2
2
2
2 E ( X ) D( X ) [ E ( X )]2 a b a b ,
12
4
ab
1 n
令
A1 X i ,
2
n i 1
n
2
2
1
2
(a b) (a b)
X
A2
i ,
n i 1
12
4
a b 2 A1
即
2
b a 12( A2 A1 )
解方程组得到a, b的矩估计量分别为
3 n
2
(
X
X
)
,
aˆ A1 3( A2 A1 ) X
i
n i 1
2
n
3
2
ˆb A1 3( A2 A12 ) X
(
X
X
)
,
i
n i 1
例9 - 16
设总体X服从几何分布, 即有分布律
P{X k} p(1 p) k 1 (k 1,2,),
其中p (0 p 1)未知, (X1 , X 2 ,, X n )是来自总
体X的样本, 求p的矩估计量.
解
E ( X ) k p(1 p)
k 1
k 1
1
,
p
1
令 A1 X ,
pˆ
1
pˆ
为所求p的矩估计量.
X
例9 - 17 设总体X 的均值 和方差 2 都存在, 且有
0, 但 和 均为未知, 又设X1 , X 2 ,, X n是
2
2
一个样本, 求 和 2 的矩估计量.
解
1 E(X ) ,
2
2
2
,
D
(
X
)
[
E
(
X
)]
2 E ( X )
A1
令 2
2
A2
解方程组得到矩估计量分别为 ˆ A1 X ,
2
n
n
1
1
ˆ 2 A2 A1 X i 2 X 2 ( X i X )2 .
n i 1
n i 1
2
总体均值与方差的矩估计量的表达式,
不因不同的总体分布而异.
例 X ~ N ( , 2 ), , 2未知, 即得 , 2的矩估计量
n
1
2
2
ˆ X ,
(
X
X
)
.
ˆ
i
n i 1
一般地:
1 n
用 样 本 均 值X X i 作 为 总 体X的 均 值 的 矩 估 计
,
n i 1
1 n
用样本二阶中心矩B2 ( X i X )2 作为总体
n i 1
X的方差的矩估计.
矩法的优点是简单易行
缺点是,当总体类型已知时,没有
充分利用分布提供的信息 . 一般场合下,
矩估计量不具有唯一性 .
9.2.2
参数的区间估计
前面,我们讨论了参数的点估计. 它是用
样本算得的一个值去估计未知参数. 但是
点估计值仅仅是未知参数的一个近似值,
它没有反映出这个近似值的误差范围,使
用起来把握不大. 区间估计正好弥补了点
估计的这个缺陷 .
1. 置信区间的定义
设总体 X 的分布函数 F ( x; ) 含有一个未知
参数 , 对于给定值 (0 1)若由样本X1 , X 2 ,
, X 确定的两个统计量ˆ ˆ ( X , X , , X )
n
1
1
1
2
n
和ˆ2 ˆ2 ( X1 , X 2 , , X n ) 满足
P{ˆ ˆ } 1
1
2
则称随机区间[ˆ1 , ˆ2 ]是 的置信度为1 的置信区
间, ˆ 和 ˆ 分别称为置信度为1 的双侧置信区间
1
2
的置信下限和置信上限, 1 为置信度.
关于定义的说明
被估计的参数
虽然未知, 但它是一个常数
,
没有随机性
, 而区间[ˆ , ˆ ]是随机的.
1
2
因此定义中以下表达式
P{ˆ ˆ } 1
1
2
的 本 质 是:
随 机 区 间[ˆ 1 , ˆ 2 ]以 1 的 概 率 包 含 着 参 数
的 真 值,
而不能说参数
以 1 的 概 率 落 入 随 机 区 间
[ˆ 1 , ˆ 2 ].
区间估计的两个要求
1. 要求 以很大的可能被包含在区间 [ˆ1 ,ˆ2 ]
ˆ
ˆ
P
{
内,就是说,概率 1
2 } 要尽可能大.
即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间
长度 ˆ2 ˆ1 尽可能短,或能体现该要求的其
它准则.
可靠度与精度是一对矛盾,
一般是在保证可靠度的条件下
尽可能提高精度.
2. 求置信区间的一般步骤(共3步)
(1) 寻求一个样本X 1 , X 2 ,, X n 的函数 :
Z Z ( X 1 , X 2 ,, X n ; )
其中仅包含待估参数 , 并且Z的分布已知
且不依赖于任何未知参数(包括 ).
( 2) 对 于 给 定 的 置 信 度
1 , 决 定 出 两 个 常 数
a , b,
使P{a Z ( X 1 , X 2 ,, X n ; ) b} 1 .
(3) 若 能 从a Z ( X 1 , X 2 , , X n ; ) b 得 到 等 价 的
不 等 式 ˆ ˆ , 其 中ˆ ˆ ( X , X , , X ),
1
2
1
1
1
2
n
ˆ2 ˆ2 ( X 1 , X 2 , , X n )都 是 统 计 量, 那 么[ˆ1 , ˆ2 ]就 是
的 一 个 置 信 度 为
1 的 置 信 区 间
.
一般有
样本容量
n固定, 置信度1 增大, 置信区间
长度增大, 可信程度增大
, 区间估计精度降低
.
置信度
1 固定, 样本容量n增大, 置信区间
长度减小, 可信程度不变
, 区间估计精度提高
.
3.正态总体均值与方差的区间估计
设给定置信度为1 , 并设X1 , X 2 ,, X n 为
总体N(, )的样本, X, S 分别是样本均值和
修正样本方差.
2
2
均值 的区间估计
(1) 为已知,
2
X
~ N (0,1),
因为 X 是 的无偏估计, 且 U
/ n
由标准正态分布的上 分位点的定义知
X
P
u / 2 1 ,
/ n
即 P X
u / 2 X
u / 2 1 ,
n
n
期望的置信区间
于是得的一个置信度为1 的置信区间
u/2 , X
u / 2 .
X
n
n
u / 2 .
这样的置信区间常写成 X
n
其置信区间的长度为 2
n
u / 2 .
例9-18 某车间生产的零件长度服从正态分
布 N(,0.22 ) ,从当日产品中随机抽取5个,测得
长度单位分别为22.0,21.4,21.8,22.3,21.5.试
求零件长度的数学期望的置信度为99%的置信区
间.
解
0.2, n 5,
计算得 X 21.8,
置信度1 0.99时, 0.01
查表得u / 2 u 0.005 2.58
X
u / 2 21.57
n
X
u / 2 22.03
n
即 的置信度为99%的置信区间为
[21.57, 22.03].
例9-19 包糖机某日开工包了12包糖,称得重量(单
位:克)分别为506,500,495,488,504,486,505,
513,521,520,512,485. 假设重量服从正态分布,
且标准差为 10, 试求糖包的平均重量 的 1
置信区间(分别取 0.10 和 0.05).
解
10, n 12,
计算得 x 502.92,
(1) 当 0.10时, 1 0.95,
2
查表得 u / 2 u0.05 1.645,
x
x
u / 2 502.92 10 1.645 498.17,
n
12
n
u / 2
10
502.92
1.645 507.67,
12
即 的置信度为90%的置信区间为
[498.17, 507.67].
( 2) 当 0.05时,
查表得
1
2
0.975,
u / 2 u0.025 1.96,
同理可得的置信度为95%的置信区间为
[497.26, 508.58].
从此例可以看出,
当置信度 1 较大时, 置信区间也较大;
当置信度 1 较小时, 置信区间也较小.
(2) 为未知
2
S
的置信度为1 的置信区间 X
t / 2 (n 1) .
n
注意
由于区间 X
u / 2 中含有未知参数 , 不能
n
直接使用此区间,
但因为S2 是2 的无偏估计, 可用S替换,
由第九章定理三,
X
~ t (n 1)
S/ n
X
故P t (n 1)
t (n 1) 1 ,
S/ n
S
S
即PX
t (n 1) X
t (n 1) 1 ,
n
n
于是得 的置信度为1 的置信区间
S
t (n 1) .
X
n
例9-20 测得自动车床加工的10个零件尺寸与规
定的偏差为:2,1,-2,3,2,4,-2,5,3,4,
并且被测总体近似服从正态分布,求零件尺寸
偏差的数学期望的置信区( 0.05
).
解
此时未知, n 10,
10
1
0.05, x 2, s 2 ( x i 2) 2 5.78,
9 i 1
查 t ( n 1) 分布表可知:
t 0.05 (9) 2.262
s
5.78
于是 x - t (n 1) 2
2.262 0.28,
10
n
s
5.78
x
t (n 1) 2
2.262 3.72.
10
n
得的 0.05的置信区间(0.28, 3.72).
2.方差 的区间估计
2
根据实际需要, 只介绍 未知的情况.
方差 的置信度为 1 的置信区间
2
(n 1)S2
(n 1)S2
2
.
, 2
/ 2 (n 1) 1 / 2 (n 1)
推导过程如下:
因为S 是 的无偏估计,
2
2
由第九章定理二知
(n 1)S2
2
~
(n 1),
2
方差的置信区间
2
(n 1)S2
2
故 P1 / 2 (n 1)
/ 2 (n 1) 1 ,
2
2
(n 1)S2
(
n
1
)
S
2
即 P 2
2
1 ,
1 / 2 (n 1)
/ 2 (n 1)
于是得方差 2 的置信度为1 的置信区间
(n 1)S2
(n 1)S2
2
.
, 2
/ 2 (n 1) 1 / 2 (n 1)
进一步可得:
标准差 的一个置信度为1 的置信区间
n 1S
,
2 (n 1)
/2
.
12 / 2 (n 1)
n 1S
注意: 在密度函数不对称时,
如 2 分布和 F分布,
习惯上仍取对称的分位点来
确定置信区间(如图).
例9-21
随机的取某种炮弹9发作实验,测得
炮口速度的样本标准差S=11(m/s).设炮口速度
X ~ N(, 2 ) ,求这种炮弹的炮口速度的标准差的置
信度95%的置信区间.
解
0.025, 1 0.975,
n 1 8,
2
2
2
2
0.025 (8) 17.535, 0.975 (8) 2.18, S 11(m / s),
的95%的置信区间为(7.4,18.59).
例9-22 有一大批糖果,现从中随机地取16袋, 称
得重量(克)如下:
506 508 499 503 504 510 497 512
514 505 493 496 506 502 509 496
设袋装糖果的重量服从正态分布, 试求总体标准
差的置信度为0.95的置信区间.
解
计算得 x 503.75, s 6.2022,
*
n
2
0.025,
1
2
0.975,
n 1 15,
标准差的置信区间
查 2 (n 1) 分布表可知:
02.025 (15) 27.488,
02.975 (15) 6.262,
代入公式得标准差的置信区间 [4.58, 9.60].
本讲要求掌握
掌握矩估计的方法,会判别估计量的
好坏。针对不同情况会套用置信区间的公
式。
练习
2
1.设总体X~ N (2,4 ), X 1 , X 2
Xn
为X的样本,则下面结果正确的是( )
(A) X 2 ~ N(0,1)
4
X 2
(B) 16 ~ N(0,1)
X 2
(C)
~ N(0,1)
2
X 2
(D) 4 ~ N(0,1)
n
X1 X 2
2. 设总体X~ N ( , 2 ) ,其中 已知,
2 未知, X1 , X 2 , X 3 , X 4 为X的样本,
则以下哪个不是统计量(
(A) X1 X 2
4
k
(C) X k
k 1 10
)
(B)X1 X 4
X
(D)
/ 4
3. 设
1
与
2 都是总体未知参数
的无偏估计量, 1 比
1
与
2 更有效,则
2 的方差应满足
。
4.对于相同的置信度,置信区间的长度
越小,表示估计的精确度越
低)。
(高/
答案
1.(D)
2.(D)
3. D( 1 ) D( 2 )
4. 高
作业
练习9-2
1、2、6