Transcript 下载6
第六章 数理统计的基本概念
关键词:
总
体,个 体,样 本, 统 计 量
分布 t 分 布 F 分布
2
1
数理统计学 是一门以数据为基础的科学, 可以定义为
收集数据, 分析数据和由数据得出结论的一组概念、
原则和方法。
例如:若规定灯泡寿命低于1000小时者为次品,如何确定
次品率?由于灯泡寿命试验是破坏性试验,不可能把整批
灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,
以样本的信息来推断总体的信息,这是数理统计学研究的
问题之一。
2
§6.1随机样本与统计量
总体:研究对象的全体;
个体:总体中的成员;
总体的容量:总体中包含的个体数;
有限总体:容量有限的总体;
无限总体:容量无限的总体,通常将容量非
常大的总体也按无限总体处理。
3
例:现要研究某一个公司员工工资水平
及其影响工资水平的因素. 这个公司的
每个员工就是"个体", 而所有的员工构
成一个"总体". 由于公司的员工总数是
有限的, 因此, 是一个有限总体. 每个员
工都附着有年龄, 性别, 工种, 工资, 受
教育程度等指标(变量).
4
总体的某个指标X,
对于不同的个
体来说有不同的取值, 这些取值可
以构成一个分布, 因此X可以看成
一个随机变量. 有时候就把X称为
总体. 假设X的分布函数为F(x), 也
称F(x)为总体.
5
数理统计主要任务是从总体中抽取
一部分个体, 根据这部分个体的数
据对总体分布给出推断. 被抽取的
部分个体叫做总体的一个 样本.
6
随机样本:从总体中随机地取n个个体, 称为
一个随机样本。
简单随机样本:满足以下两个条件的随机样
本(X1,X2,…,Xn)称为容量是n的简单随机样本
。
1. 每个Xi与X同分布;
2. X1,X2,…,Xn是相互独立的随机变量。
7
[说明]:后面提到的样本均指简单随机样本。
由概率论知,若总体X具有概率密度f(x),则
样本(X1,X2,…,Xn)具有联合密度函数:
f n x1 , x2 ,
n
xn f xi
i 1
8
[注意]:一个容量为n的样本
X1 , X 2 ,
Xn
是指n个独立与总体分布相同的随机变量。
一旦对样本进行观察,得到实际数值
x1 , x2 ,
xn
称为样本观察值(或样本值)。
两次观察,样本值可能是不同的。
9
如何取得的样本才称是简单随机样本?
对于有限总体, 采用放回抽样就能得到简单随
机样本.
但当总体容量很大的时候,放回抽样有时候很
不方便, 因此在实际中当总体容量比较大时,通常
将不放回抽样所得到的样本近似当作简单随机样
本来处理.
对于无限总体, 一般采取不放回抽样.
10
统计量:样本的不含任何未知参数的函数。
常用统计量:设(X1,X2,…,Xn)为取自总体X
的样本。常用的统计量如下:
n
1. 样本均值 X 1 X i
n i 1
n
2. 样本方差 S 2 1 ( X i X ) 2 , S 为样本标准差
n 1 i 1
n
3. 样本矩
k阶矩:Ak 1 X ik
n i 1
k 1, 2,
n
k
1
k阶中心矩:Bk ( X i X )
n i 1
k 1, 2,
11
[思考题]:
对于总体X , X 1 ,
, X n是来自总体的样本,
设下列数字特征存在,
E ( X ) , D( X ) ,E ( X ),E[( X ) ],
2
k
k
问:(1)X 与,(2)S 与 ,
2
2
(3)Ak 与E ( X ),(4)Bk 与E[( X ) ]
k
k
是一回事吗?
答:不是。前者是随机变量,观察两次得到的统计
值可能不一样;后者是数,可能已知也可能未知。
12
当总体数字特征未知时
一般, 用样本均值 X 作为总体均值 E ( X ) 的估计;
用样本方差 S 2 作为总体方差 2 E( X )2 的估计;
用样本的原点矩 Ak 作为总体原点矩 k E( X k ) 的估计;
用样本的中心矩 Bk 作为总体中心矩 k E( X )k 的估
计.
(假设总体各阶矩存在)
13
2
总体方差的估计可以用 S 也可以 B2 ,
2
主要的区别是 S 作为
总体方差估计是无偏估计, 但 B2 作为总体方差的估计是有偏的
(关于估计的无偏性将在下一节讨论).
14
§6.2 2 分 布 t 分 布 F 分 布
统计量的分布称为抽样分布.
在数理统计中,
最重要的三个分布
分别为:
分布 t 分 布 F 分布
2
15
分布
2
定义:设随机变量X 1 , X 2 ,
X i N 0,1 i 1, 2,
n
则称 X
2
n
i 1
2
i
X n 相互独立,
, n
1
服从自由度为n 的 2分布,记为 2 2 n
自由度指 1 式右端包含的独立变量的个数.
16
分布
2
2
n 分布的概率密度为:
y
1
2
f n y 2 n 2
0
其中
0
x
n 1
2
e
2y
y0
y0
1 x
e dx
17
f ( x)
n 1
n4
0
n 10
分布的概率密度函数
2
x
18
2分 布 的 一 些 重 要 性 质 :
1. 设 n , 则 有 E n , D 2 n
2
2
2
2
2. 设 Y1 2 n1 , Y2 2 n 2 , 且 Y1 , Y2 相 互 独 立 , 则 有 Y1 Y2 2 n1 n 2
性质2称为 2分布的可加性,可推广到有限个的情形:
Yi ~ 2 ni , i 1,2,m ,并假设 Y1 , Y2 ,Ym 相互独立,
m
2
则 Yi ~ ni
i 1
i 1
m
19
对给定的概率 , 0 1, 称满足条件
2 n
f n y dy 的点2 n 为
2 n 分布的上 分位数, 上 分位数2 n 的值可查 2分布表
20
例:求
2
0.1
25
通过Excel给出.
(1)具体如下: 在Excel表单的任一单元格输入“=” ;
(2)在主菜单中点击“插入”,点击“函数(F)” ;
(3)在选择类别的下拉式菜单中选择“统计” 选择
“CHIINV” 点击“确定”在函数参数表单中输入
Probability=0.9.
(注意:Probability输入的应该是1-0.1=0.9)
(4) Deg\_freedom=25, 点击''确定" 即在单元格中出
现 ''34.382".
21
例:设总体X N , 2 , , 2 已知。
X1, X 2 ,
, X n 是取自总体X 的样本
求(1)统计量 2 12
n
2
(
X
)
的分布;
i
i 1
(2)设n 5,若a(X 1 X 2 ) 2 b(2 X 3 X 4 X 5 ) 2 ~ 2 (k ),
则a, b, k 各为多少?
22
Xi
解:( 1) 作变换 Yi
i 1,2, , n
显然Y1, Y2 , , Yn相互独立,且Yi N 0,1 i 1,2, , n
n
于是 (
2
i 1
Xi
n
) Yi
2
2
i 1
2
n
23
(2)
X1 X 2 ~ N (0, 2 ),
2
2 X 3 X 4 X 5 ~ N (0, 6 ),
2
X1 X 2
~ N (0, 1)
2
2X3 X4 X5
6
X1 X 2 2 X 3 X 4 X 5
与
相互独立,
2
6
( X 1 X 2 )2 (2 X 3 X 4 X 5 ) 2
2
故
~
(2)
2
2
2
6
~ N (0, 1)
a
1
,
2
1
b
,
2
6
k 2.
2
24
t 分布
设 X ~ N (0,1) ,Y ~
则称随机变量 T
2 n ,并且假设 X , Y 相互独立,
X
Y /n
服从自由度为 n 的 t 分布。
记为 T ~ t (n)
t n 分布的概率密度为:f t , n
率密度为:f t , n
n
1 t
n
n
2
n 1
2
2
n21
n21
n n2
, t
25
t n 分布概率密度函数
26
t 分布
对给定的 , 0 1, 称满足条件
t n
f t , n dt 的点t n
为t n 分布的上 分位数。t分布的上 分位数可查t分布表
t1 (n) t (n)
27
例:求 t0.05 25
通过Excel给出.
(1)具体如下: 在Excel表单的任一单元格输入 “=” ;
(2)在主菜单中点击“插入”,点击“函数(F)” ;
(3)在选择类别的下拉式菜单中选择“统计” 选择
“TINV” 点击“确定“在函数参数表单中输入
Probability=0.95.
(4) Deg\_freedom=25, 点击“确定” 即在单元格中
出现 “1.708”.
28
F分布
定义:
且Xn,2Y独立,则
, 且X , Y 独立,
设设X
X
n1 ,Yn1 , Y n
2 ,
2
2
2
2
X / n1
X / n1 n1 , n2 的F 分布,
称随机变量F
服从自由度
则称随机变量
服 从自由度 n1 ,
Y / nF
2
记为F ~ F n1 , n2
Y / n2
其中
n1称为第一自由度,
n2 称为第二自
其中
n1称为第一自由度,
n2 称为第二自由度
性质:F ~ F (n1, n2 ), 则F 1~ F (n2 , n1 )
29
.5: F n1 , n2 分布的概率密度为:
n1 n2
n
n
n
1
2
1 1
1
2
2
2
n
n
x
n2 n1 x 2
1
2
B n1 , n2
f x; n1 , n2 2 2
0
1
a b
b 1
1
其中B a, b x 1 x dx
0
a b
x0
x0
30
F 5,10 分布概率密度函数
31
对于给定的 , 0 1, 称满足条件
F n1 , n2
f x; n1 , n2 dx
的点F n1 , n2 为F n1 , n2 分布的上 分位数。
F n1 , n2 的值可查F 分布表
F1 (n1, n2 ) [ F (n2 , n1 )]1
32
例:求 F0.1 9,10
通过Excel给出.
(1)具体如下: 在Excel表单的任一单元格输入“=” ;
(2)在主菜单中点击“插入”,点击“函数(F)” ;
(3)在选择类别的下拉式菜单中选择“统计” 选择
“FINV” 点击“确定”在函数参数表单中输入
Probability=0.9.
(4) Deg\_freedom1=9, Deg\_freedom2=10点击
“确定” 即在单元格中出现 “2.347”.
33
§6.3正态总体下的抽样分布
定理 6.3.1 设 X1 , X 2 ,
N ( , )
2
, X n 为来自正态总体
的简单随机样本, X 是样本均值,
2
S 是样本方差, 则有:
X ~ N ,
n
2
.
34
定理 6.3.2 设 X1 , X 2 ,
, X n 为来自正态总体
N (, ) 的 简 单 随 机 样 本 , X 是 样 本 均 值 ,
2
S 2 是样本方差, 则有:
(1)
(n 1) S 2
2
~ 2 (n 1) ,
2
(2) X 与 S 相互独立.
35
[思考题]:
设X 1 , X 2 ,
, X n是来自正态总体N ( , 2 )
的简单随机样本,X 和S 2分别是样本均值
和样本方差。问:
n
(X
(1)i 1
i
X)
2
2
服从什么分布?
n
2
(
X
)
i
(2)i 1
服从什么分布?
2
答:(1) (n 1),(2) (n).
2
2
36
定理 6.3.3 设 X1 , X 2 ,
, X n 为来自正态总体
N (, ) 的简单随机样本, X 是样本均值, S 2
2
是样本方差, 则有:
X
~ t (n 1)
S n
37
定理6.3.4
, X n1 定和
, Yn2 分别来自总体
1, :
理Y
6.8
设样本
X , , X 和N Y
6.8:设样本 X 1 ,
1
n1
1
并且它们相互独立,其样本方差分别为
S ,S ,
总体
N 1 , 1 和N 2 , 2 并且它们相互独立,其样
2
, Yn2 分别来自总体
N 1 , 1 和
N
2 , 2
2 2
n1 和 Y1 ,
2
2
2 S1
2
S
2
1
n
1
, S 2则
, :1 F 2 2 F n21 1,
则
:
1
F
F n1
2 2
2
2
1 S2
立,其样本方差分别为
S1 , S 2 ,
1 S2
X Y 1 2
X
Y
1
F n12S1,2n2 12 S 2 2 N2(0,1),
2
2
1
1 2 1 2
1
(1)
~ F (n1 1, n12 1).
2
2
2
2 1 2 2
S
n
n
n1 n2
2
2
2
2
1 2 S
1
2
N (0,1),
2
X 3Y 当 21 22 2时
2
2
2
2
2
2
2
1
2
2
38
(2)
X Y
1
2
1
n1
2
2
2
~ N (0,1)
n2
其中X , Y 分别为样本均值.
39
2
1 S
2
1
2
2
2
X Y
(3)当
2
1
2
1
1 2
2
2
2
2 2
时,
N (0,1),
X Yn1 n1 2 2 ~ t n n 2.
1
2
1 1
X Y 1 2
2
2
2
S
3 当 1 w n2 n
时,
~ t n1
1
2
1 1
Sw
其中S
2
w
n1 1 S
n1
n2
n2 1 S
2
, Sw Sw
n1 n2 2
2
1
2
2
40
例:设总体X 的均值,方差 2 存在,
X1,
, X n 是取自总体X 的样本,
X , S 为样本均值和样本方差;
2
求(1)E ( X ), D( X ), E ( S );
2
(2) X 1与X 的相关系数;
(3)若X N , 2 ,求D( S 2).
41
n
n
解:( 1) E ( X ) E ( 1 X i ) 1 E ( X i ) ,
n i 1
n i 1
1
1
D( X ) D( X i ) 2 D( X i ) ,
n i 1
n
n i 1
n
n
n
2
n
2
2
2
1
1
E (S ) E (
( X i X ) ) E(
( X i nX ))
n 1 i 1
n 1 i 1
2
n
1 ( E ( X i2 ) nE ( X 2 ))
n 1 i 1
2
2
2
1
( ( ) n( 2 )) 2
n 1 i 1
n
n
42
n
( 2) Cov( X 1 , X ) Cov( X 1 , 1 X i )
n i 1
1
D( X1 )
,
n
n
2
X X
1
2
n
Cov( X1 , X )
D( X1 ) D( X )
2
1 ,
2
n
n
43
(3) X N , 2 ,
(n 1) S 2
2
~ 2 (n 1),
(n 1)S
D
2(n 1)
2
2
D(S ) 2 .
n 1
2
4
44
例:设总体X N , ,
X1,
2
与 Y1 ,
, X4
, Y9 是取自总体X 的两个独立样本,
X , S12和Y , S 22分别为样本均值和样本方差;
求( 1) 若a X Y ~ t (k ), 则a, k 各为多少?
S1
4
(2) ( X i ) 2 4 S22 服从什么分布?
i 1
45
(1)
X ~ N ( ,
2
4
), Y ~ N ( ,
2
9
), 且X 与 Y 相互独立,
13
(
6 X Y)
X Y ~ N (0,
),
~ N (0,1)
36
13
3S12
2
2
又 2 ~ (3), 且X Y 与S1 相互独立,
2
6 X Y
由t分布定义,
13
3S12 6 13 X Y
~ t (3)
2
3
13
S1
6 13
a
, k 3.
13
46
(2) 12
4
2
2
(
X
)
~
(4),
i
i 1
8S22
2
~ 2 (8),
4
且 ( X i )2与S22独立,
i 1
由F 分布定义知,
1
4 2
4
2
(
X
)
i
i 1
4
8S22
2
2
(
X
)
4
S
i
2 ~ F (4,8).
2
8
i 1
47