Transcript 下载6

第六章 数理统计的基本概念
关键词:
总

体,个 体,样 本, 统 计 量
  分布 t  分 布 F  分布
2
1

数理统计学 是一门以数据为基础的科学, 可以定义为
收集数据, 分析数据和由数据得出结论的一组概念、
原则和方法。

例如:若规定灯泡寿命低于1000小时者为次品,如何确定
次品率?由于灯泡寿命试验是破坏性试验,不可能把整批
灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,
以样本的信息来推断总体的信息,这是数理统计学研究的
问题之一。
2
§6.1随机样本与统计量

总体:研究对象的全体;

个体:总体中的成员;

总体的容量:总体中包含的个体数;

有限总体:容量有限的总体;

无限总体:容量无限的总体,通常将容量非
常大的总体也按无限总体处理。
3

例:现要研究某一个公司员工工资水平
及其影响工资水平的因素. 这个公司的
每个员工就是"个体", 而所有的员工构
成一个"总体". 由于公司的员工总数是
有限的, 因此, 是一个有限总体. 每个员
工都附着有年龄, 性别, 工种, 工资, 受
教育程度等指标(变量).
4
 总体的某个指标X,
对于不同的个
体来说有不同的取值, 这些取值可
以构成一个分布, 因此X可以看成
一个随机变量. 有时候就把X称为
总体. 假设X的分布函数为F(x), 也
称F(x)为总体.
5
 数理统计主要任务是从总体中抽取
一部分个体, 根据这部分个体的数
据对总体分布给出推断. 被抽取的
部分个体叫做总体的一个 样本.
6
随机样本:从总体中随机地取n个个体, 称为
一个随机样本。
简单随机样本:满足以下两个条件的随机样
本(X1,X2,…,Xn)称为容量是n的简单随机样本
。
1. 每个Xi与X同分布;
2. X1,X2,…,Xn是相互独立的随机变量。
7
[说明]:后面提到的样本均指简单随机样本。
由概率论知,若总体X具有概率密度f(x),则
样本(X1,X2,…,Xn)具有联合密度函数:
f n  x1 , x2 ,
n
xn    f  xi 
i 1
8
[注意]:一个容量为n的样本
X1 , X 2 ,
Xn
是指n个独立与总体分布相同的随机变量。
一旦对样本进行观察,得到实际数值
x1 , x2 ,
xn
称为样本观察值(或样本值)。
两次观察,样本值可能是不同的。
9

如何取得的样本才称是简单随机样本?
对于有限总体, 采用放回抽样就能得到简单随
机样本.
但当总体容量很大的时候,放回抽样有时候很
不方便, 因此在实际中当总体容量比较大时,通常
将不放回抽样所得到的样本近似当作简单随机样
本来处理.
对于无限总体, 一般采取不放回抽样.
10
统计量:样本的不含任何未知参数的函数。
常用统计量:设(X1,X2,…,Xn)为取自总体X
的样本。常用的统计量如下:
n
1. 样本均值 X  1  X i
n i 1
n
2. 样本方差 S 2  1  ( X i  X ) 2 , S 为样本标准差
n  1 i 1
n
3. 样本矩
k阶矩:Ak  1  X ik
n i 1
 k  1, 2, 
n
k
1
k阶中心矩:Bk   ( X i  X )
n i 1
 k  1, 2, 
11
[思考题]:
对于总体X , X 1 ,
, X n是来自总体的样本,
设下列数字特征存在,
E ( X )   , D( X )   ,E ( X ),E[( X   ) ],
2
k
k
问:(1)X 与,(2)S 与 ,
2
2
(3)Ak 与E ( X ),(4)Bk 与E[( X   ) ]
k
k
是一回事吗?
答:不是。前者是随机变量,观察两次得到的统计
值可能不一样;后者是数,可能已知也可能未知。
12
当总体数字特征未知时

一般, 用样本均值 X 作为总体均值   E ( X ) 的估计;

用样本方差 S 2 作为总体方差  2  E( X   )2 的估计;

用样本的原点矩 Ak 作为总体原点矩 k  E( X k ) 的估计;

用样本的中心矩 Bk 作为总体中心矩  k  E( X   )k 的估
计.
(假设总体各阶矩存在)
13

2
总体方差的估计可以用 S 也可以 B2 ,
2
主要的区别是 S 作为
总体方差估计是无偏估计, 但 B2 作为总体方差的估计是有偏的
(关于估计的无偏性将在下一节讨论).
14
§6.2  2  分 布 t  分 布 F  分 布
 统计量的分布称为抽样分布.
 在数理统计中,
最重要的三个分布
分别为:
  分布 t  分 布 F  分布
2
15
 分布
2
定义:设随机变量X 1 , X 2 ,
X i  N  0,1  i  1, 2,
n
则称    X
2
n
i 1
2
i
X n 相互独立,
, n
1
服从自由度为n 的 2分布,记为 2   2  n 
自由度指 1 式右端包含的独立变量的个数.
16
 分布
2

2
 n  分布的概率密度为:

 y
1



2
f n  y    2  n 2   

 0
其中    

0
x
n 1
2
e
 2y
y0
y0
 1  x
e dx
17
f ( x)
n 1
n4
0
n  10
 分布的概率密度函数
2
x
18
 2分 布 的 一 些 重 要 性 质 :
1. 设     n  , 则 有 E     n , D     2 n
2
2
2
2
2. 设 Y1   2  n1  , Y2   2  n 2  , 且 Y1 , Y2 相 互 独 立 , 则 有 Y1  Y2   2  n1  n 2 
性质2称为 2分布的可加性,可推广到有限个的情形:
Yi ~  2 ni , i  1,2,m ,并假设 Y1 , Y2 ,Ym 相互独立,
m


2
则  Yi ~    ni 
i 1
 i 1 
m
19
对给定的概率 , 0    1, 称满足条件

2  n 
f n  y  dy  的点2  n  为
 2  n  分布的上 分位数, 上 分位数2  n 的值可查 2分布表
20
例:求 

2
0.1
25
通过Excel给出.
(1)具体如下: 在Excel表单的任一单元格输入“=” ;
(2)在主菜单中点击“插入”,点击“函数(F)” ;
(3)在选择类别的下拉式菜单中选择“统计” 选择
“CHIINV” 点击“确定”在函数参数表单中输入
Probability=0.9.
(注意:Probability输入的应该是1-0.1=0.9)
(4) Deg\_freedom=25, 点击''确定" 即在单元格中出
现 ''34.382".
21
例:设总体X  N   ,  2  ,  ,  2 已知。
 X1, X 2 ,
, X n  是取自总体X 的样本
求(1)统计量  2  12
n
2
(
X


)
的分布;
 i
 i 1
(2)设n  5,若a(X 1  X 2 ) 2  b(2 X 3  X 4  X 5 ) 2 ~  2 (k ),
则a, b, k 各为多少?
22
Xi  
解:( 1) 作变换 Yi 
i  1,2, , n

显然Y1, Y2 , , Yn相互独立,且Yi  N 0,1 i  1,2, , n
n
于是    (
2
i 1
Xi  

n
)   Yi  
2
2
i 1
2
 n
23
(2)
X1  X 2 ~ N (0, 2 ),
2
2 X 3  X 4  X 5 ~ N (0, 6 ),
2
X1  X 2
~ N (0, 1)
2
2X3  X4  X5
6
X1  X 2 2 X 3  X 4  X 5
与
相互独立,
2
6
( X 1  X 2 )2 (2 X 3  X 4  X 5 ) 2
2
故

~

(2)
2
2
2
6
~ N (0, 1)
a
1
,
2
1
b
,
2
6
k  2.
2
24
t  分布
设 X ~ N (0,1) ,Y ~
则称随机变量 T 
 2 n ,并且假设 X , Y 相互独立,
X
Y /n
服从自由度为 n 的 t 分布。
记为 T ~ t (n)
t  n  分布的概率密度为:f  t , n  
率密度为:f  t , n  

n
 1  t 


n 
n

 2
n 1
2
2
 n21
  n21 
n   n2 
,   t  
25
t  n  分布概率密度函数
26
t  分布
对给定的 , 0    1, 称满足条件

t  n 
f  t , n  dt  的点t  n 
为t  n  分布的上 分位数。t分布的上 分位数可查t分布表
t1 (n)  t (n)
27
例:求 t0.05 25

通过Excel给出.
(1)具体如下: 在Excel表单的任一单元格输入 “=” ;
(2)在主菜单中点击“插入”,点击“函数(F)” ;
(3)在选择类别的下拉式菜单中选择“统计” 选择
“TINV” 点击“确定“在函数参数表单中输入
Probability=0.95.
(4) Deg\_freedom=25, 点击“确定” 即在单元格中
出现 “1.708”.
28
F分布
定义:
 且Xn,2Y独立,则
, 且X , Y 独立,
设设X
X   
n1  ,Yn1 , Y n
2 ,
2
2
2
2
X / n1
X / n1  n1 , n2 的F 分布,
称随机变量F 
服从自由度
则称随机变量

服 从自由度 n1 ,
Y / nF
2
记为F ~ F  n1 , n2 

Y / n2
其中
n1称为第一自由度,
n2 称为第二自
其中
n1称为第一自由度,
n2 称为第二自由度
性质:F ~ F (n1, n2 ), 则F 1~ F (n2 , n1 )
29
.5: F  n1 , n2  分布的概率密度为:
n1  n2
n
n
n
1
2
1 1


1
2
2
2
n
n
x
 n2  n1 x  2
1
2
 B n1 , n2
f  x; n1 , n2     2 2 

0

1
  a   b
b 1
 1
其中B  a, b    x 1  x  dx 
0
  a  b
x0
x0
30
F  5,10 分布概率密度函数
31
对于给定的 , 0    1, 称满足条件


F  n1 , n2 
f  x; n1 , n2  dx  
的点F  n1 , n2  为F  n1 , n2  分布的上 分位数。
F  n1 , n2 的值可查F 分布表
F1 (n1, n2 )  [ F (n2 , n1 )]1
32
例:求 F0.1 9,10

通过Excel给出.
(1)具体如下: 在Excel表单的任一单元格输入“=” ;
(2)在主菜单中点击“插入”,点击“函数(F)” ;
(3)在选择类别的下拉式菜单中选择“统计” 选择
“FINV” 点击“确定”在函数参数表单中输入
Probability=0.9.
(4) Deg\_freedom1=9, Deg\_freedom2=10点击
“确定” 即在单元格中出现 “2.347”.
33
§6.3正态总体下的抽样分布
定理 6.3.1 设 X1 , X 2 ,
N ( , )
2
, X n 为来自正态总体
的简单随机样本, X 是样本均值,
2
S 是样本方差, 则有:
 
X ~ N   ,
n

2

 .

34
定理 6.3.2 设 X1 , X 2 ,
, X n 为来自正态总体
N (,  ) 的 简 单 随 机 样 本 , X 是 样 本 均 值 ,
2
S 2 是样本方差, 则有:
(1)
(n  1) S 2

2
~  2 (n  1) ,
2
(2) X 与 S 相互独立.
35
[思考题]:
设X 1 , X 2 ,
, X n是来自正态总体N (  ,  2 )
的简单随机样本,X 和S 2分别是样本均值
和样本方差。问:
n
(X
(1)i 1
i

 X)
2
2
服从什么分布?
n
2
(
X


)

i
(2)i 1
服从什么分布?
2

答:(1) (n 1),(2) (n).
2
2
36
定理 6.3.3 设 X1 , X 2 ,
, X n 为来自正态总体
N (, ) 的简单随机样本, X 是样本均值, S 2
2
是样本方差, 则有:
X 
~ t (n  1)
S n
37
定理6.3.4

 
 
, X n1 定和
, Yn2 分别来自总体

1, :
理Y
6.8
设样本
X , , X 和N Y
6.8:设样本 X 1 ,
1
n1
 
1
并且它们相互独立,其样本方差分别为
S ,S ,
总体
N  1 ,  1  和N   2 ,  2  并且它们相互独立,其样
2
, Yn2 分别来自总体
N  1 ,  1  和
N
2 , 2
2 2

n1 和 Y1 ,
2
2
 2 S1
2

S
2
1
n

1
, S 2则
, :1 F  2 2 F  n21  1,

则
:
1
F

F  n1
2 2
2
2
 1 S2
立,其样本方差分别为
S1 , S 2 ,
 1 S2
X  Y    1   2 

X

Y







1
F  n12S1,2n2 12  S 2  2 N2(0,1),
2
2
1
1  2 1 2
1


(1)

~ F (n1  1, n12  1).
2
2
2
2 1 2 2
S


n
n
n1 n2
2
2
2
2
  1   2 S
1
2

N (0,1),
2
 X 3Y 当 21  22  2时
2
2
2
2
 
2

2
2
1
2
2
38
(2)
 X Y   
1

2
1
n1


 2 
2
2
~ N (0,1)
n2
其中X , Y 分别为样本均值.
39
2
1 S
2
1
2
2
2
X Y      

(3)当     
2
1
2
1
1 2
2
2
2
2 2
时,
N (0,1),
 

X  Yn1 n1 2 2  ~ t n  n  2.
1
2
1 1
X  Y    1   2 

2
2
2
S
3 当 1 w n2  n
 时,
~ t  n1 
1
2
1 1
Sw
其中S
2
w
n1  1 S


n1

n2
  n2  1 S
2
, Sw  Sw
n1  n2  2
2
1
2
2
40
例:设总体X 的均值,方差 2 存在,
 X1,
, X n  是取自总体X 的样本,
X , S 为样本均值和样本方差;
2
求(1)E ( X ), D( X ), E ( S );
2
(2) X 1与X 的相关系数;
(3)若X  N   ,  2 ,求D( S 2).
41
n
n
解:( 1) E ( X )  E ( 1  X i )  1  E ( X i )  ,
n i 1
n i 1

1
1
D( X )  D(  X i )  2  D( X i )  ,
n i 1
n
n i 1
n
n
n
2
n
2
2
2
1
1
E (S )  E (
( X i  X ) )  E(
( X i  nX ))

n  1 i 1
n  1 i 1
2
n
 1 ( E ( X i2 )  nE ( X 2 ))
n  1 i 1
2
2
2

1

( (   )  n(   2 ))   2
n  1 i 1
n
n
42
n
( 2) Cov( X 1 , X )  Cov( X 1 , 1  X i )
n i 1

1
 D( X1 ) 
,
n
n
2
X X 
1
2


n
Cov( X1 , X )
D( X1 ) D( X )
2

 
 1 ,
2
n
n
43
(3) X  N   ,  2  ,
(n  1) S 2
2
~ 2 (n  1),
 (n  1)S 
 D
 2(n  1)

2
 

2
 D(S )  2 .
n 1
2
4
44
例:设总体X  N   ,  ,
 X1,
2
与 Y1 ,
, X4 
, Y9  是取自总体X 的两个独立样本,
X , S12和Y , S 22分别为样本均值和样本方差;
求( 1) 若a X  Y ~ t (k ), 则a, k 各为多少?
S1
4
(2)  ( X i   ) 2 4 S22 服从什么分布?
i 1
45
(1)
X ~ N ( ,
2
4
), Y ~ N (  ,
2
9
), 且X 与 Y 相互独立,
13
(
6 X  Y)
 X  Y ~ N (0,
),
~ N (0,1)
36
13
3S12
2
2
又 2 ~ (3), 且X  Y 与S1 相互独立,

2
6 X Y
由t分布定义,
13 
3S12 6 13 X  Y

~ t (3)
2
3
13
S1
6 13
a
, k  3.
13
46
(2) 12

4
2
2
(
X


)
~

(4),
 i
i 1
8S22
2
~  2 (8),
4
且 ( X i   )2与S22独立,
i 1
由F 分布定义知,
1
4 2
4
2
(
X


)
 i
i 1
4
8S22
2
2

(
X


)
4
S

i
2 ~ F (4,8).
2
8
i 1
47