Transcript [ppt]

数理统计
1
数理统计
数理统计是应用概率论基本理论,根据试
验或观察所得到的数据来研究随机现象,
对研究对象的客观规律性作出种种合理的
估计和判断。
试验设计:研究如何有效地收集随机数据
统计推断:研究如何有效分析已获得的随机
数据
2
第六章 样本及抽样分布
§1 基本概念
§2 抽样分布
3
第六章 样本及抽样分布
§1
基本概念
§1. 基本概念
总体:研究对象的某项数量指标的值的全体。
个体:总体中的每个元素为个体。
例如:某厂生产的灯泡寿命是总体,每一个灯泡
的寿命是个体;某学校全体男生的身高是总体,
每个男生的身高是个体。
研究对象的数量指标𝑿的取值在客观上有一定的
分布,因此,可将其看做随机变量,它的分布称
为总体分布。
4
第六章 样本及抽样分布
§1
基本概念
§1. 基本概念
样本:从总体中随机抽取的一些个体
抽样:抽得样本的过程
样本容量:样本中个体的数量
样本值:对样本观察得到的数值
样本的二重性:
 就一次具体观察而言,样本值是确定的数
 在不同的抽样下,样本值会发生变化,因此
可看做是随机变量
5
第六章 样本及抽样分布
§1
基本概念
定义:设随机变量X的分布函数是F(x),若 X 1 ,
, Xn
是具有同一分布函数F的相互独立的随机变量,
则称X 1 , , X n为从总体X中得到的容量为n的简
单随机样本,简称为样本,其观察值 x1 , , x n称
为样本值。
样本的两个特性(对抽样的要求):
 代表性:样本的每个分量𝑿𝒊 与总体𝑿具有相
同的分布
 独立性:𝑿𝟏 , 𝑿𝟐 , … , 𝑿𝒏 相互独立。
6
第六章 样本及抽样分布
§1
基本概念
由定义知:若X 1 , , X n为X的一个样本, 则 X 1 ,
的联合分布函数为:
, Xn
n
*
F ( x1 ,
, xn )   F ( xi )
i 1
设X的密度为p(x),则 X 1 ,
密度为:
, X n 的联合概率
n
*
p ( x1 ,
, xn )   p( xi )
i 1
7
第六章 样本及抽样分布
1. 定义:设 X 1 ,
基本概念
, X n为来自总体X的一个样本,
, X n ) 是 X1 ,
g( X 1 ,
§1
, X n 的函数,若g是连续
函数,且g中不含任何未知参数;
则称g ( X1 ,
设 x1 ,
, X n )是一个统计量。
, xn是( X 1 ,
则称g( x1 ,
, X n )的样本值。
, xn )是g( X 1 ,
, X n )的观察值。
注:统计量是随机变量。
8
第六章 样本及抽样分布
例.
设X 1 ,
§1
基本概念
, X n为来自总体 X ~ N (  ,  2 ) 的一个样本,
问下列随机变量中那些是统计量
其中未知 ,  2已知,
X1  X n
min( X 1 , X 2 , , X n );
;
2
2
X1   X n
( X1  X n )
 ;
;
2
n

( X 1   X n )  n
.
n
9
第六章 样本及抽样分布
§1
基本概念
2. 常用的统计量
样本均值
1 n
X   Xi
n i 1
n
样本方差
n
1
1
2
2
2
S   ( Xi  X )   Xi  X
n i 1
n i 1
2
n
n
另一定义 S
2
n 1
1
2

( Xi  X )

n  1 i 1
二者关系 nS  ( n  1) S
2
n
2
n 1
,
Sn
n1

S n 1
n
10
第六章 样本及抽样分布
样本标准差
Sn  S 
2
n
§1
基本概念
1 n
2
( Xi  X )

n i 1
1 n
k
样本k阶(原点)矩:Ak   X i
n i 1
k  1, 2,
1 n
k
样本k阶中心矩:Bk   ( X i  X )
n i 1
k  1, 2,
它们的观察值分别为:
n
n
1 n
1
1
x   xi , sn2   ( xi  x ) 2   xi 2  x 2
n i 1
n i 1
n i 1
11
第六章 样本及抽样分布
§1
基本概念
1 n
2
s
(
x

x
)

n i 1 i
1 n k
ak   xi , k  1, 2,
n i 1
n
1
k
bk   ( xi  x ) , k  1, 2,
n i 1
分别称为样本均值、样本方差、样本标准差、样
本k阶矩、样本k阶中心矩。
统计量是样本的函数,它是一个随机变量,统计
量的分布称为抽样分布。
12
第六章 样本及抽样分布
§1
基本概念
结论1:设 X 1 , , X n 为来自总体 X 的一个样本,
EX   , DX   2 , X为样本均值,
则
E X   , DX 
2
n
.
13
第六章 样本及抽样分布
§2
抽样分布
§2 抽样分布
一. 正态总体样本的线性函数的分布
设 X1, X2, ... , Xn是来自正态总体X~N(μ,σ2)
的样本,则统计量 U=a1X1+a2X2+...+anXn
也服从正态分布:
n
n
i 1
i 1
U ~ N (   ai ,  2  ai2 ).
14
第六章 样本及抽样分布
1 n
于是,U   X i  X .
n i 1
n
  ai   , 
i 1
 X ~ N (,
/ n
基本概念
1
ai  , ( i  1, 2, L , n),
n
特别,若取
X 
§1
n
2

a
i 1
2
i


2
n
2
n
),
标准化即得:
~ N (0, 1).
15
标准正态分布的上 分位点u
设 X ~ N (0,1) , 0 <  < 1, 称满足
P ( X  u )  
的点 u 为X 的上 分位点
0.4
注意:Φ(uα)=1-α
0.3
常用数据
0.2

0.1
-3
-2
-1
1
z
u
2
3
u0.025  1.96
u0.05  1.645
u0.1  1.28
16
第六章 样本及抽样分布
§2
抽样分布
二.  分布
2
定义: 设 X 1 , X 2 , , X n相互独立, 都服从正态
分布N (0,1) , 则称随机变量:
  X1  X 2 
2
2
2
 Xn
2
所服从的分布为自由度为 n 的  分布.
2
记为
 ~  ( n).
2
2
17
 ( n)分布的概率密度为
2
x n

1
 1
2
2
e x ,

n
 2 n
p( x )   2  ( )
2


0

x0
x  0.
 2 ( n)分布的概率密度曲线如图.
18
第六章 样本及抽样分布
§2
抽样分布
 分布的性质
2
1.设 X 1 ~  2 ( n1 ), X 2 ~  2 ( n2 ), 且 X1, X2相互独立,
则X 1  X 2 ~  ( n1  n2 ).
2
(  分布的可加性)
2
19
例:设X1 ,
, X 4是来自N(0, 4)的样本,Y =a( X1 - 2X 2 ) 
2
b(3 X 3  4 X 4 )2 .问a, b取何值时,X服从 2分布,自由度?
解:𝑋1 − 2𝑋2 ~𝑁 0,20 , 3𝑋3 − 4𝑋4 ~𝑁(0,100)
𝑋1 − 2𝑋2
3𝑋3 − 4𝑋4
~𝑁 0,1 ,
~𝑁(0,1)
10
20
X1 ,
, X 4独立  X1 - 2X 2与3 X 3  4 X 4独立
𝑋1 − 2𝑋2
20
2
3𝑋3 − 4𝑋4
+
10
2
~𝜒 2 (2)
1
1
a 
,b
,自由度为2.
20
100
20
第六章 样本及抽样分布
§2
抽样分布
2

2. 若X~ (n) , 则E(X)=n, D(X)=2n.
由X i ~ N (0,1),  E ( X i )  D( X i )  1
2
D( X )  E ( X )  [ E ( X )]  3  1  2
2
i
4
i
2
i
2
 ( k  1)!! k  偶
Z ~ N (0,1), E (Z )  
k 奇
 0
k
n
E (  )   E ( X i )  n,
2
2
i 1
n
D (  )   D ( X i )  2 n.
2
2
i 1
21
第六章 样本及抽样分布
§2
抽样分布
3.  分布的分位点
2
对于给定的α, 0<α<1, 称满足条件
P {    }  
2
 ( n)
的点  为  ( n) 的上  分位点,记为:
2
2
对于不同的 , n,
可以通过查表求
得上 分位点的值.
22
第六章 样本及抽样分布
§2
抽样分布
例 设 Z ~  2 ( n),  2 ( n) 的上  分位点满足
P { Z   ( n)}   ,
2
求 ( n)的值, 可通过查表完成.
2
 02.025 (8)  17.535,
 02.975 (10)  3.247,
 02.1 ( 25)  34.382.
2
 0.02
(8)  18.16
1
n  45时, (n)  (u   2n  1) 2
2
2
23
第六章 样本及抽样分布
§2
抽样分布
三. t 分布
设 X ~ N (0, 1), Y ~  ( n), 且 X , Y 独立,
X
则称随机变量 T 
服从自由度为 n 的 t
Y /n
分布, 记为 T ~ t (n ).
2
t (n) 分布的概率密度函数为
 n1
n1



2
2


t
2
 1
p( t )  
,    t  


n
 n
nπ   
 2
24
第六章 样本及抽样分布
§2
抽样分布
t分布的性质:
t分布的密度函数关于t=0对称,当n充分大
时,密度函数p(t)近似于N(0,1)的密度φ(t).
即:lim p( t ) 
1
2
t 分布的概率密度曲线如图
e
t2 2
.
n 
25
第六章 样本及抽样分布
§2
抽样分布
t分布的分位点
对于给定的α, 0<α<1, 称满足条件
P{T  t ( n)}  
的点 t ( n) 为 t (n) 分布的上  分位 点.
26
第六章 样本及抽样分布
§2
抽样分布
t分布的上 分位点的性质:
t1 (n)  t (n)
t分布的上分位点t ( n)可查表
求得,例t0.025 (15)  2.1315.
当n  45时,对于常用的 的值,可用正态近似
t ( n)  u
27
第六章 样本及抽样分布
§2
抽样分布
四. F分布
定义 设 U ~  2 ( n1 ), V ~  2 ( n2 ), 且U , V 独立, 则称
U / n1
随机变量 F 
服从自由度为 ( n1 , n2 ) 的 F 分
V / n2
布, 记为 F ~ F ( n1 , n2 ).
28
第六章 样本及抽样分布
§2
抽样分布
F ( n1 , n2 )分布的概率密度为
n1

n1
2
1


n

n
n


  1
2
1
2
 2  n  x


 2 
, x  0,

n1  n2
p( x )  
2




n
n
n
x




   1    2  1   1  
  2   2    n2  

0
其他 .

F分布的概率密度
29
第六章 样本及抽样分布
§2
抽样分布
F分布的分位点
对于给定的,
0    1, 称满足条件
p F  F ( n1 , n2 )  
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上分位点.如图所示.

F ( n1 , n2 )
F分布的分位点
可以查表求得。
如, F0.05 (4, 5)  5.19
30
第六章 样本及抽样分布
§2
抽样分布
F分布的性质
1
~ F (n2 , n1 ).
1. 若F ~ F ( n1 , n2 ), 则
F
1
2. F1  ( n1 , n2 ) 
F ( n2 , n1 )
31
第六章 样本及抽样分布
证明2:若F ~ F (n1 , n2 )
§2
抽样分布
1
1
1    P{F  F1 (n1 , n2 )}  P{ 
}
F F1 (n1 , n2 )
1
1
 1  P{ 
}
F F1 (n1 , n2 )
1
1
所以 P{ 
}
F F1 (n1 , n2 )
1
又因为 1 / F ~ F (n2 , n1 ), 所以 F (n2 , n1 ) 
F1 (n1 , n2 )
1
即 F1 (n1 , n2 ) 
F (n2 , n1 )
1
1
例: F0.95 (12,9) 

 0.357
F0.05 (9,12 ) 2.80
32
例: 设 X ~ t ( n), 求𝒀 = 𝑿𝟐 的分布?
𝑋 2 ~𝐹(1, 𝑛)
33
第六章 样本及抽样分布
§2
抽样分布
正态总体的抽样分布
定理1 (样本均值的分布)
设 X1, X2, ... , Xn是来自正态总体X~N(μ,σ2)
1 n
的样本, X   X i
n i 1
X 
/ n
则:
~ N (0, 1).
34
第六章 样本及抽样分布
§2
抽样分布
定理2 (样本方差的分布)
设X1,X2,…,Xn是来自正态总体
N (  ,  ) 的样本,
2
X 和 S n2分别为样本均值和样本方差, 则有
(1)
(2)
2
n
2
nS

2


(
n

1)
S
2
n

1
~  ( n  1)  或:
~  ( n  1) 
2



2
X 与 S n2 独立.
 X i  
思考:  




n
i 1
2
分布?
35
正交变换矩阵
A=
1


n

 (n  1)
 n(n  1)


0





0



0


1
n
1
n(n  1)
1
n
1
n(n  1)
1
n
1
n(n  1)
(n  2)
(n  1)(n  2)
1
(n  1)(n  2)
1
(n  1)(n  2)
0
0
0
0
1
6
1
2







1

(n  1)(n  2) 


1


6

1


2

1
n
1
n(n  1)
36
第六章 样本及抽样分布
§2
定理3 设X1,X2,…,Xn是来自正态总体
X 和S
2
为样本均值和样本方差,
n
X 
Sn / n  1
抽样分布
N (  ,  ) 的样本,
2
则有
~ t ( n  1).
X 
~ N (0,1),
证明 因为
/ n
nSn2
2
~  2 ( n  1),
且两者独立, 由 t 分布的定义知
X 
/ n
X 
nSn2 /  2

n1
Sn / n  1
~ t ( n  1).
37
第六章 样本及抽样分布
§2
抽样分布
定理 4 (两总体样本均值差、样本方差比的分布)
设 X ~ N ( 1 ,  12 ),Y ~ N (  2 ,  22 ),且X与Y独立,
X1,X2,…, X n是来自X的样本, Y1,Y2,…, Yn 是来自Y的样本,
1
2
2
2
分别是
分别是这两个样本的
样本均值,
S
和
S
X和Y
1
2
是X, Y的修正样本方差:
n1
1
2
S 
(
X

X
)
 i
n1  1 i 1
2
1
n2
1
2
S 
(
Y

Y
)
 i
n2  1 i 1
2
2
38
第六章 样本及抽样分布
§2
抽样分布
S12 / S22
则有 (1) 2 2 ~ F ( n1  1, n2  1);
1 / 2
(2) 当 12   22   2 时,
( X  Y )  ( 1   2 )
~ t ( n1  n2  2),
1 1
Sw

n1 n2
2
2
(
n

1
)
S

(
n

1
)
S
1
2
2
其中 S w2  1
,
n1  n2  2
Sw 
S w2 .
39
第六章 样本及抽样分布
§2
抽样分布
证明 (1) 由定理2
( n1  1) S12

2
1
~  ( n1  1),
2
由假设 S12 , S22 独立,
( n1  1)S / 
n1  1
2
1
2
1
2
1
2
1
( n2  1) S22

2
2
~  ( n2  1),
2
则由 F 分布的定义知
( n2  1)S / 
~ F ( n1  1, n2  1),
n2  1
2
2
2
2
2
2
2
2
S /S
即
~ F ( n1  1, n2  1).
 /
40
第六章 样本及抽样分布
(2)
§2
抽样分布

2 2

因为 X  Y ~ N  1   2 ,

n1 n2 

( X  Y )  ( 1   2 )
所以 U 
~ N (0,1),
1 1


n1 n2
由
( n1  1) S12

2
~  2 ( n1  1),
( n2  1) S22
2
~  2 ( n2  1),
且它们相互独立, 故由  2 分布的可加性知
41
第六章 样本及抽样分布
V
( n1  1) S12
2

( n2  1) S 22
2
§2
抽样分布
~  2 ( n1  n2  2),
由于 U 与 V 相互独立 , 按 t 分布的定义 .
U
V /( n1  n2  2)
( X  Y )  ( 1   2 )

~ t ( n1  n2  2).
1 1
Sw

n1 n2
42
第六章 样本及抽样分布
§2
抽样分布
例 若总体X ~ N (0,1),从此总体中取一个容量为
6的样本X 1 , X 2 ,X 6 , 设
Y  ( X 1  X 2  X 3 )2  ( X 4  X 5  X 6 )2
试决定常数C,使随机变量CY服从 2分布.
解. 因为 X 1  X 2  X 3 ~ N (0,3)
X1  X 2  X 3
所以
~ N (0,1)
3
2
 X1  X 2  X 3 
2
从而 
 ~  (1)
3


43
第六章 样本及抽样分布
§2
抽样分布
 X4  X5  X6 
2
同理可知 
 ~  (1)
3


2
由 2分布的性质可知
1
 X1  X 2  X 3   X1  X 2  X 3 
2
Y 

~

( 2)
 

3
3
3

 

2
2
1
故C .
3
44
第六章 样本及抽样分布
§2
抽样分布
设总体X服从正态分布N (12,  2 ), 抽取容量为
例
25的样本, 求样本均值X大于12.5的概率.如果(1)已
2
知  2;(2)未知,但已知样本方差Sn-1
 5.57.
解:(1) X  12 ~N (0,1),
2
25
 X  12 12.5  12 
P  X  12.5  P 

  1   (1.25)  0.1063
2 25 
 2 25
( 2) T 
X  12
Sn-1
~t ( 24)
25
 X  12
12.5 
P  X  12.5  P 

  P T  1.059
 Sn-1 25 Sn1 25 
t0.15 ( 24)  1.059, P T  1.059  0.15.
故有P  X  12.5  0.15.
45
第六章 样本及抽样分布
§2
抽样分布
例. 从正态总体N ( ,0.52 )中抽取样本X 1 ,, X 10 .
10
2

(1)已知  0,求概率p   X i  4;
 i 1

10
2

μ
(2)未知,求概率p   ( X i  X )  2.85.
 i 1

Xi
解 (1) 由  0, ~ N (0,1),
0.5
2
 Xi 
2
 Y  
~

(10)

i 1  0.5 
10
2
 10 2

 1
P   X i  4  P  2
 i 1

 0.5
4 
2
X


P
(
Y
 16)

i
2
0.5 
i 1
10
2
46
第六章 样本及抽样分布
查表求
2
0.10
§2
抽样分布
10
2

(10)  16.由此可得 p   X i  4  0.10.
 i 1

(2) 由题设及定理2,
2
10
10
S
1
2
2
2
n
Z 

( X i  X ) ~  (9)
2
2 
0.5
0.5 i 1
10
 10


1
2.85 
2
2
P   ( X i  X )  2.85   P  2  ( X i  X ) 
2 
0.5 
 i 1

 0.5 i 1
 P ( Z  11.4)
2
查表得
2
0.25
(9)  11.4,由此可求得
10
2

p  ( X i  X )  2.85  0.25.
 i 1

47
2

~
N
(0,

), (X1 , X 2 )
例:设总体
(X1  X 2 ) 2
(X1  X 2 ) 2
是它的样本,求
的分布。
48