6.2 正态样本统计量的抽样分布

Download Report

Transcript 6.2 正态样本统计量的抽样分布

概率论与数理统计
课件制作:应用数学系
概率统计课程组
6.2
正态样本统计量的抽样分布
6.2.1
正态分布
6.2.2
 (n) (卡方)分布
6.2.3
t分布(学生分布)
6.2.4
F分布
6.2.5
正态总体抽样分布的某些结论
6.2.6
Excel实现
2
确定统计量的分布—— 抽样分布, 是数理统计
的基本问题之一. 采用求随机向量的函数的分布的方
法可得到抽样分布.由于样本容量一般不止 2 或 3
(甚至还可能是随机的), 故计算往往很复杂, 有时还
需要特殊技巧或特殊工具.
由于正态总体是最常见的总体,
的几个抽样分布均对正态总体而言.
故本节介绍
6.2.1 正态分布(Normal distribution)
若
则
X 1 , X 2 ,, X n
i.i.d.
~
N ( i ,  i2 )
n
 n
2 2
ai X i ~ N   ai  i ,  ai  i 

i 1
i 1
 i 1

n
特别地,
若
则
X 1 , X 2 , , X n
i.i.d.
~
X i ~ N (, )
2

1
 
X   X i ~ N   , 
n i 1
n 

n
2
上(双)侧  分位数的概念
设X 为连续型随机变量,其概率密度函数为f ( x ) ,
为给定常数, 0 <  <1
若
P( X  x )  
x 为X 所服从的分布的上 分位数.
如果 X 的概率密度函数为偶函数,则对于满足
0 <  < 1/2 的  ,
若 P( X  x / 2 )  
则称 x /2 为X 所服从的分布的双侧  分位数
则称
标准正态分布的上 分位数
z
0.4
z0.05  1.645
0.3
0.2

0.1
-2
-1
•2
z
1
z0.025  1.96
常用
数字
z0.005  2.575
0.4
0.3
0.2
/2
/2
0.1
•
-z/2
-2
-1
1
•2
z/2
-z/2 = z1-/2
6.2.2
 (n) 分布(Chi squared r.v.)
2
定义 设 X 1 , X 2 , , X n 相互独立,
且都服从标准正态分布N (0,1),则
n
X
i 1
2
i
~  (n)
2
n = 1 时,其密度函数为


f ( x)  
 0,

1  
x e ,
2
1
2
x
2
1.2
1
x0
x0
0.8
0.6
0.4
0.2
2
4
6
8
10
n=2
时,其密度函数为
 1  2x
e ,

f ( x)   2
 0,

x0
x0
为参数为1/2的指数分布.
0.4
0.3
0.2
0.1
2
4
6
8
10
一般地, 自由度为 n 的  (n) 的密度函数为
2
1

1

 2  (n) e x ,
f ( x)  
2
 0,

x
2
n
2
n
2
其中,
x0
x0
  x 1 t
 ( x)   0 t e dt
在x > 0 时收敛,称为 函数,具有性质
( x  1)  x( x),
(1)  1, (1 / 2)  
(n  1)  n ! (n  N )
 (n) 分布
2
0.4
密度函数图
n=2
0.3
n=3
0.2
n=5
n = 10
0.1
n = 15
5
10
15
20
25
 (n) 分布的性质
2




1 E  (n)  n, D  (n)  2n

2
2
2 若X 1   2 (n1 ), X 2   2 (n2 ), X 1 , X 2 相互独立,
则 X 1+X 2~ 2 (n1+n2 )
3 n   时,
 2 (n)  正态分布

2
4  ( n) 分布的上 分位数有表可查
0.1
0.08
例如
02.05(10)  18.307

0.06

P  (10)  18.307  0.05
2
n = 10

0.04
0.02
5
10
•
20
20.05
(10)
15
证
n
1
2
2

(
n
)

X
设
 i
X i ~ N (0,1) i  1,2,, n
i 1
X 1 , X 2 , , X n 相互独立,
则
E ( X i )  0, D( X i )  1, E ( X )  1
2
i

2
E  (n)   E   X i   n
 i 1
2
1  4  x2
4
E( X i ) 
x e dx  3

2 
D( X i2 )  E ( X i4 )  E 2 ( X i2 )  2
n
2
n

2
2
D (n)   D  X i   2n
 i 1

6.2.3
t 分布 (Student 分布)
定义 设 X ~ N (0,1) , Y ~
T 
X
Y
 (n), X , Y 相互独立,
2
n
则T 所服从的分布称为自由度为 n 的t 分
布其密度函数为
 n  1
n 1

Γ

2
2


t
2
 1  
f (t )  


n
  n 
n Γ  
2
t 
0.4
0.3
0.2
0.1
n= 1
n=20
-3
-2
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t
分布的性质
1°f n(t)是偶函数,
1
n  , f n (t )   (t ) 
e
2
t2

2
2°t分布的上 分位数 t 与双测  分位数 t/2 有表可
查
PT  t   
0.35
 t  t1
0.25
0.3
n = 10
0.2
0.15

0.1
-3
•
-t-2

0.05
-1
1
t•
2
3
PT  1.8125  0.05  t0.05 (10)  1.8125
PT  1.8125  0.05
PT  1.8125  0.95
 t0.95 (10)  1.8125
P (T  t / 2 ) 

2
P T  t / 2   
0.35
0.3
0.25
0.2
0.15
/2
-3
/2
0.1
•
-t-2
/2
0.05
-1
PT  2.2281  0.025
PT  2.2281  0.05
1
t2•/2
3
 t0.025 (10)  2.2281
6.2.4
F 分布
(F distribution with n and m degrees)
定义 设
令
X ~  2 (n), Y ~  2 (m), X , Y 相互独立 ,
X /n
F
Y /m
则F 所服从的分布称为第一自由度为n ,第二自由度为
m 的F 分布,其密度函数为
 nm
nm
n
 Γ


2
n
2
   t n2 1 1  n t  2 , t  0
 
 


f (t , n, m)   Γ  n Γ  m   m 
 m 
    
 2  2 

0,
t0

0.8
m = 10, n = 4
m = 10, n = 10
m = 10, n = 15
0.6
0.4
0.2
1
2
3
4
5
6
0.8
m = 4, n =10
m = 10, n =10
m = 15, n =10
0.6
0.4
0.2
1
2
3
4
5
6
F 分布的性质
1
1 若F ~ F (n, m) , 则 ~ F (m, n)
F

2 F (n, m) 的上 分位数F (n , m) 有表可查:

P( F  F (n, m))  
例如 F0. 05 ( 4 , 5 )  5 . 19
但
F0 . 95 ( 5 , 4 )  ?
0.6
事实上,
0.3
1
F1 (n, m) 
F (m, n)
1
1
故 F0.95 (5,4) 

F0.05 (4,5) 5.19
0.5
0.4

0.2
0.1
1
2
•
3
4
5
F(n,m)
6
例1
证
1
证明 F1 (n, m) 
F (m, n)
1

1

P( F  F1 (n, m))  P 
 F F1 (n, m) 
1

1
  1  
 1  P 
 F F1 (n, m) 
1

1
1
   由于 ~ F (m, n)
故 P 
F
 F F1 (n, m) 
1
因而
 F (m, n)
F1 (n, m)
例2
证明:
[t1  (n)]  F (1, n)
2
2
G
证 设 X ~ T ( n) , X 
, G ~ N (0,1)
2
 ( n)
n
2
 (1)
2
G
令 Y  X2  2
 21 ~ F (1, n)
 ( n)  ( n)
n
n
因而 P( X | t1  (n) |)  P( X  t  (n))  
2
即
t (n)  F (1, n)
2
1 2
2
 P( X 2  t 2 (n))  P(Y  t12 (n))

2

2
6.2.5
正态总体抽样分布的某些结论
(Ⅰ) 一个正态总体
设 X ~ N (  ,  ) E ( X )   , D( X )  
2
总体的样本为(
2
),则
X 

~ N (0,1)
X ~ N ( , )  
n
2
n
(n  1) S 2
2
2
 Xi  X 
2
 
 ~  (n  1)
 
i 1 
n
X 
( n  1) S 2

2
相互独立
X 
 
~ T (n  1)

S

n
n
S
与 X
(1)
(2)
( II ) 两个正态总体
设 X 1 , X 2 , , X n 是来自正态总体 X ~ N (  ,  2 )
1 1
的一个简单随机样本
Y1 , Y2 , , Ym 是来自正态总体 Y ~ N ( 2 ,  22 )
的一个简单随机样本
它们相互独立.
1 m
1 n
令 X   Xi
Y  Yj
m j 1
n i1
n
m
1
1
2
2
2
2
S1 
(
X

X
)
S2 
(Y j  Y )

i

n  1 i1
m  1 j 1
则
(n  1) S
2
~  (n  1)
2
1
2
1
S12
S
2
2
若 1   2 则
 12

(m  1) S
2
~  (m  1)
2
2
2
2
~ F (n  1, m  1)
2
2
2
1
2
2
S
~ F (n  1, m  1)
S
(3)
设
X ~ N ( 1 ,  2 )
X 1 , X 2 , , X n 是来自正态总体
的一个简单随机样本
Y ~ N ( 2 ,  )
Y1 , Y2 , , Ym 是来自正态总体
的一个简单随机样本 ,
则
2
它们相互独立.
1

1

X   X i ~ N ( 1 , ) Y   Y j ~ N (  2 , )
n i 1
n
m j 1
m
n
2
2
m
 
X  Y ~ N ( 1   2 ,  )
n m
( X  Y )  ( 1   2 )
~ N (0,1)
2 2

n
m
2
2
(n  1)S
(m  1) S
2
2
~  (n  1) ,
~  (m  1)
2
2


2
1
2
2
(n  1) S

2
1
2

(m  1) S

2
2
2
~  (n  m  2)
2
2
2
(
n

1
)
S
(
m

1
)
S
1
2 相互独立

X Y 与
2
2


( X  Y )  ( 1   2 )
2
n
(n  1) S12

2

2

m
(m  1) S 22

2
nm2
( X  Y )  ( 1   2 )

1 1 (n  1) S12  (m  1) S 22

n m
nm2
~ t (n  m  2)
(4)
例3 设总体
X ~ N (72,100) ,为使样本均值
大于70 的概率不小于 90% ,则样本容量
42
n  ——
.
解
设样本容量为
n,
则
100
X ~ N (72,
)
n
故
P( X  70)  1  P( X  70)   0.2 n 
令
 0.2 n   0.9 查表得 0.2 n  1.29
即
n  41.6025
所以取
n  42
例4
从正态总体 X ~ N (  ,  2 ) 中,抽取了
n = 20 的样本 X 1 , X 2 , , X 20
20
1
2

2
2
(1) 求 P 0.37    X i  X   1.76 
20 i 1


20
1
2

2
2
 X i     1.76 
(2) 求 P 0.37 

20 i 1


(n  1) S
解 (1)
~  (n  1)
2

2
2
19S
1 20
2



X

X
~

(19)
i
2
2 

 i 1
2
即
2
20
1
2


2
故 P 0.37    X i  X   1.76 2 
20 i1


20
1
2


 P 7.4  2   X i  X   35.2 
 i1


1 20
2
2
 1 20 



 P 2  X i  X   7.4   P 2   X i  X   35.2 
  i1
   i1

查表
 0.99  0.01  0.98
(P.386)
 Xi   
2
(2)  
 ~  (20)
 
i 1 
20
1
2

2
2
故 P 0.37    X i     1.76 
20 i1


20
2
2
20


Xi   

 P 7.4   
  35.2 
 
i 1 


 20  X i    2
  20  X i    2

 P  
  7.4   P  
  35.2 
 i1   
  i1   

 0.995  0.025  0.97
例5
设X 与Y 相互独立, X ~ N(0,16), Y ~ N(0,9) ,
X1, X2 ,…, X9 与 Y1, Y2 ,…, Y16 分别是取自 X 与 Y
的简单随机样本, 求统 计量
X1  X 2    X 9
2
2
2
Y1  Y2    Y16
所服从的分布.
解
X1  X 2    X 9 ~ N ( 0, 9 16 )
1
( X 1  X 2    X 9 ) ~ N ( 0, 1)
3 4
1
Yi ~ N (0,1) , i  1,2,,16
3
2
 1 Y  ~  2 (16)
  3 i 
i 1
16
从而
X1  X 2    X 9
Y  Y  Y
2
1
2
2
2
16
1
X1  X 2    X 9 
 3 4
2
16
1 
 Yi 


i 1  3
16
~ t (16)
例7 设
X 1 , X 2 ,, X n 是来自正态总体N ( , 2 )
的简单随机样本,
X
n
1
2
2
S1 
(Xi  X ) ,

n  1 i 1
n
1
2
2
S3 
( Xi  ) ,

n  1 i 1
是样本均值,
n
1
2
2
S2   ( X i  X ) ,
n i 1
n
1
2
2
S4   ( X i   ) ,
n i1
则服从自由度为n - 1的t 分布的随机变量为:
X 
( A)
n 1
S1
X 
( C)
n
S3
X 
( B)
n 1
S2
X 
(D)
n
S4
X 
解
~ N (0,1)

n
n
1

2
2
(
X

X
)
~

(n  1)
i
2 
i 1
X 

n
1

2
n
(X
i 1
i
n 1
故应选(B)

 X)
2
n(n  1) ( X   )
n
(Xi  X )
i 1
2
~ t (n  1)
例8 在总体X~N(12,4)中抽取容量为5的样本X1,X2,…,X5,
求下列概率:
(1) P(| X  12 | 1);
(2) P(max( X 1 ,, X 5 )  15); (3) P(min( X 1 ,, X 5 )  10).
4
X  12
解 (1)因为 X ~ N (12, ), 所以
~ N(0,
1)
5
4
5

 X  12
P(| X  12 | 1)  P

 4
5

=0.7364

1 
=2Φ(1.118)-1
4 
5
例8 在总体X~N(12,4)中抽取容量为5的样本X1,X2,…,X5,
求下列概率:
(1) P(| X  12 | 1);
(2) P(max( X 1 ,, X 5 )  15); (3) P(min( X 1 ,, X 5 )  10).
解
(2) P(max( X 1 ,, X 5 )  15) 1  P(max( X 1 ,, X 5 )  15)
 1  P( X 1  15,, X 5  15)
 1  P( X 1  15) P( X 5  15)
15  12 5
5
 1  [ P( X  15)]  1  [(
)]
2
 1  [(1.5)]5 =0.2923
例8 在总体X~N(12,4)中抽取容量为5的样本X1,X2,…,X5,
求下列概率:
(1) P(| X  12 | 1);
(2) P(max( X 1 ,, X 5 )  15); (3) P(min( X 1 ,, X 5 )  10).
解
(3) P(min( X 1 ,, X 5 )  10)
 P( X 1  10) P( X 5  10)
 [ P( X  10)]5  [1  P( X  10)]5
 [1  (1)]5  [(1)]5
=0.4215
6.2.6 Excel实现
(1) 利用Excel计算样本均值、样本方差、样本标准差
Step1 在数据编辑窗口中,建立数据文件;
Step2 计算样本均值——调用Average 函数:
Step3 计算样本方差——调用Var 函数 ;
Step4 计算样本标准差——调用Stdev 函数.
(2) 利用Excel计算四大分布的分位数
Step1 计算标准正态分布的上侧α分位数
z  NORMSINV (1   )
2

Step2 计算 (n)分布的上侧α分位数
 2 (n)  CHIINV ( , n)
Step3 计算 t (n)分布 的上侧α分位数
t ( n )  TINV ( 2 , n )
Step4 计算 F (n1 , n2 )分布 的上侧α分位数
F ( n1 , n2 )  FINV (  , n1 , n2 )
内容小结:
1. 正态分布
2.
 (n) (卡方)分布
2
3. t分布(学生分布)
4.
F分布
5.
正态总体抽样分布的某些结论
6.
Excel实现
思考题: (非正态总体的样本均值分布问题)
设总体X 的分布未知,其期望 E ( X )   ,
为来自总体X 的样本,则当n充分
均已知,
大时,其样本均值服从什么分布?
1

答案: X   X i ~ N (  , )
n i 1
n
n
即
D( X )   2  0
X 
~ N (0,1)
 n
2
思考题2(2003年数学一考研试题选择题)
设随机变量X~t(n),n>1,Y
 1 / X 2 ,则( )
A. Y~  2 (n).
B. Y~  2 (n-1).
C. Y~F(n,1).
D. Y~F(1,n).
思考题3.(2001年数学一考研试题十二题)
设总体X服从正态分布 N ( , 2 ) ,(>0),从该总体中抽取
简单随机样本 X ,X ,
,X (n  2) ,其样本均值
1
2
2n
2n
1
X
Xi

2n i 1
的数学期望。
n
,求统计量 Y
  ( X i  X n i  2 X ) 2
i 1