6.2 正态样本统计量的抽样分布
Download
Report
Transcript 6.2 正态样本统计量的抽样分布
概率论与数理统计
课件制作:应用数学系
概率统计课程组
6.2
正态样本统计量的抽样分布
6.2.1
正态分布
6.2.2
(n) (卡方)分布
6.2.3
t分布(学生分布)
6.2.4
F分布
6.2.5
正态总体抽样分布的某些结论
6.2.6
Excel实现
2
确定统计量的分布—— 抽样分布, 是数理统计
的基本问题之一. 采用求随机向量的函数的分布的方
法可得到抽样分布.由于样本容量一般不止 2 或 3
(甚至还可能是随机的), 故计算往往很复杂, 有时还
需要特殊技巧或特殊工具.
由于正态总体是最常见的总体,
的几个抽样分布均对正态总体而言.
故本节介绍
6.2.1 正态分布(Normal distribution)
若
则
X 1 , X 2 ,, X n
i.i.d.
~
N ( i , i2 )
n
n
2 2
ai X i ~ N ai i , ai i
i 1
i 1
i 1
n
特别地,
若
则
X 1 , X 2 , , X n
i.i.d.
~
X i ~ N (, )
2
1
X X i ~ N ,
n i 1
n
n
2
上(双)侧 分位数的概念
设X 为连续型随机变量,其概率密度函数为f ( x ) ,
为给定常数, 0 < <1
若
P( X x )
x 为X 所服从的分布的上 分位数.
如果 X 的概率密度函数为偶函数,则对于满足
0 < < 1/2 的 ,
若 P( X x / 2 )
则称 x /2 为X 所服从的分布的双侧 分位数
则称
标准正态分布的上 分位数
z
0.4
z0.05 1.645
0.3
0.2
0.1
-2
-1
•2
z
1
z0.025 1.96
常用
数字
z0.005 2.575
0.4
0.3
0.2
/2
/2
0.1
•
-z/2
-2
-1
1
•2
z/2
-z/2 = z1-/2
6.2.2
(n) 分布(Chi squared r.v.)
2
定义 设 X 1 , X 2 , , X n 相互独立,
且都服从标准正态分布N (0,1),则
n
X
i 1
2
i
~ (n)
2
n = 1 时,其密度函数为
f ( x)
0,
1
x e ,
2
1
2
x
2
1.2
1
x0
x0
0.8
0.6
0.4
0.2
2
4
6
8
10
n=2
时,其密度函数为
1 2x
e ,
f ( x) 2
0,
x0
x0
为参数为1/2的指数分布.
0.4
0.3
0.2
0.1
2
4
6
8
10
一般地, 自由度为 n 的 (n) 的密度函数为
2
1
1
2 (n) e x ,
f ( x)
2
0,
x
2
n
2
n
2
其中,
x0
x0
x 1 t
( x) 0 t e dt
在x > 0 时收敛,称为 函数,具有性质
( x 1) x( x),
(1) 1, (1 / 2)
(n 1) n ! (n N )
(n) 分布
2
0.4
密度函数图
n=2
0.3
n=3
0.2
n=5
n = 10
0.1
n = 15
5
10
15
20
25
(n) 分布的性质
2
1 E (n) n, D (n) 2n
2
2
2 若X 1 2 (n1 ), X 2 2 (n2 ), X 1 , X 2 相互独立,
则 X 1+X 2~ 2 (n1+n2 )
3 n 时,
2 (n) 正态分布
2
4 ( n) 分布的上 分位数有表可查
0.1
0.08
例如
02.05(10) 18.307
0.06
P (10) 18.307 0.05
2
n = 10
0.04
0.02
5
10
•
20
20.05
(10)
15
证
n
1
2
2
(
n
)
X
设
i
X i ~ N (0,1) i 1,2,, n
i 1
X 1 , X 2 , , X n 相互独立,
则
E ( X i ) 0, D( X i ) 1, E ( X ) 1
2
i
2
E (n) E X i n
i 1
2
1 4 x2
4
E( X i )
x e dx 3
2
D( X i2 ) E ( X i4 ) E 2 ( X i2 ) 2
n
2
n
2
2
D (n) D X i 2n
i 1
6.2.3
t 分布 (Student 分布)
定义 设 X ~ N (0,1) , Y ~
T
X
Y
(n), X , Y 相互独立,
2
n
则T 所服从的分布称为自由度为 n 的t 分
布其密度函数为
n 1
n 1
Γ
2
2
t
2
1
f (t )
n
n
n Γ
2
t
0.4
0.3
0.2
0.1
n= 1
n=20
-3
-2
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
t
分布的性质
1°f n(t)是偶函数,
1
n , f n (t ) (t )
e
2
t2
2
2°t分布的上 分位数 t 与双测 分位数 t/2 有表可
查
PT t
0.35
t t1
0.25
0.3
n = 10
0.2
0.15
0.1
-3
•
-t-2
0.05
-1
1
t•
2
3
PT 1.8125 0.05 t0.05 (10) 1.8125
PT 1.8125 0.05
PT 1.8125 0.95
t0.95 (10) 1.8125
P (T t / 2 )
2
P T t / 2
0.35
0.3
0.25
0.2
0.15
/2
-3
/2
0.1
•
-t-2
/2
0.05
-1
PT 2.2281 0.025
PT 2.2281 0.05
1
t2•/2
3
t0.025 (10) 2.2281
6.2.4
F 分布
(F distribution with n and m degrees)
定义 设
令
X ~ 2 (n), Y ~ 2 (m), X , Y 相互独立 ,
X /n
F
Y /m
则F 所服从的分布称为第一自由度为n ,第二自由度为
m 的F 分布,其密度函数为
nm
nm
n
Γ
2
n
2
t n2 1 1 n t 2 , t 0
f (t , n, m) Γ n Γ m m
m
2 2
0,
t0
0.8
m = 10, n = 4
m = 10, n = 10
m = 10, n = 15
0.6
0.4
0.2
1
2
3
4
5
6
0.8
m = 4, n =10
m = 10, n =10
m = 15, n =10
0.6
0.4
0.2
1
2
3
4
5
6
F 分布的性质
1
1 若F ~ F (n, m) , 则 ~ F (m, n)
F
2 F (n, m) 的上 分位数F (n , m) 有表可查:
P( F F (n, m))
例如 F0. 05 ( 4 , 5 ) 5 . 19
但
F0 . 95 ( 5 , 4 ) ?
0.6
事实上,
0.3
1
F1 (n, m)
F (m, n)
1
1
故 F0.95 (5,4)
F0.05 (4,5) 5.19
0.5
0.4
0.2
0.1
1
2
•
3
4
5
F(n,m)
6
例1
证
1
证明 F1 (n, m)
F (m, n)
1
1
P( F F1 (n, m)) P
F F1 (n, m)
1
1
1
1 P
F F1 (n, m)
1
1
1
由于 ~ F (m, n)
故 P
F
F F1 (n, m)
1
因而
F (m, n)
F1 (n, m)
例2
证明:
[t1 (n)] F (1, n)
2
2
G
证 设 X ~ T ( n) , X
, G ~ N (0,1)
2
( n)
n
2
(1)
2
G
令 Y X2 2
21 ~ F (1, n)
( n) ( n)
n
n
因而 P( X | t1 (n) |) P( X t (n))
2
即
t (n) F (1, n)
2
1 2
2
P( X 2 t 2 (n)) P(Y t12 (n))
2
2
6.2.5
正态总体抽样分布的某些结论
(Ⅰ) 一个正态总体
设 X ~ N ( , ) E ( X ) , D( X )
2
总体的样本为(
2
),则
X
~ N (0,1)
X ~ N ( , )
n
2
n
(n 1) S 2
2
2
Xi X
2
~ (n 1)
i 1
n
X
( n 1) S 2
2
相互独立
X
~ T (n 1)
S
n
n
S
与 X
(1)
(2)
( II ) 两个正态总体
设 X 1 , X 2 , , X n 是来自正态总体 X ~ N ( , 2 )
1 1
的一个简单随机样本
Y1 , Y2 , , Ym 是来自正态总体 Y ~ N ( 2 , 22 )
的一个简单随机样本
它们相互独立.
1 m
1 n
令 X Xi
Y Yj
m j 1
n i1
n
m
1
1
2
2
2
2
S1
(
X
X
)
S2
(Y j Y )
i
n 1 i1
m 1 j 1
则
(n 1) S
2
~ (n 1)
2
1
2
1
S12
S
2
2
若 1 2 则
12
(m 1) S
2
~ (m 1)
2
2
2
2
~ F (n 1, m 1)
2
2
2
1
2
2
S
~ F (n 1, m 1)
S
(3)
设
X ~ N ( 1 , 2 )
X 1 , X 2 , , X n 是来自正态总体
的一个简单随机样本
Y ~ N ( 2 , )
Y1 , Y2 , , Ym 是来自正态总体
的一个简单随机样本 ,
则
2
它们相互独立.
1
1
X X i ~ N ( 1 , ) Y Y j ~ N ( 2 , )
n i 1
n
m j 1
m
n
2
2
m
X Y ~ N ( 1 2 , )
n m
( X Y ) ( 1 2 )
~ N (0,1)
2 2
n
m
2
2
(n 1)S
(m 1) S
2
2
~ (n 1) ,
~ (m 1)
2
2
2
1
2
2
(n 1) S
2
1
2
(m 1) S
2
2
2
~ (n m 2)
2
2
2
(
n
1
)
S
(
m
1
)
S
1
2 相互独立
X Y 与
2
2
( X Y ) ( 1 2 )
2
n
(n 1) S12
2
2
m
(m 1) S 22
2
nm2
( X Y ) ( 1 2 )
1 1 (n 1) S12 (m 1) S 22
n m
nm2
~ t (n m 2)
(4)
例3 设总体
X ~ N (72,100) ,为使样本均值
大于70 的概率不小于 90% ,则样本容量
42
n ——
.
解
设样本容量为
n,
则
100
X ~ N (72,
)
n
故
P( X 70) 1 P( X 70) 0.2 n
令
0.2 n 0.9 查表得 0.2 n 1.29
即
n 41.6025
所以取
n 42
例4
从正态总体 X ~ N ( , 2 ) 中,抽取了
n = 20 的样本 X 1 , X 2 , , X 20
20
1
2
2
2
(1) 求 P 0.37 X i X 1.76
20 i 1
20
1
2
2
2
X i 1.76
(2) 求 P 0.37
20 i 1
(n 1) S
解 (1)
~ (n 1)
2
2
2
19S
1 20
2
X
X
~
(19)
i
2
2
i 1
2
即
2
20
1
2
2
故 P 0.37 X i X 1.76 2
20 i1
20
1
2
P 7.4 2 X i X 35.2
i1
1 20
2
2
1 20
P 2 X i X 7.4 P 2 X i X 35.2
i1
i1
查表
0.99 0.01 0.98
(P.386)
Xi
2
(2)
~ (20)
i 1
20
1
2
2
2
故 P 0.37 X i 1.76
20 i1
20
2
2
20
Xi
P 7.4
35.2
i 1
20 X i 2
20 X i 2
P
7.4 P
35.2
i1
i1
0.995 0.025 0.97
例5
设X 与Y 相互独立, X ~ N(0,16), Y ~ N(0,9) ,
X1, X2 ,…, X9 与 Y1, Y2 ,…, Y16 分别是取自 X 与 Y
的简单随机样本, 求统 计量
X1 X 2 X 9
2
2
2
Y1 Y2 Y16
所服从的分布.
解
X1 X 2 X 9 ~ N ( 0, 9 16 )
1
( X 1 X 2 X 9 ) ~ N ( 0, 1)
3 4
1
Yi ~ N (0,1) , i 1,2,,16
3
2
1 Y ~ 2 (16)
3 i
i 1
16
从而
X1 X 2 X 9
Y Y Y
2
1
2
2
2
16
1
X1 X 2 X 9
3 4
2
16
1
Yi
i 1 3
16
~ t (16)
例7 设
X 1 , X 2 ,, X n 是来自正态总体N ( , 2 )
的简单随机样本,
X
n
1
2
2
S1
(Xi X ) ,
n 1 i 1
n
1
2
2
S3
( Xi ) ,
n 1 i 1
是样本均值,
n
1
2
2
S2 ( X i X ) ,
n i 1
n
1
2
2
S4 ( X i ) ,
n i1
则服从自由度为n - 1的t 分布的随机变量为:
X
( A)
n 1
S1
X
( C)
n
S3
X
( B)
n 1
S2
X
(D)
n
S4
X
解
~ N (0,1)
n
n
1
2
2
(
X
X
)
~
(n 1)
i
2
i 1
X
n
1
2
n
(X
i 1
i
n 1
故应选(B)
X)
2
n(n 1) ( X )
n
(Xi X )
i 1
2
~ t (n 1)
例8 在总体X~N(12,4)中抽取容量为5的样本X1,X2,…,X5,
求下列概率:
(1) P(| X 12 | 1);
(2) P(max( X 1 ,, X 5 ) 15); (3) P(min( X 1 ,, X 5 ) 10).
4
X 12
解 (1)因为 X ~ N (12, ), 所以
~ N(0,
1)
5
4
5
X 12
P(| X 12 | 1) P
4
5
=0.7364
1
=2Φ(1.118)-1
4
5
例8 在总体X~N(12,4)中抽取容量为5的样本X1,X2,…,X5,
求下列概率:
(1) P(| X 12 | 1);
(2) P(max( X 1 ,, X 5 ) 15); (3) P(min( X 1 ,, X 5 ) 10).
解
(2) P(max( X 1 ,, X 5 ) 15) 1 P(max( X 1 ,, X 5 ) 15)
1 P( X 1 15,, X 5 15)
1 P( X 1 15) P( X 5 15)
15 12 5
5
1 [ P( X 15)] 1 [(
)]
2
1 [(1.5)]5 =0.2923
例8 在总体X~N(12,4)中抽取容量为5的样本X1,X2,…,X5,
求下列概率:
(1) P(| X 12 | 1);
(2) P(max( X 1 ,, X 5 ) 15); (3) P(min( X 1 ,, X 5 ) 10).
解
(3) P(min( X 1 ,, X 5 ) 10)
P( X 1 10) P( X 5 10)
[ P( X 10)]5 [1 P( X 10)]5
[1 (1)]5 [(1)]5
=0.4215
6.2.6 Excel实现
(1) 利用Excel计算样本均值、样本方差、样本标准差
Step1 在数据编辑窗口中,建立数据文件;
Step2 计算样本均值——调用Average 函数:
Step3 计算样本方差——调用Var 函数 ;
Step4 计算样本标准差——调用Stdev 函数.
(2) 利用Excel计算四大分布的分位数
Step1 计算标准正态分布的上侧α分位数
z NORMSINV (1 )
2
Step2 计算 (n)分布的上侧α分位数
2 (n) CHIINV ( , n)
Step3 计算 t (n)分布 的上侧α分位数
t ( n ) TINV ( 2 , n )
Step4 计算 F (n1 , n2 )分布 的上侧α分位数
F ( n1 , n2 ) FINV ( , n1 , n2 )
内容小结:
1. 正态分布
2.
(n) (卡方)分布
2
3. t分布(学生分布)
4.
F分布
5.
正态总体抽样分布的某些结论
6.
Excel实现
思考题: (非正态总体的样本均值分布问题)
设总体X 的分布未知,其期望 E ( X ) ,
为来自总体X 的样本,则当n充分
均已知,
大时,其样本均值服从什么分布?
1
答案: X X i ~ N ( , )
n i 1
n
n
即
D( X ) 2 0
X
~ N (0,1)
n
2
思考题2(2003年数学一考研试题选择题)
设随机变量X~t(n),n>1,Y
1 / X 2 ,则( )
A. Y~ 2 (n).
B. Y~ 2 (n-1).
C. Y~F(n,1).
D. Y~F(1,n).
思考题3.(2001年数学一考研试题十二题)
设总体X服从正态分布 N ( , 2 ) ,(>0),从该总体中抽取
简单随机样本 X ,X ,
,X (n 2) ,其样本均值
1
2
2n
2n
1
X
Xi
2n i 1
的数学期望。
n
,求统计量 Y
( X i X n i 2 X ) 2
i 1