Transcript [ppt]
数理统计
1
数理统计
数理统计是应用概率论基本理论,根据试
验或观察所得到的数据来研究随机现象,
对研究对象的客观规律性作出种种合理的
估计和判断。
试验设计:研究如何有效地收集随机数据
统计推断:研究如何有效分析已获得的随机
数据
2
第六章 样本及抽样分布
§1 基本概念
§2 抽样分布
3
第六章 样本及抽样分布
§1
基本概念
§1. 基本概念
总体:研究对象的某项数量指标的值的全体。
个体:总体中的每个元素为个体。
例如:某厂生产的灯泡寿命是总体,每一个灯泡
的寿命是个体;某学校全体男生的身高是总体,
每个男生的身高是个体。
研究对象的数量指标𝑿的取值在客观上有一定的
分布,因此,可将其看做随机变量,它的分布称
为总体分布。
4
第六章 样本及抽样分布
§1
基本概念
§1. 基本概念
样本:从总体中随机抽取的一些个体
抽样:抽得样本的过程
样本容量:样本中个体的数量
样本值:对样本观察得到的数值
样本的二重性:
就一次具体观察而言,样本值是确定的数
在不同的抽样下,样本值会发生变化,因此
可看做是随机变量
5
第六章 样本及抽样分布
§1
基本概念
定义:设随机变量X的分布函数是F(x),若 X 1 ,
, Xn
是具有同一分布函数F的相互独立的随机变量,
则称X 1 , , X n为从总体X中得到的容量为n的简
单随机样本,简称为样本,其观察值 x1 , , x n称
为样本值。
样本的两个特性(对抽样的要求):
代表性:样本的每个分量𝑿𝒊 与总体𝑿具有相
同的分布
独立性:𝑿𝟏 , 𝑿𝟐 , … , 𝑿𝒏 相互独立。
6
第六章 样本及抽样分布
§1
基本概念
由定义知:若X 1 , , X n为X的一个样本, 则 X 1 ,
的联合分布函数为:
, Xn
n
*
F ( x1 ,
, xn ) F ( xi )
i 1
设X的密度为p(x),则 X 1 ,
密度为:
, X n 的联合概率
n
*
p ( x1 ,
, xn ) p( xi )
i 1
7
第六章 样本及抽样分布
1. 定义:设 X 1 ,
基本概念
, X n为来自总体X的一个样本,
, X n ) 是 X1 ,
g( X 1 ,
§1
, X n 的函数,若g是连续
函数,且g中不含任何未知参数;
则称g ( X1 ,
设 x1 ,
, X n )是一个统计量。
, xn是( X 1 ,
则称g( x1 ,
, X n )的样本值。
, xn )是g( X 1 ,
, X n )的观察值。
注:统计量是随机变量。
8
第六章 样本及抽样分布
例.
设X 1 ,
§1
基本概念
, X n为来自总体 X ~ N ( , 2 ) 的一个样本,
问下列随机变量中那些是统计量
其中未知 , 2已知,
X1 X n
min( X 1 , X 2 , , X n );
;
2
2
X1 X n
( X1 X n )
;
;
2
n
( X 1 X n ) n
.
n
9
第六章 样本及抽样分布
§1
基本概念
2. 常用的统计量
样本均值
1 n
X Xi
n i 1
n
样本方差
n
1
1
2
2
2
S ( Xi X ) Xi X
n i 1
n i 1
2
n
n
另一定义 S
2
n 1
1
2
( Xi X )
n 1 i 1
二者关系 nS ( n 1) S
2
n
2
n 1
,
Sn
n1
S n 1
n
10
第六章 样本及抽样分布
样本标准差
Sn S
2
n
§1
基本概念
1 n
2
( Xi X )
n i 1
1 n
k
样本k阶(原点)矩:Ak X i
n i 1
k 1, 2,
1 n
k
样本k阶中心矩:Bk ( X i X )
n i 1
k 1, 2,
它们的观察值分别为:
n
n
1 n
1
1
x xi , sn2 ( xi x ) 2 xi 2 x 2
n i 1
n i 1
n i 1
11
第六章 样本及抽样分布
§1
基本概念
1 n
2
s
(
x
x
)
n i 1 i
1 n k
ak xi , k 1, 2,
n i 1
n
1
k
bk ( xi x ) , k 1, 2,
n i 1
分别称为样本均值、样本方差、样本标准差、样
本k阶矩、样本k阶中心矩。
统计量是样本的函数,它是一个随机变量,统计
量的分布称为抽样分布。
12
第六章 样本及抽样分布
§1
基本概念
结论1:设 X 1 , , X n 为来自总体 X 的一个样本,
EX , DX 2 , X为样本均值,
则
E X , DX
2
n
.
13
第六章 样本及抽样分布
§2
抽样分布
§2 抽样分布
一. 正态总体样本的线性函数的分布
设 X1, X2, ... , Xn是来自正态总体X~N(μ,σ2)
的样本,则统计量 U=a1X1+a2X2+...+anXn
也服从正态分布:
n
n
i 1
i 1
U ~ N ( ai , 2 ai2 ).
14
第六章 样本及抽样分布
1 n
于是,U X i X .
n i 1
n
ai ,
i 1
X ~ N (,
/ n
基本概念
1
ai , ( i 1, 2, L , n),
n
特别,若取
X
§1
n
2
a
i 1
2
i
2
n
2
n
),
标准化即得:
~ N (0, 1).
15
标准正态分布的上 分位点u
设 X ~ N (0,1) , 0 < < 1, 称满足
P ( X u )
的点 u 为X 的上 分位点
0.4
注意:Φ(uα)=1-α
0.3
常用数据
0.2
0.1
-3
-2
-1
1
z
u
2
3
u0.025 1.96
u0.05 1.645
u0.1 1.28
16
第六章 样本及抽样分布
§2
抽样分布
二. 分布
2
定义: 设 X 1 , X 2 , , X n相互独立, 都服从正态
分布N (0,1) , 则称随机变量:
X1 X 2
2
2
2
Xn
2
所服从的分布为自由度为 n 的 分布.
2
记为
~ ( n).
2
2
17
( n)分布的概率密度为
2
x n
1
1
2
2
e x ,
n
2 n
p( x ) 2 ( )
2
0
x0
x 0.
2 ( n)分布的概率密度曲线如图.
18
第六章 样本及抽样分布
§2
抽样分布
分布的性质
2
1.设 X 1 ~ 2 ( n1 ), X 2 ~ 2 ( n2 ), 且 X1, X2相互独立,
则X 1 X 2 ~ ( n1 n2 ).
2
( 分布的可加性)
2
19
例:设X1 ,
, X 4是来自N(0, 4)的样本,Y =a( X1 - 2X 2 )
2
b(3 X 3 4 X 4 )2 .问a, b取何值时,X服从 2分布,自由度?
解:𝑋1 − 2𝑋2 ~𝑁 0,20 , 3𝑋3 − 4𝑋4 ~𝑁(0,100)
𝑋1 − 2𝑋2
3𝑋3 − 4𝑋4
~𝑁 0,1 ,
~𝑁(0,1)
10
20
X1 ,
, X 4独立 X1 - 2X 2与3 X 3 4 X 4独立
𝑋1 − 2𝑋2
20
2
3𝑋3 − 4𝑋4
+
10
2
~𝜒 2 (2)
1
1
a
,b
,自由度为2.
20
100
20
第六章 样本及抽样分布
§2
抽样分布
2
2. 若X~ (n) , 则E(X)=n, D(X)=2n.
由X i ~ N (0,1), E ( X i ) D( X i ) 1
2
D( X ) E ( X ) [ E ( X )] 3 1 2
2
i
4
i
2
i
2
( k 1)!! k 偶
Z ~ N (0,1), E (Z )
k 奇
0
k
n
E ( ) E ( X i ) n,
2
2
i 1
n
D ( ) D ( X i ) 2 n.
2
2
i 1
21
第六章 样本及抽样分布
§2
抽样分布
3. 分布的分位点
2
对于给定的α, 0<α<1, 称满足条件
P { }
2
( n)
的点 为 ( n) 的上 分位点,记为:
2
2
对于不同的 , n,
可以通过查表求
得上 分位点的值.
22
第六章 样本及抽样分布
§2
抽样分布
例 设 Z ~ 2 ( n), 2 ( n) 的上 分位点满足
P { Z ( n)} ,
2
求 ( n)的值, 可通过查表完成.
2
02.025 (8) 17.535,
02.975 (10) 3.247,
02.1 ( 25) 34.382.
2
0.02
(8) 18.16
1
n 45时, (n) (u 2n 1) 2
2
2
23
第六章 样本及抽样分布
§2
抽样分布
三. t 分布
设 X ~ N (0, 1), Y ~ ( n), 且 X , Y 独立,
X
则称随机变量 T
服从自由度为 n 的 t
Y /n
分布, 记为 T ~ t (n ).
2
t (n) 分布的概率密度函数为
n1
n1
2
2
t
2
1
p( t )
, t
n
n
nπ
2
24
第六章 样本及抽样分布
§2
抽样分布
t分布的性质:
t分布的密度函数关于t=0对称,当n充分大
时,密度函数p(t)近似于N(0,1)的密度φ(t).
即:lim p( t )
1
2
t 分布的概率密度曲线如图
e
t2 2
.
n
25
第六章 样本及抽样分布
§2
抽样分布
t分布的分位点
对于给定的α, 0<α<1, 称满足条件
P{T t ( n)}
的点 t ( n) 为 t (n) 分布的上 分位 点.
26
第六章 样本及抽样分布
§2
抽样分布
t分布的上 分位点的性质:
t1 (n) t (n)
t分布的上分位点t ( n)可查表
求得,例t0.025 (15) 2.1315.
当n 45时,对于常用的 的值,可用正态近似
t ( n) u
27
第六章 样本及抽样分布
§2
抽样分布
四. F分布
定义 设 U ~ 2 ( n1 ), V ~ 2 ( n2 ), 且U , V 独立, 则称
U / n1
随机变量 F
服从自由度为 ( n1 , n2 ) 的 F 分
V / n2
布, 记为 F ~ F ( n1 , n2 ).
28
第六章 样本及抽样分布
§2
抽样分布
F ( n1 , n2 )分布的概率密度为
n1
n1
2
1
n
n
n
1
2
1
2
2 n x
2
, x 0,
n1 n2
p( x )
2
n
n
n
x
1 2 1 1
2 2 n2
0
其他 .
F分布的概率密度
29
第六章 样本及抽样分布
§2
抽样分布
F分布的分位点
对于给定的,
0 1, 称满足条件
p F F ( n1 , n2 )
的点F ( n1 , n2 )为F ( n1 , n2 )分布的上分位点.如图所示.
F ( n1 , n2 )
F分布的分位点
可以查表求得。
如, F0.05 (4, 5) 5.19
30
第六章 样本及抽样分布
§2
抽样分布
F分布的性质
1
~ F (n2 , n1 ).
1. 若F ~ F ( n1 , n2 ), 则
F
1
2. F1 ( n1 , n2 )
F ( n2 , n1 )
31
第六章 样本及抽样分布
证明2:若F ~ F (n1 , n2 )
§2
抽样分布
1
1
1 P{F F1 (n1 , n2 )} P{
}
F F1 (n1 , n2 )
1
1
1 P{
}
F F1 (n1 , n2 )
1
1
所以 P{
}
F F1 (n1 , n2 )
1
又因为 1 / F ~ F (n2 , n1 ), 所以 F (n2 , n1 )
F1 (n1 , n2 )
1
即 F1 (n1 , n2 )
F (n2 , n1 )
1
1
例: F0.95 (12,9)
0.357
F0.05 (9,12 ) 2.80
32
例: 设 X ~ t ( n), 求𝒀 = 𝑿𝟐 的分布?
𝑋 2 ~𝐹(1, 𝑛)
33
第六章 样本及抽样分布
§2
抽样分布
正态总体的抽样分布
定理1 (样本均值的分布)
设 X1, X2, ... , Xn是来自正态总体X~N(μ,σ2)
1 n
的样本, X X i
n i 1
X
/ n
则:
~ N (0, 1).
34
第六章 样本及抽样分布
§2
抽样分布
定理2 (样本方差的分布)
设X1,X2,…,Xn是来自正态总体
N ( , ) 的样本,
2
X 和 S n2分别为样本均值和样本方差, 则有
(1)
(2)
2
n
2
nS
2
(
n
1)
S
2
n
1
~ ( n 1) 或:
~ ( n 1)
2
2
X 与 S n2 独立.
X i
思考:
n
i 1
2
分布?
35
正交变换矩阵
A=
1
n
(n 1)
n(n 1)
0
0
0
1
n
1
n(n 1)
1
n
1
n(n 1)
1
n
1
n(n 1)
(n 2)
(n 1)(n 2)
1
(n 1)(n 2)
1
(n 1)(n 2)
0
0
0
0
1
6
1
2
1
(n 1)(n 2)
1
6
1
2
1
n
1
n(n 1)
36
第六章 样本及抽样分布
§2
定理3 设X1,X2,…,Xn是来自正态总体
X 和S
2
为样本均值和样本方差,
n
X
Sn / n 1
抽样分布
N ( , ) 的样本,
2
则有
~ t ( n 1).
X
~ N (0,1),
证明 因为
/ n
nSn2
2
~ 2 ( n 1),
且两者独立, 由 t 分布的定义知
X
/ n
X
nSn2 / 2
n1
Sn / n 1
~ t ( n 1).
37
第六章 样本及抽样分布
§2
抽样分布
定理 4 (两总体样本均值差、样本方差比的分布)
设 X ~ N ( 1 , 12 ),Y ~ N ( 2 , 22 ),且X与Y独立,
X1,X2,…, X n是来自X的样本, Y1,Y2,…, Yn 是来自Y的样本,
1
2
2
2
分别是
分别是这两个样本的
样本均值,
S
和
S
X和Y
1
2
是X, Y的修正样本方差:
n1
1
2
S
(
X
X
)
i
n1 1 i 1
2
1
n2
1
2
S
(
Y
Y
)
i
n2 1 i 1
2
2
38
第六章 样本及抽样分布
§2
抽样分布
S12 / S22
则有 (1) 2 2 ~ F ( n1 1, n2 1);
1 / 2
(2) 当 12 22 2 时,
( X Y ) ( 1 2 )
~ t ( n1 n2 2),
1 1
Sw
n1 n2
2
2
(
n
1
)
S
(
n
1
)
S
1
2
2
其中 S w2 1
,
n1 n2 2
Sw
S w2 .
39
第六章 样本及抽样分布
§2
抽样分布
证明 (1) 由定理2
( n1 1) S12
2
1
~ ( n1 1),
2
由假设 S12 , S22 独立,
( n1 1)S /
n1 1
2
1
2
1
2
1
2
1
( n2 1) S22
2
2
~ ( n2 1),
2
则由 F 分布的定义知
( n2 1)S /
~ F ( n1 1, n2 1),
n2 1
2
2
2
2
2
2
2
2
S /S
即
~ F ( n1 1, n2 1).
/
40
第六章 样本及抽样分布
(2)
§2
抽样分布
2 2
因为 X Y ~ N 1 2 ,
n1 n2
( X Y ) ( 1 2 )
所以 U
~ N (0,1),
1 1
n1 n2
由
( n1 1) S12
2
~ 2 ( n1 1),
( n2 1) S22
2
~ 2 ( n2 1),
且它们相互独立, 故由 2 分布的可加性知
41
第六章 样本及抽样分布
V
( n1 1) S12
2
( n2 1) S 22
2
§2
抽样分布
~ 2 ( n1 n2 2),
由于 U 与 V 相互独立 , 按 t 分布的定义 .
U
V /( n1 n2 2)
( X Y ) ( 1 2 )
~ t ( n1 n2 2).
1 1
Sw
n1 n2
42
第六章 样本及抽样分布
§2
抽样分布
例 若总体X ~ N (0,1),从此总体中取一个容量为
6的样本X 1 , X 2 ,X 6 , 设
Y ( X 1 X 2 X 3 )2 ( X 4 X 5 X 6 )2
试决定常数C,使随机变量CY服从 2分布.
解. 因为 X 1 X 2 X 3 ~ N (0,3)
X1 X 2 X 3
所以
~ N (0,1)
3
2
X1 X 2 X 3
2
从而
~ (1)
3
43
第六章 样本及抽样分布
§2
抽样分布
X4 X5 X6
2
同理可知
~ (1)
3
2
由 2分布的性质可知
1
X1 X 2 X 3 X1 X 2 X 3
2
Y
~
( 2)
3
3
3
2
2
1
故C .
3
44
第六章 样本及抽样分布
§2
抽样分布
设总体X服从正态分布N (12, 2 ), 抽取容量为
例
25的样本, 求样本均值X大于12.5的概率.如果(1)已
2
知 2;(2)未知,但已知样本方差Sn-1
5.57.
解:(1) X 12 ~N (0,1),
2
25
X 12 12.5 12
P X 12.5 P
1 (1.25) 0.1063
2 25
2 25
( 2) T
X 12
Sn-1
~t ( 24)
25
X 12
12.5
P X 12.5 P
P T 1.059
Sn-1 25 Sn1 25
t0.15 ( 24) 1.059, P T 1.059 0.15.
故有P X 12.5 0.15.
45
第六章 样本及抽样分布
§2
抽样分布
例. 从正态总体N ( ,0.52 )中抽取样本X 1 ,, X 10 .
10
2
(1)已知 0,求概率p X i 4;
i 1
10
2
μ
(2)未知,求概率p ( X i X ) 2.85.
i 1
Xi
解 (1) 由 0, ~ N (0,1),
0.5
2
Xi
2
Y
~
(10)
i 1 0.5
10
2
10 2
1
P X i 4 P 2
i 1
0.5
4
2
X
P
(
Y
16)
i
2
0.5
i 1
10
2
46
第六章 样本及抽样分布
查表求
2
0.10
§2
抽样分布
10
2
(10) 16.由此可得 p X i 4 0.10.
i 1
(2) 由题设及定理2,
2
10
10
S
1
2
2
2
n
Z
( X i X ) ~ (9)
2
2
0.5
0.5 i 1
10
10
1
2.85
2
2
P ( X i X ) 2.85 P 2 ( X i X )
2
0.5
i 1
0.5 i 1
P ( Z 11.4)
2
查表得
2
0.25
(9) 11.4,由此可求得
10
2
p ( X i X ) 2.85 0.25.
i 1
47
2
~
N
(0,
), (X1 , X 2 )
例:设总体
(X1 X 2 ) 2
(X1 X 2 ) 2
是它的样本,求
的分布。
48