Transcript Document

第五章、大数定律与中心极限定理
问题的给出
大数定律
中心极限定理
返回目录
问题的给出
在第一章中,我们在讨论频率与概率的关系时已经
知道,概率总是在对大量随机现象的考察中才能显现出来。
为了研究大量的随机现象,必须采用极限的形式。这就自
然地引导人们对极限定理进行研究,极限定理的内容很广
泛,其中最重要的有大数定律与中心极限定理。
历史的经验告诉我们,掷一枚质地均匀的硬币。虽
然不能准确地预言掷出的结果,但如果独立地连掷n次,
当n充分大时,出现正面的概率与1/2很接近,此处的nA表
示在此n次中出现正面的总次数。
这类事实可以如下直观地解释:要从随机现象中寻求
必然的法则,应该研究大量的随机现象。因为在大量的随
机现象里:各自的偶然性在一定程度上相互抵消,相互补
偿。因而可能显示出必然的法则来。
这就向人们提出一个理论问题,在一般的贝努里试验
中,每个试验中事件A出现的概率为 p, (0  p  1)
能否在数学上证明: n A  p
n
或考虑独立随机变量序列{ Xk
( n  )
}。其中,
Xk {
1A在第k次试验中出现
0......A在第k次试验中不出现
n
X

求证:
k 1
n
即
k
p
( n  ),这里 p  E ( X k )
1 n
( X k  p)  0

n n 1
(n  )
依概率收敛
设Y1 , Y2 ,, Yn , 是一个随机变量序列,
若对任意ε>0 ,有
lim p{| Yn  a |  }  1
n 
p
则称序列{ Yn }依概率收敛于a。记作 Yn 

a
p
X


a,Yn  b,又设函数
依概率收敛的序列有以下的性质:若 n
p
g(x,y)在区间(a,b)连续,则 g( X n , Yn ) 
g(a, b)
关于随机变量序列的收敛的提法:
nA
当n足够大时, 与p有较大偏差的概率很小。
n
用数学语言来讲,就是要证明:对于任意的
nA
lim p{|
 p |  }  0
n 
n
等价于
nA
lim p{|
 p |  }  1
n 
n
nA
即有 n 依概率收敛于p
  0,
§5.1 大数定律
介绍三个定理:
定理一 (契比雪夫定理的特殊情况)
设随机变量 X1,X2,…Xn… 相互独立,具有相同
的期望与方差 。令
E( X k )  , D( X k )   2 (k  1.2。则
)
p
X


定理一表明,当n很大时,随机变量 X1,X2,…Xn….的算
术平均接近于数学期望 E(Xk)=μ 。通俗地说,在定理的条
件下,n个随机变量的算术平均,当n无限增大时将几乎变成
一个常数。(证明)
定理二(贝努里大数定理)
设 nA 为 n 次独立重复试验中事件 A 发生的次数,p 是事
件 A 在每次实验中发生的概率, 则对任意正数ε,有
lim P{|
n 
nA
n
p
 p |  }  1 即 A 


n
n
定理二表明:事件发生的频率
nA
依概率收敛于事件的概
n
率p。这个定理以严格的数学形式表达了频率的稳定性。在实际
应用中,当实验次数很大时,可用频率来代替事件的概率。
定理三 (辛钦大数定理)
设随机变量X1,X2,…Xn… 相互独立,服从同一分布,且
具有数学期望E(Xk)=μk,(k=1,2,…),则对任意正数ε,有
1 n
lim P{|
X k   |  }  1 即

n 
n k 1
p
X 


定理三表明:
在定理的条件下,当n很大时,平均值 X 接近于μ的概率很
大。
返回
§5.2
中心极限定理
介绍三个常用的中心极限定理
定理四(独立同分布的中心极限定理)
设随机变量X1,X2,…Xn… 相互独立,服从同一分布,具
有数学期望和方差:  E( X k ), 2  D( X K )
n
机变量之和  X k 的标准化变量:
n
Yn 
k 1
X
k 1
k
n
 E ( X k )
k 1
n
(k=1,2,…),则随
n

D( X k )
X
k 1
k
 n
n
k 1
的分布函数Fn(x)对于任意x满足
lim Fn ( x ) 
n 
n

 k 1 X k  n
lim P 
 x}
n 
n




x

1
t 2 / 2
e
dt   ( x )
2
定理四表明: 在定理的条件下,当n充分大时,
n
X
k
 n
k 1
近似地
~
n
N (0,1).
因此可以借助于标准正态分布对
n
X
k 1
析或作实际计算。
k
作理论分
定理四的另一中表达形式,当n充分大时,
近似地
X
~
N ( ,

2
n
)
定理五(李雅普诺夫定理)
设随机变量X1,X2,…Xn… 相互独立,期望
E ( X k )  k ,
n
D( X k )   , k  1,2,3,, 令B    k2 , , 如果存在δ>0,
k 1
1 n
使得当 lim 2  E{| X k  k |2 }  0
时,则对任意的
n B
k 1
n
2
k
2
n
n
n
 X 
x成立
lim
n 
p{
k 1
k
k 1
Bk
k
x
 x} 


1
e
2
t 2
2
dt
定理五表明:在定理的条件下,不管 X k (k  1,2,3,) 服
从什么分布,只要n充分大时,
n
X
k 1
k
近似地服从正态分布 ,
这就是为什么正态分布是概率论的重要的常见分布的原因。
定理六(棣莫弗-拉普拉斯定理)
设随机变量ηn~b(n,p), n=1,2,…,则对任意的x有
 n  np
lim p{
n 
npq
x
 x} 


1
2
e
t 2
2
dt
定理六表明:二项分布的极限分布是正态分布,即
n充分大时,近似地服从N(np,npq),因此n充分大
时,二项分布的概率可用正态分布的概率近似。
返回
例5.1 设电站供电所有10000盏电灯,夜晚每一
盏灯开灯的概率是0.7,而假定开关时间彼此独立,
估计夜晚同时开着的灯数在6800与7200盏之间的
概率。
解
例5.2 一加法器同时收到20个噪声电压 Vk (k  1,2,,20),
设它们是相互独立的随机变量,且都在区间(0,10)
上服从均匀分布,记 V

20
V
k 1
值。
解
k
, 求P{V>105 }的近似
例5.3 一船舶在某海区航行,已知每遭受一次波
浪的冲击,纵摇角大于3度的概率为p=1/3, 若船遭受
了90000次波浪冲击, 问其中有29500~30500次纵
摇角度大于3度的概率是多少?
解
例5.4
对于一个学生而言,来参加家长会的家长人数
是一个随机变量,设一个学生无家长,1名家长,2名家长
来参加会仪的概率分别为0.05,0.8,0.15。若学校共有
400名学生,设各学生参加会议的家长数相互独立,且服
从同一分布。
(1)求参加会议的家长数X超过450的概率;
(2)求有1名家长来参加会议的学生数不多于340的概率。
解
返回
解 令X表示在夜晚同时开着的灯数的数目,则X~b(10000,0.7) ,
E ( X )  10000 0.7  7000, D( X )  10000 0.7  0.3  2100.
1)由切比雪夫不等式
p{6800 X  7200}  p{| X  7000| 200}
2100
 1
2  0.95
200
2)由棣莫弗——拉普拉斯定理
6800 7000 x  7000 7200 7000


}
p{6800 x  7200}  p{
2100
2100
2100
x  7000
 p{4.36 
 4.36}
45.83
 2(4.36)  1
 0.99999
说明:
切比雪夫不等式在近似计算中,除了不够精确之外,
还有不便于应用的因素存在。比如,区间必须是以E(X)为
中心的有限区间等,因此与中心极限定理相比,切比雪夫
不等式既不精确也不便使用。所以计算时只要条件允许,
首选中心极限定理。
Return
解 易知 E (Vk )  5, D(Vk )  100 (k  1,2,,20).
12
20
由定理四,随机变量
Z 
V
k 1
k
 20 5
100
20
12
V  20 5

100
20
12
近似服从正态分布N(0,1),于是
p{V  105} 
p{
 p{
V  20 5
105 20 5

}
100
20 (10 12) 20
12
V  100
 0.387}
10
( 12 ) 20
V  100
 1  p{
 0.387}
10
( 12 ) 20
 1 
0.387

即有
1
e
2
t 2
2
p{V  105}  0.348
dt 1  (0.387)  0.348
Return
解 我们将船舶每遭受一次波浪冲击看作是一次
试验,并假定各实验是独立的。在90000次波浪冲击中纵
摇角度大于3度的次数记为X,则X是一个随机变量,且有
X~b(90000,1/3).其分布律为
1 k 2 90000  k , k  0,1,2,3,,90000
k
C
(
p{ X  k}  90000 ) ( )
3 3
所求的概率为
p{29500 X  30500} 
30500
1 k 2 90000 k
C
( ) ( )

3 3
k  29500
要直接计算是麻烦的,我们利用棣莫弗——拉普拉斯
k
90000
定理来求它的近似值,即有
29500 np
X  np
30500 np


}
p{29500 X  30500}  p{
np(1  p)
np(1  p)
np(1  p)

30500  np
np (1 p )
29500  np
np (1 p )

1
e
2
t 2
2
dt
30500 np
29500 np
 (
)  (
)
np(1  p)
np(1  p)
其中n=90000,p=1/3. 则
p{29500 X  30500}
 (5 2 / 2)  (5 2 / 2)
=0.9995
Return
解 (1)以Xk(k=1,2,…,400) 记第k个学生来参加会议的
家长数,则
的分布律为
Xk
0
1
2
Pk
0.05
0.8
0.15
400
易知E( X k )  1.1, D( X k )  0.19(k  1,2,,400) 而X   X k
k 1
由定理四,随机变量
400
X
k 1
k
 4001.1
400 0.19
X  4001.1

400 0.19
近似服从正态分布N(0,1),于是
X  400 1.1
450  400 1.1

}
P{X>450}= p{
400 0.19
400 0.19
X  4001.1
 1  p{
 1.147}
400 0.19
 1  (1.147)  0.1357
2)以Y记有一名家长来参加会议的学生数,则
Y~b(400,0.8),由定理六,得
P{Y
Y  400 0.8
340 400 0.8

}
 340}  P{
400 0.8  0.2
400 0.8  0.2
Y  400 0.8
 P{
 2.5}
400 0.8  0.2
  (2.5) =0.9938
Return