Transcript Document

连续型随机变量及其概率分布
第九讲
大纲
• 什么是连续型随机变量
• 主要连续型随机变量及其分布介绍
– 均匀分布
– 指数分布
– 伽玛分布
概率密度函数
• 对于离散型随机变量我们可以用一系列等
式来描述其概率分布的情况
• 而对于连续型的随机变量,由于变量的可
能取值是某一区间内的所有值,这时我们
考察事件X = x的概率显然没有什么意义,
而必须了解事件a   b的概率
• 为此,引进概率密度函数的概念
概率密度函数的定义
• 对于随机变量X,如果存在非负可积函数
f (x),使对任意实数a,b ,(a b),都有:
b
P(a  X  b)   f ( x)dx  F (b)  F (a)
a
• 则称X为连续型的随机变量,并称f (x)为X的
概率密度函数(probability density function,
pdf)
– 对应于离散型随机变量, f (x)为X的概率质量
(mass)函数, pmf
说明
• 讨论连续型随机变量落如某一区间的概率
时,不必区分是否包括区间端点
• 随机变量落入某一区间(a,b)的概率等于曲
线 y = f (x)在区间(a,b)上的面积
• 概率密度函数y = f (x)满足概率的基本性质
– 非负性 f ( x)  0

– 正则性  f ( x )dx  1

这两条性质是判定函数
f (x) 是否为随机变量
X 的概率密度函数的充
要条件
概率分布函数
• 设X是一连续型随机变量,则函数
F(x) = Pr(X ≤ x)称作X的概率分布函数
– 与我们前面学的次数或频率累积分布曲线相似
– 也称作累积分布函数,cdf
– 对于离散型随机变量,定义同样成立
• 对于任意实数x1< x2,随机点落入(x1, x2)上
的概率为:
Pr( x1  X  x2 )  F ( x2 )  F ( x1 )
分布函数的特性
• 如果将X看作是数轴上的随机点的坐标,那
么F(x)在x处的函数值就表示点X落入区间
(-∞, x)上的概率
• 对于连续型随机变量X,分布函数F(x)与密
度函数 f (x) 有如下关系:
x
F ( x )  Pr( X  x )  Pr(   X  x ) 
– F(x)是f(x)的可变上限积分函数
– F(x)的取值随x的不同而不同


f (t )dt
F′(x)
• 在 f (x)的连续点处,有 f (x) = F′(x)
• 在可导处x0
F ( x0  x )  F ( x0 )
F ( x0 )  lim
x 0
x
Pr( x0  X  x0  x )
 lim
x 0
x
 f ( x0 )
f ( x0 ) x  Pr( x0  X  x0  x )
这就是概
率密度
分布函数的性质
• 0≤ F(x) ≤1
• F(x)是非减函数
– 若x1< x2,有f (x1)< f (x2)
F ( x)  0, lim F ( x)  1
• xlim

x
• F(x)右连续
– 对于连续型随机变量, F(x)处处连续
– 对于离散型型随机变量, F(x) = Pr(X ≤ x)
– lim F ( x  x )  F ( x )
x  0
F(x)右连续
分布函数与密度函数的几何含义
Pr( a  X  b)
f ( x)
b
f ( x)
F(x)
  f ( x )dx
a
 F (b)  F ( a )
x
几种重要的连续型随机变量
• 均匀分布
• 指数分布
• 伽玛分布
均匀分布
• 一个质点在某个区间作均匀运动,以等可
能性落在区间内的任意一点
• 定义:如果随机变量X 的概率密度函数为:
 1
, a xb

f ( x)  b  a

otherwise
0
则称X服从 [a,b] 区间上的均匀分布,记作
X ~U[a,b]
分布函数
F ( x)  
x

xa
0
 x  a
f (t )dt  
, a xb
b  a
xb
1
图示
f (x)
a
b
x
b
x
F (x)
1
a
例5.38
• 某人要搭乘一列6:00发出的火车,他打算
乘出租车于5:40出发到火车站,从他家乘
汽车 到火车站,在最顺利的情况下要10分
钟,在交通最拥挤时要50分钟,到火车站
后上火车要5分钟。假定从他家到火车站汽
车行驶时间X在[10,50]区间上服从均匀分
布,问此人能赶上火车的概率。
练习
• 秒表最小刻度值为0.01秒。若计时精度是取
最近的刻度值,求使用该表计时产生的随
机误差X 的概率密度函数f (x) ,并计算误差
的绝对值不超过0.004秒的概率。
指数分布
• 定义:如果随机变量X 的概率密度函数为:
l e lx
x0
l 0
f ( x)  
0
otherwise
则称X服从参数为l 的指数分布,记作X~E(l)
• 其分布函数为:
x0
0
F ( x)  
lx
1

e
x0

指数分布的应用
• 常用于描述两次事件在特定的时间间隔内
发生的概率,如
– 电子元件的寿命
– 病人候诊的时间
– 机器发生两次故障的间隔
– 银行自动提款机支付一次现金所花费的时间
• 其中参数l 表示在单位时间内,事件发生的
次数
图形
pdf
cdf
Expondist函数
• 语法:Expondist(x, lambda, cumulative)
– x:函数的数值;Lambda:参数值l;
– Expondist(10,0.2,TRUE) = 0.864665,是一个概率
分布值
– Expondist(10,0.2,FALSE) = 0.027067 ,是一个概
率密度值
指数分布与泊松分布
• 泊松分布中随机变量X描述的是在一段时间中事件
发生的次数(离散),指数分布描述的则是两次事件
发生之间的时间间隔(连续)
• 两种分布有同样的参数,但参数的表述形式有所
不同
泊松分布随机变量
指数分布随机变量
一段时间内机器发生故障的次数
机器使用至发生故障之间的时间
一段时间内商店接待的顾客人数
两位顾客到达一商店间隔的时间
一分钟内电话交换台接到的呼唤次数 电话交换台接到两次呼唤的时间间隔
例5.44
• 已知某工厂生产的笔记本电池的使用寿命X服
从参数l=0.4的指数分布。厂家承诺,如果电
池在半年之内不能使用的话,可以免费更换。
已知能够正常使用的电池的平均利润为每个
200元,更换电池的成本为每个600元,请问该
厂家最终的平均利润为多少?
• 我们首先需要计算一下电池的使用寿命在半年
以内的概率是多少:
P(X<0.5)=expondist(0.5,0.4,1)=0.1813。
• 然后计算电池的平均(期望)利润为:
200×0.9183-600×0.1813=74.88(元)
伽玛分布
• 指数分布和伽玛分布都可以用来计算等候时间、
产品可靠度、排队问题等
• 不同的是,在指数分布中是等待第一个成功事
件所需的时间,而在伽玛分布中,则等待第n
个成功事件所需的时间
• 定义:如果随机变量X概率密度函数为:
 1
a 1  x / b
x
e
x0
 a
f ( x; a , b )   b (a )

0
otherwise

– 其中, a和b 均大于0
则称X服从参数为a和b的伽玛分布
图形
f(x)
Gamma Distributions
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
2
4
6
x
8
10
应用
• 伽玛分布可以用来计算等候时间
• 在泊松过程中,单位时间成功次数为l,那
么等候第一个成功事件出现的时间平均需
要b=1/ l,若要等候第n个成功事件出现,
则a=n
• GAMMADIST函数
– 语法:GAMMADIST(x, alpha, beta, cumulative)
例5.45
• 某个淘宝热门小铺平均而言每分钟的点击
人数达到2人次,那么第50个访问者会在半
小时内出现的概率是多少?
• 该网站第一位访问者出现的平均时间b =
1/2分钟,a =50,x=30,根据伽玛分布,
得到:
F(X=30; a =50, b=1/2)=Gammadist(30, 50,
1/2, 1) =0.9156。
例5.46
• 小张每天早上7点半左右搭乘公交车上班,一般而
言,平均每10分钟有一班公交车。今天早上他等了
20分钟还没有公交车到达,请问今天的情况是否特
别偶然?
• 公交车抵站可以视为泊松过程,因此等候的时间服
从伽玛分布
• 等候第一个公交车出现的时间平均需要b=10分钟,
小张在这20分钟的时间里等待下一辆公交车到达,
所以a=1。
• 等候20分钟尚无公交车到达的概率为:
• P(X>20; a =1, b=10)=1-P(X<=20)
=1-Gammadist(20, 1, 10, true) = 1-0.8647 = 0.1353
伽玛分布与泊松分布
• 两种分布都是从泊松过程中产生的
– 泊松分布是一种离散型随机变量分布,它描述
的是在一个连续的时间或空间中,事件发生n次
的概率
– 伽玛分布则是连续型随机变量分布,它描述的
是在一个泊松过程中,事件发生n次所需一定时
间的概率
• 它们之间是否存在着某种对应关系?
伽玛分布与泊松分布
• 在例5.45中,我们用伽玛分布计算了第50个访
问者会在半小时内出现的概率
• 现在对于这一事件,我们也可以用泊松分布来
计算在半小时内出现至少50个访问者的概率
• 由题意可知l = 2×30 = 60,其概率值为:1Poisson(49, 60, 1) = 0.9156,结果与我们用伽玛
分布计算的完全一样!
• 因此在求解泊松过程的概率问题时,这两种分
布都可以使用,对于每一种分布,一定要找到
正确的参数大小
其他的连续型随机变量分布
• 正态分布、t分布、F分布
• 非常重要,将在后面专门介绍
作业
• 5.16
• 在高为 h 的△ABC 中任取一点M ,点 M 到
AB 的距离为随机变量X,求其密度函数 f (x)
和分布函数F(x) 。
– 需要用到概率的几何定义
E
C
F
.M
h
A
B