Transcript 下载2

第二章 随机变量及其分布
关键词:
随机变量
概率分布函数
离散型随机变量
连续型随机变量
随机变量的函数
1
§1
随机变量
常见的两类试验结果:
示数的——降雨量;
候车人数;
发生交通事故的次数…
示性的——明天天气(晴,云…);
化验结果(阳性,阴性)…
中心问题:将试验结果数量化
s
e
x
X=X(e)--为S上的
单值函数,X为实数
3
定 义 : 设 随 机 试 验 的 样 本 空 间 为 S  e , 若
X  X (e) 为定义在样本空间 S 上的实值单值函数,
则称 X  X (e) 为随机变量。

一般采用大写英文字母 X , Y , Z 来表示随机变量

引入随机变量的目的是用来描述随机现象
4
一 般 的 , 若 I 是 一 个 实 数 集 合 , { X  I }记
则{X  I }为事件{e : X (e)  I }
离散型的
常见的两类随机变量
连续型的
例:掷硬币3次,出现正面的次数记为X.
样本点
TTT TTH THT HTT HHT HTH THH HHH
X的值
0
1
1
1
2
2
2
3
P{X  0}  P{TTT }  1 / 8
P{X  1}  P{TTH , THT , HTT }  3 / 8
P{X  1}  P{ X  0}  P{X  1}  1 / 2
X
0
1
2
3
p
1/8
3/8
3/8
1/8
6
§2
离散型随机变量及其分布
定义:取值至多可数的随机变量为离散
型的随机变量。概率分布(分布律)为
X
pk
x1
p1
x2
p2
…
…
xi
pi
…
…

pi  0,  pi  1
i 1
7
概率分布
写出所有可能取值

写出取每个可能取值相应的概率
例:某人骑自行车从学校到火车站,
一路上要经过3个独立的交通灯,设各
灯工作独立,且设各灯为红灯的概率
为p,0<p<1,以X表示首次停车时所通
过的交通灯数,求X的概率分布律。
解:设Ai={第i个灯为红灯},则P(Ai)=p,
i=1,2,3 且A1,A2,A3相互独立。
P( X  0)  P( A1 )  p ;
P( X  1)  P( A1 A2 )  (1  p) p ;
P( X  2)  P( A1 A2 A 3 )  (1  p) p ;
2
P( X  3)  P( A1 A2 A 3 )  (1  p) ;
3
10
X
p
0
p
1
3
2
2
p(1-p) (1-p) p (1-p)
3
11
例:若随机变量X的概率分布律为
c
P( X  k ) 
,k  0,1, 2, ,   0
k!
k
求常数c.
12
解:

1   P{ X  k }
k 0

 c
k 0 k !

k
 ce
 ce


几个重要的离散型随机变量
一、0-1分布
若X的分布律为:
X
p
0
q
1
p
随机变量只可能
取0、1 两个值
(p+q=1,p>0,q>0)
则称X服从参数为p的0-1分布,或两点分布.
记为
X ~ 0 1( p) 或 B(1, p)
它的分布律还可以写为
1k
P( X  k )  p (1  p) , k  0,1.
k
15
对于一个随机试验,如果它的样本空间只
包含两个元素,即 S  {e1 , e2 } ,我们总能
在S上定义一个服从(0-1)分布的随机
变量。
0, 当e  e1 ,
X  X (e)  
1, 当e  e2 .
来描述这个随机试验的结果。
检查产品的质量是否合格,对新生婴儿
的性别进行登记,检验种子是否发芽以
及前面多次讨论过的“抛硬币”试验都
可以用(0-1)分布的随机变量来描述 。
17
一个随机试验,设A是一随机事件,且
P(A)=p,(0<p<1).若仅考虑事件A发生与否,
定义一个服从参数为p的0-1分布的随机变
量:
1, 若 A发生 ,
X 
 0, 若 A不发生(即A发生).
来描述这个随机试验的结果。只有两个
可能结果的试验,称为Bernoulli试验。
二、二项分布
n重贝努利试验:设试验E只有两个可能的
结果: A与A ,p(A)=p,0<p<1,将E独立地重
复进行n次,则称这一串重复的独立试验为
n重贝努利试验。
在相同条件下
重复进行
即每次试验结果
互不影响
19

独立重复地抛n次硬币,每次只有两个可能的
结果:正面,反面,
P 出现正面  1 2

将一颗骰子抛n次,设A={得到1点},则每次
试验只有两个结果:A, A,
P  A  1 6
从52张牌中有放回地取n次,设A={取到红
牌},则每次只有两个结果: A, A,
P  A  1 2
如果是不放回抽样呢?
21
设A在n重贝努利试验中发生X次,则
n k
P( X  k )  C p (1  p) ,k  01
,
,
,n
k
n
k
并称X服从参数为p的二项分布,记
X ~ B(n,p)
n
注:1  ( p  q)n   Cnk p k q n k 其中q  1  p
k 0
22
推导:以n=3为例,设Ai={ 第i次A发生 }
P( X  0)  P( A1 A 2 A3 )  (1  p)
3
P( X  1)  P( A1 A 2 A3
A1 A 2 A3
P( X  2)  P( A1 A 2 A3
A1 A 2 A3
P( X  3)  P( A1 A 2 A3 )  p
A1 A 2 A3 )  C31 p1 (1  p)31
A1 A 2 A3 )  C32 p 2 (1  p)32
3
一般 P( X  k )  Cnk pk (1  p)nk , k  0,1,2,
,n
例:有一大批产品,其验收方案如下:
先作第一次检验,从中任取10件,经检
验无次品接受这批产品,次品数大于2
拒收;否则作第二次检验,从中任取5
件,仅当5件中无次品便接受这批产品,
设产品的次品率为p.求这批产品能被
接受的概率.
解:设A={接受该批产品}。 设X为第一次抽得
的次品数,Y为第2次抽得的次品数.
则X~B(10,p),Y~B(5,p),且{X=i}与{Y=j}独立。
P ( A)  P( X  0)  P(1  X  2且Y=0)
 P( X  0)  P(1  X  2)  P(Y  0)
 P( X  0)  ( P( X  1)  P( X  2))  P(Y  0)
 (1  p)10  [10 p(1  p)9  45 p2 (1  p)8 ]  (1  p)5
25
例:设随机变量 X ~ B(100, 0.05),
求P( X  10)和P( X  10)
10
10
解:P( X  10)   P( X  k )   C 0.05 0.95
k 0
10
k
100
k 0
10
k
X  10)   P( X  k )   C 0.05 0.95
k 0
k 0
k
100
k
100  k
26
使用Excel表单:在Excel表单的任一单元格输入“ =”
 在主菜单中点击“ 插入” “ 函数( F )”
 在选择类别的下拉式菜单中选择“ 统计”
 选择“ BINOMDIST” 点击“ 确定”
 在函数参数表单中输入
“ Number _ s  10, Trials  100, Probability _ s  0.05, Cumulative  TRUE”
点击“ 确定”  即在单元格中出现"0.98852759"。
计算P( X  10),只要将上述步骤中“ Cumulative  TRUE”
改为“ Cumulative  FALSE”  即出现 "0.016715884"。
泊松分布(Poisson分布)
若随机变量X的概率分布律为
P( X  k ) 
 e
k

k!
,k  0,1, 2, ,   0
称X服从参数为λ的泊松分布,记
X ~  ( )
例:设某汽车停靠站单位时间内候车人数
X ~  (4.8),
求(1)随机观察1个单位时间,至少有3人候车
的概率;
(2)随机独立观察5个单位时间,恰有4个单
位时间至少有3人候车的概率。
29
解:
1 P( X  3)  1 P( X  0)  P( X  1)  P( X  2)
 2
2
4.8
 1  e 4.8 (1  4.8 
)  0.8580
2!
设5个单位时间内有Y 个单位时间是
“ 至少有3人候车” ,
则Y ~ B(5, p), 其中p  P( X  3)  0.8580,
于是
P(Y  4)  C p (1  p)  0.7696.
4
5
4
30
二项分布与泊松分布有以下近似公式:
当n  10, p  0.1时,
k
Cn
p 1  p 
k
nk

 e  , 其中  np
k!
k
事实上, C nk
p 1  p 
k
nk

  1  n 
n!

k !( n  k )! n
k
 
n ( n  1)...( n  k  1) 



1


n
k!
nk

k
n 



nk

 
1 
n
k
 k
e


k!

n ( n  1)...( n  k  1)

因为当 n充分大和适当的 时,

1
,
1

n
nk
 
n ( n  1)...( n  k  1)

的 时,

1
,
1

n
nk
k
 

 1, 1  
n

n 




 e
32
例:某地区一个月内每200个成年人中有1
个会患上某种疾病,设各人是否患病相互独
立。若该地区一社区有1000个成年人,求某
月内该社区至少有3人患病的概率。
33
解:设该社区1000人中有X 个人患病,则 X
P
(
X

3)

1

P
(
X

0)

P
(
X

1)

P
(
X

2
人患病,则 X ~ B(1000, p), 其中p  1/ 200
X 解:设该社区
1)  P( X 1000
2)人中有
 0.8760
X 个人患病,则 X ~ B(1000, p), 其中
P( X  3)  1  P( X  0)  P( X  1)  P( X  2)  0.8760
利用泊松分布进行近似计算,取  5,
5
5
2
5
e
5e
5e
P( X  3)  1 


 0.8753
0!
1!
2!
注:泊松分布也可以使用Excel表单:在Excel表单的任一单元格输入“ =”
 在主菜单中点击“ 插入” “ 函数( F )”
 在选择类别的下拉式菜单中选择“ 统计”
 选择“ POISSON” 点击“ 确定”
 在函数参数表单中输入“ X  2, Mean  5, Cumulative  TRUE”
点击“ 确定”  即在单元格中出现"0.124652019"。
P( X  3)  1  P( X  2)  0.875347981
35
超几何分布
若随机变量X的概率分布律为
k
a
nk
b
n
N
CC
P( X  k ) 
C
, k  l1 , l1  1,..., l2 ,
其中,l1  max(0, n  b), l2  min(a, n).
称X服从超几何分布
例:一袋中有a个白球,b个红球,a+b=N,
从中不放回地取n个球,设每次取到各球的
概率相等,以X表示取到的白球数,则X服从
超几何分布。
37
几何分布
若随机变量X的概率分布律为
k 1
P( X  k )  p(1  p) , k  1, 2,3,..., 0  p  1.
称X服从参数p的几何分布
例:从生产线上随机抽产品进行检测,设
产品的次品率为p,0<p<1,若查到一只次
品就得停机检修,设停机时已检测到X只产
品,则X服从参数p的几何分布。
39
巴斯卡分布
若随机变量X的概率分布律为
P ( X  k )  Ckr11 p r (1  p ) k  r , k  r , r  1, r  2,...,
其中r为正整数,0  p  1.
称X服从参数为(r,p)的巴斯卡分布.
例:独立重复地进行试验,每次试验的结果
为成功或失败,每次试验中成功的概率均为p,
0<p<1,试验进行到出现r次成功为止,以X表示
试验次数,则X服从参数为(r,p)的巴斯卡分布。
41
思考题:一盒中有2个红球4个白球,
(1)从中取一球,X表示取到的红球数;
(2)采用不放回抽样取3球,Y表示取到的
红球数;
(3)采用放回抽样取3球,Z表示取到的红
球数;
(4)采用放回抽样取球,直到取到红球为
止,U表示取球次数;
(5)采用放回抽样取球,直到取到3个红球
为止,V表示取球次数。
上述随机变量X,Y,Z,U,V的分布律是什么呢?
42
解答:(1)X服从0-1分布,P(X=1)=1/3,P(X=0)=2/3;
(2)Y服从超几何分布,
C2k C43k
P(Y  k ) 
, k  0,1, 2;
3
C6
(3)Z服从二项分布B(3, 1/3),
3 k
2
P( Z  k )  C3k 3 , k  0,1, 2,3;
3
(4)U服从几何分布,
2k 1
P(U  k )  k , k  1, 2,3,...
3
(5)V服从巴斯卡分布,
P(V  k )  C
2
k 1
2 k 3
, k  3, 4,5,...
k
3
43
§3 随机变量的分布函数
随机变量X , 对实变量x, P( X  x) 应为x的函数
定义:随机变量X , 对任意实数x, 称函数
F ( x)  P( X  x) 为 X 的概率分布函数,简称分布函数。
F ( x)的几何意义:
任何随机变量
都有相应的分
布函数
X
x
F ( x)的性质:
1) 0  F ( x)  1
2) F ( x)单调不减,且F ()  0,F ()  1
0  P( x1  X  x2 )  F ( x2 )  F ( x1 )
3) F ( x)右连续,即F ( x  0)  F ( x).
4) F ( x)  F ( x  0)  P( X  x)
45
X
例:
p
0
q
1
p
p>0,q>0,q+p=1.
求X的概率分布函数F  x 。
0

F ( x)  P  X  x  q
1

解:
x0
0  x 1
x 1
F  x
1
q
0
1
x
47
一 般 地 , 设 离 散 型 随 机 变 量 X的 分 布 律 为
P X  x k   p k ,
k  1,
2,

由 概 率 的 可 列 可 加 性 得 X的 分 布 函 数 为
F ( x) 
p
xk  x
k
分布函数 F ( x )在 x  x k , k  1,2, 处有跳跃,
其跳跃值为 p k  P{ X  x k }
例:设随机变量X 的分布函数如下,求X 的分布律。
 0,
0.2,

F ( x)  
 0.6,

F (x)  1,
x  1,
1  x  3,
3  x  4,
x  4.
1
0 .6
0 .2
1
0
3
4
x
49
F (x)
1
0 .6
0 .2
1
0
3
4
x
解:F (x)只在  1,3,4有跳,跳的幅度分别是
0.2,0.4,0.4. 分布律为
X
1
3
4
pk
0 .2
0 .4
0 .4
50
例:设一物体在A,B两点间移动,A,B之间距
离3个单位。该物体落在A,B间任一子区间的
概率与区间长度成正比。设它离A点的距离
为X ,求X的分布函数。
51
解:根据题意,P(0  X  3)  1,
1
P(0  X  3)  3k  1,  k 
3
当x  0时, F ( x)  P( X  x)  0,
当x  3时, F ( x)  P( X  x)  1,
当0  x  3时, F ( x)  P( X  x)
x
 P( X  0)  P(0  X  x)  .
3
X 的分布函数为
0,
 x

F ( x)  P( X  x)  
 3
 1
F (x)
x0
0 x3
x3
1
0
3
x
与离散型随机变量的分布函数不同
§4 连续型随机变量及其概率密度
定义:对于随机变量X的分布函数 F ( x), 若存
在非负的函数 f ( x),使对于任意实数 x,有:
x
F ( x)   f (t )dt

则称X为连续型随机变量,
其中f ( x)称为X的概率密度函数,简称概率密度。
f ( x)的性质:
面积为1
y  f ( x)
1) f ( x)  0
2)

+

f ( x)dx  1
Px1  X  x2
3) 对于任意的实数x1,x2 ( x2  x1 )
P x1  X  x2  

x2
x1
f (t ) dt  P( X  a)  0
x1 x2
f ( x)的性质:
4) 在f ( x)连续点x,F '( x)  f ( x)
即在f ( x)的连续点
F ( x  x)  F ( x)
P( x  X  x  x)
f ( x)  F '( x)  lim
 lim
x 0
x 0
x
x
与物理学中的质量线密度的定义相类似
P( x  X  x  x)  f ( x)  x
这表示X 落在点 x 附近(x, x  x]的概率近似等于f ( x)x
56
思考题:
设A,B为随机事件,
若P ( A)  1,则A为必然事件吗?
若P ( B )  0,则B为不可能事件吗?
若P ( AB)  0,则A与B不相容吗?
答:都不一定。
57
0  x 1
c

f ( x)  2 9 3  x  6
例:设X的概率密度为
0
其他

(1)求常数c的值;
(2) 写出X的概率分布函数;
2
(3)要使 P( X  k )  ,
求k的值。
3
解:
1
1 


f (t )dt
2 6
1
2
 c  dt   dt   c  c 
0
9 3
3
3
1
 2
F ( x)  P  X  x  
 0
 x1
 0 3 dt

 11
   dt
0 3
 11
x 2
  dt   dt
3 9
 03

 1
x0
0  x 1
1 x  3
3 x 6
x6
x

f (t )dt
x0
0
x 3
0  x 1


 1 3
1 x  3
(2 x  3) / 9 3  x  6

x6

1
59
 3
2
使 P( X  k )   F (k )  k  4.5
3
60
几个重要的连续量
均匀分布定义:X具有概率密度
 1
x  ( a, b)

f ( x)   b  a

其他
0
称X在区间(a,b)上服从均匀分布,记为X~U(a,b)
f  x
1
ba
0
a
b
x
设 a  c  cl  b
 P (c  X  c  l )  
c l
c
1
l
dt 
- - - - 与c无关
ba
ba
xa
0
xa

F ( x)  
a xb
b  a
xb
1
F  x
1
0
a
b
x
62
例:(1)在区间(-1,2)上随机取一数X,试写
出X的概率密度。并求 P( X  0)的值;
(2)若在该区间上随机取10个数,求10个数
中恰有两个数大于0的概率。
解:(1) X为在区间(-1,2)上均匀分布
1
 , 1  x  2
 f ( x)   3

0, 其他
2
P ( X  0)  ,
3
(2)设10个数中有Y个数大于0, 则:
2
8
2
Y ~ B (10, )  P(Y  2)  C102  2   1 
3
 3   3
64
例:杭州某长途汽车站每天从早上6点(第一班
车)开始,每隔30分钟有一班车开往上海。王
先生在早上6:20过X分钟到达车站,设X服从
(0,50)上的均匀分布,
(1)求王先生候车时间不超过15分钟的概率;
(2)如果王先生一月中有两次按此方式独立地
去候车,求他一次候车不超过15分钟,另一次
候车大于10分钟的概率。
解: (1)P(候车时间不超过15钟)=25/50=0.5
(2) P(候车时间大于10分钟)=30/50=3/5
P(一次候车时间不超过15分钟,另一次大于10分钟)
 P(( X1  15, X 2  10)  ( X1  10, X 2  15))
 P( X1  15, X 2  10)  P( X1  10, X 2  15)  P(10  X1  15,10  X 2  15)
 0.5  3 / 5  3 / 5  0.5  0.1 0.1  0.59
6:30
6:20 6:30
6:50
6:45
7:00 7:10
66
指数分布
e x x  0
定义:设X的概率密度为 f ( x)  
x0
0
其中λ>0为常数,则称X服从参数为λ的指数
分布。记为
X ~ Exp( )或X ~ E ( )
1  e
F ( x)  
0
 x
x0
x0
X具有如下的无记忆性:t0  0, t  0, P( X  t0 
P ( X  t0  t )
t  0, P( X  t0  t | X  t0 ) 
P ( X  t0 )
1  F (t 0 t )
 t

e
 P( X  t )
1  F (t 0 )
68
例:某大型设备在任何长度为t 的区间内
发生故障的次数N t  服从参数为λt
的Poi sson分布,记设备无故障运行的时间为T.
1 求T的概率分布函数;
 2 已知设备无故障运行10个小时,
求再无故障运行8个小时的概率。
解:1 P  N  t   k   e
 t
 t 
k
/ k !, k  0,1, 2,
FT t   PT  t  1 PT  t
当t  0 时,FT t   0
当t  0 时,FT t   1 PN t   0  1 e
t
P T  18 8
 e  P T  8
 2 P T  18 | T  10 
P T  10
70
正态分布
定义:设X的概率密度为

1
f ( x) 
e
2
( x   )2
2 2
,    x  
其中     ,   0 为常数,称X服从
参数为  ,  的正态分布(Gauss分布),
记为 X ~ N ( ,  2 )
71

可以验证:

+



f ( x)dx  1
令t 
x

f ( x)dx 






2
t
2
1 e  dt
2
t2

2
1
e dt
2
t2
 
2

记 I   e dt
 I   e
2
( x 2  y2 )

2
2

0
0
  d  re



dxdy
r2

2
dr  I  2
f ( x)dx  1
73
X ~ N ( , ):
2

1
f ( x) 
e
2
( x   )2
2 2
,    x  
1 f ( x)关于x   对称
1
2 f max  f (  ) 
2
3 lim f ( x)  0
x   
正态概率密度函数

1
f ( x) 
e
2
( x   )2
2 2
,    x  
当固定 σ , 改变 μ 的大小时,
f ( x) 图形的形状不变, 只是沿
着 x 轴作平移变换;
当固定 μ, 改变 σ 的大小时, f ( x) 图形的对称轴
不变, 而形状在改变, σ 越小,图形越高越瘦, σ 越大,
图形越矮越胖.
X ~ N (  , )
2
称μ为位置参数(决定对称轴位置)
σ为尺度参数(决定曲线分散性)
f  x
0
 5

 5
1
x
X的取值呈中间多,两头少,对称的特性。
当固定μ时,σ越大,曲线的峰越低,落
在μ附近的概率越小,取值就越分散,即
σ是反映X的取值分散性的一个指标。
在自然现象和社会现象中,大量随机变量
服从或近似服从正态分布。
正态分布下的概率计算
x
1
P { X  x } F ( x ) 
e

2σ 
?
( t  μ )2

2σ 2
dt
若 Z ~ N (0,1),称Z 服从标准正态分布
x2

2
1
Z的概率密度:  x  
e
2
t2
x
1 2
Z的分布函数:( x)  
e dt

2
y
 ( x)
y   ( x)
  x    x  1
( x)
x
0
x
当 X ~ N ( ,  2 ) 时
P ( X  b)  
1 
e
2
b

x
(作变换:
 t)


b


 P ( X  b)   (
b

( x   )2
2 2
dx
t2

2
1
e dt
2
)
事实上,当X N (  ,  ),
X


2
~ N (0, 1)
当 X ~ N ( , ) 时
2

例:X ~ N ( ,  )
2
P( X     )  P(     X     )
 P(
(   )  


X 


(   )  

 (1)  (1)  2(1)  1  0.6826
P( X    2 )  2(2) 1  0.9544
P( X    3 )  2(3) 1  0.9974
  3   2
 
 
68.26%
95.44%
99.74%
  2   3
)
例:用天平称一实际重量为 a 的物体,天平的
读数为随机变量 X ,设 X ~ N (a, 0.012 ) 时,
(1)求读数与 a 的误差小于0.005的概率;
(2)求读数至少比 a 多0.0085的概率。
解:
( 1) P( X  a  0.005)
0.005
0.005
 (
)  (
)
0.01
0.01
 2(0.5)  1
查附表
=== 2  0.6915  1  0.3830
( 2) P( X  a  0.0085)  1  (0.85)  1  0.8
(0.85)  1  0.8023  0.1977.
85
注:计算P( X  a  0.0085)使用Excel表单:
在Excel表单的任一单元格输入“ =”
 在主菜单中点击“ 插入” “ 函数( F )”
 在选择类别的下拉式菜单中选择“ 统计”
 选择“ NORMDIST” 点击“ 确定”
 在函数参数表单中输入
“ X  0.0085, Mean  0, Standard _ dev  0.01, Cumulative  TRUE”
点击“ 确定”  即在单元格中出现"0.802337508"。
86
例:一批钢材(线材)长度 X (cm) ~ N (,  2 )
(1)若μ=100,σ=2,求这批钢材长度小于
97.8cm的概率;
(2)若μ=100,要使这批钢材的长度至少 有
90%落在区间(97,103)内,问σ至多取何值?
解:
( 1) P( X  97.8)
97.8  100
 (
)
2
X  100 97.8  100
 P(

)
2
2
 1  (1.1)
查附表
=== 1  0.8643  0.1357
( 2) 需:P97  X  103  90%
103  100
97  100
3
即 (
)  (
)  2( )  1  90%


3
3


  ( )  0.95 

 1.645    1.8237
88
例:设一天中经过一高速公路某一入口的重型
车辆数X近似服从 N (,  2 ) ,已知有25%的天
数超过400辆,有33%的天数不到350辆,求
,  .
解:已知 P( X  400)  0.25, P( X  350)  0.33
而 P( X  400)  1   (
P( X  350)  (
400  
350  


  400
)  (
),  (0.675)  0.25,

), (0.440)  0.33,
   400
 0.675
 
   369.7
于是 

   44.8
 350    0.440
 
90
例:一银行服务需要等待,设等待时间X(分
钟)的概率密度为
 1 10x
 e , x0
f ( x)  10
 0,
x0

某人进了银行,且打算过会儿去办另一件事,于是先
等待,如果超过15分钟还没有等到服务就离开,设他
实际的等待时间为Y,(1)求Y的分布函数;(2)问Y是离
散型随机变量吗?连续型随机变量吗?
91
y0
 0,

y

解:( 1) F ( y )  P(Y  y )  1  e 10 , 0  y  15
 1,
y  15

( 2) Y的取值范围为[0,15],故不是离散量;
又P{Y  15}  e
1.5
 0,因此Y 也不是连续量。
§5 随机变量函数的分布
例如,若要测量一个圆的面积,总是测量其
半径,半径的测量值可看作随机变量X,若
X ~ N (,  ),则Y服从什么分布?
2
问题:已知随机变量X的概率分布,
且已知Y=g(X),求Y的概率分布。
-1
0
1
X
例:已知X具有概率分布 p
i 0.2 0.5 0.3
且设Y=X2,求Y的概率分布。
解:Y的所有可能取值为0,1
P(Y  0)  P( X  0)  0.5
P(Y  1)  P( X  1) ( X  1)
 P( X  1)  P( X  1)  0.5
即找出(Y=0)的等价事件(X=0);
(Y=1)的等价事件(X=1)与(X=-1)的和事件
95
例:设随机变量X具有概率密度
x
 , 0 x4
f X ( x)   8
0, 其他
求 Y = X 2 的概率密度。
FY ( y)
解:分记X,Y的分布函数为 FX ( x),
FY ( y )  P Y  y  P  X  y
2
当 y  0时,F Y ( y)  0;
当 y  16时,FY ( y)  1
97
当 0  y  16 时,

 
FY ( y)  P 0  X  y 
y
0
t
y
dt 
8
16
1
 , 0  y  16
 fY ( y )  16

其他
0,
Y在区间(0,16)上均匀分布。
98
一般,若已知X的概率分布,Y=g(X),求Y的
概率分布的过程为:
1. 若Y 为离散量,则先写出Y的可能取值:
y1 , y2 ,
yj,
, 再找出Y  y j 的等价
事件( X  D), 得P(Y  yi )  P( X  D);
2. 若Y 为连续量,则先写出Y的概率分布函数:
FY ( y )  P(Y  y ),找出Y  y 的等价事件( X  D),
得FY ( y )  P( X  D);再求出Y的概率密度函数fY ( y );
关键是找出等价事件。
X
例:设
-1
0
1
1
1
1
3
3
3
Y=2X,Z=X2,求Y,Z的概率分布。
解:Y的可能取值为-2,0,2
Z的可能取值为0,1
(Y=-2)的等价事件为(X=-1)…
(Z=1)的等价事件为(X=1)∪(X=-1)
故得:
Z
p
0
1
Y
1
3
2
3
p
-2
0
2
1
1
1
3
3
3
101
例:
设随机变量X具有概率密度为
fX(x),-∞ < x < +∞,
2
分别求Y = X , Z = X 的
概率密度fY(y),fZ(z)。
解 : 分 别 记 X , Y , Z 的 分 布 函 数 为 F X ( x ), FY ( y ), FZ ( z ).
当 y  0 时, FY ( y )  0. 当 y  0 时,
FY ( y )  P{Y  y}  P{ X  y}  FX ( y )  FX (  y ).
 f X ( y )  f X (  y ),
fY ( y )  
0,

y0
(1)
y0
103
同理,当 z  0 时 , FZ ( z )  0. 当 z  0 时 ,
FZ ( z )  P{Z  z}  P{ X  z}
2
 P{ z  X  z }  FX ( z )  FX (  z )
 1
[ f X ( z )  f X (  z )], z  0

fZ ( z)   2 z
(2)
0
, z  0.

例如:X~U(-1, 2),求
Y  X 的概率密度fY ( y).
1/ 3, 1  x  2
解: X 的概率密度为 f X ( x )  
其它
 0,
由(1)得Y  X 的概率密度为
 f X ( y )  f X (  y ),
fY ( y )  
0,

y0
y0
1 1
2
3  3 , 0  y  1
 3 , 0  y 1


1
1
   0, 1  y  2   , 1  y  2
3
3
其它
其它
 0,
0,




106
例如:X~N(0, 1),求
Z  X 的概率密度f Z ( z).
2
107
解: X 的概率密度为 f X ( x ) 
1
e
2
x2

2
,   x   ,
由 (2) 得 Z  X 的 概 率 密 度 为
2
 1
[ f X ( z )  f X (  z )], z  0

fZ ( z)   2 z
0
, z  0.

 1  12  2z
z e , z0

  2
0
, z  0.

此 时 称 Z 服 从 自 由 度 为 1 的  2分 布 。
定理:设X ~ f X ( x),    x  ,g '( x)  0 (或g '( x)  0)。
Y  g ( X ),则Y 具有概率密度为:

 f X (h( y ))  h '( y ) ,   y  
f Y ( y)  
0,
其他


这里
( , )是
g的反函数
其中
 Yg的取值范围,
(),   gh(是

),
{当g '( x)  0时  g (
h( y)  x  y  g ( x)
y
y=g(x)
y
h(y),y
0
x
证明:不妨设g '( x)  0, 则g  x 为单调增函数,
且:h '( y)  0
,当
y   y时,
;当
1;
显然,当
  F时,
F)Y (y)0
0;当y y 时,
时,FFYY((yy) ) 
1;
Y (y
当   y   时,
FY ( y)  P(Y  y)  P( g ( X )  y)
 P( X  h( y))  FX (h( y))
 fY ( y)  f X (h( y))h '( y)  f X (h( y))  h '( y)
同理可证:当g '( x)  0 时,定理为真
110
例:设X ~ N (, ),Y  aX  b(a  0),求Y的概
2
(a  0),求Y的概率密度fY ( y).
111
解: y  g ( x)  ax  b,g '( x)  a  0,
y b
x  h( y ) 
a
1
y b
fY ( y ) 
fX (
)
a
a y b
1

a

1
exp{
2
1
2 a 

e
(
  )2
a
2 2
}
[ y  ( a   b )]2
2 a 2 2
 Y ~ N (a  b, a2 2 )
2
一般若X ~ N ( ,  ),Y  aX  b 
2
),Y  aX  b  Y ~ N (a  b, a  )
2
2
113
例
设 随 机 变 量 X 在 (  / 2 ,  / 2 )内 服 从 均 匀 分 布
Y  sin X , 试 求 随 机 变 量 Y 的 概 率 密 度 。
解:
Y  sin X 对 应 的 函 数 y  g ( x )  sin x 在 (  / 2 ,  / 2 )
上 恒 有 g ' ( x )  cos x  0 , 且 有 反 函 数
x  h ( y )  arcsin y , h ' ( y )  1 / 1  y
2
X的 概 率 密 度 为
f X (x ) 


1
 , - x

2
2
 0 , 其它
115
由 定 理 得 Y  sin X 的 概 率 密 度 为
fY ( y) 
1
1
, -1  y  1
 
2


1 y

0 , 其它

116
例 : V  sin  , 服从U (0,  ),求fV (v).
解:V  sin  在(0,)不单调,所以不能应用定理。
对0  v  1,
2 arcsin v
FV (v)  P(V  v)  P{sin   v) 

sin 
v

arcsin v
  arcsin v

117
所以V的概率密度为:
2

,

2

1

v

fV (v)  
0,


0<v <1,
其他.
118
例:设X 服从参数为的指数分布,F  x  为X 的分布函数。
1 求F  x ;
 2  设Y  F  X  , 试证Y ~ U  0,1 即均匀分布。
119
 e   x , x  0
解:
1 由前知, X ~ f  x   
 0 ,x0
1  e  x , x  0
 F  x  
,x0
 0
(2)当x  0, y  F ( x)严格单调递增,y的取值范围为
1
1
(0,1), 此时x  F ( y )   ln(1  y )

 X  0, Y的取值范围为 (0,1).
当0  y  1时,FY  y   P 1  e
 X
 y
FY ( y)  P(Y  y)  P( F ( X )  y)
 P( X  F 1 ( y))  F ( F 1 ( y))
y
y0
0,

即 FY  y    y, 0  y  1 ,  Y  U  0,1 .
1,
y 1

121
课件待续!