概率论与数理统计第10讲

Download Report

Transcript 概率论与数理统计第10讲

概率论与数理统计第10讲
本讲义可在网址http://math.shekou.com
或
ftp://math.shekou.com
下载
1
§2.5 随机变量函数的分布
2
一, 随机变量的函数
在讨论正态分布与标准正态分布的关系
时, 已知有结论: 若随机变量X~N(m,s2),
则随机变量
X m
Y
~ N (0,1).
s
这里, Y是随机变量X的函数, 对X的每一
个取值, Y有唯一确定的取值与之对应.
由于X是随机变量, 其取值事先不确定,
因而Y的取值也随之不确定, 即Y也是随
机变量.
3
定义1 如果存在一个函数g(X), 使得随机
变量X,Y满足:
Y=g(X),
则称随机变量Y是随机变量X的函数.
注: 在概率论中, 我们主要研究是随机变
量函数的随机性特征, 即由自变量X的统
计规律性出发研究因变量Y的统计性规律.
4
一般地, 对任意区间I, 令C={x|g(x)I}, 则
{YI}={g(X)I}={XC},
P{YI}=P{g(X)I}=P{XC}.
因此, 随机变量Y与X的函数关系确定, 为
我们从X的分布出发导出Y的分布提供了
可能.
例如, 设X是一随机变量, 且Y=X2, 则对于
任意x0, 有
P{Y  x}  P{ X 2  x}  P{ x  X  x },
P{Y  x}  P{ X 2  x}  P{ X   x }  P{ X  x }.
5
二, 离散型随机变量函数的分布
设离散型随机变量X的概率分布为
P{X=xi}=pi, i=1,2,
易见, X的函数Y=g(X)显然还是离散型随
机变量.
6
如何由X的概率分布出发导出Y的概率分
布? 其一般方法是先根据自变量X的可能
取值确定因变量Y的所有可能取值, 然后
对Y的每一个可能取值yi, i=1,2,, 确定相
应的
Ci={xj|g(xj)=yi},
于是
{Y=yi}={g(X)=yi}={XCi},
P{Y  yi }  P{ X  Ci }   P{ X  x j } (5.1)
x j Ci
从而求得Y的概率分布.
上述过程表明:Y的概率分布完全由X的概率分布所
确定.
7
例1 设随机变量X具有以下的分布律, 试
求Y=(X1)2的分布律.
X
1
0
1
2
pi
0.2
0.3
0.1
0.4
解 Y所有可能的取值0,1,4. 由
P{Y=0}=P{(X1)2=0}=P{X=1}=0.1,
P{Y=1}=P{X=0}+P{X=2}=0.7,
P{Y=4}=P{X1}=0.2
8
X
1
0
1
2
pi
0.2
0.3
0.1
0.4
解 Y所有可能的取值0,1,4. 由
P{Y=0}=P{(X1)2=0}=P{X=1}=0.1,
P{Y=1}=P{X=0}+P{X=2}=0.7,
P{Y=4}=P{X1}=0.2
即得Y的分布律为
Y
0
1
4
pi
0.1
0.7
0.2
9
三, 连续型随机变量函数的分布
一般地, 连续型随机变量的函数不一定是
连续型随机变量, 但我们主要讨论连续型
随机变量的函数还是连续型随机变量的
情形, 此时我们不仅希望求出随机变量函
数的分布函数, 而且还希望求出其概率密
度函数.
10
设已知X的分布函数FX(x)或概率密度函
数fX(x), 则随机变量的函数Y=g(X)的分布
函数可按如下方法求得:
FY(y)=P{Yy}=P{g(X)y}
=P{XCy}.
(5.2)
其中
Cy={x|g(x)y}.
而P{XCy}常常可以由X的分布函数FX(x)
来表达或用其概率密度函数fX(x)的积分
来表达:
FY ( y )  P{ X  C y }   f X ( x)d x (5.3)
Cy
进而可求出y的密度函数.
11
例 2 对一圆片直径进行测量, 其值在[5,6]
上均匀分布, 求圆片面积的概率分布密度.
解 设圆片直径的测量值为 X, 面积为 Y, 则
有Y 

4
X . 按已知条件, X 的分布密度为
2
1, x  [5,6],
f X ( x)  
其它
0,
对于函数 y 

4
x ,当 x[5,6]时
2
12
Y

4
X . X 的分布密度
2
对于函数 y 

4
1,
f X ( x)  
0,
x  [5,6],
其它
x ,当 x[5,6]时
2
 
 

25
  min x   ,
4
4
 2 36
  max x    9
4
4
2
13
Y

4
X . X 的分布密度
2
对于函数 y 

1,
f X ( x)  
0,
x  [5,6],
其它
x , 当 x[5,6] 时 , 最 小 值
2
4
=25/4, 最大值=9, 于是
0, y  25 / 4,

FY ( y )  *, 25 / 4  y  9 ,
1, y  9

14
当25/4<y<9时,
 X 2

FY ( y )  P{Y  y}  P 
 y
 4

y

4 
 f ( x )d x
 PX 

y   X
 

4

5
4

y
4
1d x 
fY ( y )  FY  ( y ) 

1
y
y  5.
,
15
故随机变量Y的分布密度函数为
 1
, 25 / 4  y  9 ,

fY ( y )    y
 0,
其它.

16
 x / 8, 0  x  4
例 3 设 X ~ f X ( x)  
, 求
其它
 0,
Y=2X+8 的概率密度.
解 设 Y 的分布函数为 FY(y),
FY ( y )  P{Y  y}  P{2 X  8  y}


y 8
y 8

P X 
 FX 

2
 2 
17
FY ( y )  P{Y  y}  P{2 X  8  y}


y 8
y 8

P X 
 FX 

2
 2 
于是Y的密度函数
d FY ( y )
y 8 1

fY ( y ) 
 fX 
 ,
dy
 2  2
注意到0<x<4时, 即8<y<16时,
y 8 y 8

fX 
0

 2  16
18
故
 y 8
, 8  y  16

fY ( y )   32
 0,
其它
19
例4 已知随机变量X的分布函数F(x)是严
格单调的连续函数, 证明Y=F(X)服从[0,1]
上的均匀分布.
证明 设Y的分布函数是G(y), 由于0Y1,
于是当y<0时, G(y)=0, 当y>1时, G(y)=1;
又由于X的分布函数F是严格递增的连续
函数, 其反函数F1存在且严格递增. 于是,
对0y1,
G(y)=P{Yy}=P{F(X)y}
=P{XF1(y)}=F(F1(y))=y.
20
即Y的分布函数是
0, y  0,

G ( y )   y, 0  y  1,
1, y  1

求导得Y的密度函数
1, 0  y  1
g ( y)  
其它
0,
可见, Y服从[0,1]上的均匀分布.
注: 本例结论在计算机模拟中有重要应用.
21
定理1 设随机变量X具有概率密度fX(x),
x(,+), 又设y=g(x)处处可导且恒有
g'(x)>0(或恒有g'(x)<0), 则Y=g(X)是一个
连续型随机变量, 其概率密度为
 f [h( y )] | h( y ) |,   y  
fY ( y )  
(5.4)
0,
其它

其中x=h(y)是y=g(x)的反函数, 且
=min(g(),g(+)), =max(g(),g(+)).
22
证明 只证g'(x)>0的情况. 此时g(x)在(,
+)严格单调增加, 它的反函数h(y)存在,
且在(,)严格增加, 可导. 分别记X,Y的分
布函数为FX(x), FY(y). 现在求Y的分布函
数FY(y).
因为Y=g(X)在(,)取值, 故
当y时,
FY(y)=P{Yy}=0;
当y时,
FY(y)=P{Yy}=1.
当<y<时. FY(y)=P{Yy}=P{g(X)y}
=P{Xh(y)}=FX[h(y)].
23
当y时,
FY(y)=P{Yy}=0;
当y时,
FY(y)=P{Yy}=1.
当<y<时. FY(y)=P{Yy}=P{g(X)y}
=P{Xh(y)}=FX[h(y)].
将FY(y)关于y求导数, 即得Y的概率密度
 f X [h( y )]h( y ),   y   ,
fY ( y )  
(5.5)
0,
其它.

24
将FY(y)关于y求导数, 即得Y的概率密度
 f X [h( y )]h( y ),   y   ,
fY ( y )  
(5.5)
0,
其它.

对于g'(x)<0的情况可以同样地证明, 此时
有
 f X [h( y )][h( y )],   y   ,
fY ( y )  
(5.6)
0,
其它.

合并(5.5)与(5.6)两式, 定理的结论得证.
25
 f [h( y )] | h( y ) |,   y  
fY ( y )  
(5.4)
0,
其它

若f(x)在有限区间[a,b]以外等于零, 则只
需假设在[a,b]上恒有g'(x)>0(或恒有
g'(x)<0), 此时
=min(g(a),g(b)), =max(g(a),g(b)).
这时公式(5.4)照样成立.
26
注 从前例题可见, 在求FY(y)=P{Yy}的过
程中, 关键是设法从{g(X)y}解出X, 从而
得到与{g(X)y}等价的X的不等式. 而利
用本定理, 在满足条件时可直接用它求出
随机变量函数的概率密度.
27
例5 设随机变量X~N(m,s2). 试证明X的线
性函数
Y=aX+b (a0)
也服从正态分布.
证 X的概率密度为

1
f X ( x) 
e
2s
( x  m )2
2s 2
,   x  .
由y=g(x)=ax+b解得
y b
1
x  h( y ) 
, 且有h( y ) 
a
a
28
由定理1得Y=aX+b的概率密度为
1
1
 y b  1
e
fX 
fY ( y ) 

| a |  a  | a | 2s

1

e

 y b
m



a



2s 2
[ y  ( b  a m )]2
2( as ) 2
,   y  .
| a | s 2
即有
Y=aX+b~N(am+b, (as)2).
如取a=1/s, bm/s, 则得
X m
Y
~ N (0,1).
s
29
2
例6 设随机变量X在(0,1)上服从均匀分布,
求 Y2ln X 的概率密度.
解 在区间(0,1)上, 函数ln x<0, 故
2
y  2ln x  0, y    0
x
于是y在区间(0,1)上单调下降, 有反函数
x=h(y)=ey/2, 由前述定理得
y/2

)
 y / 2 d (e
y/2
, 0e
1
 f X (e )
fY ( y )  
dy

0,
其它

30
y/2

)
 y / 2 d (e
y/2
, 0e
1
 f X (e )
fY ( y )  
dy

0,
其它

已知X在(0,1)上服从均匀分布
1, 0  x  1
f X ( x)  
其它
0,
代入上面fY(y)的表达式中, 得
1 y/2
 e , y0
fY ( y )   2
 0,
其它
31
1 y/2
 e , y0
fY ( y )   2
 0,
其它
即Y服从参数为1/2的指数分布.
32
 f [h( y )] | h( y ) |,   y  
fY ( y )  
(5.4)
0,
其它

注: 利用公式(5.4)直接写出Y=g(X)的概率
密度时, 要注意两点:
首先要检验y=g(x)是否是严格单调的, 如
果不是严格单调的, 不能直接使用公式
(5.4).
在公式中h'(y)是要取绝对值的, 否则会出
现fY(y)取值小于0.
33
例7 设随机变量X服从参数为l的指数分
布, 求
Y=min(X,2)
的分布函数.
解 由已知, X的分布函数
 x
1  e , x  0
FX ( x)  
x  0.
 0,
Y的分布函数
FY(y)=P{Yy}=P{min{X,2}y}=
1P{min{X,2}>y}=1P{X>y,2>y}.
34
FY(y)=P{Yy}=P{min{X,2}y}=
1P{min{X,2}>y}=1P{X>y,2>y}.
 x
1  e , x  0
FX ( x)  
x  0.
 0,
当Y<2时, FY(y)=1P{X>y}=P{Xy}=FX(y)
当Y2时, P{X>y,2>y}=0, 于是FY(y)=1
代入X的分布函数中可得
y  0;
0,

 y
FY ( y )  1  e , 0  y  2;
1,
y  2.

35
y  0;
0,

 y
FY ( y )  1  e , 0  y  2;
1,
y  2.

注: 在本例中, 虽然X是连续型随机变量,
但Y不是连续型随机变量, 也不是离散型
随机变量. Y的分布函数在y=2处间断.
36
例8 (对数正态分布)随机变量X称为服从
参数为m,s2的对数正态分布, 如果Y=lnX
服从正态分布N(m,s2), 试求对数正态分布
的密度函数.
解 由于Y=lnX~N(m,s2), 等价地有
X=eY, Y~N(m,s2),
于是, 当x>0时,
FX(x)=P{Xx}=P{eYx}
=P{Yln x}=F(ln x);
当x0时, 显然FX(x)=0. 继而可得
37
X=eY, Y~N(m,s2),
于是, 当x>0时,
FX(x)=P{Xx}=P{eYx}
=P{Yln x}=F(ln x);
当x0时, 显然FX(x)=0. 继而可得
1
  (ln x), x  0
f X ( x)  FX ( x)   x

0,
x0
 1

e

  2s x

0,

(ln x  m ) 2
2s 2
, x0
x0
38
注: 在实际中, 通常用对数正态分布来描
述价格的分布, 特别是在金融市场的理论
研究中, 如著名的期权定价公式(BlackScholes公式), 以及许多实证研究都用对
数正态分布来描述金融资产的价格. 设某
种资产当前价格为P0, 考虑单期投资问题,
到期资产的价格为一个随机变量, 记作P1,
设投资于该资产的连续复合收益率为r,
则有
P1=P0er
39
设某种资产当前价格为P0, 考虑单期投资
问题, 到期资产的价格为一个随机变量,
记作P1, 设投资于该资产的连续复合收益
率为r, 则有
P1=P0er
从而
P1
r  ln  ln P1  ln P0
P0
注意到P0为当前价格, 是已知常数, 因而
假设价格P1服从对数正态分布实际上等
价于假设连续复合收益率r服从正态分布.
40
课堂练习
1. 设X的分布率为
X
1
pi
1/5 1/10 1/10 3/10 3/10
0
1
2
5/2
试求:(1)2X的分布率; (2)X2的分布率.
2. 设随机变量X的概率密度为
 2x
 2 , 0 x 
f ( x)   
 0,
其它
求Y=sinX的概率密度.
41
作业 第74页开始 习题2-5
第1题, 第3题, 第5题
42