概率论与数理统计第13讲

Download Report

Transcript 概率论与数理统计第13讲

概率论与数理统计第13讲
本讲义可在网址http://math.shekou.com
或
ftp://math.shekou.com
下载
1
§3.3 随机向量函数的分布
2
在实际应用中, 有些随机变量往往是两个
或两个以上随机变量的函数. 例如, 考虑
全国年龄在40岁以上的人群, 用X和Y分
别表示一个人的年龄和体重, Z表示这个
人的血压, 并且已知Z与X,Y的函数关系式
Z=g(X,Y)
现希望通过(X,Y)的分布来确定Z的分布.
此类问题就是我们要讨论的两个随机变
量函数的分布问题.
3
一, 离散型随机变量函数的分布
设(X,Y)是二维离散型随机变量, g(x,y)是
一个二元函数, 则g(X,Y)作为X,Y的函数是
一个随机变量, 如果(X,Y)的概率分布为
P{X=xi, Y=yj}=pij (i,j=1,2,)
设Z=g(X,Y)的所有可能取值为zk, k=1,2,,
则Z的概率分布为
P{ Z  z }  P{ g ( X , Y )  z } 
 P{ X  x , Y  y }
k
k
i
j
g ( xi , y j )  z k


p ij , k  1, 2,
(3.1)
g ( xi , y j )  z k
4
例如, 若X,Y独立, 且
P{X=k}=ak, P{Y=k}=bk, k=0,1,2,,
则Z=X+Y的概率分布为
r
P{Z  r}  P{ X  Y  r} 
 P{ X
 i , Y  r  i}
i0
r

 P{ X
 i} P {Y  r  i}
i0
 a 0 b r  a 1b r  1 
 a r b0 ,
r  0,1, 2,
.
5
即
r
P{ Z  r } 
ab
i
r i
.
(3.2)
i0
这个公式称为离散型卷积公式.
6
例1 设随机变量(X,Y)的概率分布如下表
Y
X
1
2
1
0
1
2
0.2
0.1
0.15
0
0.1
0.1
0.3
0.05
求二维随机变量的函数Z的分布:
(1) Z=X+Y;
(2) Z=XY.
7
Y
X
1
2
1
0
1
2
0.2
0.1
0.15
0
0.1
0.1
0.3
0.05
解 列表计算
pij
0.2 0.15 0.1
(X,Y)
(-1,-1) (-1,0)
(-1,1)
Z=X+Y
2 1
0
Z=XY
1
0
0.3
0.1
(-1,2) (2,-1)
0
0.1 0.05
(2,0)
(2,1)
(2,2)
1
2
3
4
1 2 2
0
2
4
1
8
pij
(X,Y)
Z=X+Y
Z=XY
0.2 0.15 0.1
(-1,-1) (-1,0)
(-1,1)
0.3
0.1
(-1,2) (2,-1)
1
1
2 1 0
1
0 1 2 2
0
0.1 0.05
(2,0)
(2,1)
(2,2)
2
0
3
2
4
4
(1) Z=X+Y的概率分布为
2
0.2
Z
pk
1
0.15
0
0.1
1
0.4
2
0
3
0.1
4
0.05
(2) Z=XY的概率分布为
Z
2
1
0
1
2
4
pk
0.4
0.1
0.15
0.2
0.1
0.05
9
例2 设X和Y相互独立, X~b(n1,p),
Y~b(n2,p), 求Z=X+Y的分布.
解 这里我们利用第二章中二项分布的直
观解释求之.
若X~b(n1,p), 则X是在n1次独立重复试验
中事件A出现的试验次数, 每次试验中A
出现的概率都为p.
同样, Y是在n2次独立重复试验中事件A出
现的次数, 每次A出现的概率为p. 故
Z=X+Y是在n1+n2次独立试验中事件A出
现的次数, 于是Z~b(n1+n2, p).
10
例3 若X和Y相互独立, 它们分别服从参数
为l1,l2的泊松分布, 证明Z=X+Y服从参数
为l1+l2的泊松分布.
解 依题意
P { X  i} 
e
 l1
l
i
1
, i  0,1, 2,
i!
P {Y  j } 
e
 l2
l
j
2
, j  0,1, 2,
j!
11
由离散型卷积公式得
r
P{Z  r} 
 P{ X
 i , Y  r  i}
i0
r

e
 l1
l
i0

e
 ( l1  l 2 )
r!

e
 ( l1  l 2 )
i
1
e
l
 l2
( r  i )!
i!
r
C
r i
2
i
r
l l
i
1
r i
2
i0
( l1  l 2 ) , r  0,1,
r
r!
即Z服从参数为l1+l2的泊松分布.
12
二, 连续型随机变量的函数的分布
设(X,Y)是二维连续型随机向量, 其概率密
度函数为f(x,y), 令g(x,y)为一个二元函数,
则g(X,Y)是(X,Y)的函数
可用类似于求一元随机变量函数分布的
方法来求Z=g(X,Y)的分布.
13
(1) 求分布函数FZ(z),
FZ ( z )  P { Z  z }  P { g ( X , Y )  z } 
 P{ ( X , Y )  D Z } 

f ( x, y ) d x d y
DZ
(3.3)
(2) 求其概率密度函数fZ(z), 对几乎所有的z,
有
f Z ( z )  FZ ( z ).
(3.4)
14
在求随机向量(X,Y)的函数Z=g(X,Y)的分
布时, 关键是设法将其转化为(X,Y)在一定
范围内取值的形式, 从而利用已知(X,Y)的
分布求出Z=g(X,Y)的分布.
15
例4 设随机变量X与Y相互独立, 且同服从
[0,1]上的均匀分布, 试求Z=|XY|的分布
函数与密度函数.
解 先求Z的分布函数
 0,

F Z ( z )  P { | X  Y | z }   P {  z  X  Y  z } ,
1,

 0,

2
 1  (1  z ) ,
1,

z0
0  z 1
z 1
z0
0  z 1
z 1
16
 0,

2
F Z ( z )  1  (1  z ) ,
1,

z0
0  z 1
z 1
Y=X+z
Y
1
Y=Xz
z
O
z
1
X
17
 0,

2
F Z ( z )  1  (1  z ) ,
1,

z0
0  z 1
z 1
则Z=|XY|的概率密度为
 2 (1  z ),
f Z ( z )  F Z ( z )  
0,

0  x  1,
其它.
18
定理 1 设(X1,X2)是具有密度函数 f(x1,x2)的
连续型随机变量, 且满足
2
(1) 设 y1=g1(x1,x2), y2=g2(x1,x2)是 R 到自身
的一一映射, 即存在定义在该变换的值域
上的逆变换:
x1=h1(y1,y2), x2=h2(y1,y2);
(2) 假设变换和它的逆变换都是连续的;
(3) 假设偏导数
hi
y j
(i  1, 2; j  1, 2) 存在且连
续;
19
(4) 假设逆变换的雅可比行列式
J ( y1 , y 2 ) 
 h1
 h1
 y1
y2
 h2
 h2
 y1
y2
 0,
即J(y1,y2)对于在变换的值域中的(y1,y2)是
不为0的. 则Y1=g1(X1,X2), Y2=g2(X1,X2)具有
联合密度
w(y1,y2)=|J|f(h1(y1,y2),h2(y1,y2)).
20
例5 设(X1,X2)的密度函数为f(x1,x2). 令
Y1=X1+X2, Y2=X1X2
试用f表示Y1和Y2的联合密度函数.
解 令y1=x1+x2, y2=x1x2, 则逆变换为
x1 
y1  y 2
2
J ( y1 , y 2 ) 
, x2 
y1  y 2
,
2
1/ 2
1/ 2
1/ 2
1 / 2

1
 0.
2
21
x1 
y1  y 2
2
J ( y1 , y 2 ) 
, x2 
y1  y 2
,
2
1/ 2
1/ 2
1/ 2
1 / 2

1
 0.
2
故由定理1知, Y1和Y2的联合概率密度函
数为
 y1  y 2 y1  y 2 
w ( y1 , y 2 ) 
f 
,

2 
2
2

1
22
1.和的分布: 设X和Y的联合密度为f(x,y),
则Z=X+Y的密度为
fZ (z) 







f (z  y, y) d y
f ( x, z  x) d x
(3.5)
证明 Z=X+Y的分布函数是
FZ ( z )  P { Z  z }  P { X  Y  z } 

f ( x, y ) d x d y
D
D={(x,y)|x+yz}是直线x+y=z左下方的半
平面.
23

FZ ( z ) 
f ( x, y ) d x d y
x y z

y



z y

d y
f
(
x
,
y
)
d
x
  

z
x+y=z
z
O
x
24

FZ ( z ) 


z y

d y
f
(
x
,
y
)
d
x
 

固定z和y对方括号内的积分作变量代换,
令x=uy, 得
Fz ( z ) 




d y
f
(
u

y
,
y
)
d
u
  

z




du
f
(
u

y
,
y
)
d
y
    

z
25



Fz ( z )  
du
f
(
u

y
,
y
)
d
y
   

z
由概率密度与分布函数的关系, 即得
Z=X+Y的概率密度为
f Z ( z )  F Z ( z ) 



f (z  y, y) d y
由X和Y的对称性, fZ(z)又可写成
f Z ( z )  F Z ( z ) 



f ( x, z  x) d x
以上两式即是两个随机变量和的概率密
度的一般公式.
26
fZ (z) 







f (z  y, y) d y
f ( x, z  x) d x
(3.5)
注: 特别地, 当X和Y独立时, 设(X,Y)关于
X,Y的边缘密度分别为fX(x),fY(y), 则上述
两式化为
fZ (z) 
fZ (z) 






f X ( z  y ) fY ( y ) d y
(3.6)
f X ( x ) fY ( z  x ) d x
(3.7 )
以上两个公式称为卷积公式.
27
例6 设X和Y是两个相互独立的随机变量.
它们都服从N(0,1)分布, 其概率密度为
f X (x) 
fY ( y ) 
1
2
1
2

2
2
e

e
x
y
,   x   ,
2
2
,   y  .
求Z=X+Y的概率密度.
28
解 由卷积公式得
fZ (z) 





1
2
1
2
f X ( x ) fY ( z  x ) d x

e


e


z
x
2
2

e
2
2



e
(zx)
2
2
z

 x 
2

dx
2
dx
29
fZ (z) 
令t  x 
z

1
z

2
e
2
2


e
z

 x 
2

2
dx
,得
2
fZ (z) 

1
2

z
4
e
1
2 
2

e

z


e
t
2
dt 
1
2

e
z
2
4

2
4
.
即Z服从N(0,2)分布.
30
定理 2 设 X,Y 相互独立, 且 X ~ N ( 1 ,  ) ,
2
1
Y ~ N (  2 ,  ) . 则 Z=X+Y 仍然服从正态分布,
2
2
且
Z ~ N ( 1   2 ,    ).
2
1
2
2
更一般地, 可以证明: 有限个相互独立的正
态随机变量的线性组合仍然服从正态分布,
31
定理 3 若 X i ~ N ( i ,  )(i  1, 2,
2
i
, n) , 且它
们相互独立, 则对于任意不全为零的常数
a1,a2, ,an, 有
n

i 1

2
2 
ai X i ~ N   ai  i ,  ai  i  .
i 1
 i 1

n
n
32
例7 设某种商品一周的需要量是一个随
机变量, 其概率密度函数为
 xe  x ,
f ( x)  
 0,
x0
其它
如果各周的需要量相互独立, 求两周需要
量的概率密度函数.
33
解 分别用X和Y表示第一, 二周的需要量,
则
x
y
 xe ,
f X ( x)  
 0,
 ye ,
, fY ( y )  
其它
 0,
x0
y0
其它
从而两周需要量Z=X+Y, 由卷积公式
fZ (z) 



f X ( x ) fY ( z  x ) d x
34
fZ (z) 



f X ( x ) fY ( z  x ) d x
当z0时, 若x>0, 则zx<0, fY(zx)=0; 若
x0, 则fX(x)=0, 从而fZ(z)=0.
当z>0时, 若x0, 则fX(x)=0; 若zx0, 即
zx, 则fZ(z)=0. 因此上式当z>0时, 才有
fZ (z) 


z
xe
0

x


f X ( x ) fY ( z  x ) d x
( z  x )e
(zx)
dx
z
3
e
z
,
6
35
fZ (z) 


z
xe

x


f X ( x ) fY ( z  x ) d x
( z  x )e
(zx)
dx
z
3
e
z
,
6
0
从而
 z3 z
 e ,
fZ (z)   6
 0,

z0
其 它.
36
例8 设X1,X2相互独立且分别服从参数为
a1,b;a2,b的G分布(分别记成X1~G(a1,b),
X2~G(a2,b)), X1,X2的概率密度分别为
1

a 1 1  x / b
x
e
,
 a1
f X 1 ( x )   b G (a 1 )

0,

1

a 2 1  y / b
y
e
,
 a2
f X 2 ( y )   b G (a 2 )

0,

x0
其它
y0
其它
37
试证明X1+X2服从参数为a1+a2,b的G分布
证明 由(3.7)式知, 当z0时, Z=X1+X2的概
率密度
fZ(z)=0.
而当z>0时, Z=X1+X2的概率密度为
fZ (z) 





f Z1 ( x ) f Z 2 ( z  x ) d x
z
0
A1 x
a 1 1  x / b
e
A2 ( z  x )
a 2 1
e
(zx)/ b
dx
38
fZ (z) 

z
0
A1 x
a 1 1  x / b
e
z
A2 ( z  x )
a 1 1
 A1 A2 e
z/b
 A1 A2 z
a 1  a 2 1  z / b
 Az

x
(z  x)
a 2 1
a 2 1
e
(zx)/ b
dx
d x ( 令 x  zt )
0
e

1
a1
t (1  t )
a 2 1
dt
0
a 1  a 2 1  z / b
e
由此即知Z=X1+X2服从参数为a1+a2,b的G
分布, 即
X1+X2~G(a1+a2,b).
39
2. 商的分布: 设二维随机向量(X,Y)的密度
函数为 f(x,y). Z 
X
, 则 z 的密度函数为
Y
fZ ( z)  


| y | f ( zy , y ) d y
(3.8)
解 对任意 z, 令
Dz={(x,y)|x/yz}, 则有
FZ ( z )  P

X
Y

 Z   f ( x, y ) d x d y
Dz
40
FZ ( z ) 


0

  
zy


f ( x, y ) d
f ( x, y ) d x  d y  

 

 zy
0
y
O
x d y

x=zy
x
41
FZ ( z ) 


0

  
zy


f ( x, y ) d
f ( x, y ) d x  d y  

 

 zy
0
x d y

于是Z的密度函数为(利用积分上限函数
求导公式)
f Z ( z )  F Z ( z )





0
yf ( zy , y ) d y 

0

yf ( zy , y ) d y


| y | f ( zy , y ) d y
42
例 9 设 X 与 Y 相互独立, 它们都服从参数为
l的指数分布. 求 Z 
X
的密度函数.
Y
解 依题意知
l x
l e ,
f X ( x)  
 0,
l y
l e ,
, fY ( y )  
x0
 0,
x0
y0
y0
.
因 X 与 Y 相互独立, 故 f(x,y)=fX(x)fY(y).
由商的分布知
fZ (z) 



| y | f X ( yz ) f Y ( y ) d y .
43
fZ (z) 



| y | f X ( yz ) f Y ( y ) d y .
当z0时, fZ(z)=0;
当z>0时,
fZ (z)  l
2


e
 l y (1  z )
yd y 
0
1
(1  z )
2
.
故Z的密度函数为
1

,

2
f Z ( z )   (1  z )

0,

z0
z  0.
44
3. 积的分布; 设(X1,X2)具有密度函数
f(x1,x2), 则Y=X1X2的概率密度为
fY ( y ) 



 y 1
f  z, 
dz
 z | z |
(3.9)
45
证明 令y=x1x2, z=x1, 它们构成(X1,X2)到
(Y,Z)的一对一的变换, 逆变换为x1=z,
x2=y/z. 雅可比行列式为
0
1
1/ z
y/z
J ( y, z) 
2

1
 0,
z
y 1

由定理1得Y和Z的联合密度为 f  z , 
,
 z | z |
再求Y的边缘密度得
fY ( y ) 



 y1
f  z,  d z
 z z
46
例10 设二维随机变量(X,Y)在矩形
G={(x,y)|0x2, 0y1}
上服从均匀分布, 试求边长为X和Y的矩
形面积S的密度函数f(s).
解 S=XY, (X,Y)的密度函数为
1 / 2,
f ( x, y )  
 0,
( x, y )  G
( x, y )  G .
47
 s 1
由(3.9)式 f S ( s )   f  z , 
dz

 z | z |
s
 s
因 为 仅 当 0  z  2, 0   1 时 , f  z ,   0.
z
 z
所以
2
 s 1
f S ( s)   f  z, 
d z, 0  s  2
s
 z | z |


2
1 1
2 z
其它时, fS(s)=0.
s
dz 
1
(ln 2  ln s ),
0s2
2
48
三, M=max{X,Y}及N=min{X,Y}的分布
设随机变量X,Y相互独立, 其分布函数分
别为FX(x)和FY(y), 由于M=max{X,Y}不大
于z等价于X和Y都不大于z, 故有
FM(z)=P{Mz}=P{Xz,Yz}
=P{Xz}P{Yz}=FX(z)FY(z) (3.10)
类似地, 可得N=min{X,Y}的分布函数
FN(z)=P{Nz}=1P{N>z}=1P{X>z,Y>z}
=1P{X>z}P{Y>z}
=1[1FX(z)][1FY(z)]
(3.11)
49
注: 上述结果易推广到n维情形: 设
X1,,Xn是n个相互独立的随机变量, 其分
布函数分别为
F X i ( x ) ( i  1,
n ).
则M=max{X1,,Xn}的分布函数为
FM ( z )  F X 1 ( z )
F X n ( z ).
(3.12)
N=min{X1,,Xn}的分布函数为
F N ( z )  1  [1  F X 1 ( z )]
[1  F X n ( z )]. (3.13)
50
例11 设随机变量X1,X2相互独立, 并且有
相同的几何分布:
P{Xi=k}=pqk1, k=1,2,(i=1,2,q=1p)
求Y=max{X1,X2}的分布.
解 P{Y=n}=P{max{X1,X2}=n}
=P{X1=n,X2n}+P{X2=n,X1<n}
 pq
n 1
n

pq
k 1
 pq
n 1
k 1
 p q
2
 pq
n 1 1  q
n 1
n 1

pq
k 1
k 1
n
 p q
2
1 q
(2  q  q
n
n 1
n 1 1  q
).
n 1
1 q
51
例12 设系统L由两个相互独立的子系统
L1,L2联接而成, 联接的方式分别为串联,
并联, 备用(当系统L1损坏时, 系统L2开始
工作), 设L1,L2的寿命分别为X,Y, 已知它
们的概率密度分别为
a x
a e
,
f X ( x)  
 0,
b y
b e
,
, fY ( y )  
x0
 0,
x0
y0
y0
其中a>0, b>0且ab. 试分别就以上三种联
接方式写出L的寿命Z的概率密度.
52
,
串联
并联
备用
X
L1
Y
L2
L1
X
L2
Y
L1
X
L2
Y
53
解 由题设X与Y服从指数分布, 其分布函数
为
a x
1  e
FX ( x )  
0,

,
1  e  b y ,
FY ( y )  
0,

x0
x0
y0
y0
54
(1) 串联的情况.
由于当L1,L2中有一个损坏时, 系统L就停
止工作, 所以这时L的寿命为Z=min{X,Y}.
于是Z的分布函数为
1  e  ( a  b ) z ,
Fm in ( z )  1  [1  F X ( z )][1  FY ( z )]  
0,

z0
z0
z的概率密度函数为
 (a  b ) e  ( a  b ) z ,
f m in ( z )  
0,

z0
z  0.
55
(2) 并联的情况
由于当且仅当L1,L2都损坏时, 系统L才停
止工作, 所以这时L的寿命Z=max{X,Y}, Z
的分布函数为
a z
b z
 (1  e
Fm ax ( z )  F X ( z ) FY ( z )  

)(1  e
),
z0
z  0.
0,
于是Z的概率密度为
a e
f m ax ( z )  

a z
 be
b z
 (a  b ) e
0,
 (a  b ) z
,
z0
z0
56
(3) 备用的情况.
因此时当系统L1损坏时系统L2才开始工作,
因此整个系统L的寿命是L1,L2两者之和,
即Z=X+Y,
故当z>0时Z的概率密度为
fZ (z) 





z
f X ( z  y ) fY ( y ) d y
ae
a ( z  y )
be
b y
dy
0
 ab e
a z

z
e
0
 ( b a ) y
dy
ab
b a
[e
a z
e
b z
57
].
当z0时, fZ(z)=0, 于是Z=X+Y的概率密度
为
 ab
a z
b z
[e
e
],

fZ (z)   b  a

0,

z0
.
z0
58
作业 习题3-3 第109页开始
第9题
59