Transcript Document

第四章 随机变量的数字特征
数字特征的优越性:
1. 较集中地反映了随机变量变化的一些平均特征。
2. 很多重要的随机变量(如二项分布、泊松分布、均匀分布、
指数分布、正态分布等)的分布函数都能用一、两个数字特征
完全确定。
3. 重要的数字特征---数学期望、方差具有明确的统计意义,
同时还具有良好的数学性质。
4.随机变量的数字特征较易求出。
Copyright © 2006 NJUFE
第一节、数学期望
例1. 有甲、乙两个射击选手,他们的射击技术由下表给出:
甲射手:
环数
p
乙射手:
环数
p
10
0.6
10
8
9
0.3
0.1
8
9
0.2
0.5
0.3
试问哪一个选手射击本领较好?
甲:8×0.3N+9×0.1N+10×0.6N=9.3N
乙:8×0.2N+9×0.5N+10×0.3N=9.1N
Copyright © 2006 NJUFE
定义4.1(教材p110)
设为离散型随机变量,其分布律为
pk P(  xk ),k  1,
2,

若级数
x
k 1
k

pk 绝对收敛,则称 E()=  xk pk 为的数
k 1
学期望(或称期望或均值)。
1. 设~B(n,p),求E():
E()=np.
2. 设~(),求E():
E()=.
3.
设服从参数为p的几何分布,求E(): E()=1/p.
例2. 设随机变量分布律为
pk  P(  (1) 2 / k )  1/ 2 , k  1,
2,

k
k
k
求E() 。
Copyright © 2006 NJUFE
定义4.2 (教材p110)
设为连续型随机变量,其分布密度为f(x),若积分


x f ( x)dx 收敛, 则称 E ( ) 

望(或称期望或均值)。

为的数学期
xf
(
x
)
dx


4. 设服从参数为的指数分布,求E():
E()=1/ 
5. 设服从(a,b)区间上的均匀分布,求E(): E()=(a+b)/2
6. 设 ~N (, ),则 E()=.
2
7. 设~(,),则E()= /。
n 1
2
设 (n)  ( , ),则有 E (  (n))  n.
2 2
2
例3. 设的分布密度为
f ( x)  1/( (1  x2 )),
(Cauchy)求E( ).
Copyright © 2006 NJUFE
, n 相互独立,且均服从参数为的指数分
例4. 设 1, 2,
, n },N=min{ 1, 2,
, n },
布,M=max{ 1, 2,
求E(M)和E(N)。
定义4.3
对=( 1, 2,
, n ),若 E(i ),i  1,
2,
,n 都存在,
,E( n )) 为n维随机变量的数学
则称 E ( )  ( E (1 ),E ( 2 ),
期望(或均值向量)。
Copyright © 2006 NJUFE
定理4.1 (教材p115)
设y=g(x)是连续函数,=g():
1) 是离散型随机变量,其分布律为
P(  xi )  pi,i  1,
2,

若 g(xi ) pi  ,
i 1

则 E ( )  E[ g ( )]   g ( xi ) pi。
i 1
2) 是连续型随机变量,其概率密度为f(x),

若  g(x) f ( x)dx  ,

则 E( )  E[ g ( )] 

 g ( x) f ( x)dx。

Copyright © 2006 NJUFE
推广(教材p116):
  (1, 2 ),  g (1, 2 )。
设 y  g ( x,y ) 是连续函数,
1) 是离散型随机变量,其分布律为
pij  P(1  xi,2  y j ),i,j  1,
2,


若  g ( xi,y j ) pij  ,
i,j 1
则 E ( )  E[ g (1, 2 )] 

 g ( x ,y ) p .
i,j 1
i
j
ij
2) 是连续型随机变量,其概率密度为 f ( x,y)。
 
若
 g ( x,y) f ( x,y)dxdy  ,
  
则E ( )  E[ g (1, 2 )] 
  
  g ( x,y) f ( x,y)dxdy.
  
Copyright © 2006 NJUFE
例5. 设二维随机变量(,)的概率密度为
f ( x,y)  {
x  y, 当0  x  1,
0  y  1;
0,
其它.
试求的数学期望。
定理4.2 (教材p119)
1. 设a,b,c为任意常数,若 a    b,则 a  E ( )  b。
特别,E( c)=c。
2. 线性性:设 a1,a2,,an和b 为任意常数,则
n
n
i 1
i 1
E ( ai i  b)   ai E ( i )  b.
, n 相互独立,则
3. 若 1, 2,
E(12 n )  E(1 ) E(2 )E(n )。
Copyright © 2006 NJUFE
gi ( x),i  1,
2,
,n为连续函数,
1, 2,
, n
,gn (n ) 也是
为相互独立的随机变量,则 g1 (1 ),g 2 ( 2 ),
性质 设
相互独立的随机变量。
由此可得
E[ g1 (1 ) g2 ( 2 ) gn ( n )]  E[ g1 (1 )]E[ g2 ( 2 )]E[ gn ( n )].
例6. (2003年数学一考研试题十一题)
已知甲、乙两箱中装有同种产品,其中甲箱中装有3件合格
品和3件次品,乙箱中仅装有3件合格品。从甲箱中任取3件产
品放入乙箱后,求:
1) 乙箱中次品数X的数学期望;
2) 从乙箱中任取一件产品是次品的概率。
Copyright © 2006 NJUFE
例7. (2002年数学三、四考研试题十二题)
假设一设备开机后无故障工作的时间X服从指数分布,
平均无故障工作的时间(EX)为5小时。设备定时开机,出现
故障时自动关机,而在无故障的情况下工作2小时便关机。
试求该设备每次开机无故障工作的时间Y的分布函数F(y)。
定义3.4
1. 设(,)为离散型随机变量, 在给定  
2,

件分布律为 P(  x|
i   y j ),i  1,

若
x
i 1
i
y j 条件下的条
P(  x|
i   y j )  , 则称

E (|  y j )   xi P(  x|
i   yj)
为当 
i 1
 y j 条件下的条件数学期望。
Copyright © 2006 NJUFE
2. 设(,)为连续型随机变量,在给定=y 条件下的条件
分布密度为f(x|y),若


 x f ( x|y)dx  ,称 E(|  y)   xf ( x|y)dx

为当=y 条件下的条件数学期望。

说明: 1) 因为条件分布是随机变量,故函数的数学期望计算公
式(定理4.1)和数学期望的性质(定理4.2)对条件数学期望也成立。
2) E(|=y)对固定的y是一个数,随着取遍所有有意义的y
值, E(|=y)是的函数,故也是随机变量,记为E (|)。
定理
设g(x)为连续函数,则 E{E[g()|]}=E[g ()]。
特别,E[E (|)]=E ()。
Copyright © 2006 NJUFE
第二节 方差
例1.有甲、乙两个射击选手,他们的射击技术由下表给出:
击中环数
10
9
8
7
甲概率
0.15
0.2
0.3
0.2
乙概率
0.05
0.05
定义4.5 (教材p121)
0.05
0.8
6
0.15
0.05
设为随机变量,若 E[(  E ( )) ]存在,则称其为的
方差,记为 Var ( )  D( )  E[(  E ( )) 2 ].
2
称
 D( ) 为标准差(或均方差)。
Copyright © 2006 NJUFE
1. 设为离散型随机变量,其分布律为
pi  P(  xi ),i  1,
2,

则
D( )  [ xi  E ( )]2 pi。
i 1
2.设为连续型随机变量,其分布密度为f(x),则

D( )   [ x  E ( )]2 f ( x)dx。

方差实用计算公式:
D( )  E ( 2 )  [ E ( )]2 .
公式变形:
E ( )  D( )  [ E ( )] .
2
2
Copyright © 2006 NJUFE
几种常用分布的方差:
1. 设~B(n,p),则
D()=np(1-p) 。
2. 设~(),则 D()=  。
3. 设服从参数为p的几何分布,则
D( )  (1  p) / p 2
4. 设服从(a,b)区间上的均匀分布,则 D( )  (b  a) / 12.
2
5. 设服从参数为的指数分布,则
D( )  1 /  .
2
2
D
(

)


.
6. 设~N (, ),则
2
7. 设~(,),则
D( )   /  .
2
n 1
8. 对 ~ (n)  ( , ), D( )  2n.
2 2
2
Copyright © 2006 NJUFE
定理4.4 (切比雪夫不等式) (教材p127)
设是随机变量,若D()存在,则对任何 >0,
D( )
P(   E ( )   )  2 .
切比雪夫不等式的等价形式 
有
P(   E ( )   )  1 
D( )

2
.
1. 切比雪夫不等式可用来估计不是服从正态分布的随
机变量落在E()附近的概率。
2. 切比雪夫不等式的主要作用是进行概率论的理论研
究。
思考题 (2001年数学一考研试题)
设随机变量X的方差为2,则根据切比雪夫不等式估计
P( X  EX  2) 
。
Copyright © 2006 NJUFE
例2 (2002年数学一考研试题十一题)
设随机变量X的概率密度为
cos(x / 2) / 2, 0  x  ;
f ( x)  {
0,
其它。
对X独立地观察4次,用Y表示观察值大于/3的次数,求
2
的数学期望。
定理4.5 (教材p124)
Y
方差具有以下性质:
1. D()=0 当且仅当 P(=c)=1,c为任意常数;特别,D(c )=0。
2
2. 设 c 为任意常数,则 D(c )= c D()。
,cn为任意常数,当 D(i ),i  1,2,,n 存在,有
3. 设 c1,c2,
n
n
D( ci i )   ci2 D( i )  2
i 1
i 1
 c c E[(
1i  j  n
i
j
i
 E ( i ))( j  E ( j ))].
Copyright © 2006 NJUFE
2,
,n 相互独立,则 D(
4. 若 i,i  1,
n
n
i 1
i 1
2
c

)

c
 i i  i D(i )
特别,若与相互独立,则 D(+ )= D()+ D().
5. 若 cE(),则 D()<E (  c) 2 .
标准化随机变量:设 D()>0,构造随机变量
  E ( )
 
,
D( )



E
(

)

0
,
D
(

)  1,
则  与服从同类分布,且

称  为标准化随机变量。

Copyright © 2006 NJUFE
第三节、协方差和相关系数
定义4.6 (教材p129)
对二维随机变量(,),若 E{[-E()][-E()]} 存在,则称
其为与的协方差(或相关矩),记为 cov(,),即
cov (,)= E{[-E()][-E()]} 。
注:1) cov(, )=D(),若a为常数,则 cov(a, )=0.
2) 协方差的实用计算公式: cov (,)= E()- E() E().
3) 对二维随机变量(,),有计算公式:
D (+)= D ()+ D ()+2 cov (,).
Copyright © 2006 NJUFE
协方差的简单性质(教材p129)
1.对称性: cov(,)= cov(, )。
2.线性性: cov(a,)= acov(,),
cov(1   2,)  cov(1,)  cov( 2,).
由对称性和线性性进一步可得
cov(a1  b 2,c1  d2 )  ac cov(1,1 )
 bc cov( 2,1 )  ad cov(1,2 )  bd cov( 2,2 ),
m
n
m
n
i 1
j 1
i 1 j 1
cov(  ai i,
 b j j )   aib j cov(i, j ).
定义4.7(教材p131)
若 cov(,)= 0,则称与不相关。
Copyright © 2006 NJUFE
定理4.6 对二维随机变量(,),下列事实是等价的:
1) cov(,)= 0;
2) 与不相关;
3) E()= E() E();
4) D (+)= D ()+ D ()。
结论1: 与相互独立 => 与不相关;
与不相关
 与相互独立 。
2
2
(

,

)
~
N
(

,

,

,

结论2:设
1
2
1
2, ) ,则与不相关等价
于与相互独立 ,即 =0。
Copyright © 2006 NJUFE
思考题2(2003年数学四考研试题)
设随机变量X和Y都服从正态分布,且它们不相关,则( )
(A) X与Y一定独立.
(B) (X,Y)服从正态分布.
(C ) X与Y未必独立.
(D) X+Y服从一维正态分布.
思考题3(2002年数学三考研试题填空题)
设随机变量X 和Y 的联合概率分布为
Y
-1
0
1
0.07
0.08
0.18
0.32
0.15
0.20
X
0
1
则
X
2
和
Y
2
的协方差 cov( X 2 , Y 2 ) 
Copyright © 2006 NJUFE
例3(2002年数学三考研试题十一题第二小题)
设随机变量U在区间[-2,2]上服从均匀分布,随机变量
 1, 若U  1,
 1, 若U  1,
X {
Y {
1, 若U  1;
1, 若U  1.
试求D(X+Y)。
例4(2001年数学四考研试题十二题)
设随机变量X和Y的联合分布在以点(0,1),(1,0),(1,1)
为顶点的三角形区域服从均匀分布,试求随机变量U=X+Y的
方差。
1
G
1
x+y=1
Copyright © 2006 NJUFE
定理4.8 (柯西—许瓦兹不等式)
对任何随机变量与,都有
1)
2)
[ E( )]  E( ) E( );
等式成立当且仅当存在 t 0 ,使P(= t 0  )=1。
2
2
2



,

结论:设
是与的标准化随机变量,则
cov(, )
cov( , ) 
D( ) D( )


定理4.8推论:对任何随机变量与,都有
[cov(,)]  D( ) D().
2
Copyright © 2006 NJUFE
定义4.8 (教材p129)
设D()>0,D()>0,称
cov(, )
r 
 cov( ,  )
D( ) D( )
为与的相关系数(线性相关系数),通常简记成r或。
定理4.9 对与的相关系数r,有以下结论:
1. 与的不相关当且仅当 r=0;
2.
r  1;
3. |r|=1 当且仅当存在常数a,b,a0使
P(=a +b)=1。
Copyright © 2006 NJUFE
说明:
1.
r  0.3,称与微弱相关;
当0.3< r 0.5,称与低度相关;
当0.5< r 0.8,称与中等相关(或称显著相关);
当0<
当0.8< |r|< 1,称与高度相关;
当|r|=1,称与完全相关。
2. r=0 只说明与之间不存在线性关系,但完全可能存在
曲线关系(参见教材p157 例11)。只有当与相互独立,它们
之间才无任何关系。
3. 当r>0,称与正相关,当r<0,称与负相关。
注:以上正(负)相关是一般教科书上给出的定义,但这种定
义只能说明当与之间存在线性相关关系时的变化趋势。
准确地提法应该是:当增大时, 增大(减少),则称与
正(负)相关。
Copyright © 2006 NJUFE
性质:设
(,)~N (1,2, 12, 22, ),则
r  , cov(,)  1 2 .
阐述相关系数r反映线性相关关系:
若用的线性函数 a+b,(a,b为常数) 来近似反映,即
  a+b ,则有以下问题:
1. 随着常数 a,b 取不同的值, a+b 代表无数条直线,其中
哪一条直线近似程度最好(误差最小)?
2. 由于 a+b 也是随机变量,如何度量 a+b 与  的误差?
2
e

E
[(


(
a

b

))
]
考虑其均方误差:
此处,e 是 a,b 的函数。将 e 的表达式展开,得
e  E( )  2bE( )  2aE()  b E( )  2abE( )  a .
2
2
2
e
e
利用二元函数求极值的方法,令
 0,  0,即
a Copyright©b2006 NJUFE
2
e
 2a  2bE ( )  2 E ( )  0,
a
e
 2bE ( 2 )  2 E ( )  2aE ( )  0.
b
a0,b0,
得
cov(, )
cov(, )
b0 
,a0  E ( )  E ( )
.
D( )
D( )
解方程组求出使 e 达最小的常数
将 a0,b0 代入e 的表达式,经整理 可得
emin  min E[(  (a  b ))2 ]  E[(  (a0  b0 ))2 ]
 (1  r 2 ) D( ).
结论1:|r|越大,近似程度越好, 与之间存在线性关
系的程度越高,当r=0, 与之间不存在线性关系。
Copyright © 2006 NJUFE
注意 r 与 b 之间存在关系:
0
cov(, )
cov(, ) D( )
r

 b0
D( )
D( ) D( )
D( )
结论2: 与正(负)相关当且仅当
r  b0
b0
>0(
D( )
D( )
.
b0 <0),且
D( )
D( )
思考题4 (2001年数学一、三、四考研试题)
将一枚硬币重复掷 n 次,以 X 和 Y 分别表示正面向上和
反面向上的次数,则X 和 Y 的相关系数等于( )
(A) -1.
(B) 0.
(C )
1/2.
(D)
Copyright © 2006 NJUFE
1.
思考题5 (2001年数学三考研试题填空题)
设随机变量X和Y的数学期望分别为-2,2,方差分别为1
和4,而相关系数为-0.5,则根据切比雪夫不等式
P(|X+Y|6)
.
思考题6 (2003年数学三考研试题填空题)
设随机变量X和Y的相关系数为0.9,若Z=X-0.4,则Y与Z的
相关系数为
.
思考题7 (2003年数学四考研试题填空题)
设随机变量X和Y的相关系数为0.5,EX=EY=0,
EX 2  EY 2  2,
则 E( X  Y )2 
Copyright © 2006 NJUFE
例5 (2003年数学四考研试题十二题)
对于任意二事件A和B,0<P(A)<1,0<P(B)<1,

P( AB)  P( A) P( B)
P( A) P( B) P( A) P( B)
称做事件A与B的相关系数。
(1) 证明事件A和事件B独立的充分必要条件是其相关系数等于
零;
(2) 利用随机变量相关系数的基本性质,证明||0.
,n )为n维随机变量,记
定义4.9 设  (1, 2,
称
ij  cov(i, j ),i,j  1,
2,
,n,
C  (ij )nn 为的协方差矩阵。
Copyright © 2006 NJUFE
n维正态分布的性质:
,n ) 服从n维正态分布的充分必要条件是:
1.   (1, 2,
n
a
i 1
i
i
服从一维正态分布,其中
ai
,i=1,2,…n为常数。
,n )服从n维正态分布,令
2.设  (1, 2,
n
i   aij j,i  1,
,m,
j 1
则
(1,2,
m )服从m维正态分布。
 n ) 服从n维正态分布,则
3.设( 1, 2,
相互独立的充分必要条件是
1, 2,
 n
1, 2,
 n
两两不相关。
Copyright © 2006 NJUFE