Transcript Document
第四章 随机变量的数字特征
数字特征的优越性:
1. 较集中地反映了随机变量变化的一些平均特征。
2. 很多重要的随机变量(如二项分布、泊松分布、均匀分布、
指数分布、正态分布等)的分布函数都能用一、两个数字特征
完全确定。
3. 重要的数字特征---数学期望、方差具有明确的统计意义,
同时还具有良好的数学性质。
4.随机变量的数字特征较易求出。
Copyright © 2006 NJUFE
第一节、数学期望
例1. 有甲、乙两个射击选手,他们的射击技术由下表给出:
甲射手:
环数
p
乙射手:
环数
p
10
0.6
10
8
9
0.3
0.1
8
9
0.2
0.5
0.3
试问哪一个选手射击本领较好?
甲:8×0.3N+9×0.1N+10×0.6N=9.3N
乙:8×0.2N+9×0.5N+10×0.3N=9.1N
Copyright © 2006 NJUFE
定义4.1(教材p110)
设为离散型随机变量,其分布律为
pk P( xk ),k 1,
2,
若级数
x
k 1
k
pk 绝对收敛,则称 E()= xk pk 为的数
k 1
学期望(或称期望或均值)。
1. 设~B(n,p),求E():
E()=np.
2. 设~(),求E():
E()=.
3.
设服从参数为p的几何分布,求E(): E()=1/p.
例2. 设随机变量分布律为
pk P( (1) 2 / k ) 1/ 2 , k 1,
2,
k
k
k
求E() 。
Copyright © 2006 NJUFE
定义4.2 (教材p110)
设为连续型随机变量,其分布密度为f(x),若积分
x f ( x)dx 收敛, 则称 E ( )
望(或称期望或均值)。
为的数学期
xf
(
x
)
dx
4. 设服从参数为的指数分布,求E():
E()=1/
5. 设服从(a,b)区间上的均匀分布,求E(): E()=(a+b)/2
6. 设 ~N (, ),则 E()=.
2
7. 设~(,),则E()= /。
n 1
2
设 (n) ( , ),则有 E ( (n)) n.
2 2
2
例3. 设的分布密度为
f ( x) 1/( (1 x2 )),
(Cauchy)求E( ).
Copyright © 2006 NJUFE
, n 相互独立,且均服从参数为的指数分
例4. 设 1, 2,
, n },N=min{ 1, 2,
, n },
布,M=max{ 1, 2,
求E(M)和E(N)。
定义4.3
对=( 1, 2,
, n ),若 E(i ),i 1,
2,
,n 都存在,
,E( n )) 为n维随机变量的数学
则称 E ( ) ( E (1 ),E ( 2 ),
期望(或均值向量)。
Copyright © 2006 NJUFE
定理4.1 (教材p115)
设y=g(x)是连续函数,=g():
1) 是离散型随机变量,其分布律为
P( xi ) pi,i 1,
2,
若 g(xi ) pi ,
i 1
则 E ( ) E[ g ( )] g ( xi ) pi。
i 1
2) 是连续型随机变量,其概率密度为f(x),
若 g(x) f ( x)dx ,
则 E( ) E[ g ( )]
g ( x) f ( x)dx。
Copyright © 2006 NJUFE
推广(教材p116):
(1, 2 ), g (1, 2 )。
设 y g ( x,y ) 是连续函数,
1) 是离散型随机变量,其分布律为
pij P(1 xi,2 y j ),i,j 1,
2,
若 g ( xi,y j ) pij ,
i,j 1
则 E ( ) E[ g (1, 2 )]
g ( x ,y ) p .
i,j 1
i
j
ij
2) 是连续型随机变量,其概率密度为 f ( x,y)。
若
g ( x,y) f ( x,y)dxdy ,
则E ( ) E[ g (1, 2 )]
g ( x,y) f ( x,y)dxdy.
Copyright © 2006 NJUFE
例5. 设二维随机变量(,)的概率密度为
f ( x,y) {
x y, 当0 x 1,
0 y 1;
0,
其它.
试求的数学期望。
定理4.2 (教材p119)
1. 设a,b,c为任意常数,若 a b,则 a E ( ) b。
特别,E( c)=c。
2. 线性性:设 a1,a2,,an和b 为任意常数,则
n
n
i 1
i 1
E ( ai i b) ai E ( i ) b.
, n 相互独立,则
3. 若 1, 2,
E(12 n ) E(1 ) E(2 )E(n )。
Copyright © 2006 NJUFE
gi ( x),i 1,
2,
,n为连续函数,
1, 2,
, n
,gn (n ) 也是
为相互独立的随机变量,则 g1 (1 ),g 2 ( 2 ),
性质 设
相互独立的随机变量。
由此可得
E[ g1 (1 ) g2 ( 2 ) gn ( n )] E[ g1 (1 )]E[ g2 ( 2 )]E[ gn ( n )].
例6. (2003年数学一考研试题十一题)
已知甲、乙两箱中装有同种产品,其中甲箱中装有3件合格
品和3件次品,乙箱中仅装有3件合格品。从甲箱中任取3件产
品放入乙箱后,求:
1) 乙箱中次品数X的数学期望;
2) 从乙箱中任取一件产品是次品的概率。
Copyright © 2006 NJUFE
例7. (2002年数学三、四考研试题十二题)
假设一设备开机后无故障工作的时间X服从指数分布,
平均无故障工作的时间(EX)为5小时。设备定时开机,出现
故障时自动关机,而在无故障的情况下工作2小时便关机。
试求该设备每次开机无故障工作的时间Y的分布函数F(y)。
定义3.4
1. 设(,)为离散型随机变量, 在给定
2,
件分布律为 P( x|
i y j ),i 1,
若
x
i 1
i
y j 条件下的条
P( x|
i y j ) , 则称
E (| y j ) xi P( x|
i yj)
为当
i 1
y j 条件下的条件数学期望。
Copyright © 2006 NJUFE
2. 设(,)为连续型随机变量,在给定=y 条件下的条件
分布密度为f(x|y),若
x f ( x|y)dx ,称 E(| y) xf ( x|y)dx
为当=y 条件下的条件数学期望。
说明: 1) 因为条件分布是随机变量,故函数的数学期望计算公
式(定理4.1)和数学期望的性质(定理4.2)对条件数学期望也成立。
2) E(|=y)对固定的y是一个数,随着取遍所有有意义的y
值, E(|=y)是的函数,故也是随机变量,记为E (|)。
定理
设g(x)为连续函数,则 E{E[g()|]}=E[g ()]。
特别,E[E (|)]=E ()。
Copyright © 2006 NJUFE
第二节 方差
例1.有甲、乙两个射击选手,他们的射击技术由下表给出:
击中环数
10
9
8
7
甲概率
0.15
0.2
0.3
0.2
乙概率
0.05
0.05
定义4.5 (教材p121)
0.05
0.8
6
0.15
0.05
设为随机变量,若 E[( E ( )) ]存在,则称其为的
方差,记为 Var ( ) D( ) E[( E ( )) 2 ].
2
称
D( ) 为标准差(或均方差)。
Copyright © 2006 NJUFE
1. 设为离散型随机变量,其分布律为
pi P( xi ),i 1,
2,
则
D( ) [ xi E ( )]2 pi。
i 1
2.设为连续型随机变量,其分布密度为f(x),则
D( ) [ x E ( )]2 f ( x)dx。
方差实用计算公式:
D( ) E ( 2 ) [ E ( )]2 .
公式变形:
E ( ) D( ) [ E ( )] .
2
2
Copyright © 2006 NJUFE
几种常用分布的方差:
1. 设~B(n,p),则
D()=np(1-p) 。
2. 设~(),则 D()= 。
3. 设服从参数为p的几何分布,则
D( ) (1 p) / p 2
4. 设服从(a,b)区间上的均匀分布,则 D( ) (b a) / 12.
2
5. 设服从参数为的指数分布,则
D( ) 1 / .
2
2
D
(
)
.
6. 设~N (, ),则
2
7. 设~(,),则
D( ) / .
2
n 1
8. 对 ~ (n) ( , ), D( ) 2n.
2 2
2
Copyright © 2006 NJUFE
定理4.4 (切比雪夫不等式) (教材p127)
设是随机变量,若D()存在,则对任何 >0,
D( )
P( E ( ) ) 2 .
切比雪夫不等式的等价形式
有
P( E ( ) ) 1
D( )
2
.
1. 切比雪夫不等式可用来估计不是服从正态分布的随
机变量落在E()附近的概率。
2. 切比雪夫不等式的主要作用是进行概率论的理论研
究。
思考题 (2001年数学一考研试题)
设随机变量X的方差为2,则根据切比雪夫不等式估计
P( X EX 2)
。
Copyright © 2006 NJUFE
例2 (2002年数学一考研试题十一题)
设随机变量X的概率密度为
cos(x / 2) / 2, 0 x ;
f ( x) {
0,
其它。
对X独立地观察4次,用Y表示观察值大于/3的次数,求
2
的数学期望。
定理4.5 (教材p124)
Y
方差具有以下性质:
1. D()=0 当且仅当 P(=c)=1,c为任意常数;特别,D(c )=0。
2
2. 设 c 为任意常数,则 D(c )= c D()。
,cn为任意常数,当 D(i ),i 1,2,,n 存在,有
3. 设 c1,c2,
n
n
D( ci i ) ci2 D( i ) 2
i 1
i 1
c c E[(
1i j n
i
j
i
E ( i ))( j E ( j ))].
Copyright © 2006 NJUFE
2,
,n 相互独立,则 D(
4. 若 i,i 1,
n
n
i 1
i 1
2
c
)
c
i i i D(i )
特别,若与相互独立,则 D(+ )= D()+ D().
5. 若 cE(),则 D()<E ( c) 2 .
标准化随机变量:设 D()>0,构造随机变量
E ( )
,
D( )
E
(
)
0
,
D
(
) 1,
则 与服从同类分布,且
称 为标准化随机变量。
Copyright © 2006 NJUFE
第三节、协方差和相关系数
定义4.6 (教材p129)
对二维随机变量(,),若 E{[-E()][-E()]} 存在,则称
其为与的协方差(或相关矩),记为 cov(,),即
cov (,)= E{[-E()][-E()]} 。
注:1) cov(, )=D(),若a为常数,则 cov(a, )=0.
2) 协方差的实用计算公式: cov (,)= E()- E() E().
3) 对二维随机变量(,),有计算公式:
D (+)= D ()+ D ()+2 cov (,).
Copyright © 2006 NJUFE
协方差的简单性质(教材p129)
1.对称性: cov(,)= cov(, )。
2.线性性: cov(a,)= acov(,),
cov(1 2,) cov(1,) cov( 2,).
由对称性和线性性进一步可得
cov(a1 b 2,c1 d2 ) ac cov(1,1 )
bc cov( 2,1 ) ad cov(1,2 ) bd cov( 2,2 ),
m
n
m
n
i 1
j 1
i 1 j 1
cov( ai i,
b j j ) aib j cov(i, j ).
定义4.7(教材p131)
若 cov(,)= 0,则称与不相关。
Copyright © 2006 NJUFE
定理4.6 对二维随机变量(,),下列事实是等价的:
1) cov(,)= 0;
2) 与不相关;
3) E()= E() E();
4) D (+)= D ()+ D ()。
结论1: 与相互独立 => 与不相关;
与不相关
与相互独立 。
2
2
(
,
)
~
N
(
,
,
,
结论2:设
1
2
1
2, ) ,则与不相关等价
于与相互独立 ,即 =0。
Copyright © 2006 NJUFE
思考题2(2003年数学四考研试题)
设随机变量X和Y都服从正态分布,且它们不相关,则( )
(A) X与Y一定独立.
(B) (X,Y)服从正态分布.
(C ) X与Y未必独立.
(D) X+Y服从一维正态分布.
思考题3(2002年数学三考研试题填空题)
设随机变量X 和Y 的联合概率分布为
Y
-1
0
1
0.07
0.08
0.18
0.32
0.15
0.20
X
0
1
则
X
2
和
Y
2
的协方差 cov( X 2 , Y 2 )
Copyright © 2006 NJUFE
例3(2002年数学三考研试题十一题第二小题)
设随机变量U在区间[-2,2]上服从均匀分布,随机变量
1, 若U 1,
1, 若U 1,
X {
Y {
1, 若U 1;
1, 若U 1.
试求D(X+Y)。
例4(2001年数学四考研试题十二题)
设随机变量X和Y的联合分布在以点(0,1),(1,0),(1,1)
为顶点的三角形区域服从均匀分布,试求随机变量U=X+Y的
方差。
1
G
1
x+y=1
Copyright © 2006 NJUFE
定理4.8 (柯西—许瓦兹不等式)
对任何随机变量与,都有
1)
2)
[ E( )] E( ) E( );
等式成立当且仅当存在 t 0 ,使P(= t 0 )=1。
2
2
2
,
结论:设
是与的标准化随机变量,则
cov(, )
cov( , )
D( ) D( )
定理4.8推论:对任何随机变量与,都有
[cov(,)] D( ) D().
2
Copyright © 2006 NJUFE
定义4.8 (教材p129)
设D()>0,D()>0,称
cov(, )
r
cov( , )
D( ) D( )
为与的相关系数(线性相关系数),通常简记成r或。
定理4.9 对与的相关系数r,有以下结论:
1. 与的不相关当且仅当 r=0;
2.
r 1;
3. |r|=1 当且仅当存在常数a,b,a0使
P(=a +b)=1。
Copyright © 2006 NJUFE
说明:
1.
r 0.3,称与微弱相关;
当0.3< r 0.5,称与低度相关;
当0.5< r 0.8,称与中等相关(或称显著相关);
当0<
当0.8< |r|< 1,称与高度相关;
当|r|=1,称与完全相关。
2. r=0 只说明与之间不存在线性关系,但完全可能存在
曲线关系(参见教材p157 例11)。只有当与相互独立,它们
之间才无任何关系。
3. 当r>0,称与正相关,当r<0,称与负相关。
注:以上正(负)相关是一般教科书上给出的定义,但这种定
义只能说明当与之间存在线性相关关系时的变化趋势。
准确地提法应该是:当增大时, 增大(减少),则称与
正(负)相关。
Copyright © 2006 NJUFE
性质:设
(,)~N (1,2, 12, 22, ),则
r , cov(,) 1 2 .
阐述相关系数r反映线性相关关系:
若用的线性函数 a+b,(a,b为常数) 来近似反映,即
a+b ,则有以下问题:
1. 随着常数 a,b 取不同的值, a+b 代表无数条直线,其中
哪一条直线近似程度最好(误差最小)?
2. 由于 a+b 也是随机变量,如何度量 a+b 与 的误差?
2
e
E
[(
(
a
b
))
]
考虑其均方误差:
此处,e 是 a,b 的函数。将 e 的表达式展开,得
e E( ) 2bE( ) 2aE() b E( ) 2abE( ) a .
2
2
2
e
e
利用二元函数求极值的方法,令
0, 0,即
a Copyright©b2006 NJUFE
2
e
2a 2bE ( ) 2 E ( ) 0,
a
e
2bE ( 2 ) 2 E ( ) 2aE ( ) 0.
b
a0,b0,
得
cov(, )
cov(, )
b0
,a0 E ( ) E ( )
.
D( )
D( )
解方程组求出使 e 达最小的常数
将 a0,b0 代入e 的表达式,经整理 可得
emin min E[( (a b ))2 ] E[( (a0 b0 ))2 ]
(1 r 2 ) D( ).
结论1:|r|越大,近似程度越好, 与之间存在线性关
系的程度越高,当r=0, 与之间不存在线性关系。
Copyright © 2006 NJUFE
注意 r 与 b 之间存在关系:
0
cov(, )
cov(, ) D( )
r
b0
D( )
D( ) D( )
D( )
结论2: 与正(负)相关当且仅当
r b0
b0
>0(
D( )
D( )
.
b0 <0),且
D( )
D( )
思考题4 (2001年数学一、三、四考研试题)
将一枚硬币重复掷 n 次,以 X 和 Y 分别表示正面向上和
反面向上的次数,则X 和 Y 的相关系数等于( )
(A) -1.
(B) 0.
(C )
1/2.
(D)
Copyright © 2006 NJUFE
1.
思考题5 (2001年数学三考研试题填空题)
设随机变量X和Y的数学期望分别为-2,2,方差分别为1
和4,而相关系数为-0.5,则根据切比雪夫不等式
P(|X+Y|6)
.
思考题6 (2003年数学三考研试题填空题)
设随机变量X和Y的相关系数为0.9,若Z=X-0.4,则Y与Z的
相关系数为
.
思考题7 (2003年数学四考研试题填空题)
设随机变量X和Y的相关系数为0.5,EX=EY=0,
EX 2 EY 2 2,
则 E( X Y )2
Copyright © 2006 NJUFE
例5 (2003年数学四考研试题十二题)
对于任意二事件A和B,0<P(A)<1,0<P(B)<1,
P( AB) P( A) P( B)
P( A) P( B) P( A) P( B)
称做事件A与B的相关系数。
(1) 证明事件A和事件B独立的充分必要条件是其相关系数等于
零;
(2) 利用随机变量相关系数的基本性质,证明||0.
,n )为n维随机变量,记
定义4.9 设 (1, 2,
称
ij cov(i, j ),i,j 1,
2,
,n,
C (ij )nn 为的协方差矩阵。
Copyright © 2006 NJUFE
n维正态分布的性质:
,n ) 服从n维正态分布的充分必要条件是:
1. (1, 2,
n
a
i 1
i
i
服从一维正态分布,其中
ai
,i=1,2,…n为常数。
,n )服从n维正态分布,令
2.设 (1, 2,
n
i aij j,i 1,
,m,
j 1
则
(1,2,
m )服从m维正态分布。
n ) 服从n维正态分布,则
3.设( 1, 2,
相互独立的充分必要条件是
1, 2,
n
1, 2,
n
两两不相关。
Copyright © 2006 NJUFE