4.4 协方差及相关系数
Download
Report
Transcript 4.4 协方差及相关系数
概率论与数理统计
课件制作:应用数学系
概率统计课程组
4.4
协方差及相关系数
4.4.1
协方差及相关系数的定义
4.4.1
协方差及相关系数的性质
问题 对于二维随机变量(X ,Y ):
已知联合分布
边缘分布
这说明对于二维随机变量,除了每个
随机变量各自的概率特性以外,相互之间
可能还有某种联系. 问题是用一个什么样
的数去反映这种联系.
数
E( X EX )(Y EY )
反映了随机变量X ,Y 之间的某种关系
4.4.1
协方差及相关系数的定义
定义 称 E ( X E ( X ))(Y E (Y ))
为X ,Y 的协方差. 记为
cov( X ,Y ) E ( X E ( X ))(Y E (Y ))
称
cov( X , Y )
D( X )
D(Y )
cov( X , Y )
为(X , Y )的协方差矩阵
可以证明协方差矩阵为半正定矩阵
协方差的大小在一定程度上反映了X和Y
相互间的关系,但它还受X与Y本身度量单位
的影响.
例如:
Cov(kX, kY)=k2Cov(X,Y)
为了克服这一缺点,对协方差进行标准化,
这就引入了相关系数 .
若D (X ) > 0, D (Y ) > 0 ,称
( X E ( X ))(Y E (Y )
cov( X , Y )
E
D( X ) D(Y )
D( X ) D(Y )
为X ,Y 的 相关系数,记为
XY
cov( X , Y )
D( X ) D(Y )
cov(
X
,
Y
)
事实上, XY
若 XY 0, 称 X ,Y 不相关.
无量纲
的量
4.4.2
协方差及相关系数的性质
协方差的性质:
(1) Cov ( X , Y ) Cov (Y , X )
(2) Cov (aX , bY ) ab Cov (Y , X )
a, b 为常数
(3) Cov ( X1 X 2 ,Y ) Cov ( X1 ,Y ) Cov ( X 2 ,Y )
相关系数的性质:
(1) | XY | 1
a 0 时 , XY 1
(2) 若Y aX b, 则
a 0 时 , XY 1
(3) XY 1 P(Y aX b) 1
(4) 若X , Y相互独立, 则 XY 0
注: XY 的大小反映了X ,Y之间的线性关系的密切程度
XY 0 时, X , Y之间无线性关系
XY 1时, X ,Y之间具有线性关系
XY 0 , X ,Y 相关
XY 0 , X ,Y 不相关
XY 0 , X ,Y 正相关
XY 0 , X ,Y负相关
( XY 1 , X ,Y 完全正相关 )
显然
( XY 1 , X ,Y 完全负相关 )
X , Y 独立 X与Y不相关 XY 0
Cov( X , Y ) 0 E ( XY ) EXEY
注: X ,Y不相关不一定有X ,Y 独立
若( X , Y )服从二维正态分布, 则
X , Y独立 X , Y不相关
协方差和相关系数的性质回顾
协方差的性质
cov( X , Y ) cov(Y , X ) E ( XY ) E ( X ) E (Y )
cov( aX , bY ) ab cov( X , Y )
cov( X Y , Z ) cov( X , Z ) cov(Y , Z )
cov( X , X ) D( X )
| cov( X , Y ) | D( X ) D(Y )
2
当D(X ) > 0, D(Y ) > 0 时,当且仅当
P(Y E (Y ) t0 ( X E ( X ))) 1
时,等式成立 —Cauchy-Schwarz不等式
证5 令
g (t ) E[(Y E (Y )) t ( X E ( X ))]2
D(Y ) 2t cov( X , Y ) t D( X )
2
对任何实数 t , g (t ) 0
4 cov 2 ( X , Y ) 4 D( X ) D(Y ) 0
即
| cov( X , Y ) | D( X ) D(Y )
2
等号成立
g (t0 ) 0 即
g (t ) 0 有两个相等的实零点
cov( X , Y )
D(Y )
t0
D( X )
D( X )
E[(Y E (Y )) t0 ( X E ( X ))] 0
2
又显然 E[(Y E (Y )) t0 ( X E ( X ))] 0
D[(Y E (Y )) t0 ( X E ( X ))] 0
P[(Y E (Y )) t0 ( X E ( X )) 0] 1
P[(Y E (Y )) t0 ( X E ( X )) 0] 1
即
P[(Y E (Y )) t0 ( X E ( X ))] 1
即Y 与X 有线性关系的概率等于1,这种线性
关系为
Y E (Y )
X E( X )
P
1
D( X )
D(Y )
完全类似地可以证明
E ( XY ) E ( X ) E (Y )
2
2
2
当E(X 2) > 0, E(Y 2 ) > 0 时,当且仅当
P(Y t0 X ) 1
时,等式成立
相关系数的性质
| XY | 1
| XY | 1
Cauchy-Schwarz不等式
的等号成立
即Y 与X 有线性关系的概率等于1,
这种线性关系为
Y E (Y )
X E( X )
P
1
D( X )
D(Y )
XY 1
cov( X , Y ) 0
Y E (Y ) X E ( X )
P
1
D( X )
D(Y )
PY X 1
XY 1
cov( X , Y ) 0
Y E (Y )
X E( X )
P
1
D( X )
D(Y )
PY X 1
若X , Y 是两个随机变量,用X 的线性函数去
逼近 Y 所产生的平均平方误差为
E[Y (aX b)]
2
当取 aˆ cov( X , Y ) ,
D( X )
bˆ E (Y ) aˆE ( X )
E (Y ) XY
平均平方误差最小.
D(Y )
E(X)
D( X )
协方差和相关系数的计算
—— 利用函数的期望或方差计算协方差
cov( X , Y ) E ( XY ) E ( X ) E (Y )
1
D( X Y ) D( X ) D(Y )
2
若 ( X ,Y ) 为离散型,
cov( X , Y ) ( xi E ( X ))( y j E (Y )) pij
i 1 j 1
若 ( X ,Y ) 为连续型,
cov( X , Y ) ( x E ( X ))( y E (Y )) f ( x, y )dxdy
例4.4.1
已知 X ,Y 的联合分布为
X
1
0
Y
1
p
0
0
0
q
0 < p <1
p+q=1
求 Cov (X ,Y ), XY
解:
X
1
0
Y
1
0
XY
1
0
P
p
q
P
p
q
P
p
q
EX p,
EY p
DX pq, DY pq
E ( XY ) p
Cov ( X , Y ) E ( XY ) EXEY pq
XY
Cov ( X , Y )
1
DX DY
例4.4.2 设 X 的概率密度函数为
1 x
f ( x) e
, x ( , )
2
(1) 求 X 的期望 EX 和方差 DX
( 2) 求 X 与 X 的协方差和相关系数,并问
X 与 X 是否相关?
(3)问 X 与 X 是否相互独立?说明理由
1 x
解: (1) EX x e dx 0
2
2
2
DX EX (EX ) x 2 1 e x dx 0
2
2 1 x
2 x e dx 2
0
2
( 2) Cov( X , X ) E ( X X ) EX E X
1 x
x x e dx 0 0
2
Cov( X , X )
X X
0 所以X与 X 不相关
DX D X
( 3) 独立性由其定义来判断
对于任意的常数a 0, 事件( X a ) ( X a ),
且P ( X a ) 0, P ( X a ) 1,因此有
P ( X a, X a ) P( X a )
P( X a)P( X a) P( X a)
所以 P ( X a , X a ) P ( X a ) P ( X a )
故 X与 X 不独立
例4.4.3
设 X 和 Y 是相互独立的随机变量, 都服从
正态分布 N (0, 2 ) , 又 aX bY , aX bY
(1) 求 与 的相关系数
( 2) 问 ,
是否相关?是否独立?
( 3) 当 ,
相互独立时 , 求 ( , ) 的联合密度函数
解: (1) X ~ N (0, ) , Y ~ N (0, )
2
2
EX EY 0, DX DY
2
E E (aX bY ) aEX bEY 0
E E (aX bY ) aEX bEY 0
已知X , Y相互独立, 所以aX , bY也相互独立
故有 D D(aX bY ) a 2 DX b 2 DY
(a 2 b 2 ) 2
2
2
a
DX
b
DY
D D(aX bY )
(a 2 b 2 ) 2
E ( ) E (a 2 X 2 b 2Y 2 ) a 2 EX 2 b 2 EY 2
(a 2 b 2 ) 2
所以
a 2 b2
Cov( , )
E ( ) EE
2
2
a
b
D D
D D
(2) 当 a b 时, 0
当 a b 时, 0
, 不相关
, 相关
由于 X , Y 都服从正态分布且相互独立 ,
, 为X , Y的线性组合
所以 , 都服从正态分布N (0,
(a 2 b2 ) 2 )
在正态分布中, 不相关与独立是等价的
所以当 a b 时,
, 独立
当 a b 时, , 不独立
( 3) 当 , 相互独立时,即a 2 b 2 , , 都服从
正态分布 N (0,2a 2 2 )
f ( s )
f ( t )
1
2 2 a
1
2 2 a
e
e
s2
22 a 2 2
t2
2 2 a 2 2
s2 t 2
2 2
1
4a
所以 f ( s, t )
e
4 a 2 2
XY 0
X , Y 不相关
cov( X , Y ) 0
E ( XY ) E ( X ) E (Y )
D( X Y ) D( X ) D(Y )
X , Y 相互独立
X , Y 不相关
若 X , Y 服从二维正态分布,
X , Y 不相关
X , Y 相互独立
X和Y独立时, =0,但其逆不真.
由于当X和Y独立时,Cov(X,Y)= 0.
故
Cov( X , Y )
=0
D( X ) D(Y )
但由 0 并不一定能推出X和Y 独立.
请看下例.
例4.4.4 设X服从(-1/2, 1/2)内的均匀分布,而
Y=cos X, 不难求得,
Cov(X,Y)=0,
(请课下自行验证)
因而 =0,
即X和Y不相关 .
但Y与X有严格的函数关系,
即X和Y不独立 .
课堂练习
设随机变量 X与Y满足 DX 0, DY 0,
E ( XY ) EXEY , 则(A )
( A) X与Y不相关
( B ) X与Y相关
(C ) X与Y相互独立
( D ) X与Y不独立