Transcript 第22讲

第二十二讲 复习
此幻灯片可在网址
http://www.appmath.cn
上下载
1
(1)求导公式
(C )  0 (C 是常数)

 1

(x )   x
(是实数)
(e )  e
x
x
x

( a )  a ln a ( a  0, a  1)
x
(log a x ) 
1
( a  0, a  1)
x ln a
(sin x )  cos x
(cos x )   sin x
2
(arcsin x) 
1
1 x
1
(arccos x)  
(arctan x ) 
2
1 x
2
1
1 x
(arc cot x)  
2
1
1 x
2
3
复合函数求导法则:设u=j(x)在x是可导,
y=f(u)在对应点u=j(x)处可导,则复合函数
y=f(j(x))处可导,且
dy
dx

dy
du

du
 f (u )j ( x)
dx
4
概率论中用到导数的地方:
1,连续随机变量X的分布函数F(x)与概率密度
函数f(x)有关系:
f ( x )  F ( x )
2,在求解最大似然估计时,要求似然函数L(q)
的最大值,需要求L对参数q的导数或者偏导.
5
基本积分公式
d x  x  C

x
d
x


x
 1
 1
 C (  1)
1
 x d x  ln | x | C
a
e
x
x
dx
a
x
C
ln a
dx e C
x
6
e
 x
 xe
dx
 x
1

dx
e
 x
C
 x  1

2
e
 x
C
2

x
2x
2   x
2  x
 x e d x       2   3 e  C


 sin x d x   cos x  C
 cos x d x  sin x  C
7
积分上限的函数的有关性质
(1) 可导性:若 f(x)在[a,b]上连续,则
x
F ( x )   f (t ) d t 在[a,b]上可导,
a
F ( x ) 

  f ( x) .

x
f (t ) d t
a
(2) 原函数存在定理:若 f(x)在[a,b]上连续,
x
则 F ( x )   f (t ) d t 是 f(x)在[a,b]上的一个原函
a
数.
8
定积分的计算法
(1)牛顿-莱布尼兹公式:设 f(x)在[a,b]上连续,
且 F ( x )  f ( x ) 则

b
f ( x ) d x  F (b)  F ( a )
a
(2)换元法:
设 f(x)在[a,b]上连续,
x=j(t)在[,]
上有连续的导数,且当 t 从变到时, j(t)从
j()=a 单调地变到j()=b,则

b
a

f ( x ) d x   f (j (t ))j (t ) d t

9
(3) 分部积分法:设u(x),v(x)在[a,b]上有连续
的导数,则

b
a
b
b
u d v  uv a   v d u
a
10
概率论中用到积分的地方:如果随机变量X
的概率密度函数为f(x), 则它的分布函数为

F ( x) 
x

f (t ) d t
而X落在区间[a,b]或[a,b)或(a,b]或(a,b)的概率
b
为

f ( x) d x
a
还有
E( X )  


E( X )  
2
xf ( x ) d x


2
x f ( x) d x
D ( X )  E ( X )  [ E ( X )]
2
2
11
还有
E [j ( x )] 



j ( x) f ( x) d x
12
习题4-1 6. 设随机变量X的分布函数

a
1  3 ,
F ( x)  
x
 0,

3
x…a ,
其 中 a  0.
x  a,
求E(X), D(X).
解: 首先求出X的概率密度函数
 3 a 3 x 4 ,
f ( x )  F ( x )  
 0,
x…a ,
x  a.
13
 3 a 3 x 4 ,
f (x)  
 0,
x…a ,
x  a.
则
E(X ) 



 3a
3

xf ( x ) d x 

x
3


x3a x
 0  3a
1
d x  3a
2
a
2

4
dx
a
3
3
1
3  1
a
3
3

x
2
a
a
2
14
4
3a x ,
f (x)  
 0,
3
x…a ,
3
E(X ) 
x  a.
a
2
计算E(X2)
E(X ) 
2

 3a


3

x f (x) d x 
2

x
2
d x  3a


2
3
x 3a x
dx
a
3
a
x 
1

2
2
 3a
2
a
D ( X )  E ( X )  [ E ( X )]  3 a 
2
4
9
a
2
4

3
a
2
4
15
二重积分计算法
1.若D为矩形区域R:axb,cyd, 则
 f ( x, y ) d x d y  
b
a
d
d x  f ( x, y ) d y
c
R
d
b
  d y  f ( x, y ) d x
c
a
16
2. 若区域D是由两条直线x=a,x=b及两条曲线
y=j1(x),y=j2(x)[j1(x)j2(x),axb]所围成,则

f ( x, y ) d x d y 

b
a
d x
D
j2 ( x )
j1 ( x )
f ( x, y ) d y
若区域D是由两条直线y=c,y=d及两条曲线
x=y1(y),x=y2(y)[y1(y)y2(y),cyd]所围成,
则
 f ( x, y ) d x d y  
d
c
D
d y
y 2 ( y)
y1 ( y )
f ( x, y ) d x
17
 f ( x, y ) d x d y  
b
a
D
d x
j2 ( x )
j1 ( x )
f ( x, y ) d y
经常遇到的题就是j1(x),j2(x)中有一个是常数,
另一个是直线函数, 经常遇到的概率论中的例
子如下面一些图形表示:
18
19
二重积分在概率论中的用处:
假设随机变量(X,Y)的联合概率密度为f(x,y),
则(X,Y)落在任何区域里的概率为
 f ( x, y ) d x d y
D
此外还有 E ( X ) 

 
E (Y )  





E( X )  
2




E (Y )  
2




xf ( x, y ) d x d y
yf ( x, y ) d x d y





2
x f ( x, y ) d x d y
2
y f ( x, y ) d x d y
20
E ( XY )  





E[j ( X , Y )]  
xyf ( x, y ) d x d y





j ( x, y ) f ( x, y ) d x d y
D ( X )  E ( X )  [ E ( X )]
2
2
D (Y )  E (Y )  [ E (Y )]
2
2
cov( X , Y )  E ( XY )  E ( X ) E (Y )
 XY 
cov( X , Y )
D ( X ) D (Y )
21
D ( X )  E ( X )  [ E ( X )]
2
2
D (Y )  E (Y )  [ E (Y )]
2
2
cov( X , Y )  E ( XY )  E ( X ) E (Y )
 XY 
cov( X , Y )
D ( X ) D (Y )
22
习题4-3 3. 设二维随机变量(X,Y)在由x轴, y轴
及直线x+y2=0所围成的区域G上服从均匀分
布, 求X与Y的相关系数XY.
解 如图所示, G的面积为2, 所以概率密度函数
在此区域内取常数1/2, 即
1
 ,
f ( x, y )   2
 0,

0  x  1, 0  y  2  x ,
其 它.
23
由x轴, y轴及直线x+y-2=0所围成的区域G, 因
此可以确定积分限, 这是最重要的!
y
2
 
0
O
2 x
(
)d y d x
0
x
24

 



(YXY)))) 
EE(YX
22
f ( x, y ) d x d y  
2
 
0
2 x
0
xy xyxy 
22
2
0
1
2

2 x
0
1
d yd x 1
2
d yd x 
2 21
33
25
E(X ) 
2
, E (Y ) 
3
E ( XY ) 
2
,E(X ) 
2
3
2
, E (Y ) 
2
3
2
3
1
3
则
cov( X , Y )  E ( X Y )  E ( X ) E (Y ) 
D ( X )  E ( X )  [ E ( X )] 
2
2
D (Y )  E (Y )  [ E (Y )] 
2
2
2

1
3
4


4
9
2
3
9
9
2
4
2
3

9


1
9
9
26
cov( X , Y )  
1
, D ( X )  D (Y ) 
9
最后得
2
9
cov( X , Y )
 XY 
D ( X ) D (Y )

1
9

2
9


2
1
2
9
27
样本均值和样本方差的计算
x 
1
n
x ,s

n
i
2

i 1
1
n
(x

n 1
i
 x)
2
i 1
样本方差的简便算法:
s 
2
1
n 1
n
(  x  nx )
2
i
2
i 1
一些科学型计算器可以统计样本均值和
样本标准差.
28
第一步:先按这两
个键进入stat状态
第三步:然后按x
和S键可查看样
本均值和样本标
准差
第二步:然后每按
一个数就按DATA
键
29
第一步:按MODE,2
键进入SD状态,并按
shift,CLR,1,=键清零
第二步:每按一个数
字后按DT键
第三步:按shift,2,1,=
键得样本均值, 按
shift,2,3,=键得样本标
准差
30
各种科学型计算器计算样本标准差和样本均
值的操作办法各不相同, 可在百度上将计算器
的型号输入查找, 就可以找到网上的说明书,
主要是背诵并练习几次快速计算样本标准差
和样本均值的技术, 这样考试的时候可以节省
计算的时间.
尤其要注意当计算样本标准差的时候, 有的计
算器是有除以n和除以n1两种的, 我们需要计
算的是后者.
31
最大似然估计法
对离散型总体, 似然函数为
n
L (q ) 

p ( xi ,q )
i 1
对连续型总体, 似然函数为
n
L (q ) 

f ( xi ,q )
i 1
求使lnL(q)最大的q值就是q的最大似然
估计.
32
对数的性质:
如果a=eb, 则ln a = b
ln ab = ln a + ln b
ln ab = b ln a
33
最大似然估计法的一个经验之谈:
写出似然函数后不要先整理再取对数再求导
再令导数等于零,
而是写出似然函数后先取对数再求导再令导
数等于零这个时候再整理.
34
例如, 第156页书上例5, 假设总体的分布为参
数是l的指数分布, 要求对l的最大似然估计,
则总体的概率密度为
f ( x)  l e
lx
因此似然函数为
n
L

n
f ( xi ) 
i 1
( x  0)
le
 l xi
i 1
这个时候书上的标准例子经常就进一步写成:
n
n

le
 l xi
l
l e
n
 xi
i 1
i 1
我把这一步叫整理并认为是没有必要做的.
35
建议的做法, 在得到
n
L

n
f ( xi ) 
i 1
le
 l xi
i 1
之后, 不整理立即就取对数得
n
ln L 
 ln  l e
i 1
 l xi
n
   (ln l  l x )
i
i 1
不需要进一步整理, 而是立即求lnL的导数
d ln L
dl
n


i 1
1

  xi 
l

36
d ln L
dl
1

  xi 
l

n


i 1
然后令此导数等于0, 给出似然方程并整理:
n
l
最后得到
n

lˆ 
x
i
0
i 1
n

n
x
1
x
i
i 1
37
习题7-1 5. 设总体X具有概率密度
q x q  1 ,
f ( x)  
 0,
0  x  1,
其 它,
(q  0 ).
(1) 求q的矩估计, (2) 求q的极大似然估计.
解: (1) 总体一阶原点矩为
E(X ) 

q
1
xq x
q 1
dx q
0
1
q 1
1
x
q 1

0

1
q
x dx
0
q
q 1
38
q
E(X ) 
q 1
令它等于一阶样本原点矩A1, 得方程
q
q 1
 A1 ,
q  A1q  A1
(1  A1 )q  A1 ,
q 
A1
1  A1

x
1 x
39
q 1
q x ,
f ( x)  
 0,
0  x  1,
其 它,
(q  0 ).
(2) 求q的极大似然估计.
似然函数
n
L
qx
q 1
i
i 1
不整理直接取对数得
n
ln L 
 [ln q
 (q  1) ln x i ]
i 1
40
n
 [ln q
ln L 
 (q  1) ln x i ]
i 1
求导得
d ln L
dq
n


i 1
1
 n
 ln x i  
q
 q


n
 ln x
i
i 1
令它等于0得似然方程
n
q
n

 ln x
i 1
i
 0 解得
qˆ  
n
n
 ln x
i
i 1
41
无偏估计:
E (qˆ )  q
有效性 设 qˆ1 和 qˆ2 是q的两个无偏估计量, 如
果
D (qˆ1 )  D (qˆ2 )
则称 qˆ1 较 qˆ2 有效.
42
单正态总体的抽样分布
X ~ N (  ,  / n );
2
n 1

2
X 
 /
~ N (0,1);
n
S ~  ( n  1);
2
2
2
X与 S 相 互 独 立
X 
S/
~ t ( n  1)
n
43
常用统计分布
设X1,X2,…,Xn是取自总体N(0,1)的样本,
则称统计量
  X  X 
2
2
1
2
2
 X
2
n
服从自由度为n的2分布, 记为2~2(n).
E(2)=n, D(2)=2n.
44
设X~N(0,1), Y~2(n), 且X与Y相互独立, 则
称
X
t
Y /n
服从自由度为n的t分布, 记为t~t(n).
45
设X~2(m), Y~2(n), 且X与Y相互独立, 则
称
F 
X /m
Y /n

nX
mY
服从自由度为(m,n)的F分布, 记为F~F(m,n),
性质, 若X~t(n), 则X2~F(1,n);
若F~F(m,n)则 1
~ F ( n , m ),
F
F ( m , n ) 
1
F1   ( n , m )
46
对单正态总体X~N(,2)作对均值的区间估计
的公式(显著性水平):
当2已知时:




u , x 
u 
x 
2
2
n
n


当2未知时:
S
S


t  ( n  1), x 
t  ( n  1) 
x 
n 2
n 2


47
单正态总体的假设检验(X~N(,2))
检验假设H0:=0,H1:0 , 如2未知, 接
受域:
x  0
s/
n
 t / 2 ( n  1)
如2已知, 则接受域为:
x  0
 /
n
 u / 2
48
数学期望(均值)
离散型:
E(X ) 

x
i
pi
i 1
连续型:
E(X ) 



xf ( x ) d x
49
随机变量函数的数学期望(设Y=g(X))
离散型:

E (Y )  E [ g ( X )] 
 g(x ) p
i
i
i 1
连续型:
E (Y ) 



g ( x) f ( x) d x
50
二维随机变量函数的数学期望
离散型:

E [ g ( X , Y )] 

  g(x , y
i
j
) p ij
j 1 i 1
连续型:
E [ g ( X , Y )] 

 



g ( x, y ) f ( x, y ) d x d y
51
数学期望的性质
E(C)=C;
E(CX)=CE(X)
E(X+Y)=E(X)+E(Y)
如X,Y独立, E(XY)=E(X)E(Y)
52
方差
D(X)=E[XE(X)]2=E(X2)[E(X)]2
协方差
cov(X,Y)=E{[XE(X)][YE(Y)]}
=E(XY)E(X)E(Y)
相关系数
 XY 
cov( X , Y )
D ( X ) D (Y )
53
性质:
cov(X,Y)=0称为X,Y不相关.
独立一定不相关,不相关不一定独立.
D(C)=0; D(CX)=C2D(X);
D(XY)=D(X)+D(Y)2cov(X,Y);
特别, 当X与Y独立或者不相关, 必有
D(XY)=D(X)+D(Y)
cov(X,X)=D(X); cov(X,Y)=cov(Y,X);
cov(aX,bY)=abcov(X,Y);cov(C,X)=0;
cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y);
|XY|1
54
切比雪夫不等式
P { | X  E ( X ) | … }„
D(X )
P { | X  E ( X ) |  }„ 1 

2
D(X )

2
55
常用离散型分布
分布
参数
0-1
分布
二项
分布律
k
0<p<1
P{X=k}=p (1p)
泊松
分布
p
p(1p)
np
np(1p)
1k
P{ X  k }  Cn p (1  p )
k
n1
k  0,1,
k
N,M,n
nM
l>0
P{ X  k } 
nk
CM C N  M
C
k  0,1,
nk
,n
k
分布
方差
k=0,1
分布 0<p<1
超几何
数学期望
n
N
,n
P{ X  k } 
nM
略
N
l k el
k!
l
l
k  0,1,
56
常用连续型分布
分布
参数
概率密度
a<b
 1
,a xb

f ( x)   b  a
0,
其它

均匀
分布
正态
分布
指数
分布
,>0
q>0
f ( x) 
1
2 

e
( x )
2
数学期望
方差
ab
(b  a )
2
12

2
q
q2
2
2
 1  x /q
, x0
 e
f ( x )  q
0,
其它

57
2
n维正态分布的几个重要性质
1. n维正态变量的每一个分量都是正态变
量; 如果有n个变量都是正态变量且相互
独立, 则它们是n维正态变量.
2. n维正态变量的任意线性组合均服从一
维正态分布.
3. n维正态变量线性变换为k维变量,则这
k维变量服从k维正态分布.
4. n维正态变量两两不相关等价于它们两
两独立.
58
随机变量的分布函数
X是一个随机变量, 称
F(x)=P{Xx} (<x<+)
为X的分布函数, 有时记作X~F(x)或FX(x).
性质: 单调非减, F()=0, F(+)=1, 右连
续.
59
离散型随机变量的分布率
设离散型随机变量X的所有可能取值为
xi(i=1,2,…),
P{X=xi)=pi, i=1,2,…
称为X的概率分布或分布密度, 也称概率
函数. 常用表格形式来表示X的概率分布:
X
x1
x2

xn

pi
p1
p2

pn

p i  0, i  1, 2,

pi  1
i
60
连续型随机变量及其概率密度
如果对随机变量X的分布函数F(x), 存在
非负可积函数f(x), 使得对于任意实数x有
F ( x )  P { X  x} 

x

f (t ) d t
称X为连续型随机变量, 称f(x)为X的概率
密度函数, 简称为概率密度或密度函数.
f (x)  0



P { a  X  b} 

f ( x) d x  1
b
f (x) d x
a
61
当一个题目给定一连续型随机变量X的分布
函数F(x), 却要求随机变量的数学期望时, 需
要先对F(x)求导以得到概率密度函数
f(x)=F '(x)
62
连续型随机变量函数的分布
设已知X的分布函数FX(x)或概率密度函
数fX(x), 则Y=g(X)的分布函数可按下面办
法求得:
FY(y)=P{Yy}=P{g(X)y}=P{XCy}.
其中
Cy={x|g(x)y}
而
FY ( y )  P { X  C y } 

Cy
f X (x) d x
进而可通过Y的分布函数FY(y), 求出Y的
密度函数.
63
尤其是, 设随机变量X具有概率密度fX(x),
在区间[a,b]外恒等于0, (a可以是-,b可以
是+), 假设函数y=g(x)在[a,b]上恒有
g'(x)>0或恒有g'(x)<0, 则Y=g(X)的概率密
度为
 f [ h ( y )] | h  ( y ) |,   y  
fY ( y )  
其它
 0,
其中h(y)是g(x)的反函数,
=min{g(a),g(b)}, =max{g(a),g(b)}.
64
边缘概率密度
当连续型随机变量(X,Y)的概率密度为f(x,y)时,
X和Y的边缘概率密度为
f X (x) 
fY ( y ) 




f ( x, y ) d y,


f ( x, y ) d x
当X,Y相互独立时, f(x,y)=fX(x)fY(y)
65
若(X,Y)的概率密度为f(x,y), 则Z=X+Y的概率密
度为
fZ (z) 







f (z  y, y) d y
f ( x, z  x) d x
66
设X1,X2,…,Xn是相互独立的随机变量, 且具有
相同的分布函数F(x)时,
M=max(X1,X2,…,Xn)及N=min(X1,…,Xn)的分布
函数为
Fmax(z)=[F(z)]n
Fmin(z)=1[1F(z)]n
67
表 1-1-2 事件运算与集合运算对照表
记号
概率论
集合论
S
样本空间
全集

不可能事件
空集
e
基本事件
元素
A
事件
子集
A
A 的对立事件
A 的余集
AB
事件 A 发生导致事件 B 发生
A 是 B 的子集
A=B
事件 A 与事件 B 相等
A 与 B 的相等
AB
事件 A 与事件 B 至少有一个发生
A 与 B 的和集
AB
事件 A 与事件 B 同时发生
A 与 B 的交集
AB
事件 A 发生而事件 B 不发生
A 与 B 的差集
AB=
事件 A 和事件 B 互不相容
A 与 B 没有相同的元素
68
如事件A与事件B互不相容,
P(A+B)=P(A)+P(B)
乘法法则
P(AB)=P(A)P(B|A)
如A与B独立
P(AB)=P(A)P(B)
一般的加法法则, 对任何事件A,B
P(A+B)=P(A)+P(B)P(AB)
这四个事件中知道三个, 就能够算出另一
个.
69
还需要记住
P ( A )  1  P ( A)
P ( A  B )  P ( A)  P ( AB )
P(A
B
C )  P ( A )  P ( B )  P (C )  P ( A B )
P (BC )  P ( AC )  P ( ABC )
P(A
B
C )  1  P ( ABC )
70
在证明题中常用的不等式:
如AB, 则P(A)P(B), 例如P(A)P(AB)
P(A)0, P(A)1, P(A)+P(B)P(AB)
要记住条件概率的定义
P ( B | A) 
P ( AB )
P ( A)
71
由概率的关系通常推导不出事件的关系
如A=, 必有P(A)=1,
如P(A)=1, 未必A=,
如A=, 必有P(A)=0,
如P(A)=0, 未必A=,
如AB, 必有P(AB)=P(B),
如P(AB)=P(B), 未必AB.
但是如果P(AB)=P(A)P(B), 则A,B独立.
72
全概率公式
定理1 设A1,A2,,An,是一个完备事件组,
且P(Ai)>0, i=1,2,, 则对任一事件B, 有
P(B)=P(A1)P(B|A1)++P(An)P(B|An)+
特别地, 对事件A及它的逆组成的完备事件
组, 有
P ( B )  P ( A) P ( B | A)  P ( A ) P ( B | A )
73
定理2 设A1,A2,,An,是一完备事件组, 则
对任一事件B, P(B)>0, 有
P ( Ai | B ) 
P ( Ai B )
P(B)

P ( Ai ) P ( B | A i )
 P(A
j
)P(B | Aj )
j
i  1, 2,
,
(4.6)
上述公式称为贝叶斯公式.
74
对一个事件A和它的逆组成的完备事件
组,贝叶斯公式的形式是
P(A | B) 
P ( B | A) P ( A)
P ( B | A) P ( A)  P ( B | A ) P ( A )
75
重要的复习题:
第27页习题1-3 12. 13. 14.
第37页总习题 19.
第61页 习题2-5 3. 4. 5.
第75页 习题3-3 5.(1)
第86页 习题3-5 3.
第100页 习题4-1 6.
第110页 习题4-2 14.
第113页 习题4-3 3. 5.
还有数理统计所有出过的作业, 有关查表的题
目不用做.
76