第三节连续型随机变量

Download Report

Transcript 第三节连续型随机变量

2.3 连续型随机变量
教学要求
与
重点难点
教学内容
第2章 随机变量
 理解概率密度的概念、性质
教
学
要
求
与
重
点
、
难
点
 了解三种常用连续型分布
 掌握 均匀分布、正态分布的
特点、应用
重点:概率密度性质;正态分布
难点:正态分布性质
第2章 随机变量
2.3 连续型随机变量
一、连续型随机变量的概念与性质
二、常见连续型随机变量的分布
三、小结
第2章 随机变量
一、连续型随机变量的概念与性质
1、直方图
数理统计学中研究连续型随机变量的
分布时,通常把随机变量的观测值所分布
的区间划分为若干个相邻的小区间,然后
将观测值分组,记录观测值落在各个区间
的数据,用它除以总数据就可以得到随机
变量落在各个区间的频率分布表,然后用
直方图形式表示出来.
第2章 随机变量
引例 从某中学随机抽取了60名学生,测量他
们的身高,测量结果如下(单位:cm),
分析他们的身高分布情况
167
159
158
162
158
162
154
156
158
162
160
162
159
166
153
159
165
159
166
160
158
154
158
157
169
164
164
165
163
159
159
160
158
166
163
149
第2章 随机变量
156
157
163
157
162
164
166
156
158
151
161
168
162
157
153
146
154
159
158
161
157
151
165
153
分析
数据从表面看是离散的,但身高可能的取
值是一定范围内的实数,所以“身高”作
为随机变量就不是离散型随机变量.
我们从频率的角度分析身高的分布情况
第2章 随机变量
(1)通过观察,数据区间为[146,169];
(2)将区间 [145.5,169.5]均分为8个区间;
[145.5,148.5]
[151.5,154.5]
[157.5,160.5]
[163.5,166.5]
[148.5,151.5]
[154.5,157.5]
[160.5,163.5]
[166.5,169.5]
(3)得到频数(率)分布表;
第2章 随机变量
分组
145.5~148.5
148.5~151.5
151.5~154.5
154.5~157.5
157.5~160.5
160.5~163.5
163.5~166.5
166.5~169.5
合计
频数
1
3
6
8
18
11
10
3
60
第2章 随机变量
频率
0.017
0.050
0.100
0.133
0.300
0.183
0.167
0.050
1.000
频率分布直方图
身高
0.35
145.5~148.5
148.5~151.5
151.5~154.5
154.5~157.5
157.5~160.5
160.5~163.6
163.5~166.5
166.5~169.5
0.3
0.25
0.2
0.15
0.1
0.05
0
1
第2章 随机变量
令纵坐标为频率/组距,得下列直方图
身高
0.12
145.5~148.5
148.5~151.5
151.5~154.5
154.5~157.5
157.5~160.5
160.5~163.6
163.5~166.5
166.5~169.5
0.1
0.08
0.06
0.04
0.02
0
1
X 取值在[157.5,160.5]的概率近似0.1×3=0.3
第2章 随机变量
这样得到的直方图可以近似反映学生身高的分
布情况,如果增加被测学生的人数,同时让分
组尽可能地细分,可以设想,数据越多,分得
越细,直方图的外形轮廓就越接近一条曲线,
用这条曲线就可以准确刻划随机变量——学生
身高的分布情况,曲线下方的面积,就是X落
在该区间上的概率。
这条曲线,称为概率密度函数 f(x).

b
a
f ( x)dx
就是X落在(a,b]上的概率
第2章 随机变量
2、连续型随机变量与概率密度的定义
定义2.4
设F(x)是随机变量X的分布函数,
若存在非负的f(x),使得对于任意的实数x,有
F ( x)  
x

f (t ) d t ,
则称X为连续型随机变量,其中f(x)为随机变
量X的概率密度函数(简称为密度函数).
第2章 随机变量
思考
为什么f(x)称为概率密度函数呢?
x  x
P{x  X  x  x}  x
上式除以 x
f ( x)dx
x  x
f ( x)dx f ()x
P{x  X  x  x} x

 f ( )

x
x
x
P{x  X  x  x}
 f ( x)
若f(x)连续,lim
x  0
x
f(x)是平均概率的极限,所以称概率密度函数
第2章 随机变量
3.概率密度函数性质
(1) f ( x)  0 ;
S


(2)



f ( x )d x  1;
f ( x)
f ( x )d x  1
1
o
注:随机变量的概率密度函数的图像位于x
轴上方,而且与x轴所围面积为1
第2章 随机变量
x
x2
(3) P{x1  X  x2 }   f ( x)dx
x1
x2
S1   f ( x) d x
f ( x)
x1
1
o
S1
 
x1 x 2
注:随机变量落在 [ x1 x2 ]上的概率就是图示曲
边梯形的面积
第2章 随机变量
x
(4) 若f ( x )在点x处连续,则F ( x )  f ( x ).
证明
F ( x )  P{ X  x }  
x

f (t ) d t ,
在f ( x )的连续点x处,有
F ( x  x )  F ( x )
f ( x )  lim
 F ( x ).
x  0
x
第2章 随机变量
(5)连续型随机变量取 某数值a 的概率等于零.
即
证明
P{ X  a }  0.
P { X  a }  lim 
a  x
x  0 a
f ( x ) d x  0.
由此可得,
P {a  X  b }  P {a  X  b}  P {a  X  b}
 P {a  X  b}.
第2章 随机变量
注意
若X是连续型随机变量,{ X=a }是不
连
续
型
可能事件,则有
P { X  a }  0.
若 P{ X  a }  0,
则不能确定{ X  a } 是不可能事件
离
散
型
若 X 为离散型随机变量,
{ X  a } 是不可能事件  P{ X  a }  0.
第2章 随机变量
4.连续型随机变量的分布函数及计算公式
F ( x )  P{ X  x}  
x

f (t ) d t ,
a
P{ X  a }   f ( x ) d x ,
P{ X  a }  1  P{ X  a }

a


  f ( x) d x   f ( x) d x



f ( x)d x  

a

f ( x)d x 
 f ( x ) d x.
第2章 随机变量
a
例1 设随机变量X的概率密度函数为
ke 3 x , x  0
f ( x)  
 0, x  0
求:(1)常数k;
(2)X的分布函数F(x);
(3)P{X>0.1}
解 (1) 由 


f ( x ) d x  1,
第2章 随机变量
得


0
3 x
ke
d x  1, 解之得 k  3.
(2) 由 k  3 知 X 的概率密度为
3e , x  0
f ( x)  
 0, x  0
3 x
第2章 随机变量
由 F ( x)  
x

f (t ) d t , 得
1  e , x  0,
F ( x)  
x  0.
 0,
3 x
(3) P{X  0.1}  1  P{ X  0.1}
 1  F (0.1)  1  (1  e0.3 )  e0.3
第2章 随机变量
例2
设连续型随机变量 X 的分布函数为
x  a,
0,

x
F ( x )   A  B arcsin ,  a  x  a ,
a

x  a.
1,
求 : (1) 系数 A, B 的值;
a
( 2) P{ a  X  };
2
( 3) 随机变量 X 的概率密度.
第2章 随机变量
解 (1) 因为 X 是连续型随机变量, 所以F ( x ) 连续,
故有 F ( a )  lim F ( x ),
x  a
F (a )  lim F ( x ) ,
xa
即
  a   A   B  0,
A  B arcsin

2
 a 
 a   A   B  1,
A  B arcsin 
2
a
第2章 随机变量
1
解之得 A  ,
2
1
B .

x  a,
0,

x
1 1
所以 F ( x )    arcsin ,  a  x  a ,
a
2 
x  a.

1,
第2章 随机变量
a
a
( 2) P {  a  X  }  F ( )  F (  a )
2
2
1 1
a
  arcsin( )  0
2 π
2a
1 1 π 2
    .
2 π 6 3
( 3) 随机变量 X 的概率密度为

1  a 2  x 2 ,  a  x  a ,
f ( x )  F ( x )  
其他.

0 ,
第2章 随机变量
二、常见连续型随机变量的分布
1. 均匀分布
X ~ U [a , b]
随机变量 X 的概率密度函数为
 1
, a  x  b,

f ( x)   b  a

其它,
 0,
f ( x)
概率密度
函数图形

a
第2章 随机变量
o

b
x
均匀分布的意义
在区间(a, b) 上服从均匀分布的随机
变量 X ,
落在区间(a, b)中任意等长度的子区间
内的可能
性是相同的.
f ( x)
l
p
ba
l






1
l

a
ba
o
落在某区间的概率与区间长度成正比
与区间位置无关
第2章 随机变量

b
x
分布函数
x  a,
0,
 x  a
F ( x)  
, a  x  b,
b  a
x  b.
1,
第2章 随机变量
F ( x)
1

a o

b
x
例3 每天整点甲站都有汽车发往乙站.一位乘
客在9点到10点之间随机到达甲站.求他
的候车时间小于30分钟的概率
解 设他9点X分到达车站,则 X ~ U [0,60]
且
1
 ,0  x  60
f ( x)   60
 0,
其他
候车时间小于30分钟,即就是 30  X  60
P{30  X  60}  
60
30
1
f ( x)dx 
2
1
他候车时间小于30分钟的概率为 2
第2章 随机变量
2. 正态分布(或高斯分布)
定义设连续型随机变量
X 的概率密度为
1
f ( x) 
e
2 πσ
( x μ )2

2σ 2
,    x  ,
其中 μ, σ (σ  0) 为常数,
则称 X 服从参数为μ, σ 的正态分布
或高斯分布, 记为
X ~ N ( μ, σ ).
2
第2章 随机变量
正态分布的概率密度函数的图形特点
(1) 曲线关于 x  μ 对称;
说明 P{  h  X  }  P{  X    h}
第2章 随机变量
) )
(
(2) f ( x)在  ,  上单调增加
(
在 ,  上单调减小
1
当x  μ时, f ( x)取 得 最 大 值
;
2 πσ
根据曲边梯形的面积,相等长度的区间,
区间距离μ越远,落在区间上的概率越小。
(3) 曲线以x 轴为渐近线
;
第2章 随机变量
(4) 当 固 定σ , 改 变 μ 的 大 小 时,
f ( x) 图 形 的 形 状 不 变
,只是沿
着 x 轴作平移变换
;
第2章 随机变量
(5) 当 固 定 μ, 改 变 σ 的 值, f ( x) 图 形 的
对 称 轴 不 变, 而 形 状 在 改 变
, 随 着σ增 大,
图形越来越扁
.
第2章 随机变量
正态分布的应用
正态分布是最常见最重要的一种分布,例如
学生的考试成绩, 人的身高、体重等,生产零件
的直径、长度、重量的测量数据等都近似服从
正态分布.
第2章 随机变量
标准正态分布
当正态分布 N ( μ, σ 2 ) 中的 μ  0, σ  1 时, 这样
的正态分布称为标准正态分布, 记为 N (0, 1).
标准正态分布的概率密度表示为
x2

2
1
 ( x) 
e ,    x  ,
2π
标准正态分布的分布函数表示为
( x )  
x

1
e
2π
t2

2
d t ,    x  .
第2章 随机变量
标准正态分布的图形
第2章 随机变量
标准正态分布表
标准正态分布函数  (x) 的函数值已制成标准
正态分布表(P171附录2),利用该表可得到
服从标准正态分布的随机变量落在某些区间的
概率。
标准正态分布函数的性质
(  x)  1  ( x)
第2章 随机变量
证明


x
 ( x)  
x

1
e
2π
t2

2
dt  


1
e
2π
1
e
2π
t2

2
t2

2
dt  
 1  ( x).
第2章 随机变量
dt
x

1
e
2π
t2

2
dt
例4 已知 X ~ N (0,1),查表 计算:
(1)P{ X  2.5}; (2) P{ X  2.5}; (3) P{ x  3}
解 (1) P{ X  2.5}  (2.5)  0.9938
(2) P{ X  2.5}  1  P{X  2.5}  1  (2.5)
 0.0062
(3) P{ X  3}  P{3  X  3}
 (3)  (3)  2(3)  1
 0.9773
第2章 随机变量
正态分布的分布函数
( t  μ )2
x 
2σ 2

1
F ( x) 
e

2πσ
dt
正态分布下的概率计算
原函数不是
初等函数
( t  μ )2
x 
2σ 2

1
P{ X  x } F ( x ) 
e

2πσ
?
第2章 随机变量
dt
X μ
~ N (0,1).
定理2.3 若X ~ N ( μ, σ ), 则 Z 
σ
2
证明
P{Z
X μ
Z
的分布函数为
σ
X  μ


P

x
 x} 

 σ

 P{X  μ  σx}
μ  σx 
1

e

2πσ 
tμ
令
 u, 得
σ
P{Z  x}
1 x

e


2π
X μ
故 Z
~ N (0,1).
σ
第2章 随机变量
u2

2
(t  μ )2
2σ 2
d t,
d u   ( x ),
服从一般正态分布的随机变量落在某区间概率
的求法
问题
已知 X ~ N ( μ, σ ), 求 P{a  X  b}.
2
a  X  b
解 P{a  X  b} P{


}



b
a 
 (
)  (
)


第2章 随机变量
例5 某商店出售的袋装食品每包的标准
是500g,设X为袋装食品的质量,且 X ~ N[500,25]
求:(1)随机抽查一包,质量大于510g的概率;
(2)随机抽查一包,质量与标准质量之差
的绝对值在8g以内的概率;
(3)求常数C,使每包质量小于C的概率为
0.05;
第2章 随机变量
解
(1) P{X  510}  1  P{ X  510}
510  500
 1  (
)  1  (2)
5
 1  0.9772  0.0228
(2)P{ X  500  8}  P{492  X  508}
508  500
492  500
 (
)  (
)
5
5
 (1.6)  (1.6)  2(1.6)  1  0.8904
第2章 随机变量
(3) P{ X  C}  0.05
即
查表得
故
所以
解得
C  500
(
)  0.05
5
(1.645)  0.95
(1.645)  1  (1.645)  0.05
C  500
 1.645
5
C  491 .775
第2章 随机变量
3. 指数分布
定义 设连续型随机变量
X 的概率密度为
 e  x , x  0,
f ( x)  
x  0.
0,
其 中  0 为 常 数, 则 称 X 服 从 参 数 为 的 指 数
记为 X ~ E ()
分 布.
某些元件或设备的寿命服从指数分布.例如
无线电元件的寿命 、电力设备的寿命、动物的
寿命等都服从指数分布.
第2章 随机变量
指数分布的分布函数
1  e  x , x  0,
F ( x)  
 0, x  0.
第2章 随机变量
例6 设打一次电话所用时间X(分钟)服从参数
1

10 的指数分布,
求在排队打电话的人中,后一个人等待的时间
(1)超过10分钟的概率;
(2)10~20分钟的概率;
第2章 随机变量
1
X ~ E( )
解 由题意知
10
 1 101 x
 e , x  0,
即,
f ( x)  10

x  0.
 0,
1
1 10 x
e dx  0.368
(1) P{X  10}  
10 10

(2) P{10  X  20} 

20
10
1
1 10 x
e dx  e1  e2  0.233
10
第2章 随机变量
三、小结
x
1. 连续型随机变量 F ( x)   f (t ) d t

分布函数 概率密度
2. 常见连续型随机变量的分布
 均匀分布

 正态分布(或高斯分布)
 指数分布

第2章 随机变量
3. 正态分布是概率论中最重要的分布
正态分布是自然界和社会现象中最为常见的一
种分布, 一个变量如果受到大量微小的、独立的
随机因素的影响, 那么这个变量一般是一个正态
随机变量.
另一方面,有些分布(如二项分布、泊松分布)的极
限分布是正态分布.所以,无论在实践中,还是在理
论上,正态分布是概率论中最重要的一种分布.
第2章 随机变量
高斯(1777-1855)
Carl Friedrich Gauss
德国数学家、物理学家和
天文学家,大地测量学家。
近代数学奠基者之一,在
历史上影响之大,可以和
阿基米德、牛顿、欧拉并
列,有“数学王子”之称。
第2章 随机变量
德国马克上的高斯
第2章 随机变量
高斯发明的六分仪
第2章 随机变量