Transcript 機率論-2

Chapter 5 隨機變數 Part II
5-4 期望值與變異數
5-2
設 X 為隨機變數,a、b 為實數,則
(1) E (aX + b) = aE (X) + b
(2) E (g (X) + h (X)) = E (g (X)) + E (h (X))
5-6
設隨機變數 X 的期望值為 ,則
 x2  E[( X   )2 ]
稱為 X 的變異數。變異數也可用 2,V(X)表示。
結束
結束
定理5-3
 2  E ( X 2 )  [ E ( X )]2
證明:由定義, 2  E[( X   ) 2 ]  E ( X 2  2 X   2 )
 E ( X 2 )  E (2 X )  E (  2 )
(由定理5  2(2))
 E ( X 2 )  2 E ( X )   2
(由定理5  2(1))
 E ( X 2 )  2[ E ( X )]2  [ E ( X )]2
 E ( X )  [ E ( X )]2
2
  E( X )
結束
Ex. 15
設X為某產品每天銷售量,其機率函數為
X
0
1
2
3
4
5
p(x)
0.1
0.1
0.2
0.3
0.2
0.1
試求V(X) 及標準差σ
解:
E(X)=0(0.1)+1(0.1)+2(0.2)+3(0.3)+4(0.2)+5(0.1)=2.7
E ( X 2 )  0 2 (0.1)  12 (0.1)  2 2 (0.2)  32 (0.3)  4 2 (0.2)  52 (0.1)
 9 .3
因此
V ( X )  E ( X 2 )  [ E ( X )]2  9.3  (2.7) 2  2.01
  2.01  1.42
結束
Ex. 16
設隨機變數X的機率密度函數為
f ( x)  2( x  1), 1  x  2
0
, 其他
試求V ( X )
解:
2
2
E ( X )   x  2( x  1)dx  2  ( x n 1  x n )dx
n
1
n
1
 x n  2 x n 1  2
 2 n  2  1 2 n 1  1 
 1  2

 2


n 1 
 n  2 n 1
 n2
5
因此 E ( X ) 
3
V ( X )  E ( X 2 )  [ E ( X )]2
17
2
E( X ) 
6
17 5 2 1
V (X )   ( ) 
6
3
18
5-4 期望值與變異數
5-4
設 X 為隨機變數,a、b 為實數,則
(1) V (X + b) = V (X)
(2) V (aX) = a2V (X)
(3) V (aX + b) = a2V (X)
結束
5-4 期望值與變異數
已知隨機變數 X 的期望值為 ,變異數 2。定義
X 
Z

則由定理5-4 (3),可得
E ( Z )  0 ,V ( Z )  1
稱 Z 為 標 準 化 隨 機 變 數 (standardized random
variable)。
結束
5-4 期望值與變異數
在無法獲得X機率函數時,若只知X的期望值與變
異數時,可利用切比雪夫(Chebyshev’s inequality)求
出機率值的上限或下限。
5-5
切比雪夫不等式
若隨機變數 X 的期望值為,標準差為,則對於
任意實數 k > 0,可得
1
1
P (| X   | k )  2 P ( X    k  1  2
k
k
結束
結束
Ex. 17
在Ex. 15中,X的期望值為μ=2.7,標準差σ=1.42,由
切比雪夫不等式,可得
2.01
P (| X   | 2)  P (0.7  X  4.7) 
 0.502
4
而實際的機率值為0.8,因此在隨機變數機率的計算上,
切氏不等式提供相當重要的資訊。
1
P (| X   | k )  2
k
1
P( X    k  1  2
k
結束
Ex. 18
設某百貨公司每小時平均顧客人數為24人,標準差為
4人。若以隨機變數X表示每小時顧客的人數,是求每
小時顧客人數在16人與32人之間的機率為何?
解:
1 3
P(16  X  32)  P(| X  24 | 2  4)  1  2 
2
4
結束
5-5 常用離散機率分布
伯努利試驗與二項分布
許多隨機試驗只有兩種可能的出象,稱它為伯
努利試驗(Bernoulli trial)。若伯努利試驗的出象
以隨機變數X表之,可令 X = 1 表示出象為成功,
X = 0 表示出象為失敗,則 X 的機率函數為
1 x
f ( x )  p (1  p) ,x  0、1
x
其中 0  p  1,代表試驗成功的機率。
5-5 常用離散機率分布
5-6
設 X 為伯努利隨機變數,則
(1) E (X) = p
(2) V (X) = p (1  p)
5-7
設 X 為二項隨機變數,則
(1)E (X) = np
(2)V (X) = np (1  p)
結束
結束
EX.19
數學科期中考是有十題四選一的選擇題。某生完全以猜答案的
方式作答。試問該生能夠及格的機率有多少?
解:設X為答對的題數,則X的機率數為
k
10  k
10
  1   3 
P ( X  k )       , k  0,1,...10
 k  4   4 
該生及格的機率為
10  1   3  10  1   3 
P(X  k)            

k 6
 k  4   4   7  4   4 
10
6
4
7
3
10  1   3  10  1   3 
           
 8  4   4   9  4   4 
8
2
10  1   3 
     
10  4   4 
 0.0197(或由查表求得)
10
0
9
1
結束
Ex. 20
某工程試驗非常昂貴,且只有40%的成功機率。是問應試
驗幾次才能保證至少有一次成功出現的機率路達95%?
解:設X為試驗成功的次數。試驗者卻決定n使得
P( X  1)  0.95
或 1 - 0.95  P( X  0)
因
且
n
P( X  0)   (0.4) 0 (0.6) n  (0.6) n
0
n
4
5
6
0.6n
0.1296
0.0776
0.04665
故知至少須試驗n=6次
結束
5-5 常用離散機率分布
若一個箱子內含15個隨身聽,其中5個有缺陷。金
隨機選取一個檢查,並記錄其結果。在抽取下一個
之前,若將已驗畢之產品放回箱中,則稱為歸還式
(sampling with replacement)。此時,每次檢驗皆可
視為伯努利試驗,且出現缺陷的機率永遠是p=5/15。
但假設抽取出來隨身聽不在放回箱中,則稱為不歸
還式(sampling without replacement),此時,第一次
檢驗有缺陷的機率是5/15,第二次檢驗時,有缺陷
的機率成為4/14。
結束
5-5 常用離散機率分布
超幾何分布
假設母體含有 N 個元素,其中 S 個為「成功」,N
 S 個為「失敗」。今自母體中隨意選取 n 個出來。
若隨機變數 X 代表 n 個中是「成功」的個數,則 X
稱 為 超 幾 何 隨 機 變 數 (hypergeometric random
variable),其機率函數為
 S  N  S 
 

k  n  k 

P( X  k ) 
, k  0,1,
N
 
n 
,min( n, s )
5-5 常用離散機率分布
5-8
設 X 為超幾何隨機變數,則
(1) E ( X )  n  S 
N
N  n  S 
S
(2) V ( X ) 
 n   1  
N  1  N 
N
結束
結束
Ex. 21
已知一箱5,000個燈泡內有1,000個是壞的,假設某人
購買10個燈泡,試問其中有3個是壞燈泡的機率為多
少?
解:因為N=5000與n=10相較,是非常大。因此可利用
二項分布來求得機率的近似值。
10  k
3
10  1   4 
10  1   4 
P ( X  3)             
 3  5   5  k 0  k  5   5 
3
7
k
10  k
10  1   4 
      
k  0  k  5   5 
 0.8791  0.6778
2
k
 0.2013(由查表得)
結束
5-5 常用離散機率分布
在一連串的伯努利試驗中,常關心須等待多久才
發生第一次成功。因此設 X 為出現第一次成功的
試驗次數,其機率函數為
P ( X  k )  p(1  p)
0
k 1
, k  1, 2, 3,
其他。
具有這種機率函數的隨機變數,稱為幾何隨機變
數(geometric random variable)。
5-5 常用離散機率分布
5-9
設隨機變數 X 呈幾何分布,則
1
(1) E ( X ) 
p
q
(2) V ( X )  2 , q  1  p
p
結束
結束
Ex.22
小美生產冰棒一批每五十枝中有一枝印有「再送一枝」,
若每枝售價為五元,試問消費者平均將花費多少,使能
獲得贈送一枝?
1
p

解:每購買一枝冰棒,獲得「再送一枝」的機率為
50 。
設X=至獲贈一枝所需之購買枝數,則
1
E ( X )   50
p
因此平均將花費5×50=250元始獲贈一枝。
結束
5-5 常用離散機率分布
若 X 為幾何分布,則
P ( X  n  m X  n)  P ( X  m ) , n、m  1, 2,
證明:

P( X  n  m)
P ( X  n  m X  n) 

P ( X  n)

k  n m 1


k  n1
q n m
 n  qm  P( X  m)
q
pq k 1
pq k 1
結束
5-5 常用離散機率分布
二項分布所描述的是在n次伯努利試驗中,某事件
或現象發生的次數。但是當n很大時,二項分布的
機率將無法計算。波瓦松(Poisson distribution)不僅
在n很大時,可做二項分布之近似分布,且可用以
描述某段時間、或面積、體積內某機遇現象發生次
數。
例如波瓦松分佈可描述某辦公大樓電話總機一小時
內接到電話的次數、高速公路在一個月內發生車禍
的次數、一平方公尺布匹上的線頭數、或一立方公
分血液內的白血球數等。
5-5 常用離散機率分布
波瓦松分布
波瓦松隨機變數所討論的機遇現象須滿足下列
假定
在不重疊的時間(或空間)內,現象發生的次
數相互獨立。
當考慮的時間段落很小時,則現象發生一次
的機率與該時間段落的長短成正比。但與時
間段落的位置無關。
當時間段落很小時,現象發生兩次以上的機
率近似於0。
結束
5-5 常用離散機率分布
若設 X 為單位時間(或空間)內某現象出現的次數。
則可證明 X 的機率函數為
e  k
P( X  k ) 
, k  0,1, 2,
k!
稱參數為  的波瓦松分布,其中  表示單位時間或
空間內該現象平均發生的次數。
結束
5-5 常用離散機率分布
5-11
設 X 為參數  的波瓦松隨機變數,則
(1) E (X) = 
(2)V (X) = 
結束
結束
Ex. 23
某工廠平均每兩個月發生一次意外事件,假設意外事
件獨立,試求
1) 每年發生意外事件平均次數。
2) 某月不發生意外事件的機率。
解: (1) 設X為每年發生意外事件的次數,則X呈波式
1


12  6,因此E ( X )  6
分佈,其參數
2
(2) 設Y每月發生意外事件的次數,則
e 0.5 (0.5) 0
P(Y  00 
 e 0.5  0.607
0!
若X為二項分布,其n值很大,p值很小
且np值適中,則X近似於一參數為λ=np
的波式分布。
1

2
5-5 常用離散機率分布
5-12
負二項分布基本性質
r
E( X ) 
p
r (1  p)
V(X ) 
p2
結束
5-5 常用離散機率分布
設獨立試驗,每次成功的機率是 p,0 < p < 1,試
驗執行直到累計 r 次成功才停止,若 X 表示所需
試驗的次數,
 n  1 r
n r
P ( X  n)  
p
(1

p
)
, n  r , r  1,

 r 1
任何隨機變數 X 的機率密度函數如上式,稱為負二
項隨機變數(negative binomial),具有參數(r, p),
記為 X ~ NB (r, p),而幾何隨機變數正好是負二項
隨機變數的一個特例,其參數為(1, p)。
結束
結束
Ex. 25
• 巴納赫火柴盒問題(Banach match box problem)
某一抽菸斗的數學加在任何時間都帶有2合火柴,一
盒在左邊口袋,一盒在右邊口袋,每次她要火柴,有
相同機會可能從任何一口袋去拿。假設起出兩口袋各
有N根火柴,K=0,1,…,N的機率為多少?
解:設E表示數學家首先發覺右邊的火柴盒是空的,而
左邊還有K根火柴的事件。此事件發生的充要條件是
在N+1+N-K次試驗中右邊口袋取了(N+1)次。因此
1
P  ,r  N  1,n  2 N  K  1
2
2 N  K 1
2
N

K

 1 
 
P ( E )  
N
 2 
結束
5-6 常用連續機率分布
若隨機變數 X 的機率密度函數為
1
f ( x) 
, a xb
ba
0
其他
則 稱 X 為 在 區 間 [a, b] 的 均 勻 分 布 (uniform
distribution)並以符號 U [a, b]表之。
結束
5-6 常用連續機率分布
圖5-10 U[a,b]的機率密度函數
結束
5-6 常用連續機率分布
圖5-11 U[a,b]的累積分布函數
結束
5-6 常用連續機率分布
5-13
設 X 為均勻分布 U [a, b],則
ab
(1) E ( X ) 
2
2
(
b

a
)
(2) V ( X ) 
12
結束
Ex. 26
若再線段[0,4]中隨機選取一點,試求此點落在區間
[1,2]內的機率?
解:設X為此點的座標,則X機率密度函數為
1
f ( x)  ,0  x  4
4
0
其他
2  0 1 0 1
P(1  X  2)  F (2)  F (1) 


40 40 4
結束
5-6 常用連續機率分布
若考慮隨機變數 Xt 為 [0, t] 時間內,某現象出現的
次數,則在 [0, t] 時間內平均發生的次數應為 t。
因此 Xt 是參數為  t 的波氏分布,其機率函數為
e   t (  t )k
P( X t  k ) 
, k  0,1, 2,
k!
假如所關切的是隨機變數 X = 該現象第一次發生所需
的時間。則
P ( X  t )  P{該現像在[0, t ]時間內沒有出現 }
t
 P ( X t  0)  e ,t  0
結束
5-6 常用連續機率分布
故 X 的累積分布函數為
F ( t )  P ( X  t )  1  e   t,t  0
0
t0
而 X 的機率函數
d
t
f ( t )  F ( t )   e ,t  0
dt
0
t0
稱 X 為一具有參數  的指數分布(exponential
distribution)。
結束
5-6 常用連續機率分布
圖5-12 指數變數的機率密度函數
5-6 常用連續機率分布
圖5-13 指數變數的機率密度函數
結束
5-6 常用連續機率分布
5-14
設 X 為一參數  的指數分布,則
(1) E ( X )  1

(2) V ( X )  1
2

結束
5-6 常用連續機率分布
常態隨機變數的機率密度函數為
f ( x) 
2

1
 1 X   

exp   
,   X  

2

 2   

其中 、 均為參數。通常以 N ( ,  2)表示常態
分布。
結束
5-6 常用連續機率分布
圖5-14 常態分布
結束
5-6 常用連續機率分布
結束
f (x) 的曲線圖形具有下列特性
(1)呈鐘形分布,且對稱於 X = 。
(2)在 X =    處有兩個反曲點(point of inflec-tion)。
(3)當 X    時,f (x)  0。
(4) 值大時,曲線低平。 值小者,曲線高狹。
5-6 常用連續機率分布
5-16
若 X 的分布為 N (,  2),隨機變數 Y = aX + b,
則 Y 的分布為 N (a + b, a2  2) 。
結束
結束
Ex. 29
管數學期的成績近似常態分布,其平均分數為74分,
標準差為7.9分,試求
1) 如果成績最低的10%給E,則最低及格分數為多少?
2) 如果最高的5%給A,則A中最低的分數是多少?
解: (1)設X為學生學期成績的分數
 X  74 x  74 
0.1  P( X  x)  P


7.9 
 7.9
x  74 

 P Z 

7.9 

x  74
查表得
 1.282
7.9
故x  74  (1.282)(7.9)  63.87
結束
Ex. 29
x - 74 
x  74 


(2)0.05  P(X  x)   Z 
或P Z 
  0.95
7.9 
7.9 


x  74
查表得
 1.645
7.9
故x  74  (1.645)(7. 9)  87
結束
Ex. 30
台灣中部某鎮每年三平均雨量為9.22公厘,標準差為
2.83公厘。若雨量成常態分布,試求明年三月該地區
將得到下列雨量的機率。
1) 小於1.84公厘。
2) 大於5公厘但小於7公厘。
解:
1.84  9.22 

(1) P ( X  1.84)  P Z 
2.83

 P ( Z  2.607)  0.0045


7  9.22 
 5  9.22
(2) P (5  X  7)  P
Z

2.83 
 2.83
 P (1.49  Z  0.78)   (0.78)   (1.49)
 0.2177  0.0681  0.1496
5-6 常用連續機率分布
5-17
中央極限定理
若從平均數  ,變異數  2 的一個無限或大母體中,
抽出大小為 n 的隨機樣本。則樣本平均數 X
的抽樣分布將趨近於平均數  X   ,標準差
 的常態分布,因此
X 
n
Z
X 

n
為標準常態變數 Z 的一個值。
結束
結束
中央極限定理
若n≥30,則不論母體分布為何,定理中的常態分佈
逼近相當良好;若n<30,則僅在母體與常態母體相
去不遠時,逼近方為良好。
若已知母體為常態,則不管樣本大小為何, X 的抽
樣分部已是常態分布。
結束
Ex. 31
某廠牌燈泡的壽命趨近於平均數800小時,標準差40
小時的常態分布,隨機取大小為16燈泡的隨機樣本,
求其平均壽命小於775小時的機率。
40
 x  800, x 
 10
16
解: x 的抽樣分布近似於
的常態
分布,所求機率為圖5-10中陰影區域的面積,
775  800
 2.5
10
P X  775P( Z  2.5)
Z
 0.062
 X 10
結束
Ex. 31-1
Fast Service卡車公司使用福特Super Duty F-750的車型。每
輛卡車每年的維護成本將依據行駛的里程數決定,且行駛
里 程 數 服從 常 態分配 , 平均數 為 60,000 英 里 、標準 差 為
2,000英里。請問:
a) 有多少比例的福特Super Duty F-750卡車去年行駛超過65,200英里?
b) 有多少比例的福特Super Duty F-750卡車去年行駛超過$57,060英里
但少於58,280英里?
c) 有多少比例的卡車去年行駛少於等於62,000英里?
d) 是否有卡車行駛超過70,000英里?請解釋之。
Answer:
a. z=2.6, 0.5000 – 0.4953 = 0.0047
b. z1=-1.47, z2=-0.86, 0.4292 – 0.3051=0.1241
c. 0.8413, 0.5000 + 0.3413
70,000  60,000
d. No, 因為
z
2000
 5.0