Transcript 例題1
機率、統計╴好用的數學工具
關於統計,就好像路燈之於醉漢一樣
____支持的效果遠大於照明的效果。
基本知識
•如果想要了解選擇權實際上的運作方式,
或者想要發展出有利可圖的策略,
那麼統計和機率可以說是一定要具備的基
本知識。
探索單一數量變數分布的策略
• 先把數據畫出來:通常是畫直方圖。
• 有時觀測值數量多時,整體型態會顯示出某種
規律,即可以用平滑曲線來描述。
• 根據經驗各種實驗或測量的誤差、我們所
生產的各種產品之特性(例如長度、重量)之
變化、生物特性(例如:身高、體重)的分佈
及特徵…等,常趨近於常態分布。
密 度 曲 線
• 我們利用曲線底下的面積來表示落在該區的觀
測值的比例(proportion)。
• 為了做到這點,我們會選擇適當的尺度
(scale),使得曲線底下的總面積恰恰是 1。
• 我們因此會得到一個密度曲線(density curve),
又稱機率密度函數(probability density function) 。
一些數學代數符號
• x1+x2+x3+x4= ∑ xi
• 平均(average)__一組資料的中心趨勢
算數平均數
•所有觀察值的總和除
以觀察值的個數即為
算術平均數。
N
•母體平均數
xi
i 1
N
n
xi
•樣本平均數 X i 1
n
其中N是個數,Xi是
第i個分數, 是相
加。 是母體平均數,
讀作/mu/。
X讀
作/X bar/
算數平均數特性
•資料的平衡點
•優點
–考慮到每一個觀察值
•缺點
–易受離群值(outlier)的影響
幾何平均數
xg N
x1 x2 xN xi
i 1
N
1
N
是相乘的意思;某個數的次方,就是開N 次方
• 算數平均≧幾何平均
當在計算報酬率時,使用的數值是百分比,若一
家公司的三年營收成長率分別是3%,5%以及7%
時,若您用算數平均數(5%)來計算該公司的成
長率,會高估了該公司在三年後的營收。
意即:
1 x 1.05 x 1.05 x 1.05 > 1 x 1.03 x 1.05 x 1.07
而使用幾何平均數時(約等於4.9873%)就不會有
此問題:
1 x 1.049873 x 1.049873 x 1.049873
= 1 x 1.03 x 1.05 x 1.07
因此在計算報酬率時我們會使用幾何平均數。
中心趨勢的測量方式
•算數平均 μ = ∑ xi / n
1/n
•幾何平均 G = ( ∏ xi )
•中位數
不受離群值的影響
•眾數
•平均數=總合/總數
•中位數=將數字由小排到大,若數列為偶數則取一
半及一半加一之和的一半≡ (
N N
1) / 2
2 2
,若數列為奇數就是中間那一個
•眾數=出現最多的數字
• 例1 : 一數列 2. 3. 3. 4. 5. 5. 6. 9
則平均數、中位數及眾數是多少?
• 解答:
平均數為=(2+3+3+4+5+5+6+9)/8=4.625
中位數=8/2=4 ( 第四個數+第5個數)/2 (4+5)/2=4.5
眾數=3和5
• 例2 :投擲兩顆骰子30次, 出現的次數及點數和的
分布如下:
點 2
數
3
4
5
6
7
8
9
10 11
12
次 1
數
1
3
4
6
8
3
2
1
0
• 點數和的眾數及中位數是多少?
1
平 均 數
密度曲線的平均數是平衡點
中位數
• 一個密度曲線的中位數就是等面積點,也就是
曲線底下的一半面積在它的左邊,另一半在它
右邊的那個點。
f (x )
¤ ¤¦ ì ¼ Æ= ¥ -§ ¡¼ Æ= ² ³¼ Æ
x
眾數
• 眾數是指觀察值中其出現次數最多的那
一個數值
f (x )
¤ ¤¦ ì¼ Æ¥ -§ ¡¼ Æ
² ³¼ Æ
x
中位數和眾數
密度曲線的眾數是尖峰點,中位數是等面積點
偏態(skewness)
f (x )
¤ ¤¦ ì ¼ Æ= ¥ -§ ¡¼ Æ= ² ³¼ Æ
x
正偏態-右偏
偏斜曲線的平均數會離開中位數,被拉向長尾方向。
f (x )
-§ ¡¼ Æ
¤ ¤
¦ ì¼ Æ¥平均數
²眾數
³¼ Æ
中位數
x
The Long Tail
• Long Tail
• 長尾理論─打破80/20法則的新經濟學
• Traditionally, they used to focus on the left side of the graph, e.g.
they tried to sell high priced advertising deals to a few customers.
Google and other companies started to focus on low priced high
volume deals.
• That is, the sales action shifts to the long tail (the right side of the
graph.)
負偏態-左偏
f (x )
x
¥ -§ ¡¼ Ƥ ¤¦ ì¼ Æ
² ³¼ Æ
峰度(kurtosis)
f (X )
高峽峰
常態峰
低闊峰
X
峰度
(x
K
x) / n
4
i
4
• K> 3: 高峽峰
• K=3:常態
• K<3:低闊峰
變異性(variability)
•變異性可以用來了解當用平均值來描述一
組分布是否恰當。
•“如果一個人睡覺時把頭放在烤箱,把腳
放進冰箱___那麼「平均」來說他應該是很
舒服。”
•均方根差σ, 即「標準差」
2
•方差σ ,變異數(variance)
變異數(variance)
• 每個觀察值減去母體平均數(即離均差),
加以平方,然後加總,最後除以個數
N
2
X i
2
i 1
N
標準差(Standard Deviation)
• 全部資料與算術平均數的平均距離
• 變異數的平方根
N
X i
2
i 1
N
X i X
N
S
2
i 1
N 1
經驗法則
若資料為鐘形分配,則有68%的觀察值落在一個標準差內,
有95%的觀察值落在兩個標準差內,有99%的觀察值落在
三個標準差內。
99.70%
f (x )
95%
68%
σ
x 3S x 2S x S
x
x S x 2S x 3S
x
機率
機率論之起源據說是由於投骰子,卡片,
錢幣等之賭博遊戲之流行及保險之發生
而產生。賭博的歷史源遠流長,幾乎自
人類文明之始就有了。人類的天性是好
賭的,由於相信一切機會、命運皆為上
天所掌控,當有爭執或遇到難以決定的
事,往往以抽籤決定。中國古代藉卜卦,
西方藉投擲獸骨以對未來做一些預測。
現今台灣廟裡擲筊杯,西方的藉樸克牌
算命,皆仍有賭的意味....
骰子的發明和由來
• 相傳骰子為曹植所發明,曹植所造的骰子當時用
玉製成,後改用骨制。變五木為兩骰,立方體,
其六面刻點,點數從一到六。所以又叫“雙六”。
• 到了唐代(七世紀),骰子成為一種獨立的博具。
並且由兩個骰子變為六個骰子。據《西墅記》所
載,唐明皇與楊貴妃擲骰子戲娛,唐明皇的戰況
不佳,只有讓六個骰子中的兩個骰子同時出現"四
"才能轉敗為勝。於是唐明皇一面舉骰投擲,一面
連呼"重四" 。骰子停定,正好重四。唐明皇大悅,
命令高力士將骰子的四點塗為紅色,因此直到今
天,骰子的么、四兩面為紅色,其餘四面都是黑
色。
機率的理論
• 機率的理論誕生於十七世紀法國巴黎的賭
場。Chevalier de Mere , 是一位法國貴族
兼好賭成性的賭徒,當時他常在玩一種簡
單機率的遊戲。遊戲是只要能用一個骰子,
在四次擲骰過程中,至少丟出一次六點,
就能贏得賭注。因為他相信他的勝算是
P(出現一次六) = 4×1/6=2/3=67%
•他很快就厭倦了這個遊戲,他又換另一個
遊戲-這次用兩個骰子,在24次擲骰過程
中,至少有ㄧ次能丟出兩個六,就能贏得
賭注。
P(出現一次兩個六) = 24×1/36=2/3=67%
• 當他開始在第二個遊戲失去穩定的勝利時,
de Mere 便找上帕斯卡(Pascal),以及費馬
(Fermat)一起合作解決這個問題。
機率學習館
機率的定義
• 通常以在多次重覆實驗後,一事件出現的頻率來
表示機率。
• 例如給定一賽局(game)為投擲一骰子一次,則樣本空間
S={1,2,3,4,5,6},而出現奇數的事件 A={1,3,5}。則我們定
義A之機率為P = n(A) / n(S) ,其中n(A) 表示A中不同元素
的個數,n(S) 表示S中不同元素的個數。
• 以丟骰子為例,會得到一奇數的機率為3/6=1/2
另一種定義
• 古典的模式不夠一般性,因為它無法用來描述一
有無限可能性的結果的實驗。由於並非只考慮一
次實驗的結果,而是關於一數列條件相同下之實
驗結果。因此,若以頻率的角度來定義機率,可
以下列方式定義之。
• 一實驗實行 n次,若出現 事件A之次數為n(A) ,
當實驗次數 趨近於無限時,該事件A 發生的比例,
即定義為事件A發生的機率。
機率之性質
• 由拉普拉斯(Laplace)定義的古典機率,我們可以
直接得到下列的性質﹔
• 1. P( ϕ ) = 0, P( S ) = 1
• 2. 若A ⊂ S, 0 ≤ P(A) ≤1
c
• 3. 餘事件機率,若A ⊂ S為一事件,則P(A )=1−P(A)
• 4. 機率的加法性:若A, B 為S中的二事件,
則 P(A∪B) =P(A) +P(B) -P(A∩B)
• 5. 機率的單調性 :
若A, B 為S 中的二事件,且A ⊂ B ,則 P(A) ≤P(B)
de Mere 擲骰問題
•先計算一個骰子在連續四次中都沒有丟出
六點的機率,然後用1減去該機率:
4
P(出現一次六) = 1- (5/6) = 51.8%
•這個略超過對手的優勢讓他在第一個遊戲
中獲得穩定勝利(50%的機率才是公平的遊
戲),同樣地,第二個遊戲的機率如下:
24
P(出現一次兩個六) = 1- (35/36) = 49.1%
•這說明了為什麼 de Mere 在第二個遊戲會
輸的原因。
機率的規則
•兩個事件如果被稱為獨立(independent),
就表示其中一個事件的發生(或不發生)對
另一個事件完全沒有影響。
•乘法規則:若A和B是獨立的,則
P(A且B)=P(A) × P(B)
機率例題
• 例題1:[骰子問題]
取兩枚公正的骰子,連擲3次,則每次所出現點數總和均大於或等於8
之機率為何?
解答:
先討論投擲1次的情形﹔
點數和 =8 ,則骰子的點數為: (2,6)(3,5)(4,4)(5,3)(2,6)共5種情形。
點數和 =9 ,則骰子的點數為: (3,6)(4,5)(5,4)(6,3)共4種情形。
點數和 =10 ,則骰子的點數為: (4,6)(5,5)(6,4)共3種情形。
點數和 =11 ,則骰子的點數為: (5,6)(6,5)共2種情形。
點數和 =12 ,則骰子的點數為: (6,6)僅1種情形。
5 4 3 2 1 5
所以投擲1次而出現點數總和大於或等於8的機率為
36
12
5 3 125
(
)
所以投擲3次的機率為
。
12
1728
• 例題2:[取物問題]
有一箱子裡面裝有6顆白球,5顆黑球。若從箱子內"隨機取出"兩顆
球,則取到一白球及一黑球的機率為多少?
解答:
若取球的先後次序有關,則樣本空間共有 11 x 10 = 110 個點。
又第一次取到白球而第二次取到黑球的情形有 6 x 5 = 30 種,同樣的
算法,第一次取到黑球而第二次取到白球的情形亦有 6 x 5 = 30 種。
因此,若假設“隨機取出”的意思是指樣本空間110個點中每一點發
生的機會均等,則可得所求 的機率為
30 30 6
110
11
機率習題
• 習題1. 某俱樂部發出二十張彩票,其中三張可中獎。甲搶
先拿了十張,乙拿剩下的十張。下列何者是錯的:
(A) 甲中獎的機會比乙大。
(B) 甲中獎的機會和乙一樣。
(C) 每張彩票中獎的機率是3/20 。
(D) 甲中獎的機率比 1/2 大。
解答
進階-排列組合
•乘法原理
•完全相異物直線排列
•重複排列
•相異物組合
•重複組合
•排容原理
乘法原理
• 在說明乘法原理之前,我們首先考慮下面的問題:
• 假設某餐廳備有肉 4 種,魚 3 種,蔬菜 5 種,有
位客人預計各點一種肉、魚、和蔬菜,問他可有
幾種點菜的方法?
• 原理:
如果完成某件事可依序分成k個步驟,而第j
(j=1,2, …k)個步驟有mj種方法可以完成它, 那麼
完成這件事的方法共有
m1×m2。。。×mk 種。
完全相異物直線排列
•甲、乙和丙三人排成一列,想知道有多少種可能
的排法,我們可以將所有的排列一一列舉出來,
共有
甲 乙 丙
甲 丙 乙
乙 甲 丙
乙 丙 甲
丙 甲 乙
丙 乙 甲
完全相異物直線排列
• 現考慮較一般的情況,假設有n個不同的事物,將
它們排成一列,會有幾種不同的排法呢? 仿照上
面的討論方式,我們將排列的位置予以編號分別
為1,2,…,n,並按編號依序選擇放置的事物,則
• 1 從n個不同的事物中,選一個放入編號1的位置,
共有n種選法。
• 2 從剩下的n-1個不同的事物中,選擇一個放入
編號2的位置共有n-1種選法。
……….
• n-1 從剩下的 2 個不同事物中,選擇一個放入編
號n-1的位置,共有 2 種選法。
• n 從剩下的 1 個不同事物中,選擇一個放入編
號n的位置,共有1種選法。
• 因此由乘法原理可知排列數共有
n × (n-1) ×…. × 2 × 1 種。
• 因此為了使用上的方便我們將n的連乘積叫作n的
階乘,並以符號 n!表示。
排列(Permutation)
• 將 n 個不同的物品排列有 n! 排法。(需考慮先後
次序)
• 想法:
•
n
n-1
2
1
• 位置一 位置二….
位置n-1 位置n
• 共有 n × (n-1) ×…. × 2 × 1 = n! 種。
• 例如甲、乙和丙三人的排列方式有 3!=6 種排法。
• 最後,我們考慮更一般的情況,假設有n個不同的
事物,從其中任取m個 (m < n) 排成一列,會有幾
種不同的排法呢? 同樣地,我們將排列的位置編
號,分別為1,2…,m , 並按編號依序選擇放置的事
物,則
• 1 從n個不同的事物中,選一個放入編號1的位置,
共有n種選法。
• 2 從剩下的n-1個不同的事物中,選擇一個放入
編號2的位置共有n-1種選法。
……….
• m 從剩下的n-(m-1)個不同事物中,選擇一個放入
編號m的位置,共有n-(m-1)種選法。
• 由乘法原理可知排列數共有
n × (n-1) ×…. × (n-m+1)種。
• 我們以符號P(n,m)表示從n個不同事物中,任取m個排成一
列的排列數,即
P(n,m) = n× (n-1) ×…. ×(n-m+1) 。
P(n,m) = n!/(n-m)!, 0!=1
稱為n中取m直線的排列
習題
• 習題1. 有 2 男生及 5 女生要排成一列,若 2 男生
不相鄰,請問有幾種排法?
• 習題2. 自 0, 1, 2, 3, 4, 5 中取三個數字排成三位數
(1) 數字不可重複,有多少不同的三位數?
(2) 數字不可重複,有多少不同的三位數是奇數?
重複排列
• 由n個不同的事物中,可以重複選取地任選m個,
排成一列, 稱為n中取m的重複排列。我們先看下
面的問題:
• 問題1. 由 1,2,3,4,5,6,7,8,9 九個數字所構成的三位
數有多少個? 其中數字可以重複出現。
• 由乘法原理可知,共有9 × 9 × 9 = 9 3= 729種不同
的三位數
重複排列
• 定理:由n個不同的事物中,可以重複選取地任選
m個,排成一列之n中取m重複排列數為n m。
• 習題1. 有 5 件獎品要分給 7 個人,每人可拿超過
一件,試問共有幾種方法?
組合(Combination)
• 從 n 個不同的物品中取 r 件,但不考慮其先
後次序。排法有
P(n,r)/r!= n!/(n-r)!r!= C(n,r)
排列與組合的差別
C(n,r) = P(n,r)/r!
舉例說明_組合
• 在日常生活中我們時常會考慮,從不同的
東西中要選出其中幾個到底有多少種選法,
先看一個簡單的例子:
• 例題:若要從 A,B,C,D,E 五個人之中不考慮
次序選出三個人作為一組,參加三對三籃
球賽, 將會有多少種選法?
• 例題:若要從 A,B,C,D,E 五個人之中不考慮
次序選出三個人作為一組,參加三對三籃
球賽, 將會有多少種選法?
• 分析:從此 5 個人當中選 3 個人出來排列,
若考慮選擇的次序,則共有
P(5,3) = 5!/(5-3)! =5 × 4 × 3 = 60
• 由於固定的 3 個人,其直線排列數為3!=6。
例如 A,B,C 三人的直線排列有
(A,B,C),(A,C,B),(B,A,C),(B,C,A),(C,A,B),(C,
B,A)
6 種,而這 6 種排列皆為同一種選法,因此
選法共有P(5,3) /3! = 60 / 6 =10種。
C(5,3) = P(5,3)/3!= 5!/(5-3)!3!
• 事實上,我們可以將所有可能的情形列出
來,分別是
(A,B,C),(A,B,D),(A,B,E),(A,C,D),(A,C,E),
(A,D,E),(B,C,D),(B,C,E),(B,D,E),(C,D,E)
等 10 種情形。
C(n,m)
• 現考慮一般的情形,從 n個不同物件中,不重複
且不計其前後次序取 m個 物件為一組,稱作 n中
取 m的組合。其中的每一種可能結果稱為一種組
合。我們以符號C(n,m)表示所有組合的總數(簡稱
組合數)。
• 由上面的例子可以知道,n個不同物件中取m個的
組合數,可以分成兩個步驟來求:
(i)先從n個中選取m個出來作直線排列,其排列數
為P(n,m)。
(ii)由於對固定的m個物件,其直線排列數m!為所
以P(n,m)排列中,每m!皆為同一種組合。
C(n,m)
• 定理:自n個不同物件中,每次不重覆地取m個為
一組,則其組合數為:
C(n,r) =P(n,m)/m!= n!/(n-m)!/m!
(0 < m < n)
C(n,m)
• 例題:大樂透的中獎方式為由{1,2,..,49},
此49個數字中以隨機方式取出六個數字
(不投返),若某人的彩券號碼與此六個
數字一樣則中獎。則某人中獎的機率約為
— 一千四百萬分之一
-7
1/C(49,6)=1/13983816 ≈ 1.4x10
• 所以所謂包牌(保證一定中) ,就是全餐...
大樂透全餐為 1400萬x 50元 = 7億元
• 就算獎金累積超過7億元,其實全餐還是有
風險→因為當頭獎不只一人時,就恐怕會賠
錢。
• 彩迷集資56萬包牌 搏威彩六億
• 選八個號碼包牌,共有廿八組合(即二十
八注),一張二千八百元,
• C(8,6) x 50 = 28 x 50
• 七個號碼取六個號碼C(7,6)
(7x6x5x4x3x2)/(6x5x4x3x2x1) = 7
•
<====7注$350
八個號碼取六個號碼C(8,6)
(8x7x6x5x4x3)/(6x5x4x3x2x1) = 28
<===28注$1400
• 九個號碼取六個號碼C(9,6)
(9x8x7x6x5x4)/(6x5x4x3x2x1) = 84
<===84注$4200
………………………………..
• 12個號碼取六個號碼C(12,6)
(12x11x10x9x8x7)/(6x5x4x3x2x1) = 924<==924注$46200
7員工合資中樂透 樂昏不上班
習題
• 習題1. 同花色的 13 張撲克牌中,若把 J,Q,K,A 等四張表示
的牌稱為大牌,試求自此13 張牌中任意抽出3張,其中恰
含有二張大牌的組合數?
解答
重複組合
• 由n類相異物中,任取r個為一組,其中每類物
品的個數均不小於r且可重複選取,則稱此種組
合為n中取r之重複組合,其組合數以H(n,r) 表
之。
• 問題1:假設紅、藍、白三種顏色的球均超過4
個,從其中取4個球,試問其可能的取法數 為多
少?
• 問題2:X1+X2+X3+X4 =4有幾組非負整數解?
H(n,r)
• 可將所有可能的解一一列舉出來,即為:(4,0,0),
(0,4,0), …… (1,3,0),…..
共 15 種。
• 定理:H(n,r)=C(r+n-1,n-1)
• 例題2. 同時擲2個相同且公正的骰子,有幾種不
同的花色(結果)?
• 解答:H(6,2)=C(7,5)=21
排容原理
• 問題一:試問 1 至 120 中,4 或 6 的倍數有幾個?
• 首先求出 1 至 120 中 4 的倍數之個數,易知其共
120/4=30個。其次我們再求出6的倍數之個數,共
有120/6=20個,但此時我們將同時是 4 及 6 的倍
數之個數算了兩次,因此必須將他們減掉,而在
1 至 120 中,同時為 4 跟 6 的倍數的數即為 12 的
倍數,故共有120/12=10個。因此,4 或 6 的倍數
之個數為 30+20-10=40個。
• 若令A 為 1 至 120 中 4 的倍數之集合,B 為
1 至 120 中 6 的倍數之集合,則A∩B 是12
倍數之集合, A∪B為 4 或 6 的倍數之集合,
從上面的問題討論中,我們可以得知
A∪B=A+B-A∩B 。
A
B
• 例題1. 求 1~120 中,不為 4 或 6 的倍數有
幾個?
樂透摃龜機率
•
•
樂透摃龜機率為97.0935%--醒醒吧!別做春秋大夢了
經試算每筆投注中獎機率如下:
猜中號碼數機率如下:
六組全中 0.000019%(仟萬分之一點九)
頭獎機率: C(6,6) /C(42,6)
猜中五組 加一特別號
貳獎機率: [C(1,1) * C(6,5)] / C(42,6) = 0.00011437%
猜中五組 0.0041%(佰萬分之四點一)
參獎機率: [C(36,1) *C(6,5)] / C(42,6)
猜中四組 0.1819%
肆獎機率: [C(36,2) * C(6,4)] / C(42,6) = 0.1801%
猜中三組 2.7222%
普獎機率: [C(36,3) * C(6,3)] / C(42,6) = 2.722185%
猜中二組16.8435%
[C(36,4) * C(6,2)] / C(42,6)
猜中一組43.1194%
[C(36,5) * C(6,1)] / C(42,6)
全部摃龜37.1306%
C(36,6) / C(42,6)
猜中三組號碼以上才有獎金,猜中三組獎金200元