Transcript Document
Chapter 02
基本統計方法
2010
©版權所有,未經授權請勿使用及出版
Outline
敘述統計
機率分配
抽樣分配
估計
假設檢定
變異數分析
Pg 2
Statistics
統計學(Statistics)主要目的在於根據抽樣之
樣本資料進行分析與獲得資訊(解讀),並進一
步對母體作推論及決策。
統計學在品質管制與改善活動上扮演一極重
要之角色。
本章針對在品質活動上常用之統計理論做一基本
扼要之介紹,內容包含敘述統計、機率分配、抽
樣分配、點估計、區間估計、假設檢定與變異數
分析。
Pg 3
敘述統計
敘述統計(Descriptive Statistics)
敘述統計(descriptive statistics)的主要目的
在於利用統計圖表與數值方法來表達與呈現
資料之特性。
要描述資料之前,通常必須先確認資料之型
態。一般而言,資料可分為質化型資料
(qualitative data)與量化型資料(quantitative
data)。
Pg 5
質化型資料(Qualitative Data)
質化型資料,主要是依據其性質不同而加以區分,
例如原物料依色彩可分為紅、黃、白等顏色,產品
缺陷程度可分為輕微、中度、嚴重程度,血型分為
O、A、B、AB型等等
質化型資料也稱為屬性資料(attribute data)或類別
型資料(categorical data)。
以圖形來描述質性資料之方法,常見的有長條圖
(bar chart)與圓形圖(pie chart)。若欲以數值描
述質性資料,常用的則為摘要表(summary table)。
Pg 6
量化型資料(Quantitative Data)
量化型資料又可分為離散型資料(discrete data)與
連續型資料(continuous data)。
離散型資料指的就是可以用來計數的(countable)資料
,如晶圓上的缺點數(particle)、汽車鈑金的刮痕數、
產品的不良品數、電腦螢幕的黑點數等
連續型資料,即是在任意兩數值間存在有無限多個數值
,關於此類之資料相當的多,譬如身高、體重、濃度、
壓力、體積、面積等。
若欲以圖形描述量化型資料,常見的有點圖(dot plot)
、枝葉圖(stem-and-leaf)與直方圖(histogram)。以數
值方法描述連續型資料型態,常見的有集中趨勢(central
tendency)與離散趨勢(dispersion tendency)之描述
Pg 7
資料類別(Data Type)
Minitab執行路徑: Stat > Basic Statistics > Display Descriptive Statistics
Pg 8
定質型資料描述
摘要表
長條圖
圓餅圖
Pg 9
摘要表(Summary Table)
摘要表為資料收集重要之工具,其製作步驟如下
1. 依照各類別進行計次
2. 總計各類別發生之次數
3. 計算相對次數
Example
收集有200個產品,依照等級做區分並製作摘要表
Pg 10
長條圖(Bar Chart)
長條圖之主要目的在於將摘要表的數據以圖形方式
呈現出來,其橫軸代表區分之類別,縱軸可為發生
之次數或相對次數的百分比。
Pg 11
圓餅圖(Pie Chart)
圓餅圖乃將摘要表用圖形方式顯示出來,其做法主
要是將一圓形依照發生次數之百分比進行分割。
Pg 12
定量型資料描述
點圖
枝葉圖
直方圖
集中趨勢
離散趨勢
盒鬚圖
Pg 13
點圖(Dot Plot)
在一水平軸上依照每個觀測值大小標示 ,若有相同
的觀測值,則在該數值處把點往上疊。點圖主要目
的在於呈現點的集中或疏密情況以了解資料之趨勢
。
Example
●
考慮一筆數據:21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Pg 14
枝葉圖(Stem-and-Leaf)
假設某一數值,至少是兩位數,枝葉圖做法就是將
該數值分成兩個部分:「枝」與「葉」。
枝的部分通常取一位會更多位的
領導位數,而剩下的位數則當作
是葉的部分。
一般而言,枝的數目不要太多,
最好在5~20之間。在枝決定之後
,將其列於圖的左方,然後將各
自的葉列於右邊便完成枝葉圖。
枝表達了類別,而葉的部分表達
了發生的次數。
Pg 15
直方圖(Histogram)
枝葉圖適用於少量資料之描述,當資料量大時我們
就須繪製直方圖(histogram)。
直方圖的繪製
Step 0. 決定量測變數,蒐集數據,將數據由小至大排列
Step 1. 找出全體數據中之最大值與最小值,計算全距
Step 2. 決定組數
Step 3. 決定組距=全距/組數
Step 4. 求出各組上、下組界,以及組中心點
Step 5. 製作次數分配表
Step 6. 繪製直方圖
Pg 16
Example 2.3
收集50筆某化學濃度數據
組編號
1
2
3
4
5
6
7
組界
27.5 ~ 37.5
37.5 ~ 47.5
47.5 ~ 57.5
57.5 ~ 67.5
67.5 ~ 77.5
77.5 ~ 87.5
87.5 ~ 97.5
劃記
正
正正
正正
次數
7
5
9
10
10
6
3
Pg 17
Central Tendency
集中趨勢主要目的在於描述資料的「中心位
置」
樣本平均數 (Sample mean)
中位數 (Median)
眾數 (Mode)
Pg 18
Sample Mean
假設某樣本存在n個觀測值x1, x2, …, xn,則樣本平均
數可計算如下
x
x1 x 2 x n
n
Example 2.4
x
373 2 436
4
7
Pg 19
中位數(Median)
資料從小到大排序後,中位數即為「最中間的數」
。換句話說,中位數可將一筆資料切割為相等的兩
部分。
當觀測值有偶數個,則取最中間的兩個數值並計算
其平均值以作為中位數。
中位數通常以Me表之。表2.4的資料經排序後如下:
2, 3, 3, 3, 4, 6, 7,因此,可得Me = 3。
Pg 20
眾數(Mode)
眾數即是在一筆資料中,出現次數頻率最多的數。
眾數(Mo)可能發生的情況包含單一眾數、無眾數及
多重眾數。
Example
單一眾數:例如: 3, 7, 3, 2, 4, 3, 6 ,存在單一眾數3。
無眾數:例如:10, 4, 8, 11, 6, 7,並無眾數存在。
多重眾數:例如:25, 32, 32, 42, 45, 45,存在雙眾數32與
45。
Pg 21
比較
平均數:容易計算、適合代數上處理,但容易受極
端值影響。
當資料呈現偏斜的情況,使用樣本平均數描述資料中心位
置較不具代表性。
中位數:不受極端值之影響,但當資料中間有缺口
時,較不具代表性。
眾數:容易瞭解,不受極端值之影響,但可能存在
多重眾數或是眾數不存在的情況。
Pg 22
資料對稱性(Data Symmetry)
利用集中趨勢衡量尺度來判斷資料之對稱性
對稱分配:樣本平均數 = 中位數 = 眾數。
左偏分配:樣本平均數 < 中位數 < 眾數。
右偏分配:樣本平均數 > 中位數 > 眾數。
Pg 23
離散程度(Dispersion Tendency)
離散趨勢主要目的在於描述資料的「離散程
度」
全距 (Range)
四分位距 (Inter-quartile range)
樣本變異數 (Sample variance)
樣本標準差 (Sample standard deviation)
Pg 24
全距(Range)
全距即一組資料中的最大值與最小值的差距
全距 Max ( x i ) Min ( x i )
例如: 3, 7, 3, 2, 4, 3, 6 ,全距 = 7 – 2 = 5
利用全距描述資料離散程度,主要的優點在於容易
計算,因此常用於管制圖之計算中;其缺點在於僅
考慮資料中的極大與極小值,而忽略了中間數值之
資訊,因此不適用於大量資料。
Pg 25
四分位距(Inter-Quartile Range)
將資料由小至大排序並分割成四個等分,每一個切
割點稱為四分位數(quartile)。四分位距(Inter-Quartile
Range; IQR)即是第一(下四分位數Q1)與第三分位數(
上四分位數Q3)之差,表示如下
IQR Q 3 Q1
Pg 26
四分位距
IQR只考慮了中間50%的資料量,也即描述了中央散
佈的情形。
四分位數也可用於檢視資料是否為對稱之分配。若
符合Me – Q1 = Q3 - Me ,則該筆資料即為對稱分配
。
計算IQR之缺點在於當資料量大時,Q1 、Q3 的計算
較為複雜。此外,IQR只考慮中間的一半資料,不足
以表示全部數值的分散程度。
Pg 27
樣本變異數(Sample Variance)
假設收集一組資料x1, x2, …, xn,樣本變異數主
要是將各個觀測值與樣本平均數之差取平方
加總後再取其平均值,表示如下:
n
s
2
( xi x )
2
i 1
n 1
一般而言,樣本變異數s2越大,樣本變異性就
越大。
Pg 28
樣本標準差
標準差是最常用且最重要的離散趨勢衡量尺度。樣
本變異數s2 的單位為原始資料單位的平方,這在解
釋上較為困難,因此將s2 取根號,即所謂的樣本標
準差(s),用以當成變異性的衡量尺度,其表示如下
:
n
(x
s
i
x)
2
i 1
n 1
使用樣本標準差最大的優點就是能以原始的單位作
為標準
Pg 29
比較離散程度指標
全距
四分位距
變異數&
標準差
考慮全部資料的一
最容易瞭解、
半,故不受偏離值
優點 計算
之影響
考慮觀測值的
整體資訊
當資料在四分位數
僅考慮極大、
附近有間隔時,代
缺點 極小值
表性低
易受極端值影
響
Pg 30
盒鬚圖(Box-and-Whisker Plot)
盒鬚圖(box-and-whisker plot)又稱箱型圖或箱鬚圖
,其主要目的在於利用圖形視覺化資料的集中趨勢
、離散趨勢及對稱性。此外盒鬚圖也可用以比較兩
組以上資料之差異性,以及偵測資料的離群值。因
此,盒鬚圖常用於品質改善活動中。
Pg 31
盒鬚圖
盒鬚圖中間的『箱子』是由Q1 及Q3 所組成,因此箱
內包含了50%的數值資料,其中Median描述了資料
中心位置,而IQR解釋了中央散佈的情形。此外盒鬚
圖的『鬚』分別是由箱子延伸至最大及最小值,而
Range描述了整體資料散佈的情況。
Pg 32
盒鬚圖
利用箱型圖判斷資料的對稱性
一般而言,當左鬚長度等於右鬚長度,則資料屬於對稱分
配。當左鬚長度大於右鬚長度,則資料呈現左偏的分配。
當左鬚長度小於右鬚長度,則資料呈現右偏的分配。
Pg 33
盒鬚圖
盒鬚圖的另一重要運用在於辨認離群值(outlier),而使用此法
最大的優點在於資料不需任何的前提假設。
當鬚從盒子的邊界延伸1.5IQR的距離,若觀測值超出此範圍
,則視為離群值。當觀測值的最大值或最小值分別未超出Q3
+ 1.5IQR與Q1 - 1.5IQR ,則盒鬚圖的鬚僅延伸至極值(最大值
或最小值)。
Pg 34
Example 2.5
收集10個數據:1.3, 3.6, 8.5, 1.0, 0.6, 1.0, 4.6, 0.3, 1.1,
2.2。執行Minitab繪製盒鬚圖如下,結果可發現存在
一離群值(*)。
Pg 35
機率分配
機率分配(Probability Distributions)
機率分配(probability distributions)主要目的在於將品
質特性模式化,並解釋其參數行為。
機率分配將觀測之品質特性視為一個隨機變數(Random
Variable; R.V.),因其值在母體中是隨機變動的,因此機
率分配即在描述品質特性的某些值在母體中出現的機率分
佈情況。
機率分配依品質特性的資料型態,可分為
離散型機率分配(discrete probability distributions)與
連續型機率分配(continuous probability distributions)
Pg 37
離散型資料型態
當隨機變數屬於可計數的離散型資料型態,如產品
缺點數、書本錯字數、產品不良品數等,其所形成
之機率分佈稱為離散型機率分配。
離散型機率分配的形狀類似
一釘狀物,其高度即代表隨
機變數所對應之機率。當隨
機變數X的值為xi時,其機率
表示為
Pr ( X x i ) p ( x i )
其中
0 p ( xi ) 1 ,
n
p ( xi ) 1
i 1
Pg 38
超幾何分配
超幾何分配(Hypergeometric distribution)常應用於
自一批量大小為有限的送驗批中進行抽樣檢驗時,
計算貨批之允收機率。
假設有一大小為N之有限群體,其中有二類物品,D
個為「合格品」而有N-D個為「不合格品」,則超
幾何分配的隨機變數(X)代表從N中採不放回方式
隨機抽取n個,其中有x個屬於「合格品」之機率分
配為:
D N D
x n x
f ( X x ) Pr ( X x )
N
n
x 0 , 1, , min ( n,D )
Pg 39
超幾何分配
超幾何分配之平均數與變異數分別為
nD
N
2
nD
N
(1
D
N
)(
N n
N 1
)
Pg 40
二項式分配
伯努力實驗(Bernoulli trial)
即是進行一次實驗,其實驗結果不是「成功」就是「失敗
」。
每次成功之機率都為p,每次失敗的機率都為1-p
二項式分配(Binomial distribution)
做了n次獨立的Bernoulli實驗
二項式分配的隨機變數(X)代表n次實驗中成功的次數,其
機率分配如下:
n x
n x
f ( X x ) Pr ( X x ) p (1 p )
x
x 0 , 1, , n
Pg 41
二項式分配
母體平均數或稱為期望值為
2
變異數為 Var ( X ) np (1 p )
E ( X ) np
常應用於不合格率管制圖、不合格品數管制圖與允
收抽樣計劃。
Pg 42
二項式分配
通常以符號X~B(n,p)表示隨機變數X符合參數n, p之
二項式分配
n為固定p為變動
p為固定n為變動
p < 0.5
當樣本數n為固定(n = 5),p為變動時
當p = 0.5時,二項式分配為一對稱分配。
當p < 0.5時,為一右偏分配。
當p > 0.5時,為一左偏分配。
當樣本數n為不同值,p固定為0.25時
可知當p固定,而n增加時,分配會越加
對稱。
Pg 43
Example 2.6
某批產品之不合格率為20%,今隨機抽取10個產品
進行檢驗,則在樣本中發現最多2個不合格品之機率
為何?
成功機率(p)=0.2
失敗機率(1-p)=0.8
10
10
10
10
x
10 x
0
10
1
9
2
8
(
0
.
2
)
(
0
.
8
)
(
0
.
2
)
(
0
.
8
)
(
0
.
2
)
(
0
.
8
)
(
0
.
2
)
(
0
.
8
)
x
0
1
2
x0
2
Pr( X 2 )
10 !
0
( 0 .2 ) ( 0 .8 )
0!10 !
10
10 !
1!9!
( 0 .2 ) ( 0 .8 )
1
9
10 !
2
( 0 .2 ) ( 0 .8 )
8
2!8!
0 . 678
Pg 44
卜氏分配
卜氏分配的隨機變數X表示在某特定單位內事件發
生次數,而所謂某特定單位可以是某特定時間內、
某特定面積、某晶圓等。
機率分配
l e
x
f ( X x ) Pr( X x )
l
x 0 , 1, ,
x!
參數l表示單位內平均發生之次數,且l > 0
Pg 45
卜氏分配
卜氏分配的平均數與變異數相等
E(X ) l
2
Var ( X ) l
卜氏分配運用層面很廣,常用於等候線理論、品質
管制中的缺點數管制圖等。
Pg 46
卜氏分配
通 常 以 符 號 X~P(l) 表 示 隨 機
變數X符合參數l之卜氏分配
Example
卜氏分配為一右偏之分配,而
當l值越大,機率分配就越逼近
對稱型分配
當n很大,p很小(p ≦0.01)且l
= np ≦ 7,則二項式分配將趨
近於卜氏分配,如下
x l
n x
l
e
n x
lim p (1 p )
n x
x!
Pg 47
Example 2.7
平均每小時有72輛車進入加油站進行加油,
則3分鐘內有4輛車到達加油站之機率?
l = 72輛/小時= 1.2 輛/分鐘 = 3.6 輛/3分鐘
Pr X x
Pr X 4
x
λ e
λ
x!
3.6 4 2.718 3.6
0.1912
4!
Pg 48
連續型機率分配
當隨機變數屬於連續型資料型態,如壓力、濃度、
內徑、長度、面積、時間等,其所形成之機率分佈
稱為連續型機率分配。
不同於離散型機率分配(f(x) = p(x)),連續型機率
分配的高度(f(x))並不代表隨機變數所對應之機率
值(p(x))。
在探討連續型機率分配時,單點是無機率的或是無意義的
。譬如欲知道某人在5點10分20秒35毫秒12微秒…準時到
達車站的機率,基本上是無意義的。換言之,我們會想知
道某人在某時段內到達車站之機率為何,例如某人在5點
到6點到達車站之機率,此才具有意義。
Pg 49
連續型機率分配
連續型機率分配的圖形為一平滑之曲線,假設存在
某區間(a到b),則其機率即為曲線下所圍成之面
積,表示如下
p (a x b)
b
f ( x ) dx
a
Pg 50
常態分配
常 態 分 配 ( Normal distribution ) 又 稱 高 斯 分 配 (
Gaussian distribution ) 或 鐘 型 分 配 ( Bell shaped
distribution)。
假設存在一連續隨機變數X,則常態分配之機率分配
如下:
f ( X x)
1
2
e
1 x
2
2
, x
其中為母體平均數,為母體標準差
Pg 51
常態分配
通常以X~N(, 2)表示隨機變數X符合平均數為,
變異數為2之常態分配。
常態分配之圖形為類似鐘型的對稱曲線,其平均數
、中位數與眾數都在同一點。
常態分配存在兩個反曲點
,分別距離平均數±1個
的距離,也就是 及
+。
Pg 52
常態分配
在推論統計學中,無論是估計、假設檢定、迴歸分
析,甚至是變異數分析,無不以常態分配作為基礎
。常態分配可說是運用最廣泛且最重要之分配。
Pg 53
標準常態分配
欲求常態分配之機率,必須算出函數在某範圍內所
圍成之面積,然常態分配之函數相當複雜,且不易
直接進行積分。因此通常的作法就是將常態分配的
隨機變數做「標準化」的程序,並使之成為「標準
常態分配」
所謂標準化的程序,就是針對常態分配之變數(X)進
行以下之變數轉換:
X
Z
轉換過後之變數Z會符合一平均數為0,標準差為1之常態
分配(Z~N(0, 1))。
Pg 54
Example 2.8
已知某一班級身高符合一常態分配,平均身高為172
公分,標準差為7公分。今隨機從班上抽取一人,此
人身高介於165公分至179公分之機率為?
Pr 165 X 179 Pr Z 1 Pr Z 1 0 . 8413 0 . 1577 0 . 6826
Pg 55
抽樣分配
統計量(Statistic)
通常母體特性是 未知的。推論統計學 (inferential
statistics)之目的就在於從母體中抽出一組樣本,並
進一步計算相關統計量(statistic)以用來推估母體
。
所謂統計量,簡言之就是樣本的數學組合。
例如,從母體抽出一組樣本x1, x2, …, xn,並計算樣本平均
數 x 用以推估母體平均數();或計算樣本變異數s2推估母
體變異數(2)。因此, x 及s2都為統計量。
Pg 57
抽樣分配
母體與樣本間之關係
母體分配與抽樣分配之關連性
統 計 量 所 形 成 的 機 率 分 配 就 稱 為 抽 樣 分 配 (sampling
distribution)。換言之,抽樣分配就是將樣本統計量視為隨
機變數,並考慮所有可能樣本組合而形成之機率分配。
Pg 58
抽樣分配
X
假設存在一母體(無論何分配),其平均數為,標準
差為。隨機自母體抽出一組樣本x1, x2, …, xn,則樣
本平均數的抽樣分配之平均數與變異數分別如下:
E X
X
2
X
Var X
2
n
抽樣分配之標準差是母體標準差的1 / n 倍。
X 抽樣分配之標準差即代表抽樣誤差(sampling error)
。若欲使抽樣誤差為0,則須實行普查。
X
lim x lim
n
n
0
n
Pg 59
Example
投擲一具四個點數之公平骰子,每個點數出現之機
率為1/4 。令X表示出現之點數(X = 1, 2, 3, 4),則
X之母體分配如下所示,此分配稱為間斷型機率分配
(discrete uniform distribution)。
母體平均數
N
x
i 1
i
1 2 3 4
N
2 .5
4
母體標準差
四點數骰子母體分配
N
x
i
i 1
2
2
N
(1 2 . 5 ) ( 2 2 . 5 ) ( 3 2 . 5 ) ( 4 2 . 5 )
2
2
2
1 . 12
4
Pg 60
Example
今投擲此骰子兩次(n=2)
X 2 .5
X
n
1 . 12
0 . 79
2
Pg 61
中央極限定理
中央極限定理(Central Limit Theorem; CLT)在統計
推論中扮演一極重要之角色。
假設存在一母體(無論分配為何),其平均數為μ,標
準差為σ。今隨機自母體抽出一組樣本x1, x2, …, xn,
並計算樣本平均數 x ,如果抽樣的樣本數 n 很大
(n≧30),則 X 抽樣分配會接近常態分配。
2
X ~ N ,
n
換言之,當不知道母體分配為何時,只要抽樣的樣
本數夠大,則可將 X 之抽樣分配視為常態分配
Pg 62
中央極限定理
Pg 63
Sampling From a Normal Population
標準化樣本平均數抽樣分配 (Z 分配)
t 分配
卡方分配
F 分配
2
Pg 64
Z-分配
自常態母體(N(, 2))下隨機抽出一組樣本x1, x2,
…, xn,則其 抽樣分配同樣會符合一常態分配,
2
X ~ N ,
n
標準化 X ,得
Z
X
n
則Z會符合一平均值為0,變異數為1的標準常態分配
Z~N(0, 1)。
Pg 65
t-分配
當常態母體、為已知的情況下,統計量
會符合標準常態分配。
Z
X
/
n
今若母體標準差未知,並以樣本標準差s代替,
則統計量 Z
記為
X
/
X
s
會符合自由度為n-1之t分配,
n
~ t ( n 1)
n
Pg 66
自由度
所謂自由度(Degree of Freedom)是指統計量
中隨機變數可以自由變動的數目。譬如,假
設我們要選取四個觀察值,以滿足其和為100
,那麼當選取其中三個之後,第四個就直接
被確定了,所以其自由度只有n - 1 = 4 - 1 = 3
。
Pg 67
t-分配 與 Z-分配
當d.f.趨近於∞時,t分配會近似Z分配(虛線部
分)。換句話說,當母體為常態分配,抽樣樣
本數n≦30 ,且未知時,常會利用t分配對於
母體平均數進行推估。
Pg 68
2
分配
從一常態母體抽出一組樣本x1, x2, …, xn,並
計算樣本平均數 x 與樣本變異數s2。假設母
體平均數μ未知,則統計量 x x 會符合
自由度為n-1之卡方分配
n
2
i
i 1
2
n
xi
x
i 1
2
2
( n 1) s
2
2
~ ( n 1)
2
Pg 69
2
分配
隨著樣本數n的增加,其變異數也會跟著增加。
樣本數n越大, 圖形越趨近常態分配。
2
卡方分配常用於機率分配適合度之檢定、獨立性檢
定以及對母體變異數2進行推估。
Pg 70
F分配
考慮兩獨立常態母體:X~N(1, 12)及Y~N(2, 22),
自第一個常態母體抽取n1個隨機樣本x1, x2, …, xn1,
計算出樣本變異數s12 。另外,自第二個常態母體抽
取n2個隨機樣本y1, y2, …, yn2,計算出樣本變異數s22
。則統計量 ( s12 / 12 ) /( s 22 / 22 ) 會符合F分配
s /
2
1
2
2
s /
2
1
2
2
n
1 1
/ n1 1
2
n 2 1
/ n2 1
2
~ F (n 1 ,n 2 )
其中n1、n2分別為分子與分母卡方分配之自由度。
F分配常用於變異數分析以及對兩獨立母體變異數比
值進行推論
Pg 71
抽樣自伯努力分配
假設有一隨機變數Y,若y=1代表成功,y=0 代表失
敗,則伯努力機率分配(Bernoulli distribution)如
下:
y
1 y
f (Y y ) p (1 p )
母體平均數為
, y0
or 1
E (Y ) p
母體變異數為 2 Var (Y ) p (1 p )
隨機自伯努力分配母體抽出一組樣本x1, x2, …, xn,
則樣本之總和(即成功之次數)
X = x1 + x2 + … + xn
會符合一參數為 n 及 p 之二項式分配。
Pg 72
抽樣自伯努力分配
隨機自伯努力分配母體抽出一組樣本x1, x2, …, xn,
則樣本之總和(即成功之次數)
X = x1 + x2 + … + xn
會符合一參數為 n 及 p 之二項式分配。 X~B(n, p)
母體參數p (稱為母體比例,population proportion)通
常為未知,則可利用樣本比例(sample proportion)進
行估計,如下:
pˆ
出現 「 成功 」 次數
實驗次數
X
n
x1 x 2 x n
n
Pg 73
抽樣分配之統計量
pˆ
抽樣分配之平均數為
變異數為
2
pˆ
Var ( pˆ )
pˆ E ( pˆ ) p
p (1 p )
n
由中央極限定理得知,當樣本數n ≧ 30,則 pˆ 會趨近
一常態分配,記為
p (1 p )
ˆp ~ N p ,
n
Pg 74
估計
估計
通常母體分配之參數為未知,因此必須利用
抽樣的樣本資料對母體參數進行估計。例如
,估計卜氏分配的參數l、二項式分配的 p、
常態分配的與。
估 計 的 方 法 主 要 有 兩 種 : 點 估 計 (point
estimate)與區間估計(interval estimate)。
Pg 76
點估計
點估計之目的在於利用樣本資料,求得一估計值以
表示未知母體參數值。通常以「^」符號表示參數的
點估計值。
一個好的點估計量(point estimator)須具許多重要
之性質,如充分性(sufficient)、不偏性(unbiased
)、效率性(efficiency)、一致性(consistence)
等;而最重要的性質為不偏性。
所謂不偏性指的就是點估計量的期望值必須等於被
估計參數值。假設有一母體參數 q ,其點估計值為
ˆ
,則 qˆ 為一不偏估計量(unbiased
E (qˆ ) q
q,若
estimator)。
Pg 77
不偏估計量
不偏估計量
樣本平均數 x 為母體平均數 μ 的不偏估計量。換句話說,
抽樣分配的期望值會等於母體平均數,如下: X
E(X )
2 不偏估計量
樣本變異數s2為母體變異數2的不偏估計量。換句話說,
s2抽樣分配的期望值會等於母體變異數,如下:
E (s )
2
2
Pg 78
不偏估計量
不偏估計量 (利用樣本標準差)
s2 為2的不偏估計量,但是s並非為母體標準差之不偏估
計量。換句話說,s 抽樣分配的期望值為
E ( s ) c 4
利用s估計之不偏估計量為 ˆ s / c 4
不偏估計量 (利用全距)
隨機變數W = R/ 稱為相對全距(relative range),則W抽樣
分配之期望值為
E (W ) E ( R / ) d 2
利用R估計之不偏估計量為 ˆ R / d 2
Pg 79
Note
一般而言,當樣本數n為4~6時會使用R估計。
因全距只考慮最大值與最小值而忽略中間值的資訊
,所以當n≧10時,全距估計 會顯的較沒效率,此
時就需利用 s 估計 。
Pg 80
區間估計
區間估計,主要目的在於根據樣本資料所得之點估
計值,並利用點估計量的抽樣分配建構一區間範圍
,以使得參數之真實值落在此區間內之統計方法。
一區間包含區間上限與區間下限,而點估計值位於
區間的中心位置。
Pg 81
區間估計
希望所建構之區間能夠包含真正的母體參數值
譬如利用點估計值 x 及 X 抽樣分配建構一區間來包
含常態母體之平均數μ,可表示如下:
希望估計誤差會小於某個允差
X tolerance
因為
所以
X ,將允差設為 Z
Z
n
/ n
x Z
n
即
xZ
n
xZ
n
Pg 82
信賴區間
基本上建構出之區間只有「包含」與「不包含」真
值。那到底會有多少信心說明所建構之區間能夠涵
蓋μ?這關於到區間寬度的大小。換句話說,區間越
寬,涵蓋真值的機率就越大。因此在建構區間前必
須先決定信賴水準(confidence level),1-a。
由
X
P r Z a
Za
2
2
/ n
所產生之區間
P r X Z a
X Za
1a
2
2
n
n
x Za
2
n
x Za
2
n
稱為未知平均數μ的(1-a)100%信賴區間(confidence interval)
Pg 83
信賴水準(Confidence Level)
常用之信賴水準
信賴水準
(1-a )100%
a
a/2
Za/2
90%
0.10
0.05
Z0.05 = 1.645
95%
0.05
0.025
Z0.025 = 1.96
99%
0.01
0.005
Z0.005 = 2.58
Pg 84
信賴區間(Confidence Interval)
關於平均數μ的(1- α)100%信賴區間的另一解釋為:
歷經無數次抽樣,會有(1- α)100%所建構之區間包含μ,而
α% 所建構之區間不包含μ。
Pg 85
信賴區間: 單一母體
針對單一母體進行區間估計時會使用到之抽樣分配
Pg 86
單一母體平均值(σ 已知)
從一常態母體抽出一組樣本x1, x2, …, xn,並計算樣
本 平 均數 x , 假 設 母體 標 準差 已 知, 則 的 (1-
a)100% 信賴區間為
x Za
2
n
x Za
2
n
Pg 87
單一母體平均值(σ 未知)
自常態母體抽取一組樣本x1, x2, …, xn,計算樣本平
均數 x,若樣本數n ≧30(大樣本),且母體標準差σ
未知,以s代替,則μ的(1- α)%信賴區間為:
x Za
s
2
s
x Za
n
n
2
自常態母體抽取一組樣本x1, x2, …, xn,計算樣本平
均數 x ,若樣本數n < 30(小樣本),且母體標準差
σ 未知,則μ的(1- α)%信賴區間為:
x t a ( n 1)
2
s
n
x t a ( n 1)
2
s
n
Pg 88
單一母體變異數
自常態母體抽取一組樣本x1, x2, …, xn,計算樣本變
異數s2,則
( n 1) s
2
2
~ ( n 1)
2
2
2
2
P r n 1,1a n 1,a 1 a
2
2
( n 1) s
2
a ( n 1)
2
2
( n 1) s
2
1
2
a
2
( n 1)
2
的(1- α)% 信賴區間為:
( n 1) s
2
a ( n 1)
2
2
( n 1) s
2
1
a
2
( n 1)
2
Pg 89
單一母體比例
由中央極限定理得知,當樣本數n ≧30,則
p (1 p )
pˆ ~ N p ,
n
因此,pˆ 的(1- α)%信賴區間為
pˆ Z a
2
pˆ (1 pˆ )
n
p pˆ Z a
2
pˆ (1 pˆ )
n
Pg 90
區間估計: 兩母體
針對兩母體進行區間估計時會使用到之抽樣分配
Pg 91
獨立樣本與成對樣本
獨立樣本(independent samples)
指的是從一母體抽出的樣本不會影響到從另一個母體所抽
出樣本。
譬如,調查竹科工程師與賣雞排商人的年平均所得差異,
其分別抽出之樣本為獨立。
成對樣本(matched samples)
指的是母體分配彼此為相關,或在抽樣時樣本間具有「成
對」的情形。
譬如,當兵「前與後」的食量差異、「同一時間」二家電
視台之收視率差異等,其樣本間具有相關性。
值得注意的是,此種關係為一個樣本產生兩個值,所以樣
本數會一樣,即n1 = n2。
Pg 92
兩母體平均值:Matched Samples
假設有兩相關常態母體X~N(1, 12)與Y~N(2, 22),
其差值仍符合一常態分配,即D = X - Y ~ N(1-2,
12+22)。今抽取一組樣本大小為n之樣本,計算其
差值d1, d2, …, dn及樣本平均數 d 與樣本標準差sd
若n ≧30 (大樣本),則兩母體平均數差1-2的 (1-a)100%
sd
sd
信賴區間為:
d Za
2
n
1 2 d Z a
n
2
若n < 30 (小樣本),則兩母體平均數差1-2的 (1-a)100%
信賴區間為:
d t a ( n 1)
2
sd
n
1 2 d t a ( n 1)
2
sd
n
Pg 93
兩獨立常態母體平均值: 變異數已知
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 與 y,若兩母體標準差1與2
已知,則兩母體平均數差1-2的 (1-a)100% 信賴區
間為:
1
2
(x y) Z a
2
n1
2
2
n2
1
2
1 2 (x y ) Z a
2
n1
2
2
n2
Pg 94
兩獨立常態母體平均值:(變異數未知,大
樣本)
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 、 y 與樣本標準差s1、s2。 若
兩母體標準差 1與2未知,且n1≧30與n2≧30,則兩
母體平均數差1-2的 (1-a)100% 信賴區間為:
1
2
(x y) Z a
2
n1
2
2
n2
1
2
1 2 (x y ) Z a
2
n1
2
2
n2
Pg 95
兩獨立常態母體平均值:
(變異數未知,小樣本,同質性)
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 (n1< 30
與 n2< 30),並分別計算樣本平均數 x 、 y 與樣本標準
差s1、s2 。 若兩母體標準差 1 與 2 未知,但具同質
性(homogeneity),即1 = 2 ,則可求出共同樣本
標準差(pooled standard deviation):
( n 1 1) s 1 ( n 2 1) s 2
2
Sp
2
n1 n 2 2
而兩母體平均數差1-2的 (1-a)100% 信賴區間為:
( x y ) t a ( n1 n 2 2 ) S p
2
1
n1
1
n2
1 2 ( x y ) t a ( n1 n 2 2 ) S p
2
1
n1
1
n2
Pg 96
兩獨立常態母體平均值:
(變異數未知,小樣本,異質性)
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 (n1<
30 與 n2< 30),並分別計算樣本平均數 x 、y 與樣本
標準差s1、s2 。 若兩母體標準差 1 與 2 未知,也不
具同質性(heterogeneity),即1 ≠ 2,則兩母體平均
數差1-2的 (1-a)100% 信賴區間為:
2
( x y ) t a (v )
2
s1
n1
2
s2
n2
而其中自由度為:
2
1 2 ( x y ) t a (v )
2
2
s 12
s2
n n
2
1
2
s1
n1
2
s2
n2
2
2
s 12
s 22
n
n
1
2
n1 1
n2 1
Pg 97
Note
一般而言,當數據符合常態分配且為大樣本時,變
異數的異質性並不敏感。但是當樣本數為小樣本時
,變異數異質性將會導致變異數高估之情況,而使
得信賴區間過寬。因此當樣本數為小樣本時,需先
利用假設檢定的方法來確定變異數的同質性。當檢
定所得結果為變異數具異質性時,可將數據進行轉
換,例如:平方根轉換法、對數轉換法、倒數轉換
法或反正弦轉換法。
Pg 98
兩母體變異數
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2,並分別
計算樣本變異數s12與s22。則
s1 / 1
2
s /
2
2
因為
2
2
2
~ F n1 1 , n 2 1
p F1a , n 1, n 1 F Fa , n 1, n 1 1 a
2
2
2 1
2 1
兩母體變異數比值s12/s22的(1-a)100%
2
2
2
信賴區間為:
s1 / s 2
1
Fa / 2 ( n1 1, n 2 1)
2
2
2
2
s1 / s 2
F1 a / 2 ( n1 1, n 2 1)
Pg 99
兩母體比例
從兩獨立伯努力分配分別抽出一組樣本x1, x2, …, xn1
和y1, y2, …, yn2。令
X = x1+x2+…+xn1,Y = y1+y2+…+yn2,
樣本比例分別為:
pˆ 1 X / n1
pˆ 2 Y / n 2
由中央極限定理得知,當樣本數n≧30,則
p (1 p 1 )
ˆp 1 ~ N p 1 , 1
n1
p (1 p 1 )
ˆp 2 ~ N p 1 , 1
n1
p (1 p 1 ) p 2 (1 p 2 )
pˆ 1 pˆ 2 ~ N p 1 p 2 , 1
n1
n2
Pg 100
兩母體比例
將
pˆ 1 pˆ 2 進行標準化,得
Z
( pˆ 1 pˆ 2 ) ( p 1 p 2 )
p 1 (1 p 1 )
n1
p 2 (1 p 2 )
n2
p1 – p2的(1-a)100% 信賴區間為:
( pˆ 1 pˆ 2 ) Z a
2
p 1 (1 p 1 )
n1
p 2 (1 p 2 )
n2
p 1 p 2 ( pˆ 1 pˆ 2 ) Z a
2
p 1 (1 p 1 )
n1
p 2 (1 p 2 )
n2
Pg 101
假設檢定
(待第六章再講解)
Hypothesis Testing
假設檢定(hypothesis testing)就是對有關母體參數
進行「假設」,並利用樣本的資訊,「檢定」是否
拒絕該假設的一個統計方法。
Example
假設某班級宣稱其全班平均身高為172公分,則此陳述我
們可以表達如下式:
H0: = 172 H1: ≠ 172
其中,H0: = 172,我們稱之為虛無假設(null hypothesis)
。通常“=”是寫在虛無假設的部分。
另一跟虛無假設成對立的假設,H1: ≠ 172,我們稱為對
立假設(alternative hypothesis)。
Pg 103
Hypothesis
虛無假設 (null hypothesis)
1. 統計中被用來檢定的敘述,記為 H0
2. 虛無假設常用 “無效果”或 “無差異”表示
Ex: “水果冷凍後水分不流失”,即 H0: = 0
對立假設 (alternative hypothesis)
1. 與虛無假設對立之敘述,記為 H1或Ha
2. 對立假設是研究者最關心且想獲得的結果
Ex: “水果冷凍後水分衰減”,即 H1: < 0
Pg 104
General Principles
進行假設時,有兩個重要原則:
將想要 “拒絕”的假設設為虛無假設,而利用樣本
統計量去 “驗證”的假設設為對立假設
Example: 法官審判犯人,會將犯人宣稱自己是無罪的
設為虛無假設,此時,法官會懷疑並提出證據來拒絕
犯人的宣稱,因此會將犯人是有罪的設為對立假設。
抽樣之樣本,經計算的統計量需符合對立假設
Example: 某 一 輪 胎 製 造 商 宣 稱 其 輪 胎 至 少 可 以 跑
300000 公 里 , 而 經 現 場 收 集 數 據 計 算 得 x 301000
…..
(>300000),則假設如下:
H 0 : 300000
H 1 : 300000
Pg 105
Decision of Hypothesis Testing
當問題假設完成後,就需進行檢定(決策)。即,
「拒絕」H0 或是
「不拒絕」H0
通常,進行決策時會犯兩種錯誤:型I誤差(type I
error)與型II誤差(type II error)。
Type I error: 當H0為真,但拒絕H0所發生的機率
a Pr( 拒絕 H 0 | H 0 為真 )
Type II error: 當H0不為真,但接受H0所發生的機率
Pr( 不拒絕 H 0 | H 0 不為真 )
Pg 106
Producer’s Risk vs. Customer’s Risk
在品質管制中,a被稱為生產者風險(producer’s risk)
,因為它代表一個好的產品,卻被消費者認為是不
良品的機率。同樣的,被稱為消費者風險
(customer’s risk),因為它代表的是一個不良品,卻
被消費者認定是良品的機率。
另一機率1-,我們稱為檢定力(power of test),它代
表的是當產品為不良時,我們真正能夠正確判斷它
為不良的機率。
Pg 107
Testing Results
Pg 108
Testing Procedure
當抽出樣本值後,我們會選擇適當的檢定統計量
(Test statistic),並計算其值,若此統計量之值落在
接受域(acceptance region),則不拒絕H0。反之,若
檢定統計量之值不落在接受域,則拒絕H0。
接受域的界定取決於臨界值(critical value)。首先我們會
事先給定型I誤差機率(決定a),之後再根據a的水準來決
定臨界值。常用之a值為0.1, 0.05與0.01。
Pg 109
One-Sided vs. Two-Sided Testing
檢定可分為單邊(one-sided)檢定與雙邊(two-sided)檢
定,完全取決於對立假設。
若有一母體參數θ,
若對立假設為H1: θ < θ0,其中 θ0表示真值。當所計算統計
量之值「小於」臨界值,才拒絕H0,稱為左尾檢定。
若其對立假設為H1: θ > θ0,則當所計算統計量之值「大於
」臨界值,才拒絕H0,稱為右尾檢定。
若其對立假設為H1: θ ≠ θ0,則屬於一雙邊檢定。
當所計算統計量之值落於拒絕域時,才拒絕H0。
Pg 110
One-Sided vs. Two-Sided Testing
Pg 111
The Process of Hypothesis Testing
設立虛無假設與對立假設。
選擇檢定統計量。
給定顯著水準α ,並獲得檢定的臨界值。
計算檢定統計量之值。
制訂決策(拒絕或不拒絕 H0)。
Pg 112
Hypothesis Testing for a Single
Population Mean
考慮單一母體平均數等於某一特定值(0),
雙邊檢定之假設為 H0: = 0
H1: ≠ 0
右尾檢定之假設為 H0: = 0
H1: > 0
左尾檢定之假設為 H0: = 0
H1: < 0
Pg 113
Hypothesis Testing for a Single
Population Mean (σ Known)
假設X為一常態分配隨機變數,其平均數 未知、變
異數2已知。我們希望對平均數等於某一數值 0 的
假設做檢定。首先抽取一組樣本x1, x2, …, xn,其樣
本平均數為 x 。以Z為檢定統計量,並進一步計算檢
x 0
定值如下
*
Z
/
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣Z*∣> Za/2
右尾檢定: Z* > Za
左尾檢定: Z* < -Za
Pg 114
Hypothesis Testing for a Single
Population Mean (σ Unknown, Large Sample Size)
假設X為一常態分配隨機變數,其平均數未知、變
異數2未知。我們希望對平均數等於某一數值0 的
假設做檢定。首先抽取一組樣本x1, x2, …, xn,並分
別計算樣本平均數 x 與樣本標準差 s。若樣本數n
≧30 ,則以Z為檢定統計量,並計算檢定值
Z
*
x 0
s/
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣Z*∣> Za/2
右尾檢定: Z* > Za
左尾檢定: Z* < -Za
Pg 115
Hypothesis Testing for a Single
Population Mean (σ Unknown, Small Sample Size)
假設X為一常態分配隨機變數,其平均數未知、變
異數2未知。我們希望對平均數等於某一數值0 的
假設做檢定。首先抽取一組樣本x1, x2, …, xn,並分
別計算樣本平均數 x 與樣本標準差 s。若樣本數n <
30 ,則以 t 為檢定統計量,並計算檢定值
t
*
x 0
s/
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣t*∣> ta/2(n-1)
右尾檢定: t* > ta(n-1)
左尾檢定: t* < -ta(n-1)
Pg 116
Example 2.9
一連鎖店的中盤商擬分析客戶延緩付款的情形。以
每次收款的平均日數當做測量的基礎,今有人宣稱
「產業界(母體)中一般公司收款期限平均是50日」。
今抽樣100個公司,計算回收款樣本平均數為52.5日
,樣本標準差為14日,則母體平均數是否依然是50
日?
H0: = 50
H1: > 50
令a = 0.05, Z0.05 = 1.645,
Z
*
x 0
s
n
52 . 5 50
14
1 . 786
100
Z* < 1.645,所以拒絕H0。換言之,收款期限平均超過50日。
Pg 117
Hypothesis Testing for a Single
Population Variance
假設隨機變數X為服從常態分配,其平均數為、變異數為2
。若我們希望檢定常態分配的變異數是否會等於某一數值02
,則雙邊檢定的假設如下
H0: = 0
H1: ≠ 0
首先抽取一組樣本x1, x2, …, xn,並計算樣本變異數s2。
以
2為檢定統計量,並計算檢定值
2
2*
( n 1) s
0
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:2* > 2a/2(n-1 或 2* < 21a/2(n-1
右尾檢定: 2* > 2a(n-1
左尾檢定: 2* < 21-a(n-1
Pg 118
Hypothesis Testing for a Single
Population Proportion
由中央極限定理得知,當樣本數n≧30 ,則
p (1 p )
。
pˆ ~ N p ,
n
假設我們想檢定母體比例 p 是否會等於某個標準值p0,
則雙邊檢定為
H0:p = p0
H1:p ≠ p0
抽出一組樣本大小為n之樣本,求得樣本比例為
pˆ p 0
*
定統計量,並計算檢定值
Z
pˆ ,以Z為檢
p 0 (1 p 0 )
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣Z*∣> Za/2
右尾檢定: Z* > Za
左尾檢定: Z* < -Za
Pg 119
P-Value
使用P-value判斷是否拒絕H0
若P-value < α ,則拒絕虛無假設H0。
若P-value > α ,則不拒絕虛無假設H0 。
假設Z*為檢定統計量的值,則P-value計算如下
2[1 Pr( Z Z * )] 雙尾檢定 : H 1 : 0
*
P value 1 Pr( Z Z )
上尾檢定 : H 1 : 0
*
Pr(
Z
Z
)
下尾檢定 : H 1 : 0
Pg 120
Hypothesis Testing: Two Populations
Pg 121
Hypothesis Testing for Two
Population Means
考慮兩母體平均數是否相等,
雙邊檢定之假設為 H0:1 = 2
H1:1 ≠ 2
右尾檢定之假設為 H0:1 = 2
H1:1 > 2
左尾檢定之假設為 H0:1 = 2
H1:1 < 2
Pg 122
Hypothesis Testing for Two
Population Means: Matched Samples
假設有兩相關常態母體X~N(1, 12)與Y~N(2, 22),
其差值仍符合一常態分配,即D = X - Y ~ N(1-2,
12+22) 。今抽取一組樣本大小為n之樣本,計算其
差值d1, d2, …, dn及樣本平均數 d 與樣本標準差sd。
採用 t 分配檢定統計量,並計算檢定值
t
*
d ( 1 2 )
sd /
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣t*∣> ta/2(n-1)
右尾檢定: t* > ta(n-1)
左尾檢定: t* < -ta(n-1)
Pg 123
Hypothesis Testing for Two Independent
Population Means (Variance Known)
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 與 y
若兩母體標準差 1與 2 已知,計算檢定統計量之值
為
x y (1 2 )
*
Z
1
2
n1
2
2
n2
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣Z*∣> Za/2
右尾檢定: Z* > Za
左尾檢定: Z* < -Za
Pg 124
Hypothesis Testing for Two Independent
Population Means (Variance Unknown, Large Sample Size)
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 與 y
若兩母體標準差未知,但n1≧30與n2≧30,則分別利用
樣本標準差s1和s2代替1與2,計算檢定統計量之值為
Z
*
x y ( 1 2 )
2
s1
n1
2
s2
n2
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣Z*∣> Za/2
右尾檢定: Z* > Za
左尾檢定: Z* < -Za
Pg 125
Hypothesis Testing for Two Independent
Population Means (Small Sample Size, 1 = 2)
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,其中
n1<30與n2<30,並分別計算樣本平均數 x 與 y
若兩母體標準差未知,但具同質性(1=2),計算檢
定統計量之值為
t
*
x y (1 2 )
S
1
p
n1
1
n2
( n1 1) s1 ( n 2 1) s 2
2
其中
Sp
2
n1 n 2 2
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣t*∣> ta/2(n1+n2-2)
右尾檢定: t* > ta(n1+n2-2)
左尾檢定: t* < -ta(n1+n2-2)
Pg 126
Hypothesis Testing for Two Independent
Population Means (Small Sample Size, 1 ≠ 2)
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,其中
n1<30與n2<30,並分別計算樣本平均數 與
y
x
若兩母體標準差未知,但不具同質性(1≠2),計算
檢定統計量之值為
t
*
x y ( 1 2 )
2
s1
n1
2
s2
其中
s1 , s 2為樣本標準差
n2
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定:∣t*∣> ta/2(ν)
s
s
n
*
n
右尾檢定: t > ta(ν)
s
s
左尾檢定: t* < -ta(ν)
/( n 1)
2
1
n1
2
2
1
2
2
1
2
2
2
2
1
n2
2
/( n 2 1)
Pg 127
Example 2.10
在一項品質管理訓練裡,實驗者隨機分派20位受試
者至實驗組(有某種品質管理技巧訓練)和控制組
(沒有該項品管訓練),每組10人。經過四週的訓
練後,測其品管技術分數(分數越高表示越好)。
得到實驗組的樣本平均數和變異數分別為68和26,
控制組則為62和20。則這個品質管理技巧訓練有效
嗎?
Pg 128
Example 2.10
H0:1 = 2
H1:1 < 2
若變異數具同質性(σ1=σ2),共同樣本變異數為
( n 1 1) s 1 ( n 2 1) s 2
2
S
2
p
2
n1 n 2 2
(10 1) 26 (10 1) 20
10 10 2
23
計算檢定統計量之值如下:
t
*
x y (1 2 )
Sp
1
n1
68 62 0
1
23
n2
10
2 .8
23
10
給定a = 0.05,則t0.05(18) = 2.25,t* > t0.05,所以拒絕H0
。
Pg 129
Hypothesis Testing for Two
Population Variances
考慮檢定兩獨立常態母體變異數是否相等,
雙邊檢定之假設為 H0:12 = 22
H1:12 ≠ 22
將上式轉變為 H0:12/22 1
H1:12/22 ≠ 1
分別從兩獨立常態母體抽出n1 與n2 個樣本,並計算樣本標準
差s1與s2,則F檢定統計量之值為
F
*
s1 / s 2
2
2
給定a值,分別在以下情況時則拒絕虛無假設 H0
雙邊檢定: F* > Fa/2(n1-1, n2-1) 或 F* < F1a/2(n1-1, n2-1)
右尾檢定: F* > Fa(n1-1, n2-1)
左尾檢定: F* < F1a(n1-1, n2-1)
Pg 130
Hypothesis Testing for Two
Population Proportions
考慮檢定兩獨立伯努力母體比例是否相等,
雙邊檢定之假設為 H0:p1 = p2
H1:p1 ≠ p2
分別從兩獨立伯努力母體抽出n1 與n2 個樣本,並計算樣本比
例 pˆ 1 與 pˆ 2,若n1≧30與n2≧30 ,由中央極限定理得知
p (1 p 1 )
pˆ 1 ~ N p 1 , 1
n1
p (1 p 2 )
pˆ 2 ~ N p 2 , 2
n2
pˆ pˆ 2 ( p 1 p 2 )
*
計算檢定統計量之值
Z 1
其中
1
1
n pˆ n 2 pˆ 2
p (1 p )
p 1 1
n1
n2
n1 n 2
稱為共同樣本比例
給定a值,分別在以下情況時則拒H0
(pooled sample proportion)
雙邊檢定:∣Z*∣> Z
右尾檢定:
左尾檢定:
Z*
Z*
>
<
a/2
Za
-Za
Pg 131
變異數分析
Analysis of Variance
變異數分析ANOVA為 ANalysis Of Variance
之縮寫
ANOVA之目的是用來檢定三個或三個以上母
體平均數是否相等的假設。
Pg 133
Why ANOVA?
當使用Z或 t 比較三個或三個以上母體平均數
是否相等時,會有一些缺失 兩兩比較的方式
1. 型I誤差機率上升
Ex: 在三個樣本時,每次a 定為0.05,進行三次的
t 之後,整體的a 則升至0.15。
2. 忽視多個平均數之整體效果的考驗
Pg 134
ANOVA Hypotheses
“變異數分析”這個名詞似乎並不恰當,因為要檢定
的是母體平均數而非變異數,然而事實上,變異數
分析的檢定過程是根據樣本資料的變異分析為基礎
的。
使用變異數分析檢定多個(a個)母體平均數差異時,
其假設如下 H :
0
1
2
a
H 1 : 母體平均數並不全相等
其中, H0表示所有母體平均數均相等,而H1表示至
少有一母體平均數有差異。
Pg 135
Variation
變異數分析將總變異(total variation)區分為
組間變異(between variation)與組內變異(
within variation)。
總變異=組間變異+組內變異
組間變異:就是組間平均數差異所造成之變異量
。
組內變異:主要是因為組內隨機誤差所產生的變
異量。
Pg 136
Sum of Squares
總平方和 = 因子平方和 + 誤差平方和
總平方和,通常以SST (total sum of squares)表示
因子平方和,通常以SSF (sum of squares due to
factor)表示
誤差平方和,通常以SSE (sum of squares due to
error)表示
Pg 137
Sum of Squares
總平方和主要是描述個別觀測值與整體平均值差異
的平方和
n
a
i
SST
i 1
( x ij x )
2
j 1
因子平方和主要衡量各組平均值對總平均 產生的
差異平方,也就是衡量組間變異。
a
SSF
ni ( xi x )
2
i 1
誤差平方和主要是衡量個別觀察值相較所屬組平均
數差異的平方和,也就是衡量組內變異。
a
SSE
ni
i 1
( x ij x i )
2
j 1
Pg 138
Assumptions
常態假設 (normality)
各母體均為常態分配
變異數為同質(homogeneity)
各母體的變異數皆相等
判斷常態性假設之方法有繪製常態
機率圖(Normal probability plot)與
卡方適合度檢定(goodness of fit)。
當資料不符合常態分配時,經常將
原始數據進行轉換,而Box-Cox轉
換為常用之方法。
變異數同質性檢定方法,常用的為
Bartlett test。檢定結果為變異數不具同
質性時,此時也需對原始數據進行轉換。
觀測值及誤差項為隨機且獨立的
隨機樣本抽選時亦為獨立
判斷樣本是否為隨機且獨立,可
利用建立殘差的常態機率圖來進
行殘差分析(residual analysis)。
Pg 139
Principle of ANOVA
因 子 變 異 ( between variation): 為 可 解 釋 的 變 異
隨機變異(within variation):為不可解釋之變異
變異數分析的方法即是利用樣本統計量(F)來比較因
子變異和隨機變異的大小,以檢定因子所引起的變
異是否大到足以拒絕虛無假設。
檢定準則
若「組間差異 / 組內差異」的值較小,則表示沒有
足夠的證據證明母體平均數不相等。
若「組間差異 / 組內差異」的值很大,則表示母體
平均數應該是不相等。
Pg 140
F Test Statistic
因為 SSF 和 SSE 會受樣本個數多少的影響,因此不
能直接比較 SSF 與 SSE 的大小,而必須進一步求平
均變異。
將平方和除以其對應的自由度,所得稱之為均方
(mean square),因此有:
MSF
SSF
MSE
a 1
其中 N: 所有樣本數
SSE
N a
a: 母體個數
檢定統計量
F
MSF
MSE
Pg 141
ANOVA Table
來源
自由度
d.f.
平方和
Sum of Square
均方
Mean Square
組間
(between)
a-1
SSF
MSF
F Test
MSF
組內(within)
N-a
總和(total)
N-1
SSE
MSE
MSE
給定a,當 F Fa ( a 1, N a ) ,則拒絕虛無假設。
值得注意的是ANOVA的F檢定為右尾檢定,因為當組間
變異遠大於組內變異時才能拒絕虛無假設。
*
Pg 142
Example
為決定那一個十字路口需要交警的監督,在六天中,
紀錄四個十字路口在交通尖峰時刻三十分鐘內車子通
過數量,記錄資料如下。
Day
路口一
路口二
路口三
路口四
1
475
470
360
320
2
465
490
400
410
3
440
450
410
415
4
475
470
415
400
5
510
520
435
460
6
420
440
370
380
以5% 顯著水準檢定四個十字路口在交通尖峰時刻三十
分鐘內平均車流量是否有差異?
Pg 143
Example
來源
SS
d.f.
MS
F*
臨界值
組間
30358
3
10119
8.53
3.10
組內
23725
20
1186
總和
54083
23
F* > F0.05(3, 20) = 3.10,所以應拒絕虛無假設。
換句話說,各路口車流量在交通尖峰時刻有差異。
Pg 144