Transcript Document

Chapter 02
基本統計方法
2010
©版權所有,未經授權請勿使用及出版
Outline
敘述統計
 機率分配
 抽樣分配
 估計
 假設檢定
 變異數分析

Pg 2
Statistics

統計學(Statistics)主要目的在於根據抽樣之
樣本資料進行分析與獲得資訊(解讀),並進一
步對母體作推論及決策。

統計學在品質管制與改善活動上扮演一極重
要之角色。
 本章針對在品質活動上常用之統計理論做一基本
扼要之介紹,內容包含敘述統計、機率分配、抽
樣分配、點估計、區間估計、假設檢定與變異數
分析。
Pg 3
敘述統計
敘述統計(Descriptive Statistics)

敘述統計(descriptive statistics)的主要目的
在於利用統計圖表與數值方法來表達與呈現
資料之特性。

要描述資料之前,通常必須先確認資料之型
態。一般而言,資料可分為質化型資料
(qualitative data)與量化型資料(quantitative
data)。
Pg 5
質化型資料(Qualitative Data)

質化型資料,主要是依據其性質不同而加以區分,
例如原物料依色彩可分為紅、黃、白等顏色,產品
缺陷程度可分為輕微、中度、嚴重程度,血型分為
O、A、B、AB型等等

質化型資料也稱為屬性資料(attribute data)或類別
型資料(categorical data)。

以圖形來描述質性資料之方法,常見的有長條圖
(bar chart)與圓形圖(pie chart)。若欲以數值描
述質性資料,常用的則為摘要表(summary table)。
Pg 6
量化型資料(Quantitative Data)

量化型資料又可分為離散型資料(discrete data)與
連續型資料(continuous data)。
 離散型資料指的就是可以用來計數的(countable)資料
,如晶圓上的缺點數(particle)、汽車鈑金的刮痕數、
產品的不良品數、電腦螢幕的黑點數等
 連續型資料,即是在任意兩數值間存在有無限多個數值
,關於此類之資料相當的多,譬如身高、體重、濃度、
壓力、體積、面積等。
 若欲以圖形描述量化型資料,常見的有點圖(dot plot)
、枝葉圖(stem-and-leaf)與直方圖(histogram)。以數
值方法描述連續型資料型態,常見的有集中趨勢(central
tendency)與離散趨勢(dispersion tendency)之描述
Pg 7
資料類別(Data Type)
Minitab執行路徑: Stat > Basic Statistics > Display Descriptive Statistics
Pg 8
定質型資料描述

摘要表

長條圖

圓餅圖
Pg 9
摘要表(Summary Table)

摘要表為資料收集重要之工具,其製作步驟如下
1. 依照各類別進行計次
2. 總計各類別發生之次數
3. 計算相對次數

Example
 收集有200個產品,依照等級做區分並製作摘要表
Pg 10
長條圖(Bar Chart)

長條圖之主要目的在於將摘要表的數據以圖形方式
呈現出來,其橫軸代表區分之類別,縱軸可為發生
之次數或相對次數的百分比。
Pg 11
圓餅圖(Pie Chart)

圓餅圖乃將摘要表用圖形方式顯示出來,其做法主
要是將一圓形依照發生次數之百分比進行分割。
Pg 12
定量型資料描述

點圖

枝葉圖

直方圖

集中趨勢

離散趨勢

盒鬚圖
Pg 13
點圖(Dot Plot)

在一水平軸上依照每個觀測值大小標示 ,若有相同
的觀測值,則在該數值處把點往上疊。點圖主要目
的在於呈現點的集中或疏密情況以了解資料之趨勢
。

Example
●
 考慮一筆數據:21, 24, 24, 26, 27, 27, 30, 32, 38, 41
Pg 14
枝葉圖(Stem-and-Leaf)

假設某一數值,至少是兩位數,枝葉圖做法就是將
該數值分成兩個部分:「枝」與「葉」。
 枝的部分通常取一位會更多位的
領導位數,而剩下的位數則當作
是葉的部分。
 一般而言,枝的數目不要太多,
最好在5~20之間。在枝決定之後
,將其列於圖的左方,然後將各
自的葉列於右邊便完成枝葉圖。
 枝表達了類別,而葉的部分表達
了發生的次數。
Pg 15
直方圖(Histogram)

枝葉圖適用於少量資料之描述,當資料量大時我們
就須繪製直方圖(histogram)。

直方圖的繪製
Step 0. 決定量測變數,蒐集數據,將數據由小至大排列
Step 1. 找出全體數據中之最大值與最小值,計算全距
Step 2. 決定組數
Step 3. 決定組距=全距/組數
Step 4. 求出各組上、下組界,以及組中心點
Step 5. 製作次數分配表
Step 6. 繪製直方圖
Pg 16
Example 2.3

收集50筆某化學濃度數據
組編號
1
2
3
4
5
6
7
組界
27.5 ~ 37.5
37.5 ~ 47.5
47.5 ~ 57.5
57.5 ~ 67.5
67.5 ~ 77.5
77.5 ~ 87.5
87.5 ~ 97.5
劃記
正
正正
正正
次數
7
5
9
10
10
6
3
Pg 17
Central Tendency

集中趨勢主要目的在於描述資料的「中心位
置」
 樣本平均數 (Sample mean)
 中位數 (Median)
 眾數 (Mode)
Pg 18
Sample Mean

假設某樣本存在n個觀測值x1, x2, …, xn,則樣本平均
數可計算如下
x 
x1  x 2    x n
n

Example 2.4
x 
373 2 436
4
7
Pg 19
中位數(Median)

資料從小到大排序後,中位數即為「最中間的數」
。換句話說,中位數可將一筆資料切割為相等的兩
部分。

當觀測值有偶數個,則取最中間的兩個數值並計算
其平均值以作為中位數。

中位數通常以Me表之。表2.4的資料經排序後如下:
2, 3, 3, 3, 4, 6, 7,因此,可得Me = 3。
Pg 20
眾數(Mode)

眾數即是在一筆資料中,出現次數頻率最多的數。
眾數(Mo)可能發生的情況包含單一眾數、無眾數及
多重眾數。

Example
 單一眾數:例如: 3, 7, 3, 2, 4, 3, 6 ,存在單一眾數3。
 無眾數:例如:10, 4, 8, 11, 6, 7,並無眾數存在。
 多重眾數:例如:25, 32, 32, 42, 45, 45,存在雙眾數32與
45。
Pg 21
比較

平均數:容易計算、適合代數上處理,但容易受極
端值影響。
 當資料呈現偏斜的情況,使用樣本平均數描述資料中心位
置較不具代表性。

中位數:不受極端值之影響,但當資料中間有缺口
時,較不具代表性。

眾數:容易瞭解,不受極端值之影響,但可能存在
多重眾數或是眾數不存在的情況。
Pg 22
資料對稱性(Data Symmetry)

利用集中趨勢衡量尺度來判斷資料之對稱性
 對稱分配:樣本平均數 = 中位數 = 眾數。
 左偏分配:樣本平均數 < 中位數 < 眾數。
 右偏分配:樣本平均數 > 中位數 > 眾數。
Pg 23
離散程度(Dispersion Tendency)

離散趨勢主要目的在於描述資料的「離散程
度」
 全距 (Range)
 四分位距 (Inter-quartile range)
 樣本變異數 (Sample variance)
 樣本標準差 (Sample standard deviation)
Pg 24
全距(Range)

全距即一組資料中的最大值與最小值的差距
全距  Max ( x i )  Min ( x i )

例如: 3, 7, 3, 2, 4, 3, 6 ,全距 = 7 – 2 = 5

利用全距描述資料離散程度,主要的優點在於容易
計算,因此常用於管制圖之計算中;其缺點在於僅
考慮資料中的極大與極小值,而忽略了中間數值之
資訊,因此不適用於大量資料。
Pg 25
四分位距(Inter-Quartile Range)

將資料由小至大排序並分割成四個等分,每一個切
割點稱為四分位數(quartile)。四分位距(Inter-Quartile
Range; IQR)即是第一(下四分位數Q1)與第三分位數(
上四分位數Q3)之差,表示如下
IQR  Q 3  Q1
Pg 26
四分位距

IQR只考慮了中間50%的資料量,也即描述了中央散
佈的情形。

四分位數也可用於檢視資料是否為對稱之分配。若
符合Me – Q1 = Q3 - Me ,則該筆資料即為對稱分配
。

計算IQR之缺點在於當資料量大時,Q1 、Q3 的計算
較為複雜。此外,IQR只考慮中間的一半資料,不足
以表示全部數值的分散程度。
Pg 27
樣本變異數(Sample Variance)

假設收集一組資料x1, x2, …, xn,樣本變異數主
要是將各個觀測值與樣本平均數之差取平方
加總後再取其平均值,表示如下:
n

s 
2

( xi  x )
2
i 1
n 1
一般而言,樣本變異數s2越大,樣本變異性就
越大。
Pg 28
樣本標準差

標準差是最常用且最重要的離散趨勢衡量尺度。樣
本變異數s2 的單位為原始資料單位的平方,這在解
釋上較為困難,因此將s2 取根號,即所謂的樣本標
準差(s),用以當成變異性的衡量尺度,其表示如下
:
n
 (x
s 

i
 x)
2
i 1
n 1
使用樣本標準差最大的優點就是能以原始的單位作
為標準
Pg 29
比較離散程度指標
全距
四分位距
變異數&
標準差
考慮全部資料的一
最容易瞭解、
半,故不受偏離值
優點 計算
之影響
考慮觀測值的
整體資訊
當資料在四分位數
僅考慮極大、
附近有間隔時,代
缺點 極小值
表性低
易受極端值影
響
Pg 30
盒鬚圖(Box-and-Whisker Plot)

盒鬚圖(box-and-whisker plot)又稱箱型圖或箱鬚圖
,其主要目的在於利用圖形視覺化資料的集中趨勢
、離散趨勢及對稱性。此外盒鬚圖也可用以比較兩
組以上資料之差異性,以及偵測資料的離群值。因
此,盒鬚圖常用於品質改善活動中。
Pg 31
盒鬚圖

盒鬚圖中間的『箱子』是由Q1 及Q3 所組成,因此箱
內包含了50%的數值資料,其中Median描述了資料
中心位置,而IQR解釋了中央散佈的情形。此外盒鬚
圖的『鬚』分別是由箱子延伸至最大及最小值,而
Range描述了整體資料散佈的情況。
Pg 32
盒鬚圖

利用箱型圖判斷資料的對稱性
 一般而言,當左鬚長度等於右鬚長度,則資料屬於對稱分
配。當左鬚長度大於右鬚長度,則資料呈現左偏的分配。
當左鬚長度小於右鬚長度,則資料呈現右偏的分配。
Pg 33
盒鬚圖

盒鬚圖的另一重要運用在於辨認離群值(outlier),而使用此法
最大的優點在於資料不需任何的前提假設。

當鬚從盒子的邊界延伸1.5IQR的距離,若觀測值超出此範圍
,則視為離群值。當觀測值的最大值或最小值分別未超出Q3
+ 1.5IQR與Q1 - 1.5IQR ,則盒鬚圖的鬚僅延伸至極值(最大值
或最小值)。
Pg 34
Example 2.5

收集10個數據:1.3, 3.6, 8.5, 1.0, 0.6, 1.0, 4.6, 0.3, 1.1,
2.2。執行Minitab繪製盒鬚圖如下,結果可發現存在
一離群值(*)。
Pg 35
機率分配
機率分配(Probability Distributions)

機率分配(probability distributions)主要目的在於將品
質特性模式化,並解釋其參數行為。
 機率分配將觀測之品質特性視為一個隨機變數(Random
Variable; R.V.),因其值在母體中是隨機變動的,因此機
率分配即在描述品質特性的某些值在母體中出現的機率分
佈情況。

機率分配依品質特性的資料型態,可分為
 離散型機率分配(discrete probability distributions)與
 連續型機率分配(continuous probability distributions)
Pg 37
離散型資料型態

當隨機變數屬於可計數的離散型資料型態,如產品
缺點數、書本錯字數、產品不良品數等,其所形成
之機率分佈稱為離散型機率分配。
 離散型機率分配的形狀類似
一釘狀物,其高度即代表隨
機變數所對應之機率。當隨
機變數X的值為xi時,其機率
表示為
Pr ( X  x i )  p ( x i )
其中
0  p ( xi )  1 ,
n

p ( xi )  1
i 1
Pg 38
超幾何分配

超幾何分配(Hypergeometric distribution)常應用於
自一批量大小為有限的送驗批中進行抽樣檢驗時,
計算貨批之允收機率。

假設有一大小為N之有限群體,其中有二類物品,D
個為「合格品」而有N-D個為「不合格品」,則超
幾何分配的隨機變數(X)代表從N中採不放回方式
隨機抽取n個,其中有x個屬於「合格品」之機率分
配為:
 D  N  D 
  

 x  n  x 
f ( X  x )  Pr ( X  x ) 
N 
 
 n
x  0 , 1,  , min ( n,D )
Pg 39
超幾何分配

超幾何分配之平均數與變異數分別為
 
nD
N

2

nD
N
(1 
D
N
)(
N n
N 1
)
Pg 40
二項式分配

伯努力實驗(Bernoulli trial)
 即是進行一次實驗,其實驗結果不是「成功」就是「失敗
」。
 每次成功之機率都為p,每次失敗的機率都為1-p

二項式分配(Binomial distribution)
 做了n次獨立的Bernoulli實驗
 二項式分配的隨機變數(X)代表n次實驗中成功的次數,其
機率分配如下:
n x
n x
f ( X  x )  Pr ( X  x )    p (1  p )
 x
x  0 , 1,  , n
Pg 41
二項式分配

母體平均數或稱為期望值為 

2
變異數為   Var ( X )  np (1  p )

 E ( X )  np
常應用於不合格率管制圖、不合格品數管制圖與允
收抽樣計劃。
Pg 42
二項式分配

通常以符號X~B(n,p)表示隨機變數X符合參數n, p之
二項式分配
n為固定p為變動
p為固定n為變動
p < 0.5
當樣本數n為固定(n = 5),p為變動時
當p = 0.5時,二項式分配為一對稱分配。
當p < 0.5時,為一右偏分配。
當p > 0.5時,為一左偏分配。
當樣本數n為不同值,p固定為0.25時
可知當p固定,而n增加時,分配會越加
對稱。
Pg 43
Example 2.6

某批產品之不合格率為20%,今隨機抽取10個產品
進行檢驗,則在樣本中發現最多2個不合格品之機率
為何?
成功機率(p)=0.2
失敗機率(1-p)=0.8
 10 
 10 
 10 
 10 
x
10  x
0
10
1
9
2
8








(
0
.
2
)
(
0
.
8
)

(
0
.
2
)
(
0
.
8
)

(
0
.
2
)
(
0
.
8
)

(
0
.
2
)
(
0
.
8
)
 x 
 0 
 1 
 2 
x0 

 
 
 
2
Pr( X  2 ) 

10 !
0
( 0 .2 ) ( 0 .8 )
0!10 !
10

10 !
1!9!
( 0 .2 ) ( 0 .8 ) 
1
9
10 !
2
( 0 .2 ) ( 0 .8 )
8
2!8!
 0 . 678
Pg 44
卜氏分配

卜氏分配的隨機變數X表示在某特定單位內事件發
生次數,而所謂某特定單位可以是某特定時間內、
某特定面積、某晶圓等。

機率分配
l e
x
f ( X  x )  Pr( X  x ) 
l
x  0 , 1,  , 
x!
參數l表示單位內平均發生之次數,且l > 0
Pg 45
卜氏分配

卜氏分配的平均數與變異數相等
  E(X )  l


2
 Var ( X )  l
卜氏分配運用層面很廣,常用於等候線理論、品質
管制中的缺點數管制圖等。
Pg 46
卜氏分配


通 常 以 符 號 X~P(l) 表 示 隨 機
變數X符合參數l之卜氏分配
Example
 卜氏分配為一右偏之分配,而
當l值越大,機率分配就越逼近
對稱型分配

當n很大,p很小(p ≦0.01)且l
= np ≦ 7,則二項式分配將趨
近於卜氏分配,如下
x l
n x
l
e
n x
lim   p (1  p )

n  x
x!
 
Pg 47
Example 2.7

平均每小時有72輛車進入加油站進行加油,
則3分鐘內有4輛車到達加油站之機率?
 l = 72輛/小時= 1.2 輛/分鐘 = 3.6 輛/3分鐘
Pr  X  x  
Pr  X  4  
x
λ e
λ
x!
3.6 4  2.718  3.6
 0.1912
4!
Pg 48
連續型機率分配

當隨機變數屬於連續型資料型態,如壓力、濃度、
內徑、長度、面積、時間等,其所形成之機率分佈
稱為連續型機率分配。

不同於離散型機率分配(f(x) = p(x)),連續型機率
分配的高度(f(x))並不代表隨機變數所對應之機率
值(p(x))。
 在探討連續型機率分配時,單點是無機率的或是無意義的
。譬如欲知道某人在5點10分20秒35毫秒12微秒…準時到
達車站的機率,基本上是無意義的。換言之,我們會想知
道某人在某時段內到達車站之機率為何,例如某人在5點
到6點到達車站之機率,此才具有意義。
Pg 49
連續型機率分配

連續型機率分配的圖形為一平滑之曲線,假設存在
某區間(a到b),則其機率即為曲線下所圍成之面
積,表示如下
p (a  x  b) 

b
f ( x ) dx
a
Pg 50
常態分配

常 態 分 配 ( Normal distribution ) 又 稱 高 斯 分 配 (
Gaussian distribution ) 或 鐘 型 分 配 ( Bell shaped
distribution)。

假設存在一連續隨機變數X,則常態分配之機率分配
如下:
f ( X  x) 
1
2 
e
1  x 
 

2  
2
,   x
其中為母體平均數,為母體標準差
Pg 51
常態分配

通常以X~N(, 2)表示隨機變數X符合平均數為,
變異數為2之常態分配。

常態分配之圖形為類似鐘型的對稱曲線,其平均數
、中位數與眾數都在同一點。

常態分配存在兩個反曲點
,分別距離平均數±1個
的距離,也就是  及
+。
Pg 52
常態分配

在推論統計學中,無論是估計、假設檢定、迴歸分
析,甚至是變異數分析,無不以常態分配作為基礎
。常態分配可說是運用最廣泛且最重要之分配。
Pg 53
標準常態分配

欲求常態分配之機率,必須算出函數在某範圍內所
圍成之面積,然常態分配之函數相當複雜,且不易
直接進行積分。因此通常的作法就是將常態分配的
隨機變數做「標準化」的程序,並使之成為「標準
常態分配」

所謂標準化的程序,就是針對常態分配之變數(X)進
行以下之變數轉換:
X 
Z 

 轉換過後之變數Z會符合一平均數為0,標準差為1之常態
分配(Z~N(0, 1))。
Pg 54
Example 2.8

已知某一班級身高符合一常態分配,平均身高為172
公分,標準差為7公分。今隨機從班上抽取一人,此
人身高介於165公分至179公分之機率為?
Pr 165  X  179   Pr  Z  1   Pr  Z   1   0 . 8413  0 . 1577  0 . 6826
Pg 55
抽樣分配
統計量(Statistic)

通常母體特性是 未知的。推論統計學 (inferential
statistics)之目的就在於從母體中抽出一組樣本,並
進一步計算相關統計量(statistic)以用來推估母體
。

所謂統計量,簡言之就是樣本的數學組合。
 例如,從母體抽出一組樣本x1, x2, …, xn,並計算樣本平均
數 x 用以推估母體平均數();或計算樣本變異數s2推估母
體變異數(2)。因此, x 及s2都為統計量。
Pg 57
抽樣分配

母體與樣本間之關係

母體分配與抽樣分配之關連性
 統 計 量 所 形 成 的 機 率 分 配 就 稱 為 抽 樣 分 配 (sampling
distribution)。換言之,抽樣分配就是將樣本統計量視為隨
機變數,並考慮所有可能樣本組合而形成之機率分配。
Pg 58
抽樣分配
X

假設存在一母體(無論何分配),其平均數為,標準
差為。隨機自母體抽出一組樣本x1, x2, …, xn,則樣
本平均數的抽樣分配之平均數與變異數分別如下:
  E X   
X

2
X
 Var  X  

2
n
抽樣分配之標準差是母體標準差的1 / n 倍。
X 抽樣分配之標準差即代表抽樣誤差(sampling error)
。若欲使抽樣誤差為0,則須實行普查。
 X
lim  x  lim
n 
n 

0
n
Pg 59
Example

投擲一具四個點數之公平骰子,每個點數出現之機
率為1/4 。令X表示出現之點數(X = 1, 2, 3, 4),則
X之母體分配如下所示,此分配稱為間斷型機率分配
(discrete uniform distribution)。
 母體平均數
N
 
x
i 1
i

1 2  3 4
N
 2 .5
4
 母體標準差
四點數骰子母體分配
N
 
 x
i
 
i 1
2
2

N
(1  2 . 5 )  ( 2  2 . 5 )  ( 3  2 . 5 )  ( 4  2 . 5 )
2
2
2
 1 . 12
4
Pg 60
Example

今投擲此骰子兩次(n=2)
 X    2 .5
X 

n

1 . 12
 0 . 79
2
Pg 61
中央極限定理

中央極限定理(Central Limit Theorem; CLT)在統計
推論中扮演一極重要之角色。
假設存在一母體(無論分配為何),其平均數為μ,標
準差為σ。今隨機自母體抽出一組樣本x1, x2, …, xn,
並計算樣本平均數 x ,如果抽樣的樣本數 n 很大
(n≧30),則 X 抽樣分配會接近常態分配。
 2
X ~ N   ,
n






換言之,當不知道母體分配為何時,只要抽樣的樣
本數夠大,則可將 X 之抽樣分配視為常態分配
Pg 62
中央極限定理
Pg 63
Sampling From a Normal Population

標準化樣本平均數抽樣分配 (Z 分配)

t 分配

卡方分配

F 分配

2
Pg 64
Z-分配

自常態母體(N(, 2))下隨機抽出一組樣本x1, x2,
…, xn,則其 抽樣分配同樣會符合一常態分配,
 2
X ~ N   ,
n


標準化 X ,得
Z 




X 

n
則Z會符合一平均值為0,變異數為1的標準常態分配
Z~N(0, 1)。
Pg 65
t-分配

當常態母體、為已知的情況下,統計量
會符合標準常態分配。

Z 
X 
 /
n
今若母體標準差未知,並以樣本標準差s代替,
則統計量 Z 
記為
X 
 /
X 
s
會符合自由度為n-1之t分配,
n
~ t ( n  1)
n
Pg 66
自由度

所謂自由度(Degree of Freedom)是指統計量
中隨機變數可以自由變動的數目。譬如,假
設我們要選取四個觀察值,以滿足其和為100
,那麼當選取其中三個之後,第四個就直接
被確定了,所以其自由度只有n - 1 = 4 - 1 = 3
。
Pg 67
t-分配 與 Z-分配

當d.f.趨近於∞時,t分配會近似Z分配(虛線部
分)。換句話說,當母體為常態分配,抽樣樣
本數n≦30 ,且未知時,常會利用t分配對於
母體平均數進行推估。
Pg 68


2
分配
從一常態母體抽出一組樣本x1, x2, …, xn,並
計算樣本平均數 x 與樣本變異數s2。假設母
體平均數μ未知,則統計量   x  x  會符合

自由度為n-1之卡方分配
n
2
i
i 1
2
n
  xi
 x
i 1

2
2

( n  1) s

2
2
~  ( n  1)
2
Pg 69

2
分配

隨著樣本數n的增加,其變異數也會跟著增加。

樣本數n越大, 圖形越趨近常態分配。

2
卡方分配常用於機率分配適合度之檢定、獨立性檢
定以及對母體變異數2進行推估。
Pg 70
F分配

考慮兩獨立常態母體:X~N(1, 12)及Y~N(2, 22),
自第一個常態母體抽取n1個隨機樣本x1, x2, …, xn1,
計算出樣本變異數s12 。另外,自第二個常態母體抽
取n2個隨機樣本y1, y2, …, yn2,計算出樣本變異數s22
。則統計量 ( s12 /  12 ) /( s 22 /  22 ) 會符合F分配
s /
2
1
2
2
s /
2
1
2
2
n
1 1
/ n1  1
2
n 2 1
/ n2  1
2


~ F (n 1 ,n 2 )
其中n1、n2分別為分子與分母卡方分配之自由度。

F分配常用於變異數分析以及對兩獨立母體變異數比
值進行推論
Pg 71
抽樣自伯努力分配

假設有一隨機變數Y,若y=1代表成功,y=0 代表失
敗,則伯努力機率分配(Bernoulli distribution)如
下:
y
1 y
f (Y  y )  p (1  p )
 母體平均數為
, y0
or 1
  E (Y )  p
 母體變異數為  2  Var (Y )  p (1  p )

隨機自伯努力分配母體抽出一組樣本x1, x2, …, xn,
則樣本之總和(即成功之次數)
X = x1 + x2 + … + xn
會符合一參數為 n 及 p 之二項式分配。
Pg 72
抽樣自伯努力分配

隨機自伯努力分配母體抽出一組樣本x1, x2, …, xn,
則樣本之總和(即成功之次數)
X = x1 + x2 + … + xn
會符合一參數為 n 及 p 之二項式分配。 X~B(n, p)

母體參數p (稱為母體比例,population proportion)通
常為未知,則可利用樣本比例(sample proportion)進
行估計,如下:
pˆ 
出現 「 成功 」 次數
實驗次數

X
n

x1  x 2    x n
n
Pg 73
抽樣分配之統計量
 pˆ
抽樣分配之平均數為
變異數為


2
pˆ
 Var ( pˆ ) 
 pˆ  E ( pˆ )  p
p (1  p )
n
由中央極限定理得知,當樣本數n ≧ 30,則 pˆ 會趨近
一常態分配,記為
p (1  p ) 

ˆp ~ N  p ,

n


Pg 74
估計
估計

通常母體分配之參數為未知,因此必須利用
抽樣的樣本資料對母體參數進行估計。例如
,估計卜氏分配的參數l、二項式分配的 p、
常態分配的與。

估 計 的 方 法 主 要 有 兩 種 : 點 估 計 (point
estimate)與區間估計(interval estimate)。
Pg 76
點估計

點估計之目的在於利用樣本資料,求得一估計值以
表示未知母體參數值。通常以「^」符號表示參數的
點估計值。

一個好的點估計量(point estimator)須具許多重要
之性質,如充分性(sufficient)、不偏性(unbiased
)、效率性(efficiency)、一致性(consistence)
等;而最重要的性質為不偏性。

所謂不偏性指的就是點估計量的期望值必須等於被
估計參數值。假設有一母體參數 q ,其點估計值為
ˆ
,則 qˆ 為一不偏估計量(unbiased
E (qˆ )  q
q,若
estimator)。
Pg 77
不偏估計量

 不偏估計量
 樣本平均數 x 為母體平均數 μ 的不偏估計量。換句話說,
抽樣分配的期望值會等於母體平均數,如下: X
E(X )  

2 不偏估計量
 樣本變異數s2為母體變異數2的不偏估計量。換句話說,
s2抽樣分配的期望值會等於母體變異數,如下:
E (s )  
2
2
Pg 78
不偏估計量

 不偏估計量 (利用樣本標準差)
 s2 為2的不偏估計量,但是s並非為母體標準差之不偏估
計量。換句話說,s 抽樣分配的期望值為
E ( s )  c 4
 利用s估計之不偏估計量為 ˆ  s / c 4

 不偏估計量 (利用全距)
 隨機變數W = R/ 稱為相對全距(relative range),則W抽樣
分配之期望值為
E (W )  E ( R /  )  d 2
 利用R估計之不偏估計量為 ˆ  R / d 2
Pg 79
Note


一般而言,當樣本數n為4~6時會使用R估計。
因全距只考慮最大值與最小值而忽略中間值的資訊
,所以當n≧10時,全距估計  會顯的較沒效率,此
時就需利用 s 估計 。
Pg 80
區間估計

區間估計,主要目的在於根據樣本資料所得之點估
計值,並利用點估計量的抽樣分配建構一區間範圍
,以使得參數之真實值落在此區間內之統計方法。

一區間包含區間上限與區間下限,而點估計值位於
區間的中心位置。
Pg 81
區間估計

希望所建構之區間能夠包含真正的母體參數值
譬如利用點估計值 x 及 X 抽樣分配建構一區間來包
含常態母體之平均數μ,可表示如下:
 希望估計誤差會小於某個允差
X    tolerance
 因為
 所以
X   ,將允差設為 Z 
Z 
n
 / n
x  Z

n
即
xZ

n
  xZ

n
Pg 82
信賴區間


基本上建構出之區間只有「包含」與「不包含」真
值。那到底會有多少信心說明所建構之區間能夠涵
蓋μ?這關於到區間寬度的大小。換句話說,區間越
寬,涵蓋真值的機率就越大。因此在建構區間前必
須先決定信賴水準(confidence level),1-a。
由

X 
P r   Z a 
 Za
2
2
 / n

所產生之區間


 

  P r  X  Z a
   X  Za
  1a
2
2
n
n



x  Za
2
n

   x  Za
2
n
稱為未知平均數μ的(1-a)100%信賴區間(confidence interval)
Pg 83
信賴水準(Confidence Level)

常用之信賴水準
信賴水準
(1-a )100%
a
a/2
Za/2
90%
0.10
0.05
Z0.05 = 1.645
95%
0.05
0.025
Z0.025 = 1.96
99%
0.01
0.005
Z0.005 = 2.58
Pg 84
信賴區間(Confidence Interval)

關於平均數μ的(1- α)100%信賴區間的另一解釋為:
歷經無數次抽樣,會有(1- α)100%所建構之區間包含μ,而
α% 所建構之區間不包含μ。
Pg 85
信賴區間: 單一母體
針對單一母體進行區間估計時會使用到之抽樣分配
Pg 86
單一母體平均值(σ 已知)

從一常態母體抽出一組樣本x1, x2, …, xn,並計算樣
本 平 均數 x , 假 設 母體 標 準差 已 知, 則  的 (1-
a)100% 信賴區間為
x  Za
2

n
   x  Za
2

n
Pg 87
單一母體平均值(σ 未知)

自常態母體抽取一組樣本x1, x2, …, xn,計算樣本平
均數 x,若樣本數n ≧30(大樣本),且母體標準差σ
未知,以s代替,則μ的(1- α)%信賴區間為:
x  Za
s
2

s
   x  Za
n
n
2
自常態母體抽取一組樣本x1, x2, …, xn,計算樣本平
均數 x ,若樣本數n < 30(小樣本),且母體標準差
σ 未知,則μ的(1- α)%信賴區間為:
x  t a ( n  1)
2
s
n
   x  t a ( n  1)
2
s
n
Pg 88
單一母體變異數

自常態母體抽取一組樣本x1, x2, …, xn,計算樣本變
異數s2,則
( n  1) s

2
2
~  ( n  1)
2
2
2
2
P r   n 1,1a     n 1,a   1  a
2
2 

( n  1) s
2

 a ( n  1)
2
2

( n  1) s

2
1
2
a
2
( n  1)
2
 的(1- α)% 信賴區間為:
( n  1) s
2
 a ( n  1)
2
2
 
( n  1) s

2
1
a
2
( n  1)
2
Pg 89
單一母體比例

由中央極限定理得知,當樣本數n ≧30,則
p (1  p ) 

pˆ ~ N  p ,

n


因此,pˆ 的(1- α)%信賴區間為
pˆ  Z a
2
pˆ (1  pˆ )
n
 p  pˆ  Z a
2
pˆ (1  pˆ )
n
Pg 90
區間估計: 兩母體
針對兩母體進行區間估計時會使用到之抽樣分配
Pg 91
獨立樣本與成對樣本

獨立樣本(independent samples)
 指的是從一母體抽出的樣本不會影響到從另一個母體所抽
出樣本。
 譬如,調查竹科工程師與賣雞排商人的年平均所得差異,
其分別抽出之樣本為獨立。

成對樣本(matched samples)
 指的是母體分配彼此為相關,或在抽樣時樣本間具有「成
對」的情形。
 譬如,當兵「前與後」的食量差異、「同一時間」二家電
視台之收視率差異等,其樣本間具有相關性。
 值得注意的是,此種關係為一個樣本產生兩個值,所以樣
本數會一樣,即n1 = n2。
Pg 92
兩母體平均值:Matched Samples

假設有兩相關常態母體X~N(1, 12)與Y~N(2, 22),
其差值仍符合一常態分配,即D = X - Y ~ N(1-2,
12+22)。今抽取一組樣本大小為n之樣本,計算其
差值d1, d2, …, dn及樣本平均數 d 與樣本標準差sd
 若n ≧30 (大樣本),則兩母體平均數差1-2的 (1-a)100%
sd
sd
信賴區間為:
d  Za
2
n
 1   2  d  Z a
n
2
 若n < 30 (小樣本),則兩母體平均數差1-2的 (1-a)100%
信賴區間為:
d  t a ( n  1)
2
sd
n
  1   2  d  t a ( n  1)
2
sd
n
Pg 93
兩獨立常態母體平均值: 變異數已知

從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 與 y,若兩母體標準差1與2
已知,則兩母體平均數差1-2的 (1-a)100% 信賴區
間為:
1
2
(x  y)  Z a
2
n1
2
2

n2
1
2
 1   2  (x  y )  Z a
2
n1
2
2

n2
Pg 94
兩獨立常態母體平均值:(變異數未知,大
樣本)

從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 、 y 與樣本標準差s1、s2。 若
兩母體標準差 1與2未知,且n1≧30與n2≧30,則兩
母體平均數差1-2的 (1-a)100% 信賴區間為:
1
2
(x  y)  Z a
2
n1
2
2

n2
1
2
 1   2  (x  y )  Z a
2
n1
2
2

n2
Pg 95
兩獨立常態母體平均值:
(變異數未知,小樣本,同質性)

從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 (n1< 30
與 n2< 30),並分別計算樣本平均數 x 、 y 與樣本標準
差s1、s2 。 若兩母體標準差 1 與 2 未知,但具同質
性(homogeneity),即1 = 2  ,則可求出共同樣本
標準差(pooled standard deviation):
( n 1  1) s 1  ( n 2  1) s 2
2
Sp 

2
n1  n 2  2
而兩母體平均數差1-2的 (1-a)100% 信賴區間為:
( x  y )  t a ( n1  n 2  2 ) S p
2
1
n1

1
n2
  1   2  ( x  y )  t a ( n1  n 2  2 ) S p
2
1
n1

1
n2
Pg 96
兩獨立常態母體平均值:
(變異數未知,小樣本,異質性)

從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 (n1<
30 與 n2< 30),並分別計算樣本平均數 x 、y 與樣本
標準差s1、s2 。 若兩母體標準差 1 與 2 未知,也不
具同質性(heterogeneity),即1 ≠ 2,則兩母體平均
數差1-2的 (1-a)100% 信賴區間為:
2
( x  y )  t a (v )
2
s1
n1
2

s2
n2
而其中自由度為:
 
2
  1   2  ( x  y )  t a (v )
2
2
 s 12
s2

 n  n
2
 1
2




s1
n1
2

s2
n2
2
2
 s 12 
 s 22 




 n 
 n 
 1 
 2 

n1  1
n2  1
Pg 97
Note

一般而言,當數據符合常態分配且為大樣本時,變
異數的異質性並不敏感。但是當樣本數為小樣本時
,變異數異質性將會導致變異數高估之情況,而使
得信賴區間過寬。因此當樣本數為小樣本時,需先
利用假設檢定的方法來確定變異數的同質性。當檢
定所得結果為變異數具異質性時,可將數據進行轉
換,例如:平方根轉換法、對數轉換法、倒數轉換
法或反正弦轉換法。
Pg 98
兩母體變異數
從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2,並分別
計算樣本變異數s12與s22。則

s1 /  1
2
s /
2
2

因為
2
2
2
~ F n1  1 , n 2  1
p  F1a , n 1, n 1  F  Fa , n 1, n 1   1  a
2
2
2 1
2 1


兩母體變異數比值s12/s22的(1-a)100%
2
2
2
信賴區間為:
s1 / s 2
1
Fa / 2 ( n1  1, n 2  1)


2
2

2
2
s1 / s 2
F1 a / 2 ( n1  1, n 2  1)
Pg 99
兩母體比例

從兩獨立伯努力分配分別抽出一組樣本x1, x2, …, xn1
和y1, y2, …, yn2。令
X = x1+x2+…+xn1,Y = y1+y2+…+yn2,
樣本比例分別為:

pˆ 1  X / n1
pˆ 2  Y / n 2
由中央極限定理得知,當樣本數n≧30,則

p (1  p 1 ) 
ˆp 1 ~ N  p 1 , 1



n1



p (1  p 1 ) 
ˆp 2 ~ N  p 1 , 1



n1



p (1  p 1 ) p 2 (1  p 2 ) 

pˆ 1  pˆ 2 ~ N  p 1  p 2 , 1


n1
n2


Pg 100
兩母體比例

將
pˆ 1  pˆ 2 進行標準化,得
Z 
( pˆ 1  pˆ 2 )  ( p 1  p 2 )
p 1 (1  p 1 )
n1


p 2 (1  p 2 )
n2
p1 – p2的(1-a)100% 信賴區間為:
( pˆ 1  pˆ 2 )  Z a
2
p 1 (1  p 1 )
n1

p 2 (1  p 2 )
n2
 p 1  p 2  ( pˆ 1  pˆ 2 )  Z a
2
p 1 (1  p 1 )
n1

p 2 (1  p 2 )
n2
Pg 101
假設檢定
(待第六章再講解)
Hypothesis Testing


假設檢定(hypothesis testing)就是對有關母體參數
進行「假設」,並利用樣本的資訊,「檢定」是否
拒絕該假設的一個統計方法。
Example
 假設某班級宣稱其全班平均身高為172公分,則此陳述我
們可以表達如下式:
H0:  = 172 H1:  ≠ 172
其中,H0:  = 172,我們稱之為虛無假設(null hypothesis)
。通常“=”是寫在虛無假設的部分。
 另一跟虛無假設成對立的假設,H1:  ≠ 172,我們稱為對
立假設(alternative hypothesis)。
Pg 103
Hypothesis

虛無假設 (null hypothesis)
1. 統計中被用來檢定的敘述,記為 H0
2. 虛無假設常用 “無效果”或 “無差異”表示
Ex: “水果冷凍後水分不流失”,即 H0: = 0

對立假設 (alternative hypothesis)
1. 與虛無假設對立之敘述,記為 H1或Ha
2. 對立假設是研究者最關心且想獲得的結果
Ex: “水果冷凍後水分衰減”,即 H1: < 0
Pg 104
General Principles

進行假設時,有兩個重要原則:
 將想要 “拒絕”的假設設為虛無假設,而利用樣本
統計量去 “驗證”的假設設為對立假設

Example: 法官審判犯人,會將犯人宣稱自己是無罪的
設為虛無假設,此時,法官會懷疑並提出證據來拒絕
犯人的宣稱,因此會將犯人是有罪的設為對立假設。
 抽樣之樣本,經計算的統計量需符合對立假設

Example: 某 一 輪 胎 製 造 商 宣 稱 其 輪 胎 至 少 可 以 跑
300000 公 里 , 而 經 現 場 收 集 數 據 計 算 得 x  301000
…..
(>300000),則假設如下:
H 0 :   300000
H 1 :   300000
Pg 105
Decision of Hypothesis Testing

當問題假設完成後,就需進行檢定(決策)。即,
 「拒絕」H0 或是
 「不拒絕」H0

通常,進行決策時會犯兩種錯誤:型I誤差(type I
error)與型II誤差(type II error)。
 Type I error: 當H0為真,但拒絕H0所發生的機率
a  Pr( 拒絕 H 0 | H 0 為真 )
 Type II error: 當H0不為真,但接受H0所發生的機率
  Pr( 不拒絕 H 0 | H 0 不為真 )
Pg 106
Producer’s Risk vs. Customer’s Risk


在品質管制中,a被稱為生產者風險(producer’s risk)
,因為它代表一個好的產品,卻被消費者認為是不
良品的機率。同樣的,被稱為消費者風險
(customer’s risk),因為它代表的是一個不良品,卻
被消費者認定是良品的機率。
另一機率1-,我們稱為檢定力(power of test),它代
表的是當產品為不良時,我們真正能夠正確判斷它
為不良的機率。
Pg 107
Testing Results
Pg 108
Testing Procedure

當抽出樣本值後,我們會選擇適當的檢定統計量
(Test statistic),並計算其值,若此統計量之值落在
接受域(acceptance region),則不拒絕H0。反之,若
檢定統計量之值不落在接受域,則拒絕H0。
 接受域的界定取決於臨界值(critical value)。首先我們會
事先給定型I誤差機率(決定a),之後再根據a的水準來決
定臨界值。常用之a值為0.1, 0.05與0.01。
Pg 109
One-Sided vs. Two-Sided Testing

檢定可分為單邊(one-sided)檢定與雙邊(two-sided)檢
定,完全取決於對立假設。

若有一母體參數θ,
 若對立假設為H1: θ < θ0,其中 θ0表示真值。當所計算統計
量之值「小於」臨界值,才拒絕H0,稱為左尾檢定。
 若其對立假設為H1: θ > θ0,則當所計算統計量之值「大於
」臨界值,才拒絕H0,稱為右尾檢定。
 若其對立假設為H1: θ ≠ θ0,則屬於一雙邊檢定。
當所計算統計量之值落於拒絕域時,才拒絕H0。
Pg 110
One-Sided vs. Two-Sided Testing
Pg 111
The Process of Hypothesis Testing

設立虛無假設與對立假設。

選擇檢定統計量。

給定顯著水準α ,並獲得檢定的臨界值。

計算檢定統計量之值。

制訂決策(拒絕或不拒絕 H0)。
Pg 112
Hypothesis Testing for a Single
Population Mean

考慮單一母體平均數等於某一特定值(0),
 雙邊檢定之假設為 H0: = 0
H1: ≠ 0
 右尾檢定之假設為 H0: = 0
H1: > 0
 左尾檢定之假設為 H0: = 0
H1: < 0
Pg 113
Hypothesis Testing for a Single
Population Mean (σ Known)

假設X為一常態分配隨機變數,其平均數 未知、變
異數2已知。我們希望對平均數等於某一數值 0 的
假設做檢定。首先抽取一組樣本x1, x2, …, xn,其樣
本平均數為 x 。以Z為檢定統計量,並進一步計算檢
x  0
定值如下
*
Z 
 /
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣Z*∣> Za/2
 右尾檢定: Z* > Za
 左尾檢定: Z* < -Za
Pg 114
Hypothesis Testing for a Single
Population Mean (σ Unknown, Large Sample Size)

假設X為一常態分配隨機變數,其平均數未知、變
異數2未知。我們希望對平均數等於某一數值0 的
假設做檢定。首先抽取一組樣本x1, x2, …, xn,並分
別計算樣本平均數 x 與樣本標準差 s。若樣本數n
≧30 ,則以Z為檢定統計量,並計算檢定值
Z 
*
x  0
s/
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣Z*∣> Za/2
 右尾檢定: Z* > Za
 左尾檢定: Z* < -Za
Pg 115
Hypothesis Testing for a Single
Population Mean (σ Unknown, Small Sample Size)

假設X為一常態分配隨機變數,其平均數未知、變
異數2未知。我們希望對平均數等於某一數值0 的
假設做檢定。首先抽取一組樣本x1, x2, …, xn,並分
別計算樣本平均數 x 與樣本標準差 s。若樣本數n <
30 ,則以 t 為檢定統計量,並計算檢定值
t 
*
x  0
s/
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣t*∣> ta/2(n-1)
 右尾檢定: t* > ta(n-1)
 左尾檢定: t* < -ta(n-1)
Pg 116
Example 2.9

一連鎖店的中盤商擬分析客戶延緩付款的情形。以
每次收款的平均日數當做測量的基礎,今有人宣稱
「產業界(母體)中一般公司收款期限平均是50日」。
今抽樣100個公司,計算回收款樣本平均數為52.5日
,樣本標準差為14日,則母體平均數是否依然是50
日?
 H0:  = 50
H1:  > 50
 令a = 0.05, Z0.05 = 1.645,
Z 
*
x  0
s
n

52 . 5  50
14
 1 . 786
100
 Z* < 1.645,所以拒絕H0。換言之,收款期限平均超過50日。
Pg 117
Hypothesis Testing for a Single
Population Variance

假設隨機變數X為服從常態分配,其平均數為、變異數為2
。若我們希望檢定常態分配的變異數是否會等於某一數值02
,則雙邊檢定的假設如下
H0: = 0
H1: ≠ 0
首先抽取一組樣本x1, x2, …, xn,並計算樣本變異數s2。
以
2為檢定統計量,並計算檢定值
2

2*

( n  1) s
0
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:2* > 2a/2(n-1 或 2* < 21a/2(n-1
 右尾檢定: 2* > 2a(n-1
 左尾檢定: 2* < 21-a(n-1
Pg 118
Hypothesis Testing for a Single
Population Proportion

由中央極限定理得知,當樣本數n≧30 ,則
p (1  p ) 

。
pˆ ~ N  p ,
n


假設我們想檢定母體比例 p 是否會等於某個標準值p0,
則雙邊檢定為
H0:p = p0
H1:p ≠ p0
抽出一組樣本大小為n之樣本,求得樣本比例為
pˆ  p 0
*
定統計量,並計算檢定值
Z 
pˆ ,以Z為檢
p 0 (1  p 0 )
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣Z*∣> Za/2
 右尾檢定: Z* > Za
 左尾檢定: Z* < -Za
Pg 119
P-Value
使用P-value判斷是否拒絕H0

若P-value < α ,則拒絕虛無假設H0。
若P-value > α ,則不拒絕虛無假設H0 。

假設Z*為檢定統計量的值,則P-value計算如下
 2[1  Pr( Z  Z * )] 雙尾檢定 : H 1 :    0

*
P  value  1  Pr( Z  Z )
上尾檢定 : H 1 :    0

*
Pr(
Z

Z
)
下尾檢定 : H 1 :    0

Pg 120
Hypothesis Testing: Two Populations
Pg 121
Hypothesis Testing for Two
Population Means

考慮兩母體平均數是否相等,
 雙邊檢定之假設為 H0:1 = 2
H1:1 ≠ 2
 右尾檢定之假設為 H0:1 = 2
H1:1 > 2
 左尾檢定之假設為 H0:1 = 2
H1:1 < 2
Pg 122
Hypothesis Testing for Two
Population Means: Matched Samples

假設有兩相關常態母體X~N(1, 12)與Y~N(2, 22),
其差值仍符合一常態分配,即D = X - Y ~ N(1-2,
12+22) 。今抽取一組樣本大小為n之樣本,計算其
差值d1, d2, …, dn及樣本平均數 d 與樣本標準差sd。
採用 t 分配檢定統計量,並計算檢定值
t 
*
d  ( 1   2 )
sd /
n
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣t*∣> ta/2(n-1)
 右尾檢定: t* > ta(n-1)
 左尾檢定: t* < -ta(n-1)
Pg 123
Hypothesis Testing for Two Independent
Population Means (Variance Known)


從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 與 y
若兩母體標準差 1與 2 已知,計算檢定統計量之值
為
x  y  (1   2 )
*
Z

1
2
n1
2
2

n2
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣Z*∣> Za/2
 右尾檢定: Z* > Za
 左尾檢定: Z* < -Za
Pg 124
Hypothesis Testing for Two Independent
Population Means (Variance Unknown, Large Sample Size)


從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )
分別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,並
分別計算樣本平均數 x 與 y
若兩母體標準差未知,但n1≧30與n2≧30,則分別利用
樣本標準差s1和s2代替1與2,計算檢定統計量之值為
Z
*

x  y  ( 1   2 )
2
s1
n1
2

s2
n2
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣Z*∣> Za/2
 右尾檢定: Z* > Za
 左尾檢定: Z* < -Za
Pg 125
Hypothesis Testing for Two Independent
Population Means (Small Sample Size, 1 = 2)


從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,其中
n1<30與n2<30,並分別計算樣本平均數 x 與 y
若兩母體標準差未知,但具同質性(1=2),計算檢
定統計量之值為
t
*

x  y  (1   2 )
S
1
p
n1

1
n2
( n1  1) s1  ( n 2  1) s 2
2
其中
Sp 
2
n1  n 2  2
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣t*∣> ta/2(n1+n2-2)
 右尾檢定: t* > ta(n1+n2-2)
 左尾檢定: t* < -ta(n1+n2-2)
Pg 126
Hypothesis Testing for Two Independent
Population Means (Small Sample Size, 1 ≠ 2)


從兩獨立常態母體(X~N(1, 12)與Y~N(2, 22) )分
別抽出一組樣本x1, x2, …, xn1 和y1, y2, …, yn2 ,其中
n1<30與n2<30,並分別計算樣本平均數 與
y
x
若兩母體標準差未知,但不具同質性(1≠2),計算
檢定統計量之值為
t 
*
x  y  ( 1   2 )
2
s1
n1
2

s2
其中
s1 , s 2為樣本標準差
n2
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定:∣t*∣> ta/2(ν)
 s
s 



 n

*
n
 右尾檢定: t > ta(ν)


 
 s 
 s 
 左尾檢定: t* < -ta(ν)

 /( n  1)  





2
1
 n1 
2
2
1
2
2
1
2
2
2
2
1
 n2 
2
/( n 2  1)
Pg 127
Example 2.10

在一項品質管理訓練裡,實驗者隨機分派20位受試
者至實驗組(有某種品質管理技巧訓練)和控制組
(沒有該項品管訓練),每組10人。經過四週的訓
練後,測其品管技術分數(分數越高表示越好)。
得到實驗組的樣本平均數和變異數分別為68和26,
控制組則為62和20。則這個品質管理技巧訓練有效
嗎?
Pg 128
Example 2.10
H0:1 = 2
H1:1 < 2

若變異數具同質性(σ1=σ2),共同樣本變異數為
( n 1  1) s 1  ( n 2  1) s 2
2
S

2
p

2
n1  n 2  2
(10  1)  26  (10  1)  20
10  10  2
 23
計算檢定統計量之值如下:
t 
*
x  y  (1   2 )
Sp


1
n1


68  62  0
1
23
n2
10

 2 .8
23
10
給定a = 0.05,則t0.05(18) = 2.25,t* > t0.05,所以拒絕H0
。
Pg 129
Hypothesis Testing for Two
Population Variances


考慮檢定兩獨立常態母體變異數是否相等,
 雙邊檢定之假設為 H0:12 = 22
H1:12 ≠ 22
 將上式轉變為 H0:12/22  1
H1:12/22 ≠ 1
分別從兩獨立常態母體抽出n1 與n2 個樣本,並計算樣本標準
差s1與s2,則F檢定統計量之值為
F

*
 s1 / s 2
2
2
給定a值,分別在以下情況時則拒絕虛無假設 H0
 雙邊檢定: F* > Fa/2(n1-1, n2-1) 或 F* < F1a/2(n1-1, n2-1)
 右尾檢定: F* > Fa(n1-1, n2-1)
 左尾檢定: F* < F1a(n1-1, n2-1)
Pg 130
Hypothesis Testing for Two
Population Proportions


考慮檢定兩獨立伯努力母體比例是否相等,
 雙邊檢定之假設為 H0:p1 = p2
H1:p1 ≠ p2
分別從兩獨立伯努力母體抽出n1 與n2 個樣本,並計算樣本比
例 pˆ 1 與 pˆ 2,若n1≧30與n2≧30 ,由中央極限定理得知

p (1  p 1 ) 

pˆ 1 ~ N  p 1 , 1

n1



p (1  p 2 ) 

pˆ 2 ~ N  p 2 , 2

n2


pˆ  pˆ 2  ( p 1  p 2 )
*
 計算檢定統計量之值
Z  1
其中
1
1
n pˆ  n 2 pˆ 2
p (1  p )

p  1 1
n1
n2
n1  n 2
稱為共同樣本比例
給定a值,分別在以下情況時則拒H0
(pooled sample proportion)
 雙邊檢定:∣Z*∣> Z
 右尾檢定:
 左尾檢定:
Z*
Z*
>
<
a/2
Za
-Za
Pg 131
變異數分析
Analysis of Variance

變異數分析ANOVA為 ANalysis Of Variance
之縮寫

ANOVA之目的是用來檢定三個或三個以上母
體平均數是否相等的假設。
Pg 133
Why ANOVA?

當使用Z或 t 比較三個或三個以上母體平均數
是否相等時,會有一些缺失 兩兩比較的方式
1. 型I誤差機率上升
Ex: 在三個樣本時,每次a 定為0.05,進行三次的
t 之後,整體的a 則升至0.15。
2. 忽視多個平均數之整體效果的考驗
Pg 134
ANOVA Hypotheses

“變異數分析”這個名詞似乎並不恰當,因為要檢定
的是母體平均數而非變異數,然而事實上,變異數
分析的檢定過程是根據樣本資料的變異分析為基礎
的。

使用變異數分析檢定多個(a個)母體平均數差異時,
其假設如下 H :       
0
1
2
a
H 1 : 母體平均數並不全相等
其中, H0表示所有母體平均數均相等,而H1表示至
少有一母體平均數有差異。
Pg 135
Variation

變異數分析將總變異(total variation)區分為
組間變異(between variation)與組內變異(
within variation)。

總變異=組間變異+組內變異
 組間變異:就是組間平均數差異所造成之變異量
。
 組內變異:主要是因為組內隨機誤差所產生的變
異量。
Pg 136
Sum of Squares

總平方和 = 因子平方和 + 誤差平方和
 總平方和,通常以SST (total sum of squares)表示
 因子平方和,通常以SSF (sum of squares due to
factor)表示
 誤差平方和,通常以SSE (sum of squares due to
error)表示
Pg 137
Sum of Squares

總平方和主要是描述個別觀測值與整體平均值差異
的平方和
n
a
i
SST 

i 1

( x ij  x )
2
j 1
因子平方和主要衡量各組平均值對總平均 產生的
差異平方,也就是衡量組間變異。
a
SSF 

ni ( xi  x )
2
i 1

誤差平方和主要是衡量個別觀察值相較所屬組平均
數差異的平方和,也就是衡量組內變異。
a
SSE 
ni

i 1
( x ij  x i )
2
j 1
Pg 138
Assumptions

常態假設 (normality)
各母體均為常態分配

變異數為同質(homogeneity)
各母體的變異數皆相等

判斷常態性假設之方法有繪製常態
機率圖(Normal probability plot)與
卡方適合度檢定(goodness of fit)。
當資料不符合常態分配時,經常將
原始數據進行轉換,而Box-Cox轉
換為常用之方法。
變異數同質性檢定方法,常用的為
Bartlett test。檢定結果為變異數不具同
質性時,此時也需對原始數據進行轉換。
觀測值及誤差項為隨機且獨立的
隨機樣本抽選時亦為獨立
判斷樣本是否為隨機且獨立,可
利用建立殘差的常態機率圖來進
行殘差分析(residual analysis)。
Pg 139
Principle of ANOVA



因 子 變 異 ( between variation): 為 可 解 釋 的 變 異
隨機變異(within variation):為不可解釋之變異
變異數分析的方法即是利用樣本統計量(F)來比較因
子變異和隨機變異的大小,以檢定因子所引起的變
異是否大到足以拒絕虛無假設。
檢定準則
若「組間差異 / 組內差異」的值較小,則表示沒有
足夠的證據證明母體平均數不相等。
若「組間差異 / 組內差異」的值很大,則表示母體
平均數應該是不相等。
Pg 140
F Test Statistic


因為 SSF 和 SSE 會受樣本個數多少的影響,因此不
能直接比較 SSF 與 SSE 的大小,而必須進一步求平
均變異。
將平方和除以其對應的自由度,所得稱之為均方
(mean square),因此有:
MSF 
SSF
MSE 
a 1
其中 N: 所有樣本數

SSE
N a
a: 母體個數
檢定統計量
F 
MSF
MSE
Pg 141
ANOVA Table
來源
自由度
d.f.
平方和
Sum of Square
均方
Mean Square
組間
(between)
a-1
SSF
MSF
F Test
MSF
組內(within)
N-a
總和(total)
N-1
SSE
MSE
MSE
給定a,當 F  Fa ( a  1, N  a ) ,則拒絕虛無假設。
值得注意的是ANOVA的F檢定為右尾檢定,因為當組間
變異遠大於組內變異時才能拒絕虛無假設。
*
Pg 142
Example


為決定那一個十字路口需要交警的監督,在六天中,
紀錄四個十字路口在交通尖峰時刻三十分鐘內車子通
過數量,記錄資料如下。
Day
路口一
路口二
路口三
路口四
1
475
470
360
320
2
465
490
400
410
3
440
450
410
415
4
475
470
415
400
5
510
520
435
460
6
420
440
370
380
以5% 顯著水準檢定四個十字路口在交通尖峰時刻三十
分鐘內平均車流量是否有差異?
Pg 143
Example

來源
SS
d.f.
MS
F*
臨界值
組間
30358
3
10119
8.53
3.10
組內
23725
20
1186
總和
54083
23
F* > F0.05(3, 20) = 3.10,所以應拒絕虛無假設。
換句話說,各路口車流量在交通尖峰時刻有差異。
Pg 144