兩樣本比例差的比較

Transcript 兩樣本比例差的比較

第二十一講
兩個或多個類別資料檢定
Tests for Two or More Samples
with Categorical Data
1
學習目標
1. 兩類別比例值的比較
a. Z 檢定
b. 2 檢定(卡方檢定)
2. 多個(二個以上)類別比例值的比較
a. 同質性
3. 兩類別因子比例值的比較
a. 齊一性檢定
b. 獨立性檢定
2
資料類型
Data Types
資料
Data
數值
類別
Numerical
Categorical
順序
Ordinal
名義或名目
Nominal
3
資料的獲得

實驗(experiment)
例如 : 丟擲一個骰子，出現點數為六的次數。

調查(survey)
例如 : 某公司新推出的產品在市場上的反應情形。
很滿意、滿意、普通、不滿意、很不滿意
4
單一樣本比例

丟擲一個骰子，出現點數為六的次數，若該骰子共丟擲
100次，出現 20 次點數為六，欲知該骰子出現點數為六的
機率是否為1/ 6?
令  : 母體的成功比例參數。
p : 母體所抽出樣本的成功比例估計量。
解: H0 :  = 1/ 6
H1 :   1/ 6
5
單一樣本比例
解: H0 :  = 1/ 6 (  : 母體的成功比例參數。)
H1 :   1/ 6 ( p : 母體所抽出樣本的成功比例估計量。)
p=x/n
( x : 母體所抽出樣本為六的次數。)
= 20 / 100
( n : 母體抽出所有樣本次數。)
= 0.2
 n  > 5 , n (1-  ) > 5

Z* 
1
6
 0.894
1
1
(1  )
6
6
100
0.2 
6
單一樣本比例
解: H0 :  = 1/ 6 (  : 母體的成功比例參數)
H1 :   1/ 6 ( p : 母體所抽出樣本的成功比例估計量)
p = x / n = 20/100 = 0.2
Z
*

1
0.2 
6
1
1
 (1  )
6
6
100
( x : 母體所抽出樣本為六的次數)
( n : 母體抽出所有樣本次數)
 0.894
(
n  > 5 , n (1-  ) > 5 )
RR: | Z | > Z/2 = Z 0.025 = 1. 96
 Z* = 0.894 < 1.96
 不拒絕虛無假設(do not reject H0)，在=0.05 ，沒有充分証
據說明骰子出現六點機率不為 1/6 。
7
單一樣本比例另解
 丟擲一個骰子，出現點數為六的次數，若丟擲該骰子 100次，
出現 20 次點數為六，欲知該骰子出現點數為六的機率是否為
1/ 6 ?
令  : 母體的成功比例參數。
p : 母體所抽出樣本的成功比例估計量。
解: H0 :  = 1/ 6
H1 :   1/ 6
骰子出現點數
六
其他
合計
觀察值 (O)
期望機率值( )
20
1/6
80
5/6
100
1
1 0 0 /6
1 0 0  5/6
100
期望值 (E)
8
單一樣本比例另解
利用實際觀測個數(次數)與期望個數之差距來測量其偏離
的程度而該偏離度以 2 表示於下：
2 = (O-E)2/ E
骰子出現點數
六
其他
合計
觀察值 (O)
20
80
100
期望值 (E)
100/6
1005/6
1
 2 =(O-E)2/ E
(20-100/6)2/(100/6)=2/3
(80-500/6)2/(500/6)=2/15
12/15=0.8
9
卡方檢定的意義
• 在具有 k 個分類別數的資料中(例如:顏色喜好，手機種
類)，根據研究分析之需要，利用實際觀測個數(次數)與
其在虛無假設為真之母體分配所發生的個數(期望個數)之
差距來測量其偏離度，

2
k

i 1
(Oi  E i )
2
Ei
式中 Oi 表示在第i分類之實際觀測個數(次數);
Ei 表示在第 i 分類之期望個數 ٥
10
卡方檢定性質
a. 當觀測個數(O)與期望個數(E)之間愈接近χ2值愈小，表
示愈不易拒絕虛無假設為真 ;
b. 若 O 與 E 之間距離愈遠，則χ2值愈大，表示拒絕虛無
假設為真;
c. χ2值除了由 O 與 E 之間的差值決定以外，還受限於類
別數的多少，當類別數愈多，χ2也會愈大，因為每個類
別都提供一個正值，所以在查χ2臨界值表時，要考慮整
個資料，自由度的大小。
11
單一樣本比例另解
2 = (O-E)2/ E
2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6)
= 2/3 + 2/15= 0.8
d f = 2 - 1= 1
RR:  2 >  21, 0.05 = 3.84146
2 Table (Portion)
DF
1
2
.995
...
0.010
…
…
…
Upper Tail Area
.95
.05
.025
.01
…
0.004 … 3.84146 5.024 6.635
0.103 … 5.99147 7.378 9.210
12
單一樣本比例另解
2 = (O-E)2/ E
2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6)
= 2/3 + 2/15= 0.8
d f = 2 - 1= 1
RR:  2 >  21, 0.05 = 3.84146

2 <  21, 0.05 = 3.84146
 不拒絕虛無假設(do not reject H0)，在=0.05 ，沒有充分証
據說明骰子出現六點機率不為 1/ 6 。
13
另例、藥品藥效
例：某藥廠宣稱其所治療高血壓的藥品藥效為 96 ，
今用該藥治療 200位高血壓患者，其中180位患者病
情有改善，試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解： H0： = 0.96
 n >5, n(1- ) >5
H1 :   0.96
方法(一) 以 Z 檢定
p=180/200=0.9 ,
0.96(1  0.96)
Z  (0.9  0.96) 
200
 4.33
*
14
藥品藥效例題
例：某藥廠宣稱其所治療高血壓的藥品藥效為 96 ，
今用該藥治療 200位高血壓患者，其中180位患者病
情有改善，試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解： H0： = 0.96
H1 :   0.96
方法(二) 以 2 檢定
E1  200  0.96  192
E 2  200  (1  0.96)  8
2
2
(
180

192
)
(
20

8
)
2
 

192
8
 18.75
15
藥品藥效例題
例：某藥廠宣稱其所治療高血壓的藥品藥效為 96 ，
今用該藥治療 200位高血壓患者，其中180位患者病
情有改善，試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解： H0： = 0.96
vs H1 :   0.96
方法 (二 )
方法 (一 )
 2  18.75
Z *  4.33
RR :  2   2 0.05,1
Z  Z 0.025  1.96
 2 0.05,1  3.84146
無論採用何方法均拒絕虛無假設
(reject H 0 ), 無法相信該藥廠之宣稱
16
單一樣本多類別
 今丟擲一個骰子360次，欲知該骰子是否為一公正
骰子，紀錄其結果如下:
(在α= 0.05條件下進行相關檢定。)
出現點數X值
1
2
3
4
5
6
合計
觀測到出現次數
60
66
72
42
57
63
360
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i not all equal to 1/ 6
17
單一樣本多類別
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
X值
1
2
3
4
5
6
合計
觀測到出現次數(O)
60
66
72
42
57
63
360
期望機率()
1/6
1/6
1/6
1/6
1/6
1/6
1
期望出現次數(E)
60
60
60
60
60
60
360
(O-E)2/ E
0
0.6
2.4
5.4
0.15
0.15
8.7
2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
+ (42-60)2/60 + (57-60)2/60 + (63-60)2/60
= 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7
18
單一樣本多類別
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
+ (42-60)2/60 + (57-60)2/60 + (63-60)2/60
= 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7
df=6-1=5
RR: 2 > 2 0.05,5 =11.1
∵ 2 < 11.1
所以α= 0.05之下，不拒絕虛無假設，骰子為不公
正的情形不顯著，即認為此骰子為公正的。
19
單一樣本多類別

丟擲一個骰子，欲知該骰子是否為一公正骰子?
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
多項式母體比例的檢定
∴卡方檢定可用來決定資料是否屬於原有的母
體或分配。適合度檢定
20
適合度檢定

多項式母體的檢定

二項式母體的檢定

卜瓦松母體的檢定

常態母體的檢定
以例題分別說明，並以電腦excel操作計算
21
多項式母體的檢定

電腦excel操作
丟擲一個骰子360次，欲知該骰子是否為一公正骰
子，紀錄其丟擲結果如下:
(在α= 0.05條件下進行相關檢定。)
出現點數X值
1
2
3
4
5
6
合計
觀測到出現次數
60
66
72
42
57
63
360
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i not all equal to 1/ 6
22
23
24
25
26
27
28
29
30
31
32
33
34
35
3601/6=60
36
37
38
39
40
60  60
2
60
41
42
43
44
45
  8.7  
2
2
0.05,5
 11.1
46
計算 p-value
47
48
49
求得檢定之 p-value值
p-value
50
另一方法求得檢定之 p-value值
51
另一方法求得檢定之 p-value值
52
另一方法求得檢定之 p-value值
53
另一方法求得檢定之 p-value值
54
另一方法求得檢定之 p-value值
55
另一方法求得檢定之 p-value值
p-value
56
二項母體的檢定
 某調查現今小學生配戴眼鏡的分布情形，今收集
250戶有2位小學生之家庭資料如下：
小學生戴眼鏡人數
0
1
2
合計
觀察到的家庭數O
35
110
105
250
欲知小學生戴眼鏡的情形是否符合60%的二項分配型態。
H0：資料來自B(2 , 0.6)
Ha：資料不是來自B(2 , 0.6)
在自由度 df=2 及 α= 0.05 時
57
二項母體的檢定
小孩戴眼鏡人數
觀察到的家庭戶數(O)
期望機率()
期望的家庭戶數(E)
(O-E)2/ E
0
35
0.16
40
0.625
1
110
0.48
120
0.8333
2
105
0.36
90
2.5
合計
250
1
250
3.9583
2 = Σ(Oi - Ei) 2 / Ei
= (35-40)2/40 + (110-120)2/120 + (105-90)2/90
= 0.625 + 0.8333 + 2.5 =3.9583
df=3-1
因為 3.9583 < 22, 0.05 =5.99147 ; 或 p-value = Pr(2 > 3.9583)
0.1 < p-value < 0.2
22, 0.1 < 2 < 22, 0.2
所以不拒絕虛無假設，沒有充分證據說明此資料不是來自二項分配
58
59
60
61
P ( X  0 )  C   1   
 C02 0.6  0.4 2
 0.16
2
0
0
0
2 0
62
63
64
65
66
67
 2  3.96   22,0.05  5.99147
68
計算p-value
69
0.1 < p-value < 0.2 ,
較 =0.05 為大
所以不拒絕虛無假設，沒有充分證據說明此資料不是來
自二項分配
70
卜瓦松分配母體檢定
某一加油站調查，每分鐘加油車輛數的觀測值下：
到達車數
0
1
2
3
4
5
合計
觀測數
182
129
79
8
1
1
400
試以α=0.05的顯著水準，檢定加油車輛數的分
配是否符合卜瓦松分配。
71
卜瓦松分配母體檢定
到達車數
0
1
2
3
4
5
合計
觀測次數
182
129
79
8
1
1
400
ˆ
解：H0：母體分配為卜瓦松分配
Ha：母體分配不為卜瓦松分配
由於平均到站加油車數未知，須先估計
ˆ
=(0182+1129+279+38+41+51)/400= 0.8
72
73
ˆ
74
P( X  x) 
x  e  
x!
0.8 0  e 0.8
P( X  0) 
0!
 0.44933
75
76
77
由於期望車數必須在五輛以上，進行卡方的檢定方
法才準確，因此將到達車次合併至3次，重新計算
78
79
由於分配之平均車數未知，為一估計值
因此自由度為 4 – 1 – 1=2
  13.82  
2
2
0.05, 2
 5.99147
∵ p-value <0.05
所以加油站車輛加油之分配，不為卜瓦松分配
80
常態分配的檢定
有一隨機樣本大小為30，而其觀測值如下：
18 25 26 27 26 25 20 22 23 25 16 24 30 36 34
19 31 28 26 25 24 21 29 28 22 20 27 32 28 19
以顯著水準α=0.05，檢定是否符合平均數為25
，變異數為10 之常態分配。
解： H0：母體分配為常態分配(25,10)
Ha：母體分配不為常態分配(25,10)
81
常態分配的檢定
將樣本由小到大排序，如下：
16 18 19 19 20 20 21 22 22 23 24 24 25 25 25
25 26 26 26 27 27 28 28 28 29 30 31 32 34 36
分五組，找出五個20百分位值，在顯著水準α=0.05，
檢定是否符合平均數為25，變異數為10之常態分
配。
用Excel 電腦軟體進行
82
機率平均數標準差
p百分位值 ( x p )      z p
p  P(Z  z p )
83
機率平均數標準差
84
限制條件範圍
用以計次之數值範圍
85
86
87
 p  value  0.05
not reject H 0
沒有充分證據說明資料不為N(25,10)之常態分配
88
常態分配的檢定
有一隨機樣本大小為20，而其觀測值如下：
18 25 26 27 26 25 20 22 23 25
19 31 28 26 25 24 21 29 28 22
以顯著水準α=0.05，檢定是否符合常態分配。
解： H0：母體分配為常態分配
Ha：母體分配不為常態分配
決定平均數ヽ變異數及分組數(k)後，再依照前
述方法利用Excel進行檢定。特別注意的是卡方
檢定自由度為 k-1-(估計參數個數)=k-1-2
89
回顧

二類別數, 成功或失敗
Z
2

多個類別數(k), 配適度
2
n ≥ 5, n(1- )≥5
自由度 k-1-(估計參數個數)
90
兩樣本比例差的比較
•何時使用?
a. 當要比較兩個母體比例是否有差異存在，或某比例較另一為
大時。
b. 欲比較兩個母體比例差距為某介於(-1,1)之間的非零差距值。
• 所需前題：
a. 獨立樣本
b. 母體來自二項分配
c. 樣本數要夠大，每一母體均需滿足
n  ≥ 5 且 n (1-) ≥ 5 ，其中 n 為樣本個數； 為成功機率參數
91
兩樣本比例差的比較
符號說明
i：第 i 母體的成功比例參數。
Pi：自第 i 母體所抽出樣本的成功比例估計量。
ni：自第 i 母體所抽出的全部樣本數。
xi：自第 i 母體所抽出樣本為成功的樣本個數，
其中 Pi = xi / n i 。
92
兩樣本比例差的比較
有興趣研究問題種類
假設兩比例無差異母體1比例  母體2比例母體1  母體2比例
條件兩比例有差異母體1比例 < 母體2比例母體1 > 母體2比例
H0
H1
1 - 2  
1 - 2  
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
93
兩樣本比例差的比較
有興趣研究問題種類
假設兩比例無差異母體1比例  母體2比例母體1  母體2比例
條件兩比例有差異母體1比例 < 母體2比例母體1 > 母體2比例
H0
H1
註: 1 -
1 - 2  
1 - 2  
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
2   0 ，其中  0可為任一非零的比例
94
兩樣本比例差的比較
有興趣研究問題種類
假設兩比例無差異母體1比例  母體2比例母體1  母體2比例
條件兩比例有差異母體1比例 < 母體2比例母體1 > 母體2比例
H0
H1
檢定
統計
量
1 - 2  
1 - 2  
Z與2
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
Z
Z
95
兩樣本比例差的比較
假設兩比例無差異 Z 
條件兩比例有差異
H0
H1
檢定
統計
量
1 - 2  
1 - 2  
1 1
p(1  p)    
 n1 n2 
決策條件
2 
Z與2
p1  p2
Z  Z
,
x 1  x2
p
n1  n2
2

Oi  Ei 

2
k
i 1
Ei
決策條件  2   2 , df , 其中 df  k  1
96
兩樣本比例差的比較
母體 1 比例不較母體 2 比例大
母體 1 比例較母體 2 比例大
假設
條件
H0
H1
1 - 2  
1 - 2 > 
檢定
統計
量
Z
Z
p1  p2
 p1 1  p1  p2 1  p2  



n1
n2


決策條件 Z  Z
97
兩樣本比例差的比較
母體 1 比例不較母體 2 比例小
母體 1 比例較母體 2 比例小
假設
條件
H0
H1
1 - 2  
1 - 2 < 
檢定
統計
量
Z
Z
p1  p2
 p1 1  p1  p2 1  p2  



n1
n2


決策條件 Z  Z
98
兩樣本比例差的比較
有興趣研究問題種類
假設兩比例無差異母體1比例  母體2比例母體1  母體2比例
條件兩比例有差異母體1比例 < 母體2比例母體1 > 母體2比例
H0
H1
1 - 2  
1 - 2  
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
99
兩樣本比例差例題
區間估計
例、公正性認知
某公司人事主管，欲測試兩種員工能力表現評比
方法的公正性認知百分比差異變化。以方法Ⅰ評比80
位員工中，有60位認為公正;以方法Ⅱ評比75位員工中，
有45為認為公正，試估計在95%的信賴係數下，兩種方
法公正性的認知差異。
100
兩樣本比例差例題
區間估計
p1：表方法Ⅰ認知百分比估計量
p2：表方法Ⅱ認知百分比估計量
E (p1-p2) = 1- 2 , V(p1-p2) = 1 (1- 1) / n1 + 2 (1- 2) / n2
ˆ p1  p2  p1  p2
ˆ p1  p2 
p1 (1  p1 )
p2 (1  p2 )

n1
n2
101
兩樣本比例差例題
區間估計
在 n1 , n2 均為大樣本條件下，由中央極限定理可知，
p1p2會近似常態，所以
 p1 p2  Z /2 ˆ p1 p2  1  2 p1 p2 Z /2ˆ p1  p2
102
兩樣本比例差例題
區間估計
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
ˆ p  p 
1
2
0.75  0.25 0.6  0.4

80
75
 0.005544  0.0745
Z/2=Z
0.025=1.96
103
兩樣本比例差例題
區間估計
p1 = 0.75
p2 = 0.6
ˆ p  p  0.0745
1
2
=0.05, Z/2=Z
0.025=1.96
 p1 p2  Z /2 ˆ p1 p2  1  2 p1 p2 Z /2ˆ p1  p2
0.750.61.960.0745 12 0.750.61.960.0745
→ 0.00398  1 2  0.29602
在95%的信賴係數下，方法Ⅰ與方法Ⅱ公正性的認知差異
介於 (0.00398, 0.29602)
104
兩樣本比例差例題
比例差為某百分比之檢定
例、公正性認知
某公司人事主管，欲測試兩種員工能力表現評比
方法的公正性認知百分比差異變化。以方法Ⅰ評比80
位員工中，有60位認為公正;以方法Ⅱ評比75位員工
中，有45為認為公正，由以往的幾次測試結果，欲知
方法Ⅰ的評比公正性認知較方法Ⅱ高出1成。
105
兩樣本比例差的比較
假設
條件
H0
H1
檢定
統計
量
母體 1 比例不較母體 2 比例高出一成
母體 1 比例較母體 2 比例高出一成
1 - 2  .1
1 - 2 > .1
Z
p1  p2  ( 1   2 )
 p1 1  p1  p2 1  p2  



n1
n2


決策條件 Z  Z
Z
106
兩樣本比例差例題
比例差為某百分比之檢定
解:
下標1表方法Ⅰ，下標2表方法Ⅱ
H0 : 1  2  0.1
H1 : 1  2  0.1
∵ n1 15, n1(1- 1 )  5 且 n2 2  5, n2(1- 2 ) 5
在 n1 , n2 均為大樣本條件下，由中央極限定理可知，
p1p2 會近似常態，所以
107
兩樣本比例差例題
比例差為某百分比之檢定
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
Z 
*

( p1  p2 )  ( 1   2 )
p1 (1  p1 ) p2 (1  p2 )

n1
n2
(0.75  0.6 )  0.1
 0.6715
0.75  0.25 0.6  0.4

80
75
108
兩樣本比例差例題
比例差為某百分比之檢定
在 H0 : 1  2  0.1
H1 : 1  2  0.1
Z 
*
(0.75  0.6)  0.1
 0.6715
0.75  0.25 0.6  0.4

80
75
RR: |Z|> Z/2=Z
0.025=1.96
Z*=0.6715 < 1.96
Not reject H0 ,方法Ⅰ沒有顯著高於方法Ⅱ 1成。
109
兩樣本比例差例題
比例差是否有差異
例、公正性認知
某公司人事主管，欲測試兩種員工能力表現評
比方法的公正性認知百分比差異變化。以方法Ⅰ
評比80位員工中，有60位認為公正;以方法Ⅱ評比
75位員工中，有45為認為公正，試比較在95%的信
賴係數下，兩種方法公正性的認知是否有差異存
在。
110
兩樣本比例差的比較
假設兩比例無差異
條件兩比例有差異
H0
H1
1 - 2  
1 - 2  
p1  p2
x 1  x2
Z
, p
n1  n2
1 1
p(1  p)    
 n1 n2 
決策條件 : Z  Z


O E 

2
2
檢定
統計
量

Z與2
2
E
2
2
決策條件 :     , df
111
兩樣本比例差例題
比例差是否有差異
H 0 :  1  2
vs
H1 :  1   2
 n1 1  5, n1 (1   1 )  5且 n2 2  5, n2 (1   2 )  5
p1  60 / 80  0.75
p2  45 / 75  0.6
60  45 21
p

80  75 31
0.75  0.6
Z* 
 1.9964
21 10  1
1 




31 31  80 75 
RR : Z  Z  1.96
2
under   0.05, Z *  1.96
112
兩樣本比例差例題
比例差是否有差異
H 0 :  1  2
vs H 1 :  1   2
Z *  1.9964
RR : Z  Z  1.96
2
under   0.05, Z *  1.96
拒絕虛無假設,
兩評分方法之公正性認知上有顯著差異存在
113
兩樣本比例差的比較
假設
條件
H0
H1
兩比例無差異 Z 
兩比例有差異
1 - 2  
1 - 2  
p1  p2
1 1
p(1  p)    
 n1 n2 
,
x 1  x2
p
n1  n2
決策條件 : Z  Z

2
2


O

E
2  
檢定
統計
量
E
Z與
2
2
2
決策條件 :     , df
其中 O為觀測值 , E為期望值
114
兩樣本比例差例題
比例差是否有差異
兩獨立
樣本
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
變數水準
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
115
兩樣本比例差例題
比例差是否有差異
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
H0 : 1 - 2  
H1 : 1 - 2  
116
兩樣本比例差例題
比例差是否有差異
H0 : 1 - 2   vs H1 : 1 - 2  
 
2
(O  E )
2
E
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
117
兩樣本比例差例題
比例差是否有差異
r
(Oij  E ij)
c
 
2
i 1 j 1
2
, r  1,2 c  1,2
E ij
df  ( r  1)  (c  1)
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
118
兩樣本比例差例題
比例差是否有差異
r
c
2   
i 1 j 1
(Oij  E ij) 2
, r  1,2 c  1,2
E ij
n1  n1
E11 
n
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
119
兩樣本比例差例題
比例差是否有差異
n1  n1 105  80
E11 

 54.19
n
155
評比方法
認
知
Ⅰ
Ⅱ
合計
公正
60 (54.19)
45
105
不公正
20
30
50
合計
80
75
155
120
兩樣本比例差例題
比例差是否有差異
評比方法
認
知
公正
Ⅰ
Ⅱ
60 (54.19) 45 (50.81)
合計
105
不公正
20 (25.81) 30 (24.19)
50
80
合計
r
c
 
2
i 1 j 1
(Oij  E ij)
75
2
155
, r  1,2 c  1,2
E ij
121
兩樣本比例差例題
比例差是否有差異

60  54.19 


45  50.81

2

2
2
54.19
50.81
20  25.81
2
25.81


30  24.19 

2
24.19
 3.9906
122
兩樣本比例差例題
比例差是否有差異
H0 : 1 - 2   vs H1 : 1 - 2  
r
c
2   
(Oij  E ij) 2
i 1 j 1
,
r  1, 2
c  1, 2
E ij
 2  3.9906 ,
df  ( r  1)( c  1)  1
在  0.05下 , RR : X 2   1,0.05  3.84146
2
 3.9906 
 12,0.05  3.84146
拒絕虛無假設 ,兩評分方法之公正性認知上有顯著差異存在
123
二維列聯表
R C contingency table
22 列聯表
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
觀測個數
邊際個數
總個數
124
二維列聯表
R C contingency table
22 列聯表
pij = nij /n
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
p11
p21
p+1
p12
p22
p+2
p1+
p2+
1
觀測機率
邊際機率
總機率
125
兩獨立樣本
評比方法
認
知
Ⅰ
Ⅱ
合計
公正
60
45
105
不公正
合計
20
30
50
80
75
155
變數水準
126
變數水準
32 列聯表
性別
系
別
男
女
合計
統計
企管
26
30
35
40
61
70
經濟
合計
20
44
64
76
119
195
變數水準
127
卡方檢定
齊一性
例  某零售商懷疑三家不同公司所批得之零件品質有差異。
因此今將各公司購得之零件品質測試紀錄於下表，試以0.05顯
著水準檢定，在不同公司零件品質是否有差異。
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315
55
370
B
425
75
500
C
510
90
600
合計
1250
220
1470
128
卡方檢定
齊一性
以 p11表A公司生產良品個數的比例
p21表B公司生產良品個數的比例
p31表C公司生產良品個數的比例
p11 = p21 = p31
p12 = p22 = p32
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
129
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
  
2
r
c
(Oij  E ij)2
i 1 j 1
Eij 
E
, r  1,2,3 c  1,2
ij
ni   n j
n
130
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
E11=3701250/1470=314.6
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55
370
B
425
75
500
C
510
90
600
合計
1250
220
1470
131
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55 (55.4)
370
B
425 (425.2)
75 (74.8)
500
C
510 (510.2)
90 (89.8)
600
合計
1250
220
1470
132
卡方檢定
齊一性
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55 (55.4)
370
B
425 (425.2)
75 (74.8)
500
C
510 (510.2)
90 (89.8)
600
合計
1250
220
1470
2


315

314
.
6
2 
314.6
55  55.4 2
55.4
2

425  425.2 

425.2
2

75  74.8 

74.8
2

510  510.2 

510.2
2

90  89.8 

89.8

 0.04
133
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
2


315

314
.
6
2 
314.6
55  55.4 2
55.4
2

425  425.2 

425.2
2

75  74.8 

74.8
2

510  510.2 

510.2
2

90  89.8 

89.8

 0.04
RR : X 2   22,0.05  5.99147 , df  (3  1)( 2  1)  2

0.04   22,0.05
不拒絕虛無假設
三公司零件品質無顯著差異存在
134
卡方檢定
齊一性
•將卡方檢定由一般情形延伸至多個獨立
母體之比較
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
•檢定一個變數(變項)各類別(或水準)在
不同母體比例是否相同
•應用列聯表
135
卡方檢定
齊一性
前題條件
•必須為隨機獨立選出樣本
•必須為大樣本
•所有各期望個數必須大於1
136
齊一性檢定例題
例 : 欲知不同系別畢業生畢業後，最先開始從事的
工作性質是否受到其在校主修學位的不同而有差
異。今自企管、統計和經濟系畢業生中，隨機抽
出適當樣本數，並記錄其畢業後，最先開始從事
的工作類別如下: (以α= 0.01檢定之)
主修學位
電腦
銀行
其他
合計
企管
50
16
14
80
統計
25
35
15
75
經濟
21
46
18
85
合計
96
97
47
240
137
齊一性檢定例題
解︰ H0：主修學位與工作類別無差異
Ha：主修學位與工作類別有差異
p11 = p21 =p31 ,
p21 = p22 = p32 ,
p31 = p32 = p33
其中 p11表示企管系畢業生畢業從事電腦工作的百分比
p21表示統計系畢業生畢業從事電腦工作的百分比
p31表示經濟系畢業生畢業從事電腦工作的百分比
E11=80  96 / 240 = 32.0
E21=75  96 / 240 = 30.0
E31=85  96 / 240 = 34.0
138
齊一性檢定例題
期望數的結果
主修學位
電腦
銀行
電子
企管
32.0
32.3
15.7
統計
30.0
30.3
14.7
經濟
34.0
34.4
16.7
139
齊一性檢定例題
解︰ H0：主修學位與工作類別無差異
Ha：主修學位與工作類別有差異
p11 = p21 =p31 ,
p21 = p22 = p32 ,
p31 = p32 = p33
其中 p11表示企管系畢業生畢業從事電腦工作的百分比
p21表示統計系畢業生畢業從事電腦工作的百分比
p31表示經濟系畢業生畢業從事電腦工作的百分比
E11=80  96 / 240 = 32.0
E21=75  96 / 240 = 30.0
E31=85  96 / 240 = 34.0
140
齊一性檢定例題
H0：主修學位與工作類別無差異
Ha：主修學位與工作類別有差異
2
2
2
2








50

32
.
0
25

30
.
0
21

34
.
0
16

32
.
3
2 




32.0
30.0
34.0
32.3
35  30.32  46  34.4 2  14  15.7 2  15  14.7 2  18  16.7 2
30.3
34.4
15.7
14.7
16.7
 29.09
RR : X 2   42,0.01  13.2767 , df  (3  1)(3  1)  4

29.09   42,0.01
拒絕虛無假設
三系別畢業生在初次工作類別上有顯著差異存在
141
卡方檢定
獨立性
例: 某食品公司欲知不同性別消費者，對所推出的3
種不同口味產品喜好是否有差異。今隨機調查200位
消費者，在試吃後選出其最喜歡的口味種類。在顯著
水準0.01下，檢定性別對產品的喜好看法是否有差異。
產品口味
性別
A
B
C
合計
男
75
22
20
117
女
45
18
20
83
合計
120
40
40
200
142
卡方檢定
獨立性
解︰ H0：性別與產品口味無差異
( i j =  i+  +j)
Ha：性別與產品口味有差異
( i j   i+  +j)
( i :性別, 男: 1, 女: 2 ; j : 口味, A:1, B:2, C:3 )
產品口味
性別
A
B
C
合計
男
75
22
20
117
女
45
18
20
83
合計
120
40
40
200
143
卡方檢定
獨立性
產品口味
性別
A
B
C
合計
男
75 (70.2)
22 (23.4)
20 (23.4)
117
女
45 (49.8)
18 (16.6)
20 (16.6)
83
合計
120
40
40
200
144
卡方檢定
獨立性
H0：性別與產品口味無差異 (i j =  i+  +j)
Ha：性別與產品口味有差異 ( i j   i+  +j)
2


75

70
.
2
2 
70.2
18  16.6 2
16.6
2

45  49.8 

49.8
2

20  23.4 

23.4
2

22  23.4 

23.4

2

20  16.6 

16.6
 2.183
RR : X 2   22,0.01  9.21034, df  (2  1)(3  1)  2

2.183   22,0.01
不拒絕虛無假設
不同性別在口味喜好上沒有顯著差異存在
145
卡方檢定
獨立性
•顯示兩變項間的關係
1.僅由一個母體中抽出樣本
H0：i j =  i+  +j
Ha： i j   i+  +j
2.每個變項均有兩個或多個類別(或水準)
3.不顯示因果關係
4.不顯示兩變項間的性質
•應用列聯表
146
卡方檢定
獨立性
•與齊一性比較
齊一性
1.將卡方檢定由一般情形延伸至多個獨立母體之比較
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
2.檢定一個變數(變項)各類別(或水準)在不同母體比例
是否相同
獨立性
1.顯示兩變項間的關係
H0：i j =  i+  +j
僅由一個母體中抽出樣本
vs
Ha： i j   i+  +j
147
應用列聯表,Excel 程式
n1  n 1
n
148
149
150
151
(O11  E11 ) 2
E11
152
RR : X 2   22,0.01  9.21034,

df  (2  1)(3  1)  2
2.183   22,0.01
不拒絕虛無假設
不同性別在口味喜好上沒有顯著差異存在
153
可省略直接應用
CHITEST(B2:D3,B7:D8)
154
總結
1. 兩類別比例值的比較
a. Z 檢定
b. 2 檢定(卡方檢定)
2. 多個(二個以上)類別比例值的比較
a. 同質性
3. 兩類別因子比例值的比較
a. 齊一性檢定
b. 獨立性檢定
155
關於本講程...
請你靜下來想一想:

1. 你學到哪些 ?

2. 想想在您日常生活中，是否有某些事物或
現象符合我們以上所提的各種分析方法?
您是否能對您有興趣瞭解的現象，進行適
當檢定與決策。

3. 是否還有相關問題與疑問 ?
156