兩樣本比例差的比較

Download Report

Transcript 兩樣本比例差的比較

第 二 十 一 講
兩個或多個類別資料檢定
Tests for Two or More Samples
with Categorical Data
1
學習目標
1. 兩類別比例值的比較
a. Z 檢定
b. 2 檢定(卡方檢定)
2. 多個(二個以上)類別比例值的比較
a. 同質性
3. 兩類別因子比例值的比較
a. 齊一性檢定
b. 獨立性檢定
2
資料類型
Data Types
資 料
Data
數值
類別
Numerical
Categorical
順序
Ordinal
名義或名目
Nominal
3
資料的獲得

實驗(experiment)
例如 : 丟擲一個骰子,出現點數為六的次數。

調查(survey)
例如 : 某公司新推出的產品在市場上的反應情形。
很滿意 、 滿意 、普通 、 不滿意、 很不滿意
4
單一樣本比例

丟擲一個骰子,出現點數為六的次數,若該骰子共丟擲
100次,出現 20 次點數為六,欲知該骰子出現點數為六的
機率是否為1/ 6?
令  : 母體的成功比例參數。
p : 母體所抽出樣本的成功比例估計量。
解: H0 :  = 1/ 6
H1 :   1/ 6
5
單一樣本比例
解: H0 :  = 1/ 6 (  : 母體的成功比例參數。)
H1 :   1/ 6 ( p : 母體所抽出樣本的成功比例估計量。)
p=x/n
( x : 母體所抽出樣本為六的次數。)
= 20 / 100
( n : 母體抽出所有樣本次數。)
= 0.2
 n  > 5 , n (1-  ) > 5

Z* 
1
6
 0.894
1
1
(1  )
6
6
100
0.2 
6
單一樣本比例
解: H0 :  = 1/ 6 (  : 母體的成功比例參數)
H1 :   1/ 6 ( p : 母體所抽出樣本的成功比例估計量)
p = x / n = 20/100 = 0.2
Z
*

1
0.2 
6
1
1
 (1  )
6
6
100
( x : 母體所抽出樣本為六的次數)
( n : 母體抽出所有樣本次數)
 0.894
(
n  > 5 , n (1-  ) > 5 )
RR: | Z | > Z/2 = Z 0.025 = 1. 96
 Z* = 0.894 < 1.96
 不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証
據說明骰子出現六點機率不為 1/6 。
7
單一樣本比例另解
 丟擲一個骰子,出現點數為六的次數,若丟擲該骰子 100次,
出現 20 次點數為六,欲知該骰子出現點數為六的機率是否為
1/ 6 ?
令  : 母體的成功比例參數。
p : 母體所抽出樣本的成功比例估計量。
解: H0 :  = 1/ 6
H1 :   1/ 6
骰子出現點數
六
其他
合計
觀察值 (O)
期望機率值( )
20
1/6
80
5/6
100
1
1 0 0 /6
1 0 0  5/6
100
期望值 (E)
8
單一樣本比例另解
利用實際觀測個數(次數)與期望個數之差距來測量其偏離
的程度 而該偏離度以 2 表示於下:
2 = (O-E)2/ E
骰子出現點數
六
其他
合計
觀察值 (O)
20
80
100
期望值 (E)
100/6
1005/6
1
 2 =(O-E)2/ E
(20-100/6)2/(100/6)=2/3
(80-500/6)2/(500/6)=2/15
12/15=0.8
9
卡方檢定的意義
• 在具有 k 個分類別數的資料中(例如:顏色喜好,手機種
類),根據研究分析之需要,利用實際觀測個數(次數)與
其在虛無假設為真之母體分配所發生的個數(期望個數)之
差距來測量其偏離度,

2
k

i 1
(Oi  E i )
2
Ei
式中 Oi 表示在第i分類之實際觀測個數(次數);
Ei 表示在第 i 分類之期望個數 ٥
10
卡方檢定性質
a. 當觀測個數(O)與期望個數(E)之間愈接近χ2值愈小,表
示愈不易拒絕虛無假設為真 ;
b. 若 O 與 E 之間距離愈遠,則χ2值愈大,表示拒絕虛無
假設為真;
c. χ2值除了由 O 與 E 之間的差值決定以外,還受限於類
別數的多少,當類別數愈多,χ2也會愈大,因為每個類
別都提供一個正值,所以在查χ2臨界值表時,要考慮整
個資料,自由度的大小。
11
單一樣本比例另解
2 = (O-E)2/ E
2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6)
= 2/3 + 2/15= 0.8
d f = 2 - 1= 1
RR:  2 >  21, 0.05 = 3.84146
2 Table (Portion)
DF
1
2
.995
...
0.010
…
…
…
Upper Tail Area
.95
.05
.025
.01
…
0.004 … 3.84146 5.024 6.635
0.103 … 5.99147 7.378 9.210
12
單一樣本比例另解
2 = (O-E)2/ E
2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6)
= 2/3 + 2/15= 0.8
d f = 2 - 1= 1
RR:  2 >  21, 0.05 = 3.84146

2 <  21, 0.05 = 3.84146
 不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証
據說明骰子出現六點機率不為 1/ 6 。
13
另例、藥品藥效
例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 ,
今用該藥治療 200位高血壓患者,其中180位患者病
情有改善,試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解: H0: = 0.96
 n >5, n(1- ) >5
H1 :   0.96
方法(一) 以 Z 檢定
p=180/200=0.9 ,
0.96(1  0.96)
Z  (0.9  0.96) 
200
 4.33
*
14
藥品藥效例題
例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 ,
今用該藥治療 200位高血壓患者,其中180位患者病
情有改善,試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解: H0: = 0.96
H1 :   0.96
方法(二) 以 2 檢定
E1  200  0.96  192
E 2  200  (1  0.96)  8
2
2
(
180

192
)
(
20

8
)
2
 

192
8
 18.75
15
藥品藥效例題
例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 ,
今用該藥治療 200位高血壓患者,其中180位患者病
情有改善,試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解: H0: = 0.96
vs H1 :   0.96
方法 (二 )
方法 (一 )
 2  18.75
Z *  4.33
RR :  2   2 0.05,1
Z  Z 0.025  1.96
 2 0.05,1  3.84146
無論採用何方法均拒絕虛無假設
(reject H 0 ), 無法相信該藥廠之宣稱
16
單一樣本多類別
 今丟擲一個骰子360次,欲知該骰子是否為一公正
骰子,紀錄其結果如下:
(在α= 0.05條件下進行相關檢定。)
出現點數X值
1
2
3
4
5
6
合計
觀測到出現次數
60
66
72
42
57
63
360
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i not all equal to 1/ 6
17
單一樣本多類別
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
X值
1
2
3
4
5
6
合計
觀測到出現次數(O)
60
66
72
42
57
63
360
期望機率()
1/6
1/6
1/6
1/6
1/6
1/6
1
期望出現次數(E)
60
60
60
60
60
60
360
(O-E)2/ E
0
0.6
2.4
5.4
0.15
0.15
8.7
2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
+ (42-60)2/60 + (57-60)2/60 + (63-60)2/60
= 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7
18
單一樣本多類別
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
+ (42-60)2/60 + (57-60)2/60 + (63-60)2/60
= 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7
df=6-1=5
RR: 2 > 2 0.05,5 =11.1
∵ 2 < 11.1
所以α= 0.05之下,不拒絕虛無假設,骰子為不公
正的情形不顯著,即認為此骰子為公正的。
19
單一樣本多類別

丟擲一個骰子,欲知該骰子是否為一公正骰子?
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
多項式母體比例的檢定
∴卡方檢定可用來決定資料是否屬於原有的母
體或分配。 適合度檢定
20
適合度檢定

多項式母體的檢定

二項式母體的檢定

卜瓦松母體的檢定

常態母體的檢定
以例題分別說明,並以電腦excel操作計算
21
多項式母體的檢定

電腦excel操作
丟擲一個骰子360次,欲知該骰子是否為一公正骰
子,紀錄其丟擲結果如下:
(在α= 0.05條件下進行相關檢定。)
出現點數X值
1
2
3
4
5
6
合計
觀測到出現次數
60
66
72
42
57
63
360
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i not all equal to 1/ 6
22
23
24
25
26
27
28
29
30
31
32
33
34
35
3601/6=60
36
37
38
39
40
60  60
2
60
41
42
43
44
45
  8.7  
2
2
0.05,5
 11.1
46
計算 p-value
47
48
49
求得檢定之 p-value值
p-value
50
另一方法求得檢定之 p-value值
51
另一方法求得檢定之 p-value值
52
另一方法求得檢定之 p-value值
53
另一方法求得檢定之 p-value值
54
另一方法求得檢定之 p-value值
55
另一方法求得檢定之 p-value值
p-value
56
二項母體的檢定
 某調查現今小學生配戴眼鏡的分布情形,今收集
250戶有2位小學生之家庭資料如下:
小學生戴眼鏡人數
0
1
2
合計
觀察到的家庭數O
35
110
105
250
欲知小學生戴眼鏡的情形是否符合60%的二項分配型態。
H0:資料來自B(2 , 0.6)
Ha:資料不是來自B(2 , 0.6)
在自由度 df=2 及 α= 0.05 時
57
二項母體的檢定
小孩戴眼鏡人數
觀察到的家庭戶數(O)
期望機率()
期望的家庭戶數(E)
(O-E)2/ E
0
35
0.16
40
0.625
1
110
0.48
120
0.8333
2
105
0.36
90
2.5
合計
250
1
250
3.9583
2 = Σ(Oi - Ei) 2 / Ei
= (35-40)2/40 + (110-120)2/120 + (105-90)2/90
= 0.625 + 0.8333 + 2.5 =3.9583
df=3-1
因為 3.9583 < 22, 0.05 =5.99147 ; 或 p-value = Pr(2 > 3.9583)
0.1 < p-value < 0.2
22, 0.1 < 2 < 22, 0.2
所以不拒絕虛無假設,沒有充分證據說明此資料不是來自二項分配
58
59
60
61
P ( X  0 )  C   1   
 C02 0.6  0.4 2
 0.16
2
0
0
0
2 0
62
63
64
65
66
67
 2  3.96   22,0.05  5.99147
68
計算p-value
69
0.1 < p-value < 0.2 ,
較 =0.05 為大
所以不拒絕虛無假設,沒有充分證據說明此資料不是來
自二項分配
70
卜瓦松分配母體檢定
某一加油站調查,每分鐘加油車輛數的觀測值下:
到達車數
0
1
2
3
4
5
合計
觀測數
182
129
79
8
1
1
400
試以α=0.05的顯著水準,檢定加油車輛數的分
配是否符合卜瓦松分配。
71
卜瓦松分配母體檢定
到達車數
0
1
2
3
4
5
合計
觀測次數
182
129
79
8
1
1
400
ˆ
解:H0:母體分配為卜瓦松分配
Ha:母體分配不為卜瓦松分配
由於平均到站加油車數未知,須先估計
ˆ
=(0182+1129+279+38+41+51)/400= 0.8
72
73
ˆ
74
P( X  x) 
x  e  
x!
0.8 0  e 0.8
P( X  0) 
0!
 0.44933
75
76
77
由於期望車數必須在五輛以上,進行卡方的檢定方
法才準確,因此將到達車次合併至3次,重新計算
78
79
由於分配之平均車數未知,為一估計值
因此自由度為 4 – 1 – 1=2
  13.82  
2
2
0.05, 2
 5.99147
∵ p-value <0.05
所以加油站車輛加油之分配, 不為卜瓦松分配
80
常態分配的檢定
有一隨機樣本大小為30,而其觀測值如下:
18 25 26 27 26 25 20 22 23 25 16 24 30 36 34
19 31 28 26 25 24 21 29 28 22 20 27 32 28 19
以顯著水準α=0.05,檢定是否符合平均數為25
,變異數為10 之常態分配。
解: H0:母體分配為常態分配(25,10)
Ha:母體分配不為常態分配(25,10)
81
常態分配的檢定
將樣本由小到大排序,如下:
16 18 19 19 20 20 21 22 22 23 24 24 25 25 25
25 26 26 26 27 27 28 28 28 29 30 31 32 34 36
分五組,找出五個20百分位值,在顯著水準α=0.05,
檢定是否符合平均數為25,變異數為10之常態分
配。
用Excel 電腦軟體進行
82
機率 平均數 標準差
p百分位值 ( x p )      z p
p  P(Z  z p )
83
機率 平均數 標準差
84
限制條件範圍
用以計次之數值範圍
85
86
87
 p  value  0.05
not reject H 0
沒有充分證據說明資料不為N(25,10)之常態分配
88
常態分配的檢定
有一隨機樣本大小為20,而其觀測值如下:
18 25 26 27 26 25 20 22 23 25
19 31 28 26 25 24 21 29 28 22
以顯著水準α=0.05,檢定是否符合常態分配。
解: H0:母體分配為常態分配
Ha:母體分配不為常態分配
決定平均數ヽ變異數及分組數(k)後,再依照前
述方法利用Excel進行檢定。特別注意的是卡方
檢定自由度為 k-1-(估計參數個數)=k-1-2
89
回顧

二類別數, 成功或失敗
Z
2

多個類別數(k), 配適度
2
n ≥ 5, n(1- )≥5
自由度 k-1-(估計參數個數)
90
兩樣本比例差的比較
•何時使用?
a. 當要比較兩個母體比例是否有差異存在,或某比例較另一為
大時。
b. 欲比較兩個母體比例差距為某介於(-1,1)之間的非零差距值。
• 所需前題:
a. 獨立樣本
b. 母體來自二項分配
c. 樣本數要夠大,每一母體均需滿足
n  ≥ 5 且 n (1-) ≥ 5 ,其中 n 為樣本個數; 為成功機率參數
91
兩樣本比例差的比較
符號說明
i:第 i 母體的成功比例參數。
Pi:自第 i 母體所抽出樣本的成功比例估計量。
ni:自第 i 母體所抽出的全部樣本數。
xi:自第 i 母體所抽出樣本為成功的樣本個數,
其中 Pi = xi / n i 。
92
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例  母體2比例 母體1  母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
1 - 2  
1 - 2  
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
93
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例  母體2比例 母體1  母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
註: 1 -
1 - 2  
1 - 2  
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
2   0 ,其中  0可為任一非零的比例
94
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例  母體2比例 母體1  母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
檢定
統計
量
1 - 2  
1 - 2  
Z與2
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
Z
Z
95
兩樣本比例差的比較
假 設 兩比例無差異 Z 
條 件 兩比例有差異
H0
H1
檢定
統計
量
1 - 2  
1 - 2  
1 1
p(1  p)    
 n1 n2 
決策條件
2 
Z與2
p1  p2
Z  Z
,
x 1  x2
p
n1  n2
2

Oi  Ei 

2
k
i 1
Ei
決策條件  2   2 , df , 其中 df  k  1
96
兩樣本比例差的比較
母體 1 比例不較母體 2 比例大
母體 1 比例 較 母體 2 比例大
假 設
條 件
H0
H1
1 - 2  
1 - 2 > 
檢定
統計
量
Z
Z
p1  p2
 p1 1  p1  p2 1  p2  



n1
n2


決策條件 Z  Z
97
兩樣本比例差的比較
母體 1 比例不較母體 2 比例小
母體 1 比例 較 母體 2 比例小
假 設
條 件
H0
H1
1 - 2  
1 - 2 < 
檢定
統計
量
Z
Z
p1  p2
 p1 1  p1  p2 1  p2  



n1
n2


決策條件 Z  Z
98
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例  母體2比例 母體1  母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
1 - 2  
1 - 2  
1 - 2  
1 - 2 < 
1 - 2  
1 - 2 > 
99
兩樣本比例差例題
區間估計
例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評比
方法的公正性認知百分比差異變化。以方法Ⅰ評比80
位員工中,有60位認為公正;以方法Ⅱ評比75位員工中,
有45為認為公正,試估計在95%的信賴係數下,兩種方
法公正性的認知差異。
100
兩樣本比例差例題
區間估計
p1:表方法Ⅰ認知百分比估計量
p2:表方法Ⅱ認知百分比估計量
E (p1-p2) = 1- 2 , V(p1-p2) = 1 (1- 1) / n1 + 2 (1- 2) / n2
ˆ p1  p2  p1  p2
ˆ p1  p2 
p1 (1  p1 )
p2 (1  p2 )

n1
n2
101
兩樣本比例差例題
區間估計
在 n1 , n2 均為大樣本條件下,由中央極限定理可知,
p1p2會近似常態,所以
 p1 p2  Z /2 ˆ p1 p2  1  2 p1 p2 Z /2ˆ p1  p2
102
兩樣本比例差例題
區間估計
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
ˆ p  p 
1
2
0.75  0.25 0.6  0.4

80
75
 0.005544  0.0745
Z/2=Z
0.025=1.96
103
兩樣本比例差例題
區間估計
p1 = 0.75
p2 = 0.6
ˆ p  p  0.0745
1
2
=0.05, Z/2=Z
0.025=1.96
 p1 p2  Z /2 ˆ p1 p2  1  2 p1 p2 Z /2ˆ p1  p2
0.750.61.960.0745 12 0.750.61.960.0745
→ 0.00398  1 2  0.29602
在95%的信賴係數下,方法Ⅰ與方法Ⅱ公正性的認知差異
介於 (0.00398, 0.29602)
104
兩樣本比例差例題
比例差為某百分比之檢定
例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評比
方法的公正性認知百分比差異變化。以方法Ⅰ評比80
位員工中,有60位認為公正;以方法Ⅱ評比75位員工
中,有45為認為公正,由以往的幾次測試結果,欲知
方法Ⅰ的評比公正性認知較方法Ⅱ高出1成。
105
兩樣本比例差的比較
假 設
條 件
H0
H1
檢定
統計
量
母體 1 比例不較母體 2 比例高出一成
母體 1 比例 較 母體 2 比例高出一成
1 - 2  .1
1 - 2 > .1
Z
p1  p2  ( 1   2 )
 p1 1  p1  p2 1  p2  



n1
n2


決策條件 Z  Z
Z
106
兩樣本比例差例題
比例差為某百分比之檢定
解:
下標1表方法Ⅰ, 下標2表方法Ⅱ
H0 : 1  2  0.1
H1 : 1  2  0.1
∵ n1 15, n1(1- 1 )  5 且 n2 2  5, n2(1- 2 ) 5
在 n1 , n2 均為大樣本條件下,由中央極限定理可知,
p1p2 會近似常態,所以
107
兩樣本比例差例題
比例差為某百分比之檢定
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
Z 
*

( p1  p2 )  ( 1   2 )
p1 (1  p1 ) p2 (1  p2 )

n1
n2
(0.75  0.6 )  0.1
 0.6715
0.75  0.25 0.6  0.4

80
75
108
兩樣本比例差例題
比例差為某百分比之檢定
在 H0 : 1  2  0.1
H1 : 1  2  0.1
Z 
*
(0.75  0.6)  0.1
 0.6715
0.75  0.25 0.6  0.4

80
75
RR: |Z|> Z/2=Z
0.025=1.96
Z*=0.6715 < 1.96
Not reject H0 ,方法Ⅰ沒有顯著高於方法Ⅱ 1成。
109
兩樣本比例差例題
比例差是否有差異
例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評
比方法的公正性認知百分比差異變化。以方法Ⅰ
評比80位員工中,有60位認為公正;以方法Ⅱ評比
75位員工中,有45為認為公正,試比較在95%的信
賴係數下,兩種方法公正性的認知是否有差異存
在。
110
兩樣本比例差的比較
假 設 兩比例無差異
條 件 兩比例有差異
H0
H1
1 - 2  
1 - 2  
p1  p2
x 1  x2
Z
, p
n1  n2
1 1
p(1  p)    
 n1 n2 
決策條件 : Z  Z


O E 

2
2
檢定
統計
量

Z與2
2
E
2
2
決策條件 :     , df
111
兩樣本比例差例題
比例差是否有差異
H 0 :  1  2
vs
H1 :  1   2
 n1 1  5, n1 (1   1 )  5且 n2 2  5, n2 (1   2 )  5
p1  60 / 80  0.75
p2  45 / 75  0.6
60  45 21
p

80  75 31
0.75  0.6
Z* 
 1.9964
21 10  1
1 




31 31  80 75 
RR : Z  Z  1.96
2
under   0.05, Z *  1.96
112
兩樣本比例差例題
比例差是否有差異
H 0 :  1  2
vs H 1 :  1   2
Z *  1.9964
RR : Z  Z  1.96
2
under   0.05, Z *  1.96
拒絕虛無假設,
兩評分方法之公正性認知上有顯著差異存在
113
兩樣本比例差的比較
假設
條件
H0
H1
兩比例無差異 Z 
兩比例有差異
1 - 2  
1 - 2  
p1  p2
1 1
p(1  p)    
 n1 n2 
,
x 1  x2
p
n1  n2
決策條件 : Z  Z

2
2


O

E
2  
檢定
統計
量
E
Z與
2
2
2
決策條件 :     , df
其中 O為觀測值 , E為期望值
114
兩樣本比例差例題
比例差是否有差異
兩獨立
樣本
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
變數 水準
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
115
兩樣本比例差例題
比例差是否有差異
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
H0 : 1 - 2  
H1 : 1 - 2  
116
兩樣本比例差例題
比例差是否有差異
H0 : 1 - 2   vs H1 : 1 - 2  
 
2
(O  E )
2
E
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
117
兩樣本比例差例題
比例差是否有差異
r
(Oij  E ij)
c
 
2
i 1 j 1
2
, r  1,2 c  1,2
E ij
df  ( r  1)  (c  1)
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
118
兩樣本比例差例題
比例差是否有差異
r
c
2   
i 1 j 1
(Oij  E ij) 2
, r  1,2 c  1,2
E ij
n1  n1
E11 
n
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
119
兩樣本比例差例題
比例差是否有差異
n1  n1 105  80
E11 

 54.19
n
155
評比方法
認
知
Ⅰ
Ⅱ
合計
公正
60 (54.19)
45
105
不公正
20
30
50
合計
80
75
155
120
兩樣本比例差例題
比例差是否有差異
評比方法
認
知
公正
Ⅰ
Ⅱ
60 (54.19) 45 (50.81)
合計
105
不公正
20 (25.81) 30 (24.19)
50
80
合計
r
c
 
2
i 1 j 1
(Oij  E ij)
75
2
155
, r  1,2 c  1,2
E ij
121
兩樣本比例差例題
比例差是否有差異

60  54.19 


45  50.81

2

2
2
54.19
50.81
20  25.81
2
25.81


30  24.19 

2
24.19
 3.9906
122
兩樣本比例差例題
比例差是否有差異
H0 : 1 - 2   vs H1 : 1 - 2  
r
c
2   
(Oij  E ij) 2
i 1 j 1
,
r  1, 2
c  1, 2
E ij
 2  3.9906 ,
df  ( r  1)( c  1)  1
在  0.05下 , RR : X 2   1,0.05  3.84146
2
 3.9906 
 12,0.05  3.84146
拒絕虛無假設 ,兩評分方法之公正性認 知上有顯著差異存在
123
二維列聯表
R C contingency table
22 列聯表
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
觀測個數
邊際個數
總個數
124
二維列聯表
R C contingency table
22 列聯表
pij = nij /n
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
p11
p21
p+1
p12
p22
p+2
p1+
p2+
1
觀測機率
邊際機率
總機率
125
兩獨立樣本
評比方法
認
知
Ⅰ
Ⅱ
合計
公正
60
45
105
不公正
合計
20
30
50
80
75
155
變數 水準
126
變數 水準
32 列聯表
性別
系
別
男
女
合計
統計
企管
26
30
35
40
61
70
經濟
合計
20
44
64
76
119
195
變數 水準
127
卡方檢定
齊一性
例  某零售商懷疑三家不同公司所批得之零件品質有差異。
因此今將各公司購得之零件品質測試紀錄於下表,試以0.05顯
著水準檢定,在不同公司零件品質是否有差異。
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315
55
370
B
425
75
500
C
510
90
600
合計
1250
220
1470
128
卡方檢定
齊一性
以 p11表A公司生產良品個數的比例
p21表B公司生產良品個數的比例
p31表C公司生產良品個數的比例
p11 = p21 = p31
p12 = p22 = p32
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
129
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
  
2
r
c
(Oij  E ij)2
i 1 j 1
Eij 
E
, r  1,2,3 c  1,2
ij
ni   n j
n
130
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
E11=3701250/1470=314.6
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55
370
B
425
75
500
C
510
90
600
合計
1250
220
1470
131
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55 (55.4)
370
B
425 (425.2)
75 (74.8)
500
C
510 (510.2)
90 (89.8)
600
合計
1250
220
1470
132
卡方檢定
齊一性
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55 (55.4)
370
B
425 (425.2)
75 (74.8)
500
C
510 (510.2)
90 (89.8)
600
合計
1250
220
1470
2


315

314
.
6
2 
314.6
55  55.4 2
55.4
2

425  425.2 

425.2
2

75  74.8 

74.8
2

510  510.2 

510.2
2

90  89.8 

89.8

 0.04
133
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
2


315

314
.
6
2 
314.6
55  55.4 2
55.4
2

425  425.2 

425.2
2

75  74.8 

74.8
2

510  510.2 

510.2
2

90  89.8 

89.8

 0.04
RR : X 2   22,0.05  5.99147 , df  (3  1)( 2  1)  2

0.04   22,0.05
不拒絕虛無假設
三公司零件品質無顯著差異存在
134
卡方檢定
齊一性
•將卡方檢定由一般情形延伸至多個獨立
母體之比較
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
•檢定一個變數(變項)各類別(或水準)在
不同母體比例是否相同
•應用列聯表
135
卡方檢定
齊一性
前題條件
•必須為隨機獨立選出樣本
•必須為大樣本
•所有各期望個數必須大於1
136
齊一性檢定例題
例 : 欲知不同系別畢業生畢業後,最先開始從事的
工作性質是否受到其在校主修學位的不同而有差
異。今自企管、統計和經濟系畢業生中,隨機抽
出適當樣本數,並記錄其畢業後,最先開始從事
的工作類別如下: (以α= 0.01檢定之)
主修學位
電腦
銀行
其他
合計
企管
50
16
14
80
統計
25
35
15
75
經濟
21
46
18
85
合計
96
97
47
240
137
齊一性檢定例題
解︰ H0:主修學位與工作類別無差異
Ha:主修學位與工作類別有差異
p11 = p21 =p31 ,
p21 = p22 = p32 ,
p31 = p32 = p33
其中 p11表示企管系畢業生畢業從事電腦工作的百分比
p21表示統計系畢業生畢業從事電腦工作的百分比
p31表示經濟系畢業生畢業從事電腦工作的百分比
E11=80  96 / 240 = 32.0
E21=75  96 / 240 = 30.0
E31=85  96 / 240 = 34.0
138
齊一性檢定例題
期望數的結果
主修學位
電腦
銀行
電子
企管
32.0
32.3
15.7
統計
30.0
30.3
14.7
經濟
34.0
34.4
16.7
139
齊一性檢定例題
解︰ H0:主修學位與工作類別無差異
Ha:主修學位與工作類別有差異
p11 = p21 =p31 ,
p21 = p22 = p32 ,
p31 = p32 = p33
其中 p11表示企管系畢業生畢業從事電腦工作的百分比
p21表示統計系畢業生畢業從事電腦工作的百分比
p31表示經濟系畢業生畢業從事電腦工作的百分比
E11=80  96 / 240 = 32.0
E21=75  96 / 240 = 30.0
E31=85  96 / 240 = 34.0
140
齊一性檢定例題
H0:主修學位與工作類別無差異
Ha:主修學位與工作類別有差異
2
2
2
2








50

32
.
0
25

30
.
0
21

34
.
0
16

32
.
3
2 




32.0
30.0
34.0
32.3
35  30.32  46  34.4 2  14  15.7 2  15  14.7 2  18  16.7 2
30.3
34.4
15.7
14.7
16.7
 29.09
RR : X 2   42,0.01  13.2767 , df  (3  1)(3  1)  4

29.09   42,0.01
拒絕虛無假設
三系別畢業生在初次工作類別上有顯著差異存在
141
卡方檢定
獨立性
例: 某食品公司欲知不同性別消費者,對所推出的3
種不同口味產品喜好是否有差異。今隨機調查200位
消費者,在試吃後選出其最喜歡的口味種類。在顯著
水準0.01下,檢定性別對產品的喜好看法是否有差異。
產品口味
性別
A
B
C
合計
男
75
22
20
117
女
45
18
20
83
合計
120
40
40
200
142
卡方檢定
獨立性
解︰ H0:性別與產品口味無差異
( i j =  i+  +j)
Ha:性別與產品口味有差異
( i j   i+  +j)
( i :性別, 男: 1, 女: 2 ; j : 口味, A:1, B:2, C:3 )
產品口味
性別
A
B
C
合計
男
75
22
20
117
女
45
18
20
83
合計
120
40
40
200
143
卡方檢定
獨立性
產品口味
性別
A
B
C
合計
男
75 (70.2)
22 (23.4)
20 (23.4)
117
女
45 (49.8)
18 (16.6)
20 (16.6)
83
合計
120
40
40
200
144
卡方檢定
獨立性
H0:性別與產品口味無差異 (i j =  i+  +j)
Ha:性別與產品口味有差異 ( i j   i+  +j)
2


75

70
.
2
2 
70.2
18  16.6 2
16.6
2

45  49.8 

49.8
2

20  23.4 

23.4
2

22  23.4 

23.4

2

20  16.6 

16.6
 2.183
RR : X 2   22,0.01  9.21034, df  (2  1)(3  1)  2

2.183   22,0.01
不拒絕虛無假設
不同性別在口味喜好上沒有顯著差異存在
145
卡方檢定
獨立性
•顯示兩變項間的關係
1.僅由一個母體中抽出樣本
H0:i j =  i+  +j
Ha: i j   i+  +j
2.每個變項均有兩個或多個類別(或水準)
3.不顯示因果關係
4.不顯示兩變項間的性質
•應用列聯表
146
卡方檢定
獨立性
•與齊一性比較
齊一性
1.將卡方檢定由一般情形延伸至多個獨立母體之比較
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
2.檢定一個變數(變項)各類別(或水準)在不同母體比例
是否相同
獨立性
1.顯示兩變項間的關係
H0:i j =  i+  +j
僅由一個母體中抽出樣本
vs
Ha: i j   i+  +j
147
應用列聯表,Excel 程式
n1  n 1
n
148
149
150
151
(O11  E11 ) 2
E11
152
RR : X 2   22,0.01  9.21034,

df  (2  1)(3  1)  2
2.183   22,0.01
不拒絕虛無假設
不同性別在口味喜好上沒有顯著差異存在
153
可省略直接應用
CHITEST(B2:D3,B7:D8)
154
總結
1. 兩類別比例值的比較
a. Z 檢定
b. 2 檢定(卡方檢定)
2. 多個(二個以上)類別比例值的比較
a. 同質性
3. 兩類別因子比例值的比較
a. 齊一性檢定
b. 獨立性檢定
155
關於本講程...
請你靜下來想一想:

1. 你學到哪些 ?

2. 想想在您日常生活中,是否有某些事物或
現象符合我們以上所提的各種分析方法?
您是否能對您有興趣瞭解的現象,進行適
當檢定與決策。

3. 是否還有相關問題與疑問 ?
156