Transcript 兩樣本比例差的比較
第 二 十 一 講
兩個或多個類別資料檢定
Tests for Two or More Samples
with Categorical Data
1
學習目標
1. 兩類別比例值的比較
a. Z 檢定
b. 2 檢定(卡方檢定)
2. 多個(二個以上)類別比例值的比較
a. 同質性
3. 兩類別因子比例值的比較
a. 齊一性檢定
b. 獨立性檢定
2
資料類型
Data Types
資 料
Data
數值
類別
Numerical
Categorical
順序
Ordinal
名義或名目
Nominal
3
資料的獲得
實驗(experiment)
例如 : 丟擲一個骰子,出現點數為六的次數。
調查(survey)
例如 : 某公司新推出的產品在市場上的反應情形。
很滿意 、 滿意 、普通 、 不滿意、 很不滿意
4
單一樣本比例
丟擲一個骰子,出現點數為六的次數,若該骰子共丟擲
100次,出現 20 次點數為六,欲知該骰子出現點數為六的
機率是否為1/ 6?
令 : 母體的成功比例參數。
p : 母體所抽出樣本的成功比例估計量。
解: H0 : = 1/ 6
H1 : 1/ 6
5
單一樣本比例
解: H0 : = 1/ 6 ( : 母體的成功比例參數。)
H1 : 1/ 6 ( p : 母體所抽出樣本的成功比例估計量。)
p=x/n
( x : 母體所抽出樣本為六的次數。)
= 20 / 100
( n : 母體抽出所有樣本次數。)
= 0.2
n > 5 , n (1- ) > 5
Z*
1
6
0.894
1
1
(1 )
6
6
100
0.2
6
單一樣本比例
解: H0 : = 1/ 6 ( : 母體的成功比例參數)
H1 : 1/ 6 ( p : 母體所抽出樣本的成功比例估計量)
p = x / n = 20/100 = 0.2
Z
*
1
0.2
6
1
1
(1 )
6
6
100
( x : 母體所抽出樣本為六的次數)
( n : 母體抽出所有樣本次數)
0.894
(
n > 5 , n (1- ) > 5 )
RR: | Z | > Z/2 = Z 0.025 = 1. 96
Z* = 0.894 < 1.96
不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証
據說明骰子出現六點機率不為 1/6 。
7
單一樣本比例另解
丟擲一個骰子,出現點數為六的次數,若丟擲該骰子 100次,
出現 20 次點數為六,欲知該骰子出現點數為六的機率是否為
1/ 6 ?
令 : 母體的成功比例參數。
p : 母體所抽出樣本的成功比例估計量。
解: H0 : = 1/ 6
H1 : 1/ 6
骰子出現點數
六
其他
合計
觀察值 (O)
期望機率值( )
20
1/6
80
5/6
100
1
1 0 0 /6
1 0 0 5/6
100
期望值 (E)
8
單一樣本比例另解
利用實際觀測個數(次數)與期望個數之差距來測量其偏離
的程度 而該偏離度以 2 表示於下:
2 = (O-E)2/ E
骰子出現點數
六
其他
合計
觀察值 (O)
20
80
100
期望值 (E)
100/6
1005/6
1
2 =(O-E)2/ E
(20-100/6)2/(100/6)=2/3
(80-500/6)2/(500/6)=2/15
12/15=0.8
9
卡方檢定的意義
• 在具有 k 個分類別數的資料中(例如:顏色喜好,手機種
類),根據研究分析之需要,利用實際觀測個數(次數)與
其在虛無假設為真之母體分配所發生的個數(期望個數)之
差距來測量其偏離度,
2
k
i 1
(Oi E i )
2
Ei
式中 Oi 表示在第i分類之實際觀測個數(次數);
Ei 表示在第 i 分類之期望個數 ٥
10
卡方檢定性質
a. 當觀測個數(O)與期望個數(E)之間愈接近χ2值愈小,表
示愈不易拒絕虛無假設為真 ;
b. 若 O 與 E 之間距離愈遠,則χ2值愈大,表示拒絕虛無
假設為真;
c. χ2值除了由 O 與 E 之間的差值決定以外,還受限於類
別數的多少,當類別數愈多,χ2也會愈大,因為每個類
別都提供一個正值,所以在查χ2臨界值表時,要考慮整
個資料,自由度的大小。
11
單一樣本比例另解
2 = (O-E)2/ E
2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6)
= 2/3 + 2/15= 0.8
d f = 2 - 1= 1
RR: 2 > 21, 0.05 = 3.84146
2 Table (Portion)
DF
1
2
.995
...
0.010
…
…
…
Upper Tail Area
.95
.05
.025
.01
…
0.004 … 3.84146 5.024 6.635
0.103 … 5.99147 7.378 9.210
12
單一樣本比例另解
2 = (O-E)2/ E
2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6)
= 2/3 + 2/15= 0.8
d f = 2 - 1= 1
RR: 2 > 21, 0.05 = 3.84146
2 < 21, 0.05 = 3.84146
不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証
據說明骰子出現六點機率不為 1/ 6 。
13
另例、藥品藥效
例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 ,
今用該藥治療 200位高血壓患者,其中180位患者病
情有改善,試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解: H0: = 0.96
n >5, n(1- ) >5
H1 : 0.96
方法(一) 以 Z 檢定
p=180/200=0.9 ,
0.96(1 0.96)
Z (0.9 0.96)
200
4.33
*
14
藥品藥效例題
例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 ,
今用該藥治療 200位高血壓患者,其中180位患者病
情有改善,試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解: H0: = 0.96
H1 : 0.96
方法(二) 以 2 檢定
E1 200 0.96 192
E 2 200 (1 0.96) 8
2
2
(
180
192
)
(
20
8
)
2
192
8
18.75
15
藥品藥效例題
例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 ,
今用該藥治療 200位高血壓患者,其中180位患者病
情有改善,試問該藥廠之宣稱是否予以相信 ?以顯
著水準0.05進行檢定。
解: H0: = 0.96
vs H1 : 0.96
方法 (二 )
方法 (一 )
2 18.75
Z * 4.33
RR : 2 2 0.05,1
Z Z 0.025 1.96
2 0.05,1 3.84146
無論採用何方法均拒絕虛無假設
(reject H 0 ), 無法相信該藥廠之宣稱
16
單一樣本多類別
今丟擲一個骰子360次,欲知該骰子是否為一公正
骰子,紀錄其結果如下:
(在α= 0.05條件下進行相關檢定。)
出現點數X值
1
2
3
4
5
6
合計
觀測到出現次數
60
66
72
42
57
63
360
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i not all equal to 1/ 6
17
單一樣本多類別
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
X值
1
2
3
4
5
6
合計
觀測到出現次數(O)
60
66
72
42
57
63
360
期望機率()
1/6
1/6
1/6
1/6
1/6
1/6
1
期望出現次數(E)
60
60
60
60
60
60
360
(O-E)2/ E
0
0.6
2.4
5.4
0.15
0.15
8.7
2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
+ (42-60)2/60 + (57-60)2/60 + (63-60)2/60
= 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7
18
單一樣本多類別
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60
+ (42-60)2/60 + (57-60)2/60 + (63-60)2/60
= 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7
df=6-1=5
RR: 2 > 2 0.05,5 =11.1
∵ 2 < 11.1
所以α= 0.05之下,不拒絕虛無假設,骰子為不公
正的情形不顯著,即認為此骰子為公正的。
19
單一樣本多類別
丟擲一個骰子,欲知該骰子是否為一公正骰子?
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i 不全為 1/ 6
多項式母體比例的檢定
∴卡方檢定可用來決定資料是否屬於原有的母
體或分配。 適合度檢定
20
適合度檢定
多項式母體的檢定
二項式母體的檢定
卜瓦松母體的檢定
常態母體的檢定
以例題分別說明,並以電腦excel操作計算
21
多項式母體的檢定
電腦excel操作
丟擲一個骰子360次,欲知該骰子是否為一公正骰
子,紀錄其丟擲結果如下:
(在α= 0.05條件下進行相關檢定。)
出現點數X值
1
2
3
4
5
6
合計
觀測到出現次數
60
66
72
42
57
63
360
H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6
H1 : i not all equal to 1/ 6
22
23
24
25
26
27
28
29
30
31
32
33
34
35
3601/6=60
36
37
38
39
40
60 60
2
60
41
42
43
44
45
8.7
2
2
0.05,5
11.1
46
計算 p-value
47
48
49
求得檢定之 p-value值
p-value
50
另一方法求得檢定之 p-value值
51
另一方法求得檢定之 p-value值
52
另一方法求得檢定之 p-value值
53
另一方法求得檢定之 p-value值
54
另一方法求得檢定之 p-value值
55
另一方法求得檢定之 p-value值
p-value
56
二項母體的檢定
某調查現今小學生配戴眼鏡的分布情形,今收集
250戶有2位小學生之家庭資料如下:
小學生戴眼鏡人數
0
1
2
合計
觀察到的家庭數O
35
110
105
250
欲知小學生戴眼鏡的情形是否符合60%的二項分配型態。
H0:資料來自B(2 , 0.6)
Ha:資料不是來自B(2 , 0.6)
在自由度 df=2 及 α= 0.05 時
57
二項母體的檢定
小孩戴眼鏡人數
觀察到的家庭戶數(O)
期望機率()
期望的家庭戶數(E)
(O-E)2/ E
0
35
0.16
40
0.625
1
110
0.48
120
0.8333
2
105
0.36
90
2.5
合計
250
1
250
3.9583
2 = Σ(Oi - Ei) 2 / Ei
= (35-40)2/40 + (110-120)2/120 + (105-90)2/90
= 0.625 + 0.8333 + 2.5 =3.9583
df=3-1
因為 3.9583 < 22, 0.05 =5.99147 ; 或 p-value = Pr(2 > 3.9583)
0.1 < p-value < 0.2
22, 0.1 < 2 < 22, 0.2
所以不拒絕虛無假設,沒有充分證據說明此資料不是來自二項分配
58
59
60
61
P ( X 0 ) C 1
C02 0.6 0.4 2
0.16
2
0
0
0
2 0
62
63
64
65
66
67
2 3.96 22,0.05 5.99147
68
計算p-value
69
0.1 < p-value < 0.2 ,
較 =0.05 為大
所以不拒絕虛無假設,沒有充分證據說明此資料不是來
自二項分配
70
卜瓦松分配母體檢定
某一加油站調查,每分鐘加油車輛數的觀測值下:
到達車數
0
1
2
3
4
5
合計
觀測數
182
129
79
8
1
1
400
試以α=0.05的顯著水準,檢定加油車輛數的分
配是否符合卜瓦松分配。
71
卜瓦松分配母體檢定
到達車數
0
1
2
3
4
5
合計
觀測次數
182
129
79
8
1
1
400
ˆ
解:H0:母體分配為卜瓦松分配
Ha:母體分配不為卜瓦松分配
由於平均到站加油車數未知,須先估計
ˆ
=(0182+1129+279+38+41+51)/400= 0.8
72
73
ˆ
74
P( X x)
x e
x!
0.8 0 e 0.8
P( X 0)
0!
0.44933
75
76
77
由於期望車數必須在五輛以上,進行卡方的檢定方
法才準確,因此將到達車次合併至3次,重新計算
78
79
由於分配之平均車數未知,為一估計值
因此自由度為 4 – 1 – 1=2
13.82
2
2
0.05, 2
5.99147
∵ p-value <0.05
所以加油站車輛加油之分配, 不為卜瓦松分配
80
常態分配的檢定
有一隨機樣本大小為30,而其觀測值如下:
18 25 26 27 26 25 20 22 23 25 16 24 30 36 34
19 31 28 26 25 24 21 29 28 22 20 27 32 28 19
以顯著水準α=0.05,檢定是否符合平均數為25
,變異數為10 之常態分配。
解: H0:母體分配為常態分配(25,10)
Ha:母體分配不為常態分配(25,10)
81
常態分配的檢定
將樣本由小到大排序,如下:
16 18 19 19 20 20 21 22 22 23 24 24 25 25 25
25 26 26 26 27 27 28 28 28 29 30 31 32 34 36
分五組,找出五個20百分位值,在顯著水準α=0.05,
檢定是否符合平均數為25,變異數為10之常態分
配。
用Excel 電腦軟體進行
82
機率 平均數 標準差
p百分位值 ( x p ) z p
p P(Z z p )
83
機率 平均數 標準差
84
限制條件範圍
用以計次之數值範圍
85
86
87
p value 0.05
not reject H 0
沒有充分證據說明資料不為N(25,10)之常態分配
88
常態分配的檢定
有一隨機樣本大小為20,而其觀測值如下:
18 25 26 27 26 25 20 22 23 25
19 31 28 26 25 24 21 29 28 22
以顯著水準α=0.05,檢定是否符合常態分配。
解: H0:母體分配為常態分配
Ha:母體分配不為常態分配
決定平均數ヽ變異數及分組數(k)後,再依照前
述方法利用Excel進行檢定。特別注意的是卡方
檢定自由度為 k-1-(估計參數個數)=k-1-2
89
回顧
二類別數, 成功或失敗
Z
2
多個類別數(k), 配適度
2
n ≥ 5, n(1- )≥5
自由度 k-1-(估計參數個數)
90
兩樣本比例差的比較
•何時使用?
a. 當要比較兩個母體比例是否有差異存在,或某比例較另一為
大時。
b. 欲比較兩個母體比例差距為某介於(-1,1)之間的非零差距值。
• 所需前題:
a. 獨立樣本
b. 母體來自二項分配
c. 樣本數要夠大,每一母體均需滿足
n ≥ 5 且 n (1-) ≥ 5 ,其中 n 為樣本個數; 為成功機率參數
91
兩樣本比例差的比較
符號說明
i:第 i 母體的成功比例參數。
Pi:自第 i 母體所抽出樣本的成功比例估計量。
ni:自第 i 母體所抽出的全部樣本數。
xi:自第 i 母體所抽出樣本為成功的樣本個數,
其中 Pi = xi / n i 。
92
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
1 - 2
1 - 2
1 - 2
1 - 2 <
1 - 2
1 - 2 >
93
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
註: 1 -
1 - 2
1 - 2
1 - 2
1 - 2 <
1 - 2
1 - 2 >
2 0 ,其中 0可為任一非零的比例
94
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
檢定
統計
量
1 - 2
1 - 2
Z與2
1 - 2
1 - 2 <
1 - 2
1 - 2 >
Z
Z
95
兩樣本比例差的比較
假 設 兩比例無差異 Z
條 件 兩比例有差異
H0
H1
檢定
統計
量
1 - 2
1 - 2
1 1
p(1 p)
n1 n2
決策條件
2
Z與2
p1 p2
Z Z
,
x 1 x2
p
n1 n2
2
Oi Ei
2
k
i 1
Ei
決策條件 2 2 , df , 其中 df k 1
96
兩樣本比例差的比較
母體 1 比例不較母體 2 比例大
母體 1 比例 較 母體 2 比例大
假 設
條 件
H0
H1
1 - 2
1 - 2 >
檢定
統計
量
Z
Z
p1 p2
p1 1 p1 p2 1 p2
n1
n2
決策條件 Z Z
97
兩樣本比例差的比較
母體 1 比例不較母體 2 比例小
母體 1 比例 較 母體 2 比例小
假 設
條 件
H0
H1
1 - 2
1 - 2 <
檢定
統計
量
Z
Z
p1 p2
p1 1 p1 p2 1 p2
n1
n2
決策條件 Z Z
98
兩樣本比例差的比較
有 興 趣 研 究 問 題 種 類
假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例
條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例
H0
H1
1 - 2
1 - 2
1 - 2
1 - 2 <
1 - 2
1 - 2 >
99
兩樣本比例差例題
區間估計
例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評比
方法的公正性認知百分比差異變化。以方法Ⅰ評比80
位員工中,有60位認為公正;以方法Ⅱ評比75位員工中,
有45為認為公正,試估計在95%的信賴係數下,兩種方
法公正性的認知差異。
100
兩樣本比例差例題
區間估計
p1:表方法Ⅰ認知百分比估計量
p2:表方法Ⅱ認知百分比估計量
E (p1-p2) = 1- 2 , V(p1-p2) = 1 (1- 1) / n1 + 2 (1- 2) / n2
ˆ p1 p2 p1 p2
ˆ p1 p2
p1 (1 p1 )
p2 (1 p2 )
n1
n2
101
兩樣本比例差例題
區間估計
在 n1 , n2 均為大樣本條件下,由中央極限定理可知,
p1p2會近似常態,所以
p1 p2 Z /2 ˆ p1 p2 1 2 p1 p2 Z /2ˆ p1 p2
102
兩樣本比例差例題
區間估計
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
ˆ p p
1
2
0.75 0.25 0.6 0.4
80
75
0.005544 0.0745
Z/2=Z
0.025=1.96
103
兩樣本比例差例題
區間估計
p1 = 0.75
p2 = 0.6
ˆ p p 0.0745
1
2
=0.05, Z/2=Z
0.025=1.96
p1 p2 Z /2 ˆ p1 p2 1 2 p1 p2 Z /2ˆ p1 p2
0.750.61.960.0745 12 0.750.61.960.0745
→ 0.00398 1 2 0.29602
在95%的信賴係數下,方法Ⅰ與方法Ⅱ公正性的認知差異
介於 (0.00398, 0.29602)
104
兩樣本比例差例題
比例差為某百分比之檢定
例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評比
方法的公正性認知百分比差異變化。以方法Ⅰ評比80
位員工中,有60位認為公正;以方法Ⅱ評比75位員工
中,有45為認為公正,由以往的幾次測試結果,欲知
方法Ⅰ的評比公正性認知較方法Ⅱ高出1成。
105
兩樣本比例差的比較
假 設
條 件
H0
H1
檢定
統計
量
母體 1 比例不較母體 2 比例高出一成
母體 1 比例 較 母體 2 比例高出一成
1 - 2 .1
1 - 2 > .1
Z
p1 p2 ( 1 2 )
p1 1 p1 p2 1 p2
n1
n2
決策條件 Z Z
Z
106
兩樣本比例差例題
比例差為某百分比之檢定
解:
下標1表方法Ⅰ, 下標2表方法Ⅱ
H0 : 1 2 0.1
H1 : 1 2 0.1
∵ n1 15, n1(1- 1 ) 5 且 n2 2 5, n2(1- 2 ) 5
在 n1 , n2 均為大樣本條件下,由中央極限定理可知,
p1p2 會近似常態,所以
107
兩樣本比例差例題
比例差為某百分比之檢定
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
Z
*
( p1 p2 ) ( 1 2 )
p1 (1 p1 ) p2 (1 p2 )
n1
n2
(0.75 0.6 ) 0.1
0.6715
0.75 0.25 0.6 0.4
80
75
108
兩樣本比例差例題
比例差為某百分比之檢定
在 H0 : 1 2 0.1
H1 : 1 2 0.1
Z
*
(0.75 0.6) 0.1
0.6715
0.75 0.25 0.6 0.4
80
75
RR: |Z|> Z/2=Z
0.025=1.96
Z*=0.6715 < 1.96
Not reject H0 ,方法Ⅰ沒有顯著高於方法Ⅱ 1成。
109
兩樣本比例差例題
比例差是否有差異
例、公正性認知
某公司人事主管,欲測試兩種員工能力表現評
比方法的公正性認知百分比差異變化。以方法Ⅰ
評比80位員工中,有60位認為公正;以方法Ⅱ評比
75位員工中,有45為認為公正,試比較在95%的信
賴係數下,兩種方法公正性的認知是否有差異存
在。
110
兩樣本比例差的比較
假 設 兩比例無差異
條 件 兩比例有差異
H0
H1
1 - 2
1 - 2
p1 p2
x 1 x2
Z
, p
n1 n2
1 1
p(1 p)
n1 n2
決策條件 : Z Z
O E
2
2
檢定
統計
量
Z與2
2
E
2
2
決策條件 : , df
111
兩樣本比例差例題
比例差是否有差異
H 0 : 1 2
vs
H1 : 1 2
n1 1 5, n1 (1 1 ) 5且 n2 2 5, n2 (1 2 ) 5
p1 60 / 80 0.75
p2 45 / 75 0.6
60 45 21
p
80 75 31
0.75 0.6
Z*
1.9964
21 10 1
1
31 31 80 75
RR : Z Z 1.96
2
under 0.05, Z * 1.96
112
兩樣本比例差例題
比例差是否有差異
H 0 : 1 2
vs H 1 : 1 2
Z * 1.9964
RR : Z Z 1.96
2
under 0.05, Z * 1.96
拒絕虛無假設,
兩評分方法之公正性認知上有顯著差異存在
113
兩樣本比例差的比較
假設
條件
H0
H1
兩比例無差異 Z
兩比例有差異
1 - 2
1 - 2
p1 p2
1 1
p(1 p)
n1 n2
,
x 1 x2
p
n1 n2
決策條件 : Z Z
2
2
O
E
2
檢定
統計
量
E
Z與
2
2
2
決策條件 : , df
其中 O為觀測值 , E為期望值
114
兩樣本比例差例題
比例差是否有差異
兩獨立
樣本
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
變數 水準
p1 = 60 / 80 =3 / 4 = 0.75
p2 = 45 / 75 =3 / 5 = 0.6
115
兩樣本比例差例題
比例差是否有差異
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
H0 : 1 - 2
H1 : 1 - 2
116
兩樣本比例差例題
比例差是否有差異
H0 : 1 - 2 vs H1 : 1 - 2
2
(O E )
2
E
評比方法
認
知
公正
Ⅰ
60
Ⅱ
45
合計
105
不公正
20
30
50
合計
80
75
155
117
兩樣本比例差例題
比例差是否有差異
r
(Oij E ij)
c
2
i 1 j 1
2
, r 1,2 c 1,2
E ij
df ( r 1) (c 1)
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
118
兩樣本比例差例題
比例差是否有差異
r
c
2
i 1 j 1
(Oij E ij) 2
, r 1,2 c 1,2
E ij
n1 n1
E11
n
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
119
兩樣本比例差例題
比例差是否有差異
n1 n1 105 80
E11
54.19
n
155
評比方法
認
知
Ⅰ
Ⅱ
合計
公正
60 (54.19)
45
105
不公正
20
30
50
合計
80
75
155
120
兩樣本比例差例題
比例差是否有差異
評比方法
認
知
公正
Ⅰ
Ⅱ
60 (54.19) 45 (50.81)
合計
105
不公正
20 (25.81) 30 (24.19)
50
80
合計
r
c
2
i 1 j 1
(Oij E ij)
75
2
155
, r 1,2 c 1,2
E ij
121
兩樣本比例差例題
比例差是否有差異
60 54.19
45 50.81
2
2
2
54.19
50.81
20 25.81
2
25.81
30 24.19
2
24.19
3.9906
122
兩樣本比例差例題
比例差是否有差異
H0 : 1 - 2 vs H1 : 1 - 2
r
c
2
(Oij E ij) 2
i 1 j 1
,
r 1, 2
c 1, 2
E ij
2 3.9906 ,
df ( r 1)( c 1) 1
在 0.05下 , RR : X 2 1,0.05 3.84146
2
3.9906
12,0.05 3.84146
拒絕虛無假設 ,兩評分方法之公正性認 知上有顯著差異存在
123
二維列聯表
R C contingency table
22 列聯表
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
n11
n21
n+1
n12
n22
n+2
n1+
n2+
n
觀測個數
邊際個數
總個數
124
二維列聯表
R C contingency table
22 列聯表
pij = nij /n
評比方法
認
知
公正
不公正
合計
Ⅰ
Ⅱ
合計
p11
p21
p+1
p12
p22
p+2
p1+
p2+
1
觀測機率
邊際機率
總機率
125
兩獨立樣本
評比方法
認
知
Ⅰ
Ⅱ
合計
公正
60
45
105
不公正
合計
20
30
50
80
75
155
變數 水準
126
變數 水準
32 列聯表
性別
系
別
男
女
合計
統計
企管
26
30
35
40
61
70
經濟
合計
20
44
64
76
119
195
變數 水準
127
卡方檢定
齊一性
例 某零售商懷疑三家不同公司所批得之零件品質有差異。
因此今將各公司購得之零件品質測試紀錄於下表,試以0.05顯
著水準檢定,在不同公司零件品質是否有差異。
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315
55
370
B
425
75
500
C
510
90
600
合計
1250
220
1470
128
卡方檢定
齊一性
以 p11表A公司生產良品個數的比例
p21表B公司生產良品個數的比例
p31表C公司生產良品個數的比例
p11 = p21 = p31
p12 = p22 = p32
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
129
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
2
r
c
(Oij E ij)2
i 1 j 1
Eij
E
, r 1,2,3 c 1,2
ij
ni n j
n
130
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
E11=3701250/1470=314.6
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55
370
B
425
75
500
C
510
90
600
合計
1250
220
1470
131
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55 (55.4)
370
B
425 (425.2)
75 (74.8)
500
C
510 (510.2)
90 (89.8)
600
合計
1250
220
1470
132
卡方檢定
齊一性
零件品質
公司類別
良品個數
瑕疵個數
合計
A
315 (314.6)
55 (55.4)
370
B
425 (425.2)
75 (74.8)
500
C
510 (510.2)
90 (89.8)
600
合計
1250
220
1470
2
315
314
.
6
2
314.6
55 55.4 2
55.4
2
425 425.2
425.2
2
75 74.8
74.8
2
510 510.2
510.2
2
90 89.8
89.8
0.04
133
卡方檢定
齊一性
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
2
315
314
.
6
2
314.6
55 55.4 2
55.4
2
425 425.2
425.2
2
75 74.8
74.8
2
510 510.2
510.2
2
90 89.8
89.8
0.04
RR : X 2 22,0.05 5.99147 , df (3 1)( 2 1) 2
0.04 22,0.05
不拒絕虛無假設
三公司零件品質無顯著差異存在
134
卡方檢定
齊一性
•將卡方檢定由一般情形延伸至多個獨立
母體之比較
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
•檢定一個變數(變項)各類別(或水準)在
不同母體比例是否相同
•應用列聯表
135
卡方檢定
齊一性
前題條件
•必須為隨機獨立選出樣本
•必須為大樣本
•所有各期望個數必須大於1
136
齊一性檢定例題
例 : 欲知不同系別畢業生畢業後,最先開始從事的
工作性質是否受到其在校主修學位的不同而有差
異。今自企管、統計和經濟系畢業生中,隨機抽
出適當樣本數,並記錄其畢業後,最先開始從事
的工作類別如下: (以α= 0.01檢定之)
主修學位
電腦
銀行
其他
合計
企管
50
16
14
80
統計
25
35
15
75
經濟
21
46
18
85
合計
96
97
47
240
137
齊一性檢定例題
解︰ H0:主修學位與工作類別無差異
Ha:主修學位與工作類別有差異
p11 = p21 =p31 ,
p21 = p22 = p32 ,
p31 = p32 = p33
其中 p11表示企管系畢業生畢業從事電腦工作的百分比
p21表示統計系畢業生畢業從事電腦工作的百分比
p31表示經濟系畢業生畢業從事電腦工作的百分比
E11=80 96 / 240 = 32.0
E21=75 96 / 240 = 30.0
E31=85 96 / 240 = 34.0
138
齊一性檢定例題
期望數的結果
主修學位
電腦
銀行
電子
企管
32.0
32.3
15.7
統計
30.0
30.3
14.7
經濟
34.0
34.4
16.7
139
齊一性檢定例題
解︰ H0:主修學位與工作類別無差異
Ha:主修學位與工作類別有差異
p11 = p21 =p31 ,
p21 = p22 = p32 ,
p31 = p32 = p33
其中 p11表示企管系畢業生畢業從事電腦工作的百分比
p21表示統計系畢業生畢業從事電腦工作的百分比
p31表示經濟系畢業生畢業從事電腦工作的百分比
E11=80 96 / 240 = 32.0
E21=75 96 / 240 = 30.0
E31=85 96 / 240 = 34.0
140
齊一性檢定例題
H0:主修學位與工作類別無差異
Ha:主修學位與工作類別有差異
2
2
2
2
50
32
.
0
25
30
.
0
21
34
.
0
16
32
.
3
2
32.0
30.0
34.0
32.3
35 30.32 46 34.4 2 14 15.7 2 15 14.7 2 18 16.7 2
30.3
34.4
15.7
14.7
16.7
29.09
RR : X 2 42,0.01 13.2767 , df (3 1)(3 1) 4
29.09 42,0.01
拒絕虛無假設
三系別畢業生在初次工作類別上有顯著差異存在
141
卡方檢定
獨立性
例: 某食品公司欲知不同性別消費者,對所推出的3
種不同口味產品喜好是否有差異。今隨機調查200位
消費者,在試吃後選出其最喜歡的口味種類。在顯著
水準0.01下,檢定性別對產品的喜好看法是否有差異。
產品口味
性別
A
B
C
合計
男
75
22
20
117
女
45
18
20
83
合計
120
40
40
200
142
卡方檢定
獨立性
解︰ H0:性別與產品口味無差異
( i j = i+ +j)
Ha:性別與產品口味有差異
( i j i+ +j)
( i :性別, 男: 1, 女: 2 ; j : 口味, A:1, B:2, C:3 )
產品口味
性別
A
B
C
合計
男
75
22
20
117
女
45
18
20
83
合計
120
40
40
200
143
卡方檢定
獨立性
產品口味
性別
A
B
C
合計
男
75 (70.2)
22 (23.4)
20 (23.4)
117
女
45 (49.8)
18 (16.6)
20 (16.6)
83
合計
120
40
40
200
144
卡方檢定
獨立性
H0:性別與產品口味無差異 (i j = i+ +j)
Ha:性別與產品口味有差異 ( i j i+ +j)
2
75
70
.
2
2
70.2
18 16.6 2
16.6
2
45 49.8
49.8
2
20 23.4
23.4
2
22 23.4
23.4
2
20 16.6
16.6
2.183
RR : X 2 22,0.01 9.21034, df (2 1)(3 1) 2
2.183 22,0.01
不拒絕虛無假設
不同性別在口味喜好上沒有顯著差異存在
145
卡方檢定
獨立性
•顯示兩變項間的關係
1.僅由一個母體中抽出樣本
H0:i j = i+ +j
Ha: i j i+ +j
2.每個變項均有兩個或多個類別(或水準)
3.不顯示因果關係
4.不顯示兩變項間的性質
•應用列聯表
146
卡方檢定
獨立性
•與齊一性比較
齊一性
1.將卡方檢定由一般情形延伸至多個獨立母體之比較
H0 : 11 = 21 = 31 , 12 = 22 = 32
H1: 三公司零件品質不相同
2.檢定一個變數(變項)各類別(或水準)在不同母體比例
是否相同
獨立性
1.顯示兩變項間的關係
H0:i j = i+ +j
僅由一個母體中抽出樣本
vs
Ha: i j i+ +j
147
應用列聯表,Excel 程式
n1 n 1
n
148
149
150
151
(O11 E11 ) 2
E11
152
RR : X 2 22,0.01 9.21034,
df (2 1)(3 1) 2
2.183 22,0.01
不拒絕虛無假設
不同性別在口味喜好上沒有顯著差異存在
153
可省略直接應用
CHITEST(B2:D3,B7:D8)
154
總結
1. 兩類別比例值的比較
a. Z 檢定
b. 2 檢定(卡方檢定)
2. 多個(二個以上)類別比例值的比較
a. 同質性
3. 兩類別因子比例值的比較
a. 齊一性檢定
b. 獨立性檢定
155
關於本講程...
請你靜下來想一想:
1. 你學到哪些 ?
2. 想想在您日常生活中,是否有某些事物或
現象符合我們以上所提的各種分析方法?
您是否能對您有興趣瞭解的現象,進行適
當檢定與決策。
3. 是否還有相關問題與疑問 ?
156