Transcript 兩樣本比例差的比較
第 二 十 一 講 兩個或多個類別資料檢定 Tests for Two or More Samples with Categorical Data 1 學習目標 1. 兩類別比例值的比較 a. Z 檢定 b. 2 檢定(卡方檢定) 2. 多個(二個以上)類別比例值的比較 a. 同質性 3. 兩類別因子比例值的比較 a. 齊一性檢定 b. 獨立性檢定 2 資料類型 Data Types 資 料 Data 數值 類別 Numerical Categorical 順序 Ordinal 名義或名目 Nominal 3 資料的獲得 實驗(experiment) 例如 : 丟擲一個骰子,出現點數為六的次數。 調查(survey) 例如 : 某公司新推出的產品在市場上的反應情形。 很滿意 、 滿意 、普通 、 不滿意、 很不滿意 4 單一樣本比例 丟擲一個骰子,出現點數為六的次數,若該骰子共丟擲 100次,出現 20 次點數為六,欲知該骰子出現點數為六的 機率是否為1/ 6? 令 : 母體的成功比例參數。 p : 母體所抽出樣本的成功比例估計量。 解: H0 : = 1/ 6 H1 : 1/ 6 5 單一樣本比例 解: H0 : = 1/ 6 ( : 母體的成功比例參數。) H1 : 1/ 6 ( p : 母體所抽出樣本的成功比例估計量。) p=x/n ( x : 母體所抽出樣本為六的次數。) = 20 / 100 ( n : 母體抽出所有樣本次數。) = 0.2 n > 5 , n (1- ) > 5 Z* 1 6 0.894 1 1 (1 ) 6 6 100 0.2 6 單一樣本比例 解: H0 : = 1/ 6 ( : 母體的成功比例參數) H1 : 1/ 6 ( p : 母體所抽出樣本的成功比例估計量) p = x / n = 20/100 = 0.2 Z * 1 0.2 6 1 1 (1 ) 6 6 100 ( x : 母體所抽出樣本為六的次數) ( n : 母體抽出所有樣本次數) 0.894 ( n > 5 , n (1- ) > 5 ) RR: | Z | > Z/2 = Z 0.025 = 1. 96 Z* = 0.894 < 1.96 不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証 據說明骰子出現六點機率不為 1/6 。 7 單一樣本比例另解 丟擲一個骰子,出現點數為六的次數,若丟擲該骰子 100次, 出現 20 次點數為六,欲知該骰子出現點數為六的機率是否為 1/ 6 ? 令 : 母體的成功比例參數。 p : 母體所抽出樣本的成功比例估計量。 解: H0 : = 1/ 6 H1 : 1/ 6 骰子出現點數 六 其他 合計 觀察值 (O) 期望機率值( ) 20 1/6 80 5/6 100 1 1 0 0 /6 1 0 0 5/6 100 期望值 (E) 8 單一樣本比例另解 利用實際觀測個數(次數)與期望個數之差距來測量其偏離 的程度 而該偏離度以 2 表示於下: 2 = (O-E)2/ E 骰子出現點數 六 其他 合計 觀察值 (O) 20 80 100 期望值 (E) 100/6 1005/6 1 2 =(O-E)2/ E (20-100/6)2/(100/6)=2/3 (80-500/6)2/(500/6)=2/15 12/15=0.8 9 卡方檢定的意義 • 在具有 k 個分類別數的資料中(例如:顏色喜好,手機種 類),根據研究分析之需要,利用實際觀測個數(次數)與 其在虛無假設為真之母體分配所發生的個數(期望個數)之 差距來測量其偏離度, 2 k i 1 (Oi E i ) 2 Ei 式中 Oi 表示在第i分類之實際觀測個數(次數); Ei 表示在第 i 分類之期望個數 ٥ 10 卡方檢定性質 a. 當觀測個數(O)與期望個數(E)之間愈接近χ2值愈小,表 示愈不易拒絕虛無假設為真 ; b. 若 O 與 E 之間距離愈遠,則χ2值愈大,表示拒絕虛無 假設為真; c. χ2值除了由 O 與 E 之間的差值決定以外,還受限於類 別數的多少,當類別數愈多,χ2也會愈大,因為每個類 別都提供一個正值,所以在查χ2臨界值表時,要考慮整 個資料,自由度的大小。 11 單一樣本比例另解 2 = (O-E)2/ E 2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6) = 2/3 + 2/15= 0.8 d f = 2 - 1= 1 RR: 2 > 21, 0.05 = 3.84146 2 Table (Portion) DF 1 2 .995 ... 0.010 … … … Upper Tail Area .95 .05 .025 .01 … 0.004 … 3.84146 5.024 6.635 0.103 … 5.99147 7.378 9.210 12 單一樣本比例另解 2 = (O-E)2/ E 2 = (20-100/6)2/(100/6)+(80-500/6)2/(500/6) = 2/3 + 2/15= 0.8 d f = 2 - 1= 1 RR: 2 > 21, 0.05 = 3.84146 2 < 21, 0.05 = 3.84146 不拒絕虛無假設(do not reject H0),在=0.05 ,沒有充分証 據說明骰子出現六點機率不為 1/ 6 。 13 另例、藥品藥效 例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 , 今用該藥治療 200位高血壓患者,其中180位患者病 情有改善,試問該藥廠之宣稱是否予以相信 ?以顯 著水準0.05進行檢定。 解: H0: = 0.96 n >5, n(1- ) >5 H1 : 0.96 方法(一) 以 Z 檢定 p=180/200=0.9 , 0.96(1 0.96) Z (0.9 0.96) 200 4.33 * 14 藥品藥效例題 例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 , 今用該藥治療 200位高血壓患者,其中180位患者病 情有改善,試問該藥廠之宣稱是否予以相信 ?以顯 著水準0.05進行檢定。 解: H0: = 0.96 H1 : 0.96 方法(二) 以 2 檢定 E1 200 0.96 192 E 2 200 (1 0.96) 8 2 2 ( 180 192 ) ( 20 8 ) 2 192 8 18.75 15 藥品藥效例題 例:某藥廠宣稱其所治療高血壓的藥品藥效為 96 , 今用該藥治療 200位高血壓患者,其中180位患者病 情有改善,試問該藥廠之宣稱是否予以相信 ?以顯 著水準0.05進行檢定。 解: H0: = 0.96 vs H1 : 0.96 方法 (二 ) 方法 (一 ) 2 18.75 Z * 4.33 RR : 2 2 0.05,1 Z Z 0.025 1.96 2 0.05,1 3.84146 無論採用何方法均拒絕虛無假設 (reject H 0 ), 無法相信該藥廠之宣稱 16 單一樣本多類別 今丟擲一個骰子360次,欲知該骰子是否為一公正 骰子,紀錄其結果如下: (在α= 0.05條件下進行相關檢定。) 出現點數X值 1 2 3 4 5 6 合計 觀測到出現次數 60 66 72 42 57 63 360 H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i not all equal to 1/ 6 17 單一樣本多類別 H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i 不全為 1/ 6 X值 1 2 3 4 5 6 合計 觀測到出現次數(O) 60 66 72 42 57 63 360 期望機率() 1/6 1/6 1/6 1/6 1/6 1/6 1 期望出現次數(E) 60 60 60 60 60 60 360 (O-E)2/ E 0 0.6 2.4 5.4 0.15 0.15 8.7 2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60 + (42-60)2/60 + (57-60)2/60 + (63-60)2/60 = 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7 18 單一樣本多類別 H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i 不全為 1/ 6 2 = Σ(Oi - Ei)2 / Ei = (60-60)2/60 + (66-60)2/60 + (72-60)2/60 + (42-60)2/60 + (57-60)2/60 + (63-60)2/60 = 0 + 0.6 + 2.4+ 5.4 + 0.15 + 0.15 = 8.7 df=6-1=5 RR: 2 > 2 0.05,5 =11.1 ∵ 2 < 11.1 所以α= 0.05之下,不拒絕虛無假設,骰子為不公 正的情形不顯著,即認為此骰子為公正的。 19 單一樣本多類別 丟擲一個骰子,欲知該骰子是否為一公正骰子? H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i 不全為 1/ 6 多項式母體比例的檢定 ∴卡方檢定可用來決定資料是否屬於原有的母 體或分配。 適合度檢定 20 適合度檢定 多項式母體的檢定 二項式母體的檢定 卜瓦松母體的檢定 常態母體的檢定 以例題分別說明,並以電腦excel操作計算 21 多項式母體的檢定 電腦excel操作 丟擲一個骰子360次,欲知該骰子是否為一公正骰 子,紀錄其丟擲結果如下: (在α= 0.05條件下進行相關檢定。) 出現點數X值 1 2 3 4 5 6 合計 觀測到出現次數 60 66 72 42 57 63 360 H0 : 1 = 2 = 3 =4 = 5 =6 =1/ 6 H1 : i not all equal to 1/ 6 22 23 24 25 26 27 28 29 30 31 32 33 34 35 3601/6=60 36 37 38 39 40 60 60 2 60 41 42 43 44 45 8.7 2 2 0.05,5 11.1 46 計算 p-value 47 48 49 求得檢定之 p-value值 p-value 50 另一方法求得檢定之 p-value值 51 另一方法求得檢定之 p-value值 52 另一方法求得檢定之 p-value值 53 另一方法求得檢定之 p-value值 54 另一方法求得檢定之 p-value值 55 另一方法求得檢定之 p-value值 p-value 56 二項母體的檢定 某調查現今小學生配戴眼鏡的分布情形,今收集 250戶有2位小學生之家庭資料如下: 小學生戴眼鏡人數 0 1 2 合計 觀察到的家庭數O 35 110 105 250 欲知小學生戴眼鏡的情形是否符合60%的二項分配型態。 H0:資料來自B(2 , 0.6) Ha:資料不是來自B(2 , 0.6) 在自由度 df=2 及 α= 0.05 時 57 二項母體的檢定 小孩戴眼鏡人數 觀察到的家庭戶數(O) 期望機率() 期望的家庭戶數(E) (O-E)2/ E 0 35 0.16 40 0.625 1 110 0.48 120 0.8333 2 105 0.36 90 2.5 合計 250 1 250 3.9583 2 = Σ(Oi - Ei) 2 / Ei = (35-40)2/40 + (110-120)2/120 + (105-90)2/90 = 0.625 + 0.8333 + 2.5 =3.9583 df=3-1 因為 3.9583 < 22, 0.05 =5.99147 ; 或 p-value = Pr(2 > 3.9583) 0.1 < p-value < 0.2 22, 0.1 < 2 < 22, 0.2 所以不拒絕虛無假設,沒有充分證據說明此資料不是來自二項分配 58 59 60 61 P ( X 0 ) C 1 C02 0.6 0.4 2 0.16 2 0 0 0 2 0 62 63 64 65 66 67 2 3.96 22,0.05 5.99147 68 計算p-value 69 0.1 < p-value < 0.2 , 較 =0.05 為大 所以不拒絕虛無假設,沒有充分證據說明此資料不是來 自二項分配 70 卜瓦松分配母體檢定 某一加油站調查,每分鐘加油車輛數的觀測值下: 到達車數 0 1 2 3 4 5 合計 觀測數 182 129 79 8 1 1 400 試以α=0.05的顯著水準,檢定加油車輛數的分 配是否符合卜瓦松分配。 71 卜瓦松分配母體檢定 到達車數 0 1 2 3 4 5 合計 觀測次數 182 129 79 8 1 1 400 ˆ 解:H0:母體分配為卜瓦松分配 Ha:母體分配不為卜瓦松分配 由於平均到站加油車數未知,須先估計 ˆ =(0182+1129+279+38+41+51)/400= 0.8 72 73 ˆ 74 P( X x) x e x! 0.8 0 e 0.8 P( X 0) 0! 0.44933 75 76 77 由於期望車數必須在五輛以上,進行卡方的檢定方 法才準確,因此將到達車次合併至3次,重新計算 78 79 由於分配之平均車數未知,為一估計值 因此自由度為 4 – 1 – 1=2 13.82 2 2 0.05, 2 5.99147 ∵ p-value <0.05 所以加油站車輛加油之分配, 不為卜瓦松分配 80 常態分配的檢定 有一隨機樣本大小為30,而其觀測值如下: 18 25 26 27 26 25 20 22 23 25 16 24 30 36 34 19 31 28 26 25 24 21 29 28 22 20 27 32 28 19 以顯著水準α=0.05,檢定是否符合平均數為25 ,變異數為10 之常態分配。 解: H0:母體分配為常態分配(25,10) Ha:母體分配不為常態分配(25,10) 81 常態分配的檢定 將樣本由小到大排序,如下: 16 18 19 19 20 20 21 22 22 23 24 24 25 25 25 25 26 26 26 27 27 28 28 28 29 30 31 32 34 36 分五組,找出五個20百分位值,在顯著水準α=0.05, 檢定是否符合平均數為25,變異數為10之常態分 配。 用Excel 電腦軟體進行 82 機率 平均數 標準差 p百分位值 ( x p ) z p p P(Z z p ) 83 機率 平均數 標準差 84 限制條件範圍 用以計次之數值範圍 85 86 87 p value 0.05 not reject H 0 沒有充分證據說明資料不為N(25,10)之常態分配 88 常態分配的檢定 有一隨機樣本大小為20,而其觀測值如下: 18 25 26 27 26 25 20 22 23 25 19 31 28 26 25 24 21 29 28 22 以顯著水準α=0.05,檢定是否符合常態分配。 解: H0:母體分配為常態分配 Ha:母體分配不為常態分配 決定平均數ヽ變異數及分組數(k)後,再依照前 述方法利用Excel進行檢定。特別注意的是卡方 檢定自由度為 k-1-(估計參數個數)=k-1-2 89 回顧 二類別數, 成功或失敗 Z 2 多個類別數(k), 配適度 2 n ≥ 5, n(1- )≥5 自由度 k-1-(估計參數個數) 90 兩樣本比例差的比較 •何時使用? a. 當要比較兩個母體比例是否有差異存在,或某比例較另一為 大時。 b. 欲比較兩個母體比例差距為某介於(-1,1)之間的非零差距值。 • 所需前題: a. 獨立樣本 b. 母體來自二項分配 c. 樣本數要夠大,每一母體均需滿足 n ≥ 5 且 n (1-) ≥ 5 ,其中 n 為樣本個數; 為成功機率參數 91 兩樣本比例差的比較 符號說明 i:第 i 母體的成功比例參數。 Pi:自第 i 母體所抽出樣本的成功比例估計量。 ni:自第 i 母體所抽出的全部樣本數。 xi:自第 i 母體所抽出樣本為成功的樣本個數, 其中 Pi = xi / n i 。 92 兩樣本比例差的比較 有 興 趣 研 究 問 題 種 類 假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例 條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例 H0 H1 1 - 2 1 - 2 1 - 2 1 - 2 < 1 - 2 1 - 2 > 93 兩樣本比例差的比較 有 興 趣 研 究 問 題 種 類 假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例 條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例 H0 H1 註: 1 - 1 - 2 1 - 2 1 - 2 1 - 2 < 1 - 2 1 - 2 > 2 0 ,其中 0可為任一非零的比例 94 兩樣本比例差的比較 有 興 趣 研 究 問 題 種 類 假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例 條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例 H0 H1 檢定 統計 量 1 - 2 1 - 2 Z與2 1 - 2 1 - 2 < 1 - 2 1 - 2 > Z Z 95 兩樣本比例差的比較 假 設 兩比例無差異 Z 條 件 兩比例有差異 H0 H1 檢定 統計 量 1 - 2 1 - 2 1 1 p(1 p) n1 n2 決策條件 2 Z與2 p1 p2 Z Z , x 1 x2 p n1 n2 2 Oi Ei 2 k i 1 Ei 決策條件 2 2 , df , 其中 df k 1 96 兩樣本比例差的比較 母體 1 比例不較母體 2 比例大 母體 1 比例 較 母體 2 比例大 假 設 條 件 H0 H1 1 - 2 1 - 2 > 檢定 統計 量 Z Z p1 p2 p1 1 p1 p2 1 p2 n1 n2 決策條件 Z Z 97 兩樣本比例差的比較 母體 1 比例不較母體 2 比例小 母體 1 比例 較 母體 2 比例小 假 設 條 件 H0 H1 1 - 2 1 - 2 < 檢定 統計 量 Z Z p1 p2 p1 1 p1 p2 1 p2 n1 n2 決策條件 Z Z 98 兩樣本比例差的比較 有 興 趣 研 究 問 題 種 類 假 設 兩比例無差異 母體1比例 母體2比例 母體1 母體2比例 條 件 兩比例有差異 母體1比例 < 母體2比例 母體1 > 母體2比例 H0 H1 1 - 2 1 - 2 1 - 2 1 - 2 < 1 - 2 1 - 2 > 99 兩樣本比例差例題 區間估計 例、公正性認知 某公司人事主管,欲測試兩種員工能力表現評比 方法的公正性認知百分比差異變化。以方法Ⅰ評比80 位員工中,有60位認為公正;以方法Ⅱ評比75位員工中, 有45為認為公正,試估計在95%的信賴係數下,兩種方 法公正性的認知差異。 100 兩樣本比例差例題 區間估計 p1:表方法Ⅰ認知百分比估計量 p2:表方法Ⅱ認知百分比估計量 E (p1-p2) = 1- 2 , V(p1-p2) = 1 (1- 1) / n1 + 2 (1- 2) / n2 ˆ p1 p2 p1 p2 ˆ p1 p2 p1 (1 p1 ) p2 (1 p2 ) n1 n2 101 兩樣本比例差例題 區間估計 在 n1 , n2 均為大樣本條件下,由中央極限定理可知, p1p2會近似常態,所以 p1 p2 Z /2 ˆ p1 p2 1 2 p1 p2 Z /2ˆ p1 p2 102 兩樣本比例差例題 區間估計 p1 = 60 / 80 =3 / 4 = 0.75 p2 = 45 / 75 =3 / 5 = 0.6 ˆ p p 1 2 0.75 0.25 0.6 0.4 80 75 0.005544 0.0745 Z/2=Z 0.025=1.96 103 兩樣本比例差例題 區間估計 p1 = 0.75 p2 = 0.6 ˆ p p 0.0745 1 2 =0.05, Z/2=Z 0.025=1.96 p1 p2 Z /2 ˆ p1 p2 1 2 p1 p2 Z /2ˆ p1 p2 0.750.61.960.0745 12 0.750.61.960.0745 → 0.00398 1 2 0.29602 在95%的信賴係數下,方法Ⅰ與方法Ⅱ公正性的認知差異 介於 (0.00398, 0.29602) 104 兩樣本比例差例題 比例差為某百分比之檢定 例、公正性認知 某公司人事主管,欲測試兩種員工能力表現評比 方法的公正性認知百分比差異變化。以方法Ⅰ評比80 位員工中,有60位認為公正;以方法Ⅱ評比75位員工 中,有45為認為公正,由以往的幾次測試結果,欲知 方法Ⅰ的評比公正性認知較方法Ⅱ高出1成。 105 兩樣本比例差的比較 假 設 條 件 H0 H1 檢定 統計 量 母體 1 比例不較母體 2 比例高出一成 母體 1 比例 較 母體 2 比例高出一成 1 - 2 .1 1 - 2 > .1 Z p1 p2 ( 1 2 ) p1 1 p1 p2 1 p2 n1 n2 決策條件 Z Z Z 106 兩樣本比例差例題 比例差為某百分比之檢定 解: 下標1表方法Ⅰ, 下標2表方法Ⅱ H0 : 1 2 0.1 H1 : 1 2 0.1 ∵ n1 15, n1(1- 1 ) 5 且 n2 2 5, n2(1- 2 ) 5 在 n1 , n2 均為大樣本條件下,由中央極限定理可知, p1p2 會近似常態,所以 107 兩樣本比例差例題 比例差為某百分比之檢定 p1 = 60 / 80 =3 / 4 = 0.75 p2 = 45 / 75 =3 / 5 = 0.6 Z * ( p1 p2 ) ( 1 2 ) p1 (1 p1 ) p2 (1 p2 ) n1 n2 (0.75 0.6 ) 0.1 0.6715 0.75 0.25 0.6 0.4 80 75 108 兩樣本比例差例題 比例差為某百分比之檢定 在 H0 : 1 2 0.1 H1 : 1 2 0.1 Z * (0.75 0.6) 0.1 0.6715 0.75 0.25 0.6 0.4 80 75 RR: |Z|> Z/2=Z 0.025=1.96 Z*=0.6715 < 1.96 Not reject H0 ,方法Ⅰ沒有顯著高於方法Ⅱ 1成。 109 兩樣本比例差例題 比例差是否有差異 例、公正性認知 某公司人事主管,欲測試兩種員工能力表現評 比方法的公正性認知百分比差異變化。以方法Ⅰ 評比80位員工中,有60位認為公正;以方法Ⅱ評比 75位員工中,有45為認為公正,試比較在95%的信 賴係數下,兩種方法公正性的認知是否有差異存 在。 110 兩樣本比例差的比較 假 設 兩比例無差異 條 件 兩比例有差異 H0 H1 1 - 2 1 - 2 p1 p2 x 1 x2 Z , p n1 n2 1 1 p(1 p) n1 n2 決策條件 : Z Z O E 2 2 檢定 統計 量 Z與2 2 E 2 2 決策條件 : , df 111 兩樣本比例差例題 比例差是否有差異 H 0 : 1 2 vs H1 : 1 2 n1 1 5, n1 (1 1 ) 5且 n2 2 5, n2 (1 2 ) 5 p1 60 / 80 0.75 p2 45 / 75 0.6 60 45 21 p 80 75 31 0.75 0.6 Z* 1.9964 21 10 1 1 31 31 80 75 RR : Z Z 1.96 2 under 0.05, Z * 1.96 112 兩樣本比例差例題 比例差是否有差異 H 0 : 1 2 vs H 1 : 1 2 Z * 1.9964 RR : Z Z 1.96 2 under 0.05, Z * 1.96 拒絕虛無假設, 兩評分方法之公正性認知上有顯著差異存在 113 兩樣本比例差的比較 假設 條件 H0 H1 兩比例無差異 Z 兩比例有差異 1 - 2 1 - 2 p1 p2 1 1 p(1 p) n1 n2 , x 1 x2 p n1 n2 決策條件 : Z Z 2 2 O E 2 檢定 統計 量 E Z與 2 2 2 決策條件 : , df 其中 O為觀測值 , E為期望值 114 兩樣本比例差例題 比例差是否有差異 兩獨立 樣本 評比方法 認 知 公正 Ⅰ 60 Ⅱ 45 合計 105 不公正 20 30 50 合計 80 75 155 變數 水準 p1 = 60 / 80 =3 / 4 = 0.75 p2 = 45 / 75 =3 / 5 = 0.6 115 兩樣本比例差例題 比例差是否有差異 評比方法 認 知 公正 Ⅰ 60 Ⅱ 45 合計 105 不公正 20 30 50 合計 80 75 155 H0 : 1 - 2 H1 : 1 - 2 116 兩樣本比例差例題 比例差是否有差異 H0 : 1 - 2 vs H1 : 1 - 2 2 (O E ) 2 E 評比方法 認 知 公正 Ⅰ 60 Ⅱ 45 合計 105 不公正 20 30 50 合計 80 75 155 117 兩樣本比例差例題 比例差是否有差異 r (Oij E ij) c 2 i 1 j 1 2 , r 1,2 c 1,2 E ij df ( r 1) (c 1) 評比方法 認 知 公正 不公正 合計 Ⅰ Ⅱ 合計 n11 n21 n+1 n12 n22 n+2 n1+ n2+ n 118 兩樣本比例差例題 比例差是否有差異 r c 2 i 1 j 1 (Oij E ij) 2 , r 1,2 c 1,2 E ij n1 n1 E11 n 評比方法 認 知 公正 不公正 合計 Ⅰ Ⅱ 合計 n11 n21 n+1 n12 n22 n+2 n1+ n2+ n 119 兩樣本比例差例題 比例差是否有差異 n1 n1 105 80 E11 54.19 n 155 評比方法 認 知 Ⅰ Ⅱ 合計 公正 60 (54.19) 45 105 不公正 20 30 50 合計 80 75 155 120 兩樣本比例差例題 比例差是否有差異 評比方法 認 知 公正 Ⅰ Ⅱ 60 (54.19) 45 (50.81) 合計 105 不公正 20 (25.81) 30 (24.19) 50 80 合計 r c 2 i 1 j 1 (Oij E ij) 75 2 155 , r 1,2 c 1,2 E ij 121 兩樣本比例差例題 比例差是否有差異 60 54.19 45 50.81 2 2 2 54.19 50.81 20 25.81 2 25.81 30 24.19 2 24.19 3.9906 122 兩樣本比例差例題 比例差是否有差異 H0 : 1 - 2 vs H1 : 1 - 2 r c 2 (Oij E ij) 2 i 1 j 1 , r 1, 2 c 1, 2 E ij 2 3.9906 , df ( r 1)( c 1) 1 在 0.05下 , RR : X 2 1,0.05 3.84146 2 3.9906 12,0.05 3.84146 拒絕虛無假設 ,兩評分方法之公正性認 知上有顯著差異存在 123 二維列聯表 R C contingency table 22 列聯表 評比方法 認 知 公正 不公正 合計 Ⅰ Ⅱ 合計 n11 n21 n+1 n12 n22 n+2 n1+ n2+ n 觀測個數 邊際個數 總個數 124 二維列聯表 R C contingency table 22 列聯表 pij = nij /n 評比方法 認 知 公正 不公正 合計 Ⅰ Ⅱ 合計 p11 p21 p+1 p12 p22 p+2 p1+ p2+ 1 觀測機率 邊際機率 總機率 125 兩獨立樣本 評比方法 認 知 Ⅰ Ⅱ 合計 公正 60 45 105 不公正 合計 20 30 50 80 75 155 變數 水準 126 變數 水準 32 列聯表 性別 系 別 男 女 合計 統計 企管 26 30 35 40 61 70 經濟 合計 20 44 64 76 119 195 變數 水準 127 卡方檢定 齊一性 例 某零售商懷疑三家不同公司所批得之零件品質有差異。 因此今將各公司購得之零件品質測試紀錄於下表,試以0.05顯 著水準檢定,在不同公司零件品質是否有差異。 零件品質 公司類別 良品個數 瑕疵個數 合計 A 315 55 370 B 425 75 500 C 510 90 600 合計 1250 220 1470 128 卡方檢定 齊一性 以 p11表A公司生產良品個數的比例 p21表B公司生產良品個數的比例 p31表C公司生產良品個數的比例 p11 = p21 = p31 p12 = p22 = p32 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 129 卡方檢定 齊一性 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 2 r c (Oij E ij)2 i 1 j 1 Eij E , r 1,2,3 c 1,2 ij ni n j n 130 卡方檢定 齊一性 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 E11=3701250/1470=314.6 零件品質 公司類別 良品個數 瑕疵個數 合計 A 315 (314.6) 55 370 B 425 75 500 C 510 90 600 合計 1250 220 1470 131 卡方檢定 齊一性 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 零件品質 公司類別 良品個數 瑕疵個數 合計 A 315 (314.6) 55 (55.4) 370 B 425 (425.2) 75 (74.8) 500 C 510 (510.2) 90 (89.8) 600 合計 1250 220 1470 132 卡方檢定 齊一性 零件品質 公司類別 良品個數 瑕疵個數 合計 A 315 (314.6) 55 (55.4) 370 B 425 (425.2) 75 (74.8) 500 C 510 (510.2) 90 (89.8) 600 合計 1250 220 1470 2 315 314 . 6 2 314.6 55 55.4 2 55.4 2 425 425.2 425.2 2 75 74.8 74.8 2 510 510.2 510.2 2 90 89.8 89.8 0.04 133 卡方檢定 齊一性 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 2 315 314 . 6 2 314.6 55 55.4 2 55.4 2 425 425.2 425.2 2 75 74.8 74.8 2 510 510.2 510.2 2 90 89.8 89.8 0.04 RR : X 2 22,0.05 5.99147 , df (3 1)( 2 1) 2 0.04 22,0.05 不拒絕虛無假設 三公司零件品質無顯著差異存在 134 卡方檢定 齊一性 •將卡方檢定由一般情形延伸至多個獨立 母體之比較 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 •檢定一個變數(變項)各類別(或水準)在 不同母體比例是否相同 •應用列聯表 135 卡方檢定 齊一性 前題條件 •必須為隨機獨立選出樣本 •必須為大樣本 •所有各期望個數必須大於1 136 齊一性檢定例題 例 : 欲知不同系別畢業生畢業後,最先開始從事的 工作性質是否受到其在校主修學位的不同而有差 異。今自企管、統計和經濟系畢業生中,隨機抽 出適當樣本數,並記錄其畢業後,最先開始從事 的工作類別如下: (以α= 0.01檢定之) 主修學位 電腦 銀行 其他 合計 企管 50 16 14 80 統計 25 35 15 75 經濟 21 46 18 85 合計 96 97 47 240 137 齊一性檢定例題 解︰ H0:主修學位與工作類別無差異 Ha:主修學位與工作類別有差異 p11 = p21 =p31 , p21 = p22 = p32 , p31 = p32 = p33 其中 p11表示企管系畢業生畢業從事電腦工作的百分比 p21表示統計系畢業生畢業從事電腦工作的百分比 p31表示經濟系畢業生畢業從事電腦工作的百分比 E11=80 96 / 240 = 32.0 E21=75 96 / 240 = 30.0 E31=85 96 / 240 = 34.0 138 齊一性檢定例題 期望數的結果 主修學位 電腦 銀行 電子 企管 32.0 32.3 15.7 統計 30.0 30.3 14.7 經濟 34.0 34.4 16.7 139 齊一性檢定例題 解︰ H0:主修學位與工作類別無差異 Ha:主修學位與工作類別有差異 p11 = p21 =p31 , p21 = p22 = p32 , p31 = p32 = p33 其中 p11表示企管系畢業生畢業從事電腦工作的百分比 p21表示統計系畢業生畢業從事電腦工作的百分比 p31表示經濟系畢業生畢業從事電腦工作的百分比 E11=80 96 / 240 = 32.0 E21=75 96 / 240 = 30.0 E31=85 96 / 240 = 34.0 140 齊一性檢定例題 H0:主修學位與工作類別無差異 Ha:主修學位與工作類別有差異 2 2 2 2 50 32 . 0 25 30 . 0 21 34 . 0 16 32 . 3 2 32.0 30.0 34.0 32.3 35 30.32 46 34.4 2 14 15.7 2 15 14.7 2 18 16.7 2 30.3 34.4 15.7 14.7 16.7 29.09 RR : X 2 42,0.01 13.2767 , df (3 1)(3 1) 4 29.09 42,0.01 拒絕虛無假設 三系別畢業生在初次工作類別上有顯著差異存在 141 卡方檢定 獨立性 例: 某食品公司欲知不同性別消費者,對所推出的3 種不同口味產品喜好是否有差異。今隨機調查200位 消費者,在試吃後選出其最喜歡的口味種類。在顯著 水準0.01下,檢定性別對產品的喜好看法是否有差異。 產品口味 性別 A B C 合計 男 75 22 20 117 女 45 18 20 83 合計 120 40 40 200 142 卡方檢定 獨立性 解︰ H0:性別與產品口味無差異 ( i j = i+ +j) Ha:性別與產品口味有差異 ( i j i+ +j) ( i :性別, 男: 1, 女: 2 ; j : 口味, A:1, B:2, C:3 ) 產品口味 性別 A B C 合計 男 75 22 20 117 女 45 18 20 83 合計 120 40 40 200 143 卡方檢定 獨立性 產品口味 性別 A B C 合計 男 75 (70.2) 22 (23.4) 20 (23.4) 117 女 45 (49.8) 18 (16.6) 20 (16.6) 83 合計 120 40 40 200 144 卡方檢定 獨立性 H0:性別與產品口味無差異 (i j = i+ +j) Ha:性別與產品口味有差異 ( i j i+ +j) 2 75 70 . 2 2 70.2 18 16.6 2 16.6 2 45 49.8 49.8 2 20 23.4 23.4 2 22 23.4 23.4 2 20 16.6 16.6 2.183 RR : X 2 22,0.01 9.21034, df (2 1)(3 1) 2 2.183 22,0.01 不拒絕虛無假設 不同性別在口味喜好上沒有顯著差異存在 145 卡方檢定 獨立性 •顯示兩變項間的關係 1.僅由一個母體中抽出樣本 H0:i j = i+ +j Ha: i j i+ +j 2.每個變項均有兩個或多個類別(或水準) 3.不顯示因果關係 4.不顯示兩變項間的性質 •應用列聯表 146 卡方檢定 獨立性 •與齊一性比較 齊一性 1.將卡方檢定由一般情形延伸至多個獨立母體之比較 H0 : 11 = 21 = 31 , 12 = 22 = 32 H1: 三公司零件品質不相同 2.檢定一個變數(變項)各類別(或水準)在不同母體比例 是否相同 獨立性 1.顯示兩變項間的關係 H0:i j = i+ +j 僅由一個母體中抽出樣本 vs Ha: i j i+ +j 147 應用列聯表,Excel 程式 n1 n 1 n 148 149 150 151 (O11 E11 ) 2 E11 152 RR : X 2 22,0.01 9.21034, df (2 1)(3 1) 2 2.183 22,0.01 不拒絕虛無假設 不同性別在口味喜好上沒有顯著差異存在 153 可省略直接應用 CHITEST(B2:D3,B7:D8) 154 總結 1. 兩類別比例值的比較 a. Z 檢定 b. 2 檢定(卡方檢定) 2. 多個(二個以上)類別比例值的比較 a. 同質性 3. 兩類別因子比例值的比較 a. 齊一性檢定 b. 獨立性檢定 155 關於本講程... 請你靜下來想一想: 1. 你學到哪些 ? 2. 想想在您日常生活中,是否有某些事物或 現象符合我們以上所提的各種分析方法? 您是否能對您有興趣瞭解的現象,進行適 當檢定與決策。 3. 是否還有相關問題與疑問 ? 156