Transcript 統計學CH13
第 13 章 兩個母體比較的推論 LOGO 13.1 兩個母體的比較 在前面幾章,我們學到了估計與檢驗單一母體: 母體平均數 µ 母體比例 p 本章之目的在比較兩個母體,我們呈現幾個不同的 方法,感興趣的參數是: 兩個平均數之間的差異。 兩個母體變異數的比率。 兩個比例之間的差異。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第466-467頁 13.2 兩母體平均數差異的推論 為了檢定與估計兩母體平均數之間的差異,我們分別從兩個 母體抽出隨機樣本。我們討論獨立樣本,即定義獨立樣本為 相互之間完全無關的樣本。 母體1 樣本,大小: n1 參數: (計算母體2的 Copyright ©2010 Cengage Learning 統計量: 與母體1的方式類似) 第13章 兩個母體比較的推論 第467頁 13.3 兩母體平均數差異的推論 因為我們要比較兩個母體平均數間差異,我們使用 統計值 為µ1- µ2的不偏及一致的估計量。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第467頁 13.4 的抽樣分配 1. 如果母體為常態或近似常態,或者如果母體是非 常態但是樣本很大(n1, n2 > 30) ,則 為常 態分配。 2. 的期望值是 µ1- µ2 的變異數是 3. 以及標準誤是 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第468頁 13.5 μ1-μ2的推論 如果母體為常態或近似常態,或者如果母體是非常 態但是樣本很大,則 為常態分配。因此: 是一標準常態(或近似常態)的隨機變數。 我們可以藉此計算出µ1 - µ2的檢定統計量與信賴區 間估計量。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第468頁 13.6 μ1-μ2的推論 然而,這些公式很少被使用,因為母體變異數σ12與 σ22在實務上通常是未知的。 ?? 我們用t- 測量值替代。 我們思考兩個未知母體變異數的案例:何時我們相 信它們是相等的,相反地,何時它們不相等。 更多關於此內容如下… Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第468頁 13.7 μ1-μ2的檢定統計量(相等變異數) 計算 —被稱為混合變異數估計量(pooled variance estimator)… 在此使用: 自由度 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第469頁 13.8 μ1-μ2 的信賴區間估計量(相等變異數) 當母體變異數相等時,μ1-μ2 的檢定統計量被給 定為: 混合變異數估計量 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第469頁 自由度 13.9 μ1-μ2的檢定統計(不相等變異數) 當母體變異數不相等時,μ1-μ2 的檢定統計量被 給定為: 同樣地,信賴區間估計量為: Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第469-470頁 自由度 13.10 該選擇哪個檢定統計量? 我們該選擇哪一種檢定統計量?相等變異數或不等 變異數? 無論是否有證據去推論母體變異數是相異的,我們 將進行 相等變異數 t- 檢定 因此,任何兩個給定樣本: 12=22 的自由度 ≥ 12≠22 的自由度 較大的自由度,同樣的擁有 較大的樣本 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第470頁 ≥ 13.11 檢定母體變異數 檢定的假設是 H0: σ12 / σ22 = 1 H1: σ12 / σ22 ≠ 1 檢定統計量:s12 / s22,服從自由度為ν1 = n1– 1 和ν2 = n2 −2的F- 分配 所需要的條件等同於對µ1 - µ2 的t- 檢定條件,及兩 母體皆服從常態分配。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第471頁 13.12 檢定母體變異數 這是一個雙尾檢定,所以拒絕域為 F F / 2,1 , 2 或 F F1 / 2,1 , 2 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第471頁 13.13 範例13.1 數以百萬計的投資人購買共同基金,從數千種可能 的基金中做選擇。 有些基金可以直接向銀行或財務機構購買,而有些 則必須透過收取服務費的經紀人購買。 這產生一個問題。投資人直接購買是否能夠比透過 經紀人購買做得更好。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第471頁 13.14 範例13.1 為了回答這個問題,一群研究人員從直接購買以及 透過經紀人購買的共同基金中隨機抽樣年度報酬率, 並且記錄了年度淨報酬率,它為扣除所有相關費用 之的投資報酬,如 Xm13-01所列。 在5%的信賴水準下,我們是否能夠結論:直接購買 的共同基金表現得比透過經紀人購買的共同基金好? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第471-472頁 13.15 辨識方法 範例13.1 為了回答此問題,我們必須比較直接購買與透過經 紀人購買共同基金報酬率的母體。 很明顯地,資料是區間的(我們記錄了真實的數 字)。 這個問題目的-資料型態的組合告訴我們要被檢定 的參數是兩個平均數之間的差異µ1- µ2。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第472頁 13.16 辨識方法 範例13.1 要檢定的假設是直接購買共同基金的平均淨報酬率 (µ1)大於透過經紀人購買共同基金的平均淨報酬率 (µ2)因此,對立假設為 H1: µ1- µ2 > 0 和 H0: µ1- µ2 = 0 要決定應用哪一個µ1- µ2的 t- 檢定,我們執行σ12/ σ22 的 F- 檢定。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第472頁 13.17 計算 範例13.1 由資料我們計算下列的統計量 s12 = 37.49 與 s22 = 43.34 檢定統計量 F = s12/ s22 = 37.49/43.34 = 0.86 拒絕域 F F / 2,1 , 2 F.025,49,49 F.025,50,50 1.75 或 F F1 / 2,1 , 2 F.975,49,49 1/ F.025,49,49 1/ F.025,50,50 1/ 1.75 .57 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第472頁 13.18 計算 範例13.1 檢定統計量的值是F = .8650。Excel 輸出單尾 p- 值。 因為我們執行雙尾檢定,我們將這個值加倍。因此, 這項檢定的p- 值是2 × .3068 = .6136。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第473頁 13.19 詮釋 範例13.1 沒有足夠的證據去推論母體變異數不同。因此我們 必須應用µ1- µ2 的相等-變異數 t- 檢定。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第473頁 13.20 計算 範例13.1 點選Data、Data Analysis,與t-Test: Two-Sample Assuming Equal Variances。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.21 計算 範例13.1 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第474頁 13.22 詮釋 範例13.1 檢定統計量的值是2.29。單尾p- 值是.0122。 我們觀察到這項檢定的 p- 值是小的( 並且檢定統計 量落在拒絕域之中)。 因此,我們結論有充分的證據去推論平均而言直接 購買共同基金的表現超越透過經紀人購買的共同基 金。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第475頁 13.23 信賴區間估計 假設我們想要知道直接購買共同基金與透過經紀人 購買共同基金之間平均報酬率差異的95% 信賴區間 估計值。 對相同的母體變異數,平均數之間差異的信賴區間 估計量是 (x1 x 2 ) t / 2 2 s p 1 1 n1 n 2 直接購買共同基金與透過經紀人購買共同基金之間 平均報酬率差異的95% 信賴區間估計值 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第475.476頁 13.24 計算 信賴區間估計 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第476頁 13.25 詮釋 信賴區間估計 我們估計直接購買共同基金的報酬率平均大於透 過經紀人購買共同基金的報酬率在.38 與5.43 個百 分點之間。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第476頁 13.26 範例13.2 當家族經營企業被老闆的兒子或女兒接管時會發生 什麼情況? 如果新老闆是公司擁有者的下一代時,經過改變之 後的企業是否經營得比較好,或是由外來者當執行 長(CEO) 時,企業會經營得比較好? 為了求得答案,研究人員在1994 與2002 年之間隨機 選取140 家公司,其中30%把所有權傳給下一代, 70% 則是指定外來者當CEO。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第476頁 13.27 範例13.2 對於每一家公司,研究人員根據資產的比例計算新 CEO 接管前一年和後一年的經營收入。 這個變數的改變( 之後的經營收入-之前的經營收入) 被記錄並且列於Xm13-02。 這些資料是否容許我們去推論使用下一代CEO 的影 響力不同於聘請外來者當CEO 的影響力? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第476頁 13.28 辨識方法 範例13.2 本例的目的是要比較兩個母體: 母體群體1:公司擁有者的兒子或女兒成為CEO的前 後平均差異。 母體群體2:公司指定外來者當CEO的前後平均差異。 資料是區間的(經營收入)。 兩母體平均數之間的差異µ1- µ2,其中µ1是母體群體 1,而µ2為母體群體2。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第477頁 13.29 辨識方法 範例13.2 因為我們想要決定兩個平均數之間是否存在著差異 (difference),對立假設為 H1: µ1- µ2 ≠ 0 以及虛無假設為 H0: µ1- µ2 = 0 我們必須決定是否應用µ1- µ2 的相等變異數t- 檢定, 或是µ1- µ2 的不等-變異數 t- 檢定。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第477-478頁 13.30 辨識方法 範例13.2 為了決定要應用哪一個 t- 檢定,我們執行σ12 / σ22 的F- 檢定。 由資料我們計算下列的統計量。 s12 = 3.79 和 s22 = 8.03 檢定統計量 F = 3.79/8.03 = 0.47 拒絕域 F F / 2,1 ,2 F.025,41,97 F.025,40,100 1.54 或 F F1 / 2,1 ,2 F.975,41,97 1/ F.025,97,41 1/ F.025,100,40 1/ 1.59 .63 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第477頁 13.31 辨識方法 範例13.2 點選 Data, Data Analysis,與 F-Test Two Sample for Variances Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.32 辨識方法 範例13.2 檢定統計量的值是 F =.47以及 p- 值= 2×.0040 = .0080。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第478頁 13.33 辨識方法 範例13.2 因此,適當的方法是µ1- µ2的不等-變異數 t- 檢定。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第478頁 13.34 計算 範例13.2 點選Data、Data Analysis,與t-Test: Two-Sample Assuming Unequal Variances 。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.35 計算 範例13.2 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第479頁 13.36 詮釋 範例13.2 t- 統計量為-3.22 並且其 p- 值是 .0017。因此,我們 下結論說有充分的證據去推論經營收入的平均改變 有差異。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第479頁 13.37 信賴區間估計 我們也可以用計算信賴區間估計量的方式產生有關 兩母體平均數間差異的推論。我們使用m1 - m2 的 不等-變異數信賴區間估計量以及95%的信賴水準。 我們使用Estimators工作簿中的t-Estimate_2 Means (Uneq-Var) 工作表或手算。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第480頁 13.38 計算 信賴區間估計 啟動Estimators工作簿中的t-Estimate_2 Means (Uneq-Var) 工作表並且帶入樣本統計量與信賴水準。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第480頁 13.39 詮釋 信賴區間估計 我們估計外聘CEO 經營收入的平均改變超越下一 代CEO 經營收入的平均改變在 .51 到2.16 個百分 點之間。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第480頁 13.40 檢查必要的條件 相等-變異數和不等-變異數兩種方法皆要求兩母 體為常態。如同以前,我們能夠藉著畫資料的直方 圖來檢查這項條件是否被滿足。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第480頁 13.41 檢查必要的條件:範例13.1 . Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第481頁 圖13.2 & 圖13.3 13.42 檢查必要的條件:範例13.2 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第481.482頁 圖13.4 & 圖13.5 13.43 必要條件的違背 當常態的條件不被滿足時, 我們可以使用一個無母 數方法──Wilcoxon 等級和檢定(Wilcoxon rank sum test) 來取代µ1-µ2的相等-變異數 t- 檢定。 當母體是非常態時,我們並沒有對µ1-µ2的不等-變 異數 t- 檢定之無母數替代方案。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第482頁 13.44 專有術語 來自第一個樣本的所有觀測值被儲存於一欄,而來自第二個 樣本的所有觀測值被儲存於另一欄,資料被稱為非堆疊式 (unstacked) 。 如果來自兩種樣本的所有資料 被儲存在同一欄中,則稱資料 為堆疊式(stacked)。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第482頁 13.45 發展對統計觀念的了解 1 本節的公式相對於其他章節是比較複雜的。但是, 在觀念上,兩個檢定定統計量都是基於我們在第11 章和第12 章介紹的方法。 也就是,檢定統計量的值是統計量 x 1 x 2 和參數1 - 2 假設值之間的差距,以標準誤為衡量單位。 統計量 參數 檢定統計量 標準誤 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第483-484頁 13.46 發展對統計觀念的了解 2 如同對 p 的區間估計量,對所有在此介紹的推論程 序,標準誤必須從資料估計。 我們用來計算x1 - x2 標準誤的方法取決於母體變異 數是否相等。當它們相等,我們使用混合變異數估 計量sp2 來計算。 我們在此應用一個重要的原則,而且我們將在13.5 節和之後的章節中再次應用此原則。此原則是,如 果可能,混合樣本資料來估計標準誤是較具優勢的。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第484頁 13.47 發展對統計觀念的了解 2 這個原則可以概略敘述如下:只要可能,混合樣本資料去估 計標準誤是較具優勢的。在先前的應用中,我們能夠混合是 因為我們假設兩組樣本是從兩個具共同變異數的母體中抽取 出來。 合併兩組樣本增加估計值的精確度。因此,sp2 是比個別用s12 或s22 更好的共同變異數估計量。 當兩母體變異數不等時,我們不能混合資料以產生一個共同 的估計量。 我們必須計算s12 和s22 並使用它們分別去估計12 和22 。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第484頁 13.48 辨識因素 I 辨識1 - 2 相等-變異數 t- 檢定和估計量的因素 1. 問題目的:比較兩個母體。 2. 資料類型:區間。 3. 敘述性測量的類型:中央位置。 4. 實驗設計:獨立樣本。 5. 母體變異數:相等。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第484頁 13.49 辨識因素 II 辨識1 - 2 不等-變異數t- 檢定和估計量的因素 1. 問題目的:比較兩個母體。 2. 資料類型:區間。 3. 敘述性測量的類型:中央位置。 4. 實驗設計:獨立樣本。 5. 母體變異數。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第484頁 13.50 範例13.3 雖然有些爭論,科學家大致同意高纖穀類可以降低罹患 各種癌症的可能性。但是,有一位科學家宣稱早餐吃高 纖穀類的人,與早餐不吃高纖穀類的人相較,平均而言 在午餐時會攝取少一點的卡路里。 如果這個宣稱為真,高纖穀類製造商將可以宜稱另一個 食用他們產品的好處——對減肥者有潛在的減重效果。 對宣稱的一項初步檢定中 · 隨機抽出150個人 · 並且詢問 他們日常早餐與午餐的食物為何。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第488頁 13.51 範例13.3 每一個人被分類為高纖穀類的消費者或非消費者, 並且在午餐所吃下的卡路里被測量且記錄下來。這 些資料如Xm13-03所列。 科學家是否能夠在5%的顯著水準下結論他的認知為 正確的? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第488頁 13.52 範例13.3 H 0 : (1 2 ) 0 H1 : (1 2 ) 0 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第488.489頁 13.53 範例13.3 檢定統計量的值是- 2.09。 單尾的 p- 值是.0193。 根據此結果,我們下結論說有充分的證據去推論高 纖穀物的消費者午餐的確比非高纖穀物的消費者攝 取較少的卡路里。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第489頁 13.54 觀測和實驗資料 從這個結果,我們傾向於相信在早餐食用高纖穀物 可能是一種減重的方法。 但是,還有其他可能的詮釋。 例如,攝取較少卡路里的人很可能是比較重視健康 的一群人,而這些人比較可能會將高纖穀物當成是 健康早餐的一部分。 在這個詮釋中,高纖穀物並不一定導致低午餐卡路 里攝取。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第489頁 13.55 觀測和實驗資料 另一個因素是,對健康的整體顧慮同時導致低午餐 卡路里攝取和以高纖穀物為早餐。 注意的是這個統計程序的結論是不變的。 平均而言,食用高纖穀物的人在午餐攝取較少的卡 路里。但是,因為資料蒐集的方法,我們要詮釋這 個結果是比較困難的。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第489頁 13.56 觀測和實驗資料 根據範例13.3的結果,我們傾向於相信在早餐食用 高纖穀物可能是一種減重的方法。 但是,還有其他可能的詮釋。例如,攝取較少卡路 里的人很可能是比較重視健康的一群人,而這些人 比較可能會將高纖穀物當成是健康早餐的一部分。 在這個詮釋中,高纖穀物並不一定導致低午餐卡路 里攝取。另一個因素是,對健康的整體顧慮將同時 導致低午餐卡路里攝取和以高纖穀物為早餐。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第489頁 13.57 觀測和實驗資料 假設我們用實驗的方法重做範例13.3。 我們隨機抽選出150 個人來參與這個實驗。 並隨機指派75 個人於早餐食用高纖穀物,而另外75 個人吃其他的食品。 我們接著再記錄他們每一個人在午餐所攝取的卡路 里。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第489頁 13.58 觀測和實驗資料 在理想的情況下,在這個實驗中,兩群人對所有其 他的面向會比較相似,包括對健康顧慮。( 越大的樣 本大小越能增加兩群體相似的可能性。) 假如統計的結果與範例13.3 的結果大致相同,我們 就有一些正當的理由去相信早餐食用高纖穀物導致 減少午餐卡路里的攝取。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第489頁 13.59 成對樣本 在13.1 節中,感興趣的參數是兩母體平均數之間的 差異,其中資料是由獨立樣本取得。 然而,假設在一個樣本中的一個觀測值與第二個樣 本的一個觀測值配對,稱為配對實驗。 為了說明我們為何會需要配對實驗以及如何處理這 種方法所產生的資料,考慮範例13.4。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第491頁 13.60 範例13.4 過去幾年一些以網路為基礎提供就業服務的公司逐 漸成立。 一位這類公司的經理想要調查最近支付給MBA 工作 的薪資。 特別是,她想要知道是否支付給主修財務者的薪資 高於主修行銷者的薪資。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第491頁 13.61 範例13.4 在初步的研究中,她隨機抽樣50 位最近畢業的MBA, 其中半數主修財務,半數主修行銷。 對每一個人,她記錄其最高的薪資( 包括紅利)。資 料列於Xm13-04。 我們是否能夠推論在這些MBA 之中,主修財務者比 主修行銷者獲得更高的薪資支付? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第491頁 13.62 辨識方法 範例13.4 參數是兩平均數的差異µ1 - µ2(其中 µ1=提供給主 修財務者的平均最高薪資,以及µ2 = 提供給主修行 銷者的平均最高薪資)。 因為我們想要決定是否主修財務者被提供較高的薪 資,對立假設將指定 µ1大於µ2。 對變異數執行 F- 檢定,使用相等一變異數檢定統計 量。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第491頁 13.63 辨識方法 範例13.4 假設分別為: H 0 : (1 2 ) 0 H1 : (1 2 ) 0 Excel的結果為: Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第492頁 13.64 計算 範例13.4 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第493頁 13.65 詮釋 範例13.4 檢定統計量的值(t =1.04) 與其 p- 值 (.1513) 指出只有 很少的證據可以支持主修財務者比主修行銷者獲得 較高薪資的假設。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第493頁 13.66 詮釋 範例13.4 注意我們有一些證據支持對立假設。 樣本平均數的差異為: x 1 x 2 = (65,624 -60,423) = 5,201 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第493頁 13.67 範例13.5 假設現在我們以下列的方式重做這項實驗。 我們檢視主修財務與主修行銷MBA 的成績單。 我們隨機選取平均成績(grade point average, GPA)介 於 3.92 與 4.0 之間(最多為 4)的一位主修財務者 與一位主修行銷者。 然後我們隨機選取平均成績介於於3.84 與 3.92 之間 的一位主修財務者與一位主修行銷者。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第493-494頁 13.68 範例13.5 我們持續這個程序直到第25 對的樣本點被抽出,其 GPA是落在2.0 與2.08 之間。 ( 畢業要求的最低GPA 是2.0。) 如同我們在範例13.4 中所執行的,我們記錄最高的 薪資。這些資料,與 GPA 群組,列於Xm13-05。 從這些資料我們是否可以結論主修財務者比主修行 銷者吸取較高的薪資? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第494頁 13.69 辨識方法 範例13.5 在範例 l3.4中描述的實驗是一個獨立樣本的設計。 也就是,一個樣本中的觀測值與第二個樣本中的觀 測值之間沒有關係存在。但是,在這個範例中的實 驗被設計為在一個樣本中的每一個觀測值與在另一 個樣本中的一個觀測值配對。這項配對是選擇具有 相似 GPA 的主修財務者與主修行銷者。因此,在每 一個配對組中比較不同主修的薪資是合理的。這類 的實驗稱為配對實驗(matched pairs experiment)。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第494頁 13.70 辨識方法 範例13.5 對每一個GPA 組,我們計算主修財務和行銷者薪資 之間的配對差異。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第494頁 13.71 辨識方法 範例13.5 下圖表黑字部分為原始的薪資資料(Xm13-05) ,藍字 部分為計算後的結果。 雖然一位學生不是主修財務就是 主修行銷(即獨立),但是資料 以這種方式群組使之成為配對實 驗(即,在群組#1的兩位學生是 根據他們的成績範圍被“配對”)。 平均數的差異=差異的平均數,所以我們可以認為「配對差異的平均數」 是我們感興趣的參數: Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.72 辨識方法 範例13.5 主修財務者比主修行銷者吸取較高的薪資? 對立假設為: H1: (我們的虛無假設為 H0: Copyright ©2010 Cengage Learning ) 第13章 兩個母體比較的推論 第494-495頁 13.73 D的檢定統計量 辨認方法 差異的母體平均數(μD)的檢定統計量為: 在差異是常態分配的前提下,它是具有自由度v =D -1的學生t 分配。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第495頁 13.74 計算 範例13.5 點選Data, Data Analysis,與 t-Test: Paired Two- Sample for Means Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.75 計算 範例13.5 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第496頁 13.76 詮釋 範例13.5 檢定統計量的值是 t = 3.81,具有.0004 的p- 值。現 在存在著壓倒性的證據去推論主修財務者比主修行 銷者獲得更高的薪資。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第497頁 13.77 範例13.6 μD信賴區間估計值 應用信賴區間的一般公式,我們可以推導出μD 的信 賴區間估計量: Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第497.498頁 13.78 檢查必要的條件 母體的差異被要求為常態分佈。 就如之前的作法, 我們藉著繪製差異的直方圖以檢視條件是否被滿足。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第500頁 圖13.6 13.79 必要條件的違背 假如差異是非常的非常態,我們不能採用D 的t- 檢 定。 但是我們能夠採用一個無母數方法──配對樣本的 Wilcoxon符號等級和檢定。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第500頁 13.80 獨立樣本或成對樣本:哪一種實驗設計比較好? 範例13.4 和範例13.5 展示實驗設計在統計推論上 是一項重要的因素。 但是,這兩個範例引起了數個有關實驗設計的問 題。 1. 為何配對實驗可導致主修財務者比主修行銷者得 到較高薪資的結論,然而獨立樣本實驗卻不能? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第498頁 13.81 獨立樣本或成對樣本:哪一種實驗設計比較好? 2. 我們是否應該總是使用配對樣本的實驗?是否有 使用上的缺點? 3. 當一個配對實驗被執行時,我們該如何辨識? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第498頁 13.82 獨立樣本或成對樣本:哪一種實驗設計比較好? 1. 在範例13.5 中執行的配對實驗可以降低資料的變 異性。 要了解這一點,檢查兩種樣本的統計量。在範例 13.4,我們發現 x1 - x2 =5,201。 在範例13.5,我們計算xD = 5,065。因此,兩個檢 定統計量。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第498頁 13.83 獨立樣本或成對樣本:哪一種實驗設計比較好? 因此,兩個檢定統計量的分子是非常相似的。 但是,因為標準誤的關係,範例13.5 的檢定統計 量比範例13.4 的檢定統計量大很多。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第498頁 13.84 獨立樣本或成對樣本:哪一種實驗設計比較好? 在範例13.4 中,我們計算 s 2p 311,330,926 2 s p 1 1 4,991 n1 n 2 範例13.5 產生 s D 6,647 sD 1,329 nD Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第498-499頁 13.85 獨立樣本或成對樣本:哪一種實驗設計比較好? 2. 配對實驗是否總是產生比獨立樣本實驗大的檢定 統計量?答案是,不一定。 假設對我們的範例,我們發現公司在決定該支付 MBA 畢業生多少薪資時,並不考慮GRA。 在這種情況,當與獨立樣本做比較時,配對實驗 並不會顯著地減少變異性。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第499頁 13.86 獨立樣本或成對樣本:哪一種實驗設計比較好? 3. 正如你所見,在本書中我們處理已被執行的實驗 所產生的問題。 因此,你的任務之一是決定適合的檢定統計量。 在比較兩個區間資料母體的個案中,你必須決定 是否樣本是獨立的(在這樣的個案中參數是1-2) 或配對的(在這樣的個案中參數是D)以選擇正確 的檢定統計量。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第499頁 13.87 獨立樣本或成對樣本:哪一種實驗設計比較好? 為了幫助你做這個判斷,我們建議你詢問並回答 下列問題: 是否有一些自然的關係存在於每一對觀測值之間, 它能夠提供一個合邏輯的理由去比較樣本l的第一 個觀測值與樣本 2 的第一個觀測值、樣本1的第二 個觀測值與樣本 2 的第二個觀測值,以此類推? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第499-500頁 13.88 發展對統計觀念的了解 1 本節應用了兩個在統計上最重要的原則。 第一個觀念是分析變異性的來源。在範例13.4 和範 例13.5 中,我們顯示藉由降低每一個樣本薪資之間 的變異性,能夠偵測出介於兩個主修之間的實際差 異。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第501頁 13.89 發展對統計觀念的了解 1 這是一個一般化分析資料程序的應用,將部分的變 異性歸屬於數個來源。 在範例13.5中,兩個變異性的來源是GPA 和MBA 的 主修。但是,我們對介於不同GPA 畢業生之間的變 異性並不感興趣。 取而代之,我們僅想要移除該變異來源,使得決定 主修財務者是否獲得較大的薪資支付更為容易。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第501頁 13.90 發展對統計觀念的了解1 在第14 章,我們將介紹一個稱為變異數分析 (analysis of variance) 的方法,如其名稱所建議的: 它分析變異性的來源,試圖去偵測真正的差異。 在這個程序大部分的應用中,我們將對每一個變異 性來源感興趣,而不是簡單地降低其中一個來源。 我們將這種過程稱為變異性的解釋(explaining the variation)。解釋變異性的觀念也應用於第16 至第17 章,在其中我們將介紹迴歸分析。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第501頁 13.91 發展對統計觀念的了解 2 第二個在本節中展示的原則是統計實作人員能夠設 計資料蒐集的程序,使得變異性的來源能夠被分析。 在執行範例13.5 中的實驗之前,統計實作人員懷疑 不同GPA 的畢業生之間有大的差異。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第501頁 13.92 發展對統計觀念的了解2 因此,實驗被安排來儘可能移除那些差異所造成的 影響。 我們也可能設計實驗讓我們更容易偵測出實際的差 異以及最小化資料蒐集的成本。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第501頁 13.93 辨識因素 辨識D 的t- 檢定和估計量的因素: 1. 問題目的:比較兩個母體。 2. 資料類型:區間。 3. 敘述性測量的類型:中央位置。 4. 實驗設計:成對樣本。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第501頁 13.94 兩母體變異數比值的推論 到目前為止我們已經看過中央位置測量的比較,稱為兩母體 的平均數。 當看到兩母體變異數,我們考慮變異數的比值,也就是,我 們感興趣的參數是: 這個統計量 的F 分配。 Copyright ©2010 Cengage Learning 服從自由度為ν1 = n1 - 1 和ν2 = n2 -1 第13章 兩個母體比較的推論 第503頁 13.95 兩母體變異數比值的推論 虛無假設永遠表達為 H0: (我們的虛無假設將永遠指向兩個母體的變異數是相 等的,因此,比值將會等於1。) 因此,我們的檢定統計量是: Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第505頁 13.96 範例13.7 在範例12.3 中,我們應用一個變異數的卡方檢定去 決定是否有足夠的證據去下結論說母體變異數小於 1.0。 假設統計實作人員也從另一個容器填充機蒐集資料, 並且記錄了一個隨機樣本的填充量。在5% 的顯著水 準下,我們是否可以推論第二部機器的一致性是比 較好的。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第505-506頁 13.97 辨識方法 範例13.7 問題之目的是要比較兩個母體,資料是區間的。 由於我們想要有關兩部機器一致性的資訊 · 我們想 要檢定的參數是σ12 / σ22,其中σ12 是機器 l 的變異數 而σ22是機器 2 的變異數。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第506頁 13.98 辨識方法 範例13.7 我們必須執行σ12 / σ22的 F - 檢定以決定是否母體 2 的變異數是小於母體 l 的變異數。 換言之,我們想要決定是否有足夠的證據去推論σ12 大於σ22。因此,我們檢定的假設為 H0: σ12 / σ22 = 1 H1: σ12 / σ22 > 1 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第506頁 13.99 計算 範例13.7 點選Data、Data Analysis,與F-Test Two-Sample for Variances。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.100 計算 範例13.7 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第506頁 13.101 詮釋 範例13.7 沒有足夠的證據去推論機器2 的變異數小於機器1 的 變異數。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第507頁 13.102 範例13.8 決定在範例13.7 中兩母體變異數比值的95% 信賴區 間估計量。 已知信賴區間估計量σ12 / σ22 為: Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第507頁 13.103 計算 範例13.8 開啟Estimators 工作簿中的F-Estimate_2 Variances 工作表,並且代入樣本變異數、樣本大小,以及信 賴水準。 我們估計 σ12 / σ22 落在.6164 和 3.1741之間。 注意 1 在這個區間之中。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第507-508頁 13.104 辨識因素 辨識的F- 檢定與估計量的因素: 1. 問題目的:比較兩個母體。 2. 資料類型:區間。 3. 敘述性測量的類型:變異性。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第508頁 13.105 兩母體比例差異的推論 我們現在將看看當資料是名目的(即:類別的)時候, 兩母體之間差異的推論。 當資料是名目的,唯一有意義的計算是計數每一種 類型發生的次數,以及計算比例。因此,在本節中 要被檢定的和估計的參數是兩母體比例之間的差異 p1–p2。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第509頁 13.106 統計量和抽樣分配 為了推論參數p1–p2,我們選取母體的樣本,計算樣 本比例並且看它們的差異 和 是p1–p2的一個不偏且一致的估計量。 我們將母體1計數成功 的次數標示為x1。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第510頁 和 13.107 抽樣分配 在樣本大小夠大的前提下,統計量 我們表達樣本大小的條件為 大於或等於5。 會近似於常態分配。 和 皆 平均數、變異數、標準誤分別是: 因此,變數 Copyright ©2010 Cengage Learning 是近似標準常態分配。 第13章 兩個母體比較的推論 第510-511頁 13.108 檢定和估計 因為母體比例(p1 & p2)未知,標準誤 是未知的。因此, 對於 的標準誤,我們有兩 種不同的估計量,取決於虛無假設。我們將在下一 頁看見案例。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第511頁 13.109 pˆ1 pˆ 2 的檢定統計量 有兩個案例可以考慮 公式1 假如虛無假設設定為 H0: ( p1 - p2) = 0 檢定統計量是 pˆ 是混和比例估計值 Copyright ©2010 Cengage Learning 公式2 假如虛無假設設定為 H0: ( p1 - p2) = D (D≠0) 檢定統計量為 它可以被表示為 第13章 兩個母體比較的推論 第512頁 13.110 範例13.9 General Products Company 製造與銷售各種家庭用品。 由於激烈的競爭,其產品之一──沐浴皂──的銷售 情形不佳。 為了改善銷售量,General Products 決定引進更具吸 引力的包裝。 這家公司的廣告代理商發展兩種新的設計。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第514頁 13.111 範例13.9 第一種設計以數種亮麗顏色為特色,與其他品牌做 區別。 第二種設計以淡綠色為底並僅僅印上該公司的商標。 為了檢定哪一種設計比較好,行銷經理選擇兩家超 市。 其中一家超市,香皂被包裝在使用第一種設計的盒 中,第二家超市則使用第二種設計。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第514頁 13.112 範例13.9 每一家超市的產品掃描機記錄一週之內的每一位香 皂購買者。 兩家超市記錄了五種在超市中銷售的香皂商品的條 碼後四位。 Xm13-09 General Products 品牌香皂的條碼是9077( 其他品牌 的條碼是4255、3745、7118,與8855)。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第514頁 13.113 範例13.9 在測試期間過後,掃描機的資料被轉換成電腦檔案。 由於第一種設計較昂貴,管理階層決定當有充分證 據讓他們下結論其為一種較佳的設計時才採用這種 設計。 管理階層應該轉換到亮麗顏色的設計或是簡單的綠 色設計? Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第514頁 13.114 辨識方法 範例13.9 問題之目的是比較兩個母體。第一個是在超市1 浴 皂銷售的母體,以及第二個是在超市2 浴皂銷售的 母體。 因為數值為「購買General Products 浴皂」與「購買 其他公司的浴皂」,所以資料為名目的。 這兩個因素告訴我們要檢定的參數是兩母體比例之 間的差異p1 – p2 ( 其中p1 與p2 分別代表General Products 品牌的浴皂在超市1 與超市2 中銷售的比例)。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第514頁 13.115 辨識方法 範例13.9 因為我們想要知道是否有足夠的證據去採用亮麗顏 色的設計,對立假設為 H1: (p1 – p2) > 0 虛無假設一定是 H0: (p1 – p2) = 0 這告訴我們這是一個公式1 的應用。因此,檢定統 (pˆ 1 pˆ 2 ) 計量為 z 1 1 ˆp(1 pˆ ) n n 2 1 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第514頁 13.116 計算 範例13.9 點選Add-Ins、Data Analysis Plus,與Z-Test : 2 Proportions。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.117 計算 範例13.9 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第515頁 13.118 詮釋 範例13.9 檢定統計量的值是z = 2.90;其 p- 值是.0019。有充 分的證據去推論亮麗顏色的設計比簡單的設計更受 歡迎。因此,建議管理階層可以轉換到第一種設計。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第516頁 13.119 範例13.10 假設在範例13.9 中,亮麗顏色設計的額外成本要求 它必須比簡單設計的銷售多3%。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第516頁 13.120 辨識方法 範例13.10 對立假設為 H1: (p1–p2) > .03 則虛無假設是H0: (p1–p2) = .03 由於虛無假設指定一個不為0 的差異,我 們將應用公式2 的檢定統計量。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第516頁 13.121 計算 範例13.10 點選Add-Ins、 Data Analysis Plus,與 Z-Test: 2 Proportions Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.122 計算 範例13.10 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第517頁 13.123 詮釋 範例13.10 並沒有充分的證據去推論購買亮麗顏色設計的香皂 顧客比例比購買簡單設計的香皂顧客比例高3%。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第517頁 13.124 信賴區間估計 參數為p1 – p2,以下列的信賴區間估計量來估計: 表達樣本大小的條件為 皆大於或等於 5。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第518頁 和 13.125 範例13.11 為了協助估計利潤的差異,在範例13.9 與範例13.10 中的行銷經理想要估計兩個比例之間的差異。建議 使用95% 的信賴水準。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第517頁 13.126 計算 範例13.11 點選Add-Ins、Data Analysis Plus,與Z-Estimates: 2 Proportions。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 13.127 計算 範例13.11 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第518頁 13.128 辨識因素 辨識p1 – p2 的z- 檢定與估計量的因素 1. 問題目的:比較兩個母體。 2. 資料類型:名目。 Copyright ©2010 Cengage Learning 第13章 兩個母體比較的推論 第520頁 13.129