Transcript 上課ppt
第八章 統計估計 學習目標 瞭解點估計的意義、估計的步驟與限制。 瞭解優良估計式的性質。 瞭解區間估計的意義。 瞭解大樣本與小樣本母體常態、變異數已知 與未知下,單一母體平均數區間估計的方 法。 知悉t分配的意義與機率值。 瞭解單一母體比例區間估計的方法。 瞭解單一母體變異數區間估計的方法。 瞭解卡方分配的意義與卡方值。 統計推論 統計推論(statistical inference)是我們從樣本中獲得關於母體的 資訊並且從中推導出結論的程序。 統計 資料 資訊 母體 Population 推論 樣 本 Sample Inference 參數 Parameter 統計量 Statistic 為了做推論, 我們需要敘述統計、機率分配及抽樣分配的技術和知識。 估計的概念 估計的目的是在樣本統計量的基礎上,決定一個 母體參數的近似值。 有兩種估計的類型: 點估計量 (point estimator) 區間估計量 (interval estimator) 點估計量 一個點估計量(point estimator) 藉著一個單一數 值或點來估計母體的未知參數,以對母體進行推 論。 先前看到連續分配的點機率幾乎是0。同樣地, 我們期望點估計量會依樣本量的增加而更接近參 數值。但是,點估計量沒有能力反映較大樣本的 效果。因此,我們將使用區間估計量(interval estimator)估計母體參數。 點估計量與區間估計量 假設一位統計學教授想要估計其商學院二年學生的平均 暑期收入。隨機選出25 位學生(n=25), 計算的樣本平均 週薪是$400。 點估計量 區間估計量 另一種說法: 二年級商學院學生暑期的平均週薪是介於$380 與$420 之 間。 點估計量品質 估計量品質是包括不偏性 (unbiasedness)、一致性 (consistency)、相對有效性(relative efficiency): 1. 不偏性 若估計式的平均數等於母體參數值,則該估計式為 不偏估計式(unbiased estimator) ,否則為偏誤估計式 (biased estimator) 。 即若 E (ˆ ) ,則 ˆ 為 的不偏估計式。 例:樣本平均數 X 與 S 2 n 1 (X n 1 i X) i 1 平均數 µ 與σ2的不偏估計式。 E(X ) E (S ) 2 2 2 分別是母體 點估計量品質 2. 一致性 一個不偏估計量被稱為是一致的(consistent),假如隨著樣本大 小的變大,估計量與參數間的差異會隨之變小。 ˆ 若 n 為不偏誤估計式或漸近不偏估計式,當 n ,其變異 數趨近於零,即 lim V (ˆn ) 0 n 則ˆn 為 的一致性估計式。 例: X 是 µ 的一個一致性估計量,因為: Var ( X ) X 2 n lim Var ( X ) lim n n 2 n 0 點估計量品質 3. 有效性 如果一個參數有兩個不偏估計量,變異數比較小的 那一個被稱為是相對的比較有效(relatively more efficient)。 ˆ 均為 的不偏誤估計式, 若 即 設ˆ 、ˆ Var (ˆ ) 1 ˆ Var (ˆ ) ˆ 為有效估計式。 則 ˆ 相對 ˆ 3. 相對有效性 例:樣本平均數 及樣本中位數Me都是母體平均數的不 偏估計值,然而,樣本中位數Me擁有比樣本平均數 更 大的變異數,所以我們選擇 ,因為與樣本中位數比較 , 其相對的比較有效。 因此,樣本平均數 是母體平均數 µ “最好/佳”估計值。 例1:估計式的相對有效性評斷標準 X 與Me的相對有效性 _ X的抽樣分配 Me的抽樣分配 _ E(Me)=E(X) 統計量 μ 母體參數 例2:不偏性、相對有效性 隨機變數 X 為一組以抽出放回的 方式,從母體 中 N ( , ) 隨機抽出的樣本, n 3 現以 ˆ 1 X 與 ˆ 1 ( X X ) 來估計μ , 1 , X 2 , , X n 2 n 1 1 n2 i i2 2 2 1 n 試比較此二估計式的不偏性、相對有效 性。 例2:不偏性、相對有效性 解: (1) 不偏性 E ( ˆ 1 ) E ( 1 n 1 n2 Xi) i2 E ( ˆ 2 ) E [ ˆ 1 與 1 ˆ 2 2 ( X 1 X n )] 1 n 1 n2 i2 1 2 E(X i) 1 n2 [ E ( X 1 ) E ( X n )] 皆為 之不偏估計式。 1 2 (n 2) ( ) 例2:不偏性、相對有效性 解: (2)相對有效性 V ( ˆ 1 ) V ( 1 n 1 n2 Xi) 1 ( n 2 ) (n 2) i2 (n 2) 2 1 n 1 1 2 2 V (X i ) i2 2 n2 1 2 V ( ˆ 2 ) V [ ( X 1 X n )] [V ( X 1 ) V ( X n )] 2 4 2 n=3 μ2相對μ1 具相對有效性 Var ( ˆ 1 ) Var ( ˆ 2 ) 2 n 2 n=4 μ1 與μ2 具相同的有效性 n>4 μ1 相對 μ2具相對有效性 例3:不偏性、一致性 隨機變數 X 1 , X 2 , , X n 為一組以抽出放回 的方式,從母體 中 N ( , 本,現以 S 2 1 n (X n 1 i 1 i X) 2 2 ) 隨機抽出的樣 估計σ2 ,試比較 此估計式的不偏性、一致性。 例3:不偏性、一致性 解: (1) 不偏性 n (X X) i i 1 已知 2 ~ n 1 , E ( n 1 ) n 1, V ( n 1 ) 2 ( n 1) 2 2 2 2 n (X E( ( n 1) S S 2 X ) i 1 2 ( n 1) S 2 ) n 1 E( S 2 2 2 ~ n 1 2 2 2 1 i ) ( n 1) 2 n 1 n (X n 1 i 1 i X) 2 為σ2 之不偏估計式。 2 例3:不偏性、一致性 解: (2)一致性 n 已知 (X i X ) 2 i 1 ~ n 1 , Var ( n 1 ) 2 ( n 1) 2 2 Var ( ( n 1) S 2 Var( S 2 2 ) 2 ( n 1) ) 2 ( n 1) lim Var ( S ) lim n S 1 2 ) Var ( n 1 ) 2 ( n 1) 4 ( n 1) 2 2 2 ~ n 1 2 4 Var( S 2 2 2 ( n 1) 又 2 ( n 1) S n 2 2 2 4 ( n 1) 4 n 1 0 n (X n 1 i 1 i X) 2 為σ2 之一致性估計式。 區間估計的意義 對未知的母體參數估計出一個上下限的區間,並指出該 區間包含母體參數的可靠度。 點估計量的值不會恰好等於母體參數值。 區間估計值 (interval estimate) 通常是由點估計值加或減 某個值求得,我們稱這個加減值是邊際誤差 (margin of error)。 信賴區間:是在一個既定的信賴水準下所構成的一個區間。 區間估計值的一般形式是: 點估計值 邊際誤差 信賴水準(信賴係數) :是指信賴區間包含母體參數的信 心(或稱可靠度)。 區間估計值可以讓我們瞭解:點估計值與母體參數值的 接近程度。 區間估計量 一個區間估計量(interval estimator)使用一個區間 來估計母體未知參數的值,以對母體進行推論。 這就是我們所說的 (有某些 ___% 確實性) 關注的 母體參數在下限及上限的範圍之間。 第一部份 3.單一母體平均數μ之估計 (一) 定義: (1) 設(X1,X2,. . . . . . ,Xn)為由母體f(x) 中抽出的n個隨機 樣本,若θ為此母體之參數,設T1、T2為兩個統計量, 使得 P( T1≦θ≦T2)=1-α 則稱(T1, T2) 為θ 的100(1-α) %信賴區間,而稱1-α為信賴度 (confidence level) (2) 若 為θ之估計式,若 P ( ˆ d ) 1 計θ的100(1-α)%誤差界限。 ,則稱d為以 ˆ 估 3.單一母體平均數μ之估計-點估計 (二) 點估計 (1)母體平均數μ之估計是最常見估計問題之一,且 一般皆以 X 來估計μ,也就是說取 X 為μ的估計 式,因此 X 為μ之點估計值。 (i)(重要!!) 當樣本數n已知,且n>30時,以 100(1-α)%誤差界限為 d z 2 n P ( ˆ d ) 1 ( 定義 ) (思考方式) P( X d ) 1 X 估計μ的 ∵大樣本n>30, 使用統計量 (推導) 以 z x / n x / n 進行估計μ 代入公式得到 P ( z / 2 P( z x / n x / n z / 2 ) 1 z / 2 ) 1 P x z / 2 1 n d z 2 n 為以 X 估計μ的100(1-α)%之誤差界限 3.單一母體平均數μ之估計-點估計 (ii)(重要!!)當樣本數n未定,但n>30時,若誤差界限d已 知,則樣本數為n為 (思考方式) 2 z 2 d d z n 2 d 2 2 (z ) 2 2 n 2 z n 2 d 2 2 3.單一母體平均數μ之估計-區間估計 (i) 大樣本,母體變異數 已知) 抽自任意母體且為大樣本時,當樣本數n>30且母體變 異數 已知,則使用統計量 (推導) P ( z / 2 P x z x / /2 n n Z X n 進行區間估計 z / 2 ) 1 x z /2 1 n 此時,母體平均數μ的100(1-α)%信賴區間為 X z / 2 n 或 ( X z /2 n , X z /2 n ) 3.單一母體平均數μ之估計-區間估計 (i) 大樣本,母體變異數 已知) 區間可以表示成 信賴下限 (Lower confidence limit) = x z / 2 n 信賴上限(Upper confidence limit) = x z /2 n 其中 機率1 – α 稱為信賴水準 ,為測量區間實際包含 µ 的機 率。 3.單一母體平均數μ之估計-區間估計 (ii) (大樣本,變異數 未知,且樣本數n>30) 當樣本數n>30且母體變異數 未知,可用S2來 取 代 σ2 ,則使用統計量 Z (推導) P ( z / 2 P x z S/ n X S 進行區間估計 n x S /2 n z / 2 ) 1 x z 1 n S /2 此時,母體平均數μ的100(1-α)%信賴區間為 X z / 2 S n 或 ( X z S /2 n , X z S /2 n ) 3.單一母體平均數μ之估計-區間估計 (iii) (母體為有限且採取不歸還抽樣) (a) 以 估計μ的100(1-α)%誤差界限為 N n N 1 n 2 d z 2 (b) 母體平均數μ的100(1-α)%信賴區間為 (X z 2 N n N 1 2 n , X z 2 N n N 1 2 n ) 3.單一母體平均數μ之估計-區間估計 (iv) (小樣本,變異數 未知,且樣本數n<30) 當樣本數n<30且母體變異數 未知,可用S2來 取 代 (推導) σ2 ,則使用統計量 t P ( t / 2 P x t x S / S / 2 ( n 1 ) n n X 進行區間估計 S n t / 2 ) 1 x t 1 n S / 2 此時,母體平均數μ的100(1-α)%信賴區間為 X t /2 S n 或 ( X t S /2 n , X t S /2 n ) 例 4. 大樣本 一家雜誌社欲知其讀者的平均年齡,以作為雜誌內容 走向的參考,根據其對訂閱戶抽查所得的讀者平均年 齡為36歲。 (a) 當樣本數為49,母體標準差為6歲,求該雜誌讀者平 均年齡的95%信賴區間。 解: ∵大樣本n=49>30,母體變異數σ2 已知 使用統計量 Z X 進行估計μ n ∴平均年齡μ的95%信賴區間 X z / 2 n 36 Z 0 . 025 6 49 ( 34 . 32 ~ 37 . 68 ) 例 4. 大樣本 (b)當樣本數為49,樣本標準差為6歲,求該雜誌讀者平 均年齡的95%信賴區間。 解: ∵大樣本n=49>30,母體變異數σ2 未知 使用統計量 Z X 進行估計μ S n ∴平均年齡μ的95%信賴區間 X z S /2 n 36 Z 0 . 025 6 49 ( 34 . 32 ~ 37 . 68 ) 例 4. 小樣本 (c)當樣本數為25,母體分配為常態,樣本標準差為6歲, 求該雜誌讀者平均年齡的95%信賴區間。 解: ∵小樣本n=25<30,母體變異數σ2 未知 使用統計量 t X 進行估計μ n 1 S n ∴平均年齡μ的95%信賴區間 X t / 2 S n 36 t 0 . 025 , 24 6 25 ( 33 . 5232 ~ 38 . 4768 ) 例 5. 小樣本,變異數σ 未知 為了檢驗某款迷你車的耗油量,經測試1公升 的油料所能行駛的里程數6次,分別是17.2、 16.5、17.5、17.7、16.1、15.9公里。若假設里 程數為常態分配,試求該款車1公升油料平均 所行駛之里程數的95%信賴區間。 例 5. 小樣本,變異數σ 未知 ∵小樣本n=6<30,母體變異數σ2 未知 解: 使用統計量 t n 1 X S n X 17 . 2 16 . 5 17 . 5 17 . 7 16 . 1 15 . 9 16 . 82 6 S 2 S X 2 i nX 2 n 1 S 2 1699 . 65 1697 . 47 0 . 5697 5 0 . 7548 ∴平均平均里程數μ的95%信賴區間 6 . 82 t 0 .025 , 5 0 . 7548 X t / 2 16 . 82 2 . 571 0 . 308 6 16 . 82 0 . 79 (16 . 03 ~ 17 . 61 ) S n 區間估計的準確度: 在信賴區間長度相同之下,信賴水準1- α越大 則準確度越大。 當信賴水準1-α相同時,信賴區間長度越短則 準確度越大。 信賴敘述的結論永遠是針對母體而不是樣本。 信賴水準1- α越大,則誤差界限越大。 報告誤差界限時,用95%的信賴水準是很普遍 的。 在同樣的信賴水準下,要求較小的誤差界限 時,只要增加樣本數就成了。 35 區間估計的準確度: 是非題 1. 點估計通常較區間估計更精確。 (X ) 點估計值估計母體參數時,可能完全正確或完全不 正確,且其估計正確的可靠度未知; 而區間估計的可靠度即信賴係數,故可知區間估計 的可靠度較點估計為佳。 36 區間估計的準確度: 是非題 2. 當母體變異數未知,但已知母體為常態分配 時,用Z分配與t分配所求得的母體平均數的 信賴區間的長度是一樣的。 (X Z分配信賴區間長度 t分配信賴區間長度 S 2Z ) n 2 S 2 t n 1, n 2 當樣本數 很大時 t n 1, 樣, t n 1, 但樣本數不很大時, 賴區間會較長 Z 2 2 ,兩個區間長度會一 Z 2 2 ,故用t分配求得的信 37 區間估計的準確度: 是非題 3. 信賴區間的長度與準確度隨信賴水準的增加 而增加。 (X ) 信賴水準的增加 信賴區間的長度增加 (Why?) 信賴區間的長度增加精確度減少 38 區間估計的準確度: 是非題 4. 若母體為常態分配,且母體變異數為已知, 當信賴水準不變時,母體平均數的信賴區間 長度隨樣本數的增加而變小。 (O ) 信賴區間長度 2Z 2 n 樣本數增加時,信賴區間長度 變小。 39 4.單一母體比例p之估計-點估計 (一) 點估計 樣本比率 pˆ X / n 為母體比率p之不偏估計量,且在 大樣本時, pˆ 之抽樣分配近似於常態。 因此,母體比例p之估計是最常見估計問題之一,且一 般皆以 pˆ 來估計p,也就是說取 pˆ 為p的不偏估計 pˆ 式,因此 為p之點估計值。 (i)(重要!!) 當樣本數n已知,且n>30時,以 pˆ 估計p 的100(1-α)%誤差界限為 z 2 pˆ (1 pˆ ) n ∵大樣本n>30, 使用統計量 (推導) 以 Z ˆ p p ˆ (1 p ˆ) p ˆ p p Z 進行估計p n p (1 p ) 代入公式得到 n P ( z / 2 pˆ p pˆ (1 pˆ ) z / 2 ) 1 P( pˆ p pˆ (1 pˆ ) /2 ) 1 n n P ( pˆ p z / 2 d z z pˆ (1 pˆ ) ) 1 n pˆ (1 pˆ ) /2 n 為以 pˆ 估計p的100(1-α)%之誤差界限 3.單一母體比例p之估計-點估計 (ii)(重要!!) 當樣本數n未定,但n>30時,若誤差界限d已 知,則求樣本數n之方法 2 (a) (b) z n 2 pˆ (1 pˆ ) d z 1 2 n 4 d ˆ 為樣本比例 p 2 p 無任何資訊 4.單一母體比例p之估計-區間估計 (i) 大樣本,抽自任意母體且為大樣本時,當樣本數 n>30 且若np ≥ 5且 n(1-p) ≥ 5) ,則使用統計量 進行區間估計 (推導) pˆ p pˆ (1 pˆ ) n pˆ p P ( z / 2 z pˆ (1 pˆ ) z / 2 ) 1 n P ( pˆ z / 2 pˆ (1 pˆ ) n p pˆ z / 2 pˆ (1 pˆ ) ) 1 n 此時,母體比例p的100(1-α)%信賴區間為 pˆ z pˆ (1 pˆ ) /2 n 或 ˆ z (p ˆ (1 p ˆ) p /2 n ˆ z , p ˆ (1 p ˆ) p /2 n ) 4.單一母體比例p之區間估計 例 6. 母體比例的區間估計 為了想瞭解女性高爾夫球員對高爾夫球課 程的看法,針對全美 900 位女性高爾夫球 員進行調查。調查結果發現,有 396 位女 性高爾夫球員對練習發球的次數感到滿 意,如此,對發球次數感到滿意的女性高 爾夫球員之母體比例的點估計為396/900= 0.44。 解: ∵大樣本n=900>30, 使用統計量 z pˆ p pˆ (1 pˆ ) 進行估計p n 其中 pˆ 396 0 . 44 900 ∴發球次數感到滿意的女性高爾夫球員之母體比例p的95%信賴 區間 pˆ z pˆ (1 pˆ ) /2 n 0 . 44 1 . 96 0 . 44 (1 0 . 44 ) 900 0 . 44 0 . 0324 ∴在 95% 的信賴水準下,母體比例p的區間估計為 (0.4076, 0.4724 )。 結論是:我們有 95% 的信心說,有 40.76% 至 47.24% 的 女性高爾夫球員對其練習發球的次數感到滿意。 例 7. 樣本數 某茶葉製造公司欲了解其在市場的佔有率,乃 在市場上進行抽樣調查。假設該公司要求樣本 比例與母體之誤差不能超過0.01,且有95%的 信賴度,則樣本數應為何? 例 7. 樣本數 解: ∵ p未知,故以 p=1/2代入, 可解得 ( Z ) P (1 P ) (1 . 96 ) 2 n 2 ( 0 . 01 ) 2 2 ( 0 . 01 ) 2 1 4 9 , 604 ∴故至少應選取9,604個樣本點。 5.單一母體變異數σ2之估計-點估計 (一) 點估計 樣本變異數 S 為為母體變異數σ2之 2 不偏估計量。 因此,母體變異數σ2之估計一般皆以 S 來估計σ2 ,也就是說取 S 為σ2 的不偏 2 估計式,因此 S 2 為σ2 之點估計值。 2 5.單一母體變異數σ2之估計-區間估計 隨機變數 X 1 , X 2 , , X 2 P( ( n 1) S 2 ( n 1) S 2 為一組從母體 中隨機抽出的樣 ( n 1) S 本,則使用統計量 P ( 1 n ~ 2 2 ( n 1 ) 進行σ2區間估計。 2 ) 1 2 2 2 ( n 1) S 2 2 2 2 ) 1 1 2 2 2 此時,母體變異數σ2的100(1-α)%信賴區間為 ( ( ( n 1) S 2 2 2 , ( n 1) S 1 2 2 2 ) 例 8.單一母體變異數σ2的區間估計 某部機器負責填充某種罐裝咖啡。如果填 充過程的變異數太大,表示機器失控則必 須送修。因此必須不斷地檢查填充過程的 變異數,測量隨機抽樣罐裝咖啡的體積並 且計算樣本變異數。一組3 0罐咖啡的隨機 樣本變異數估計 =18,540,計算母體變異數 σ2的95%信賴區間。 解: ( n 1) S 使用統計量 2 2 ~ 2 ( n 1 ) 進行σ2區間估計。 母體變異數σ2 的100(1-α)%信賴區間為 ( ( n 1) S 2 2 , 2 S 18,540 2 n 30 2 2 2 1 0 .975 , 29 16 . 0471 2 2 母體變異數σ2 的100(1-α)%信賴區間為 ( 2 2 2 , ( n 1) S 1 2 2 ) ( 29 18540 , 29 18540 45 . 7222 2 (11765 , 33604 ) 16 . 0471 2 2 2 ( n 1) S 1 d.f. n - 1 29 0 .025 , 29 45 . 7222 , 查表 ( n 1) S ) 2 ) 例 9. 單一母體變異數σ2的區間估計 S 2 n A B C D E 50 40 30 52 60 5 5 4 6 8 此樣本來自相同變異數的五個獨立常態母 體試求共同變異數σ2的95%信賴區間。 (X 2 令 SP X ) ( X 2 X ) ... ( X 5 X ) 2 1 2 n5 2 X ) ... ( X n ( X 1A X ) ( X 2 A 2 SA 2 ( X 1B X ) ( X 2 B 2 SB 2 n1 1 2 X ) ... ( X n 2 A 2 B X) 2 E X) ( Spooled Sample Variance ) 2 n2 1 ( X 1 E X ) ( X 2 E X ) ... ( X n 2 SE 2 1 X) 2 2 5 n5 1 ( n 5 ) S P ( n 1 1) S A ( n 2 1) S B .... ( n 5 1) S E 2 (n 5) S P 2 2 2 2 n5 ~ ( n 1 1) S A 2 2 2 n 2 1 1 2 ( n 2 1) S B 2 2 n2 ........ 1 ( n 5 1) S E 2 2 2 2 n 5 1 (n i 1) S i 2 解: (n 5) S p 2 i 4 50 4 40 3 30 5 52 7 60 1130 使用統計量 ( n 5) S P 2 2 ~ 2 (n5) 進行共同變異數σ2 區間估 計。 ( n 21的100(1-α)%信賴區間為 ) S p ( n 1) S p 母體共同變異數σ 2 ( 2 , 2 1 2 2 查表 2 0 .025 , 23 38 . 0757 , 2 ) 2 2 1 0 .975 , 23 11 . 6885 2 2 2 母體共同變異數σ2 的95%信賴區間為 ( (n 5) S 2 2 2 p (n 5) S , 1 2 2 p ) ( 1130 38 . 0757 , 1130 ) 11 . 6885 2 ( 29 . 6777 , 96 . 6762 ) 第二部份 6. 兩個母體平均數差μ1-μ2的估計 μ1 為母體2 的平均數,μ2 為母體2的平均數 由母體1抽出n1 個簡單隨機樣本,由母體2中抽 出n2 個簡單隨機樣本 兩個樣本的抽取彼此互相獨立,稱為獨立簡單 隨機樣本 兩母體之標準差σ1與σ2已知 n1 與 n2 均大於30 或兩母體近似常態分配 X X 之抽樣分配為一常態分配 1 2 6. 兩個母體平均數差μ1-μ2的估計 (1) (一) 點估計(σ 與σ 已知) 1 2 樣本平均數差 X 1 X 2 為母體平均數差μ1-μ2之不 偏估計量。 因此,母體平均數差μ1-μ2估計一般皆以統計量 Z ( X 1 X 2 ) (1 2 ) 1 2 。 來估計 n1 2 2 n2 6. 兩個母體平均數差μ1-μ2的估計 (1) (二)區間估計(σ 與σ 已知) 1 2 X1 X 2 兩母體平均數差μ1-μ2之點估計量 1 2 兩樣本平均數差 之的標準差 μ1-μ2之誤差界限為 z 2 1 2 n1 n1 2 2 n2 2 2 n2 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為 X1 X 2 z 2 12 n1 2 2 n2 例 10.兩母體平均數之差的估計:已知 σ1與 σ2 G百貨公司在水牛城有兩家分店,一家在市 區,另一家位於郊區的購物中心。現在假 定這位地區經理請我們替她分析這兩個地 點的顧客平均年齡是否確有差異。 將市區分店的顧客視為母體1,而郊區分店 的顧客為母體2。 例 10. 兩母體平均數之差的推論:已知 σ1與 σ2 依據前述之顧客人數作為統計研究的資料,兩 個母體標準差已知為 σ1=9歲與 σ2=10歲。由 Greystone顧客中蒐集到的兩個獨立簡單隨機 樣本的資料如下: 計算這兩個地點的顧客平均年齡差的95%信賴 區間。 解: ∵大樣本n1=36, n2=49>30且母體標準差σ1=9 , σ2=10已 知 ∴ 使用統計量 Z (X1 X 2 ) (1 2 ) 12 n1 進行估計μ1 - μ2 2 2 n2 ∴若使用95% 信賴水準,且 z/2=z0.025=1.96,我們可得 μ1 - μ2的95%信賴區間 X 1 X 2 z 12 2 40 35 1 . 96 5 4 . 06 ( 0 . 94 ~ 9 . 06 ) n1 2 2 n2 9 2 36 10 2 49 6. 兩個母體平均數差μ1-μ2的估計 (2) (一) 點估計(σ1與σ2未知,但n1 與 n2均為大樣本) 樣本平均數差X 1 X 為母體平均數差μ1-μ2之不 2 偏估計量。 由於σ1與σ2未知,但是n1 與 n2 (小於30)為小樣本,本, 此時可以 S 1 12 , S 2 22 。 2 2 因此,母體平均數差μ1-μ2估計一般皆以統計量 來估計。 Z (X1 X 2 ) (1 2 ) 2 S1 n1 2 S2 n2 6. 兩個母體平均數差μ1-μ2的估計 (2) (二)區間估計(σ1與σ2未知,但n1 與 n2均為大樣本) X1 X 2 兩母體平均數差μ1-μ2之點估計量 2 兩樣本平均數差 之的標準差 2 S1 2 n1 μ1-μ2之誤差界限為 S1 2 S1 n2 2 n1 2 n1 S2 n2 z 2 S2 S2 n2 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為 2 X1 X 2 z 2 S1 n1 2 S2 n2 6. 兩個母體平均數差μ1-μ2的估計(3) (一) 點估計(σ1與σ2未知,但σ1=σ2=σ且n1 與 n2為 小樣本) 樣本平均數差 X1 X 2 為母體平均數差μ1-μ2之不偏估計 量。 由於σ1與σ2未知,但是σ1=σ2=σ ,此時以 ( n 1 1) S 1 ( n 2 1) S 2 2 S 2 P 2 n1 n 2 2 2 因此,母體平均數差μ1-μ2估計一般皆以統計量 t 來估計。 t n1 1 n 2 2 ( X 1 X 2 ) (1 2 ) S 2 p n1 S 2 p n2 或 t n11 n 2 2 ( X 1 X 2 ) (1 2 ) Sp 1 n1 1 n2 6. 兩個母體平均數差μ1-μ2的估計(3) (二)區間估計(σ1與σ2未知,但σ1=σ2=σ且n1 與 n2為 小樣本) X1 X 兩母體平均數差μ1-μ2之點估計量 S 兩樣本平均數差 之的標準差 2 p S 2 1 n1 μ1-μ2之誤差界限為 t ,( n S n2 2 ) 2 2 p n2 2 p n1 S 2 p n2 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為 X1 X 2 t ,( n 2 S 1 n2 2 ) 2 p n1 S 2 p n2 例 11 .兩母體平均數之差的估計: σ1與σ2未 知,但σ1=σ2=σ 某政府單位想知道A與B家庭平均收入的差 異,已知兩母體變異數相等,抽查的結果 如下: A市 B市 樣本數 35 40 平均收入 401,800 388,000 標準差 20,000 22,000 計算這兩個地點的顧客平均年齡差的95% 信賴區間 解: ∵大樣本n1=36, n2=49>3且母體標準差σ1= σ2未知 ∴ 使用統計量 SP S 2 P ( 35 1) 20000 2 ( n 1 1) S ( n 2 1) S 2 1 2 2 n1 n 2 2 ( 40 1) 22000 2 2 21092 35 40 2 ∴大樣本n1=36, n2=49使用統計量 (X X 估計μ1-μ2 Z 1 Sp 2 ) (1 2 ) 1 n1 1 n2 解: 若使用95% 信賴水準,且 t/2=z0.025=1.96,我 們可得μ1 - μ2的95%信賴區間 X1 X 2 z 2 S 2 p n1 S 2 p n2 401 ,800 388 , 000 Z 0 . 025 S P 1 35 1 40 13 ,800 1 . 96 21 , 092 0 . 2315 13 ,800 9 , 568 . 42 ( 4 , 231 . 6 ~ 23 , 368 . 42 ) 6. 兩個母體平均數差μ1-μ2的估計 (4) (一) 點估計(σ1與σ2未知,但σ1=σ2 ≠ σ 且 n1 與 n2為小樣本) 樣本平均數差 X1 X 2 為母體平均數差μ1-μ2之不 偏估計量。 由於σ1與σ2未知,但是σ1=σ2 ≠ σ ,此時以 S1 1 2 2 S2 2 2 , 2 6. 兩個母體平均數差μ1-μ2的估計(4) (一) 點估計(σ1與σ2未知,但σ1=σ2 ≠ σ 且n1 與 n2為 小樣本) 母體平均數差μ1-μ2估計一般皆以統計量 t 來估計。 t (X 1 X 2 ) (1 2 ) 2 S1 2 n1 t/2 的自由度為 ν 一般無條件捨去取 整數值 S2 n2 s s n2 n1 2 1 df 2 2 2 2 s 1 s n1 1 n1 n2 1 n2 1 2 1 2 2 2 6. 兩個母體平均數差μ1-μ2的估計(4) (二)區間估計(σ1與σ2未知,但σ1=σ2 ≠ σ且n1 與 n2為 小樣本) X1 X 兩母體平均數差μ1-μ2之點估計量 2 μ1-μ2之誤差界限為 2 S1 兩樣本平均數差 之的標準差 t , n2 2 S2 2 n1 2 S2 n1 S1 2 n2 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為 2 X1 X 2 t , 2 S1 n1 2 S2 n2 例 12 .兩母體平均數之差的估計:σ1與σ2未知, 但σ1=σ2 ≠ σ 國家銀行正進行一項在其兩家分行的顧客支票 帳戶之平均差異的調查。Cherry Grove分行中 簡單隨機抽樣28個支票帳戶,Beechmont分行 亦獨立簡單隨機抽樣22個支票帳戶。每一個支 票帳戶的目前支票帳戶平均餘額均加以記錄。 帳戶平均餘額之摘要如下: 例 12.兩母體平均數之差的估計: σ1與σ2未 知,但σ1=σ2 ≠ σ Clearwater國家銀行欲估計Cherry Grove與 Beechmont顧客母體支票帳戶平均數之差異 的95%信賴區間估計。 解: Cherry Grove分行樣本資料顯示 n1=28,x1 =$1,025與 s1=$150,而Beechmont分行則 為 n2=22, x2 =$910, s2=$125。t/2 之自由 度計算如下: 解: 我們將非整數之自由度無條件捨去取整數值為 47,以獲得較大的 t值及較為保守的區間估計。 使用 t分配表與自由度47,可求得 t0.025,47= 2.012。 建立兩母體平均數之差的95%信賴區間如下: ∴ 兩母體平均數之差的95%信賴區間估計值為(37, 193)。 6.成對母體平均數差μ1-μ2的估計(5) μ1 為母體2 的平均數,μ2 為母體2的平均數 自母體中抽取元素,對同一元素蒐集實驗前後 兩個觀察值所構成的樣本稱為成對樣本(paired samples)。 成對樣本的母體彼此不互相獨立。 6.成對母體平均數差μ1-μ2的估計(5) 成對母體與成對樣本 成對差母體 成對母體 X1 X 2 D X1 X 2 1 D1 M M 1 X 11 X 21 M M N X 1N M X 2N N DN 抽 樣 抽 樣 1 D X1 X 2 X1 X2 X 11 X 21 1 D1 M M M n M n X 1n X 2n Dn D 1 X 11 X 21 , D 2 X 12 X 22 ,.... D n1 X 1 n X 2 n 6.成對母體平均數差μ1-μ2的估計(5) (一) 點估計(配對樣本) 令 D 1 X 11 X 21 , D 2 X 12 X 22 ,.... D n1 X 1 n X 2 n 則把(D1,D2,. . . . . . ,Dn)視為另一個由母體抽出的隨機 樣本 配對樣本平均數 D D 1 D 2 ..... D n n 不偏估計量。 D 2 (!!) E ( D ) D Var ( D ) D 2 n 為母體平均數差 μ1-μ2之 6. 成對母體平均數差統計量 成對母體平均數差 D 使用的統計量 大樣本母體變異數已知: Z D D D n 大樣本母體變異數未知: Z D D SD n 小樣本母體常態變異數已知: Z D D D n 小樣本母體常態變異數未知: t D D SD n 6. 成對母體平均數差的區間估計 (二)區間估計 成對母體平均數差 D 的信賴區間 大樣本變異數 D Z / 2 D 已知 式中: 大樣本變異數 D Z /2S D 2 D 2 D D D n 未知 式 中: S D SD n , SD 小 樣 本 母 體 分 配 為 常 態 分 配 , D Z / 2 D 2 D 已知 小 樣 本 母 體 分 配 為 常 態 分 配 , D t n 1 , / 2 S D 2 D 未知 D 2 ( D ) / n 2 n 1 。 例 13 .成對母體平均數差的區間估計 例13.成對母體平均數差的區間估計 例 13. 小樣本,變異數σ 未知 解: ∵小樣本n=7<30,母體變異數σ2 未知 使用統計量 t D D SD n E (D ) D D 1 .5 5 .4 3 .6 6 .9 5 .5 2 .7 2 .3 3 . 557 7 SD 2 SD X 2 i nX n 1 SD 2 2 7 . 7062 2 . 776 ∴使用前後平均體重差μ1-μ2 的95%信賴區間 3 . 557 t 0 .025 , 6 2 . 776 D t / 2 3 . 557 2 . 447 1 . 1333 6 3 . 557 2 . 773 ( 0 . 784 ~ 6 . 330 ) SD n 7.兩個母體比例差p1-p2的估計 樣本比例差 pˆ 1 pˆ 2 為母體比例差p1-p2之不偏估 計量。 獨立大樣本母體比例 pˆ 1 。 平均數 E ( pˆ pˆ ) 變異數 V a (rpˆ 1 pˆ 2 ) 1 2 pˆ 2 的抽樣分配 pˆ 1 pˆ 2 p p 2 pˆ 1 pˆ 2 1 式中: q1 1 p1 , q 2 1 p 2 。 p1 q1 n1 2 p2q2 n2 7.兩個母體比例差p1-p2的估計 兩個母體比例差p1-p2使用的統計量 大樣本母體比例P1, P2已知: Z pˆ 1 pˆ 2 ( p 1 p 2 ) p 1 (1 p 1 ) p 2 (1 p 2 ) n1 n2 大樣本母體變異數未知: Z pˆ 1 pˆ 2 ( p 1 p 2 ) pˆ 1 (1 pˆ 1 ) n1 Z pˆ 2 (1 pˆ 2 ) n2 pˆ 1 pˆ 2 ( p 1 p 2 ) 0 .5 ( 0 .5 ) n1 0 .5 ( 0 .5 ) n2 或 7. 兩個母體比例差p1-p2的區間估計 大樣本母體比例差的信賴區間 ( pˆ 1 pˆ 2 ) Z / 2 S pˆ 1 pˆ 2 式中: S pˆ 1 pˆ 2 pˆ 1 qˆ 1 pˆ 2 qˆ 2 n1 n2 母體比例差的信賴區間 ( pˆ 1 pˆ 2 ) Z / 2 S pˆ 1 pˆ 2 1 式中: S pˆ ˆ 1 p2 2 1 1 2 2 n1 1 2 n2 例 14.兩個母體比例差p1-p2的區間估計 某大城市中隨機抽120位的成年男子,其中有38位沒9抽 煙的習慣,又隨機抽出72位的成年女子,其中有51位沒 有抽煙的習慣。 (1) 估計此城市成年男子中與成年女子中沒有抽煙習慣的 比例差之95%誤差界限? ˆ1 p x1 n1 38 0 . 3167 ˆ2 p 120 Z 0 . 05 95%誤差界限= 1 . 96 pˆ 1 (1 pˆ 1 ) n1 x2 n2 51 0 . 7083 72 pˆ 2 (1 pˆ 2 ) n2 0 . 3167 (1 0 . 3167 ) 1 . 96 . 06836 0 . 1340 120 0 . 7083 (1 0 . 7083 ) 72 (2) 求此城市成年男子中與成年女子 沒有抽煙習慣的比例差之95%信賴區間? 解: ∴沒有抽煙習慣的比例差p1-p2 的95%信賴區間 pˆ 1 pˆ 2 Z 0 .05 pˆ 1 (1 pˆ 1 ) n1 0 . 3167 0 . 7083 0 . 1340 ( 0 . 5256 , 0 . 2576 ) pˆ 2 (1 pˆ 2 ) n2 8. 兩個母體變異數比的統計推論 2 2 S1 S2 1 2 2 2 2 的分配 2 S1 S2 2 1 2 2 2 12 2 2 S1 S 2 2 ~ F n1 1 , n 2 1 8. 兩個母體變異數比的統計推論 區間估計 2 使用統計量 F分配 2 S1 S2 2 1 2 2 2 12 2 2 S1 S 2 2 ~ F n1 1 , n 2 1 f (F ) F 1 , 2 0 F 1 , 2 ,1 / 2 F 1 , 2 , / 2 F 8. 兩個母體變異數比的統計推論 區間估計 母體變異數比的1-α信賴區間 S1 1 2 P ( F1 2 S 2 2 P( S1 S 2 2 2 2 S 2 2 2 F n 1 1 , n 2 1 , / 2 S1 F ) 1 1 2 1 2 2 2 2 1 F n 1 1 , n 2 1 , / 2 2 2 2 S1 S 1 2 2 2 2 2 1 F n 1 1 , n 2 1 ,1 / 2 2 ) 1 S1 S 2 2 1 F n1 1 , n 2 1 ,1 / 2 例 15.兩個母體變異數比的統計推論 已知學生的身高呈常態分配,但其平均數未知,今從某 大學隨機抽樣10名女生與9名男生,得其身高的標準差 分別為6公分與7公分。 (1) 試分別求女生與男生身高變異數的90%信賴區間。 單一母體變異數σ2的 ( 100(1-α)%信賴區間為 ( n 1) S 2 2 2 , ( n 1) S 1 2 2 ) 2 ( 女生身高變異數的90%信賴區間 (10 1) 36 (10 1) 36 324 324 ( , )( , ) (19 . 15 ~ 97 . 44 ) 2 2 16 . 9190 3 . 3251 9 , 0 .05 9 , 0 .95 例 15.兩個母體變異數比的統計推論 已知學生的身高呈常態分配,但其平均數未知,今從某 大學隨機抽樣10名女生與9名男生,得其身高的標準差 分別為6公分與7公分。 (1) 試分別求女生與男生身高變異數的90%信賴區間。 單一母體母體變異數σ2的 ( ( n 1) S 100(1-α)%信賴區間為 2 2 2 , ( n 1) S 1 2 2 ) 2 ( 男生身高變異數的90%信賴區間 ( ( 9 1) 49 ( 9 1) 49 392 392 , ) ( , ) ( 25 . 28 ~ 143 . 45 ) 2 2 15 . 5073 2 . 7326 8 , 0 .05 8 , 0 .95 例 15.兩個母體變異數比的統計推論 已知學生的身高呈常態分配,但其平均數未知,今從某 大學隨機抽樣10名女生與9名男生,得其身高的標準差 分別為6公分與7公分。 (1) 試分別求女生與男生身高變異數的90%信賴區間。 母體變異數σ2的100(1-α)%信賴區間為 ( ( ( n 1) S 2 2 2 , ( n 1) S 1 2 2 ) 2 男生身高變異數的90%信賴區間 ( ( 9 1) 49 ( 9 1) 49 392 392 , ) ( , ) ( 25 . 28 ~ 143 . 45 ) 2 2 15 . 5073 2 . 7326 8 , 0 .05 8 , 0 .95 已知學生的身高呈常態分配,但其平均數未知,今從某 大學隨機抽樣10名女生與9名男生,得其身高的標準差 分別為6公分與7公分。 (2) 試分別求女生對男生身高變異數比與標準差比的90% 信賴區間。 1 2 兩個母體變異數比 2 S1 2 2 2 的100(1-α)%信賴區間為 1 F n 1 1 , n 2 1 , S2 12 / 2 1 2 2 2 S1 2 S2 1 F n 1 1 , n 2 1 ,1 2 女生對男生身高變異數比 36 ( 49 2 2 的90%信賴區間 36 , 49 )( 0 . 7347 F 9 , 8 , 0 .05 F 9 , 8 , 0 .95 女生對男生身高標準差 3 . 39 1 , 0 . 7347 ) ( 0 . 217 ~ 2 . 37 ) 1 3 . 23 的90%信賴區間 2 ( 0 . 217 , 2 . 37 ) ( 0 . 4658 , 1 . 539 ) / 2