估計 估計(estimation) • 估計(estimation): – Groupsamplingstatistics母群體真實的 值。 • 估計量(estimator): – 推估母體參數的統計量。 母體參數 ˆ 統計量 f x1 , x2 , x3 , xn E.
Download ReportTranscript 估計 估計(estimation) • 估計(estimation): – Groupsamplingstatistics母群體真實的 值。 • 估計量(estimator): – 推估母體參數的統計量。 母體參數 ˆ 統計量 f x1 , x2 , x3 , xn E.
估計 1 估計(estimation) • 估計(estimation): – Groupsamplingstatistics母群體真實的 值。 • 估計量(estimator): – 推估母體參數的統計量。 母體參數 ˆ 統計量 f x1 , x2 , x3 , xn E ˆ 2 估計 • 點估計(point estimation): – 由樣本資料求得估計量,推估未知的母群體參 數。 • 區間估計(interval estimation): – 兩個點構成區間,推估母體參數範圍。 3 點估計的性質 • 1.一致性(consistency): ˆ • 2.不偏性(unbiased): Biasˆ E ˆ • 3.有效性(efficiency):變異小 Var ˆ1 efficiency): R.E ˆ Var 2 1 • 相對有效性(relative • 費雪精確度(Fisher accuracy): 2 4 • 均方誤(mean square error) – 均方誤越小則為最佳估計量,同時考慮有效性與不偏 性。 2 2 ˆ ˆ ˆ ˆ MSE E Var Bias – 5 區間估計 p u 1 • 重複抽樣下,此區間我們有(1-α)%的信心 包含母群體參數。 – 信賴區間(confidence interval): – 信賴水準(confidence level):1-α – 信賴下限(lower limit of confidence): – 信賴上限(upper limit of confidence): 6 μ的信賴區間 P u 1 P Z Z Z 1 1 2 2 x Z 2 n • 信賴區間長度(越短)OR(越長)-越準確? • 信賴水準(1-α) (越小)OR(越大)-越準確? 7 • μ的信賴區間 – X為常態母群體之隨機分配,變異數σ2已知。 ( X Z 2 n , X Z 2 n ) • Example: – 查表Z0.025 ; Z0.975 : 8 • Example: P Z 2 Z Z 1 1 2 – 常態隨機變數X的標準差為15,隨機抽取25個樣本,得 樣本平均值為90,請估計以下的信賴區間: – 1. (1-α)=0.9 2. (1-α)=0.95 • Example: – 已知大專畢業生第一年月薪為常態分配,標準差為 1020元,若調查9位畢業生其平均薪資為25000元,請 估計大專畢業生第一年月薪的95%信賴區間。 9 • Example: – 假定某保險公司其投保人的母群體中抽出36位投保人, 其樣本年齡平均值為39.58歲,已知母群體標準差為7.2 歲,求母群體平均數的95%信賴區間。(37.23 , 41.93) • Example: – 欲估計某外商公司業務職員每週薪水,茲隨機抽取75 位員工,計算其每週平均薪資及標準差為227元及15元, 試計算平均薪資的90%信賴區間。(224.15 , 229.85) 10 • μ的信賴區間 – X為常態母群體之隨機分配,變異數σ2未知。 ( X t 2 n 1 S S , X t n 1 ) 2 n n • Example:(小樣本-t分配) – 自某班隨機抽出4個同學的統計成績,分別為64、66、 89、77,求全班同學平均成績的95%信賴區間。 (55.68 , 92.32) 11 • Example:(小樣本- t分配) – 某電子通信連鎖店欲估計某款手機的月平均銷售量,隨機抽取10 筆月銷售紀錄,樣本平均值為135.5,標準差為11.98,假設此款 手機銷售量為常態分配,求月平均量的90%信賴區間以及95%信 賴區間。 • 當樣本數大於30時,以t分配計算的結果與Z分配相似。 • Example: – 某電腦組裝工廠欲估計組裝一部電腦的平均時間,隨機抽取41台 的紀錄,計算出平均時間為18分鐘,標準差為1.8分鐘,假設組裝 時間為常態分配,請問μ的95%信賴區間 。t~(17.43,18.57) 12 • 母體比例信賴區間估計 – 估計某種特質在母群體中所佔的比例。 ( pˆ Z 2 pq , pˆ Z 2 n pq ) pˆ Z 2 n pˆ qˆ , pˆ Z 2 n pˆ qˆ n • 當樣本數很大時,P取代P或pˆ 取代p 所得結果很相近。 X pˆ n p E P P P P2 Var P P (1 P ) pq n n 13 • Example: – 自一批產品中抽出60個檢查,得9個為不良品,試求該 產品不良率90%信賴區間。(0.075 , 0.225) • Example: – 某生產線欲估計其不良率,隨機抽檢150個產品,其中 有六個為不良品,求不良率P的95%信賴區間。 (0.00864 , 0.0713) 14 樣本大小的決定 15 樣本大小的決定 • 母體參數區間估計 = 點估計量 + 抽樣誤差 • 抽樣誤差: – 估計值與母體參數真實值的最大誤差。此誤差小於或等於抽樣 誤差的機率約為(1-α)100% P ˆ e 1 – e = Z*點估計量標準誤 X Z Z 2 n 2 n X e e Z 2 n e 2 16 決定樣本大小的程序 • • • • 1.設定可忍受的誤差水準e。 2.設定信賴水準,查表得Z值。 3.計算n。 4.若非整數,取大於n之最小整數。 • Example: – 調查36名開車上學的大專學生,其車子的車齡平均為2.6年,標準 差0.3,請問需要多少樣本才能有95%的信心,使母體平均數與推 估值的誤差不超過0.05。(139) 17 • Example: – 欲了解每週平均修車理賠金額,隨機抽出20個 樣本,計算出樣本平均值為900,標準差為300, 請問虛要多少樣本才能有95%的信心確認μ的 估計值誤差不超過100。(35) 18 估計P所需要本數 X Z Z 2 2 P1 P X e n P1 P e n Z n 2 e 2 P1 P – 若母體P已知,直接帶入式子。 – 若母體P未知,則先隨機抽出樣本,計算 P 。 – 母體P未知,則以(1/2)*(1/2)為之,是最保守的 作法。 19 • Example: – 某衛生機構預估某城市患蛀牙的比例,若希望 誤差小於0.05的機率為0.98,則需要抽多少樣 本: • 1.根據過去經驗,平均機率P為0.3。(457) • 2.先抽出30人,得知蛀牙比例P為0.4。(522) • 3.不知道P值。(543) 20