估計 估計(estimation) • 估計(estimation): – Groupsamplingstatistics母群體真實的 值。 • 估計量(estimator): – 推估母體參數的統計量。   母體參數 ˆ  統計量  f x1 , x2 , x3 , xn   E.

Download Report

Transcript 估計 估計(estimation) • 估計(estimation): – Groupsamplingstatistics母群體真實的 值。 • 估計量(estimator): – 推估母體參數的統計量。   母體參數 ˆ  統計量  f x1 , x2 , x3 , xn   E.

估計
1
估計(estimation)
• 估計(estimation):
– Groupsamplingstatistics母群體真實的
值。
• 估計量(estimator):
– 推估母體參數的統計量。
  母體參數
ˆ  統計量  f x1 , x2 , x3 , xn 

E ˆ  
2
估計
• 點估計(point estimation):
– 由樣本資料求得估計量,推估未知的母群體參
數。
• 區間估計(interval estimation):
– 兩個點構成區間,推估母體參數範圍。
3
點估計的性質
• 1.一致性(consistency): ˆ  
• 2.不偏性(unbiased): Biasˆ  E ˆ  
• 3.有效性(efficiency):變異小
 
  
 
 Var ˆ1
efficiency): R.E  
ˆ
Var

2

1
• 相對有效性(relative
• 費雪精確度(Fisher accuracy):
2
4
• 均方誤(mean square error)
– 均方誤越小則為最佳估計量,同時考慮有效性與不偏
性。
2
2


ˆ
ˆ
ˆ
ˆ










MSE


E




Var


Bias

–


5
區間估計
p    u   1  
• 重複抽樣下,此區間我們有(1-α)%的信心
包含母群體參數。
– 信賴區間(confidence interval):
– 信賴水準(confidence level):1-α
– 信賴下限(lower limit of confidence):
– 信賴上限(upper limit of confidence):
6
μ的信賴區間
P    u   1  
P Z   Z  Z 1   1  
2 
 2


 
 x  Z 

2
n

• 信賴區間長度(越短)OR(越長)-越準確?
• 信賴水準(1-α) (越小)OR(越大)-越準確?
7
• μ的信賴區間
– X為常態母群體之隨機分配,變異數σ2已知。
( X  Z

2
n
, X  Z

2
n
)
• Example:
– 查表Z0.025 ; Z0.975 :
8

• Example: P Z

2
 Z  Z 1   1  
2 
– 常態隨機變數X的標準差為15,隨機抽取25個樣本,得
樣本平均值為90,請估計以下的信賴區間:
– 1. (1-α)=0.9
2. (1-α)=0.95
• Example:
– 已知大專畢業生第一年月薪為常態分配,標準差為
1020元,若調查9位畢業生其平均薪資為25000元,請
估計大專畢業生第一年月薪的95%信賴區間。
9
• Example:
– 假定某保險公司其投保人的母群體中抽出36位投保人,
其樣本年齡平均值為39.58歲,已知母群體標準差為7.2
歲,求母群體平均數的95%信賴區間。(37.23 , 41.93)
• Example:
– 欲估計某外商公司業務職員每週薪水,茲隨機抽取75
位員工,計算其每週平均薪資及標準差為227元及15元,
試計算平均薪資的90%信賴區間。(224.15 , 229.85)
10
• μ的信賴區間
– X為常態母群體之隨機分配,變異數σ2未知。
( X  t
2
 n 1
S
S
, X  t n 1
)
2
n
n
• Example:(小樣本-t分配)
– 自某班隨機抽出4個同學的統計成績,分別為64、66、
89、77,求全班同學平均成績的95%信賴區間。
(55.68 , 92.32)
11
• Example:(小樣本- t分配)
– 某電子通信連鎖店欲估計某款手機的月平均銷售量,隨機抽取10
筆月銷售紀錄,樣本平均值為135.5,標準差為11.98,假設此款
手機銷售量為常態分配,求月平均量的90%信賴區間以及95%信
賴區間。
• 當樣本數大於30時,以t分配計算的結果與Z分配相似。
• Example:
– 某電腦組裝工廠欲估計組裝一部電腦的平均時間,隨機抽取41台
的紀錄,計算出平均時間為18分鐘,標準差為1.8分鐘,假設組裝
時間為常態分配,請問μ的95%信賴區間 。t~(17.43,18.57)
12
• 母體比例信賴區間估計
– 估計某種特質在母群體中所佔的比例。
( pˆ  Z 
2
pq
, pˆ  Z 
2
n

pq
)   pˆ  Z 
2
n

pˆ qˆ
, pˆ  Z 
2
n
pˆ qˆ 

n 
• 當樣本數很大時,P取代P或pˆ 取代p 所得結果很相近。
X
 pˆ
n
 p  E P   P
P
 P2  Var P  
P (1  P ) pq

n
n
13
• Example:
– 自一批產品中抽出60個檢查,得9個為不良品,試求該
產品不良率90%信賴區間。(0.075 , 0.225)
• Example:
– 某生產線欲估計其不良率,隨機抽檢150個產品,其中
有六個為不良品,求不良率P的95%信賴區間。
(0.00864 , 0.0713)
14
樣本大小的決定
15
樣本大小的決定
• 母體參數區間估計 = 點估計量 + 抽樣誤差
• 抽樣誤差:
– 估計值與母體參數真實值的最大誤差。此誤差小於或等於抽樣
誤差的機率約為(1-α)100%


P ˆ    e  1  
– e = Z*點估計量標準誤
X  Z
Z


2
n
2
n
X e
e
 Z 
2
n
 e





2
16
決定樣本大小的程序
•
•
•
•
1.設定可忍受的誤差水準e。
2.設定信賴水準,查表得Z值。
3.計算n。
4.若非整數,取大於n之最小整數。
• Example:
– 調查36名開車上學的大專學生,其車子的車齡平均為2.6年,標準
差0.3,請問需要多少樣本才能有95%的信心,使母體平均數與推
估值的誤差不超過0.05。(139)
17
• Example:
– 欲了解每週平均修車理賠金額,隨機抽出20個
樣本,計算出樣本平均值為900,標準差為300,
請問虛要多少樣本才能有95%的信心確認μ的
估計值誤差不超過100。(35)
18
估計P所需要本數
X  Z
Z
2
2
P1  P 
X e
n
P1  P 
e
n
 Z
n 2
 e

2

  P1  P 


– 若母體P已知,直接帶入式子。
– 若母體P未知,則先隨機抽出樣本,計算 P 。
– 母體P未知,則以(1/2)*(1/2)為之,是最保守的
作法。
19
• Example:
– 某衛生機構預估某城市患蛀牙的比例,若希望
誤差小於0.05的機率為0.98,則需要抽多少樣
本:
• 1.根據過去經驗,平均機率P為0.3。(457)
• 2.先抽出30人,得知蛀牙比例P為0.4。(522)
• 3.不知道P值。(543)
20