上課ppt

Transcript 上課ppt

第八章統計估計
學習目標
 瞭解點估計的意義、估計的步驟與限制。
 瞭解優良估計式的性質。
 瞭解區間估計的意義。
 瞭解大樣本與小樣本母體常態、變異數已知
與未知下，單一母體平均數區間估計的方
法。
 知悉t分配的意義與機率值。
 瞭解單一母體比例區間估計的方法。
 瞭解單一母體變異數區間估計的方法。
 瞭解卡方分配的意義與卡方值。
統計推論
統計推論(statistical inference)是我們從樣本中獲得關於母體的
資訊並且從中推導出結論的程序。
統計
資料
資訊
母體
Population
推論
樣
本
Sample
Inference
參數
Parameter
統計量
Statistic
為了做推論，我們需要敘述統計、機率分配及抽樣分配的技術和知識。
估計的概念
估計的目的是在樣本統計量的基礎上，決定一個
母體參數的近似值。
有兩種估計的類型：
點估計量
(point estimator)
區間估計量
(interval estimator)
點估計量
一個點估計量(point estimator) 藉著一個單一數
值或點來估計母體的未知參數，以對母體進行推
論。
先前看到連續分配的點機率幾乎是0。同樣地，
我們期望點估計量會依樣本量的增加而更接近參
數值。但是，點估計量沒有能力反映較大樣本的
效果。因此，我們將使用區間估計量(interval
estimator)估計母體參數。
點估計量與區間估計量
假設一位統計學教授想要估計其商學院二年學生的平均
暑期收入。隨機選出25 位學生(n=25)，計算的樣本平均
週薪是$400。
點估計量
區間估計量
另一種說法：
二年級商學院學生暑期的平均週薪是介於$380 與$420 之
間。
點估計量品質
 估計量品質是包括不偏性 (unbiasedness)、一致性
(consistency)、相對有效性(relative efficiency)：
1. 不偏性
 若估計式的平均數等於母體參數值，則該估計式為
不偏估計式(unbiased estimator) ，否則為偏誤估計式
(biased estimator) 。
 即若 E (ˆ )   ，則 ˆ 為  的不偏估計式。
 例：樣本平均數 X 與 S
2

n
1
(X

n 1
i
 X)
i 1
平均數 µ 與σ2的不偏估計式。
E(X )  
E (S )  
2
2
2
分別是母體
點估計量品質
2. 一致性
 一個不偏估計量被稱為是一致的(consistent)，假如隨著樣本大
小的變大，估計量與參數間的差異會隨之變小。
ˆ
 若  n 為不偏誤估計式或漸近不偏估計式，當 n   ，其變異
數趨近於零，即
lim V (ˆn )  0
n 
則ˆn 為  的一致性估計式。
例： X 是 µ 的一個一致性估計量，因為：
 Var ( X )  
X
2
n
lim Var ( X )  lim 
n 
n 
2
n
 0
點估計量品質
3. 有效性
 如果一個參數有兩個不偏估計量，變異數比較小的
那一個被稱為是相對的比較有效(relatively more
efficient)。
ˆ 均為 的不偏誤估計式，若
 即設ˆ 、ˆ
Var (ˆ )
1
ˆ
Var (ˆ )
ˆ 為有效估計式。
則 ˆ 相對 ˆ
3. 相對有效性
例：樣本平均數及樣本中位數Me都是母體平均數的不
偏估計值，然而，樣本中位數Me擁有比樣本平均數更
大的變異數，所以我們選擇，因為與樣本中位數比較
，其相對的比較有效。
因此，樣本平均數是母體平均數 µ “最好/佳”估計值。
例1：估計式的相對有效性評斷標準
X 與Me的相對有效性
＿
X的抽樣分配
Me的抽樣分配
＿
E(Me)=E(X)
統計量
μ
母體參數
例2：不偏性、相對有效性
 隨機變數 X
為一組以抽出放回的
方式，從母體中 N (  ,  ) 隨機抽出的樣本， n  3
現以 ˆ  1  X 與 ˆ  1 ( X  X ) 來估計μ ，
1
, X 2 , , X
n
2
n 1
1
n2
i
i2
2
2
1
n
試比較此二估計式的不偏性、相對有效
性。

例2：不偏性、相對有效性
解: (1) 不偏性
E ( ˆ 1 )  E (
1
n 1

n2
Xi) 
i2
E ( ˆ 2 )  E [

ˆ 1
與
1
ˆ 2
2
( X 1  X n )] 
1
n 1

n2
i2
1
2
E(X i) 
1
n2
[ E ( X 1 )  E ( X n )] 
皆為之不偏估計式。
1
2
(n  2)  
(   )  

例2：不偏性、相對有效性
解: (2)相對有效性
V ( ˆ 1 )  V (
1
n 1

n2
Xi) 
1
( n  2 )
(n  2)
i2

(n  2)
2
1
n 1
1
2

2

 V (X
i
)
i2
2
n2

1
2
V ( ˆ 2 )  V [ ( X 1  X n )]  [V ( X 1 )  V ( X n )] 
2
4
2

n=3
μ2相對μ1 具相對有效性
Var ( ˆ 1 )
Var ( ˆ 2 )

2
n  2
n=4
μ1 與μ2 具相同的有效性
n>4
μ1 相對 μ2具相對有效性
例3：不偏性、一致性
 隨機變數
X 1 , X 2 , , X
n
為一組以抽出放回
的方式，從母體中 N (  , 
本，現以 S
2

1
n
(X

n 1
i 1
i
 X)
2
2
)
隨機抽出的樣
估計σ2 ，試比較
此估計式的不偏性、一致性。

例3：不偏性、一致性
解: (1) 不偏性
n
 (X
 X)
i
i 1
已知
2
~  n 1 , E (  n 1 )  n  1, V (  n 1 )  2 ( n  1)
2

2
2
2
n
 (X

E(

( n  1) S

S
2

 X )
i 1

2

( n  1) S

2
)  n  1  E( S
2
2
2
~  n 1
2
2
2
1
i
)  ( n  1) 

2
n 1
 
n
 (X
n 1
i 1
i
 X)
2
為σ2 之不偏估計式。
2

例3：不偏性、一致性
解: (2)一致性
n

已知
(X i  X )
2
i 1
~  n 1 , Var (  n 1 )  2 ( n  1)
2

2
Var (

( n  1) S

2
Var( S
2
2
)  2 ( n  1)
)  2 ( n  1)
 lim Var ( S )  lim
n 

S

1
2
)  Var (  n  1 )  2 ( n  1)

4
( n  1)
2
2
2
~  n 1
2
4
 Var( S

2
2
2
( n  1)

又
2
( n  1) S
n 
2
2

2
4
( n  1)
4
n 1
 0
n
(X

n 1
i 1
i
 X)
2
為σ2 之一致性估計式。
區間估計的意義
 對未知的母體參數估計出一個上下限的區間，並指出該
區間包含母體參數的可靠度。
 點估計量的值不會恰好等於母體參數值。
 區間估計值 (interval estimate) 通常是由點估計值加或減
某個值求得，我們稱這個加減值是邊際誤差 (margin of
error)。
 信賴區間：是在一個既定的信賴水準下所構成的一個區間。
區間估計值的一般形式是：
點估計值 邊際誤差
 信賴水準(信賴係數) ：是指信賴區間包含母體參數的信
心(或稱可靠度)。
 區間估計值可以讓我們瞭解：點估計值與母體參數值的
接近程度。
區間估計量
一個區間估計量(interval estimator)使用一個區間
來估計母體未知參數的值，以對母體進行推論。
這就是我們所說的 (有某些 ___% 確實性) 關注的
母體參數在下限及上限的範圍之間。
第一部份
3.單一母體平均數μ之估計
(一) 定義：
(1) 設(X1，X2，. . . . . . ，Xn)為由母體f(x) 中抽出的n個隨機
樣本，若θ為此母體之參數，設T1、T2為兩個統計量，
使得 P( T1≦θ≦T2)=1-α
則稱(T1, T2) 為θ 的100(1-α) %信賴區間，而稱1-α為信賴度
(confidence level)
(2) 若為θ之估計式，若
P ( ˆ    d )  1  
計θ的100(1-α)%誤差界限。
，則稱d為以 ˆ 估
3.單一母體平均數μ之估計-點估計
(二) 點估計
(1)母體平均數μ之估計是最常見估計問題之一，且
一般皆以 X 來估計μ，也就是說取 X 為μ的估計
式，因此 X 為μ之點估計值。
(i)（重要!!）當樣本數n已知，且n>30時，以
100(1-α)%誤差界限為
d  z 
2

n
P ( ˆ    d )  1   ( 定義 )
(思考方式)
 P( X    d )  1  
X
估計μ的
∵大樣本n>30，使用統計量
(推導) 以 z 
x 
 /
n
x  
 /
n
進行估計μ
代入公式得到
 P ( z / 2 
 P(
z 
x
/ n
x 
 /
n
 z / 2 )  1  
 z / 2 )  1  

 
 P  x    z  / 2
  1  
n

d  z 
2

n
為以
X
估計μ的100(1-α)%之誤差界限
3.單一母體平均數μ之估計-點估計
(ii)（重要!!）當樣本數n未定，但n>30時，若誤差界限d已
知，則樣本數為n為
(思考方式)
2
 z
 2
 d


 



 d  z 
n
2
d
2
2
 (z )
2
2
n
2
 z
n   2
 d







2

2
3.單一母體平均數μ之估計-區間估計
(i) 大樣本，母體變異數已知)
抽自任意母體且為大樣本時，當樣本數n>30且母體變
異數已知，則使用統計量
(推導)
 P ( z / 2 

 P
 x  z

x 
 /

/2
n
n
Z 
X  

n
進行區間估計
 z / 2 )  1  
   x  z

/2


 1 
n 
此時，母體平均數μ的100(1-α)%信賴區間為
X  z / 2 

n
或
( X  z

/2
n
, X  z

/2
n
)
3.單一母體平均數μ之估計-區間估計
(i) 大樣本，母體變異數已知)
區間可以表示成
信賴下限 (Lower confidence limit) =
 

 x  z / 2

n 

信賴上限(Upper confidence limit) =
 

x

z


 /2
n 

其中機率1 – α 稱為信賴水準，為測量區間實際包含 µ 的機
率。
3.單一母體平均數μ之估計-區間估計
(ii) (大樣本，變異數未知，且樣本數n>30)
當樣本數n>30且母體變異數未知，可用S2來取
代
σ2 ，則使用統計量 Z
(推導)  P (  z  / 2 

 P
 x  z

S/
n
X  
S
進行區間估計
n
x 
S
/2

n
 z / 2 )  1  
   x  z


 1 
n 
S
/2
此時，母體平均數μ的100(1-α)%信賴區間為
X  z / 2 
S
n
或
( X  z
S
/2
n
, X  z
S
/2
n
)
3.單一母體平均數μ之估計-區間估計
(iii) (母體為有限且採取不歸還抽樣)
(a) 以估計μ的100(1-α)%誤差界限為
N n 

N 1 n
2
d  z 
2
(b) 母體平均數μ的100(1-α)%信賴區間為
(X  z 
2
N  n
N 1


2
n
, X  z 
2
N  n
N 1


2
n
)
3.單一母體平均數μ之估計-區間估計
(iv) (小樣本，變異數未知，且樣本數n<30)
當樣本數n<30且母體變異數未知，可用S2來取
代
(推導)
σ2 ，則使用統計量 t
 P ( t / 2 

 P
 x  t

x 
S /
S
/ 2
( n 1 )
n
n

X  
進行區間估計
S
n
 t / 2 )  1  
   x  t


 1  
n 
S
/ 2
此時，母體平均數μ的100(1-α)%信賴區間為
X  t
/2

S
n
或
( X  t
S
/2
n
, X  t
S
/2
n
)
例 4. 大樣本
 一家雜誌社欲知其讀者的平均年齡，以作為雜誌內容
走向的參考，根據其對訂閱戶抽查所得的讀者平均年
齡為36歲。
(a) 當樣本數為49，母體標準差為6歲，求該雜誌讀者平
均年齡的95%信賴區間。
解： ∵大樣本n=49>30，母體變異數σ2 已知
使用統計量
Z 
X 
進行估計μ

n
∴平均年齡μ的95%信賴區間
X  z

/ 2
n
 36  Z 0 . 025
6
49
 ( 34 . 32 ~ 37 . 68 )
例 4. 大樣本
(b)當樣本數為49，樣本標準差為6歲，求該雜誌讀者平
均年齡的95%信賴區間。
解：
∵大樣本n=49>30，母體變異數σ2 未知
使用統計量 Z  X   進行估計μ
S
n
∴平均年齡μ的95%信賴區間
X  z
S
/2
n
 36  Z 0 . 025
6
49
 ( 34 . 32 ~ 37 . 68 )
例 4. 小樣本
(c)當樣本數為25，母體分配為常態，樣本標準差為6歲，
求該雜誌讀者平均年齡的95%信賴區間。
解：
∵小樣本n=25<30，母體變異數σ2 未知
使用統計量 t  X   進行估計μ
n 1
S
n
∴平均年齡μ的95%信賴區間
X  t / 2
S
n
 36  t 0 . 025 , 24
6
25
 ( 33 . 5232 ~ 38 . 4768 )
例 5. 小樣本，變異數σ 未知
 為了檢驗某款迷你車的耗油量，經測試1公升
的油料所能行駛的里程數6次，分別是17.2、
16.5、17.5、17.7、16.1、15.9公里。若假設里
程數為常態分配，試求該款車1公升油料平均
所行駛之里程數的95％信賴區間。
例 5. 小樣本，變異數σ 未知
∵小樣本n=6<30，母體變異數σ2 未知
解：
使用統計量
t n 1 
X 
S
n
X 
17 . 2  16 . 5  17 . 5  17 . 7  16 . 1  15 . 9
 16 . 82
6
S
2

S 

X
2
i
 nX
2
n 1
S
2

1699 . 65  1697 . 47
 0 . 5697
5
 0 . 7548
∴平均平均里程數μ的95%信賴區間
6 . 82  t 0 .025 , 5
0 . 7548
X  t / 2
 16 . 82  2 . 571  0 . 308
6
 16 . 82  0 . 79  (16 . 03 ~ 17 . 61 )
S
n
區間估計的準確度：
 在信賴區間長度相同之下，信賴水準1- α越大
則準確度越大。
 當信賴水準1-α相同時，信賴區間長度越短則
準確度越大。
 信賴敘述的結論永遠是針對母體而不是樣本。
 信賴水準1- α越大，則誤差界限越大。
 報告誤差界限時，用95%的信賴水準是很普遍
的。
 在同樣的信賴水準下，要求較小的誤差界限
時，只要增加樣本數就成了。
35
區間估計的準確度：
 是非題
1. 點估計通常較區間估計更精確。
(X
)
 點估計值估計母體參數時，可能完全正確或完全不
正確，且其估計正確的可靠度未知；
 而區間估計的可靠度即信賴係數，故可知區間估計
的可靠度較點估計為佳。
36
區間估計的準確度：
 是非題
2. 當母體變異數未知，但已知母體為常態分配
時，用Z分配與t分配所求得的母體平均數的
信賴區間的長度是一樣的。 (X
 Z分配信賴區間長度
 t分配信賴區間長度
S
2Z 
)
n
2
S
2 t n 1，
n
2
 當樣本數很大時 t n 1， 
樣，
t n 1，
 但樣本數不很大時，
賴區間會較長

Z
2
2
，兩個區間長度會一

 Z
2
2
，故用t分配求得的信
37
區間估計的準確度：
 是非題
3. 信賴區間的長度與準確度隨信賴水準的增加
而增加。 (X
)

信賴水準的增加 信賴區間的長度增加 (Why?)

信賴區間的長度增加精確度減少
38
區間估計的準確度：
 是非題
4. 若母體為常態分配，且母體變異數為已知，
當信賴水準不變時，母體平均數的信賴區間
長度隨樣本數的增加而變小。 (O
)
 信賴區間長度

 2Z
2

n
樣本數增加時，信賴區間長度變小。
39
4.單一母體比例p之估計-點估計
(一) 點估計
 樣本比率 pˆ  X / n
為母體比率p之不偏估計量，且在
大樣本時， pˆ 之抽樣分配近似於常態。
 因此，母體比例p之估計是最常見估計問題之一，且一
般皆以 pˆ 來估計p，也就是說取 pˆ 為p的不偏估計
pˆ
式，因此
為p之點估計值。
 (i)（重要!!）當樣本數n已知，且n>30時，以 pˆ 估計p
的100(1-α)%誤差界限為
z 
2
pˆ (1  pˆ )
n
∵大樣本n>30，使用統計量
(推導) 以
Z 
ˆ  p
p
ˆ (1  p
ˆ)
p
ˆ  p
p
Z 
進行估計p
n
p (1  p )
代入公式得到
n
 P ( z / 2 
pˆ  p
pˆ (1  pˆ )
 z / 2 )  1  
 P(
pˆ  p
pˆ (1  pˆ )
/2
) 1
n
n
 P ( pˆ  p  z  / 2
d  z
 z
pˆ (1  pˆ )
) 1
n
pˆ (1  pˆ )
/2
n
為以 pˆ 估計p的100(1-α)%之誤差界限
3.單一母體比例p之估計-點估計
(ii)（重要!!）當樣本數n未定，但n>30時，若誤差界限d已
知，則求樣本數n之方法
2
(a)
(b)
 z 
n   2  pˆ (1  pˆ )
 d 
 
z 
1 
2


n 
4  d 


ˆ 為樣本比例
p
2
p 無任何資訊
4.單一母體比例p之估計-區間估計
(i) 大樣本，抽自任意母體且為大樣本時，當樣本數
n>30 且若np ≥ 5且 n(1－p) ≥ 5) ，則使用統計量
進行區間估計
(推導)
pˆ  p
pˆ (1  pˆ )
n
pˆ  p
 P ( z / 2 
z 
pˆ (1  pˆ )
 z / 2 )  1  
n
 P ( pˆ  z  / 2
pˆ (1  pˆ )
n
 p  pˆ  z  / 2
pˆ (1  pˆ )
) 1
n
此時，母體比例p的100(1-α)%信賴區間為
pˆ  z 
pˆ (1  pˆ )
/2
n
或
ˆ  z
(p
ˆ (1  p
ˆ)
p
/2
n
ˆ  z
, p
ˆ (1  p
ˆ)
p
/2
n
)
4.單一母體比例p之區間估計
例 6. 母體比例的區間估計
 為了想瞭解女性高爾夫球員對高爾夫球課
程的看法，針對全美 900 位女性高爾夫球
員進行調查。調查結果發現，有 396 位女
性高爾夫球員對練習發球的次數感到滿
意，如此，對發球次數感到滿意的女性高
爾夫球員之母體比例的點估計為396/900＝
0.44。
解：
∵大樣本n=900>30，使用統計量
z
pˆ  p
pˆ (1  pˆ )
進行估計p
n
其中
pˆ 
396
 0 . 44
900
∴發球次數感到滿意的女性高爾夫球員之母體比例p的95%信賴
區間
pˆ  z 
pˆ (1  pˆ )
/2
n
 0 . 44  1 . 96
0 . 44 (1  0 . 44 )
900
 0 . 44  0 . 0324
∴在 95% 的信賴水準下，母體比例p的區間估計為 (0.4076,
0.4724 )。
結論是：我們有 95% 的信心說，有 40.76% 至 47.24% 的
女性高爾夫球員對其練習發球的次數感到滿意。
例 7. 樣本數
 某茶葉製造公司欲了解其在市場的佔有率，乃
在市場上進行抽樣調查。假設該公司要求樣本
比例與母體之誤差不能超過0.01，且有95％的
信賴度，則樣本數應為何？
例 7. 樣本數
解：
∵ p未知，故以 p=1/2代入，
可解得
( Z  ) P (1  P )
(1 . 96 ) 
2
n
2
( 0 . 01 )
2
2

( 0 . 01 )
2
1
4  9 , 604
∴故至少應選取9,604個樣本點。
5.單一母體變異數σ2之估計-點估計
(一) 點估計
 樣本變異數
S
為為母體變異數σ2之
2
不偏估計量。
 因此，母體變異數σ2之估計一般皆以 S
來估計σ2 ，也就是說取 S 為σ2 的不偏
2
估計式，因此
S
2
為σ2 之點估計值。
2
5.單一母體變異數σ2之估計-區間估計

隨機變數
X 1 , X 2 , , X
2
 P(
( n  1) S

2

( n  1) S

2
為一組從母體中隨機抽出的樣
( n  1) S
本，則使用統計量
 P (  1  
n
~ 
2
2
( n 1 )
進行σ2區間估計。
2
  ) 1
2
2
2
( n  1) S
2

2

2
2
) 1
 1 
2
2
2
 此時，母體變異數σ2的100(1-α)%信賴區間為
(
(
( n  1) S

2
2
2
,
( n  1) S
 1 
2
2
2
)
例 8.單一母體變異數σ2的區間估計
 某部機器負責填充某種罐裝咖啡。如果填
充過程的變異數太大，表示機器失控則必
須送修。因此必須不斷地檢查填充過程的
變異數，測量隨機抽樣罐裝咖啡的體積並
且計算樣本變異數。一組3 0罐咖啡的隨機
樣本變異數估計 =18,540，計算母體變異數
σ2的95%信賴區間。
解：
( n  1) S
 使用統計量

2
2
~ 
2
( n 1 )
進行σ2區間估計。
 母體變異數σ2 的100(1-α)%信賴區間為
(
( n  1) S
2

2
,
2
 S  18,540
2
n  30
2
2
2
 1     0 .975 , 29  16 . 0471
2
2
母體變異數σ2 的100(1-α)%信賴區間為
(

2
2
2
,
( n  1) S
 1 
2
2
)  (
29  18540
,
29  18540
45 . 7222
2
 (11765 , 33604 )
16 . 0471
2
2
2
( n  1) S
 1 
d.f.  n - 1  29
    0 .025 , 29  45 . 7222 ,
查表
( n  1) S
)
2
)
例 9. 單一母體變異數σ2的區間估計
S
2
n
A
B
C
D
E
50
40
30
52
60
5
5
4
6
8
此樣本來自相同變異數的五個獨立常態母
體試求共同變異數σ2的95%信賴區間。
(X


2
令
SP
 X )   ( X 2  X )  ...   ( X 5  X )
2
1
2
n5
2
 X )  ...  ( X n
( X 1A  X )  ( X 2 A
2
SA 
2
( X 1B  X )  ( X 2 B
2
SB 
2
n1  1
2
 X )  ...  ( X n
2
A
2
B
 X)
2
E
 X)
( Spooled
Sample
Variance )
2
n2  1
( X 1 E  X )  ( X 2 E  X )  ...  ( X n
2
SE 
2
1
 X)
2
2
5
n5  1
 ( n  5 ) S P  ( n 1  1) S A  ( n 2  1) S B  ....  ( n 5  1) S E
2
(n  5) S P
2
2



2
2
n5
~
( n 1  1) S A
2
2


2
n
2
1 1
2
( n 2  1) S B



2

2
n2
........
1
( n 5  1) S E
2
2


 
2
2
n 5 1
 (n i  1) S i
2
解：
 (n  5) S p 
2
i
 4  50  4  40  3  30  5  52  7  60
 1130
 使用統計量
( n  5) S P
2

2
~ 
2
(n5)
進行共同變異數σ2 區間估
計。
( n 21的100(1-α)%信賴區間為
) S p ( n  1) S p
 母體共同變異數σ
2
(
2
,

2
 1 
2
2
查表
2
    0 .025 , 23  38 . 0757 ,
2
)
2
2
 1     0 .975 , 23  11 . 6885
2
2
2
母體共同變異數σ2 的95%信賴區間為
(
(n  5) S

2
2
2
p
(n  5) S
,
 1 
2
2
p
)  (
1130
38 . 0757
,
1130
)
11 . 6885
2
 ( 29 . 6777 ,
96 . 6762 )
第二部份
6. 兩個母體平均數差μ1-μ2的估計
 μ1 為母體2 的平均數，μ2 為母體2的平均數
 由母體1抽出n1 個簡單隨機樣本，由母體2中抽




出n2 個簡單隨機樣本
兩個樣本的抽取彼此互相獨立，稱為獨立簡單
隨機樣本
兩母體之標準差σ1與σ2已知
n1 與 n2 均大於30 或兩母體近似常態分配
X  X 之抽樣分配為一常態分配
1
2
6. 兩個母體平均數差μ1-μ2的估計
(1)
(一) 點估計(σ 與σ 已知)
1
2
 樣本平均數差 X 1  X 2 為母體平均數差μ1-μ2之不
偏估計量。
 因此，母體平均數差μ1-μ2估計一般皆以統計量
Z 
( X 1  X 2 )  (1   2 )
1
2
。
來估計
n1


2
2
n2
6. 兩個母體平均數差μ1-μ2的估計
(1)
(二)區間估計(σ 與σ 已知)
1
2
X1  X 2
 兩母體平均數差μ1-μ2之點估計量
1
2
 兩樣本平均數差之的標準差
 μ1-μ2之誤差界限為

z
2
1
2

n1

n1
2
2
n2

2
2
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
X1  X
2
 z
2
 12
n1


2
2
n2
例 10.兩母體平均數之差的估計：已知 σ1與
σ2
 G百貨公司在水牛城有兩家分店，一家在市
區，另一家位於郊區的購物中心。現在假
定這位地區經理請我們替她分析這兩個地
點的顧客平均年齡是否確有差異。
 將市區分店的顧客視為母體1，而郊區分店
的顧客為母體2。
例 10. 兩母體平均數之差的推論：已知 σ1與
σ2
 依據前述之顧客人數作為統計研究的資料，兩
個母體標準差已知為 σ1＝9歲與 σ2＝10歲。由
Greystone顧客中蒐集到的兩個獨立簡單隨機
樣本的資料如下：
計算這兩個地點的顧客平均年齡差的95%信賴
區間。
解：
∵大樣本n1=36, n2=49>30且母體標準差σ1＝9 , σ2＝10已
知
∴ 使用統計量
Z 
(X1  X
2
)  (1   2 )
 12


n1
進行估計μ1 - μ2
2
2
n2
∴若使用95% 信賴水準，且 z/2＝z0.025＝1.96，我們可得
μ1 - μ2的95%信賴區間
X
1
 X
2
 z
 12
2
 40  35  1 . 96
 5  4 . 06
 ( 0 . 94 ~ 9 . 06 )

n1

2
2
n2
9
2
36

10
2
49
6. 兩個母體平均數差μ1-μ2的估計
(2)
(一) 點估計(σ1與σ2未知，但n1 與 n2均為大樣本)
 樣本平均數差X 1 
X
為母體平均數差μ1-μ2之不
2
偏估計量。
 由於σ1與σ2未知，但是n1 與 n2 (小於30)為小樣本，本，
此時可以 S 1   12 , S 2   22 。
2
2
 因此，母體平均數差μ1-μ2估計一般皆以統計量
來估計。
Z 
(X1  X
2
)  (1   2 )
2
S1
n1
2

S2
n2
6. 兩個母體平均數差μ1-μ2的估計
(2)
(二)區間估計(σ1與σ2未知，但n1 與 n2均為大樣本)
X1  X 2
 兩母體平均數差μ1-μ2之點估計量
2
 兩樣本平均數差之的標準差
2
S1
2

n1
 μ1-μ2之誤差界限為
S1
2
S1
n2
2

n1
2

n1
S2
n2
z
2
S2
S2
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
2
X1  X
2
 z
2
S1
n1
2

S2
n2
6. 兩個母體平均數差μ1-μ2的估計(3)
(一) 點估計(σ1與σ2未知，但σ1=σ2=σ且n1 與 n2為
小樣本)
 樣本平均數差
X1  X
2
為母體平均數差μ1-μ2之不偏估計
量。
 由於σ1與σ2未知，但是σ1=σ2=σ ，此時以
( n 1  1) S 1  ( n 2  1) S 2
2
S
2
P

2
n1  n 2  2

2
 因此，母體平均數差μ1-μ2估計一般皆以統計量 t
來估計。
t n1 1  n 2  2 
( X 1  X 2 )  (1   2 )
S
2
p
n1

S
2
p
n2
或
t n11  n 2  2 
( X 1  X 2 )  (1   2 )
Sp
1
n1

1
n2
6. 兩個母體平均數差μ1-μ2的估計(3)
(二)區間估計(σ1與σ2未知，但σ1=σ2=σ且n1 與 n2為
小樣本)
X1  X
 兩母體平均數差μ1-μ2之點估計量
S
 兩樣本平均數差之的標準差
2
p
S
2
1

n1
 μ1-μ2之誤差界限為
t  ,( n
S
 n2  2 )
2
2
p
n2
2
p

n1
S
2
p
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
X1  X
2
 t  ,( n
2
S
1
 n2  2 )
2
p
n1

S
2
p
n2
例 11 .兩母體平均數之差的估計： σ1與σ2未
知，但σ1=σ2=σ
 某政府單位想知道A與B家庭平均收入的差
異，已知兩母體變異數相等，抽查的結果
如下：
A市
B市
樣本數
35
40
平均收入
401,800
388,000
標準差
20,000
22,000
計算這兩個地點的顧客平均年齡差的95%
信賴區間
解：
∵大樣本n1=36, n2=49>3且母體標準差σ1＝
σ2未知
∴ 使用統計量
SP 
S 
2
P
( 35  1) 20000
2
( n 1  1) S  ( n 2  1) S
2
1
2
2
n1  n 2  2
 ( 40  1) 22000

2
2
 21092
35  40  2
∴大樣本n1=36, n2=49使用統計量
(X  X
估計μ1-μ2
Z 
1
Sp
2
)  (1   2 )
1
n1

1
n2
解：
若使用95% 信賴水準，且 t/2＝z0.025＝1.96，我
們可得μ1 - μ2的95%信賴區間
X1  X
2
 z
2
S
2
p
n1

S
2
p
n2
 401 ,800  388 , 000  Z 0 . 025 S P
1
35

1
40
 13 ,800  1 . 96  21 , 092  0 . 2315
 13 ,800  9 , 568 . 42  ( 4 , 231 . 6 ~ 23 , 368 . 42 )
6. 兩個母體平均數差μ1-μ2的估計
(4)
(一) 點估計(σ1與σ2未知，但σ1=σ2 ≠ σ 且
n1 與 n2為小樣本)
 樣本平均數差
X1  X
2
為母體平均數差μ1-μ2之不
偏估計量。
 由於σ1與σ2未知，但是σ1=σ2 ≠ σ ，此時以
S1   1
2
2
S2   2
2
，
2
6. 兩個母體平均數差μ1-μ2的估計(4)
(一) 點估計(σ1與σ2未知，但σ1=σ2 ≠ σ 且n1 與 n2為
小樣本)
 母體平均數差μ1-μ2估計一般皆以統計量 t
來估計。
t 
(X
1
 X
2
)  (1   2 )
2
S1
2

n1
t/2 的自由度為 ν
一般無條件捨去取
整數值
S2
n2
s
s 



n2 
 n1
2
1
df 
2
2
2
2
s 
1 s 

 


n1  1  n1 
n2  1  n2 
1
2
1
2
2
2
6. 兩個母體平均數差μ1-μ2的估計(4)
(二)區間估計(σ1與σ2未知，但σ1=σ2 ≠ σ且n1 與 n2為
小樣本)
X1  X
 兩母體平均數差μ1-μ2之點估計量
2
 μ1-μ2之誤差界限為
2
S1
 兩樣本平均數差之的標準差
t  ,

n2
2
S2
2

n1
2
S2
n1
S1
2
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
2
X1  X
2
 t  ,
2
S1
n1
2

S2
n2
例 12 .兩母體平均數之差的估計：σ1與σ2未知，
但σ1=σ2 ≠ σ
 國家銀行正進行一項在其兩家分行的顧客支票
帳戶之平均差異的調查。Cherry Grove分行中
簡單隨機抽樣28個支票帳戶，Beechmont分行
亦獨立簡單隨機抽樣22個支票帳戶。每一個支
票帳戶的目前支票帳戶平均餘額均加以記錄。
帳戶平均餘額之摘要如下：
例 12.兩母體平均數之差的估計： σ1與σ2未
知，但σ1=σ2 ≠ σ
 Clearwater國家銀行欲估計Cherry Grove與
Beechmont顧客母體支票帳戶平均數之差異
的95%信賴區間估計。
解: Cherry Grove分行樣本資料顯示 n1＝28,x1
＝$1,025與 s1＝$150，而Beechmont分行則
為 n2＝22, x2 ＝$910, s2＝$125。t/2 之自由
度計算如下：
解：
 我們將非整數之自由度無條件捨去取整數值為
47，以獲得較大的 t值及較為保守的區間估計。
使用 t分配表與自由度47，可求得 t0.025,47＝
2.012。
 建立兩母體平均數之差的95%信賴區間如下：
∴ 兩母體平均數之差的95%信賴區間估計值為(37,
193)。
6.成對母體平均數差μ1-μ2的估計(5)
 μ1 為母體2 的平均數，μ2 為母體2的平均數
 自母體中抽取元素，對同一元素蒐集實驗前後
兩個觀察值所構成的樣本稱為成對樣本（paired
samples）。
 成對樣本的母體彼此不互相獨立。
6.成對母體平均數差μ1-μ2的估計(5)
成對母體與成對樣本
成對差母體
成對母體
X1 X 2
D  X1  X 2
1
D1
M
M
1 X 11 X 21
M
M
N X 1N
M
X 2N
N
DN
抽
樣
抽
樣
1
D  X1  X 2
X1
X2
X 11
X 21
1
D1
M
M
M
n
M
n X 1n
X 2n
Dn
D 1  X 11  X 21 , D 2  X 12  X 22 ,.... D n1  X 1 n  X 2 n
6.成對母體平均數差μ1-μ2的估計(5)
(一) 點估計(配對樣本)
 令
D 1  X 11  X 21 , D 2  X 12  X 22 ,.... D n1  X 1 n  X 2 n
則把(D1，D2，. . . . . . ，Dn)視為另一個由母體抽出的隨機
樣本
 配對樣本平均數 D 
D 1  D 2  ..... D n
n
不偏估計量。
D
2
 (!!) E ( D )   D
Var ( D )   D 
2
n
為母體平均數差 μ1-μ2之
6. 成對母體平均數差統計量
 成對母體平均數差  D 使用的統計量
大樣本母體變異數已知：
Z 
D  D
D
n
大樣本母體變異數未知：
Z 
D  D
SD
n
小樣本母體常態變異數已知：
Z 
D  D
D
n
小樣本母體常態變異數未知：
t 
D  D
SD
n
6. 成對母體平均數差的區間估計
(二)區間估計
 成對母體平均數差 D 的信賴區間
大樣本變異數
D  Z  / 2
D
已知
式中：
大樣本變異數
D  Z /2S D
2
D
2
D
D


D
n
未知
式中： S D 
SD
n
， SD 
 小樣本母體分配為常態分配，
D  Z  / 2 D
2
D
已知
 小樣本母體分配為常態分配，
D  t n  1 , / 2 S D
2
D
未知
D
2
 ( D ) / n
2
n 1
。
例 13 .成對母體平均數差的區間估計
例13.成對母體平均數差的區間估計
例 13. 小樣本，變異數σ 未知
解：
∵小樣本n=7<30，母體變異數σ2 未知
使用統計量
t 
D  D
SD
n
E (D )   D
D 
 1 .5  5 .4  3 .6  6 .9  5 .5  2 .7  2 .3
 3 . 557
7
SD
2

SD 

X
2
i
 nX
n 1
SD
2
2
 7 . 7062
 2 . 776
∴使用前後平均體重差μ1-μ2 的95%信賴區間
3 . 557  t 0 .025 , 6
2 . 776
D  t / 2
 3 . 557  2 . 447  1 . 1333
6
 3 . 557  2 . 773  ( 0 . 784 ~ 6 . 330 )
SD
n
7.兩個母體比例差p1-p2的估計
 樣本比例差
pˆ 1  pˆ 2
為母體比例差p1-p2之不偏估
計量。
 獨立大樣本母體比例 pˆ 1 
。平均數
E ( pˆ  pˆ )  
變異數
V a (rpˆ 1  pˆ 2 )  
1
2
pˆ 2 的抽樣分配
pˆ 1  pˆ 2
 p p
2
pˆ 1  pˆ 2
1

式中： q1  1  p1 ， q 2  1  p 2 。
p1 q1
n1
2

p2q2
n2
7.兩個母體比例差p1-p2的估計

兩個母體比例差p1-p2使用的統計量
大樣本母體比例P1, P2已知： Z 
pˆ 1  pˆ 2  ( p 1  p 2 )
p 1 (1  p 1 )

p 2 (1  p 2 )
n1
n2
大樣本母體變異數未知：
Z 
pˆ 1  pˆ 2  ( p 1  p 2 )
pˆ 1 (1  pˆ 1 )

n1
Z 
pˆ 2 (1  pˆ 2 )
n2
pˆ 1  pˆ 2  ( p 1  p 2 )
0 .5 ( 0 .5 )
n1

0 .5 ( 0 .5 )
n2
或
7. 兩個母體比例差p1-p2的區間估計
 大樣本母體比例差的信賴區間
( pˆ 1  pˆ 2 )  Z  / 2 S pˆ 1  pˆ 2
式中： S pˆ 1  pˆ 2 

pˆ 1 qˆ 1

pˆ 2 qˆ 2
n1
n2
母體比例差的信賴區間
( pˆ 1  pˆ 2 )  Z  / 2 S pˆ 1  pˆ 2
1
式中： S pˆ
ˆ
1  p2


2
1
1

2  2
n1
1
2
n2
例 14.兩個母體比例差p1-p2的區間估計
 某大城市中隨機抽120位的成年男子，其中有38位沒9抽
煙的習慣，又隨機抽出72位的成年女子，其中有51位沒
有抽煙的習慣。
(1) 估計此城市成年男子中與成年女子中沒有抽煙習慣的
比例差之95%誤差界限?
ˆ1 
p
x1

n1
38
 0 . 3167
ˆ2 
p
120
Z 0 . 05
95%誤差界限=
 1 . 96
pˆ 1 (1  pˆ 1 )

n1
x2
n2
51
 0 . 7083
72
pˆ 2 (1  pˆ 2 )
n2
0 . 3167 (1  0 . 3167 )
 1 . 96  . 06836
 0 . 1340

120

0 . 7083 (1  0 . 7083 )
72
(2) 求此城市成年男子中與成年女子
沒有抽煙習慣的比例差之95%信賴區間?
解：
∴沒有抽煙習慣的比例差p1-p2 的95%信賴區間
pˆ 1  pˆ 2  Z 0 .05
pˆ 1 (1  pˆ 1 )
n1
 0 . 3167  0 . 7083  0 . 1340
 (  0 . 5256 ,  0 . 2576 )

pˆ 2 (1  pˆ 2 )
n2
8. 兩個母體變異數比的統計推論
2

2
S1
S2
1  2
2
2
2
的分配
2
S1
S2


2
1
2
2

2
 12
2
2

S1
S
2
2
~ F n1  1 , n 2  1
8. 兩個母體變異數比的統計推論

區間估計
2
使用統計量 F分配
2
S1
S2


2
1
2
2

2
 12
2
2

S1
S
2
2
~ F n1  1 , n 2  1
f (F )
F 1 , 2
0
F 1 , 2 ,1 / 2
F 1 , 2 , / 2
F
8. 兩個母體變異數比的統計推論
 區間估計
 母體變異數比的1-α信賴區間
S1  1
2
 P ( F1  

2

S
2
2
 P(
S1
S
2
2

2
2

S
2
2

2

F n 1  1 , n 2  1 , / 2
S1
 F )  1  
1
2
1
2

2
2
2

1
F n 1  1 , n 2  1 , / 2
2
2
2

S1
S
1
2
2
2


2
2
1

F n 1  1 , n 2  1 ,1   / 2
2

) 1
S1
S
2
2

1
F n1 1 , n 2 1 ,1   / 2
例 15.兩個母體變異數比的統計推論
 已知學生的身高呈常態分配，但其平均數未知，今從某
大學隨機抽樣10名女生與9名男生，得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90％信賴區間。
單一母體變異數σ2的
(
100(1-α)%信賴區間為
( n  1) S

2
2
2
,
( n  1) S
 1 
2
2
)
2
(
女生身高變異數的90％信賴區間
(10  1) 36 (10  1) 36
324
324
(
,
)(
,
)  (19 . 15 ~ 97 . 44 )
2
2
16 . 9190 3 . 3251
 9 , 0 .05
 9 , 0 .95
例 15.兩個母體變異數比的統計推論
 已知學生的身高呈常態分配，但其平均數未知，今從某
大學隨機抽樣10名女生與9名男生，得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90％信賴區間。
單一母體母體變異數σ2的
(
( n  1) S
100(1-α)%信賴區間為

2
2
2
,
( n  1) S
 1 
2
2
)
2
(
男生身高變異數的90％信賴區間
(
( 9  1) 49 ( 9  1) 49
392
392
,
)

(
,
)  ( 25 . 28 ~ 143 . 45 )
2
2
15 . 5073 2 . 7326
 8 , 0 .05
 8 , 0 .95
例 15.兩個母體變異數比的統計推論
 已知學生的身高呈常態分配，但其平均數未知，今從某
大學隨機抽樣10名女生與9名男生，得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90％信賴區間。
母體變異數σ2的100(1-α)%信賴區間為
(
(
( n  1) S

2
2
2
,
( n  1) S
 1 
2
2
)
2
男生身高變異數的90％信賴區間
(
( 9  1) 49 ( 9  1) 49
392
392
,
)

(
,
)  ( 25 . 28 ~ 143 . 45 )
2
2
15 . 5073 2 . 7326
 8 , 0 .05
 8 , 0 .95
 已知學生的身高呈常態分配，但其平均數未知，今從某
大學隨機抽樣10名女生與9名男生，得其身高的標準差
分別為6公分與7公分。
(2) 試分別求女生對男生身高變異數比與標準差比的90％
信賴區間。
1
2
兩個母體變異數比 
2
S1
2
2
2
的100(1-α)%信賴區間為
1


F n 1  1 , n 2  1 ,
S2
 12

/ 2
1
2
2
2

S1
2
S2
1

F n 1  1 , n 2  1 ,1  
2
女生對男生身高變異數比
36
(
49

2
2
的90％信賴區間
36
,
49
)(
0 . 7347
F 9 , 8 , 0 .05 F 9 , 8 , 0 .95
女生對男生身高標準差
3 . 39
1

,
0 . 7347
)  ( 0 . 217 ~ 2 . 37 )
1 3 . 23
的90％信賴區間
2
( 0 . 217 , 2 . 37 )  ( 0 . 4658 , 1 . 539 )
/ 2

上課ppt

Transcript 上課ppt

Directory