Transcript 上課ppt

第八章 統計估計
學習目標
 瞭解點估計的意義、估計的步驟與限制。
 瞭解優良估計式的性質。
 瞭解區間估計的意義。
 瞭解大樣本與小樣本母體常態、變異數已知
與未知下,單一母體平均數區間估計的方
法。
 知悉t分配的意義與機率值。
 瞭解單一母體比例區間估計的方法。
 瞭解單一母體變異數區間估計的方法。
 瞭解卡方分配的意義與卡方值。
統計推論
統計推論(statistical inference)是我們從樣本中獲得關於母體的
資訊並且從中推導出結論的程序。
統計
資料
資訊
母體
Population
推論
樣
本
Sample
Inference
參數
Parameter
統計量
Statistic
為了做推論, 我們需要敘述統計、機率分配及抽樣分配的技術和知識。
估計的概念
估計的目的是在樣本統計量的基礎上,決定一個
母體參數的近似值。
有兩種估計的類型:
點估計量
(point estimator)
區間估計量
(interval estimator)
點估計量
一個點估計量(point estimator) 藉著一個單一數
值或點來估計母體的未知參數,以對母體進行推
論。
先前看到連續分配的點機率幾乎是0。同樣地,
我們期望點估計量會依樣本量的增加而更接近參
數值。但是,點估計量沒有能力反映較大樣本的
效果。因此,我們將使用區間估計量(interval
estimator)估計母體參數。
點估計量與區間估計量
假設一位統計學教授想要估計其商學院二年學生的平均
暑期收入。隨機選出25 位學生(n=25), 計算的樣本平均
週薪是$400。
點估計量
區間估計量
另一種說法:
二年級商學院學生暑期的平均週薪是介於$380 與$420 之
間。
點估計量品質
 估計量品質是包括不偏性 (unbiasedness)、一致性
(consistency)、相對有效性(relative efficiency):
1. 不偏性
 若估計式的平均數等於母體參數值,則該估計式為
不偏估計式(unbiased estimator) ,否則為偏誤估計式
(biased estimator) 。
 即若 E (ˆ )   ,則 ˆ 為  的不偏估計式。
 例:樣本平均數 X 與 S
2

n
1
(X

n 1
i
 X)
i 1
平均數 µ 與σ2的不偏估計式。
E(X )  
E (S )  
2
2
2
分別是母體
點估計量品質
2. 一致性
 一個不偏估計量被稱為是一致的(consistent),假如隨著樣本大
小的變大,估計量與參數間的差異會隨之變小。
ˆ
 若  n 為不偏誤估計式或漸近不偏估計式,當 n   ,其變異
數趨近於零,即
lim V (ˆn )  0
n 
則ˆn 為  的一致性估計式。
例: X 是 µ 的一個一致性估計量,因為:
 Var ( X )  
X
2
n
lim Var ( X )  lim 
n 
n 
2
n
 0
點估計量品質
3. 有效性
 如果一個參數有兩個不偏估計量,變異數比較小的
那一個被稱為是相對的比較有效(relatively more
efficient)。
ˆ 均為 的不偏誤估計式, 若
 即 設ˆ 、ˆ
Var (ˆ )
1
ˆ
Var (ˆ )
ˆ 為有效估計式。
則 ˆ 相對 ˆ
3. 相對有效性
例:樣本平均數 及樣本中位數Me都是母體平均數的不
偏估計值,然而,樣本中位數Me擁有比樣本平均數 更
大的變異數,所以我們選擇 ,因為與樣本中位數比較
, 其相對的比較有效。
因此,樣本平均數 是母體平均數 µ “最好/佳”估計值。
例1:估計式的相對有效性評斷標準
X 與Me的相對有效性
_
X的抽樣分配
Me的抽樣分配
_
E(Me)=E(X)
統計量
μ
母體參數
例2:不偏性、相對有效性
 隨機變數 X
為一組以抽出放回的
方式,從母體 中 N (  ,  ) 隨機抽出的樣本, n  3
現以 ˆ  1  X 與 ˆ  1 ( X  X ) 來估計μ ,
1
, X 2 , , X
n
2
n 1
1
n2
i
i2
2
2
1
n
試比較此二估計式的不偏性、相對有效
性。

例2:不偏性、相對有效性
解: (1) 不偏性
E ( ˆ 1 )  E (
1
n 1

n2
Xi) 
i2
E ( ˆ 2 )  E [

ˆ 1
與
1
ˆ 2
2
( X 1  X n )] 
1
n 1

n2
i2
1
2
E(X i) 
1
n2
[ E ( X 1 )  E ( X n )] 
皆為 之不偏估計式。
1
2
(n  2)  
(   )  

例2:不偏性、相對有效性
解: (2)相對有效性
V ( ˆ 1 )  V (
1
n 1

n2
Xi) 
1
( n  2 )
(n  2)
i2

(n  2)
2
1
n 1
1
2

2

 V (X
i
)
i2
2
n2

1
2
V ( ˆ 2 )  V [ ( X 1  X n )]  [V ( X 1 )  V ( X n )] 
2
4
2

n=3
μ2相對μ1 具相對有效性
Var ( ˆ 1 )
Var ( ˆ 2 )

2
n  2
n=4
μ1 與μ2 具相同的有效性
n>4
μ1 相對 μ2具相對有效性
例3:不偏性、一致性
 隨機變數
X 1 , X 2 , , X
n
為一組以抽出放回
的方式,從母體 中 N (  , 
本,現以 S
2

1
n
(X

n 1
i 1
i
 X)
2
2
)
隨機抽出的樣
估計σ2 ,試比較
此估計式的不偏性、一致性。

例3:不偏性、一致性
解: (1) 不偏性
n
 (X
 X)
i
i 1
已知
2
~  n 1 , E (  n 1 )  n  1, V (  n 1 )  2 ( n  1)
2

2
2
2
n
 (X

E(

( n  1) S

S
2

 X )
i 1

2

( n  1) S

2
)  n  1  E( S
2
2
2
~  n 1
2
2
2
1
i
)  ( n  1) 

2
n 1
 
n
 (X
n 1
i 1
i
 X)
2
為σ2 之不偏估計式。
2

例3:不偏性、一致性
解: (2)一致性
n

已知
(X i  X )
2
i 1
~  n 1 , Var (  n 1 )  2 ( n  1)
2

2
Var (

( n  1) S

2
Var( S
2
2
)  2 ( n  1)
)  2 ( n  1)
 lim Var ( S )  lim
n 

S

1
2
)  Var (  n  1 )  2 ( n  1)

4
( n  1)
2
2
2
~  n 1
2
4
 Var( S

2
2
2
( n  1)

又
2
( n  1) S
n 
2
2

2
4
( n  1)
4
n 1
 0
n
(X

n 1
i 1
i
 X)
2
為σ2 之一致性估計式。
區間估計的意義
 對未知的母體參數估計出一個上下限的區間,並指出該
區間包含母體參數的可靠度。
 點估計量的值不會恰好等於母體參數值。
 區間估計值 (interval estimate) 通常是由點估計值加或減
某個值求得,我們稱這個加減值是邊際誤差 (margin of
error)。
 信賴區間:是在一個既定的信賴水準下所構成的一個區間。
區間估計值的一般形式是:
點估計值 邊際誤差
 信賴水準(信賴係數) :是指信賴區間包含母體參數的信
心(或稱可靠度)。
 區間估計值可以讓我們瞭解:點估計值與母體參數值的
接近程度。
區間估計量
一個區間估計量(interval estimator)使用一個區間
來估計母體未知參數的值,以對母體進行推論。
這就是我們所說的 (有某些 ___% 確實性) 關注的
母體參數在下限及上限的範圍之間。
第一部份
3.單一母體平均數μ之估計
(一) 定義:
(1) 設(X1,X2,. . . . . . ,Xn)為由母體f(x) 中抽出的n個隨機
樣本,若θ為此母體之參數,設T1、T2為兩個統計量,
使得 P( T1≦θ≦T2)=1-α
則稱(T1, T2) 為θ 的100(1-α) %信賴區間,而稱1-α為信賴度
(confidence level)
(2) 若 為θ之估計式,若
P ( ˆ    d )  1  
計θ的100(1-α)%誤差界限。
,則稱d為以 ˆ 估
3.單一母體平均數μ之估計-點估計
(二) 點估計
(1)母體平均數μ之估計是最常見估計問題之一,且
一般皆以 X 來估計μ,也就是說取 X 為μ的估計
式,因此 X 為μ之點估計值。
(i)(重要!!) 當樣本數n已知,且n>30時,以
100(1-α)%誤差界限為
d  z 
2

n
P ( ˆ    d )  1   ( 定義 )
(思考方式)
 P( X    d )  1  
X
估計μ的
∵大樣本n>30, 使用統計量
(推導) 以 z 
x 
 /
n
x  
 /
n
進行估計μ
代入公式得到
 P ( z / 2 
 P(
z 
x
/ n
x 
 /
n
 z / 2 )  1  
 z / 2 )  1  

 
 P  x    z  / 2
  1  
n

d  z 
2

n
為以
X
估計μ的100(1-α)%之誤差界限
3.單一母體平均數μ之估計-點估計
(ii)(重要!!)當樣本數n未定,但n>30時,若誤差界限d已
知,則樣本數為n為
(思考方式)
2
 z
 2
 d


 



 d  z 
n
2
d
2
2
 (z )
2
2
n
2
 z
n   2
 d







2

2
3.單一母體平均數μ之估計-區間估計
(i) 大樣本,母體變異數 已知)
抽自任意母體且為大樣本時,當樣本數n>30且母體變
異數 已知,則使用統計量
(推導)
 P ( z / 2 

 P
 x  z

x 
 /

/2
n
n
Z 
X  

n
進行區間估計
 z / 2 )  1  
   x  z

/2


 1 
n 
此時,母體平均數μ的100(1-α)%信賴區間為
X  z / 2 

n
或
( X  z

/2
n
, X  z

/2
n
)
3.單一母體平均數μ之估計-區間估計
(i) 大樣本,母體變異數 已知)
區間可以表示成
信賴下限 (Lower confidence limit) =
 

 x  z / 2

n 

信賴上限(Upper confidence limit) =
 

x

z


 /2
n 

其中 機率1 – α 稱為信賴水準 ,為測量區間實際包含 µ 的機
率。
3.單一母體平均數μ之估計-區間估計
(ii) (大樣本,變異數 未知,且樣本數n>30)
當樣本數n>30且母體變異數 未知,可用S2來 取
代
σ2 ,則使用統計量 Z
(推導)  P (  z  / 2 

 P
 x  z

S/
n
X  
S
進行區間估計
n
x 
S
/2

n
 z / 2 )  1  
   x  z


 1 
n 
S
/2
此時,母體平均數μ的100(1-α)%信賴區間為
X  z / 2 
S
n
或
( X  z
S
/2
n
, X  z
S
/2
n
)
3.單一母體平均數μ之估計-區間估計
(iii) (母體為有限且採取不歸還抽樣)
(a) 以 估計μ的100(1-α)%誤差界限為
N n 

N 1 n
2
d  z 
2
(b) 母體平均數μ的100(1-α)%信賴區間為
(X  z 
2
N  n
N 1


2
n
, X  z 
2
N  n
N 1


2
n
)
3.單一母體平均數μ之估計-區間估計
(iv) (小樣本,變異數 未知,且樣本數n<30)
當樣本數n<30且母體變異數 未知,可用S2來 取
代
(推導)
σ2 ,則使用統計量 t
 P ( t / 2 

 P
 x  t

x 
S /
S
/ 2
( n 1 )
n
n

X  
進行區間估計
S
n
 t / 2 )  1  
   x  t


 1  
n 
S
/ 2
此時,母體平均數μ的100(1-α)%信賴區間為
X  t
/2

S
n
或
( X  t
S
/2
n
, X  t
S
/2
n
)
例 4. 大樣本
 一家雜誌社欲知其讀者的平均年齡,以作為雜誌內容
走向的參考,根據其對訂閱戶抽查所得的讀者平均年
齡為36歲。
(a) 當樣本數為49,母體標準差為6歲,求該雜誌讀者平
均年齡的95%信賴區間。
解: ∵大樣本n=49>30,母體變異數σ2 已知
使用統計量
Z 
X 
進行估計μ

n
∴平均年齡μ的95%信賴區間
X  z

/ 2
n
 36  Z 0 . 025
6
49
 ( 34 . 32 ~ 37 . 68 )
例 4. 大樣本
(b)當樣本數為49,樣本標準差為6歲,求該雜誌讀者平
均年齡的95%信賴區間。
解:
∵大樣本n=49>30,母體變異數σ2 未知
使用統計量 Z  X   進行估計μ
S
n
∴平均年齡μ的95%信賴區間
X  z
S
/2
n
 36  Z 0 . 025
6
49
 ( 34 . 32 ~ 37 . 68 )
例 4. 小樣本
(c)當樣本數為25,母體分配為常態,樣本標準差為6歲,
求該雜誌讀者平均年齡的95%信賴區間。
解:
∵小樣本n=25<30,母體變異數σ2 未知
使用統計量 t  X   進行估計μ
n 1
S
n
∴平均年齡μ的95%信賴區間
X  t / 2
S
n
 36  t 0 . 025 , 24
6
25
 ( 33 . 5232 ~ 38 . 4768 )
例 5. 小樣本,變異數σ 未知
 為了檢驗某款迷你車的耗油量,經測試1公升
的油料所能行駛的里程數6次,分別是17.2、
16.5、17.5、17.7、16.1、15.9公里。若假設里
程數為常態分配,試求該款車1公升油料平均
所行駛之里程數的95%信賴區間。
例 5. 小樣本,變異數σ 未知
∵小樣本n=6<30,母體變異數σ2 未知
解:
使用統計量
t n 1 
X 
S
n
X 
17 . 2  16 . 5  17 . 5  17 . 7  16 . 1  15 . 9
 16 . 82
6
S
2

S 

X
2
i
 nX
2
n 1
S
2

1699 . 65  1697 . 47
 0 . 5697
5
 0 . 7548
∴平均平均里程數μ的95%信賴區間
6 . 82  t 0 .025 , 5
0 . 7548
X  t / 2
 16 . 82  2 . 571  0 . 308
6
 16 . 82  0 . 79  (16 . 03 ~ 17 . 61 )
S
n
區間估計的準確度:
 在信賴區間長度相同之下,信賴水準1- α越大
則準確度越大。
 當信賴水準1-α相同時,信賴區間長度越短則
準確度越大。
 信賴敘述的結論永遠是針對母體而不是樣本。
 信賴水準1- α越大,則誤差界限越大。
 報告誤差界限時,用95%的信賴水準是很普遍
的。
 在同樣的信賴水準下,要求較小的誤差界限
時,只要增加樣本數就成了。
35
區間估計的準確度:
 是非題
1. 點估計通常較區間估計更精確。
(X
)
 點估計值估計母體參數時,可能完全正確或完全不
正確,且其估計正確的可靠度未知;
 而區間估計的可靠度即信賴係數,故可知區間估計
的可靠度較點估計為佳。
36
區間估計的準確度:
 是非題
2. 當母體變異數未知,但已知母體為常態分配
時,用Z分配與t分配所求得的母體平均數的
信賴區間的長度是一樣的。 (X
 Z分配信賴區間長度
 t分配信賴區間長度
S
2Z 
)
n
2
S
2 t n 1,
n
2
 當樣本數 很大時 t n 1, 
樣,
t n 1,
 但樣本數不很大時,
賴區間會較長

Z
2
2
,兩個區間長度會一

 Z
2
2
,故用t分配求得的信
37
區間估計的準確度:
 是非題
3. 信賴區間的長度與準確度隨信賴水準的增加
而增加。 (X
)

信賴水準的增加 信賴區間的長度增加 (Why?)

信賴區間的長度增加精確度減少
38
區間估計的準確度:
 是非題
4. 若母體為常態分配,且母體變異數為已知,
當信賴水準不變時,母體平均數的信賴區間
長度隨樣本數的增加而變小。 (O
)
 信賴區間長度

 2Z
2

n
樣本數增加時,信賴區間長度 變小。
39
4.單一母體比例p之估計-點估計
(一) 點估計
 樣本比率 pˆ  X / n
為母體比率p之不偏估計量,且在
大樣本時, pˆ 之抽樣分配近似於常態。
 因此,母體比例p之估計是最常見估計問題之一,且一
般皆以 pˆ 來估計p,也就是說取 pˆ 為p的不偏估計
pˆ
式,因此
為p之點估計值。
 (i)(重要!!) 當樣本數n已知,且n>30時,以 pˆ 估計p
的100(1-α)%誤差界限為
z 
2
pˆ (1  pˆ )
n
∵大樣本n>30, 使用統計量
(推導) 以
Z 
ˆ  p
p
ˆ (1  p
ˆ)
p
ˆ  p
p
Z 
進行估計p
n
p (1  p )
代入公式得到
n
 P ( z / 2 
pˆ  p
pˆ (1  pˆ )
 z / 2 )  1  
 P(
pˆ  p
pˆ (1  pˆ )
/2
) 1
n
n
 P ( pˆ  p  z  / 2
d  z
 z
pˆ (1  pˆ )
) 1
n
pˆ (1  pˆ )
/2
n
為以 pˆ 估計p的100(1-α)%之誤差界限
3.單一母體比例p之估計-點估計
(ii)(重要!!) 當樣本數n未定,但n>30時,若誤差界限d已
知,則求樣本數n之方法
2
(a)
(b)
 z 
n   2  pˆ (1  pˆ )
 d 
 
z 
1 
2


n 
4  d 


ˆ 為樣本比例
p
2
p 無任何資訊
4.單一母體比例p之估計-區間估計
(i) 大樣本,抽自任意母體且為大樣本時,當樣本數
n>30 且若np ≥ 5且 n(1-p) ≥ 5) ,則使用統計量
進行區間估計
(推導)
pˆ  p
pˆ (1  pˆ )
n
pˆ  p
 P ( z / 2 
z 
pˆ (1  pˆ )
 z / 2 )  1  
n
 P ( pˆ  z  / 2
pˆ (1  pˆ )
n
 p  pˆ  z  / 2
pˆ (1  pˆ )
) 1
n
此時,母體比例p的100(1-α)%信賴區間為
pˆ  z 
pˆ (1  pˆ )
/2
n
或
ˆ  z
(p
ˆ (1  p
ˆ)
p
/2
n
ˆ  z
, p
ˆ (1  p
ˆ)
p
/2
n
)
4.單一母體比例p之區間估計
例 6. 母體比例的區間估計
 為了想瞭解女性高爾夫球員對高爾夫球課
程的看法,針對全美 900 位女性高爾夫球
員進行調查。調查結果發現,有 396 位女
性高爾夫球員對練習發球的次數感到滿
意,如此,對發球次數感到滿意的女性高
爾夫球員之母體比例的點估計為396/900=
0.44。
解:
∵大樣本n=900>30, 使用統計量
z
pˆ  p
pˆ (1  pˆ )
進行估計p
n
其中
pˆ 
396
 0 . 44
900
∴發球次數感到滿意的女性高爾夫球員之母體比例p的95%信賴
區間
pˆ  z 
pˆ (1  pˆ )
/2
n
 0 . 44  1 . 96
0 . 44 (1  0 . 44 )
900
 0 . 44  0 . 0324
∴在 95% 的信賴水準下,母體比例p的區間估計為 (0.4076,
0.4724 )。
結論是:我們有 95% 的信心說,有 40.76% 至 47.24% 的
女性高爾夫球員對其練習發球的次數感到滿意。
例 7. 樣本數
 某茶葉製造公司欲了解其在市場的佔有率,乃
在市場上進行抽樣調查。假設該公司要求樣本
比例與母體之誤差不能超過0.01,且有95%的
信賴度,則樣本數應為何?
例 7. 樣本數
解:
∵ p未知,故以 p=1/2代入,
可解得
( Z  ) P (1  P )
(1 . 96 ) 
2
n
2
( 0 . 01 )
2
2

( 0 . 01 )
2
1
4  9 , 604
∴故至少應選取9,604個樣本點。
5.單一母體變異數σ2之估計-點估計
(一) 點估計
 樣本變異數
S
為為母體變異數σ2之
2
不偏估計量。
 因此,母體變異數σ2之估計一般皆以 S
來估計σ2 ,也就是說取 S 為σ2 的不偏
2
估計式,因此
S
2
為σ2 之點估計值。
2
5.單一母體變異數σ2之估計-區間估計

隨機變數
X 1 , X 2 , , X
2
 P(
( n  1) S

2

( n  1) S

2
為一組從母體 中隨機抽出的樣
( n  1) S
本,則使用統計量
 P (  1  
n
~ 
2
2
( n 1 )
進行σ2區間估計。
2
  ) 1
2
2
2
( n  1) S
2

2

2
2
) 1
 1 
2
2
2
 此時,母體變異數σ2的100(1-α)%信賴區間為
(
(
( n  1) S

2
2
2
,
( n  1) S
 1 
2
2
2
)
例 8.單一母體變異數σ2的區間估計
 某部機器負責填充某種罐裝咖啡。如果填
充過程的變異數太大,表示機器失控則必
須送修。因此必須不斷地檢查填充過程的
變異數,測量隨機抽樣罐裝咖啡的體積並
且計算樣本變異數。一組3 0罐咖啡的隨機
樣本變異數估計 =18,540,計算母體變異數
σ2的95%信賴區間。
解:
( n  1) S
 使用統計量

2
2
~ 
2
( n 1 )
進行σ2區間估計。
 母體變異數σ2 的100(1-α)%信賴區間為
(
( n  1) S
2

2
,
2
 S  18,540
2
n  30
2
2
2
 1     0 .975 , 29  16 . 0471
2
2
母體變異數σ2 的100(1-α)%信賴區間為
(

2
2
2
,
( n  1) S
 1 
2
2
)  (
29  18540
,
29  18540
45 . 7222
2
 (11765 , 33604 )
16 . 0471
2
2
2
( n  1) S
 1 
d.f.  n - 1  29
    0 .025 , 29  45 . 7222 ,
查表
( n  1) S
)
2
)
例 9. 單一母體變異數σ2的區間估計
S
2
n
A
B
C
D
E
50
40
30
52
60
5
5
4
6
8
此樣本來自相同變異數的五個獨立常態母
體試求共同變異數σ2的95%信賴區間。
(X


2
令
SP
 X )   ( X 2  X )  ...   ( X 5  X )
2
1
2
n5
2
 X )  ...  ( X n
( X 1A  X )  ( X 2 A
2
SA 
2
( X 1B  X )  ( X 2 B
2
SB 
2
n1  1
2
 X )  ...  ( X n
2
A
2
B
 X)
2
E
 X)
( Spooled
Sample
Variance )
2
n2  1
( X 1 E  X )  ( X 2 E  X )  ...  ( X n
2
SE 
2
1
 X)
2
2
5
n5  1
 ( n  5 ) S P  ( n 1  1) S A  ( n 2  1) S B  ....  ( n 5  1) S E
2
(n  5) S P
2
2



2
2
n5
~
( n 1  1) S A
2
2


2
n
2
1 1
2
( n 2  1) S B



2

2
n2
........
1
( n 5  1) S E
2
2


 
2
2
n 5 1
 (n i  1) S i
2
解:
 (n  5) S p 
2
i
 4  50  4  40  3  30  5  52  7  60
 1130
 使用統計量
( n  5) S P
2

2
~ 
2
(n5)
進行共同變異數σ2 區間估
計。
( n 21的100(1-α)%信賴區間為
) S p ( n  1) S p
 母體共同變異數σ
2
(
2
,

2
 1 
2
2
查表
2
    0 .025 , 23  38 . 0757 ,
2
)
2
2
 1     0 .975 , 23  11 . 6885
2
2
2
母體共同變異數σ2 的95%信賴區間為
(
(n  5) S

2
2
2
p
(n  5) S
,
 1 
2
2
p
)  (
1130
38 . 0757
,
1130
)
11 . 6885
2
 ( 29 . 6777 ,
96 . 6762 )
第二部份
6. 兩個母體平均數差μ1-μ2的估計
 μ1 為母體2 的平均數,μ2 為母體2的平均數
 由母體1抽出n1 個簡單隨機樣本,由母體2中抽




出n2 個簡單隨機樣本
兩個樣本的抽取彼此互相獨立,稱為獨立簡單
隨機樣本
兩母體之標準差σ1與σ2已知
n1 與 n2 均大於30 或兩母體近似常態分配
X  X 之抽樣分配為一常態分配
1
2
6. 兩個母體平均數差μ1-μ2的估計
(1)
(一) 點估計(σ 與σ 已知)
1
2
 樣本平均數差 X 1  X 2 為母體平均數差μ1-μ2之不
偏估計量。
 因此,母體平均數差μ1-μ2估計一般皆以統計量
Z 
( X 1  X 2 )  (1   2 )
1
2
。
來估計
n1


2
2
n2
6. 兩個母體平均數差μ1-μ2的估計
(1)
(二)區間估計(σ 與σ 已知)
1
2
X1  X 2
 兩母體平均數差μ1-μ2之點估計量
1
2
 兩樣本平均數差 之的標準差
 μ1-μ2之誤差界限為

z
2
1
2

n1

n1
2
2
n2

2
2
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
X1  X
2
 z
2
 12
n1


2
2
n2
例 10.兩母體平均數之差的估計:已知 σ1與
σ2
 G百貨公司在水牛城有兩家分店,一家在市
區,另一家位於郊區的購物中心。現在假
定這位地區經理請我們替她分析這兩個地
點的顧客平均年齡是否確有差異。
 將市區分店的顧客視為母體1,而郊區分店
的顧客為母體2。
例 10. 兩母體平均數之差的推論:已知 σ1與
σ2
 依據前述之顧客人數作為統計研究的資料,兩
個母體標準差已知為 σ1=9歲與 σ2=10歲。由
Greystone顧客中蒐集到的兩個獨立簡單隨機
樣本的資料如下:
計算這兩個地點的顧客平均年齡差的95%信賴
區間。
解:
∵大樣本n1=36, n2=49>30且母體標準差σ1=9 , σ2=10已
知
∴ 使用統計量
Z 
(X1  X
2
)  (1   2 )
 12


n1
進行估計μ1 - μ2
2
2
n2
∴若使用95% 信賴水準,且 z/2=z0.025=1.96,我們可得
μ1 - μ2的95%信賴區間
X
1
 X
2
 z
 12
2
 40  35  1 . 96
 5  4 . 06
 ( 0 . 94 ~ 9 . 06 )

n1

2
2
n2
9
2
36

10
2
49
6. 兩個母體平均數差μ1-μ2的估計
(2)
(一) 點估計(σ1與σ2未知,但n1 與 n2均為大樣本)
 樣本平均數差X 1 
X
為母體平均數差μ1-μ2之不
2
偏估計量。
 由於σ1與σ2未知,但是n1 與 n2 (小於30)為小樣本,本,
此時可以 S 1   12 , S 2   22 。
2
2
 因此,母體平均數差μ1-μ2估計一般皆以統計量
來估計。
Z 
(X1  X
2
)  (1   2 )
2
S1
n1
2

S2
n2
6. 兩個母體平均數差μ1-μ2的估計
(2)
(二)區間估計(σ1與σ2未知,但n1 與 n2均為大樣本)
X1  X 2
 兩母體平均數差μ1-μ2之點估計量
2
 兩樣本平均數差 之的標準差
2
S1
2

n1
 μ1-μ2之誤差界限為
S1
2
S1
n2
2

n1
2

n1
S2
n2
z
2
S2
S2
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
2
X1  X
2
 z
2
S1
n1
2

S2
n2
6. 兩個母體平均數差μ1-μ2的估計(3)
(一) 點估計(σ1與σ2未知,但σ1=σ2=σ且n1 與 n2為
小樣本)
 樣本平均數差
X1  X
2
為母體平均數差μ1-μ2之不偏估計
量。
 由於σ1與σ2未知,但是σ1=σ2=σ ,此時以
( n 1  1) S 1  ( n 2  1) S 2
2
S
2
P

2
n1  n 2  2

2
 因此,母體平均數差μ1-μ2估計一般皆以統計量 t
來估計。
t n1 1  n 2  2 
( X 1  X 2 )  (1   2 )
S
2
p
n1

S
2
p
n2
或
t n11  n 2  2 
( X 1  X 2 )  (1   2 )
Sp
1
n1

1
n2
6. 兩個母體平均數差μ1-μ2的估計(3)
(二)區間估計(σ1與σ2未知,但σ1=σ2=σ且n1 與 n2為
小樣本)
X1  X
 兩母體平均數差μ1-μ2之點估計量
S
 兩樣本平均數差 之的標準差
2
p
S
2
1

n1
 μ1-μ2之誤差界限為
t  ,( n
S
 n2  2 )
2
2
p
n2
2
p

n1
S
2
p
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
X1  X
2
 t  ,( n
2
S
1
 n2  2 )
2
p
n1

S
2
p
n2
例 11 .兩母體平均數之差的估計: σ1與σ2未
知,但σ1=σ2=σ
 某政府單位想知道A與B家庭平均收入的差
異,已知兩母體變異數相等,抽查的結果
如下:
A市
B市
樣本數
35
40
平均收入
401,800
388,000
標準差
20,000
22,000
計算這兩個地點的顧客平均年齡差的95%
信賴區間
解:
∵大樣本n1=36, n2=49>3且母體標準差σ1=
σ2未知
∴ 使用統計量
SP 
S 
2
P
( 35  1) 20000
2
( n 1  1) S  ( n 2  1) S
2
1
2
2
n1  n 2  2
 ( 40  1) 22000

2
2
 21092
35  40  2
∴大樣本n1=36, n2=49使用統計量
(X  X
估計μ1-μ2
Z 
1
Sp
2
)  (1   2 )
1
n1

1
n2
解:
若使用95% 信賴水準,且 t/2=z0.025=1.96,我
們可得μ1 - μ2的95%信賴區間
X1  X
2
 z
2
S
2
p
n1

S
2
p
n2
 401 ,800  388 , 000  Z 0 . 025 S P
1
35

1
40
 13 ,800  1 . 96  21 , 092  0 . 2315
 13 ,800  9 , 568 . 42  ( 4 , 231 . 6 ~ 23 , 368 . 42 )
6. 兩個母體平均數差μ1-μ2的估計
(4)
(一) 點估計(σ1與σ2未知,但σ1=σ2 ≠ σ 且
n1 與 n2為小樣本)
 樣本平均數差
X1  X
2
為母體平均數差μ1-μ2之不
偏估計量。
 由於σ1與σ2未知,但是σ1=σ2 ≠ σ ,此時以
S1   1
2
2
S2   2
2
,
2
6. 兩個母體平均數差μ1-μ2的估計(4)
(一) 點估計(σ1與σ2未知,但σ1=σ2 ≠ σ 且n1 與 n2為
小樣本)
 母體平均數差μ1-μ2估計一般皆以統計量 t
來估計。
t 
(X
1
 X
2
)  (1   2 )
2
S1
2

n1
t/2 的自由度為 ν
一般無條件捨去取
整數值
S2
n2
s
s 



n2 
 n1
2
1
df 
2
2
2
2
s 
1 s 

 


n1  1  n1 
n2  1  n2 
1
2
1
2
2
2
6. 兩個母體平均數差μ1-μ2的估計(4)
(二)區間估計(σ1與σ2未知,但σ1=σ2 ≠ σ且n1 與 n2為
小樣本)
X1  X
 兩母體平均數差μ1-μ2之點估計量
2
 μ1-μ2之誤差界限為
2
S1
 兩樣本平均數差 之的標準差
t  ,

n2
2
S2
2

n1
2
S2
n1
S1
2
n2
 兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
2
X1  X
2
 t  ,
2
S1
n1
2

S2
n2
例 12 .兩母體平均數之差的估計:σ1與σ2未知,
但σ1=σ2 ≠ σ
 國家銀行正進行一項在其兩家分行的顧客支票
帳戶之平均差異的調查。Cherry Grove分行中
簡單隨機抽樣28個支票帳戶,Beechmont分行
亦獨立簡單隨機抽樣22個支票帳戶。每一個支
票帳戶的目前支票帳戶平均餘額均加以記錄。
帳戶平均餘額之摘要如下:
例 12.兩母體平均數之差的估計: σ1與σ2未
知,但σ1=σ2 ≠ σ
 Clearwater國家銀行欲估計Cherry Grove與
Beechmont顧客母體支票帳戶平均數之差異
的95%信賴區間估計。
解: Cherry Grove分行樣本資料顯示 n1=28,x1
=$1,025與 s1=$150,而Beechmont分行則
為 n2=22, x2 =$910, s2=$125。t/2 之自由
度計算如下:
解:
 我們將非整數之自由度無條件捨去取整數值為
47,以獲得較大的 t值及較為保守的區間估計。
使用 t分配表與自由度47,可求得 t0.025,47=
2.012。
 建立兩母體平均數之差的95%信賴區間如下:
∴ 兩母體平均數之差的95%信賴區間估計值為(37,
193)。
6.成對母體平均數差μ1-μ2的估計(5)
 μ1 為母體2 的平均數,μ2 為母體2的平均數
 自母體中抽取元素,對同一元素蒐集實驗前後
兩個觀察值所構成的樣本稱為成對樣本(paired
samples)。
 成對樣本的母體彼此不互相獨立。
6.成對母體平均數差μ1-μ2的估計(5)
成對母體與成對樣本
成對差母體
成對母體
X1 X 2
D  X1  X 2
1
D1
M
M
1 X 11 X 21
M
M
N X 1N
M
X 2N
N
DN
抽
樣
抽
樣
1
D  X1  X 2
X1
X2
X 11
X 21
1
D1
M
M
M
n
M
n X 1n
X 2n
Dn
D 1  X 11  X 21 , D 2  X 12  X 22 ,.... D n1  X 1 n  X 2 n
6.成對母體平均數差μ1-μ2的估計(5)
(一) 點估計(配對樣本)
 令
D 1  X 11  X 21 , D 2  X 12  X 22 ,.... D n1  X 1 n  X 2 n
則把(D1,D2,. . . . . . ,Dn)視為另一個由母體抽出的隨機
樣本
 配對樣本平均數 D 
D 1  D 2  ..... D n
n
不偏估計量。
D
2
 (!!) E ( D )   D
Var ( D )   D 
2
n
為母體平均數差 μ1-μ2之
6. 成對母體平均數差統計量
 成對母體平均數差  D 使用的統計量
大樣本母體變異數已知:
Z 
D  D
D
n
大樣本母體變異數未知:
Z 
D  D
SD
n
小樣本母體常態變異數已知:
Z 
D  D
D
n
小樣本母體常態變異數未知:
t 
D  D
SD
n
6. 成對母體平均數差的區間估計
(二)區間估計
 成對母體平均數差 D 的信賴區間
大樣本變異數
D  Z  / 2
D
已知
式中:
大樣本變異數
D  Z /2S D
2
D
2
D
D


D
n
未知
式 中: S D 
SD
n
, SD 
 小 樣 本 母 體 分 配 為 常 態 分 配 ,
D  Z  / 2 D
2
D
已知
 小 樣 本 母 體 分 配 為 常 態 分 配 ,
D  t n  1 , / 2 S D
2
D
未知
D
2
 ( D ) / n
2
n 1
。
例 13 .成對母體平均數差的區間估計
例13.成對母體平均數差的區間估計
例 13. 小樣本,變異數σ 未知
解:
∵小樣本n=7<30,母體變異數σ2 未知
使用統計量
t 
D  D
SD
n
E (D )   D
D 
 1 .5  5 .4  3 .6  6 .9  5 .5  2 .7  2 .3
 3 . 557
7
SD
2

SD 

X
2
i
 nX
n 1
SD
2
2
 7 . 7062
 2 . 776
∴使用前後平均體重差μ1-μ2 的95%信賴區間
3 . 557  t 0 .025 , 6
2 . 776
D  t / 2
 3 . 557  2 . 447  1 . 1333
6
 3 . 557  2 . 773  ( 0 . 784 ~ 6 . 330 )
SD
n
7.兩個母體比例差p1-p2的估計
 樣本比例差
pˆ 1  pˆ 2
為母體比例差p1-p2之不偏估
計量。
 獨立大樣本母體比例 pˆ 1 
。 平均數
E ( pˆ  pˆ )  
變異數
V a (rpˆ 1  pˆ 2 )  
1
2
pˆ 2 的抽樣分配
pˆ 1  pˆ 2
 p p
2
pˆ 1  pˆ 2
1

式中: q1  1  p1 , q 2  1  p 2 。
p1 q1
n1
2

p2q2
n2
7.兩個母體比例差p1-p2的估計

兩個母體比例差p1-p2使用的統計量
大樣本母體比例P1, P2已知: Z 
pˆ 1  pˆ 2  ( p 1  p 2 )
p 1 (1  p 1 )

p 2 (1  p 2 )
n1
n2
大樣本母體變異數未知:
Z 
pˆ 1  pˆ 2  ( p 1  p 2 )
pˆ 1 (1  pˆ 1 )

n1
Z 
pˆ 2 (1  pˆ 2 )
n2
pˆ 1  pˆ 2  ( p 1  p 2 )
0 .5 ( 0 .5 )
n1

0 .5 ( 0 .5 )
n2
或
7. 兩個母體比例差p1-p2的區間估計
 大樣本母體比例差的信賴區間
( pˆ 1  pˆ 2 )  Z  / 2 S pˆ 1  pˆ 2
式中: S pˆ 1  pˆ 2 

pˆ 1 qˆ 1

pˆ 2 qˆ 2
n1
n2
母體比例差的信賴區間
( pˆ 1  pˆ 2 )  Z  / 2 S pˆ 1  pˆ 2
1
式中: S pˆ
ˆ
1  p2


2
1
1

2  2
n1
1
2
n2
例 14.兩個母體比例差p1-p2的區間估計
 某大城市中隨機抽120位的成年男子,其中有38位沒9抽
煙的習慣,又隨機抽出72位的成年女子,其中有51位沒
有抽煙的習慣。
(1) 估計此城市成年男子中與成年女子中沒有抽煙習慣的
比例差之95%誤差界限?
ˆ1 
p
x1

n1
38
 0 . 3167
ˆ2 
p
120
Z 0 . 05
95%誤差界限=
 1 . 96
pˆ 1 (1  pˆ 1 )

n1
x2
n2
51
 0 . 7083
72
pˆ 2 (1  pˆ 2 )
n2
0 . 3167 (1  0 . 3167 )
 1 . 96  . 06836
 0 . 1340

120

0 . 7083 (1  0 . 7083 )
72
(2) 求此城市成年男子中與成年女子
沒有抽煙習慣的比例差之95%信賴區間?
解:
∴沒有抽煙習慣的比例差p1-p2 的95%信賴區間
pˆ 1  pˆ 2  Z 0 .05
pˆ 1 (1  pˆ 1 )
n1
 0 . 3167  0 . 7083  0 . 1340
 (  0 . 5256 ,  0 . 2576 )

pˆ 2 (1  pˆ 2 )
n2
8. 兩個母體變異數比的統計推論
2

2
S1
S2
1  2
2
2
2
的分配
2
S1
S2


2
1
2
2

2
 12
2
2

S1
S
2
2
~ F n1  1 , n 2  1
8. 兩個母體變異數比的統計推論

區間估計
2
使用統計量 F分配
2
S1
S2


2
1
2
2

2
 12
2
2

S1
S
2
2
~ F n1  1 , n 2  1
f (F )
F 1 , 2
0
F 1 , 2 ,1 / 2
F 1 , 2 , / 2
F
8. 兩個母體變異數比的統計推論
 區間估計
 母體變異數比的1-α信賴區間
S1  1
2
 P ( F1  

2

S
2
2
 P(
S1
S
2
2

2
2

S
2
2

2

F n 1  1 , n 2  1 , / 2
S1
 F )  1  
1
2
1
2

2
2
2

1
F n 1  1 , n 2  1 , / 2
2
2
2

S1
S
1
2
2
2


2
2
1

F n 1  1 , n 2  1 ,1   / 2
2

) 1
S1
S
2
2

1
F n1 1 , n 2 1 ,1   / 2
例 15.兩個母體變異數比的統計推論
 已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90%信賴區間。
單一母體變異數σ2的
(
100(1-α)%信賴區間為
( n  1) S

2
2
2
,
( n  1) S
 1 
2
2
)
2
(
女生身高變異數的90%信賴區間
(10  1) 36 (10  1) 36
324
324
(
,
)(
,
)  (19 . 15 ~ 97 . 44 )
2
2
16 . 9190 3 . 3251
 9 , 0 .05
 9 , 0 .95
例 15.兩個母體變異數比的統計推論
 已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90%信賴區間。
單一母體母體變異數σ2的
(
( n  1) S
100(1-α)%信賴區間為

2
2
2
,
( n  1) S
 1 
2
2
)
2
(
男生身高變異數的90%信賴區間
(
( 9  1) 49 ( 9  1) 49
392
392
,
)

(
,
)  ( 25 . 28 ~ 143 . 45 )
2
2
15 . 5073 2 . 7326
 8 , 0 .05
 8 , 0 .95
例 15.兩個母體變異數比的統計推論
 已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90%信賴區間。
母體變異數σ2的100(1-α)%信賴區間為
(
(
( n  1) S

2
2
2
,
( n  1) S
 1 
2
2
)
2
男生身高變異數的90%信賴區間
(
( 9  1) 49 ( 9  1) 49
392
392
,
)

(
,
)  ( 25 . 28 ~ 143 . 45 )
2
2
15 . 5073 2 . 7326
 8 , 0 .05
 8 , 0 .95
 已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(2) 試分別求女生對男生身高變異數比與標準差比的90%
信賴區間。
1
2
兩個母體變異數比 
2
S1
2
2
2
的100(1-α)%信賴區間為
1


F n 1  1 , n 2  1 ,
S2
 12

/ 2
1
2
2
2

S1
2
S2
1

F n 1  1 , n 2  1 ,1  
2
女生對男生身高變異數比
36
(
49

2
2
的90%信賴區間
36
,
49
)(
0 . 7347
F 9 , 8 , 0 .05 F 9 , 8 , 0 .95
女生對男生身高標準差
3 . 39
1

,
0 . 7347
)  ( 0 . 217 ~ 2 . 37 )
1 3 . 23
的90%信賴區間
2
( 0 . 217 , 2 . 37 )  ( 0 . 4658 , 1 . 539 )
/ 2