Transcript 上課ppt
第八章 統計估計
學習目標
瞭解點估計的意義、估計的步驟與限制。
瞭解優良估計式的性質。
瞭解區間估計的意義。
瞭解大樣本與小樣本母體常態、變異數已知
與未知下,單一母體平均數區間估計的方
法。
知悉t分配的意義與機率值。
瞭解單一母體比例區間估計的方法。
瞭解單一母體變異數區間估計的方法。
瞭解卡方分配的意義與卡方值。
統計推論
統計推論(statistical inference)是我們從樣本中獲得關於母體的
資訊並且從中推導出結論的程序。
統計
資料
資訊
母體
Population
推論
樣
本
Sample
Inference
參數
Parameter
統計量
Statistic
為了做推論, 我們需要敘述統計、機率分配及抽樣分配的技術和知識。
估計的概念
估計的目的是在樣本統計量的基礎上,決定一個
母體參數的近似值。
有兩種估計的類型:
點估計量
(point estimator)
區間估計量
(interval estimator)
點估計量
一個點估計量(point estimator) 藉著一個單一數
值或點來估計母體的未知參數,以對母體進行推
論。
先前看到連續分配的點機率幾乎是0。同樣地,
我們期望點估計量會依樣本量的增加而更接近參
數值。但是,點估計量沒有能力反映較大樣本的
效果。因此,我們將使用區間估計量(interval
estimator)估計母體參數。
點估計量與區間估計量
假設一位統計學教授想要估計其商學院二年學生的平均
暑期收入。隨機選出25 位學生(n=25), 計算的樣本平均
週薪是$400。
點估計量
區間估計量
另一種說法:
二年級商學院學生暑期的平均週薪是介於$380 與$420 之
間。
點估計量品質
估計量品質是包括不偏性 (unbiasedness)、一致性
(consistency)、相對有效性(relative efficiency):
1. 不偏性
若估計式的平均數等於母體參數值,則該估計式為
不偏估計式(unbiased estimator) ,否則為偏誤估計式
(biased estimator) 。
即若 E (ˆ ) ,則 ˆ 為 的不偏估計式。
例:樣本平均數 X 與 S
2
n
1
(X
n 1
i
X)
i 1
平均數 µ 與σ2的不偏估計式。
E(X )
E (S )
2
2
2
分別是母體
點估計量品質
2. 一致性
一個不偏估計量被稱為是一致的(consistent),假如隨著樣本大
小的變大,估計量與參數間的差異會隨之變小。
ˆ
若 n 為不偏誤估計式或漸近不偏估計式,當 n ,其變異
數趨近於零,即
lim V (ˆn ) 0
n
則ˆn 為 的一致性估計式。
例: X 是 µ 的一個一致性估計量,因為:
Var ( X )
X
2
n
lim Var ( X ) lim
n
n
2
n
0
點估計量品質
3. 有效性
如果一個參數有兩個不偏估計量,變異數比較小的
那一個被稱為是相對的比較有效(relatively more
efficient)。
ˆ 均為 的不偏誤估計式, 若
即 設ˆ 、ˆ
Var (ˆ )
1
ˆ
Var (ˆ )
ˆ 為有效估計式。
則 ˆ 相對 ˆ
3. 相對有效性
例:樣本平均數 及樣本中位數Me都是母體平均數的不
偏估計值,然而,樣本中位數Me擁有比樣本平均數 更
大的變異數,所以我們選擇 ,因為與樣本中位數比較
, 其相對的比較有效。
因此,樣本平均數 是母體平均數 µ “最好/佳”估計值。
例1:估計式的相對有效性評斷標準
X 與Me的相對有效性
_
X的抽樣分配
Me的抽樣分配
_
E(Me)=E(X)
統計量
μ
母體參數
例2:不偏性、相對有效性
隨機變數 X
為一組以抽出放回的
方式,從母體 中 N ( , ) 隨機抽出的樣本, n 3
現以 ˆ 1 X 與 ˆ 1 ( X X ) 來估計μ ,
1
, X 2 , , X
n
2
n 1
1
n2
i
i2
2
2
1
n
試比較此二估計式的不偏性、相對有效
性。
例2:不偏性、相對有效性
解: (1) 不偏性
E ( ˆ 1 ) E (
1
n 1
n2
Xi)
i2
E ( ˆ 2 ) E [
ˆ 1
與
1
ˆ 2
2
( X 1 X n )]
1
n 1
n2
i2
1
2
E(X i)
1
n2
[ E ( X 1 ) E ( X n )]
皆為 之不偏估計式。
1
2
(n 2)
( )
例2:不偏性、相對有效性
解: (2)相對有效性
V ( ˆ 1 ) V (
1
n 1
n2
Xi)
1
( n 2 )
(n 2)
i2
(n 2)
2
1
n 1
1
2
2
V (X
i
)
i2
2
n2
1
2
V ( ˆ 2 ) V [ ( X 1 X n )] [V ( X 1 ) V ( X n )]
2
4
2
n=3
μ2相對μ1 具相對有效性
Var ( ˆ 1 )
Var ( ˆ 2 )
2
n 2
n=4
μ1 與μ2 具相同的有效性
n>4
μ1 相對 μ2具相對有效性
例3:不偏性、一致性
隨機變數
X 1 , X 2 , , X
n
為一組以抽出放回
的方式,從母體 中 N ( ,
本,現以 S
2
1
n
(X
n 1
i 1
i
X)
2
2
)
隨機抽出的樣
估計σ2 ,試比較
此估計式的不偏性、一致性。
例3:不偏性、一致性
解: (1) 不偏性
n
(X
X)
i
i 1
已知
2
~ n 1 , E ( n 1 ) n 1, V ( n 1 ) 2 ( n 1)
2
2
2
2
n
(X
E(
( n 1) S
S
2
X )
i 1
2
( n 1) S
2
) n 1 E( S
2
2
2
~ n 1
2
2
2
1
i
) ( n 1)
2
n 1
n
(X
n 1
i 1
i
X)
2
為σ2 之不偏估計式。
2
例3:不偏性、一致性
解: (2)一致性
n
已知
(X i X )
2
i 1
~ n 1 , Var ( n 1 ) 2 ( n 1)
2
2
Var (
( n 1) S
2
Var( S
2
2
) 2 ( n 1)
) 2 ( n 1)
lim Var ( S ) lim
n
S
1
2
) Var ( n 1 ) 2 ( n 1)
4
( n 1)
2
2
2
~ n 1
2
4
Var( S
2
2
2
( n 1)
又
2
( n 1) S
n
2
2
2
4
( n 1)
4
n 1
0
n
(X
n 1
i 1
i
X)
2
為σ2 之一致性估計式。
區間估計的意義
對未知的母體參數估計出一個上下限的區間,並指出該
區間包含母體參數的可靠度。
點估計量的值不會恰好等於母體參數值。
區間估計值 (interval estimate) 通常是由點估計值加或減
某個值求得,我們稱這個加減值是邊際誤差 (margin of
error)。
信賴區間:是在一個既定的信賴水準下所構成的一個區間。
區間估計值的一般形式是:
點估計值 邊際誤差
信賴水準(信賴係數) :是指信賴區間包含母體參數的信
心(或稱可靠度)。
區間估計值可以讓我們瞭解:點估計值與母體參數值的
接近程度。
區間估計量
一個區間估計量(interval estimator)使用一個區間
來估計母體未知參數的值,以對母體進行推論。
這就是我們所說的 (有某些 ___% 確實性) 關注的
母體參數在下限及上限的範圍之間。
第一部份
3.單一母體平均數μ之估計
(一) 定義:
(1) 設(X1,X2,. . . . . . ,Xn)為由母體f(x) 中抽出的n個隨機
樣本,若θ為此母體之參數,設T1、T2為兩個統計量,
使得 P( T1≦θ≦T2)=1-α
則稱(T1, T2) 為θ 的100(1-α) %信賴區間,而稱1-α為信賴度
(confidence level)
(2) 若 為θ之估計式,若
P ( ˆ d ) 1
計θ的100(1-α)%誤差界限。
,則稱d為以 ˆ 估
3.單一母體平均數μ之估計-點估計
(二) 點估計
(1)母體平均數μ之估計是最常見估計問題之一,且
一般皆以 X 來估計μ,也就是說取 X 為μ的估計
式,因此 X 為μ之點估計值。
(i)(重要!!) 當樣本數n已知,且n>30時,以
100(1-α)%誤差界限為
d z
2
n
P ( ˆ d ) 1 ( 定義 )
(思考方式)
P( X d ) 1
X
估計μ的
∵大樣本n>30, 使用統計量
(推導) 以 z
x
/
n
x
/
n
進行估計μ
代入公式得到
P ( z / 2
P(
z
x
/ n
x
/
n
z / 2 ) 1
z / 2 ) 1
P x z / 2
1
n
d z
2
n
為以
X
估計μ的100(1-α)%之誤差界限
3.單一母體平均數μ之估計-點估計
(ii)(重要!!)當樣本數n未定,但n>30時,若誤差界限d已
知,則樣本數為n為
(思考方式)
2
z
2
d
d z
n
2
d
2
2
(z )
2
2
n
2
z
n 2
d
2
2
3.單一母體平均數μ之估計-區間估計
(i) 大樣本,母體變異數 已知)
抽自任意母體且為大樣本時,當樣本數n>30且母體變
異數 已知,則使用統計量
(推導)
P ( z / 2
P
x z
x
/
/2
n
n
Z
X
n
進行區間估計
z / 2 ) 1
x z
/2
1
n
此時,母體平均數μ的100(1-α)%信賴區間為
X z / 2
n
或
( X z
/2
n
, X z
/2
n
)
3.單一母體平均數μ之估計-區間估計
(i) 大樣本,母體變異數 已知)
區間可以表示成
信賴下限 (Lower confidence limit) =
x z / 2
n
信賴上限(Upper confidence limit) =
x
z
/2
n
其中 機率1 – α 稱為信賴水準 ,為測量區間實際包含 µ 的機
率。
3.單一母體平均數μ之估計-區間估計
(ii) (大樣本,變異數 未知,且樣本數n>30)
當樣本數n>30且母體變異數 未知,可用S2來 取
代
σ2 ,則使用統計量 Z
(推導) P ( z / 2
P
x z
S/
n
X
S
進行區間估計
n
x
S
/2
n
z / 2 ) 1
x z
1
n
S
/2
此時,母體平均數μ的100(1-α)%信賴區間為
X z / 2
S
n
或
( X z
S
/2
n
, X z
S
/2
n
)
3.單一母體平均數μ之估計-區間估計
(iii) (母體為有限且採取不歸還抽樣)
(a) 以 估計μ的100(1-α)%誤差界限為
N n
N 1 n
2
d z
2
(b) 母體平均數μ的100(1-α)%信賴區間為
(X z
2
N n
N 1
2
n
, X z
2
N n
N 1
2
n
)
3.單一母體平均數μ之估計-區間估計
(iv) (小樣本,變異數 未知,且樣本數n<30)
當樣本數n<30且母體變異數 未知,可用S2來 取
代
(推導)
σ2 ,則使用統計量 t
P ( t / 2
P
x t
x
S /
S
/ 2
( n 1 )
n
n
X
進行區間估計
S
n
t / 2 ) 1
x t
1
n
S
/ 2
此時,母體平均數μ的100(1-α)%信賴區間為
X t
/2
S
n
或
( X t
S
/2
n
, X t
S
/2
n
)
例 4. 大樣本
一家雜誌社欲知其讀者的平均年齡,以作為雜誌內容
走向的參考,根據其對訂閱戶抽查所得的讀者平均年
齡為36歲。
(a) 當樣本數為49,母體標準差為6歲,求該雜誌讀者平
均年齡的95%信賴區間。
解: ∵大樣本n=49>30,母體變異數σ2 已知
使用統計量
Z
X
進行估計μ
n
∴平均年齡μ的95%信賴區間
X z
/ 2
n
36 Z 0 . 025
6
49
( 34 . 32 ~ 37 . 68 )
例 4. 大樣本
(b)當樣本數為49,樣本標準差為6歲,求該雜誌讀者平
均年齡的95%信賴區間。
解:
∵大樣本n=49>30,母體變異數σ2 未知
使用統計量 Z X 進行估計μ
S
n
∴平均年齡μ的95%信賴區間
X z
S
/2
n
36 Z 0 . 025
6
49
( 34 . 32 ~ 37 . 68 )
例 4. 小樣本
(c)當樣本數為25,母體分配為常態,樣本標準差為6歲,
求該雜誌讀者平均年齡的95%信賴區間。
解:
∵小樣本n=25<30,母體變異數σ2 未知
使用統計量 t X 進行估計μ
n 1
S
n
∴平均年齡μ的95%信賴區間
X t / 2
S
n
36 t 0 . 025 , 24
6
25
( 33 . 5232 ~ 38 . 4768 )
例 5. 小樣本,變異數σ 未知
為了檢驗某款迷你車的耗油量,經測試1公升
的油料所能行駛的里程數6次,分別是17.2、
16.5、17.5、17.7、16.1、15.9公里。若假設里
程數為常態分配,試求該款車1公升油料平均
所行駛之里程數的95%信賴區間。
例 5. 小樣本,變異數σ 未知
∵小樣本n=6<30,母體變異數σ2 未知
解:
使用統計量
t n 1
X
S
n
X
17 . 2 16 . 5 17 . 5 17 . 7 16 . 1 15 . 9
16 . 82
6
S
2
S
X
2
i
nX
2
n 1
S
2
1699 . 65 1697 . 47
0 . 5697
5
0 . 7548
∴平均平均里程數μ的95%信賴區間
6 . 82 t 0 .025 , 5
0 . 7548
X t / 2
16 . 82 2 . 571 0 . 308
6
16 . 82 0 . 79 (16 . 03 ~ 17 . 61 )
S
n
區間估計的準確度:
在信賴區間長度相同之下,信賴水準1- α越大
則準確度越大。
當信賴水準1-α相同時,信賴區間長度越短則
準確度越大。
信賴敘述的結論永遠是針對母體而不是樣本。
信賴水準1- α越大,則誤差界限越大。
報告誤差界限時,用95%的信賴水準是很普遍
的。
在同樣的信賴水準下,要求較小的誤差界限
時,只要增加樣本數就成了。
35
區間估計的準確度:
是非題
1. 點估計通常較區間估計更精確。
(X
)
點估計值估計母體參數時,可能完全正確或完全不
正確,且其估計正確的可靠度未知;
而區間估計的可靠度即信賴係數,故可知區間估計
的可靠度較點估計為佳。
36
區間估計的準確度:
是非題
2. 當母體變異數未知,但已知母體為常態分配
時,用Z分配與t分配所求得的母體平均數的
信賴區間的長度是一樣的。 (X
Z分配信賴區間長度
t分配信賴區間長度
S
2Z
)
n
2
S
2 t n 1,
n
2
當樣本數 很大時 t n 1,
樣,
t n 1,
但樣本數不很大時,
賴區間會較長
Z
2
2
,兩個區間長度會一
Z
2
2
,故用t分配求得的信
37
區間估計的準確度:
是非題
3. 信賴區間的長度與準確度隨信賴水準的增加
而增加。 (X
)
信賴水準的增加 信賴區間的長度增加 (Why?)
信賴區間的長度增加精確度減少
38
區間估計的準確度:
是非題
4. 若母體為常態分配,且母體變異數為已知,
當信賴水準不變時,母體平均數的信賴區間
長度隨樣本數的增加而變小。 (O
)
信賴區間長度
2Z
2
n
樣本數增加時,信賴區間長度 變小。
39
4.單一母體比例p之估計-點估計
(一) 點估計
樣本比率 pˆ X / n
為母體比率p之不偏估計量,且在
大樣本時, pˆ 之抽樣分配近似於常態。
因此,母體比例p之估計是最常見估計問題之一,且一
般皆以 pˆ 來估計p,也就是說取 pˆ 為p的不偏估計
pˆ
式,因此
為p之點估計值。
(i)(重要!!) 當樣本數n已知,且n>30時,以 pˆ 估計p
的100(1-α)%誤差界限為
z
2
pˆ (1 pˆ )
n
∵大樣本n>30, 使用統計量
(推導) 以
Z
ˆ p
p
ˆ (1 p
ˆ)
p
ˆ p
p
Z
進行估計p
n
p (1 p )
代入公式得到
n
P ( z / 2
pˆ p
pˆ (1 pˆ )
z / 2 ) 1
P(
pˆ p
pˆ (1 pˆ )
/2
) 1
n
n
P ( pˆ p z / 2
d z
z
pˆ (1 pˆ )
) 1
n
pˆ (1 pˆ )
/2
n
為以 pˆ 估計p的100(1-α)%之誤差界限
3.單一母體比例p之估計-點估計
(ii)(重要!!) 當樣本數n未定,但n>30時,若誤差界限d已
知,則求樣本數n之方法
2
(a)
(b)
z
n 2 pˆ (1 pˆ )
d
z
1
2
n
4 d
ˆ 為樣本比例
p
2
p 無任何資訊
4.單一母體比例p之估計-區間估計
(i) 大樣本,抽自任意母體且為大樣本時,當樣本數
n>30 且若np ≥ 5且 n(1-p) ≥ 5) ,則使用統計量
進行區間估計
(推導)
pˆ p
pˆ (1 pˆ )
n
pˆ p
P ( z / 2
z
pˆ (1 pˆ )
z / 2 ) 1
n
P ( pˆ z / 2
pˆ (1 pˆ )
n
p pˆ z / 2
pˆ (1 pˆ )
) 1
n
此時,母體比例p的100(1-α)%信賴區間為
pˆ z
pˆ (1 pˆ )
/2
n
或
ˆ z
(p
ˆ (1 p
ˆ)
p
/2
n
ˆ z
, p
ˆ (1 p
ˆ)
p
/2
n
)
4.單一母體比例p之區間估計
例 6. 母體比例的區間估計
為了想瞭解女性高爾夫球員對高爾夫球課
程的看法,針對全美 900 位女性高爾夫球
員進行調查。調查結果發現,有 396 位女
性高爾夫球員對練習發球的次數感到滿
意,如此,對發球次數感到滿意的女性高
爾夫球員之母體比例的點估計為396/900=
0.44。
解:
∵大樣本n=900>30, 使用統計量
z
pˆ p
pˆ (1 pˆ )
進行估計p
n
其中
pˆ
396
0 . 44
900
∴發球次數感到滿意的女性高爾夫球員之母體比例p的95%信賴
區間
pˆ z
pˆ (1 pˆ )
/2
n
0 . 44 1 . 96
0 . 44 (1 0 . 44 )
900
0 . 44 0 . 0324
∴在 95% 的信賴水準下,母體比例p的區間估計為 (0.4076,
0.4724 )。
結論是:我們有 95% 的信心說,有 40.76% 至 47.24% 的
女性高爾夫球員對其練習發球的次數感到滿意。
例 7. 樣本數
某茶葉製造公司欲了解其在市場的佔有率,乃
在市場上進行抽樣調查。假設該公司要求樣本
比例與母體之誤差不能超過0.01,且有95%的
信賴度,則樣本數應為何?
例 7. 樣本數
解:
∵ p未知,故以 p=1/2代入,
可解得
( Z ) P (1 P )
(1 . 96 )
2
n
2
( 0 . 01 )
2
2
( 0 . 01 )
2
1
4 9 , 604
∴故至少應選取9,604個樣本點。
5.單一母體變異數σ2之估計-點估計
(一) 點估計
樣本變異數
S
為為母體變異數σ2之
2
不偏估計量。
因此,母體變異數σ2之估計一般皆以 S
來估計σ2 ,也就是說取 S 為σ2 的不偏
2
估計式,因此
S
2
為σ2 之點估計值。
2
5.單一母體變異數σ2之估計-區間估計
隨機變數
X 1 , X 2 , , X
2
P(
( n 1) S
2
( n 1) S
2
為一組從母體 中隨機抽出的樣
( n 1) S
本,則使用統計量
P ( 1
n
~
2
2
( n 1 )
進行σ2區間估計。
2
) 1
2
2
2
( n 1) S
2
2
2
2
) 1
1
2
2
2
此時,母體變異數σ2的100(1-α)%信賴區間為
(
(
( n 1) S
2
2
2
,
( n 1) S
1
2
2
2
)
例 8.單一母體變異數σ2的區間估計
某部機器負責填充某種罐裝咖啡。如果填
充過程的變異數太大,表示機器失控則必
須送修。因此必須不斷地檢查填充過程的
變異數,測量隨機抽樣罐裝咖啡的體積並
且計算樣本變異數。一組3 0罐咖啡的隨機
樣本變異數估計 =18,540,計算母體變異數
σ2的95%信賴區間。
解:
( n 1) S
使用統計量
2
2
~
2
( n 1 )
進行σ2區間估計。
母體變異數σ2 的100(1-α)%信賴區間為
(
( n 1) S
2
2
,
2
S 18,540
2
n 30
2
2
2
1 0 .975 , 29 16 . 0471
2
2
母體變異數σ2 的100(1-α)%信賴區間為
(
2
2
2
,
( n 1) S
1
2
2
) (
29 18540
,
29 18540
45 . 7222
2
(11765 , 33604 )
16 . 0471
2
2
2
( n 1) S
1
d.f. n - 1 29
0 .025 , 29 45 . 7222 ,
查表
( n 1) S
)
2
)
例 9. 單一母體變異數σ2的區間估計
S
2
n
A
B
C
D
E
50
40
30
52
60
5
5
4
6
8
此樣本來自相同變異數的五個獨立常態母
體試求共同變異數σ2的95%信賴區間。
(X
2
令
SP
X ) ( X 2 X ) ... ( X 5 X )
2
1
2
n5
2
X ) ... ( X n
( X 1A X ) ( X 2 A
2
SA
2
( X 1B X ) ( X 2 B
2
SB
2
n1 1
2
X ) ... ( X n
2
A
2
B
X)
2
E
X)
( Spooled
Sample
Variance )
2
n2 1
( X 1 E X ) ( X 2 E X ) ... ( X n
2
SE
2
1
X)
2
2
5
n5 1
( n 5 ) S P ( n 1 1) S A ( n 2 1) S B .... ( n 5 1) S E
2
(n 5) S P
2
2
2
2
n5
~
( n 1 1) S A
2
2
2
n
2
1 1
2
( n 2 1) S B
2
2
n2
........
1
( n 5 1) S E
2
2
2
2
n 5 1
(n i 1) S i
2
解:
(n 5) S p
2
i
4 50 4 40 3 30 5 52 7 60
1130
使用統計量
( n 5) S P
2
2
~
2
(n5)
進行共同變異數σ2 區間估
計。
( n 21的100(1-α)%信賴區間為
) S p ( n 1) S p
母體共同變異數σ
2
(
2
,
2
1
2
2
查表
2
0 .025 , 23 38 . 0757 ,
2
)
2
2
1 0 .975 , 23 11 . 6885
2
2
2
母體共同變異數σ2 的95%信賴區間為
(
(n 5) S
2
2
2
p
(n 5) S
,
1
2
2
p
) (
1130
38 . 0757
,
1130
)
11 . 6885
2
( 29 . 6777 ,
96 . 6762 )
第二部份
6. 兩個母體平均數差μ1-μ2的估計
μ1 為母體2 的平均數,μ2 為母體2的平均數
由母體1抽出n1 個簡單隨機樣本,由母體2中抽
出n2 個簡單隨機樣本
兩個樣本的抽取彼此互相獨立,稱為獨立簡單
隨機樣本
兩母體之標準差σ1與σ2已知
n1 與 n2 均大於30 或兩母體近似常態分配
X X 之抽樣分配為一常態分配
1
2
6. 兩個母體平均數差μ1-μ2的估計
(1)
(一) 點估計(σ 與σ 已知)
1
2
樣本平均數差 X 1 X 2 為母體平均數差μ1-μ2之不
偏估計量。
因此,母體平均數差μ1-μ2估計一般皆以統計量
Z
( X 1 X 2 ) (1 2 )
1
2
。
來估計
n1
2
2
n2
6. 兩個母體平均數差μ1-μ2的估計
(1)
(二)區間估計(σ 與σ 已知)
1
2
X1 X 2
兩母體平均數差μ1-μ2之點估計量
1
2
兩樣本平均數差 之的標準差
μ1-μ2之誤差界限為
z
2
1
2
n1
n1
2
2
n2
2
2
n2
兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
X1 X
2
z
2
12
n1
2
2
n2
例 10.兩母體平均數之差的估計:已知 σ1與
σ2
G百貨公司在水牛城有兩家分店,一家在市
區,另一家位於郊區的購物中心。現在假
定這位地區經理請我們替她分析這兩個地
點的顧客平均年齡是否確有差異。
將市區分店的顧客視為母體1,而郊區分店
的顧客為母體2。
例 10. 兩母體平均數之差的推論:已知 σ1與
σ2
依據前述之顧客人數作為統計研究的資料,兩
個母體標準差已知為 σ1=9歲與 σ2=10歲。由
Greystone顧客中蒐集到的兩個獨立簡單隨機
樣本的資料如下:
計算這兩個地點的顧客平均年齡差的95%信賴
區間。
解:
∵大樣本n1=36, n2=49>30且母體標準差σ1=9 , σ2=10已
知
∴ 使用統計量
Z
(X1 X
2
) (1 2 )
12
n1
進行估計μ1 - μ2
2
2
n2
∴若使用95% 信賴水準,且 z/2=z0.025=1.96,我們可得
μ1 - μ2的95%信賴區間
X
1
X
2
z
12
2
40 35 1 . 96
5 4 . 06
( 0 . 94 ~ 9 . 06 )
n1
2
2
n2
9
2
36
10
2
49
6. 兩個母體平均數差μ1-μ2的估計
(2)
(一) 點估計(σ1與σ2未知,但n1 與 n2均為大樣本)
樣本平均數差X 1
X
為母體平均數差μ1-μ2之不
2
偏估計量。
由於σ1與σ2未知,但是n1 與 n2 (小於30)為小樣本,本,
此時可以 S 1 12 , S 2 22 。
2
2
因此,母體平均數差μ1-μ2估計一般皆以統計量
來估計。
Z
(X1 X
2
) (1 2 )
2
S1
n1
2
S2
n2
6. 兩個母體平均數差μ1-μ2的估計
(2)
(二)區間估計(σ1與σ2未知,但n1 與 n2均為大樣本)
X1 X 2
兩母體平均數差μ1-μ2之點估計量
2
兩樣本平均數差 之的標準差
2
S1
2
n1
μ1-μ2之誤差界限為
S1
2
S1
n2
2
n1
2
n1
S2
n2
z
2
S2
S2
n2
兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
2
X1 X
2
z
2
S1
n1
2
S2
n2
6. 兩個母體平均數差μ1-μ2的估計(3)
(一) 點估計(σ1與σ2未知,但σ1=σ2=σ且n1 與 n2為
小樣本)
樣本平均數差
X1 X
2
為母體平均數差μ1-μ2之不偏估計
量。
由於σ1與σ2未知,但是σ1=σ2=σ ,此時以
( n 1 1) S 1 ( n 2 1) S 2
2
S
2
P
2
n1 n 2 2
2
因此,母體平均數差μ1-μ2估計一般皆以統計量 t
來估計。
t n1 1 n 2 2
( X 1 X 2 ) (1 2 )
S
2
p
n1
S
2
p
n2
或
t n11 n 2 2
( X 1 X 2 ) (1 2 )
Sp
1
n1
1
n2
6. 兩個母體平均數差μ1-μ2的估計(3)
(二)區間估計(σ1與σ2未知,但σ1=σ2=σ且n1 與 n2為
小樣本)
X1 X
兩母體平均數差μ1-μ2之點估計量
S
兩樣本平均數差 之的標準差
2
p
S
2
1
n1
μ1-μ2之誤差界限為
t ,( n
S
n2 2 )
2
2
p
n2
2
p
n1
S
2
p
n2
兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
X1 X
2
t ,( n
2
S
1
n2 2 )
2
p
n1
S
2
p
n2
例 11 .兩母體平均數之差的估計: σ1與σ2未
知,但σ1=σ2=σ
某政府單位想知道A與B家庭平均收入的差
異,已知兩母體變異數相等,抽查的結果
如下:
A市
B市
樣本數
35
40
平均收入
401,800
388,000
標準差
20,000
22,000
計算這兩個地點的顧客平均年齡差的95%
信賴區間
解:
∵大樣本n1=36, n2=49>3且母體標準差σ1=
σ2未知
∴ 使用統計量
SP
S
2
P
( 35 1) 20000
2
( n 1 1) S ( n 2 1) S
2
1
2
2
n1 n 2 2
( 40 1) 22000
2
2
21092
35 40 2
∴大樣本n1=36, n2=49使用統計量
(X X
估計μ1-μ2
Z
1
Sp
2
) (1 2 )
1
n1
1
n2
解:
若使用95% 信賴水準,且 t/2=z0.025=1.96,我
們可得μ1 - μ2的95%信賴區間
X1 X
2
z
2
S
2
p
n1
S
2
p
n2
401 ,800 388 , 000 Z 0 . 025 S P
1
35
1
40
13 ,800 1 . 96 21 , 092 0 . 2315
13 ,800 9 , 568 . 42 ( 4 , 231 . 6 ~ 23 , 368 . 42 )
6. 兩個母體平均數差μ1-μ2的估計
(4)
(一) 點估計(σ1與σ2未知,但σ1=σ2 ≠ σ 且
n1 與 n2為小樣本)
樣本平均數差
X1 X
2
為母體平均數差μ1-μ2之不
偏估計量。
由於σ1與σ2未知,但是σ1=σ2 ≠ σ ,此時以
S1 1
2
2
S2 2
2
,
2
6. 兩個母體平均數差μ1-μ2的估計(4)
(一) 點估計(σ1與σ2未知,但σ1=σ2 ≠ σ 且n1 與 n2為
小樣本)
母體平均數差μ1-μ2估計一般皆以統計量 t
來估計。
t
(X
1
X
2
) (1 2 )
2
S1
2
n1
t/2 的自由度為 ν
一般無條件捨去取
整數值
S2
n2
s
s
n2
n1
2
1
df
2
2
2
2
s
1 s
n1 1 n1
n2 1 n2
1
2
1
2
2
2
6. 兩個母體平均數差μ1-μ2的估計(4)
(二)區間估計(σ1與σ2未知,但σ1=σ2 ≠ σ且n1 與 n2為
小樣本)
X1 X
兩母體平均數差μ1-μ2之點估計量
2
μ1-μ2之誤差界限為
2
S1
兩樣本平均數差 之的標準差
t ,
n2
2
S2
2
n1
2
S2
n1
S1
2
n2
兩母體平均數差母體μ1-μ2的100(1-α)%信賴區間為
2
X1 X
2
t ,
2
S1
n1
2
S2
n2
例 12 .兩母體平均數之差的估計:σ1與σ2未知,
但σ1=σ2 ≠ σ
國家銀行正進行一項在其兩家分行的顧客支票
帳戶之平均差異的調查。Cherry Grove分行中
簡單隨機抽樣28個支票帳戶,Beechmont分行
亦獨立簡單隨機抽樣22個支票帳戶。每一個支
票帳戶的目前支票帳戶平均餘額均加以記錄。
帳戶平均餘額之摘要如下:
例 12.兩母體平均數之差的估計: σ1與σ2未
知,但σ1=σ2 ≠ σ
Clearwater國家銀行欲估計Cherry Grove與
Beechmont顧客母體支票帳戶平均數之差異
的95%信賴區間估計。
解: Cherry Grove分行樣本資料顯示 n1=28,x1
=$1,025與 s1=$150,而Beechmont分行則
為 n2=22, x2 =$910, s2=$125。t/2 之自由
度計算如下:
解:
我們將非整數之自由度無條件捨去取整數值為
47,以獲得較大的 t值及較為保守的區間估計。
使用 t分配表與自由度47,可求得 t0.025,47=
2.012。
建立兩母體平均數之差的95%信賴區間如下:
∴ 兩母體平均數之差的95%信賴區間估計值為(37,
193)。
6.成對母體平均數差μ1-μ2的估計(5)
μ1 為母體2 的平均數,μ2 為母體2的平均數
自母體中抽取元素,對同一元素蒐集實驗前後
兩個觀察值所構成的樣本稱為成對樣本(paired
samples)。
成對樣本的母體彼此不互相獨立。
6.成對母體平均數差μ1-μ2的估計(5)
成對母體與成對樣本
成對差母體
成對母體
X1 X 2
D X1 X 2
1
D1
M
M
1 X 11 X 21
M
M
N X 1N
M
X 2N
N
DN
抽
樣
抽
樣
1
D X1 X 2
X1
X2
X 11
X 21
1
D1
M
M
M
n
M
n X 1n
X 2n
Dn
D 1 X 11 X 21 , D 2 X 12 X 22 ,.... D n1 X 1 n X 2 n
6.成對母體平均數差μ1-μ2的估計(5)
(一) 點估計(配對樣本)
令
D 1 X 11 X 21 , D 2 X 12 X 22 ,.... D n1 X 1 n X 2 n
則把(D1,D2,. . . . . . ,Dn)視為另一個由母體抽出的隨機
樣本
配對樣本平均數 D
D 1 D 2 ..... D n
n
不偏估計量。
D
2
(!!) E ( D ) D
Var ( D ) D
2
n
為母體平均數差 μ1-μ2之
6. 成對母體平均數差統計量
成對母體平均數差 D 使用的統計量
大樣本母體變異數已知:
Z
D D
D
n
大樣本母體變異數未知:
Z
D D
SD
n
小樣本母體常態變異數已知:
Z
D D
D
n
小樣本母體常態變異數未知:
t
D D
SD
n
6. 成對母體平均數差的區間估計
(二)區間估計
成對母體平均數差 D 的信賴區間
大樣本變異數
D Z / 2
D
已知
式中:
大樣本變異數
D Z /2S D
2
D
2
D
D
D
n
未知
式 中: S D
SD
n
, SD
小 樣 本 母 體 分 配 為 常 態 分 配 ,
D Z / 2 D
2
D
已知
小 樣 本 母 體 分 配 為 常 態 分 配 ,
D t n 1 , / 2 S D
2
D
未知
D
2
( D ) / n
2
n 1
。
例 13 .成對母體平均數差的區間估計
例13.成對母體平均數差的區間估計
例 13. 小樣本,變異數σ 未知
解:
∵小樣本n=7<30,母體變異數σ2 未知
使用統計量
t
D D
SD
n
E (D ) D
D
1 .5 5 .4 3 .6 6 .9 5 .5 2 .7 2 .3
3 . 557
7
SD
2
SD
X
2
i
nX
n 1
SD
2
2
7 . 7062
2 . 776
∴使用前後平均體重差μ1-μ2 的95%信賴區間
3 . 557 t 0 .025 , 6
2 . 776
D t / 2
3 . 557 2 . 447 1 . 1333
6
3 . 557 2 . 773 ( 0 . 784 ~ 6 . 330 )
SD
n
7.兩個母體比例差p1-p2的估計
樣本比例差
pˆ 1 pˆ 2
為母體比例差p1-p2之不偏估
計量。
獨立大樣本母體比例 pˆ 1
。 平均數
E ( pˆ pˆ )
變異數
V a (rpˆ 1 pˆ 2 )
1
2
pˆ 2 的抽樣分配
pˆ 1 pˆ 2
p p
2
pˆ 1 pˆ 2
1
式中: q1 1 p1 , q 2 1 p 2 。
p1 q1
n1
2
p2q2
n2
7.兩個母體比例差p1-p2的估計
兩個母體比例差p1-p2使用的統計量
大樣本母體比例P1, P2已知: Z
pˆ 1 pˆ 2 ( p 1 p 2 )
p 1 (1 p 1 )
p 2 (1 p 2 )
n1
n2
大樣本母體變異數未知:
Z
pˆ 1 pˆ 2 ( p 1 p 2 )
pˆ 1 (1 pˆ 1 )
n1
Z
pˆ 2 (1 pˆ 2 )
n2
pˆ 1 pˆ 2 ( p 1 p 2 )
0 .5 ( 0 .5 )
n1
0 .5 ( 0 .5 )
n2
或
7. 兩個母體比例差p1-p2的區間估計
大樣本母體比例差的信賴區間
( pˆ 1 pˆ 2 ) Z / 2 S pˆ 1 pˆ 2
式中: S pˆ 1 pˆ 2
pˆ 1 qˆ 1
pˆ 2 qˆ 2
n1
n2
母體比例差的信賴區間
( pˆ 1 pˆ 2 ) Z / 2 S pˆ 1 pˆ 2
1
式中: S pˆ
ˆ
1 p2
2
1
1
2 2
n1
1
2
n2
例 14.兩個母體比例差p1-p2的區間估計
某大城市中隨機抽120位的成年男子,其中有38位沒9抽
煙的習慣,又隨機抽出72位的成年女子,其中有51位沒
有抽煙的習慣。
(1) 估計此城市成年男子中與成年女子中沒有抽煙習慣的
比例差之95%誤差界限?
ˆ1
p
x1
n1
38
0 . 3167
ˆ2
p
120
Z 0 . 05
95%誤差界限=
1 . 96
pˆ 1 (1 pˆ 1 )
n1
x2
n2
51
0 . 7083
72
pˆ 2 (1 pˆ 2 )
n2
0 . 3167 (1 0 . 3167 )
1 . 96 . 06836
0 . 1340
120
0 . 7083 (1 0 . 7083 )
72
(2) 求此城市成年男子中與成年女子
沒有抽煙習慣的比例差之95%信賴區間?
解:
∴沒有抽煙習慣的比例差p1-p2 的95%信賴區間
pˆ 1 pˆ 2 Z 0 .05
pˆ 1 (1 pˆ 1 )
n1
0 . 3167 0 . 7083 0 . 1340
( 0 . 5256 , 0 . 2576 )
pˆ 2 (1 pˆ 2 )
n2
8. 兩個母體變異數比的統計推論
2
2
S1
S2
1 2
2
2
2
的分配
2
S1
S2
2
1
2
2
2
12
2
2
S1
S
2
2
~ F n1 1 , n 2 1
8. 兩個母體變異數比的統計推論
區間估計
2
使用統計量 F分配
2
S1
S2
2
1
2
2
2
12
2
2
S1
S
2
2
~ F n1 1 , n 2 1
f (F )
F 1 , 2
0
F 1 , 2 ,1 / 2
F 1 , 2 , / 2
F
8. 兩個母體變異數比的統計推論
區間估計
母體變異數比的1-α信賴區間
S1 1
2
P ( F1
2
S
2
2
P(
S1
S
2
2
2
2
S
2
2
2
F n 1 1 , n 2 1 , / 2
S1
F ) 1
1
2
1
2
2
2
2
1
F n 1 1 , n 2 1 , / 2
2
2
2
S1
S
1
2
2
2
2
2
1
F n 1 1 , n 2 1 ,1 / 2
2
) 1
S1
S
2
2
1
F n1 1 , n 2 1 ,1 / 2
例 15.兩個母體變異數比的統計推論
已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90%信賴區間。
單一母體變異數σ2的
(
100(1-α)%信賴區間為
( n 1) S
2
2
2
,
( n 1) S
1
2
2
)
2
(
女生身高變異數的90%信賴區間
(10 1) 36 (10 1) 36
324
324
(
,
)(
,
) (19 . 15 ~ 97 . 44 )
2
2
16 . 9190 3 . 3251
9 , 0 .05
9 , 0 .95
例 15.兩個母體變異數比的統計推論
已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90%信賴區間。
單一母體母體變異數σ2的
(
( n 1) S
100(1-α)%信賴區間為
2
2
2
,
( n 1) S
1
2
2
)
2
(
男生身高變異數的90%信賴區間
(
( 9 1) 49 ( 9 1) 49
392
392
,
)
(
,
) ( 25 . 28 ~ 143 . 45 )
2
2
15 . 5073 2 . 7326
8 , 0 .05
8 , 0 .95
例 15.兩個母體變異數比的統計推論
已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(1) 試分別求女生與男生身高變異數的90%信賴區間。
母體變異數σ2的100(1-α)%信賴區間為
(
(
( n 1) S
2
2
2
,
( n 1) S
1
2
2
)
2
男生身高變異數的90%信賴區間
(
( 9 1) 49 ( 9 1) 49
392
392
,
)
(
,
) ( 25 . 28 ~ 143 . 45 )
2
2
15 . 5073 2 . 7326
8 , 0 .05
8 , 0 .95
已知學生的身高呈常態分配,但其平均數未知,今從某
大學隨機抽樣10名女生與9名男生,得其身高的標準差
分別為6公分與7公分。
(2) 試分別求女生對男生身高變異數比與標準差比的90%
信賴區間。
1
2
兩個母體變異數比
2
S1
2
2
2
的100(1-α)%信賴區間為
1
F n 1 1 , n 2 1 ,
S2
12
/ 2
1
2
2
2
S1
2
S2
1
F n 1 1 , n 2 1 ,1
2
女生對男生身高變異數比
36
(
49
2
2
的90%信賴區間
36
,
49
)(
0 . 7347
F 9 , 8 , 0 .05 F 9 , 8 , 0 .95
女生對男生身高標準差
3 . 39
1
,
0 . 7347
) ( 0 . 217 ~ 2 . 37 )
1 3 . 23
的90%信賴區間
2
( 0 . 217 , 2 . 37 ) ( 0 . 4658 , 1 . 539 )
/ 2