Non-parametric method, Hypothesis testing: Categorical data

Download Report

Transcript Non-parametric method, Hypothesis testing: Categorical data

生物統計學Biostatistics
Estimation / Hypothesis testing
Nov 30, 2010
Tsuo-Hung Lan MD, PhD
Institute of Brain Science, Yang-Ming University
Department of Psychiatry, Taichung Veterans General Hospital
點估計與區間估計



推論統計的理論乃在根據樣本的訊息,猜測母體的特性或參數。主要
的推論型式是參數(母數)的估計與假設的檢定,參數的估計又可分
為
 點估計(point estimation):根據樣本資料,求得一統計量的觀
測值,作為參數(母數)的估計值。
 區間估計(interval estimation):根據樣本資料,求得兩個數值,
構成一個信賴區間(confidence interval,C. I.),概括出參數
(母數)的可能範圍。
點估計之優點為算法簡單,意義簡單明瞭;但其缺點為無法判斷估計
結果的準確性,且其估計值會因樣本不同而有所差異。所以才會有區
間估計之推出。
假定,我們估計全體大學生平均每月可用零用金為5000元,那是點估
計,該估計為單一數值,可視為線上的一點;若我們估計全體大學生
平均每月可用零用金介於4000~6000元,那就是區間估計,因為涉及
兩點,可視為線上的一個區段。
母體平均數μ的估計

實務上,最常碰到對母體均數μ的估計。如:大
學生的平均智商、平均成績、平均身高、平均手
機的使用月費;國民平均所得、工廠的平均生產
數量、……。

估計母體平均數μ的方法可為:樣本中位數與平
均數。
其中,以樣本平均數為最優,因其具有不偏性與
一致性。
大樣本時

若樣本數n>30,則以其為μ的點估計。若樣本數
n>30,且母體變異數σ2已知,則以
x  z / 2

n
為μ的100(1-α)%之信賴區間。
 但實務上,母體變異數σ2通常未知,當樣本數
n>30,可以樣本標準差S來取代母體標準差σ。
S
故以
x  z / 2
n
為μ的100(1-α)%之信賴區間。
信賴區間之範圍
α為顯著水準,α=0.05時表求算95%信賴區間之
範圍。σ為母體標準差,n為樣本數。
 若處理對象為常態分配,母體標準差(σ)已知,
其計算公式為:


z / 2
n
實務上,很少會已知母體標準差,故以樣本標準
S
差來替代。其計算公式為:
z / 2
n
故其μ的100(1-α)%之信賴區間為:
x  CONFIDENCE( , , n)
小樣本時


若母體為常態分配,樣本數n<30,仍以其為μ的點估
計。若母體為常態分配,樣本數n<30,且母體變異數
σ2已知,則以

x  z / 2
n
為μ的100(1-α)%之信賴區間。
但實務上,母體變異數σ2通常未知,當樣本數n<30,
因為樣本太小,樣本標準差S的變化會較大,就不可以
樣本標準差S來取代母體標準差σ。故以
x  t  / 2 ( n 1)
S
n
為μ的100(1-α)%之信賴區間。

如為雙尾,即求左右兩尾之陰影部份:
t分配之圖形及機率值,將隨自由度不同而略有不
同。
母體比例p的估計
估計母體比例p:
如:估計平均失業率、產品不良率、品牌佔有率、政策支
持率、候選人支持率、政黨支持率、數位相機擁有率、個
人電腦擁有率、……。
 若樣本數n>30,則以其樣本比率為母體比例p的點估計。
母體比例p的100(1-α)%之信賴區間為:
pˆ (1  pˆ )
pˆ (1  pˆ )
pˆ  z / 2
n
其中, z / 2

n
即為可容忍的誤差(e)。在計算樣本大小時,將其簡化
成
Z 2  p(1  p) 來計算樣本數。
n
 /2
e2
假設檢定概論


由於我們對母體的不瞭解,任何有關母體的敘述,都只是
假設而已(統計假設)。除非我們進行全面普查,否則,
一個統計假設是對或錯?根本就不可能獲得正確之答案。
但因為絕大多數之情況,是不允許也無法進行普查。所以,
才會透過抽樣調查,以抽查結果所獲得的資料,來檢定先
前統計假設,以判斷其對或錯?
如果,檢定後發現抽樣結果與統計假設間之差異很大,我
們就無法接受該統計假設(亦即,否定或棄卻該假設)。
反之,若檢定後發現抽樣結果與統計假設間之差異不大,
我們就無法棄卻(否定)該統計假設。不過,我們會比較
保守的說:無充分證據證明該假設是錯的;而不直接說接
受該統計假設。
假設檢定(Hypothesis Testing)

虛無假設(null hypothesis)





表示母體參數與樣本統計量間並未存在差異的情況。
當結論無法否定虛無假設時,表示「無充份證顯示虛無
假設為偽」。
虛無假說所陳述的事件永遠無法被證實為真。
H0:μ=μ0
對立假設




表示母體參數與樣本統計量間存在差異的情況。
H1:μμ0 (雙尾) 或
H1:μμ0 (單尾) 或
H1:μμ0 (單尾)



在進行各種統計假設檢定時,我們通常將要否定(棄卻)之事實
當作虛無假設(null hypothesis,以H0代表)。既然希望它是不對,
以將其否定,那就表示會有一個希望它是對的對立假設
(alternative hypothesis,以H1或Ha代表)。當檢定結果,得否定
該虛無假設時,就等於接受對立假設。注意,虛無假設與對立假
設間必須是週延且互斥,其間絕無重疊的模糊地帶;也無任何無
法涵蓋的真空地帶。如:
H0:μ1=μ2
H1:μ1≠μ2
若安排成
H0:μ1=μ2
H1:μ1≦μ2
就有等於時會發生重疊,而無法互斥。
但若安排成
H0:μ1<μ2
H1:μ1>μ2
則當兩者恰好等於時,就變成真空地帶,沒有被任一個假設涵蓋。
假設檢定之誤差

型一誤差(type I error) —α



型二誤差(type II error) —β


拒絶正確的虛無假設的機率(將好的當成壞的) 。
α稱為顯著水準(level of significance)
接受錯誤的虛無假設的機率(將壞的當成好的) 。
檢定力(power of the test) —1-β
決定β誤差的因素





母數的真實數值
所選擇的α水準
採用單尾或雙尾的檢定來測量假說
樣本標準差
樣本大小
降低型二誤差的方法



將α值變大
增加樣本數大小
尋求同時改善β與α誤差,即改善樣本測量方法
或觀察值,以減少樣本變異程度,使得尾端誤
差發生的面積減小。
假設檢定之類型與單/雙尾檢定

等於與不等於之雙尾檢定
H0:μ1=μ2
H1:μ1≠μ2
無論檢定統計量之觀察值落在左側或右側之危險域(或稱棄卻域、
拒絕域),均表示μ1 ≠ μ2 。更詳細一點,若落在左側之危險域,
表示μ1<μ2;若落在右側之危險域,表示μ1>μ2。

等於與大於之右側單尾檢定
H0:μ1≦μ2
H1:μ1>μ2
或
H0:μ1=μ2
H1:μ1>μ2
當檢定統計量之觀察值落右側之危險域,均表示μ1>μ2。

等於與小於之左側單尾檢定
H0:μ1≧μ2
H1:μ1<μ2
或
H0:μ1=μ2
H1:μ1<μ2
當檢定統計量之觀察值落左側之危險域,均表示μ1<μ2。
統計檢定程序






設立虛無假設與對立假設
選擇統計檢定的方法
選擇需要的顯著水準
計算估計的統計量
獲得檢定的臨界值
結論:當檢定統計量的觀察值落入危險域,棄
卻虛無假設H0;反之,無法棄卻虛無假設H0
(接受虛無假設)
檢定的種類

母數檢定(paramatric tests)





推論的對象為特定之母數,如μ、p…
推論全體之分配假定為已知
資料主要為比率或區間尺度所構成
較具檢定力
無母數檢定(nonparamatric tests)


推論之對象並非某特定之母數,或不知全體分配為
何,而希望探討全體分配為某一分配,兩種分配是
否相同…。
用於檢定名目或順序尺度資料的假說
母數檢定的前提假設

觀察值必須相互獨立


觀察值必須來自於常態分配的母體


Normal probability plot…
母體的變異數必須一致


Durbin-Watson test或Durbin-H test
殘差圖…
測量尺度為區間尺度或比率尺度
選擇檢定方法之考慮準則



樣本組個數為一個、二個或k個
樣本組的資料是獨立的(來自不同母體)或相關
的(或配對式的樣本)
測量尺度為名目、順序、區間或比率尺度
單一樣本的檢定

通常用於檢定此一樣本是否來自特定母體,其
檢定的內容包括:




觀測值次數和期望值次數是否有差異?(卡方)
觀測值比例和期望值比例之間是否有差異?(二項)
所抽出的樣本資料是否符合特定的分配?(適合度)
樣本均數及母體均數之間是否有差數?(t或z)
單一樣本之母數檢定



樣本數小於30且母體標準差未知t檢定
樣本數大於30或母體標準差已知Z檢定
當樣數在120以上時,Z和t分配相同
X 
t
S/ n
X 
Z
/ n
單一樣本之無母數檢定


測量尺度為名目尺度時使用
母體僅有二個分類時適用二項式檢定


例如,某生產線之平均不良率為0.7,試問本週該
生產線的不良率是否變大?
卡方檢定(最常使用)
單一母體平均數檢定--大樣本Z檢定

單一母體,若母體標準差σ已知,其各項檢
定所使用之檢定統計量為:
X 
Z
/ n

若處理對象為大樣本(n>30),且母體標準
差σ未知,則可使用樣本標準差S來替代:
X 
Z
S/ n





數列是要檢定相對於μ之陣列或資料範圍
μ是欲檢定之母體平均數
σ是母群體已知的標準差。若σ已知,則函數之公式為:
X 
Z
/ n
若省略σ,則自動使用樣本標準差,本函數之公式將為:
X 
Z
S/ n
如:
ZTEST(數列,μ)
表以樣本標準差代替母體標準差,取抽樣之數列的平均數
( x )與母體均數(μ)進行檢定。
小樣本

若樣本為抽自常態母體之小樣本(n≦30),且母
體μ與σ均未知。其各項檢定所使用之檢定統計量
為:
X 
t
S/ n
分配之自由度為n-1。

事實上,「z檢定:兩個母體平均數差異檢定」所
使用之公式為:若已知兩母體之均數為μ1、μ2,
母體之變異數為σ12、σ22,當兩母體為常態或樣
本數均>30,大樣本μ1-μ2之檢定統計量為:
Z
( X1  X 2 )   0
 12
n1



 22
n2
式中,δ0為已知常數。
若處理對象為大樣本(n>30),且母體變異數σ12、
σ22未知,則可使用樣本變異數S12、S22來替代:
Z
( X1  X 2 )   0
S12 S 22

n1 n2
T檢定


是用來進行兩組小樣本(n<30)資料之均數檢定,
或成對樣本的均數差異檢定。除成對樣本外,兩
組資料之樣本數允許不同。
單尾或雙尾其類型可分為下列三種:
1 成對
2 具有相同變異數的二個樣本
3 具有不同變異數的二個樣本


在應用t檢定時,應符合下列假設,方可得到正確
分析的結果:
 每個取樣必須隨機(random)且獨立
(independent)。
 所取樣本的母群體必須為常態分配(normal
distribution)。
由於,t分配是取決於樣本大小(n);當樣本數超過
30(n>30),t-分配就頗接近常態分佈,故檢定時可
改查常態分配表,或使用『資料分析』之「z檢定:
兩個母體平均數差異檢定」。
兩獨立小樣本平均數檢定(變異數相同)


兩樣本平均數的t檢定,旨在比較變異數相同的兩個母群之間平均
數的差異,或比較來自同一母群之兩個獨立樣本之均數的不同。
若兩母群體之變異數相同(σ12=σ22),是採用總變異數t檢定
(pooled-variance t test)。其相關公式為:
t
X1  X 2
S p2
N1


S p2
N2
2
2




N

1
S

N

1
S
1
2
2
S2  1
N1  N 2  2
p
d . f .  N1  N 2  2
2
S
式中, p 即是總變異數
兩獨立小樣本均數檢定(變異數不同)

若兩母群體之變異數不同(σ12≠σ22),則將用個別變異數的t統
計量(Cochran & Cox法)。其相關公式為:
t

X1  X 2
S12 S 22

N1 N 2
 S12 S 22 



N
N
2 
 1
d. f . 
2
2
 S12 
 S 22 
 


N
N
 1   2
N 1  1 N 2  1
請注意,其自由度已不再是兩母群體之變異數相等時簡單的
d.f.=N1+N2-2,依此處公式計算之自由度可能會含小數。
兩獨立樣本之無母數檢定

卡方檢定
k
m
χ2=  
i=1 j=1


(Oij-Eij)2
Eij
Oij=第ij個分類中觀察值的次數
Eij=第ij個分類所期望出現的次數
卡方檢定

邏輯


對每一類別的次數建立虛無假設
將每一類別中實際發生的次數與假設的理論次數進
行比較
k
(Oi-Ei)2
i=1
Ei
χ2= 



Oi=第i個分類中觀察值的次數
Ei=第i個分類所期望出現的次數
K=分類類別的個數
卡方檢定

自由度

單一名目變數


兩個或兩個以上的名目變數並形成交叉分類時


類別數減1(k-1)
(列數-1)(行數-1)
注意事項




自由度為1時,每一個方格內期望出現的次數最少要在5
次以上。
自由度大於1且期望次數少於5的方格超過20%時,不可
進行卡方檢定。
任一方格的期望次數等於0時亦不適用。
解決方式:將某些方格合併或以二項式檢定。
Yate之連續校正


使用時機
 在22的卡方表中,當樣本數大於40或(有任一格的理論
次數小於5)
 當樣本數介於20~40間,且其中的預期次數皆在5次以上
時。
Yate之檢定較保守,若拒絶虛無假設,則能使檢定更具有說
服力。
A
C
B
D
χ2=
n(|AD-BC|-n/2)2
(A+B)(C+D)(A+C)(B+D)
k個獨立樣本的檢定

母數檢定


變異數分析(analysis of variance,ANOVA)
無母數檢定
成對樣本



『兩獨立樣本均數檢定』,無論其變異數是否相等,其共
通點為兩組受測樣本間為獨立,並無任何關聯。如:甲乙
班、男女生、兩不同年度、都市與鄉村、……。
但若同組人,受訓後的手術時間是否短於受訓前。,兩組
受測樣本間為相依(同一個人),就要使用配對樣本的t
檢定。
其相關公式為:
d  d
d  x1  x2
t

sd / n
d. f .  n  1
式中,d為同一配對之兩資料相減之差。
兩相關樣本之無母數檢定

McNemar檢定


適用於名目尺度的資料,檢定觀察對象的意見在事
件前、後是否有顯著的改變。
H0:P(A)=P(D) ,H1:P(A)P(D) ,自由度為1
事件後
事件前
不喜歡
喜歡
喜歡
A
B
不喜歡
C
D
χ2=
(|A-D|-1)2
(A+D)
k個相關樣本的檢定

母數檢定

條件





各組所用的因子最少要有三個類別
觀察值必須是配對資料或同一事件至少測量兩次以上
資料尺度至少需區間尺度以上的等級
重複測量之變異數分析(repeated measures,
ANOVA)
無母數檢定
~The End~