卡方分配Chi-square 卡方分配 • 重複抽樣,並計算各別變異數。這些變異數的分配並不是 常態,而是一種不對稱的右偏分配。 • 進而分別對各個變異數值,乘以n-1(n為樣本數),再除 以母體變異數(常數),便形成一個新的統計量,稱為卡 方變數,即 n ( X  X )  (n  1) S i 2  2   • 卡方統計量的分配型態,係由其自由度所決定,記作  n  1S 2  2  ~  2 n 1

Download Report

Transcript 卡方分配Chi-square 卡方分配 • 重複抽樣,並計算各別變異數。這些變異數的分配並不是 常態,而是一種不對稱的右偏分配。 • 進而分別對各個變異數值,乘以n-1(n為樣本數),再除 以母體變異數(常數),便形成一個新的統計量,稱為卡 方變數,即 n ( X  X )  (n  1) S i 2  2   • 卡方統計量的分配型態,係由其自由度所決定,記作  n  1S 2  2  ~  2 n 1

卡方分配Chi-square
卡方分配
• 重複抽樣,並計算各別變異數。這些變異數的分配並不是
常態,而是一種不對稱的右偏分配。
• 進而分別對各個變異數值,乘以n-1(n為樣本數),再除
以母體變異數(常數),便形成一個新的統計量,稱為卡
方變數,即
n
2
(
X

X
)

(n  1) S
i
2 

2
2
2


• 卡方統計量的分配型態,係由其自由度所決定,記作

n  1S 2
 
2
2

~  2 n 1
卡方分配的性質
•
卡方分配為機率密度函數,函數的形成十分複雜。在
此,僅介紹卡方分配的一些重要特性和應用要點:
–
–
卡方統計量之值必為正數(因為卡方公式的分子、分母均為平
方之故)。卡方分配圖的橫軸,定義於0~∞的範圍。
卡方分配之平均數和變異數為
E (2 )  df
Var (2 )  2df
–
卡方分配為一右偏分配,其形狀因自由度而異,當自由度愈
大,向右偏斜程度愈小。 df=1
df=4
df=18
不同自由度的卡方分配圖
變項的類別與分析方法
依變項
自
變
項
連續性
非連續性
連續性
Correlation
Regression
Logistic Regression
非連續性
T檢定
ANOVA
卡方檢定

2
的應用
• 卡方分配主要用於類別資料(categorical dada)檢
定。
• 計數資料大都可用。
– 適合性檢定﹙Test of goodness of fit﹚
• 在二項族群假設檢定,以測驗族群均值等於指定數﹙或期望
值﹚,採Z值。
– 獨立性檢定﹙Test of independence﹚
• 對於計數資料研究兩因子間的關係。例如:抽煙與肺癌的關
係,通常把一變數分為兩組,一組接受處理,另一組則未處
理。
– 同質性檢定﹙homogeneous test﹚
• 檢定幾組樣品是否來自相同的族群。
Chi-square應用
k
 f i  ei 2
i 1
ei
2  
•
•
•
•
•
k
Oi  Ei 2
i 1
Ei

fi=觀察次數
ei=期望次數
df=k-1
行列df=(r-1)*(c-1)
上式由karl Pearson(1875~1936)提出,當n很大
時,其分配會趨近於df=k-1的卡方分配。
• 卡方檢定為右尾檢定
• Example
– 在某一的豌豆實驗中,得30個圓而黃的、10個圓而綠的、11個皺
而黃的、3個皺而綠的,已知孟德爾遺傳理論比例為9:3:3:
1,試問:
• 本題使用Chi-square分配的應用中之何種檢定方法?並說明之﹙提
示:適合性檢定、 獨立性檢定、同質性檢定﹚?
• 請檢定本實驗是否符合孟德爾理論(α=0.01)?(chi2=0.0498<11.34)
• Example
– 一項市場調查分析,某產品在市場佔有率根據過去的調查,A、
B、C三家公司的市場佔有率為1:2:1。今調查100位顧客,資料如
下,A:18、B:55、C:27(人)請問三家公司的市場占有率是否有改
變 (α=0.05) 。(chi2=2.62<5.99 )
• Example:
– 欲檢定國內四大筆記型電腦廠商市佔率是否為
Pa=0.35、Pb=0.3、Pc=0.2、Pd=0.15,隨機抽取500
位消費者,其使用頻度如下,請問在α=0.025下,是
否符合此結構。(can’t reject H0,chi2=0.89)
廠商 A
B
C
D
頻度 170
155
105
70
• Example
– 調查兩種品牌奶粉對於嬰兒的健康的影響效果,調查
150個嬰兒,從其中選出80名餵食A奶粉,其中70名餵
食B奶粉,經過ㄧ段時間得到下列資料,請問
• 虛無假設及對立假設。
• 檢定結果為何(α=0.05)。(chi2=8.224>5.99)
優良
正常
不良
奶粉A
37
24
19
奶粉B
17
33
20
• Example
– 某大連鎖店欲檢定商品陳列方式與銷售狀況是否相關,
隨機顯300家門市,以ABC三種方式鋪貨,並將門市
月銷售狀況製表如下,問在α=0.05下檢定結果為何。
(reject H0,chi2=18.7049)
陳列方式
銷售
狀況
A
B
C
高
22
80
58
低
48
60
32
• Example:
– 調查牧師、教育界人士、行政部門人員與商人之酒精
中毒情形,得下表,請檢定此四種行業酒精中毒比率
是否相同(α=0.05)。(reject H0,chi2=20.59)
中毒
非中毒
牧師
32
268
教育界
51
199
行政部門
67
233
商人
83
267
• Example:
– 欲探討經過某一化學處理之種子發芽比例是否不同,
今取100顆經過化學處理之種子,以及150顆未經處理
之種子,觀察其發芽狀況如下表,請問其發芽比例是
否不同。(α=0.05)。(can’t reject H0,chi2=0.817)
發芽
為發芽
化學處理
84
16
未處理
132
18
• 2 x 2 table
  ,1  Z 
2
• df=1。
2
2
母群體變異數的估計
 2的信賴區間
 2

2
2

P       n 1        1  
  1 ,n 1 
 , n 1  
 2

  2 
2
 2



n

1
S
2

P    
      1  
2
  1 , n 1 
 , n 1  

 2

  2 
取倒數

 1
2
1
P 2


n  1S 2  2  
  2  
 1 , n 1 
2


  2 ,n1 

 n  1S 2  2

n  1S 2
P

 2
2

1
  

2


 1 , n 1 
 ,n 1 
2


 2




  1




  1


• Example:
– 欲估計測速器的穩定度,以標準110公里/小時檢測了八
筆資料,得平均值為108,樣本均方(標準差之平方)為
24.57,求:
• 此測速器的變異數的95%CI。(9.307 , 138.821)
• 如果測速器的標準差不得超過4,則此測速器是否符合規定。
(α=0.05)(can’t reject H0 , chi2=10.75<14.07)