卡方分配Chi-square 卡方分配 • 重複抽樣,並計算各別變異數。這些變異數的分配並不是 常態,而是一種不對稱的右偏分配。 • 進而分別對各個變異數值,乘以n-1(n為樣本數),再除 以母體變異數(常數),便形成一個新的統計量,稱為卡 方變數,即 n ( X X ) (n 1) S i 2 2 • 卡方統計量的分配型態,係由其自由度所決定,記作 n 1S 2 2 ~ 2 n 1
Download ReportTranscript 卡方分配Chi-square 卡方分配 • 重複抽樣,並計算各別變異數。這些變異數的分配並不是 常態,而是一種不對稱的右偏分配。 • 進而分別對各個變異數值,乘以n-1(n為樣本數),再除 以母體變異數(常數),便形成一個新的統計量,稱為卡 方變數,即 n ( X X ) (n 1) S i 2 2 • 卡方統計量的分配型態,係由其自由度所決定,記作 n 1S 2 2 ~ 2 n 1
卡方分配Chi-square 卡方分配 • 重複抽樣,並計算各別變異數。這些變異數的分配並不是 常態,而是一種不對稱的右偏分配。 • 進而分別對各個變異數值,乘以n-1(n為樣本數),再除 以母體變異數(常數),便形成一個新的統計量,稱為卡 方變數,即 n 2 ( X X ) (n 1) S i 2 2 2 2 • 卡方統計量的分配型態,係由其自由度所決定,記作 n 1S 2 2 2 ~ 2 n 1 卡方分配的性質 • 卡方分配為機率密度函數,函數的形成十分複雜。在 此,僅介紹卡方分配的一些重要特性和應用要點: – – 卡方統計量之值必為正數(因為卡方公式的分子、分母均為平 方之故)。卡方分配圖的橫軸,定義於0~∞的範圍。 卡方分配之平均數和變異數為 E (2 ) df Var (2 ) 2df – 卡方分配為一右偏分配,其形狀因自由度而異,當自由度愈 大,向右偏斜程度愈小。 df=1 df=4 df=18 不同自由度的卡方分配圖 變項的類別與分析方法 依變項 自 變 項 連續性 非連續性 連續性 Correlation Regression Logistic Regression 非連續性 T檢定 ANOVA 卡方檢定 2 的應用 • 卡方分配主要用於類別資料(categorical dada)檢 定。 • 計數資料大都可用。 – 適合性檢定﹙Test of goodness of fit﹚ • 在二項族群假設檢定,以測驗族群均值等於指定數﹙或期望 值﹚,採Z值。 – 獨立性檢定﹙Test of independence﹚ • 對於計數資料研究兩因子間的關係。例如:抽煙與肺癌的關 係,通常把一變數分為兩組,一組接受處理,另一組則未處 理。 – 同質性檢定﹙homogeneous test﹚ • 檢定幾組樣品是否來自相同的族群。 Chi-square應用 k f i ei 2 i 1 ei 2 • • • • • k Oi Ei 2 i 1 Ei fi=觀察次數 ei=期望次數 df=k-1 行列df=(r-1)*(c-1) 上式由karl Pearson(1875~1936)提出,當n很大 時,其分配會趨近於df=k-1的卡方分配。 • 卡方檢定為右尾檢定 • Example – 在某一的豌豆實驗中,得30個圓而黃的、10個圓而綠的、11個皺 而黃的、3個皺而綠的,已知孟德爾遺傳理論比例為9:3:3: 1,試問: • 本題使用Chi-square分配的應用中之何種檢定方法?並說明之﹙提 示:適合性檢定、 獨立性檢定、同質性檢定﹚? • 請檢定本實驗是否符合孟德爾理論(α=0.01)?(chi2=0.0498<11.34) • Example – 一項市場調查分析,某產品在市場佔有率根據過去的調查,A、 B、C三家公司的市場佔有率為1:2:1。今調查100位顧客,資料如 下,A:18、B:55、C:27(人)請問三家公司的市場占有率是否有改 變 (α=0.05) 。(chi2=2.62<5.99 ) • Example: – 欲檢定國內四大筆記型電腦廠商市佔率是否為 Pa=0.35、Pb=0.3、Pc=0.2、Pd=0.15,隨機抽取500 位消費者,其使用頻度如下,請問在α=0.025下,是 否符合此結構。(can’t reject H0,chi2=0.89) 廠商 A B C D 頻度 170 155 105 70 • Example – 調查兩種品牌奶粉對於嬰兒的健康的影響效果,調查 150個嬰兒,從其中選出80名餵食A奶粉,其中70名餵 食B奶粉,經過ㄧ段時間得到下列資料,請問 • 虛無假設及對立假設。 • 檢定結果為何(α=0.05)。(chi2=8.224>5.99) 優良 正常 不良 奶粉A 37 24 19 奶粉B 17 33 20 • Example – 某大連鎖店欲檢定商品陳列方式與銷售狀況是否相關, 隨機顯300家門市,以ABC三種方式鋪貨,並將門市 月銷售狀況製表如下,問在α=0.05下檢定結果為何。 (reject H0,chi2=18.7049) 陳列方式 銷售 狀況 A B C 高 22 80 58 低 48 60 32 • Example: – 調查牧師、教育界人士、行政部門人員與商人之酒精 中毒情形,得下表,請檢定此四種行業酒精中毒比率 是否相同(α=0.05)。(reject H0,chi2=20.59) 中毒 非中毒 牧師 32 268 教育界 51 199 行政部門 67 233 商人 83 267 • Example: – 欲探討經過某一化學處理之種子發芽比例是否不同, 今取100顆經過化學處理之種子,以及150顆未經處理 之種子,觀察其發芽狀況如下表,請問其發芽比例是 否不同。(α=0.05)。(can’t reject H0,chi2=0.817) 發芽 為發芽 化學處理 84 16 未處理 132 18 • 2 x 2 table ,1 Z 2 • df=1。 2 2 母群體變異數的估計 2的信賴區間 2 2 2 P n 1 1 1 ,n 1 , n 1 2 2 2 2 n 1 S 2 P 1 2 1 , n 1 , n 1 2 2 取倒數 1 2 1 P 2 n 1S 2 2 2 1 , n 1 2 2 ,n1 n 1S 2 2 n 1S 2 P 2 2 1 2 1 , n 1 ,n 1 2 2 1 1 • Example: – 欲估計測速器的穩定度,以標準110公里/小時檢測了八 筆資料,得平均值為108,樣本均方(標準差之平方)為 24.57,求: • 此測速器的變異數的95%CI。(9.307 , 138.821) • 如果測速器的標準差不得超過4,則此測速器是否符合規定。 (α=0.05)(can’t reject H0 , chi2=10.75<14.07)