台中榮總教學研究部 生統小組 劉聖文 94

Download Report

Transcript 台中榮總教學研究部 生統小組 劉聖文 94

台中榮總教學研究部 生統小組
劉聖文
94 年教學研究月
內容簡介
基本統計量及常用統計方法介紹
統計方法與應用(SPSS軟體實作)連續資料與類別資料之統計
期刊論文統計表格範例介紹
資料之屬性
分類資料(Categorical data)
類別尺度(Nominal scale)
順序尺度(Ordinal scale )
連續資料(Continuous data)
等距尺度(Interval scale)
比率尺度(Ratio scale
)
一、名目尺度(nominal scale)
二、順序尺度(ordinal scale)
此種量表是根據被調查對象的
較類別量表多一特性,可以表示
性質而分類,如根據消費者答
各類別之間的順序關係。
案可分為「喜歡」與「不喜歡」
如要求消費者根據其心中偏好,
或「是」與「否」兩類。
將五種飲料品牌依最喜歡到最不
每類答案的數字只作為分類之 喜歡的順序排列,最喜歡給5分、
用,如果將這些答案數字(1,2,3) 最不喜歡給1分,這就是一種順序
量表。
做運算,根本沒有意義,因為
這些數字在此僅屬名義而已, 不過代表順序的數字還是不能用
來做運算,只能看出高低次序,
真正目的是在分類。
卻無法確定順序之間的差異大小,
例如若已知A>B>C>D>E,但並不
知道A與B的差距,或C與D的差
距,所以也無法得知兩種差距是
否相等。
三、等距尺度(interval scale)
較順序量表再推進一步,不單
能表示順序關係,尚能測量各
順序之間的距離,可確定地指
出5分與4分之差距等於4分與3
分的差距。
等距量表的分數可用來做加減
乘除的運算,此為其之一大優
點,但是,因為等距量表並沒
有一個真正零點(真零),不
能說明32℃為16℃的兩倍。
四、比率尺度(ratio scale)
比率量表除了具有等距量表的全
部特色外,再加上「真零」這個
特性。
例如身高、年齡、體重等變數的
測量都是用比率量表,故可說體
重80公斤的比40公斤的人重兩倍。
不過在態度測量方面,運用比率
量表顯然有困難,消費者給一種
飲料100分,另一種給50分,但卻
不表示喜歡程度有兩倍的差距。
因為態度測量本質上為一順序概
念,顯然不宜用比率或等距量表
測量。
連續型資料之描述
集中趨勢
平均數 (mean)
中位數 (median)
眾數 (mode)
離散趨勢/其他
標準差 (Std)
標準誤 (SEM)
全距(Range)
四分位差(Quartiles)
信賴區間
(confidence interval)
Statistical methods to test hypotheses
Type of experiment
資料屬性
兩群
獨立樣本
連續資料
Independent
t test
類別資料
Fisher’s exact
Yate’s 校正數
序位資料
(連續無母數)
存活分析
MannWhitney U
test
三群以上
獨立樣本
ANOVA
Chi-square
(χ2 ) test
前後測
比較
重複量數分
Paired t test
析
線性迴歸
相關分析
McNemar’s Cochran’s
test(二分類)
Q test (二分類)
列聯係數
Wilcoxon
Kruskalsigned-rank
Wallis test
test
Kaplan-Meier analysis
Log rank test
重複測量
兩變數之
相關分析
Friedman
statistic
Spearman
rank
correlation
2 group / 3 group
independent
Continuous
dependent
Categorical
Categorical
Continuous
Normal
Non-normal
Normal
t test /
ANOVA
M-W test/
K-W test
Paired t test /
Repeated
measure ANOVA
Fisher's exact test or
Yate's correction of contigency /
Pearson Chi-square test
Non-normal
Wilcoxon test/
Friedman test
McNemar's test /
Cochran's Q test
Excel資料型態
匯入資料
變數分類與命名
類別資料之檢定(獨立變數)
兩組獨立變數( 2 ×2 Table)
--有無抽煙是否因性別不同而有差異
Fisher’s exact test (Expectation<5)
Yate’s correction of contingency
(Expectation>5)
三組以上獨立變數( m×n Table
.
m,n≧2 )
--血型類型是否因性別不同而有差異
Pearson Chi-Square test (χ2 test)
操作方式
χ2 Test : Fisher’s exact test
χ2 Test : Yate’s correction of contingency
χ2 Test : Pearson Chi-Square test
連續資料-常態檢定之操作方式
預檢資料連續資料:二組獨立樣本
常態檢定
Kolmogorov-Sm irnov檢定a
orig.(V/P) : Y1
統計量
自由度
顯著性
age
V
.085
84
.198
PU
.086
31
.200*
*. 此為真顯著性的下限。
a. Lilliefors 顯著性校正
Start
常態假設成立
Shapiro-Wilk 常態性檢定
統計量
自由度
顯著性
.963
N
Y:P>0.05
Parametric
31
.434
Nonparametric
連續資料(I)
成對/二組相關樣本資料
--手術前後之血壓值有無改變
Paired t test
(Parametric test)
Wilcoxon Signed-Rank test
(Nonparametric test)
三組以上相關樣本
--治療前/中/後的血壓值改變量
Repeated Measures ANOVA
Friedman test
(Parametric test)
(Nonparametric test )
連續資料(I)
相依樣本之平均值差的統計檢定:
2個或3個以上的連續變項( Continuous variables )
Assumptions:
1. 2個或以上的連續變項皆呈常態分配( normally distributed )
2. 變項之觀察值之間互相獨立( mutually independently )
假如違背了以上兩項統計前提之一,則使用無母數檢定。
二組相關樣本: Example
常態檢定
Kolmogorov-Smirnov 檢定a
統計量
自由度
顯著性
e1_ 前
.076
46
.200*
e1_ 後
.099
46
.200*
e2_ 前
.118
46
.116
e2_ 後
.079
46
.200*
e3_ 前
.092
46
.200*
e3_ 後
.141
46
.022
*. 此為真顯著性的下限。
a. Lilliefors 顯著性校正
Shapiro-Wilk 常態性檢定
統計量
自由度
顯著性
.990
46
.953
.954
46
.066
.949
46
.044
.952
46
.055
.971
46
.302
.912
46
.002
Paired
t test
成對樣本檢定
成對變數差異
成對 1
成對 2
成對 3
e1_ 後 - e1_ 前
e2_ 後 - e2_ 前
e3_ 後 - e3_ 前
平均數
3.5111
-.5726
-15.4774
標準差
21.10437
18.19518
15.74762
平均數的
標準誤
3.11167
2.68273
2.32186
差異的 95% 信賴區間
下界
上界
-2.7561
9.7783
-5.9759
4.8307
-20.1539
-10.8009
t
1.128
-.213
-6.666
自由度
45
45
45
顯著性 (雙尾)
.265
.832
.0000000
檢定統計量
e1_ 前 - e1_ 後 e2_ 前 - e2_ 後 e3_ 前 - e3_ 後
Z 檢定
-.923
-.311
-5.009
漸近顯著性 (雙尾)
.356
.756
.000001
Wilcoxon Signed-Rank test
連續資料(II)
二組獨立樣本資料
--男/女的體重是否有差異
Independent t test
(Parametric test)
Mann-Whitney U test
(Nonparametric test)
三組以上獨立樣本
--不同血型的體重是否有差異
ANOVA
(Parametric test)
Kruskal-Wallis test
(Nonparametric test )
連續資料(II)
獨立樣本之平均值差的統計檢定:
自變項:2個或3個以上類別的類別變項( Classification )
依變項:連續變項
Assumptions:
1. 獨立樣本內之依變項呈常態分配( normally distributed )
2. 變項之觀察值之間互相獨立( mutually independently )
3. 獨立樣本之變異數必須是相等的( equal group variances )
<即符合變異數同質性 homogeneity of variances>
假如違背了以上三項統計前提之一,則使用無母數檢定。
連續資料:二組獨立樣本(母數)
連續資料:二組獨立樣本(無母數)
二組獨立樣本: Example
常態 檢定
Kolmogorov-Sm irnov檢定a
GRP_C
統計量
自由度
顯著性
C_1
1
.127
46
.062
2
.096
50
.200*
C_2
1
.164
46
.003
2
.091
50
.200*
C_3
1
.138
46
.027
2
.163
50
.002
*. 此為真顯著性的下限。
a. Lilliefors 顯著性校正
Shapiro-Wilk 常態性檢定
統計量
自由度
顯著性
.935
46
.013
.951
50
.036
.918
46
.003
.962
50
.109
.909
46
.002
.912
50
.001
Independent t test
變異數相等的 Leven e 檢定
C_1
C_2
C_3
假設變異數相等
不假設變異數相等
假設變異數相等
不假設變異數相等
假設變異數相等
不假設變異數相等
F 檢定
.987
顯著性
.323
4.697
.033
.726
.396
Mann-Whitney U 統計量
Wilcoxon W 統計量
Z 檢定
漸近顯著性 (雙尾)
C_1
820.500
1901.500
-2.418
.016
平均數相等的 t 檢定
t
-2.696
-2.717
-1.516
-1.498
.238
.236
C_2
865.000
1946.000
-2.090
.037
自由度
94
93.062
94
83.151
94
90.111
C_3
1139.000
2220.000
-.081
.936
顯著性 (雙尾)
.008
.008
.133
.138
.813
.814
平均差異
-7.5105
-7.5105
-3.4554
-3.4554
.65
.65
標準誤差異
2.78569
2.76425
2.27960
2.30668
2.72
2.73
差異的 95% 信賴區間
下界
上界
-13.04155
-1.97946
-12.99972
-2.02129
-7.98156
1.07085
-8.04313
1.13242
-4.75
6.04
-4.78
6.07
Mann-Whitney U test
連續資料:三組以上獨立樣本(母數)
K組獨立樣本: Example 1
常態檢定
Kolmogorov-Smirnov檢定a
GRP_D
統計量
自由度
顯著性
D_1
1
.113
23
.200*
2
.130
27
.200*
3
.076
38
.200*
*. 此為真顯著性的下限。
變異數同質性檢定
a. Lilliefors 顯著性校正
D_1
Levene 統計量 分子自由度 分母自由度
顯著性
1.801
2
85
.171
Shapiro-Wilk 常態性檢定
統計量
自由度
顯著性
.949
23
.285
.923
27
.046
.958
38
.158
變異數同質性檢定
D_1
多重比較
組間
組內
總和
Step2: Post-Hoc
D_1
(依變數:
事後檢定
) Scheffe
Sch effe 法
(I) GRP_D
1
(J) GRP_D 平均差異 (I-J)
2
12.2473*
3
-.9117
2
1
-12.2473*
3
-13.1590*
3
1
.9117
2
13.1590*
*. 在 .05 水準上的平均差異很顯著。
標準誤
4.31832
4.02054
4.31832
3.83053
4.02054
3.83053
Step1: One-Way ANOVA ( F test )
平方和
3085.624
19686.562
22772.186
顯著性
.021
.975
.021
.004
.975
.004
自由度
平均平方和
1542.812
231.607
2
85
87
95% 信賴區間
下界
上界
1.4881
23.0065
-10.9289
9.1056
-23.0065
-1.4881
-22.7028
-3.6151
-9.1056
10.9289
3.6151
22.7028
F 檢定
6.661
顯著性
.002
連續資料:三組以上獨立樣本(無母數)
K組獨立樣本: Example 2
檢定統計量a, b
Step1:
Kruskal-Wallis test
Step2:
Post-Hoc
test
檢定統計量
Mann-Whitney U
檢定統計量
1 vs 2
Mann-Whitney U 統計量
Wilcoxon W 統計量
Z 檢定
漸近顯著性 (雙尾)
188.000
566.000
-2.385
.017
D_1
卡方
12.476
自由度
2
漸近顯著性
.002
a. Kruskal Wallis 檢定
b. 分組變數:GRP_ D
檢定統計量
1 vs 3
Mann-Whitney U 統計量
Wilcoxon W 統計量
Z 檢定
漸近顯著性 (雙尾)
398.000
674.000
-.580
.562
2 vs 3
Mann-Whitney U 統計量
Wilcoxon W 統計量
Z 檢定
漸近顯著性 (雙尾)
251.500
629.500
-3.482
.000498
相關分析-1
皮爾森積差相關係數:
( Pearson product-moment correlation coefficient )

S xy
SxS y

n  xy   x  y
[n  x  ( x) ][ n  y  ( y) ]
2
2
2
2
ρ界於-1至+1之間
相關係數
相關程度
ρ≦0.3
低度相關(Low Correlation)
0.3<ρ≦ 0.7
中度相關(Moderate Correlation)
ρ ≧ 0.7
高度相關(High Correlation)
相關分析操作程序
相關分析-2
Spearman等級相關:
( Spearman rank order correlation coefficient )
6  Di
rs  1 
N ( N 2  1)
2
Where Di=R(Xi)-R(Yi)
這個方法主要應用於順序變項之
線性關係描述。
要注意的是,類別尺度並無順序關係,
線性關係無法成立,不宜採用此法!
Spearman相關操作程序
Spearman rho及 Kendall tau-b statistics
測量兩個序列尺度變數間的相關程度,
因為只考慮數值的大小順序,因此較不
會受極端值及資料分佈狀況的影響。
其他常用之統計分析法
信度分析
相關分析
11月28日(三) 2:00~4:00 p.m.
在視聽教室~將由何惠卿小姐主講
歡迎踴躍參加!
單變量/多變量線性迴歸
Logistic Regression
Kaplan-Meier Survival analysis
Cox proportional-harzard model
參考書籍
SPSS For Windows統計分析
作者:張紹勳 林秀娟(松崗)
量化研究與統計分析
作者:邱皓政(五南書局)
SPSS 12統計建模與應用實務
作者:林傑斌等(博碩文化)
圖解SAS在變異數分析上的應用
作者:王國川(五南書局)
Thank you!!
For your
attention!!