PowerPoint 簡報

Download Report

Transcript PowerPoint 簡報

How to Use SPSS in Biomedical
Data analysis
講員: 葛魯蘋
Kaohsiung Veterans General Hospital
Department of Education and Research
SPSS: Statistical Package for Social Science
參考資料
林清山著 心理與教育統計學 東華書局 1992年三月初版
2000年八月初版
諮詢申請服務單
一、
(1)申請人
(2)服務單位
(3)單位主管意見
(4)教研部主任意見
二、
(1)統計諮詢
(2)研究諮詢
(3)論文review
(4)其他
電話
教研部
三、
(1)題目
(2)材料方法
(3)建議
四、討論時間
自民國
年
共
時
月
分
日
時起
五、諮詢對象: 葛魯蘋教授 (Tel: 1519)
Which topic would you like?
•
•
•
•
•
•
Repeated measures ANOVA
Logistic regression
Survival analysis
Validation of questionnaire
How to design a questionnaire
How to create a data base for follow-up
study
Characteristics of Biomedical Data
1. Variables and Constant
2. Classification of variables:
1) Independent variables and Dependent variables
2) Continuous variables and Discrete variables
a) Continuous variables: Ht., Wt, Time, IQ, Anxiety
Score, BP
↑
175
↑
176
↑
↑
177 178
↑
179cm
b) Discrete variables: Type of treatment, Survival
status, Location of cancer,
Morphology, and Genotype
3)Nominal variables, Ordinal variables, Interval variables and Ratio
variables
a)Nominal variables: ID No., Type of treatment, sex,
color, name, etc.
b)Ordinal variables: rank, grade, likert scale, etc.
*if a > b and b> c then a> c, but a-b≠b-c
Grade A > Grade B > Grade C, but
Grade A – Grade B ≠ Grade B –Grade C
c)Interval variables: temperature, lightness, etc.
*variable with equal unit
*variable without absolute zero
*if a >b >c then a-b = b-c
*if 39℃ > 37 ℃>35 ℃
then 39 ℃-37 ℃= 37 ℃- 35 ℃
d)Ratio variables: Ht., Wt., etc.
*variable with equal unit
*variable with absolute zero
120cm: from 0cm to 120cm
37℃ : from 0℃ to 37℃
from 20℃ to 37℃
from -5℃ to 37℃
from -50℃ to 37℃
*if a>b>c then a-b = b-c
*if a>b>c then a/b = b/c
if 120cm>60cm>30cm
then 120cm/60cm = 60cm/30cm
四個變數的例子
球
變數
員
姓
名
例子
張
陳
蘇
盧
李
名義
球員背號
101
30
25
5
44
次序
考試等第
第三
第二
第五
第一
第四
等距
體溫(℉)
98.5
98.3
98.7
98.8
98.6
比率
身高(cm)
179
178
169
162
181
The Common Statistical Methods (1)
Independent Variable Dependent Variable Statistical Method
Categorical variable
Categorical v.
X2 test
Categorical v.
Continuous v.
t test or ANOVA
Categorical v.
Ordinal v.
Mann-Whitney U test
Kruskal-Wallis one-way ANOVA
Continuous v.
Ordinal v.
Continuous v.
Ordinal v.
Regression or
Pearson correlation
Spearman correlation
The Common Statistical Methods(2)
Independent Variable Dependent Variable Statistical Method
More than 1 conti v. Continuous v.
More than 1 conti v.
and (or)
Binomial or
multinomial v.
more than 1 cate v.
Multiple regression
Logistic regression
The Common Statistical Methods(3)
Independent Variable Dependent Variable Statistical Method
Categorical v.
More than 1cate v.
and (or)
more than 1conti v.
Time
Time
Log rank test,
Breslow test,
Tarone-Ware test
Cox’s regression
(Proportional
Hazard Model)
Chi-square test (Pearson)
 2  
i
j
(ij  ij ) 2
ij
df = (R-1)(C-1)
例:問卷調查醫生、藥劑師、與護士,問卷回收
情形如下,請問回收率是否依專業而不同?
觀察次數 (期望次數)
職稱
醫生
藥劑師
護士
回 合作 21 (15.3) 11 (10.2) 23 (29.5) 55
收
情 拒答
6 (11.7) 7 (7.8) 29 (22.5) 42
形
27
18
52
97
(21 15.3)2 (11 10.2)2 (23 29.5)2 (6  11.7)2 (7  7.8)2 (29 22.5)2
Χ 





 8.35*
15.3
10.2
29.5
11.7
7.8
22.5
2
df= (R-1)(C-1)=(2-1)(3-1)=2 *X2.95(2) = 5.991
8.35 > 5.991 ,P值 < 0.05
觀察次數 (期望次數)
性別
男
女
回 合作 21 (16.8) 7 (11.2) 28
收
情
形 拒答 6 (10.2) 11 (6.8) 17
27
18
45
(21 16.8)2 (7  11.2)2 (6  10.2)2 (11- 6.8)2
Χ 



 6.95*
16.8
11.2
10.2
6.8
2
*X2.95(1) = 3.841 , 6.95 > 3.841 , P值
< 0.05
卡 方 檢定
Pearso n卡方
數值
a
8.322
2
漸近顯著
性 (雙尾)
.016
自由度
概似比
8.668
2
.013
線性對線性的關連
8.236
1
.004
有效觀察值的個數
97
a. 0格 (.0%) 的預期個數少於 5。 最小的預期個數為 7.79。
在計算X2的過程中倘遇到df = 1,而且期望次數(不
是觀察次數)又小於5的時候,就必須進行所謂耶茲
氏校正(Yates’ correction for continuity).
1 2
(  ij   ij  )
2
 2  
 ij
i
j
觀察次數 (期望次數)
滿意程度
不滿意
滿意
CQI
CQI 前 19 (15.8) 9 (12.2) 28
推
後 3 (6.2)
CQI
行
22
8 (4.8) 11
17
39
未校正:
2
2
2
2
(19

15.8)
(9

12.2)
(3

6
.
2
)
(8
4.8)
Χ2 



 5.29*
15.8
12.2
6.2
4.8
*X2.95(1) = 3.841 , 5.29 > 3.841 , P值 <
0.05
已校正:
2
2
2
(
19

15.8
0.5)
(
9

12.2
0.5)
(
3

6
.
2
0.5)
Χ2 


15.8
12.2
6.2
( 8 - 4.8 - 0.5)2

 3.768*
4.8
*X2.95(1) = 3.841 , 3.768 < 3.841 , P值 >
0.05
s
s
a
o
s
N
N
N
c
c
c
C
%
%
%
0
9
×
N µ
o
¡
º
·
t
N
¡
C
C
C
9
9
8
¦
æ
E
8
2
0
%
%
%
%
C
C
3
8
1
E
2
8
0
%
%
%
%
T
C
2
7
9
E
0
0
0
%
%
%
%
a
y
m
c
c
i
t
g
t
a
d
i
i
l
i
d
d
u
d
f
b
P
0
1
1
a
C
8
1
2
L
7
1
1
F
3
6
L
4
1
3
A
N
9
a
C
b
1
Fisher’s Exact Test
*to
compare two proportions for the nominal variables
訪問6名男生和7名女生喜不喜歡跳傘運動,結果如下表
(B)所示,亦即回答喜歡者男生有4名,女生有1名。問男
生是否較女生喜歡跳傘運動?
(A) 極端情形
性
(B)
別
性
男
別
女
男
女
跳喜 歡
5
0
5
跳喜 歡 4 (2.3)
1 (2.7) 5
傘不喜歡
1
7
8
傘不喜歡 2 (3.7)
6 (4.3) 8
6
7
13
6
7
13
(A) 極端情形
性
(B)
別
性
男
女
跳 喜 歡
5
0
5
傘 不喜歡
1
7
8
6
7
13
5
0
1  , 2  ,
6
7
1  2   0.83  0.00  0.83
A 
5!8!6!7!
 0.0047
13!5!0!1!7!
別
男
女
跳 喜 歡
4
1
5
傘 不喜歡
2
6
8
6
7
13
4
1
1  ,2  ,
6
7
1  2   0.67  0.14  0.53
B 
5!8!6!7!
 0.0816
13!4!1!2!6!
P值 = PA + PB = 0.0047 + 0.0816 = 0.0863,因為P值 > 0.05,沒有統計上差異
假定我們所得的2×2列聯表觀察次數如下:
A
B
(A+B)
C
D
(C+D)
(A+C)
(B+D)
N
則其Fisher’s exact概率之公式為:
 
i
( A  B )!(C  D )!( A  C )!( B  D )!
N ! A! B! C ! D!
s
s
a
o
s
N
N
N
c
c
c
3¸
r
o
Ê
§
¤
o
¨
k
t
k
¸
³
C
4
1
5
E
3
7
0
%
%
%%
¤
C
2
6
8
E
7
3
0
%
%
%%
T
C
6
7
3
E
0
0
0
%
%
%%
a
y
m
c
c
i
t
g
t
a
d
i
i
l
i
d
d
u
d
f
b
P
5
1
3
a
C
9
1
3
L
3
1
7
F
3
6
L
7
1
3
A
N
3
a
C
b
4
兩個平均數的差異顯著性考驗
t-test:Students’ t-test,Paired t-test
一、兩個獨立樣本(independent samples or un-paired
samples), Students’ t-test
如:a.實驗組平均血壓與控制組平均血壓之比較。
b.某病房去年病人與今年病人在焦慮平均指
數的比較。
c.高榮男女不同員工其平均年齡的比較。
處理兩個母數的問題時,不管兩個樣本是來自同一
母群,或來自σ2相同的兩個不同母群,都要合乎兩
個基本假定。第一個基本假定就是σ2x1=σ2x2=σ2,
亦即,兩個母群的變異數要相同。當兩個母群的變
異數相同時,稱為具有變異數同質性(homogeneity of
variance)。第二個基本假定是兩樣本所來自的母群的
分配是常態的。
當σ2x1和σ2x2均為未知而且當σ2x1=σ2x2=σ2的基本假定可以
滿足時,
t
S
2
P
X1  X 2
1
1
S P2 (

)
N1 N 2
(X

1
 X 1 )2   ( X 2  X 2 )2
N1  N 2  2
S12 ( N 1  1)  S22 ( N 2  1)

N1  N 2  2

( X 1 )2  
( X 2 )2 
2
2
 X 1 
   X 2 

N
N

 

1
2

N1  N 2  2
S 的求法乃是
S
2
P
2
1
(X

1
 X 1 )2
N1 -1
和S
df = N1+N2-2
2
2
(X

2
 X 2 )2
N 2 -1
的加權平均數。
例:某心理學家宣稱RNA(核糖核酸)可以改變記憶
力,因此會影響老鼠的迷津學習。他以隨機抽
樣的方法抽取24隻老鼠,隨機分派為實驗組和
控制組,每組12隻老鼠。實驗組注射RNA,控
制組注射生理食鹽水,然後在同樣條件下進行
迷津學習實驗。結果如下頁圖表所示。問RNA
注射的老鼠學習成績與注射生理食鹽水的老鼠
相同嗎?
老鼠迷津學習正確反應的分數
實驗組
控制組
29
27
32
25
33
30
36
28
33
28
32
29
22
31
28
27
29
32
26
27
31
28
25
30
X
X
1
 362
2
1
 11026
X1  30.17
X
X
2
 336
2
2
 9498
X 2  28.00
( 362 ) 2
11026 
2
12  9.61
S1 
12  1
( 336 ) 2
9498 
2
12  8.18
S2 
12  1

( 362)2  
( 336)2 
11026 12   9498 12 
 
  8.89
S P2  
12  12  2
t
30.17  28.00
 1.78
1
1
8.89(  )
12 12
t1.005.(12122)  2.819
1.該心理學家認為是否打RNA對老鼠學習有所影響,統計假設應
寫為:
H0:μx1=μx2
H1:μx1≠μx2
2.母群的σ2x1和σ2x2均為未知,必須使用不偏估計值s2P,而且
因為
σ2x1=σ2x2=σ2的假設可以符合。
3.如果犯第一類型錯誤便是很嚴重的,因之,實驗者決定使
用.01顯著水
準。又因為 H1:μx1≠μx2,所以查附錄表D,得t1-.005(12+122)=2.819。
倘實際計算所得t值大於2.819,則應拒絕 H0:μx1=μx2 。
4.實際計算所得t=1.78,小於查表t值2.819,故H0應予接受。
t
E
d
e
N
e
i
²
a
°
¹
±
S
s
u
f
a
V
o
n
a
l
e
r
S
e
i
E
g
a
e
e
o
p
F
a
d
i
t
r
r
w
g
p
f
i
e
e
°
E
O
5
5
0
2
9
7
2
6
9
a
E
0
0
9
7
2
6
9
a
二、相依樣本或配對的樣本(dependent samples, paired
samples
or matched samples), Paired t-test
如:a.同一組人經實驗處理(吃降血壓藥)後,做前測血
壓與後
測血壓平均值之比較。
b.教研部在CQI實行前後各實驗室平均論文篇數的
比較。
c. 高榮在CQI實行前後各科健保給付剔退案平均數
之比較。
t
X
d 0 d 0


S
Sd
d
N
d
d  X
N
1
d

 X2  0
……

d


2
2
[公式
1]
N
N  N  1
 X 2 ,即這些差值的平均數等於前後兩個平均數之差
 d  d 
2
Sd 
1
N 1

d
 d 

2
2
N 1
N
是這些差值的標準差;
還有, Sd 便是假定我們重複抽取無限多對
得無限多
故:Sd 
d
時,這些 d 的分配的標準誤。
Sd

N
d

d


2
2
N
N  N  1
df = N-1
X
1
 X2

例:某研究者利用十二名兒童來接受創造力訓練課
程。下頁圖表中是接受訓練課程以前創造力測
驗前測成績和接受訓練課程以後的後測成績。
試以α= .01,考驗研究者所說「創造力訓練課程
可以提高創造力」的說法是否為真?
1.研究者主張創造力訓練課程可以提高創造力,亦即
後測的
創造力測驗平均成績會比前測時的平均成績為高,
所以:
H0:μx1≧μx2
H1:μx1<μx2
2.因為每位受試者均前後參加創造力測驗,故為相依
樣本或
受試者內設計,或重複量數的問題。又因為兩個母
群的σ2
未知,故適合使用公式 1 所示的t考驗。df = N-1 =
12-1 =11。
十二名兒童創造力測驗前後測平均成績差異考驗
IDNO
1
2
3
4
5
6
7
8
9
10
11
12
和
平方和
乘積和
相關
平均
標準差
Xi1
前測
10
8
11
9
6
15
10
13
9
11
8
7
117
1211
Xi2
後測
12
7
14
13
9
16
12
12
10
14
8
11
138
1664
di
-2
1
-3
-4
-3
-1
-2
1
-1
-3
0
-4
-21
71
11.50
2.6458
t

 1.75  0
1.7645
12
9.75  11.50  0
2

 21
71 
12
1212  1
 3.44
t.01.(121)  2.718
1402
.7682
9.75
2.5271
[公式 1]
-1.75
1.7645
3.研究者願意冒犯第一類型錯誤的機率為.01,亦即α= .01。
由對立假設H1:μx1<μx2可知這是單側考驗。而且拒絕區
是在
左端。查附錄表D,得知 t.010(12-1) = -2.718
4.將上頁圖表中的資料代入公式1得:
t
X1  X 2
d

d


2
2

9.75  11.5
2

 21
71 
N
N  N  1
 3.44
12
1212  1
或如上頁圖表使用公式1也可以得到一樣結果。因計算的t值
落入拒絕區,所以要拒絕H0:μx1≧μx2的說法。可見,創造
力測驗後測平均成績顯然比前測平均成績為高。創造力訓練
課程可以提高兒童的創造力之說法可以得到支持,惟犯第一
類型錯誤的概率為.01。
l
t
E
d
e
e
N
a
a
P
«
3
3
1
«
5
6
s
e
N
i
g
P
«
m
i
f
o
n
a
l
e
r
S
t
E
i
d
p
e
e
i
d
a
w
a
t
p
a
a
P
«
5
6
1
7
3
6
1
6
Using SPSS to Evaluate Data for
Normality
Luo-Ping Ger
Kaohsiung Veterans General Hospital
Department of Education and Research
The Common Statistical Methods (1)
Independent Variable Dependent Variable Statistical Method
Categorical variable
Categorical v.
X2 test
Categorical v.
Continuous v.
t test or ANOVA
Categorical v.
Ordinal v.
Mann-Whitney U test
Kruskal-Wallis one-way ANOVA
Continuous v.
Ordinal v.
Continuous v.
Ordinal v.
Regression or
Pearson correlation
Spearman correlation
檢 定統 計 量b
Mann-Whitney U 統計量
Wilco xon W 統計量
Z 檢定
漸近顯著性 (雙尾)
精確顯著性 [2*(單尾顯
著性)]
a. 未對等值結做修正。
b. 分組變數:組別
記憶力
44.000
122.000
-1.626
.104
.114
a
S
s
u
f
a
V
o
n
a
l
e
r
S
e
i
E
g
a
e
e
o
p
F
a
d
i
t
r
r
w
g
p
f
i
e
e
°
E
O
5
5
0
2
9
7
2
6
9
a
E
0
0
9
7
2
6
9
a
Post-hoc analysis:
ANOVA
記憶力
組間
平方和
92.389
組內
總和
自由度
2
平均平方和
46.194
251.917
33
7.634
344.306
35
檢 定 統計 量a ,b
卡方
自由度
記憶力
9.173
2
漸近顯著性
.010
a. Kruskal Walli s 檢定
b. 分組變數:組別
F 檢定
6.051
顯著性
.006
The Common Statistical Methods (1)
Independent Variable Dependent Variable Statistical Method
Categorical variable
Categorical v.
X2 test
Categorical v.
Continuous v.
t test or ANOVA
Categorical v.
Ordinal v.
Mann-Whitney U test
Kruskal-Wallis one-way ANOVA
Continuous v.
Ordinal v.
Continuous v.
Ordinal v.
Regression or
Pearson correlation
Spearman correlation