Transcript SPSS统计分析
http://cc.jlu.edu.cn/ss.html
http://cc.jlu.edu.cn/ms.html
统计软件应用
5
主讲人 陶育纯
1
2013.12.20
第五讲
• 课程名称:统计软件应用
• 主要教材: «SPSS (PASW) 17.0
在医学统计中的应用»
马斌荣 编著
科学出版社
• 年级、专业:2010级预防、卫检、信息专业
• 授课时间:2013年12月20日
• 授课时数:2h
2
2013.12.20
目录
第六章 t 检验
一、单样本 t 检验
二、配对 t 检验
三、两组独立样本的 t 检验
第七章 方差分析
一、单因素方差分析
二、方差分析中均数的两两比较
3
2013.12.20
目录
三、随机区组设计的方差分析(自学)
*四、多因素方差分析
*五、析因分析(有重复的两因素方差分析)
* 附加讲
4
2013.12.20
第六章
t 检验
一、单样本 t 检验
㈠ 使用One-Sample T Test命令
SPSS主要通过Analyze → Compare Means →
One-Sample T Test…检验完成对某资料的单样本 t 检验。
㈡ 例题及分析过程
下面通过对教材第35页例3.1的数据做单样本 t 检验
来讲述操作步骤及结果的判读。
5
2013.12.20
1. 建立数据文件
2. 适用条件判断
利用前述的正态性检验方法对样本数据进行正态性检
验。 Analyze →Nonparametric Tests →1-Sample K-S…
打开One-Sample Kolmogorov-Smirnov Test对话框。选择
检验变量,再点击OK按钮完成。从输出结果表3.1中可以
判断出“脉搏数”变量数据服从正态分布。
3. 单样本 t 检验
Next page
6
2013.12.20
Analyze → Compare Means →One-Sample T
Test…打开One-Sample T Test对话框,点击“脉搏数”变量
并移入Test Variable(s):列表栏里, 在Test Value:列表栏里,将
标准值72输入, OK完成。
4. 结果判读
输出结果见表3.2~3.3,在表3.3中可以得到单样本 t 检
验的统计量 t 值为1.590,检验概率P为Sig. (2-tailed)的值,
即P=0.118>0.05,则无统计学意义,即还不能认为该山区
成年男子的脉搏数的总体均数与一般健康成年男子的脉搏
数的总体均数有差异。
7
2013.12.20
二、配对 t 检验
㈠ 使用Paired-Samples T Test命令
SPSS主要通过Analyze → Compare Means →
Paired-Samples T Test…检验完成对某资料的配对 t 检验。
注意:SPSS的配对 t 检验要求资料建立配对的两个
变量数据。
㈡ 例题及分析过程
Next page
8
2013.12.20
下面通过对教材第38页例3.2的数据做配对 t 检验来讲
述操作步骤及结果的判读。
1. 建立数据文件(见exp6.1.sav)
2. 适用条件判断
利用前述的正态性检验方法对样本数据进行正态性检
验。Analyze → Descriptive Statistics →Explore…
打开Explore对话框。选择配对的两个变量的差值作为检验
变量,并选择Plots…按钮中的 Normality plots with tests
选项, 点击Continue按钮,再点击OK按钮完成。从输出结
果表6.2中可以判断出本例治疗前与治疗后的血红蛋白含量
差值数据服从正态分布。
9
2013.12.20
3. 配对 t 检验
Analyze → Compare Means →Paired-Samples T
Test…打开Paired-Samples T Test对话框,点击两个变量形
成配对变量并移入Paired Variables:列表栏里, OK完成。
4. 结果判读
输出结果见表6.3~6.5,在表6.5中可以得到配对 t 检验
的统计量 t 值为-0.364,检验概率P为Sig. (2-tailed)的值,
即P=0.722>0.05,则无统计学意义,即还不能认为该药能
引起患者的血红蛋白含量的显著变化。
三、两组独立样本的 t 检验
10
2013.12.20
㈠ 使用Independent-Samples T Test命令
SPSS主要通过Analyze → Compare Means →
Independent-Samples T Test…检验完成对某资料的两组独
立样本的 t 检验。
注意:SPSS的两组独立样本的 t 检验要求资料建立分
组变量。
㈡ 例题及分析过程
下面通过对教材第42页例3.3的数据做两组独立样本的
t 检验来讲述操作步骤及结果的判读。
11
2013.12.20
1. 建立数据文件(见exp6.2.sav)
2. 适用条件判断
利用前述的SPSS的数据文件的形式拆分命令Split File
把数据文件中的分组变量(group)设置成分组比较变量,从
而使得正态性检验方法可以对分组样本数据进行正态性检
验(即一箭双雕)。
Data → Split File … → Split File 对话框,点击选择
Compare groups选项,再从左侧数据库变量列表中选择分
组变量(group),移动到Groups Based on选项框里, OK即
可。Analyze → Descriptive Statistics → Explore…打开
12
2013.12.20
Explore…对话框,选择血磷值变量(xl)作为检验变量,
点击 Plots…按钮打开Explore: Plots对话框, 选择
Normality plots with tests选项, → Continue → OK完成。
从输出结果表6.7中可以判断出本例急性克山病组与健
康组的血磷测定值数据均服从正态分布。
3. 两组独立样本的 t 检验
Analyze →Compare Means →Independent–Samples
T Test…打开Independent -Samples T Test对话框,选择分
析变量和分组变量, 点击Define Groups…按钮打开Define
Groups对话框输入分组标志值,→ Continue → OK完成。
13
2013.12.20
4. 结果判读
输出结果见表6.8~6.9,表6.8显示的是每组血磷值的描
述统计分析结果;在表6.9中同时显示方差齐性检验结果和
t 检验结果。
首先通过Levene‘s test for equality of variances(即
Levene方差齐性检验)结果判断此数据的方差齐性结果,
本例 F 值为0.072,P=0.791>0.05,则方差齐。
然后在Equal variances assumed(即等方差假设)一
行找出t 检验结果。本例 t = 2.576,P=0.017<0.05,则有统
计学意义,即认为急性克山病患者与健康人的血磷测定值
(总体)不同。
14
2013.12.20
第七章 方差分析
一、单因素方差分析
㈠ 使用One-Way ANOVA命令
SPSS通过Analyze → Compare Means → One-Way
ANOVA…检验完成对某资料的单因素方差分析。
注意:SPSS的方差分析都要求资料建立分组变量。
㈡ 例题及分析过程
下面通过对教材第49页例4.1的数据做单因素方差分析
来讲述操作步骤及结果的判读。
15
2013.12.20
1. 建立数据文件(见exp7.1.sav)
2. 适用条件判断
仿前述分组进行正态性检验方法可以得到每组样本数
据的正态性检验结果(即一箭三雕)。 具体过程略。
本例用Shapiro-Wilk检验得到group=1的P=0.600,
group=2的P=0.074,group=3的P=0.221,三组数据均服从
正态分布。
3. 单因素方差分析
Analyze → Compare Means → One-Way ANOVA…
打开One-Way ANOVA对话框, 选择分析变量和分组变量,
16
2013.12.20
点击Options…按钮,打开One-Way ANOVA: Options对话
框选择 Homogeneity of variance test (方差齐性检验)选项,
→ Continue → OK完成。
4. 结果判读
输出结果见表7.4~7.5,在表7.4中显示的是方差齐性检
验的结果。本例P=0.053,P>0.05,则方差齐。
表7.5显示的是方差分析的结果。本例F = 5.564,P=
0.008<0.05,即认为三组大鼠肾组织液中NO水平存在着不
同。
二、方差分析中均数的两两比较
17
2013.12.20
当方差分析结论拒绝H0时,得到的多组样本的总体均
数不同只是笼统的,而研究者往往需要知道多个均数间到
底哪些存在不同,这就需要借助多重比较(Multiple
Comparisons)的方法。
SPSS提供了多达18种的多重比较方法,我们这里只介
绍常用的S-N-K法、LSD法、Dunnett法和Bonfferoni法。
⑴ S-N-K法(Student-Newman-Keuls):又称q检验。
常用于多个均数间每两个均数的比较。
⑵ LSD法(Least Significant Difference):即最小显著
差法。常用于多个处理组与对照组的均数比较。
18
2013.12.20
⑶ Dunnett法:常用于多个处理组与对照组的均数比较。
⑷ Bonfferoni法:常用于多个均数间每两个均数的比较。
㈠ 使用Post Hoc…按钮
SPSS通过Analyze → Compare Means → One-Way
ANOVA…打开One-Way ANOVA对话框并点击Post Hoc…
按钮打开One-Way ANOVA: Post Hoc Multiple
Comparisons对话框来选择使用某种多重比较方法。
㈡ 例题及分析过程
19
2013.12.20
下面通过对教材第52页例4.2的数据做多重比较来讲述
操作步骤及结果的判读。
1. 打开数据文件(见exp7.2.sav)
2. 选用多重比较方法
Analyze →Compare Means → One-Way ANOVA…
打开One-Way ANOVA对话框并点击Post Hoc…按钮打开
One-Way ANOVA: Post Hoc Multiple Comparisons对话框,
分别选择 LSD、 S-N-K、 Bonfferoni和 Dunnett选项,
Continue → OK完成。
3. 结果判读
20
2013.12.20
输出结果见表7.6~7.7,表7.6显示的是S-N-K法的分析
结果;表7.7显示的是LSD法、 Bonfferoni法和Dunnett法的
分析结果。
S-N-K法是通过寻找同质子集(Homogeneous Subsets)
的方法得出比较结果。子集之间的各组间有差别(P<0.05),
子集之内的各组间无差别(P>0.05)。
LSD法、 Bonfferoni法和Dunnett法是通过在对比的两
组均数差值(Mean Difference (I-J))的右上角标记“ * ”来
表示此两组均数有差别(P<0.05),未标的则无差别(P>0.05)
。
本例用上述四种多重比较方法得到的两两比较结果见
下表7.6-7。
21
2013.12.20
表7.6-7 四种多重比较方法得到的结果
对比组
正常对照组与肾缺血 60min 组
LSD
P > 0.05
Bonfferoni Dunnett
P > 0.05
P > 0.05
S-N-K
P > 0.05
正常对照组与肾缺血 60min 再灌流组
P < 0.05
P < 0.05
P < 0.05
P < 0.05
肾缺血 60min 组与肾缺血 60min 再灌流组
P < 0.05
P < 0.05
—
P < 0.05
三、随机区组设计的方差分析(自学)
㈠ 使用Univariate命令
SPSS通过Analyze → General Linear Model →
Univariate …命令完成随机区组设计的方差分析。
㈡ 例题及分析过程
22
2013.12.20
下面通过对教材第55页例4.3的资料做随机区组设计的
方差分析来讲述操作步骤及结果的判读。
1. 建立数据文件(见exp7.3.sav)
2. 适用条件判断
具体过程略。
3. 随机区组设计的方差分析
Analyze → General Linear Model → Univariate …
打开Univariate对话框, 将尿氟排出量变量(nf)调入
Dependent Variable (因变量) 中,将时间变量(group)、区
组变量(block)调入Fixed Factor(s)(固定因素)中,点击
23
2013.12.20
Model…按钮打开Univariate: Model对话框, 选择Custom(
自定义)选项,再点击 Build Term(s)下的下拉框并从中选
择Main Effects,然后把左侧的group、block调入右侧的
Model栏,去掉栏下的Include intercept in model选项, →
Continue → OK完成。
4. 结果判读
输出结果见表7.10a,结果显示:
group组(不同时间):F=7.033, P=0.004 < 0.05 ,即
工前、工中和工后的氟作业工人尿氟排出量存在不同。
block组(不同区组):F=1.642, P=0.155 > 0.05,即工
人之间的差异对尿氟排出量影响不大。
24
2013.12.20
5. 多重比较
Analyze → General Linear Model → Univariate …
打开Univariate对话框, 点击Post Hoc…按钮打开Univariate:
Post Hoc Multiple Comparisons for Observed Means对话框,
选择group为多重比较变量, 再分别选择 LSD、 S-N-K、
Bonfferoni和 Dunnett选项,Continue → OK完成。
输出结果见表7.12和表7.13。用上述四种多重比较方法
得到的两两比较结果见下表7.12-13。
表7.12-13 四种多重比较方法得到的结果
对比组
工前组与工中组
LSD
P < 0.05
Bonfferoni Dunnett
P < 0.05
P < 0.05
工前组与工后组
P > 0.05
P > 0.05
P > 0.05
P > 0.05
工中组与工后组
P > 0.05
P > 0.05
—
P > 0.05
25
S-N-K
P < 0.05
2013.12.20
* 四、多因素方差分析
前面讲授的随机区组设计的方差分析实质就是一个最
简单的多因素方差分析(两因素无重复数据),因为它不
存在交互效应(interaction),当某因素的各单独效应随
另一因素变化而变化时,则称这两个因素存在交互效应。
由于从总变异中分解的变异项目增多,多因素方差分
析计算和输出结果就更为复杂。
本节内容略。
附加内
容啊!
26
2013.12.20
*五、析因分析(有重复的两因素方差分析)
析因分析实质就是有重复数据的两因素方差分析。它
可以存在单独效应(Simple effect)、主效应(main effect)和
交互效应(interaction)。
SPSS通过Analyze → General Linear Model →
Univariate …命令完成析因分析。
下面通过对《卫生统计学》第5版教材第157页例9-3的
资料做析因分析来讲述操作步骤及结果的判读。
1. 建立数据文件(见wstjx5exp9-3.sav)
2. 析因分析
27
2013.12.20
Analyze → General Linear Model → Univariate …
打开Univariate对话框,将吞噬指数变量调入Dependent
Variable (因变量) 中,将升白细胞药物、纯苯调入Fixed
Factor(s) (固定因素) 中,点击Model…按钮打开
Univariate: Model对话框,选择Custom选项,选择Build
Term(s)中的interaction ,点击左侧的升白细胞药物和纯苯
则将二者的交互效应项(纯苯*升白细胞药物)调入右侧的
Model栏,再选择Build Term(s)中的Main Effects,点击左
侧的升白细胞药物和纯苯则将二者的主效应项(纯苯、升
白细胞药物)调入右侧的Model栏,→ Continue,点击
28
2013.12.20
Options…按钮打开Univariate: Options对话框,选择
Descriptives statistics 选项,→ Continue → OK完成。
3. 结果判读
输出结果见表7.28~7.29。
表7.28显示的是“升白细胞药物”和“纯苯”两因素
在单独效应、主效应和交互效应下的“吞噬指数”的均数
、标准差等大小。
表7.29显示的是“升白细胞药物”和“纯苯”两因素
在主效应和交互效应下的“吞噬指数”的假设检验结果。
结果为:
升白细胞药物和纯苯的交互效应:F=1.0000, P=0.3322
29
2013.12.20
> 0.05,即两因素的交互效应无统计学意义;
升白细胞药物的主效应: F=1.5192, P=0.2355 > 0.05,
即升白细胞药物的主效应无统计学意义;
纯苯的主效应: F=1857.0087, P < 0.001,即纯苯的主
效应有统计学意义。
思考题
1. 分组变量和分组标志值的区别。
2. 单因素方差分析、随机区组设计的方差分析和析因
分析的区别。
C
30
2013.12.20
表 3.1
31
2013.12.20
表 3.2
表 3.3
32
2013.12.20
33
2013.12.20
34
2013.12.20
输出结果
此结果是用
1 Sample K-S
检验得到的
正态检验结果
表 6.2
35
2013.12.20
需要点击两个变量名
形成变量对,移动按
钮方可使用。
配对变量
36
2013.12.20
输出结果
表 6.3
表 6.4
Differences — 差值
表 6.5
t = -0.364, P=0.722 > 0.05
表 6.3~6.5
37
2013.12.20
分组变量
血磷测定值变量
group=1 代表
急性克山病组
group=2 代表
健康组
38
2013.12.20
39
2013.12.20
被检验变量
选此项可以得到
Shapiro-Wilk
正态检验结果
40
2013.12.20
输出结果
·Ö×é
¼±ÐÔ¿Ëɽ²¡»¼Õß
N
Normal Parameters
a,b
Most Extreme
Di fferences
½¡¿µÈË
表 6.7
One-Sample Kolmogorov-Smirnov Test
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tai led)
Exact Si g. (2-tailed)
Point Probability
N
Normal Parameters a,b
Most Extreme
Di fferences
Mean
Std. Deviation
Absolute
Positive
Negative
Mean
Std. Deviation
Absolute
Positive
Negative
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tai led)
Exact Si g. (2-tailed)
Point Probability
a. Test distri buti on is Normal.
b. Calculated from data.
Tests of Normality
a
·Ö×é
¼±ÐÔ¿Ëɽ²¡»¼Õß
ѪÁ×Öµ
½¡¿µÈË
ѪÁ×Öµ
ѪÁ×Öµ
12
4.6917
1.22208
.126
.126
-.105
.435
.991
.979
.000
14
3.4350
1.25535
.176
.176
-.139
.657
.781
.719
.000
Kolmogorov-Smirnov
Statistic
df
Sig.
.126
12
.200*
.176
14
.200*
Shapiro-Wilk
Statistic
df
.964
12
.931
14
Sig.
.835
.316
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
41
2013.12.20
被分析变量
分组变量
分组标志值
点击此钮可以
输入分组标志值
42
2013.12.20
输出结果
方差齐性检验结果,若P>0.05,则方差齐。
表 6.8
表 6.9
等方差假设
方差不等假设
方差齐性检验F = 0.072, P=0.791 > 0.05,
方差齐。选用等方差假设下的检验结果:
t = 2.576, P=0.017 < 0.05,有统计学意义。
43
2013.12.20
分组变量
NO值变量
group=1 代表
正常对照组
group=2 代表
肾缺血60min组
group=3 代表
肾缺血60min
再灌流组
44
2013.12.20
被分析变量
分组变量
选此项可作多样本
方差齐性检验
45
2013.12.20
Sum of Squares — 离均差平方和
df — 自由度
Mean Square — 均方
输出结果
Oneway
Test of Homogeneity of Variances
表 7.4
NO
Levene
Statistic
3.216
df1
df2
2
Sig.
.053
33
方差齐性检验结果,
若P>0.05,则方差齐。
ANOVA
表 7.5
NO
Between Groups
Within Groups
Total
Sum of
Squares
46925.950
139157.6
186083.6
df
2
33
35
Mean Square
23462.975
4216.898
F
5.564
Sig.
.008
F = 5.564, P=0.008 < 0.05
表 7.4~7.5
46
2013.12.20
Equal Variances Assumed — 等方差假设 表明第一组为对照组
Equal Variances Not Assumed —方差不等假设
47
2013.12.20
输出结果
正常对照组与肾缺血60min组:P=0.611 > 0.05;
正常对照组与肾缺血60min再灌流组:P=0.004 < 0.05。
表 7.7
附加说明Dunnett法是多个处理组
与一个对照组进行比较
48
* 表示P < 0.05
2013.12.20
输出结果
Homogeneous Subsets — 同质子集
表 7.6
肾缺血60min再灌流组与肾缺血60min组:P < 0.05;
肾缺血60min再灌流组与正常对照组:P < 0.05。
正常对照组与肾缺血60min组:P=0.611 > 0.05
49
2013.12.20
尿氟排出量
变量
group=1
代表工前组
区组变量
group=2
代表工中组
group=3
代表工后组
50
2013.12.20
被分析变量(即实验指标)
模
型
设
置
按
钮
Two-way ANOVA
51
2013.12.20
Main effects(主效应)
52
2013.12.20
53
2013.12.20
输出结果
表 7.10a
Tests of Between-Subjects Effects
Dependent Variable: Äò·úÅųöÁ¿
Source
Model
group
block
Error
Total
Type III Sum
of Squares
167.682a
4.823
6.192
7.543
175.225
df
14
2
11
22
36
Mean Square
11.977
2.411
.563
.343
F
34.933
7.033
1.642
Sig.
.000
.004
.155
a. R Squared = .957 (Adjusted R Squared = .930)
group组:F=7.033, P=0.004 < 0.05
block组:F=1.642, P=0.155 > 0.05
54
2013.12.20
55
2013.12.20
输出结果
表 7.12
56
2013.12.20
输出结果
工前组与工后组:P=0.070 > 0.05
表 7.13
工前组与工中组:P < 0.05
工中组与工后组:P=0.137 > 0.05
57
2013.12.20
58
2013.12.20
59
2013.12.20
升白细胞药物和纯苯的交互效应项
升白细胞药物和纯苯的
各自主效应项
60
2013.12.20
61
2013.12.20
输出结果
Univariate Analysis of Variance
Between-Subj ects Factors
Éý°×ϸ
°ûÒ©Îï
´¿±½
0
1
0
1
Value Label
²»ÓÃ
ÓÃ
²»ÓÃ
ÓÃ
N
10
10
10
10
Descriptive Statistics
Dependent Variable: ÍÌÊÉÖ¸Êý
Éý°×ϸ°ûÒ©Îï
²»ÓÃ
ÓÃ
Total
´¿±½
²»ÓÃ
ÓÃ
Total
²»ÓÃ
ÓÃ
Total
²»ÓÃ
ÓÃ
Total
Mean
3.8800
1.9840
2.9320
3.8900
2.0800
2.9850
3.8850
2.0320
2.9585
Std. Deviation
.06325
.09915
1.00235
.10149
.11336
.95933
.07990
.11243
.95530
62
表 7.28
N
5
5
10
5
5
10
10
10
20
通过此项结果可以得到
“升白细胞药物”和“纯
苯”在单独效应、主效应
和交互效应下的“吞噬指
数”的均数大小。
2013.12.20
输出结果
表 7.29
Tests of Between-Subjects Effects
Dependent Variable: ÍÌÊÉÖ¸Êý
Source
Corrected Model
Intercept
Éý°×ϸ°ûÒ©Îï * ´¿±½
Éý°×ϸ°ûÒ©Îï
´¿±½
Error
Total
Corrected Total
Type III Sum
of Squares
17.1913a
175.0544
.0092
.0140
17.1680
.1479
192.3937
17.3393
df
3
1
1
1
1
16
20
19
Mean Square
5.7304
175.0544
.0092
.0140
17.1680
.0092
F
619.8426
18935.04
1.0000
1.5192
1857.0087
Sig.
.0000
.0000
.3322
.2355
.0000
a. R Squared = .991 (Adjusted R Squared = .990)
升白细胞药物和纯苯的交互效应:F=1.0000, P=0.3322 > 0.05;
升白细胞药物的主效应: F=1.5192, P=0.2355 > 0.05;
纯苯的主效应: F=1857.0087, P < 0.001。
63
2013.12.20