SPSS统计分析

Download Report

Transcript SPSS统计分析

http://cc.jlu.edu.cn/ss.html
http://cc.jlu.edu.cn/ms.html
统计软件应用
3
主讲人
陶育纯
1
2013.6.3
第三讲
• 课程名称:统计软件应用
• 主要教材: «SPSS (PASW) 17.0
在医学统计中的应用»
马斌荣 编著
科学出版社
• 年级、专业:2009级放射医学专业
2012级公卫研究生
• 授课时间:2013年6月4日
• 授课时数:4h
2
2013.6.3
目录
第一+章 数据文件的编辑
一、数据的搜索
二、变量和记录的插入与删除
三、数据的重新编码 ★
四、利用SPSS函数建立新变量
五、排序
六、数据文件的拆分与合并
3
2013.6.3
第一+章 数据文件的编辑
一、数据的搜索
1. 搜索指定记录的序号
Data → Go to case…,键入序号。
这里的序号是指SPSS自动生成的记录编号。
2. 搜索指定变量中的指定数据
先点击指定变量所在列的任一单元格, Edit → Find…,
键入指定数据值。
4
2013.6.3
二、变量和记录的插入与删除
1. 插入变量
⑴ 在Data View窗口,点击插入变量的位置列,Data
→Insert Variable,原变量右移。
⑵ 在Variable View窗口,点击插入变量的位置行,
Data → Insert Variable,原变量下移。
2. 删除变量
⑴ 在Data View窗口,点击要删变量的名称栏,Edit →
Clear。
⑵ 在Variable View窗口,点击要删变量的序号栏,
Edit → Clear。
5
2013.6.3
3. 插入记录
在Data View窗口,点击插入记录的位置行,Data →
Insert case,原记录下移。
4. 删除记录
在Data View窗口,点击要删记录的序号栏,Edit →
Clear。
★
三、数据的重新编码
根据统计分析的需要,当将连续变量转换为分组资料
或离散资料时,SPSS常用Recode命令或Visual Bander命令
( 12.0以上版本)完成此任务。
6
2013.6.3
1. Recode命令的用法
例2.1中的月龄age最小值1,最大值144。现以20个月
为间隔分“1~20”、“21~40”、“41~60”、“61~80”
、 “81~ 100”、“101~120”、“121~140”、“141~” 8
个组。
方法:
Transform → Recode  →
① Into Same Variables… 重编码后覆盖原变量
② Into Different Variables… 重编码后生成新变量
分别点击Old and New Values…按钮可打开两个几乎相
同的对话框。通过不同的范围定义来生成新的变量值。
7
2013.6.3
SPSS可用于定义范围的主要方式有:
① 下限值 through 上限值
② Lowest through 上限值
③ 下限值 through highest
注意:为避免重复或遗漏,不论是上限值、下限值 、
最小值和最大值,凡是第一次出现,SPSS均包含,下次出
现相同的值则不包含;范围定义出现重叠,以第一次定义
为准。
本例若选择生成一新变量age1,其新旧变量值重新编
码的对话框见图3.5。
8
2013.6.3
2. Visual Binning命令的用法
Visual Binning命令是SPSS 18.0的一个可视化分组的过
程,采用图形化操作,非常直观。
方法:
Transform → Visual Binning …→ Visual Binning对话
框1→ Visual Binning对话框2 ,点击Make Cutpoints…按
钮打开对话框,定义第一切点(First Cutpoint),组距(Width)
和切点数(Number of),完成填写数据后Apply返回Visual
Binning对话框2 , 若定义每组标号则点击Make Labels按钮,
SPSS将根据Make Cutpoints…中定义值自动生成标号, 后
在Binned Name填充栏里填写新变量名称,OK完成。
9
2013.6.3
注意:在Make Cutpoints…对话框中, First Cutpoint、
Number of和Width三个值的定义中,任意定义完成其中两
个值,SPSS则会自动生成第三个值。
本例若选择生成一新变量age1,早期SPSS用Visual
Bander命令完成的操作步骤见视频。
四、利用SPSS函数建立新变量
根据统计分析的需要,SPSS可以使用表达式生成新变
量,可利用SPSS的函数、运算操作符、数字、逻辑运算符
和原有变量,还可利用条件语句If。
10
2013.6.3
SPSS主要通过Transform → Compute…命令完成新
变量的建立。下面通过把例2.1中的“手术时间”变量time
(
单位为分钟)转化成小时来生成一个新变量timehr,并且
要求只转换男性病例的过程讲解SPSS建立新变量的过程。
方法:
Transform → Compute… →Compute Variable对话框,
利用对话框提供的功能完成表达式timehr=time/60的建立,
然后点击条件语句If按钮,打开Compute Variable: If
Cases对话框,完成条件选择sex=1,点击Continue按钮,
再点击OK按钮完成。
11
2013.6.3
五、排序
SPSS主要通过Data → Sort Cases…命令完成对某变
量的排序。
具体方法参见SPSS参考书的相关内容。
六、数据文件的拆分与合并
1. 数据文件的拆分
SPSS主要通过Data → Select Cases…命令或Split File
…命令完成对数据文件的拆分。
⑴ Data → Select Cases…→ Select Cases对话框
12
2013.6.3
若点击条件语句If按钮,打开Select Cases: If 对话框,完成
条件选择。
注意:在Select Cases对话框中的Unselected Cases Are
选项中,若选择Deleted,则不满足条件的记录将被永久删
除且不可恢复;而选择Filtered,则不满足条件的记录只是
被屏蔽(即打斜杠),可恢复。 Filtered为SPSS默认选项。
⑵ Data → Split File … → Split File 对话框,从
左侧数据库变量列表中选择分组变量,移动到Groups
Based on选项框里, OK即可。
注意: Split File …后只对数据库进行按被拆分变量的
13
2013.6.3
排序,只有在实施统计分析命令时方才发生效应。
以下是对例2.1按“性别变量”(sex)进行形式拆分,分
别
选择Compare groups和Organize output by groups项,然
后调用统计分析Frequencies命令对“感染与否变量”(
infect)进行分析得到的结果1和结果2。
2. 数据文件的合并
SPSS主要通过Data → Merge Files 命令完成对数据
文件的合并。
14
2013.6.3
具体方法参见SPSS参考书的相关内容。
思考题
1. Select Cases 和 Split File 的区别。
2. Recode命令有什么用途。
C
15
2013.6.3
16
2013.6.3
新变量名
17
2013.6.3
18
2013.6.3
Lowest thru 20 -->1
21 thru 40 -->2
图3.5
19
2013.6.3
选择要分组的变量
20
2013.6.3
21
2013.6.3
22
2013.6.3
23
2013.6.3
敲入age1
24
2013.6.3
• SPSS 18.0每次执行菜单命令后,都会自动在
Output窗口粘贴出相对应的程序。
• 以下是Visual Binning全部操作过程所对应的
程序。
25
2013.6.3
点击上图即可播放视频,再点击则暂停
26
2013.6.3
数学表达式
新
变
量
名
SPSS
函
数
旧
变
量
列
表
条件语句
Calculator Pad
27
函数描述
2013.6.3
列条件表达式
28
2013.6.3
选择满足条件的记录
随机取样本
根据时间或记录序号
范围选择记录
使用过滤变量
删除
不可逆
过滤
29
2013.6.3
30
2013.6.3
主要用于恢复拆分之前的状态
分组分析
分组输出分析结果
分组变量列表
31
2013.6.3
选择Compare groups项的输出结果
Frequencies
Statistics
¸ÐȾÓë·ñ
ÄÐ
N
Å®
N
Valid
Missing
Valid
Missing
73
0
13
0
¸ÐȾÓë·ñ
ÐÔ±ð
ÄÐ
Valid
Å®
Valid
Frequency
ÎÞ¸ÐȾ
54
¸ÐȾ
19
Total
73
ÎÞ¸ÐȾ
10
¸ÐȾ
3
Total
13
Percent
74.0
26.0
100.0
76.9
23.1
100.0
Valid Percent
74.0
26.0
100.0
76.9
23.1
100.0
Cumulative
Percent
74.0
100.0
76.9
100.0
结果 1
32
2013.6.3
Frequencies
选择Organize output by groups项的输出结果
性别 = 男
Statisticsa
¸ÐȾÓë·ñ
N
Valid
Missing
73
0
a. ÐÔ±ð = ÄÐ
¸ÐȾÓë·ña
Valid
Frequency
ÎÞ¸ÐȾ
54
¸ÐȾ
19
Total
73
Percent
74.0
26.0
100.0
Valid Percent
74.0
26.0
100.0
Cumulative
Percent
74.0
100.0
a. ÐÔ±ð = ÄÐ
结果 2
33
续
2013.6.3
续
性别 = 女
Statisticsa
¸ÐȾÓë·ñ
N
Valid
Missing
13
0
a. ÐÔ±ð = Å®
¸ÐȾÓë·ña
Valid
Frequency
ÎÞ¸ÐȾ
10
¸ÐȾ
3
Total
13
Percent
76.9
23.1
100.0
Valid Percent
76.9
23.1
100.0
Cumulative
Percent
76.9
100.0
a. ÐÔ±ð = Å®
结果 2
34
2013.6.3