数据的质量控制 Naila Baig Ansari Aga Khan大学社区卫生科学学院研究员 巴勒斯坦 卡拉奇 xhlbudd(dxy)译 作者简介 • 教育背景 • 2001年于Age Khan大学获 理学硕士学位(流行病学) 研究课题:照料与喂养实践 以及它们与居住在卡拉奇无 主空房的小孩发育迟缓的关 系 • 1989年于美国弗吉尼亚州威 廉斯堡 William and Mary学 院获管理学学士学位.

Download Report

Transcript 数据的质量控制 Naila Baig Ansari Aga Khan大学社区卫生科学学院研究员 巴勒斯坦 卡拉奇 xhlbudd(dxy)译 作者简介 • 教育背景 • 2001年于Age Khan大学获 理学硕士学位(流行病学) 研究课题:照料与喂养实践 以及它们与居住在卡拉奇无 主空房的小孩发育迟缓的关 系 • 1989年于美国弗吉尼亚州威 廉斯堡 William and Mary学 院获管理学学士学位.

数据的质量控制
Naila Baig Ansari
Aga Khan大学社区卫生科学学院研究员
巴勒斯坦 卡拉奇
xhlbudd(dxy)译
作者简介
• 教育背景
• 2001年于Age Khan大学获
理学硕士学位(流行病学)
研究课题:照料与喂养实践
以及它们与居住在卡拉奇无
主空房的小孩发育迟缓的关
系
• 1989年于美国弗吉尼亚州威
廉斯堡 William and Mary学
院获管理学学士学位
学习目标
• 知道科研研究不同阶段数据质量保证和控
制的必需步骤
• 弄清楚引导试验与预试验的区别
• 知道设计数据搜集手段的重要性
• 知道如何使用审计追踪来管理数据以及检
查已录入的数据库的方法
行为目标
• 知道质量保证和质量控制的区别以及它们
实现的途径
• 知道引导试验和预试验的目的
• 知道数据搜集手段如何设计,如何编码
• 知道用审计追踪来管理数据
• 能够检查数据库中的错误并纠正它们
数据的质量控制
• 质量保证——在搜集数据之前确保数据质
量的行为
• 质量控制——在研究过程中监控和维持数
据质量
• 数据管理——在研究过程中处使用和处理
数据
质量保证的步骤
• 阐明研究假设
• 阐明研究假设的检测方法的设计,即提出
一种研究草案
• 选择或者准备特定的方法手段
• 制定数据搜集和处理的程序,即制定操作
手册
• 工作人员的培训以及工作人员素质的保证
• 素质有保证的工作人员,预试验,引导研
究数据搜集以及方法和程序的处理
质量保证:程序的标准化
• 为什么标准化非常重要?
——为了使整个研究的数据搜集过程达到最
高程度的统一和标准化
制订操作手册的准备工作
——每个数据搜集手段过程的执行过程的详
细描述。(比如说BP)
——一个问题接着一个问题的访问方法
质量保证:工作人员的培训
• 目标是让每一位员工熟悉他(她)所负责
的问题的程序
• 工作人员执行特定程序的培训证明
质量保证:预试验和引导试验
• 预试验
——包括对一个样品用特定的程序进行评估
以检测是否在大问题
引导试验
——研究过程的正式排练
——再现与参与者尽可能相类似的样品的整
体操作流程
预试验和引导试验的结果
• 用于评估的问卷预试验
——问题的流程
——敏感问题的提出
——参数的近似分类
——让访问者弄清连续发问的程序
引导试验
——除了上面的内容,还有程序的流程
质量保证:数据管理
• 设计数据搜集方法
——列出要问的问题,问题的顺序,问题的
措词,问题答案的分类,跳跃性的发问方
式
——搜集并记录原始数据,而不是经过处理
加工的数据(比如说“年龄”)
——密码本:问卷与输入电脑的数据的联系
代码本范例
参数
ID
问题号
问题1
含义
代码
问题编号 1-750
格式
C3
性别
问题2
回应者的 1为男性
性别
1为女性
N1.0
子女
问题3
体重
问题4
屋顶
问题5
没有子女 99表示无 N2.0
回应
体重(千 999表示 N3.1
克)
没有记录
N2.0
屋顶类型 1 RCC
2 水泥层
3 锡层
4茅草屋
顶或其他
质量保证:代码本的使用
• 变量名
——由超过8个的字母或数字组成,第一个字
符应当是字母
——问题编号与描述结合(如q3age)
含义:
——变量含义的简洁描述
——SPSS软件能够在输出结果中整合变量标
记并显示它
质量保证:代码本的使用
• 代码
——尝试并运用数字代码
预先决定无应答,数值丢失的代码
——不方便问的问题或者不适用的问题(比
如说怀孕的结果)
——问题已经提出但是没有得到应答(比如
说工资的问题)
——被访问者回答“不知道”
质量控制
对工作人员明显偏离预定草案的程序和行为进行监
测
策略包括:
——工作人员的密切观察
——选择所有的访问并随机抽取一个样本进行回顾
——正在进行的研究的领域的监督
——在办公室进行编辑(包含编码)
——用统计学方法从长远的角度评估每位观察者、
访问者和技术人员的表现
数据管理:审计追踪
研究者必须能够从每一个信息追溯到原始文件
——原始文件和数据库中的ID
——所有数据的改正必须记录并且加以解释
——所有对数据库的修改必须用命令文件加以记录
——所有分析结果必须用一个命令文件记录下来
审计的目的是:
——不至于犯错误,浪费时间和丢失信息
——进行外部审计(修正)
数据管理:数据的处理
•
•
•
•
•
数据的录入
——使用专业的数据录入程序如EpiData
准备
——完成代码本
——检查问卷是否有明显的矛盾或者遗漏
数据管理:数据的处理
•
•
•
•
•
•
防止错误
——创建与你的问卷类似的数据录入表
——在录入数据之前定义有效的参数
——由两个不同的操作员输入两套数据
对内容进行对比以找出不同之处(EpiInfo)
对两种文件的错误进行纠正并进行新的比
较
数据的首次检查,找出错误
• 使用一个有序的命令为你的数据增加变量和值标志
• 找寻错误
——数据代码本的输出、变量的总体观察、合适数据的简单
概率表
——将创建的代码本与原始的代码本相比较,观测标志信息
是否是正确的。
——检查产生的摘要和频率表,看看是否有参数的不合规定
或不适当的最小和最大值。(比如说,年龄为250岁,男
性怀孕,23岁女子的儿子年龄为19岁)
• 随机选取10%或者至少40%的问卷并将它们输入到新文件
中以计算错误的概率
错误纠正——记录
• 如果发现了错误
• ——在一个命令文件(SPSS句法文件)中
进行纠正,这样能够完整地记录对数据库
的改变
• 如果在双重录入后比较文件时发现错误
• ——如果你在对两个录入文件进行比较和
校正后停止这一步,你就可以对已经录入
的数据进行直接改正。
错误纠正——记录
• 将过程分为差别明显且明确阐述的步骤,
并且使你一步到另外一步的记录保持连贯
• 档案
• ——一旦你对原始数据作了最真实的记录,
记得在一个安全的地方作一个备份,而用
原来的记录来进行下一步工作。
分析
• 确保你使用了正确的数据库
——建议创建一些用于分析的命令文件,这
些命令文件的最初几个能够读取数据库
• 错误和矛盾的后期发现
备份和归档
• 备份
——每天都要执行
——当数据破坏或者丢失的时候,可以恢复它们
——改变你的数据的数据库和命令文件,书面记录
如协议,记录本和其他记录信息
• 归档
——在工程进行过程中,进行一次或者几次
——目的是在更长的一段时间里保护数据和文档,
甚至可能让其他的研究人员得到这些信息