数据的质量控制 Naila Baig Ansari Aga Khan大学社区卫生科学学院研究员 巴勒斯坦 卡拉奇 xhlbudd(dxy)译 作者简介 • 教育背景 • 2001年于Age Khan大学获 理学硕士学位(流行病学) 研究课题:照料与喂养实践 以及它们与居住在卡拉奇无 主空房的小孩发育迟缓的关 系 • 1989年于美国弗吉尼亚州威 廉斯堡 William and Mary学 院获管理学学士学位.
Download ReportTranscript 数据的质量控制 Naila Baig Ansari Aga Khan大学社区卫生科学学院研究员 巴勒斯坦 卡拉奇 xhlbudd(dxy)译 作者简介 • 教育背景 • 2001年于Age Khan大学获 理学硕士学位(流行病学) 研究课题:照料与喂养实践 以及它们与居住在卡拉奇无 主空房的小孩发育迟缓的关 系 • 1989年于美国弗吉尼亚州威 廉斯堡 William and Mary学 院获管理学学士学位.
数据的质量控制 Naila Baig Ansari Aga Khan大学社区卫生科学学院研究员 巴勒斯坦 卡拉奇 xhlbudd(dxy)译 作者简介 • 教育背景 • 2001年于Age Khan大学获 理学硕士学位(流行病学) 研究课题:照料与喂养实践 以及它们与居住在卡拉奇无 主空房的小孩发育迟缓的关 系 • 1989年于美国弗吉尼亚州威 廉斯堡 William and Mary学 院获管理学学士学位 学习目标 • 知道科研研究不同阶段数据质量保证和控 制的必需步骤 • 弄清楚引导试验与预试验的区别 • 知道设计数据搜集手段的重要性 • 知道如何使用审计追踪来管理数据以及检 查已录入的数据库的方法 行为目标 • 知道质量保证和质量控制的区别以及它们 实现的途径 • 知道引导试验和预试验的目的 • 知道数据搜集手段如何设计,如何编码 • 知道用审计追踪来管理数据 • 能够检查数据库中的错误并纠正它们 数据的质量控制 • 质量保证——在搜集数据之前确保数据质 量的行为 • 质量控制——在研究过程中监控和维持数 据质量 • 数据管理——在研究过程中处使用和处理 数据 质量保证的步骤 • 阐明研究假设 • 阐明研究假设的检测方法的设计,即提出 一种研究草案 • 选择或者准备特定的方法手段 • 制定数据搜集和处理的程序,即制定操作 手册 • 工作人员的培训以及工作人员素质的保证 • 素质有保证的工作人员,预试验,引导研 究数据搜集以及方法和程序的处理 质量保证:程序的标准化 • 为什么标准化非常重要? ——为了使整个研究的数据搜集过程达到最 高程度的统一和标准化 制订操作手册的准备工作 ——每个数据搜集手段过程的执行过程的详 细描述。(比如说BP) ——一个问题接着一个问题的访问方法 质量保证:工作人员的培训 • 目标是让每一位员工熟悉他(她)所负责 的问题的程序 • 工作人员执行特定程序的培训证明 质量保证:预试验和引导试验 • 预试验 ——包括对一个样品用特定的程序进行评估 以检测是否在大问题 引导试验 ——研究过程的正式排练 ——再现与参与者尽可能相类似的样品的整 体操作流程 预试验和引导试验的结果 • 用于评估的问卷预试验 ——问题的流程 ——敏感问题的提出 ——参数的近似分类 ——让访问者弄清连续发问的程序 引导试验 ——除了上面的内容,还有程序的流程 质量保证:数据管理 • 设计数据搜集方法 ——列出要问的问题,问题的顺序,问题的 措词,问题答案的分类,跳跃性的发问方 式 ——搜集并记录原始数据,而不是经过处理 加工的数据(比如说“年龄”) ——密码本:问卷与输入电脑的数据的联系 代码本范例 参数 ID 问题号 问题1 含义 代码 问题编号 1-750 格式 C3 性别 问题2 回应者的 1为男性 性别 1为女性 N1.0 子女 问题3 体重 问题4 屋顶 问题5 没有子女 99表示无 N2.0 回应 体重(千 999表示 N3.1 克) 没有记录 N2.0 屋顶类型 1 RCC 2 水泥层 3 锡层 4茅草屋 顶或其他 质量保证:代码本的使用 • 变量名 ——由超过8个的字母或数字组成,第一个字 符应当是字母 ——问题编号与描述结合(如q3age) 含义: ——变量含义的简洁描述 ——SPSS软件能够在输出结果中整合变量标 记并显示它 质量保证:代码本的使用 • 代码 ——尝试并运用数字代码 预先决定无应答,数值丢失的代码 ——不方便问的问题或者不适用的问题(比 如说怀孕的结果) ——问题已经提出但是没有得到应答(比如 说工资的问题) ——被访问者回答“不知道” 质量控制 对工作人员明显偏离预定草案的程序和行为进行监 测 策略包括: ——工作人员的密切观察 ——选择所有的访问并随机抽取一个样本进行回顾 ——正在进行的研究的领域的监督 ——在办公室进行编辑(包含编码) ——用统计学方法从长远的角度评估每位观察者、 访问者和技术人员的表现 数据管理:审计追踪 研究者必须能够从每一个信息追溯到原始文件 ——原始文件和数据库中的ID ——所有数据的改正必须记录并且加以解释 ——所有对数据库的修改必须用命令文件加以记录 ——所有分析结果必须用一个命令文件记录下来 审计的目的是: ——不至于犯错误,浪费时间和丢失信息 ——进行外部审计(修正) 数据管理:数据的处理 • • • • • 数据的录入 ——使用专业的数据录入程序如EpiData 准备 ——完成代码本 ——检查问卷是否有明显的矛盾或者遗漏 数据管理:数据的处理 • • • • • • 防止错误 ——创建与你的问卷类似的数据录入表 ——在录入数据之前定义有效的参数 ——由两个不同的操作员输入两套数据 对内容进行对比以找出不同之处(EpiInfo) 对两种文件的错误进行纠正并进行新的比 较 数据的首次检查,找出错误 • 使用一个有序的命令为你的数据增加变量和值标志 • 找寻错误 ——数据代码本的输出、变量的总体观察、合适数据的简单 概率表 ——将创建的代码本与原始的代码本相比较,观测标志信息 是否是正确的。 ——检查产生的摘要和频率表,看看是否有参数的不合规定 或不适当的最小和最大值。(比如说,年龄为250岁,男 性怀孕,23岁女子的儿子年龄为19岁) • 随机选取10%或者至少40%的问卷并将它们输入到新文件 中以计算错误的概率 错误纠正——记录 • 如果发现了错误 • ——在一个命令文件(SPSS句法文件)中 进行纠正,这样能够完整地记录对数据库 的改变 • 如果在双重录入后比较文件时发现错误 • ——如果你在对两个录入文件进行比较和 校正后停止这一步,你就可以对已经录入 的数据进行直接改正。 错误纠正——记录 • 将过程分为差别明显且明确阐述的步骤, 并且使你一步到另外一步的记录保持连贯 • 档案 • ——一旦你对原始数据作了最真实的记录, 记得在一个安全的地方作一个备份,而用 原来的记录来进行下一步工作。 分析 • 确保你使用了正确的数据库 ——建议创建一些用于分析的命令文件,这 些命令文件的最初几个能够读取数据库 • 错误和矛盾的后期发现 备份和归档 • 备份 ——每天都要执行 ——当数据破坏或者丢失的时候,可以恢复它们 ——改变你的数据的数据库和命令文件,书面记录 如协议,记录本和其他记录信息 • 归档 ——在工程进行过程中,进行一次或者几次 ——目的是在更长的一段时间里保护数据和文档, 甚至可能让其他的研究人员得到这些信息