观看演示

Transcript 观看演示

第四章
偏倚的控制
与
病因推断
1
第一节
流行病学研究的偏倚
2
一﹑偏倚的概念
3
（一）研究的精确性与真实性
误差的定义：指对事物某一特征的
度量值偏离真实值的部分，即测定
值与真实值之差。
 分类：
随机误差


系统误差（偏倚）
4
1、流行病学研究的精确性
精确性就是研究中随机误差的问题。
 随机误差主要来源于研究对象的选
择过程，即抽样。它是不可避免的，
可用统计学方法评价。

5
1、流行病学研究的精确性

随机误差特点：

没有固定方向和固定大小
一般呈正态分布

6
1、流行病学研究的精确性
提高精确性的方法：
 （1）增加研究样本量；
 （2）提高信息获取的效率：正
确的设计。

7
2、流行病学研究的真实性



真实性：指研究收集的数据、分析结果
和所得结论与客观实际的符合程度。
真实性的反面，是研究中的系统误差的
问题。
系统误差：由研究设计(方法的本身特
点、设计的缺陷等)与实施过程的不恰
当所致。
8
(二)偏倚的概念
指在流行病学调查或推论过程中所
获结论系统地偏离真实值，属于系
统误差。
 凡夸大真实效应者为正偏倚。
 凡缩小真实效应者为负偏倚。

9
(三)偏倚的特点
1、具有单方向性（可高于真值，
也可低于真值）；
 2、不能用统计学方法处理，只
能够预先考虑到而加于预防和控
制。

10
二﹑常见偏倚及其分类
偏倚可发生于设计、实施、分析至
推断过程中；
 可存在于各种研究类型中，形式各
异，大致可分为：
 选择偏倚(selection bias)
 信息偏倚(information bias)
 混杂偏倚(confounding bias)

11
（一）选择偏倚（selection bias）
定义：是在研究对象的选取过程中，
由于选取方式不当，导致入选对象
与未入选对象之间存在系统差异，
由此造成的偏倚称为选择偏倚。
 多见于现况研究、病例对照研究、
历史性队列研究等。

12
一、选择偏倚
1、入院率偏倚


※
(伯克森偏倚Berkson bias)：是指利
用医院就诊或住院病人作为研究对象
时，由于入院率的不同而导致的偏差。
造成不同疾病入院率不同的原因：医
院技术特长；患者疾病严重程度、经
济状况、就诊方便程度等（医院、病
人双向选择）。
13
一、选择偏倚
2、检出症候偏倚 ※

某因素与某疾病本无关，但可引起
所研究疾病的症状或体征，从而促
使患者早就诊，提高了早期病例检
出率，过高的估计了暴露程度。
14
一、选择偏倚
3、现患-新发病例偏倚 ※

又称奈曼偏倚（Neyman bias），凡
因现患病例与新病例的构成不同，
只调查典型病例或者现患病例的暴
露情况，致使调查结果出现的系统
误差都属于本类误差。
15
一、选择偏倚
4、无应答偏倚

研究对象因各种原因对研究的内
容不予回答而产生的偏倚，称为
无应答偏倚。
16
一、选择偏倚
5、易感性偏倚

观察对象可能因各种主客观原因不
同，暴露于危险因素的概率不同，
使得各比较组对所研究疾病的易感
性有差异，从而可能夸大或缩小了
暴露因素与疾病间的关联强度，导
致两者间的虚假联系。
17
一、选择偏倚
6、时间效应偏倚

对于肿瘤、冠心病等慢性病，从开始暴
露于内外危险因素到发病有一个漫长的
发病过程。在进行病例对照研究时，特
别是在选择对照组时，往往容易把暴露
后即将发病的人、已发生早期病变而未
能检出的人作为非病例而进入对照组，
从而导致研究结果发生偏倚。
18
一、选择偏倚
7、领先时间偏倚

在应用筛检发现的病例进行预后或疗效
研究时，有相当一部分患者是属于早期
病例，其生存期自筛检之日算起。在观
察某因素对预后的影响时，即使措施无
效，也会因为确诊时间的领先而出现这
些病例的生存期长于症状出现后被医院
确诊病例的生存期的假象。
19
选择偏倚控制方法

主要应通过科学的研究设计和认真
的实施，避免其发生。因为存在选
择性偏倚的资料一般情况下很难给
予纠正。
20
选择偏倚控制方法
1、了解整个研究中可能出现的选择
偏倚，并在研究设计过程中尽量避
免；
 2、严格掌握研究对象纳入和排除标
准，应尽可能地降低拒绝参加人员
的比例；

21
选择偏倚控制方法


3、取得研究对象合作，减少无应
答、失访；
4、尽量采用多种对照。
22
二、信息偏倚
(二)信息偏倚（information bias）
又称测量偏倚或观察偏倚。
 指在流行病学调查收集资料阶段，
由于测量暴露或测量结局的方法有
缺陷，使各比较组所获得的信息产
生的系统误差。

23
二、信息偏倚
(二)信息偏倚

信息偏倚的来源：
测量不可靠(暴露、疾病)
诊断标准不明确(疾病)
原始记录不完整

24
二、信息偏倚
1、诊断怀疑偏倚
研究者事先已经知道了研究对象对
研究因素的暴露情况，因而会在研
究过程中对暴露组会更加仔细的寻
找某种结果，但对于对照组的研究
对象则不会这样，从而产生偏倚。
 主要发生在随访性质的研究。

25
二、信息偏倚
2、暴露怀疑偏倚

发生于研究者事先知道研究对象
患有某种疾病，而在资料收集过
程中会对患病者比对未患病者更
仔细收集暴露因素，而产生偏倚。
26
二、信息偏倚
3、回忆偏倚
研究对象在回忆以往发生的事情或
经历时, 由于在准确性和完整性上
的不同而产生的系统误差。原因：
 1、事件或因素频率低，被遗忘；
 2、事件久远；
 3、对调查事件的关心程度和回忆的
认真程度。

27
二、信息偏倚
4、报告偏倚
(说谎偏倚)由于研究对象有意夸大
或缩小某些信息而导致的系统误差。
 常见于对敏感问题的调查。例：
 缩小信息：青少年吸烟史
 扩大偏倚：职业危害（为获取福利）

28
二、信息偏倚
5、测量偏倚
对研究所需指标进行测量时产生的
偏倚。
 原因：仪器不准；检验技术不熟；
责任心不强。

29
二、信息偏倚
6、错误分类偏倚

指由于在测量暴露和疾病时标准
不统一或者方法不当，导致在病
例组与非病例组,暴露组与非暴露
组之间的错误分组，从而引起的
偏倚。
30
信息偏倚控制方法
1、严格的调查设计和研究人员的科
学态度，严格的质量控制措施；
 2、尽可能采用“盲法”收集资料；

31
信息偏倚控制方法
3、尽量收集客观指标的资料；
 4、采用调查技巧避免回忆偏倚；

生物学标记物。它们可以用
来测量易感性、内暴露（实
际进入体内）剂量或生物学
效应（剂量）等。
32
信息偏倚控制方法

5、收集资料的范围可以适当广泛些，
借以分散调查人员和研究对象对某项
因素的注意力，减少某些偏见带来的
偏倚。
33
（三）混杂偏倚
（confounding bias）
※
指暴露因素与疾病发生的相关(关联)
程度受到其他因素的歪曲或干扰。
 混杂的本来含义是“混合掺
杂”( mixing together )，这里是指暴露
因素对疾病的独立效应与混杂因素
的效应混在一起，造成对暴露因素
效应的估计偏倚。

34
（三）混杂偏倚

（confounding bias）
※
在研究某因素与某疾病关联时，由
于某个既与疾病有制约关系，又与
所研究的因素有联系的外来因素的
影响，掩盖或扩大了所研究的因素
与疾病的联系，这种现象或影响叫
混杂，其所带来的偏倚叫混杂偏倚，
该外来因素叫混杂因素。
35
（三）混杂偏倚
继发关联（secondary association）：是
一种纯粹由混杂偏倚产生的关联。
 即怀疑的病因（暴露）E与疾病D并
不存在因果关系，而是由于两者
（E,D）有共同的原因C，E,D同C存
在关联，从而继发产生E与D的关联。

36
（三）混杂偏倚—例

高血清胆固醇是冠心病的危险因素，
高血清胆固醇可产生沉积于眼睑的
黄色瘤，从而导致黄色瘤与冠心病
的继发关联。另外，E与C也可以由
于相关（因果方向不明）而产生继
发关联：
37
三、混杂偏倚
冠心病E
高血清胆
固醇C
？
黄色瘤D
38
（三）混杂偏倚--控制方法
(1)限制:指针对某些潜在的混杂变
量, 对研究对象的入选条件加以限
制；
 (2)配比：
 (3)随机化：
 (4)分层抽样：

39
第二节
病因及其推断
40
一、病因的概念
流行病学的目的是预防疾病。为了
达到这个目的，我们有必要首先了
解疾病是怎样发生的。
 自从有了人类社会以来，人类尤其
是医学家们就关心疾病发生的原
因—病因。

41
一、病因的概念



1、古代的病因：
迷信阶段----古代人常将疾病的发生
归因于：鬼神、上帝、天意；
疾病是由于人类的罪恶，惹怒了上帝
而引起的。认为信仰上帝，才能给人
带来健康。人们靠祈祷、拜佛及求神
等方式以求平安无病。
42
一、病因的概念



2、特异病因学说：
在人类的漫长历史中，严重损害人类健
康的疾病是传染病。例如：鼠疫、霍乱、
天花等传染病广泛流行，严重的威胁人
类的生命和健康。
Carclano指出，“疾病的种子是能繁殖
其本身是微小动物”。
43
一、病因的概念
 3、多因论学说：

病原体万能时代持续了10-20年。

即使是传染病，单一病因学说不能解
释传染病发生流行的原因。单一病因
学说过于偏重病原体的致病作用，忽
略了机体和环境的作用。
44
肺结核病：
 ⑴ 病原体：结核杆菌
 ⑵ 宿主因素：机体抵抗力、
 ⑶ 环境因素：免疫因素、
遗传因素
经济水平、

居住条件、
饮食营养水平。

45

疾病发生条件归纳为:※

1、致病因子：

生物性：病毒，细菌，立克次体，
2、宿主因素：
真菌。
3、环境因素：

物理性：有害的物理因素。
化学性：有毒化学物质。
46
一、病因的概念
 3、多因论学说：
※
 Lilienfeld：那些能使
人群发病概率升高的因
素，就可认为是病因，
其中某个或多个因素不
存在时，人群疾病频率
就会下降。
Lilienfeld AM.（1920-1984）
约翰.霍普金斯大学
流行病学教授
47
病因模型

用简洁的概念关系图来表达因果
关系的概念模型。
48
病因模型
（1）生态学模型

将机体与环境作为一个整体来考
虑。它们给出了寻找病因的分类
大框架。
三角模型 (流行病学三角)
轮状模型

49
病因模型
宿主
环境
病原物
图1
流行病学三角
50
病因模型
社
生
宿主
遗传
内核
物
会
环
境
环
境
理化环境
图2 轮状模型
51
病因模型
（2）疾病因素模型
特点：
 层次：

病因分类操作性强
较强的实践指导意义
没有动因确定的困难
外围的远因
致病机制的近因
52
病因模型
社会经济因素
生物学因素
环境因素
医学生物学因素
（致病机制）
疾
病
心理、行为因素
卫生保健因素
图3 疾病因素模型
53
病因模型
（3）病因网络模型
众多病因间存在联系，连接在一起
可提供因果关系的完整路径。
就构成一条病因链，而多个病因链
表达清晰具体，系统性强，可为
交错连接起来就形成一张病因网，
因果关系的分析提供很好的基础。
这就是病因网络模型。

54
病因模型
乙肝病
毒感染
环境
因素
社会
因素
肝癌
黄曲霉
毒素
不洁
饮水
卫生
保健
图4
肝癌发病的病因网络示意图
55
玉米传入
糙皮病病因网模型
贫困
冬藏食物
量少质差
玉米单
一种植
农活增多
食物匮乏
玉米主食、植物蛋白
偏食
匮乏
动物蛋白
少或无
非食物因
素（酒精
中毒）
其他营养缺乏
春末夏初
户外劳动
过度劳累
尼克酸需
求增加
尼克酸、色氨酸缺乏
糙皮病
日晒增加
局部
摩擦
56
糙皮病皮炎
二、病因的类型
57
病因的类型
（一）直接病因和间接病因
1、直接病因：某因素直接引起疾
病的发生，没有任何中间环节。
 如理化因素的直接损害:触电、化
学灼伤等。

58
病因的类型
（一）直接病因和间接病因
2、间接病因：某因素导致疾病发
生的过程中，中间经过若干环节。
 如传染源-传播途径-易感人群。

59
病因的类型
（二）充分病因与必需病因
1、充分病因：一组必然导致疾病发
生的最低限度状态或事件。此组因
素必定会引起疾病的发生。
 最低限度是指一组因素中的任何一
部分都是不可缺少的。

60
病因的类型
疾病发生条件
61
病因的类型
（二）充分病因与必需病因
2、必需病因：引起某种疾病发生不
可缺少的因子。缺乏此因素疾病就不
会发生。
 如：乙型肝炎—乙肝病毒是必需病因。

62
病因的类型
（二）充分病因与必需病因
3、组分病因：构成某病充分病因的
任一成分都称为该病的组分病因。
 组分病因可以是必需病因，也可以是
非必需病因，可以在一个或多个充分
病因中发挥作用。

63
充分病因与必需病因的四种组合
1）必需的而且是充分的：
例：触电伤害。
 2）必需，但不充分：
例：霍乱弧菌霍乱。

64
充分病因与必需病因的四种组合
3）充分但不是必需：
例:放射线和苯的暴露都可单独引
起白血病。
 4）既不充分，也不是必需：
例：吸烟肺癌。

65
※
66
（一）总结现象
常规报表资料(疾病资料、人口资料等）
调查的资料(现况研究p41, 特殊调查资料)
按人群，时间和地点特征
归纳整理资料，
描述疾病的人群分布、时间分布和地区分布
疾病分布特点。
67
（二）建立假设

建立病因假设方法：（19世纪著
名哲学家Mill-5种逻辑法则）
Mill 准则：
68
Mill 准则-- 1、求同法
被研究现象出现的若干不同的场合
中，只有一个相关因素相同，进而
确定这唯一的相同因素与被研究现
象有因果联系。
 或称“异中求同法”。

69
1、求同法
逻辑形式：
相关因素
被研究现象
A,B,C -------- a
A,D,E -------- a
A,F,G -------- a
…… -------- ……
所以，A与a有因果联系
70
Mill 准则-- 2、求异法
被研究现象出现和不出现的两个场
合中，其余相关因素都相同，只有
一个相关因素不同，从而确定这一
差异因素与被研究现象有因果联系。
 又称“同中求异法”。

71
2、求异法
逻辑形式：
场合
相关因素
被研究现象
①
A B C
a
②
B C
无a
所以，A与a有因果联系
72
3、共变法
Mill 准则-- 3、共变法

被研究现象出现的若干场合中，在
其余相关因素不变的情况下，某一
相关因素发生程度不同的变化时，
被研究现象也随之发生相应的程度
不同的变化，进而确定这一相关因
素与被研究现象有因果关系。
73
3、共变法
逻辑形式：
相关因素
A1、B、C
A2、D、E
A3、F、G
……
被研究现象
-----------------------------
a1、 b、c
a2、d、e
a3、f、g
……
所以，A与a有因果联系
74
Mill 准则-- 4、求同求异并用法

当所研究的现象出现的几个场合
（正面场合）中都有一个共同的情
况,而在所研究现象不出现的几个场
合（反面场合）中却没有那个共同
的情况,则可以确定该情况与所研究
的现象之间有因果联系的方法。
75
4、并用法
逻辑形式：

场合


正面场合


…… ……


反面场合

相关因素
A B C
A D E
A F G
B C G
C E H
D F I

…… ……

所以，A与a有因果联系
被研究现象
a
a
a
无a
无a
无a
76
Mill 准则—5、剩余法

对某复合结局事件（A,B,C），已知
它的有关（暴露）因素在特定的范围
内（a,b,c），通过先前的归纳又知
道b说明B，c说明C，那么剩余的a必
定说明A。
77
5、剩余法
逻辑形式：

结局事件
有关（暴露）因素
A,B,C -------- a,b,c
B -------- b
C -------- c
所以，剩余a 是A的影响因素
78
（三）检验假设



用分析流行病学方法或实验流行
病学方法验证病因假设。
分析流行病学方法
1、病例对照研究
2、队列研究
实验流行病学
79
1、病例对照研究方法
假设：某因素与疾病之间可能有联系？
因素暴露情况
病例组
人群
因素暴露情况
对照组
疾病
过去
现在
时间
80
假设：服用反应停与短肢畸形有联系？
病例组
畸形儿的母亲
怀孕后0-8周用过反应停
正常儿母亲
过去
对照组
现在
时间
81
假设：服用反应停与短肢畸形有联系
68.0%
50
34
畸形儿的母亲
怀孕后0-8周用过反应停
2.0%
2
90
正常儿母亲
X2 = 69.40, P < 0.001, OR = 93.5
过去
现在
时间
82
2、队列研究方法验证病因假设
假设：某因素与疾病之间可能有联系。
发病率
暴露组
随访观察疾病的发生情况
人群
非暴露组
因素
现在
将来
时间
83
假设：服用反应停与短肢畸形有联系？
怀孕后0-8周用过
暴露组
随访观察短肢畸形的发生情况
非暴露组
短肢畸形的发病率
怀孕后0-8周未用过
现在
将来
时间
84
假设：服用反应停与短肢畸形有联系？
怀孕后0-8周用过
暴露组
24
10
随访观察短肢畸形的发生情况
42.0%
短肢畸形
发病率
非暴露组
51
21485
0.2%
RR=175, AR=41.76%
现在
将来
时间
85


1961年12月后西德市场停止出售反应停，
从1962年中出生的儿童便很少发生这种
畸形。这亦可看作“干预研究”的例子。
反应停灾难事件反生后，不少国家建立
了先天性畸形监测系统，加强了药物流
行病学研究，改进药物筛选方案，生产
与管理方法。
86
3、实验流行病学方法验证病因假设
假设：某因素与疾病之间可能有联系
给予这种措施
实验组
人群
随访观察结局
疾病发生,
随机
对照组
死亡,
疾病好转,
现在
将来
时间
87
假设：乙型肝炎疫苗后可产生抗体？
给与乙型肝炎疫苗
实验组
实验人群
随访观察乙肝抗体情况
对照组
随机分组
抗体阳性率
给生理盐水
将来
现在
时间
88
乙型肝炎疫苗人群免疫学效果观察
抗体阳性率
给与乙型肝炎疫苗
实验组
56
54
96.4%
随访观察乙肝抗体情况
实验人群
随机
分组
对照组
现在
60
1.6%
1
将来
时间
89
（四）病因推导
1、因素与疾病关联的形式：
 ①虚假的关联：
 ②间接的关联：
 ③因果联系※

90
（四）病因推导
2、病因推断的目的：
 排除虚假的关联和间接的关联，
来推断因果联系--有时间先后的
相关关系。

91
偶然
关联
非因果关联
关联
（选择、测量或混杂偏倚）
间接因果关联
（间接病因）
有统计学
意义关联
因果关联
（有时间先后）
直接因果关联
（直接病因）
图-- 关联分类图
92
（四）病因推导





3、因果关系的判断标准--8条标准
1）关联的强度、2）关联的重复性
3）关联的特异性、4）关联的时间性
5）剂量-反应关系、6）关联的合理性
7）实验证据、8）相似性。
93
（四）病因推导
4、常用的因果推断标准：
 1）关联的时间顺序
 2）关联的强度
 3）关联的可重复性
 4）关联的合理性
 5）研究的因果论证强度

94
因果推断标准
1）关联的时间顺序
95
因果推断标准
2）关联的强度

关联的强度越大，因果的可能性就
越大。

测定OR、RR等。

混杂因素可能导致强关联和弱关联。
96
因果推断标准
3）关联的可重复性

同一暴露因素与疾病的关联，在不
同时间、不同地区以及不同的人群
中由不同的研究者获得同样的或类
似的结果。（“求同法”）
97
因果推断标准
4）关联的合理性


(1) 解释与现有理论知识不矛盾：
例如，高脂血症与冠心病的因果关
联，与冠状动脉粥样硬化的病理证
据以及动物实验结果吻合。
98
因果推断标准
4）关联的合理性


(2) 研究者的主观评价：
例如，吸烟与肺癌的关联，设想化
学物质沉积在呼吸系统上引起癌变。
99
因果推断标准
5）研究的因果论证强度


设计类型与它的论证强度密切相关。
好类型应具备：


满足时间顺序和可重复性；
控制各类偏倚的干扰。
100
因果推断标准
6）剂量反应关系

关联强度的一种特殊表现形式，疾
病发生的频率随暴露因素的剂量、
强度和持续时间的变化而变化，则
此二者之间有因果关系的可能性较
大。
101
因果推断标准
7）实验证据


也称暴露的终止效应。
减少或去除暴露因素，疾病频
率下降，可进一步支持因果关
联。
102
因果推断标准
8）联系的特异性

某种因素只能引起某种特定的疾
病，某种疾病必须有某种因素的
暴露才会出现。
103
104

观看演示

Transcript 观看演示

Directory