偏倚

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分析性研究的选择偏倚
主要体现 研究对象进入、排除、不参与或失访等 与研究暴露或处理因素存在关联,由此增大或减少 暴露与疾病、处理与效应的关联,导致效应估计的 偏倚。 控制方法 选取具体环节或已选取人群的具体特征 分析研究对象的选取是否同暴露或处理因素有关
第三节 研究的偏倚
常见选择偏倚 入院偏倚 失访偏倚 志愿者偏倚
/ Ti Ti 1
Ti2
(2) 发病密度资料
表89-5-4 以发病密度为研究指标的队列研究
新病例 合计人时
暴露组
ai
N1
非暴露组
ci
N0
合计
M1i
Ti
RRMH
ai N0i / Ti ci N1i / Ti
2 MH
ai N1i M1i / Ti M1i N1i N0i / Ti
表图 8-3 无差异性错误分类和差异性错误分类的示例
信息偏倚
➢ 回忆偏倚
由于研究对象对过去事件的回忆不准确所产 生的系统误差。常发生于病例对照研究。(通 常病例组往往表现为记忆准确性高于对照组)
➢ 报告偏倚(说谎偏倚)
是指由研究对象有意夸大或缩小某些信息而 导致的偏倚。如调查青少年的吸烟史。
➢诊断怀疑偏倚
队列研究 (1) 累计发病率资料
表 表89--43 以累计发病率为研究指标的队列研究
新病例 未发病 合计
暴露组
ai
非暴露组
ci
合计
M1i
bi
N1i
di
N0i
M0i
Ti
RRMH
ai N0i /Fra Baidu bibliotekTi ci N1i / Ti
2
2 MH
aidi bici
N1i N0iM1iM0i /
例如 吸烟是胰腺癌的危险因素,吸烟又与喝咖啡 存在相关(没有确定的时间先后),从而造成喝咖 啡与胰腺癌的继发关联。
直接因果关联的歪曲
如果怀疑病因E与疾病D既存在直接关联,又存在间 接关联(图A)或与其他危险(保护)因素F存在相关 (图B),暴露E与疾病D的直接因果关联程度或方向将 可能受到混杂干扰,即得到歪曲的关联估计值。
可避免且应该避免产生。
偏倚
偏倚(bias)
▪含义 在流行病学调查研究的设计、实施、分析以至推 论的各个阶段,由于某些因素的影响而使得研究结果与 真实情况之间出现的系统误差,使研究因素与疾病之间 的真实联系被歪曲,造成虚假的联系或掩盖真实的联系, 从而导致错误结论。
偏倚
性质 系统误差、错误,可以避免产生。 分类 选择偏倚、信息偏倚和混杂偏倚。
选择偏倚
入院率偏倚 也称伯克森偏倚。
当利用医院病人作为研究对象时,病例 及对照组均不是各自总体的随机样本。
防止方法是选择人群中的病例或对照的 随机样本。
选择偏倚
➢现患病例–新病例偏倚 也称奈曼偏倚。
由于仅选择现患病例,而不包括死亡病例、 已痊愈的病例及病程短的轻型病例产生的偏倚。
两类病例的暴露史可能有差异,且现患病 例多数病程较长,可能已经改变了原有的暴露 情况。
➢ 测量偏倚
指由于仪器、设备不准确、检测方法不当、操作技术问题而导致 测量结果偏离真值。
为了减少错误分类以及改善测量的准确性, 研究者们正在越来越多地使用生物学标记物 (biological markers)。它们可以用来测量 易感性、内暴露(实际进入体内)剂量或生 物学效应(剂量)等。
三、混杂偏倚(confounding bias)
(1)按可能的混杂因素吸烟分层
表表8-97-6 饮酒与肺癌病例对照研究
饮酒 不饮酒 合计
肺癌病例 ai24
对照
ci26
合计
ni50
bi10
di 40 n0 50
m1i34
m0i66 ti100
表表89-8-7 饮酒与肺癌病例对照研究分层分析
吸烟层 (i = 1)
不吸烟层 (i = 2)
饮酒 不饮酒 小计 饮酒 不饮酒 小计
OR= (48╳68)/(52╳32)=2.0
研研究究真真实实数数据据
差差异异性性错错误误分分类类
错错误误分分类类数数据据
高脂肪 低脂肪
膳食 膳食
心肌梗死 60
40
对 照 40
60
OR= (60╳60)/(40╳40)=2.3
高 脂 肪 膳 低脂肪

膳食
心肌梗死 60
40
对 照 32
68
OR= (60╳68)/(40╳32)=3.2
疾病之间的中间变量。
▪ 混杂偏倚
▪ 估计研究因素与疾病间联系时,受到一个或多个 既与疾病有密切关系,又与研究因素有密切关系的潜 在因素的影响,从而歪曲了(掩盖或夸大)研究因素 与疾病间的真实联系,使研究结果产生 系统性偏离的情况。这种现象称为混杂,产生的偏倚 叫混杂偏倚。
E
C

E
F

D
D
(1)继发关联
E
E
F
A?
F
B?
D
D
例如 静脉吸毒(E)与性乱(F)都是HIV感染D的危险因 素,吸毒者易发生多性伴行为,即吸毒同HIV感染 既存在直接关联(E→D)又存在间接关联 (E→F→D),吸毒与多性伴没有确定的时间先后 而呈双向相关,多性伴(F)将对吸毒E与HIV感染(D) 的直接因果关联起混杂或歪曲作用。
防止方法是选用新病例。
选择偏倚
➢ 检出偏倚 或称检出症候偏倚。 指由于一些与疾病无关的因素而引
起疾病的某些症状,促使患者早期就诊 而发现疾病。如选用这部分早期病人作 研究对象,可使研究误认为该因素是疾 病的病因。
检出症候偏倚
例子:妇女使用雌H→子宫容易出血→早期就 医而发现子宫内膜癌,用这部分人作病例对照 研究时,就易造成雌H与子宫癌有关联的错误 结论。实际上该因素只是这部分研究对象得以 发现的一个诱因,而不是其病因,当用全子宫 癌人群的随机样本时即可得出两者无关的结论。
法计算综合OR
▪ 混杂偏倚的测量
A. 考查指标
(1)含有某可疑混杂因素时,研究因素与研究疾病的效应 估计值cRR或cOR(粗RR或粗OR)
(2)按该混杂因素调整 后的效应值,即去除该因素产生的 混杂作用后的效应值aRR或aOR(调整RR或调整OR)
B. 判定方法
①cRR=aRR 无混杂作用,不存在混杂偏倚。 ②cRR>aRR 为正混杂,高估联系强度。 ③cRR<aRR 为负混杂,即cRR低估了联系强度。
混杂的判定原则
比较混杂因素调控前后的暴露因素效应估计值, 如果存在有意义的差异,就产生了混杂偏倚。 调控的统计方法
分析阶段:标准化率、分层和多变量分析 设计阶段:配比、随机化分配或限制进入
四、混杂偏倚的分层分析
M-H(Mantel-Haenszel)分层分析方法的步骤 对可能的混杂因素进行分层 判定层间RR或OR是否相等或相近 得到控制混杂后的调整RR或OR 再将调整RR或OR与分层前的粗RR或粗OR (cRR或cOR)进行比较
(2)直接因果关联的歪曲
图 8-4 混杂偏倚引起假关联
E
F

D
(3)直接因果关联的歪曲
继发关联(secondary association)
即怀疑的病因(暴露)E与疾病D并不存在因果 关系,而是由于两者(E,D)有共同的原因C, E,D同C存在关联,从而继发产生E与D的关联。
E
? C
D
例如 高血清胆固醇(C)是冠心病(E)的危险因素, 高血清胆固醇可产生沉积于眼睑的黄色瘤(D),从 而导致黄色瘤与冠心病的继发关联。
流行病学研究 研究中常见的偏倚及其控制
重庆医科大学公共卫生与管理学院
误差
随机误差
▪ 即机遇、抽样误差,因随机抽样而产生的差 异。
▪ 抽样研究中普遍存在,不可避免; 但可以衡量并加以控制。
误差
系统误差
由于设计、资料收集及分析方法不当所造 成的差异;
误差向量方向一致,不能通过增大样本量 来克服它;
表示混杂偏倚大小与方向的公式:
cRR-aRR 混杂偏倚=
aRR 若值=0,为无混杂; 当值>0,为正混杂; 当值<0,为负混杂; 值的大小表示混杂的程度大小。
偏倚分类
入院率偏倚(admission rate bias)
现患-新发病例偏倚(prevalence-incidence bias)
1)选择偏倚 无应答偏倚(non-respondent bias)
▪混杂因素(confounding factor) •含义 又称混杂因子或外部因素,是指可能歪曲 (掩盖或夸大)研究因素与疾病间真实联系的某 些非研究因素。
混杂因素(confounding factor)
基本特点(成立的条件)
a. 与疾病有关联。 b.与研究因素有关联。 c.不能是暴露的效应,尤其不能是暴露与研究
由于研究者事先知道研究对象的对研究因素的暴露情况,在作 出诊断结果时容易出现带有倾向性的主观判断。(如暴露组细致检 查,对非暴露组或对照组则较粗略);另外,研究对象如知道暴露 情况,也可能出现对未来结局的主观判断。
多见于队列研究和实验性研究中。
➢暴露怀疑偏倚
研究者若事先了解研究对象的患病情况,对病例组和对照组询 问的态度和方法可能不同。
(selection bias) 检出征候偏倚(detection signal bias) 易感性偏倚(susceptibility bias)
2)信息偏倚
(Information bias)
回忆偏倚(recall bias) 诊断怀疑偏倚(diagnostic suspicion bias) 暴露怀疑偏倚(exposure suspicion bias) 报告偏倚(reporting bias) 检出偏倚(detection bias) 诱导偏倚(inducement bias)
肺癌病例 21
6
27
3
4
7
对照
9
4
13 17 36 53
合计
30
10 40 20 40 60
(2) 判定层间关联效应水平是否同质
OR1
21 4 69
1.56
OR2
3 36 4 17
1.59
OR1 OR2
按是否吸烟分层后,两层内的饮酒与肺癌的关联效 应大小是同质(同质性检验)的,可以应用M-H方
3)混杂偏倚(confounding bias)
五、偏倚的控制
1、设计阶段 主要预防选择性偏倚和某些混杂偏倚。
1、设计方案的选择 ▪ 控制偏倚最有效的是流行病学实验; ▪ 其次是队列研究; ▪ 病例对照研究出现偏倚机会较多,但工作容易开展,仍常 选用; ▪ 描述性流行病学由于不事先设立可比的对照组,受偏倚影 响最大, 仅能提供分布情况和初步的病因线索。
一、选择偏倚(selection bias)
定义 研究对象的选取过程中,由于选取方式不当,
导致入选对象与未入选对象之间存在系统差异, 由此造成的偏倚称为选择偏倚。
描述性研究的选择偏倚
主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些
特定群体(志愿者、因特网利用者等)造成的外部 效度(外推)受限问题。 控制方法 尽量采用随机抽样,避免样本选取的偏向 对特定群体的结果在外推上要谨慎等
➢ 排除偏倚
在研究对象的确定过程中,没有按照对等的原则或标准从观察组或 对照组中排除某些研究对象。
二、信息偏倚(Information bias)
含义 又称观察偏倚、测量偏倚,主要发生于 资料收集阶段,是由于测量暴露或结局的方法 有问题,所获得的信息不准确而产生的系统误 差。
来源 可来源于研究者、研究对象及用于测量 的仪器、设备及方法。
2
病例对照研究
表 9-5 非配比的病例对照研究
有暴露 无暴露 合计
病例组 ai 对照组 ci 合计 ni
bi m1i
di m0i
n0
ti
ORMH
aidi / ti bici / ti
2
2 MH
aidi bici / ti m1i m0i n1i n0i / ti 1
ti2
1、选择偏倚(selection bias)
▪含义 是指被选入的研究对象与没有被选入者特征上 的差异所造成的系统误差。(由于选择研究对象的方法 不恰当,导致入选对象(样本人群)与理论上符合条件 入选的对象(目标人群)间产生的系统误差)。 ▪来源 主要产生于研究的设计阶段,也可产生于资料 收集过程中的失访或无应答。
选择偏倚
➢易感性偏倚
由于某些因素影响到疾病的易感性,而 导致研究因素与疾病间的虚假联系。如健康 工人效应:工人疾病的易感性较其他人群可 能更低。
➢无应答偏倚
无应答者是指研究对象中没有按照研究设计对被调查的内容予以回 答者。无应答者与应答者可能在暴露情况、患病情况、易感性等特征 均有不同。造成实际研究人群与总体目标人群间存在系统差异。
分类(常见来源举例)
无差异性错误分类和差异性错误分类
研究研真究实真数实据数据
无无差差异异性性错错误分误类分类
错错误误分分类类数数据据
高脂肪 低脂肪
膳食 膳食
心肌梗死 60
40
对 照 40
60
OR= (60╳60)/(40╳40)=2.3
高 脂 肪 膳 低脂肪

膳食
心肌梗死 48
52
对 照 32
68
相关文档
最新文档