流行病学研究中的常见偏倚
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 选择偏倚及控制
一、选择偏倚概念及类型
选择偏倚(selection bias)是由于选择研究 对象的方法有问题,使入选者与未入选 者在某些特征上存在着系统差异,从而 导致研究结果偏离真实情况。在各类流 行病学研究中均可发生选择偏倚,以病 例对照研究中较为常见,如入院率偏倚、 现患病例-新病例偏倚、检出症候群偏倚 等。
失访一般有两种情况,一种是由于观察期限 短于原规定的观察危险期,一般与所观察的 暴露因素或结果无关,且经过统计学处理能 把他们当作截尾数据(censored data)处 理。虽观察不到他们发生某事件的概率,但 与留在观察组中的非失访者是相同的,一般 较少引起偏倚。
另一种失访是在随访过程中因种种原因拒绝 继续留在观察组中,他们的失访是主动的, 多半同所研究的暴露因素或结果有关。若数 量不大,不致引起偏倚,但若数量较大,则 有可能产生偏倚。一项研究的失访率最好不 超过10%或稍高,否则应慎重考虑对结果的 解释。
检查时现患 未发病
合计
合计
病人总数 人数
பைடு நூலகம்
病人总数 人数
胆固醇≥
85
462 547
38
P75
34 72
胆固醇<P75 116
1511 1627
113
117 230
合计 RR
201 1973 2174
151
151 302
2.4
1.16
进一步调查发现,患冠心病病人在被诊 断为该病后,其后来的生活习惯或嗜好 发生改变,如开始戒烟、多食低胆固醇 食物、进行体育锻炼,从而使血中胆固 醇水平降低,因此病例对照研究的结论 存在明显的差异。
1572 4080 1860 3792
P<0.01,
OR= ad = 660 2880=1.74 bc 9121200
上述结果表明人群中A病与X因素本无关联,而以医院病例 作为样本所得观察结果则是有关联的。
2.现患病例-新病例偏倚 (prevalence-incidence bias)
在病例对照研究,调查时选择的病例往 往是存活的现患病例,无法对那些因患 病已死亡的病例或轻型、非典型或已痊 愈的病例进行调查,而队列研究中常采 用新发生的病例,因而病例对照研究得 出的结论与队列研究的结果可能发生差 异,此即现患病例-新病例偏倚,也称为 奈曼偏倚(Neyman bias)。
从上例可以看出选好对照组是十分不容易 的,它同研究者的临床知识,经验,及 关于研究变量的特征,对象选入的方法 等都有关。有时还需将多种对照同时观 察更能说明问题。
5. 无应答偏倚 (nonrespondent bias)
无应答者是指研究对象中未按设计要求 对被调查的内容予以应答者。某个特定 样本中的无应答者的患病情况及某些因 素的暴露情况与应答者可能不同,因此 而产生的偏倚称为无应答偏倚。此种偏 倚在分析性研究和实验性研究中均可发 生。
第二节 信息偏倚及控制
一、信息偏倚的概念及类型
信息偏倚(information bias)是指在研究的实施阶 段中从研究对象获取研究所需的信息时产生的系统 误差,其原因是由于诊断疾病、测量暴露或结局的 方法有问题,导致被比较各组间收集的信息有差异 而引入的误差。
各种类型的流行病学研究中均可产生信息偏倚,病 例对照研究中常见的信息偏倚有回忆偏倚、报告偏 倚、调查者偏倚、诱导偏倚等。错误分类偏倚则在 病例对照研究和队列研究中都可产生。
4.暴露怀疑偏倚(exposure
suspicion bias)
与上述的诊断怀疑偏倚一样,研究者在收集并 确定病例组的暴露比例时所具有的认真、细致 程度远高于对照组,从而导致错误结论,此即 暴露怀疑偏倚。这类偏倚多见于病例对照研究, 如采用病史记录作为分析资料,因为询问病史 的医生知道某些因素和某病发病有关,因此对 病例组患者在询问病史时特别仔细,常有阳性 的记录,而调查对照组时则漫不经心,阴性结 果很多。对两组对象以不同的调查方法进行调 查,从而产生偏倚。
1.回忆偏倚(recall bias)
指比较组间在回忆过去的暴露或既往史时,其 完整性与准确性存在系统误差而引起的偏倚。 回忆偏倚在病例对照研究中最常见,主要原因 有:
(1).研究对象对调查的内容关心程度不同,一 般情况下,病例组患者对调查的事件回忆认真程度 高于对照人群,因而导致两组对象在回忆以往事件 的准确性存在差异。
4、提高研究对象的依从性
在研究中应采取相应措施,尽量取得研究对 象的合作,尽可能提高应答率,减少无应答 率和队列研究中的主动失访,要做好组织、 宣传工作,调查手段要简便易行,对调查中 的问题应采取适当的处理技巧。若无应答或 失访者超过10%,应对无应答者或失访者进 行随机抽样调查,对失访者和已随访者的特 征做比较分析。对研究结果可能有影响有关 数据与应答者进行分析比较,若两者差异有 显著性,说明对结果有影响,在结论中应加 以说明并应作慎重的分析。
(2).调查的事件或因素发生的频率较低,未给 研究对象留下深刻印象而遗忘。
(3).调查事件是很久以前发生的事情,研究对 象记忆不清。
2.报告偏倚(reporting bias)
被调查者有意隐瞒真实情况,夸大或缩 小某些信息而导致研究结果产生偏倚, 故亦称说谎偏倚。常见于敏感问题,如 未成年人的吸烟史、冶游史。例如,有 些人有冶游史,可能会难于陈述实情。 而对于一些职业危害进行调查,研究对 象因涉及劳保福利等原因可能会夸大某 些暴露信息。
合计
组)
组)
1200
1200
2400
4800
4800
9600
OR=1,χ2检验差异无显著性,说明A病与X因素无关系。
假设A病住院率为25%,B病住院率为60%,具 有X因素也有一定的入院率为40%。现就上述 不同的入院率计算住院人数:
A病无X因素住院人数=4800×0.25=1200人
A病有X因素住院人数=1200×0.25+(1200 -300)×0.4=660人
例如,Friedman等人在美国弗明汉地区 对心血管系统疾病的研究中发现:男性 居民在队列研究中,具有高胆固醇水平 者,患冠心病的RR值为2.40,而另一项 病例对照研究中,病例组与对照组却无 明显差异,OR=1.16。
表6-3 费明汉地区男性居民血胆固醇水平与冠心病关系
定群研究
病例对照研究
检查时新 未发病
如Seltze等报道,以函访调查人群吸烟 状况时发现,85%的非吸烟者在一个月内 回函应答了调查内容,但在吸烟者中, 应答率仅占67%,这样对男性吸烟的估计 是明显低估的。
6. 失访偏倚(loss to follow up bias)
失访也是无应答的一种表现,只是它主 要发生在队列及实验性研究中。在随访 研究过程中,研究对象未能按计划被随 访,它是此类研究选择偏倚的主要原因 之一。
4. 志愿者偏倚(volunteer
bias)
一般情况下,志愿者与非志愿者在关心健康、 注意饮食习惯、禁烟、禁酒及体育锻炼等方 面可能存在系统的差别,因而,志愿者被入 选为观察对象,而非志愿者落选,这样的研 究结果往往有选择偏倚。例如,一项以“体 力活动预防冠心病”的研究,干预组都是志 愿者,而将非志愿者作对照,以比较该项措 施的效果,这样就可能会得出不正确的结论。
表6-4 更年期服用雌激素与子宫内膜癌的关系
雌激素服 用史 有 无 合计 OR
肿瘤科
暴露
非暴露
45
7
72
110
117
117
9.8
妇科
暴露 非暴露
59
42
89
108
148
148
1.7
1978年,Horwitz指出,这一结论是由检 出征候偏倚所致,两者之间的高度关联 是虚假的。因为在人群中有一定量的无 症状的子宫内膜癌早期病人,她们若不 服用雌激素,子宫不致出血,因而不去 医院就诊,而不能被发现。
1.入院率偏倚(admission rate bias)
入院率偏倚是由于各种疾病的入院率不 同而致的偏倚。现举例说明。
某研究者计划研究A病与X因素的关系, A病例取自某医院,同时,他以同一医院 随机抽取相应人数的B病人作对照。
X因 素
有 无
表 6-1 人群中病例对对照研究
A 病(病例
B 病(对照
B病无X因素住院人数=4800×0.6=2800人
B病有X因素住院人数=1200×0.6+(1200- 720)×0.4=912人
X 因素
有 无
表6-2 医院为基础的病例对照研究
A 病(病例
B 病(对照
合计
组)
组)
660
912
1572
1200
2880
4080
2= 660 2880-912 1200 2 5652 =81.89
3.检出征候群偏倚(detection signal bias)
检出征候群偏倚是指某因素与某疾病在 病因学上虽无关系,但由于该因素的存 在会引起该病的临床症状或体征的出现, 从而使患者及早就医,接受多种检查, 导致该人群有较高的检出率,致使过高 地估计该因素与该疾病的关联。
例如,1975年,Ziel等以病例对照 研究,从美国加州洛杉矶妇女中调查口 服雌激素与子宫内膜癌的关系,结果表 明子宫内膜癌患者雌激素暴露比例明显 高于对照组,认为子宫内膜癌与服用雌 激素密切相关。
流行病学研究中的常见偏倚 及其控制
上海交通大学公共卫生学院 施榕
偏倚(bias)
真实性与误差
内部真实性与外部真实性
机遇
偏倚指观察值与真值之间的偏离,是一种随机 误差以外误差的误差,属系统误差(systemic error)它是由某些较为恒定的不能准确测量的 因素所造成。偏倚可发生在流行病学研究的设 计、实施分析等各个阶段,如选择对象中以志 愿者代替随机样本,使调查对象不能代表总体。 重复抽样或加大样本含量并不能使这种误差减 少或消失。流行病学研究中常见的偏倚主要有 三大类,即选择偏倚、信息偏倚、混杂偏倚。
二、选择偏倚的测量与防制
(一)、选择偏倚的测量
选择偏倚在理论上可以通过总人群与实 际抽样人群疾病与暴露分布情况进行测 量。下面以病例对照研究为例,总人群 与实际抽样人群中疾病与暴露因素的分 布分别如表6-5和表6-6所示:
表6-5 总人群疾病与暴露分布
病例
暴露
A
非暴露
B
非病例
C
D
总人群比数比: OR AD
2、尽量采用多种对照
理想的是以人群中全体病例和非病例(或其 有代表性的样本)作为研究对象。如以医院 病例为研究对象,宜在多个医院选择对象, 且最好有2个对照组,其中一个对照组来自 社区一般人群,在队列研究中,最好也应设 多种对照,以减少选择偏倚对结果的影响。
3、严格掌握研究对象入选与排除的标准
使研究对象能较好地代表其相应的总体。如 病例对照,一般可规定病例的入选原则为新 发的确诊病例,以避免Neyman偏倚。在实验 性研究中,应严格按照随机分配的原则,将 研究对象分组,使两组除所观察因素外应具 有均衡性、可比性。应避免将志愿者分为一 组,非志愿者分为另一组,病情轻者分在一 组,病情重者分在另一组等情况的发生。
3.诊断怀疑偏倚(diagnostic suspicion bias)
由于研究者事先了解研究对象对研究因 素的暴露情况,于是带着“先入为主” 的倾向性,怀疑其患某病或在主观上倾 向出现某种阳性结果。如对暴露组或实 验组进行非常仔细地检查,而对非暴露 组或对照组则不然,从而使研究结果出 现偏差,由此而产生诊断怀疑偏倚,此 类偏倚多见于队列研究和临床试验。
BC
表6-6 实际抽样人群疾病与暴露分布
暴露
非暴露
病例
Ao
Bo
非病例
Co
Do
样本比数比:
OR
Ao Do Bo Co
选择概率为:
Ao
A
Bo
B
Co C
根据选择概率:
ORo
OR
Do
D
选择偏倚 ORo OR 或 1
OR
若 偏倚=0 即 =1,则不存在选择偏倚
偏倚>0, 即
(二)选择偏倚的防制
1、正确的研究设计
首先研究者对整个研究可能会产生的各种选 择偏倚有充分的了解。在设计中,应注意使 被比较的各组有同等的概率受到调查。应考 虑可能出现的各种偏倚,以及会在那些环节 出现,只有在设计时考虑周全,并采取相应 措施,在各个环节中阻断偏倚产生的可能性, 才能防止或减少其发生。
>1, 则存在正向选择偏倚
偏倚<0, 即
<1, 则存在负向选择偏倚
现以前述入院率偏倚为例,
α=660/1200=0.55 β=1200/4800=0.25 γ=912/1200=0.76 δ=2880/4800=0.6
0.55 0.6 1.74 0.25 0.76
偏倚= -1=0.74