第十章 流行病学研究中的偏倚及其控制

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
wenku.baidu.com
二、测量:比较总人群(总体)和研究人群(样本)所研究疾病与因素
的分布。
总体 暴露 病例 对照 非暴露 病例 选择概率 暴露
aA0/A
非暴露
b B 0/ B dD0/D
A 样本 B A0 B0
C0 D0
非病例 gC0/C
C
D
总人群OR=AD/BC 样本OR0=A0D0/B0C0 据选择概率 OR0=OR(ad/bg) 则:选择偏倚(OR0-OR)/OR= (ad/bg)-1 若=0 ,无选择偏倚 OR0=OR 若>0 ,有选择偏倚 OR0>OR 上例选择概率: 若<0 ,有选择偏倚 OR0<OR B病+暴露:a104/200=0.52 B病+未暴露: b=160/800=0.2 A病+暴露:g140/200=0.70 A病+未暴露: d=400/800=0.5 总人群OR=1 住院病人OR=1.86 选择偏倚=(1.86-1)/1.86=(0.52×0.5)/(0.20×0.7)=0.86 (>0 说明高估了OR值)
(四)易感性偏倚(susceptibility bias):某些因素可直接或间接低 影响研究对象对所研究疾病的易感性,导致所研究的因素与疾病 出现虚假关联。 例:健康工人效应。 (五)排除偏倚(exclusive bias):由于未严格按对等原则或标准 选择研究对象,而是自观察组或对照组中排除某些研究对象,从 而造成因素与疾病之间的虚假联系。 例:服用阿司匹林与心肌梗死关系的病例对照研究,应排除 慢性关节炎和慢性胃溃疡患者(前者易服此药,后者易不服此 药)。如果此类患者不排除,且在两组分布不均匀,易引起偏倚。 (六)无应答偏倚(non-respondent bias):研究对象未按要求回答 调查内容,而无应答者的患病或因素的暴露情况与应答者又不同, 从而造成该偏倚。 例:Seltzer等(1974)以函访调查人群吸烟状况,非吸烟者 应答率为85%,吸烟者为67%。其它研究发现非应答者各种不利 于健康因素的暴露率高于应答者。 原因:身体状况;对健康关心程度;调查内容;年龄;文化
流行病学研究中的偏倚及其控制 1、选择偏倚 2、信息偏倚 3、混杂偏倚
误差(error)
(1)随机误差(抽样误差;random error):是因抽样产生的样本 统计量与总体参数之间的差异。即标准误(standard error,SE) 抽样误差与样本含量的关系: 式中:N 为样本含量 为抽样误差(标准误) 为总体各变量值变异程度 (2)系统误差(偏倚;systematic error;bias):由某些不能准确 定量但恒定的因素造成的,使调查结果偏离总体真值的误差。 来源:1)受试者:抽样不随机;受试者本身变异 2)观察者:倾向性暗示;个人技术偏差 3)仪器、试剂:仪器未校正,使用不当,发生故障; 试剂未标准化; 4)非试验性外环境因素:气象;照明;震动;声响
x N
第一节 选择偏倚(select bias)
一、定义:选入研究样本的研究对象与未被选入者之间特征差异造 成的系统误差。 二、种类 (一)入院率偏倚(Berkson):以医院病人为研究对象时,由于入 院率的不同而造成的偏差。例: 表10-1 因不同住院率而住院的A、B患者及其与因素X的关系
2、判断信息偏倚的方向和大小:比较以实际信息OR值(OR)
和调查信息OR值(ORx) 信息偏倚(ORx-OR)/OR 上例选择概率: 此例: 若=0 ,无信息偏倚 ORx=OR 若>0 ,有信息偏倚 ORx>OR 若<0 ,有信息偏倚 ORx<OR
OR=(60×70)/(30×40)=3.5 ORx=(66×52)/(34×48)=2.1
第三节 混杂偏倚
一、定义:在研究某因素与某疾病关联时,由于某个既与疾病有制约
关系,又与所研究的因素有联系的外来因素的影响,掩盖或扩大了所 研究的因素与疾病的联系,这种现象或影响叫混杂(confounding), 其所带来的偏倚叫混杂偏倚(confounding bias),该外来因素叫混 杂因素(confounding factor) 。
选择偏倚=(2.1-3.5)/3.5=-0.46 -0.46<0,说明存在信息偏倚,调查所得资料低估了实际的OR 值,程度为40%。
三、控制
(一)明确细致的资料收集和严格的质量控制方法 (二)尽量采用盲法收集资料 表10-4 调查所得暴露情况 暴露 病例 对照 合计 (三)尽量采用客观指标 (四)提高调查技巧 + 66(a) 48(b) 114 34(c) 52(d) 86 (五)资料校正: 200 条件:1、有已知的特异度、灵敏度 合计 100(n1) 100(n2) 2、两组特异度、灵敏度接近 方法:1、计算校正后的A、B、C、D: A=(Sp· n1-c)/(Sp+Se-1)=(0.7×100-34)/(0.7+0.9-1)=60 B=(Sp· n2-d)/(Sp+Se-1)=(0.7×100-52)/(0.7+0.9-1)=30 C= n1-A=100-60=40 D= n2-B=100-30=70 A、B、C、D分别为校正后的a、b、c、d Sp :特异度 Se :灵敏度 (本例分别为0.7和0.9) 2、计算校正后OR值:OR=AD/BC=60×70/30×40=3.5 校正后OR=实际OR
+ 54 6 60
病例组:灵敏度=54/60=0.90 特异度=28/40=0.7 对照组:灵敏度=27/30=0.90 特异度=49/70=0.7 结论:无差异错误分类:两组特异度、灵敏度相等,即信息偏倚所 值的错误分类等同地分配在两组(ORx<OR) 有差异错误分类:两组特异度、灵敏度不等,即信息偏倚所 值的错误分类不等同地分配在两组(ORx<OR或ORx>OR)
二、测量
1、原理:将含有该因素时的研究因素与疾病的效应估计值(cRR、
cOR)与排除该因素时的研究因素与疾病的效应估计值[aRR(f)、 aOR(f)]进行比较
2、判断:
1)如cRR= aRR(f),则f 无混杂作用, cRR不存在偏倚 2)如cRR≠ aRR(f),则f 有混杂作用, cRR存在偏倚 3)如cRR >aRR(f),为正混杂,cRR高估了因素与疾病之关联 4)如cRR <aRR(f),为负混杂,cRR低估了因素与疾病之关联
(三)诊断怀疑偏倚(diagnosis suspicion bias):由于研究者和被 研究者事先了解被研究者的暴露或分组情况,怀疑被研究者已经 患病,或希望出现研究的阳性结果,因而在诊断或分析时做出带 倾向性的判断。如对暴露组、或试验组的检查细致程度大于对照 组。该偏倚常见于队列和实验研究,在病例对照研究种也存在。 例:某项关于心脏病病因研究对冠心病猝死的定义为:若病 例发病数分钟内死亡,未发现其它病因,或生前史亦不能提供其 它死因,可认为是冠心病猝死。(造成突然死亡的其它原因有蛛 网膜下腔出血、呼吸系统疾病等) (四)暴露怀疑偏倚(exposure suspicion bias):研究者事先了解 研究对象的患病或结局,可能会对其以与对照组不可比的方法探 询认为与某病或结局有关的因素。对同一组研究对象以不同的方 法调查,结果会出现很大差异。 例:儿童甲状腺癌患者放射性物质暴露史调查:在36例和22 例两组患儿中,以查找医疗记录法调查有暴露史者分别为28%和 0,询问调查为47%和50%。 (五)测量偏倚(detection bias):对研究所需指标进行测量时产 生的偏倚。原因:仪器不准;检验技术不熟;责任心不强。
3、方向及程度:
1)测量公式: 混杂偏倚= [cRR -aRR(f)]/ aRR(f) 2)判断: 若该值=0, 无混杂; 若该值为正值,则为正混杂 若该值为负值,则为负混杂
例:以《病例对照研究》一章中之实例 1、计算cOR:
表5-5 口服避孕药(OC)与心肌梗死(MI)关系
OC + 合计
病例 39(a) 114(c) 153(m1)
1.86 <0.001
造成不同疾病入院率不同的原因:医院技术特长;患者疾病严重程 度、经济状况、就诊方便程度等(医院、病人双向选择)。
(二)现患病例-新发病例偏倚(Neyman bias):病例对照或现况研究 中的的病例为现患典型病例,不包括死亡、病程短、轻型等病例。 因此,存活旧病例的信息可能只与存活有关,未必与发病有关,从 而高估了暴露因素的作用;或病例因疾病改变了生活习惯,从而过 低估了暴露因素的作用。队列研究和实验流行病学研究所用的是新 病例,无此偏倚。 例:Framingham心血管疾病研究: 队列研究:高胆固醇者患冠心病OR值=2.4(有显著差异) 病例对照研究:高胆固醇者患冠心病OR值=1.16(无显著差异) 原因:患冠心病者诊断后戒烟、体育锻炼、注意饮食 (三)检出征候偏倚(暴露偏倚;detection signal bias;unmasking bias):某因素本与疾病与致病无关,但可引起所研究疾病的症状或 体征,从而促使患者早就诊,提高了早期病例检出率,过高的估计 了暴露程度。 例:病例对照研究发现:服用雌激素与子宫内膜癌发病有正关联。 原因:雌激素促进子宫内膜生长,导致出血,频繁接受检 查,促使早期发现子宫内膜癌患者。
疾病 暴露于X者 非暴露于X者 200 200 400 800 800 1600 合计 1000 1000 2000 X暴露率(%) 20 20 20 OR 1 P 1
实际人群 A(对照) B(病例) 合计
住院率(对照A=50%;病例B=20%;暴露于因素X者40%) A(对照) 140 200×0.5+ 400 540 25.9 800 ×0.5 100 ×0.4 B(病例) 104 160 264 39.4 200×0.2+ 合计 244 160 ×0.4 560 800 ×0.2 804 30.4
三、控制
1、对偏倚要有丰富的知识 2、严格掌握研究对象的纳入和排除标准
3、提高应答率,降低失访率
4、采用多种对照
第二节 信息偏倚(观察偏倚;observational bias)
一、定义:在从研究对象收取所需信息时产生的偏倚。其表现是使 研究对象的某种特征被错误分类(misclassification)。 二、种类: (一)回忆偏倚(recall bias):由于研究对象不能准确、完整地回 忆以往发生的事情和经历时所产生的差异。 原因:1、事件或因素频率低,被遗忘。 2、事件久远 3、对调查事件的关心程度和回忆的认真程度 例:孕妇接受X线照射:医院记录与回忆符合率未73% 流产史:前10年发生的,完整回忆率为82%;20年以前 则为73% (二)报告偏倚(说谎偏倚;reporting bias ):由于研究对象有意 扩大或缩小某些信息造成的偏倚。 例:缩小信息:性乱史;青少年吸烟史 扩大偏倚:职业危害(为获取福利)
对照 24(b) 154(d) 178(m0)
合计 63(n1) 268(n0) 331(t)
cOR=ad/bc=2.2
2、观察年龄与心肌梗死几口服避孕药之关联
表5-8 年龄与MI之关联 表5-8 年龄与OC之关联
<40岁 MI 对照 26 59
≥40岁 88 95 OC 对照
二、混杂因素
1、特点: (1)必须是所研究疾病的独立危险因子 (2)必须与研究因素(暴露因素)有关 (3)必须不是研究因素与研究疾病因果链上的中间变量 2、几种情况: E E E E E:研究因素 D D D D D:疾病 F F F f F F:外来因子 E E E E f:伴随因子 D D D D :因果关系 F F F F :一般相关(1-3混杂成立,4-8混杂不成立)
二、测量
1、判断错误分类类型:以实际信息(客观检查、记录)获得的情况 为金标准,比较调查所得情况,计算特异度、灵敏度。 例: 表10-3 病例和对照组调查与实际暴露情况比较 调查 暴露 情况 + 合计 实际暴露情况(金标准) 病例 对照 合计 + 12 28 40 66 34 100 27 3 30 21 49 70 . 合计 48 52 100
相关文档
最新文档