流行病学研究中常见的偏倚及其控制
第九章 流行病学研究中的偏倚及其控制
检出症候偏倚
某人进行了一项更年期服用雌激素与子宫内膜 癌关系的病例对照研究,分别在同一个医院的 不同科室选择了研究对象,经分析得到下表结 果
检出症候偏倚
在肿瘤科,子宫内膜癌病人多由于她们服用雌激素后出 现子宫出血而到医院检查,能及早发现该人群中的子宫 内膜癌病人,且多为早期的病人,而没有服用者,由于 没有子宫出血症状,减少了就诊机会,使该病不易及早 被诊断出来,因而能得出雌激素和子宫内膜癌之间相关 联的结论 在妇科,这些患者大多数接受妇科检查,因此子宫内膜 癌的检出与是否服用雌激素使妇科检查几率增加之间没 有关系
健康工人效应
为了探讨职业暴露对人类健康的危害,McMichael等在 美国俄亥俄州的一个轮胎生产工厂,选择在岗及退休男 性工人6678人作为暴露组,进行了回顾性队列研究。观 察期间为1964~1972年共9年时间。以国家卫生统计中 心编制的1968年美国男性年龄别死亡率作参比 下表是同时期与钢铁工人、俄亥俄州人口及美国全国人 口相比较的橡胶工人全死因死亡率(1/10万人年)
现患-新发病例偏倚
现患病例-新病例偏倚的测量可依据队列研究 和病例对照研究两研究不同的联系强度来估计 假设队列研究的联系强度为OR1,病例对照研 究的联系强度为OR2,现患病例-新病例偏倚
OR2 OR1 1.16 2.40 选择偏倚= 0.517 OR1 2.40
为负值,说明由于该偏倚的存在,使得病例对 照研究中高血胆固醇与冠心病之间的联系强度 降低了51.7%
假如在人群进行一项病例对照研究,以B病为对照,研 究A病与某因素X的关系。设人群中患A病与B病者各为 5000人,暴露于因素X者各为750人,不暴露于因素X者 各为4250人,X 在A、B患者中的暴露率均为15% 暴露X 有 无 A病 750 4250 B病 750 4250 合计 1500 8500
流行病学 偏倚
选择偏倚
检出偏倚 或称检出症候偏倚。 指由于一些与疾病无关的因素而引
起疾病的某些症状,促使患者早期就诊 而发现疾病。如选用这部分早期病人作 研究对象,可使研究误认为该因素是疾 病的病因。
检出症候偏倚
例子:妇女使用雌H→子宫容易出血→早期就 医而发现子宫内膜癌,用这部分人作病例对照 研究时,就易造成雌H与子宫癌有关联的错误 结论。实际上该因素只是这部分研究对象得以 发现的一个诱因,而不是其病因,当用全子宫 癌人群的随机样本时即可得出两者无关的结论。
排除偏倚
在研究对象的确定过程中,没有按照对等的原则或标准从观察组或 对照组中排除某些研究对象。
二、信息偏倚(Information bias)
含义 又称观察偏倚、测量偏倚,主要发生于 资料收集阶段,是由于测量暴露或结局的方法 有问题,所获得的信息不准确而产生的系统误 差。
来源 可来源于研究者、研究对象及用于测量 的仪器、设备及方法。
由于研究者事先知道研究对象的对研究因素的暴露情况,在作 出诊断结果时容易出现带有倾向性的主观判断。(如暴露组细致检 查,对非暴露组或对照组则较粗略);另外,研究对象如知道暴露 情况,也可能出现对未来结局的主观判断。
多见于队列研究和实验性研究中。
暴露怀疑偏倚
研究者若事先了解研究对象的患病情况,对病例组和对照组询
一、选择偏倚(selection bias)
定义 研究对象的选取过程中,由于选取方式不当,
导致入选对象与未入选对象之间存在系统差异, 由此造成的偏倚称为选择偏倚。
描述性研究的选择偏倚
主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某
些特定群体(志愿者、因特网利用者等)造成的外 部效度(外推)受限问题。 控制方法 尽量采用随机抽样,避免样本选取的偏向 对特定群体的结果在外推上要谨慎等
流行病学中常见的偏倚及其控制
膳膳食食改改良组组
降降低胆胆固固醇醇药品物组组
0
5
10
15
图 8-2 膳食与药物预防心机梗死的样本变异性示例
流行病学中常见的偏倚及其控制
五年内发生 心肌梗死风险(%)
7
第7页
如图8-2, 研究A和B中膳食改良组五年内发生心机梗死风险为 9%, 而降胆固醇药品组为6%。
研究A样本较小(200人), 两组效应指标(心肌梗死风险) 95%可信限较大, 发生重合, 无显著性差异。
若θ<θ’<1,则为趋向无效值偏倚。
(三)不论θ>1或θ<1,若θ和θ’在1两侧,则 为颠倒偏倚。
流行病学中常见的偏倚及其控制
17
第17页
3.举例: (1)RR=1.5 RR’=2.0时,为远离无效值
正偏倚。
(2)RR=0.6 RR’=0.8时,为趋向无效值 负偏倚。
(3)RR=1.2 RR’=0.9时,为颠倒负偏倚。
流行病学中常见的偏倚及其控制
28
第28页
在美国弗明汉地域对心血管系统疾病研究中发觉: 男性居民在队列研究中,含有高胆固醇水平者,患 冠心病OR 值为2.4,而在病例对照研究中,病例 组和对照组却无显著差异(OR =1.16)。
原因: 病例对照研究中现患病例已改变了他们高胆固
醇饮食习惯。
流行病学中常见的偏倚及其控制
Hale Waihona Puke 流行病学中常见的偏倚及其控制
36
第36页
有些人以病例对照研究发觉, 子宫内膜癌患者雌 激素百分比显著高于对照组, 认为子宫内膜癌与服 用雌激素亲密相关。
流行病学中常见的偏倚及其控制
37
第37页
1978年,Horwitz和Feinstein: 口服雌激 素与子宫内膜癌高度关联是虚假,是一个 检出偏倚。
流行病学研究中的偏倚及其控制
(四)样本水平的变异性
样本(研究)水平的变异性是指通过不同样本的 研究所得结果的差异性。为什么高水平的血清总 胆固醇是不利的或不健康的?这可以在关于血清 总胆固醇与心血管死亡风险呈正相关的研究中找 到答案,如Framingham心脏研究。 但是,研究通常不能针对整个总体人群来进行, 而是通过样本人群来进行,这就引入了抽样变异 (误差)。通过不同样本的研究所得的关于总体 结果的估计值会有不同,如果排除测量误差,这 些样本的估计值与总体真实值(用各样本估计值 的均值代表)的差异,就是抽样误差。当样本含 量增大时,抽样误差就会减少。
流行病学研究中的偏 倚及其控制
一、 研究结果的变异性
(一)变异性概述
研究结果包括描述性和分析性数据(指标)的变动或 波动,称为研究结果的变异性(variability)。它可存在 于不同的水平,包括个体水平、群体水平和样本(研 究)水平。
表 8-1 变异性的水平和来源 变异性水平 变异的来源 个体 个体生物学变异,测量误差 群体 个体间遗传学变异,环境变异,测量误差 样本(研究) 抽样方式,样本大小,测量误差
(二)内部真实性
内部真实性(internal validity)是指研究结果 与实际研究对象真实情况的符合程度。它回答 一个研究本身是否真实或有效。如果一个研究 针对实际研究对象提供了真实的描述频率或效 应估计值,即随机误差和系统误差较小,则该 研究是真实或有效的。如果一个研究本身是不 真实或无效的,则很难再应用到其他人群。 改善内部真实性的措施有:限制研究对象的类 型和研究的环境条件。因为这样可以降低群体 水平的变异性,或者使因果机制趋于一致等。 这些措施可能限制研究结果应用到其他人群, 也就是使下述的外部真实性受限。
三、外部真实性
临床流行病学--偏倚
三、常见偏倚及控制
临床流行病学
1、入院率偏倚(Berkson bias)
在利用医院病例作为研究对象时, 由于具有某研究因素的病人与不具有该 研究因素的病人被选为研究对象的机率 不同,而导致研究因素与研究疾病之间 关系发生被歪曲的现象。
8
临床流行病学
实例:
表1 呼吸道疾病与骨关节疾病的关系
一般人群
过敏及 一般人群
曾住院6个月以上者
代谢性 疲劳综合症
疲劳综合症
疾病 病例 对照 计 病例 对照 计
有 13 136 149
1
21 22
无 127 2508 2635 27 208 235
小计 140 2644 2784 28 229 257
OR=1.89
OR=0.37
10
临床流行病学
原因是:
呼 骨 入院率 (%) 过敏 疲劳 入院率 (%) + + 5/17 29.4 + + 1/13 7.3 + - 15/207 7.2 + - 21/136 15.4 - + 18/184 9.8 - + 27/127 21.2 - - 219/2376 9.2 - - 208/2508 8.3
曾住院6个月以上者
呼吸道 骨关节疾病
骨关节疾病
疾病 病例 对照 计 病例 对照 计
有 17 207 224
5 15 20
无 184 2376 2560 18 219 237
小计 201 2583 2784 23 234 257
OR=1.06
OR=4.06
9
临床流行病学
表2 过敏及代谢性疾病与疲劳综合症的关系
19
临床流行病学
4、志愿者偏倚(volunteer bias) 志愿者与非志愿者在许多因素上都
流行病学研究中常见偏倚及其控制习题及答案
流行病学研究中常见偏倚及其控制1.下列哪条不是..控制选择性偏倚的措施:A. 尽量选用新发病例B. 选用中青年病例C. 选用多种对照D. 双盲法调查E. 随机选取对象2.下列哪一种情况不属于偏倚:A.由于抽样而导致的结果偏离真实情况B.由于入选的研究对象与没有入选的研究对象特征上的差异导致的结果偏离真实情况C.研究对象的某种特征被错误的分类导致的结果偏离真实情况D.由于某个或某些混杂因素导致的结果偏离真实情况E. 以上都不对1.队列研究证明暴露因素E是疾病D的危险因素(RR=3,P<0.05)。
但进行以医院为基础的病例对照研究时,发现病例与对照组暴露情况没有显著性差异(OR=1.1,P>0.05)。
进一步分析显示,这种病例对照研究与队列研究结果之间的差异,是因为患者在诊断出此病后往往会改变其行为习惯,从而使患者的暴露情况改变。
这属于:A.检出偏倚B.易感性偏倚C.Neyman偏倚D.Berksons偏倚E.诊断怀疑偏倚1.在探讨妊娠母亲各种暴露史与先天畸形之间联系的研究中,有人怀疑那些畸形儿的母亲由于内疚而少报了她们的吸烟情况,而那些对照儿童的母亲报告的要准确些,这会产生:A.报告偏倚B.易感性偏倚C.回忆偏倚D.混杂偏倚E.抽样误差2.如上题你的怀疑是正确的,并且实际上吸烟增加了畸形的危险,那么论文中报告的相对危险度与“真正的”相对危险度比是A.低估了B.高估了C.都不是D.不能确定E.没变化2.可以控制混杂偏倚的措施是:A.匹配设计B.分层分析C.因素模型D.随机化E.双盲法3.在以医院为基础进行病例对照研究时,最易出现的偏倚是:4. A.信息偏倚 B.回忆偏倚 C.选择偏倚 D.混杂偏倚 E.失访偏倚5.有人经Case-Control Study 报导子宫内膜癌患者的雌激素使用率入高于一般健康人,故此推断服用雌激素能导致子宫内膜癌,此结论:A.正确B.不正确,因该研究中病例的确定有选择性偏倚C.不正确,因该研究中病例的确定有观察偏倚D.不正确,因该研究中有混杂偏倚E.不正确,因有交互作用1.下列哪个不属于队列研究偏倚控制的内容:A.选择偏倚的控制B.入院偏倚的控制C.信息偏倚的控制D.失访偏倚的控制E.混杂偏倚的控制2.在流行病学研究中,混杂因素:A.与暴露因素有关,与疾病无关B.与疾病有关,与暴露因素无关C.与病例有关,与对照无关D.与暴露有关,与非暴露无关E.与疾病和暴露因素都有关6.混杂因素成立的条件是:(是单选吗?)A.与所研究疾病有关B.与所研究疾病无关C.与所研究暴露有关D.与所研究暴露无关7.下列哪一种偏倚属于选择偏倚?A.回忆偏倚B.测量偏倚C.报告偏倚D.无应答偏倚8.下列哪一种方法不能用来控制混杂偏倚?A.匹配B.严格的质量控制C.分层分析D.多因素分析9.流行病学研究的偏性主要指A.抽样误差B.系统误差C.过失误差D.时间顺序误差E.随机测量误差10.病例对照研究中控制混杂的方法是:A.分析B.叉生分析C.分层分析D.出生队列分析E.暴露人年分析11.流行病学研究的误差指A.测量值之间的差异B.样本和总体之间的差异C.两样本之间的差异D.两个不同质总体之间的差异E.测量值与真值之间的差异12.流行病学研究的偏性主要指A.抽样误差B.系统误差C.随机测量误差D.时间顺序误差下列哪一种情况不属于偏倚:A.由于抽样而导致的结果偏离真实情况B.由于入选的研究对象与没有入选的研究对象特征上的差异导致的结果偏离真实情况C.研究对象的某种特征被错误的分类导致的结果偏离真实情况D.由于某个或某些混杂因素导致的结果偏离真实情况E. 以上都不对下列哪一种偏倚属于选择偏倚:A.回忆偏倚B.测量偏倚C.报告偏倚D.无应答偏倚E.以上都不是下列哪一种偏倚不可能发生在病例对照研究中:A.Berksons偏倚B.混杂偏倚C.检出症候偏倚D.测量偏倚E.失访偏倚队列研究证明暴露因素E是疾病D的危险因素(RR=3,P<0.05)。
偏倚及其控制
流行病学中常见的偏倚及其控制误差(error)对事物某一特征的测量值偏离真实值的部分。
包括随机误差、系统误差随机误差:指随机抽样所得的均值与总体参数的差异,也称抽样误差。
只能减少,不能避免。
随机误差的两个特点1、样本的观察值都在平均值上下分布,从许多无偏倚样本中得到的观察值均数,假如数量较大,总是趋向于接近总体值;2、随机误差的范围可以用可信区间估计,当保持随机方法而加大样本时,样本均值逐渐向总体均值接近。
系统误差:当对群体的某一特征做一次测量或对某一个体的某一特征做多次测量时,所得均值与总体间的真实性也会产生误差,如果误差向量的方向一致或基本一致时,这种误差称为系统误差。
随机误差和系统误差的区别1、假设一项研究可以将样本量增至无穷大,如果研究样本无穷大能使误差减小到零,则此误差为随机误差。
系统误差不受样本量增加的影响,因此在研究样本无穷大时仍然存在的误差是系统误差;2、适当的重复试验或增加样本含量可以减少随机误差,但不能减少系统误差。
偏倚(bias):指在流行病学研究中样本人群所测得的某变量系统地偏离了目标人群中该变量的真实值,使得研究结果或推论的结果与真实情况之间出现偏差,这是由系统误差造成的。
选择偏倚(selection bias ):指被选入到研究中的研究对象与没有被选入者特征上的差异所造成的系统误差。
主要产生于研究的设计阶段,在各类流行病学研究中均可能发生,以在病例对照研究与现况研究中为常见。
常见的选择偏倚1、入院率偏倚(admission rate bias)亦称伯克森偏倚(Berkson’s bias),是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同或就诊机会的不同而导致的偏倚。
用住院病例进行研究时可能没有包括:1)抢救不及时死亡的病例2)距离医院远的病例3)无钱住院的病例4)病情轻的病例2、现患-新发病例偏倚(Prevalence-incidence bias)又称奈曼偏倚(Neyman bias),凡因现患病例与新病例的构成不同,只调查典型病例或现患病例的暴露状况,致使调查结果出现的系统误差都属于本类偏倚。
流行病学研究中常见偏倚及其控制5
误差 定义 指对事物某一特征的度量值偏离真实值的部分,即测定值与真实值之差 分类 随机误差 系统误差(偏倚)
举例:用动脉血压计测量某人血压(实际值为80mmHg),各次读数的均值为100mmHg,系统误差和随机误差可用以下图示
2.柔 性
机床的柔性,是指其适应加工对象变化的能力,包括空间上的柔性和时间上的柔性。 所谓空间柔性也就是功能柔性。包括机床的通用性和同一时期的机床重构能力;例如:对加工控制软件进行调整或修改,适应多种零件的加工要求。 所谓时间上的柔性也就是结构柔性,指的是在不同时期,机床各部件重新组合,即通过机床重构,改变其功能,以适应产品更新变化快的要求。
偏倚的控制 严格掌握研究对象的入选标准和排除标准 设立对照 随机化 提高应答率 客观、统一的标准收集资料 采用调查技巧 采用盲法收集资料 限制
偏倚的控制 匹配 分层分析 多变素分析
1.工艺范围
指机床适应不同生产要求的能力(加工功能)。包括:机床可完成的工序种类,所加工零件的类型、材料和尺寸范围、毛坯种类、加工精度和表面粗燥度。 不同工艺范围对机床结构的影响: 如果机床的工艺范围过宽,将使机床的结构复杂,不能充分发挥机床各部件的性能; 如果机床的工艺范围较窄,可使机床结构简单,易于实现自动化,提高生产率。
混杂偏倚 暴露因素与疾病发生的相关(关联)程度受到其他因素的歪曲或干扰
混杂因素的特征 是研究疾病的独立危险因素 与所研究的暴露因素存在统计学联系 不是暴露因素与疾病因果链中的一个环节或中间变量
混杂因素的测量
专业知识 分层分析
混杂偏倚的方向
正混杂偏倚 负混杂偏倚
偏倚概念:是指在流行病学研究中样本人群所测得的某变量值系统地偏离了目标人群中该变量的真实值,使研究结果或推论的结果与真实情况之间出现偏差,这是由系统误差造成的。
临床流行病学--偏倚
临床流行病学
控制:
⑴使用新病例
⑵应用队列研究基础上的巢式病例对 照研究;
⑶同时考虑暴露程度和暴露时间与暴 露结局的联系,可用Cox模型进行分 析。
精品课件
16
临床流行病学
3、检出征候偏倚(诊断信息偏倚)
某暴露因素可引起与所研究疾病相 似的症状和体征,而具有这些症状和体 征的人因主动就医而有更多的机会被诊 断为病例,最终造成该暴露因素与疾病 之间虚假的高度关联。
(老病人—新病人偏倚,存活者偏倚)
精品课件
13
临床流行病学
实例之一:在医院内心肌梗死病人中调查大量饮 用咖啡者心肌梗死发病的危险性是否提高?
结论:大量饮用咖啡对心肌梗死发病并无影响。
事实:大量饮用咖啡心肌梗死发病危险性是对照 的2倍。
原因:50%的心肌梗死患者入院前已死亡,研究 对象仅是幸存者。入院的病例只是一般的饮用 咖啡或已减少了饮用量,而医院的其他对照病 例可能饮用咖啡的比例较一般人群高。
精品课件
5
临床流行病学
(三)真实性(validity) 指一项观察或研究所作推论的正确
及可靠程度。 医学研究的目的是通过对样本人群
的观察和研究,取得研究变量同结果变 量之间的真实联系,并将此真实联系推 广到样本人群所属的目标人群范围内。
内部真实性(internal validity)
外部真实性(external validity)
148 148
18
临床流行病学
原因:
雌激素
子宫出血
就诊机会增加
子宫内膜癌病例中对 雌激素的暴露比例增多
精品课件
19
临床流行病学
4、志愿者偏倚(volunteer bias)
流行病学—偏倚与控制
第一节 概述
一、偏倚的概念:指在流行病学调查或推论过程中 所获结论系统地偏离真实值,属于系统误差。 二、偏倚的方向: (一)正偏倚和负偏倚: 凡夸大真实效应者为正偏倚。 凡缩小真实效应者为负偏倚。 假如某特征的真实值为θ ,而测得值为θ ’。 θ =1.0为零效应; θ >1为危险效应; θ <1为保 护效应。
二、信息偏倚的控制 (一)制定明细的资料收集方法和严格的质量控制 方法 (二)尽可能采用“盲法” (三)尽量收集客观指标的资料。 (四)收集资料的范围可以适当有意识地扩大些, 借以分散调查人员和研究对象对某项因素的注意 力,减少某些偏见带来的偏倚。 (五)通过调查知情人或采用相应的调查技术,获 取正确信息,避免报告偏倚。 (六)选择一个与暴露史有联系的鲜明的记忆目标 帮助其联想记忆或选择新病例作为对象。
¶ ÔÕ£ ¨£ ¥£ © 55 37 8
À à· çÊ ª¹ ؽ ÚÑ ×» ¼Õ ß £ ¨£ ¥£ © 27 58 15
À à· çÊ ª¹ ؽ ÚÑ ×» ¼Õ ßµ ÄÍ ¬° û £ ¨£ ¥£ © 50 42 8
类风湿关节炎患者 比其同胞、对照更能提供阳性家族史
(二)报告偏倚:研究对象有意夸大或缩 小某些信息而导致的偏倚。 如隐瞒与隐私有关的暴露史 保护调查对象声誉隐瞒不良暴露史 夸大职业暴露
(六)无应答偏倚: 某个样本中的无应答者的患病状况,以及对 某一或某些研究因素的暴露情况与应答者不同, 由此产生的偏倚称为无应答偏倚。 安阳县食管癌普查,普查率仅20%左右,不 能代表总体。 造成无应答的主要原因: 研究对象不了解研究目的;调查内容不当, 过于繁琐,涉及隐私;对象不能正理解调查内容 (文化低、高龄等);对象病重、外出。
流行病学研究中的常见偏倚
一般情况下,志愿者与非志愿者在关心 健康、注意饮食习惯、禁烟、禁酒及体 育锻炼等方面可能存在系统的差别,因 而,志愿者被入选为观察对象,而非志 愿者落选,这样的研究结果往往有选择 偏倚。例如,一项以体育锻炼预防冠心 病的研究,干预组都是志愿者,而将非 志愿者作对照,以比较该项措施的效 果,这样就可能会得出不正确的结论。
合计
组)
组)
1200
1200
2400
4800
4800
9600
OR=1,χ2检验差异无显著性,说明A病与X因素无关系。
假设A病住院率为25%,B病住院率为60%,具 有X因素也有一定的入院率为40%。现就上述 不同的入院率计算住院人数:
A病无X因素住院人数=4800×0.25=1200人
A病有X因素住院人数=1200×0.25+(1200 -300)×0.4=660人
7
72
110
117
117
9.8
妇科
暴露
非暴露
59
42
89
108
148
148
1.7
1978年,Horwitz指出,这一结论是由检 出征候偏倚所致,两者之间的高度关联 是虚假的。因为在人群中有一定量的无 症状的子宫内膜癌早期病人,她们若不 服用雌激素,子宫不致出血,因而不去 医院就诊,而不能被发现。
4. 志愿者偏倚(volunteer
2、尽量采用多种对照
理想的是以人群中全体病例和非病例(或其 有代表性的样本)作为研究对象。如以医院 病例为研究对象,宜在多个医院选择对象, 且最好有2个对照组,其中一个对照组来自 社区一般人群,在队列研究中,最好也应设 多种对照,以减少选择偏倚对结果的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
举例:用动脉血压计测量某人血压,各次读数的均值为 100mmHg,系统误差和随机误差可用以下图示
发 生 频 次
系统误差
随机误差
80
100
舒张压 (mmHg)
图1
血压计法测量舒张压值的分布
9
二、偏倚的概念
定义
偏倚(Bias)是在研究的设计、实施、分析阶段发 生的系统误差。 特点 是影响流行病学内部真实性的主要原因。 具有方向性,夸大真实值为正偏倚,缩小真实值为 负偏倚 分类 选择偏倚,信息偏倚,混杂偏倚
10
第二节 选择偏倚
一 选择偏倚的概念 选择偏倚(selection bias)指由于研究对象与目标人群的 特征存在着系统误差,使效应估计值与真值之间发生的 偏差。
是研究者在挑选研究人群时由于选择条件受限制或设计 失误所造成的。既可产生与研究开始选择研究对象的时 候,也可产生与收集资料过程中出现失访或无应答。常 见于现况研究、病例对照研究与回顾性队列研究。
16
二 选择偏倚的常见种类 2、现患-新发病例偏倚
又称奈曼偏倚,在病例对照研究中,用于研究的 通常是现患病例,而不包括死亡病例或者病程短、 轻型、不典型的病例,由此而所产生的系统误差。 如: Friedman 等人进行的心血管疾病的研究中发现, 队列研究中,高胆固醇水平者患冠心病的 OR 值为 2.4 ,而在病例对照研究中,病例组与对照组无明 显差别OR为1.16。
一、研究结果的误差和真实性
随机误差
定义
由于多种无法控制及不能预测的因素引起的 一类表现不恒定、随机变化的误差。 特点 没有固定方向和固定大小 一般呈正态分布
7
一、研究结果的误差和真实性
系统误差 定义 指研究过程中,由一些可控制的因素引起的使 研究结果或推论偏离真实情况的误差。 特点
具有单方Байду номын сангаас性 可高于真值,也可低于真值
17
现患-新发病例偏倚具体原因:
1、现患病例不能代表疾病的总体; 2、患病还可能与预后因素有关,从而歪曲联系; 3、病程长的病例会改变生活习惯,使关联发生因果 倒置。
18
二 选择偏倚的常见种类 3、无应答偏倚
调查研究中那些因各种原因不回答或不能回答所 提出问题的人、不依研究设计接受治疗者人称为无 应答者。 无应答者在某些与研究有关的特征上与应答者 存在的系统误差称为无应答偏倚。
表二 以医院为基础的乙肝与肝硬化关系的病例对照研究
暴露(有乙肝) 非暴露(无乙 肝) 合计 乙肝暴露 率(%)
病例组(肝硬化)
对照组(支气管炎)
116
152
240
480
356
532
32.6
28.6
15
入院率偏倚产生的具体原因:
医院的技术专长、患者病情的轻重、服用药物、住 院的难度、患者对疾病的认识、地位与经济状况、 就诊的方便程度等因素都会引起疾病入院率的不同。
14
假设上述病例组和对照组按照肝硬化入院率30%、支气管炎入 院率60%,乙肝入院率为40%的比例到医院就医。
肝硬化合并乙肝的入院人数=200*0.3+(200-200*0.3)*0.4=116 肝硬化不合并乙肝的人员人数=800*0.3=240 支气管炎合并乙肝的入院人数=200*0.6+(200-200*0.6)*0.4=152 支气管炎不合并乙肝的入院人数=800*0.6=480
19
二 选择偏倚的常见种类
4 志愿者偏倚
志愿参加观察的研究者同非志愿者在关心健康、 注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等 方面有差异,因志愿者常被入选为观察对象,而非 志愿者常被落选,故这样的观察或研究结果肯定有 选择偏倚
20
二 选择偏倚的常见种类 5、检出征候偏倚
某因素与某疾病虽无关联,但该因素可引发该病 的某些症状或体征。暴露于该因素者可因上述症状或 体征到医院就诊,其中的患者因此而提早确诊,使暴 露于该因素的人群有较高的该病检出率,以致得出该 因素与该病相关的错误结论。
11
二 选择偏倚的常见种类
入院率偏倚 现患-新发病例偏倚 无应答偏倚 志愿者偏倚 检出征候偏倚 时间效应偏倚
排除偏倚
失访偏倚
易感性偏倚
12
二 选择偏倚的常见种类 1、入院率偏倚
又称伯克森偏倚,是以医院为基础的病例对照研究 中,由于各比较组中患不同疾病的入院率不同所造成的 偏倚。
产生的条件
病例来自到某时期某医院就诊的A病病例,对照取自同 期在同一所医院就诊的B病病例 A、B两种疾病由于各种原因存在不同的入院率 暴露于研究因素X者也有稳定的入院率,且与A、B无关
21
二 选择偏倚的常见种类
6 时间效应偏倚
许多慢性病(如恶性肿瘤、冠心病)自接触 有效暴露(内、外环境的危险因素)之日起至出 现临床症状止,其间经过一段漫长的潜隐过程; 在此期间他们实际上是有暴露史但未出现症状, 用现有检测手段未能发现有症状的病人;但由于 无明显的症状,因此常被错误地归入健康对照组 内
真实性是指研究收集的数据、分析的结果和所 得出结论与客观实际的符合程度。也就是研究所 做出的推论的可靠程度。 流行病学的真实性有内部真实性和外部真实性 两层含义。
3
一、研究结果的误差和真实性
内部真实性:研究结果能准确反映目标人群真实状 况的程度。 增加研究对象的同质性,限制研究对象的类型和研 究的环境条件等措施可改善内部真实性。
4
一、研究结果的误差和真实性
外部真实性:研究结果被外推至不同时间、不同 地区和不同特征人群的程度。 增加研究对象的异质性,使研究对象的代表性范 围扩大,可改善外部真实性。
5
一、研究结果的误差和真实性
误差
指对事物某一特征的度量值偏离真实值的 部分,即观察值与真实值之差。 分类 随机误差 系统误差
6
13
举例:社区中肝硬化、支气管炎两病的患者各为1000人, 暴露于乙肝的概率均为20%,以此数据进行病例对照研究可 得到:
表一 以社区为基础的乙肝与肝硬化关系的病例对照研究 暴露(有乙肝) 病例组(肝硬化) 对照组(支气管炎) 200 200 非暴露(无乙 肝) 800 800 合计 1000 1000
第九章 流行病学研究中常见的偏倚及其控制
武汉大学公共卫生学院 流行病与卫生统计学系 向 浩
1
第一节 偏倚的概念
一、研究结果的误差和真实性 在流行病学研究中,无论采用何种研究方法,均 须考虑研究结果的真实性问题。 但是由于各种因素的影响,研究结果与真实情况 存在差异,有时还会得出完全错误的结论。
2
一、研究结果的误差和真实性