流行病学 第8章 偏倚及控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3、测量偏倚 (1)测量环境与条件不对等 在暴露组与对照组测量暴露或结局的信息过程 中,源自文库于不同场所、不同的时间、不同调查人员、 不同的态度等所造成的偏倚。 (2)测量差异 调查员未按要求统一培训和预调查、仪器未校 正、试剂药品不规范、调查表设计不科学、诊断 标准不一致等。
4、诊断怀疑偏倚 当观察者已知被观察者的某些情况时,在调 查时会自觉不自觉的侧重询问、检查有关情况 在作诊断或分析时,倾向于自己的判断。 5、报告偏倚 指研究对象有意夸大或缩小某些信息而导致 的偏倚。如调查一些有关隐私问题时,被调查 者通常没能如实报告情况,如职业危害调查时 通常是夸大暴露因素
一项喷漆作业工人的职业暴露与支气管哮 喘发作关系的研究。
3.29, p 0.05
2
(二)、信息偏倚(information bias)
研究对象选取后,就要进行信息采集。信息 偏倚又称测量偏倚(measurement bias)或观 察偏倚(observation bias)。 是指在收集资料阶段对各比较组所采用的观 察或测量方法不一致,使各组所获得的信息存在 系统误差。
各种类型的流行病学研究中都可发生信息偏 倚,可来自研究对象、研究者本身,也可来自测 量仪器、设备、方法等。 信息偏倚的表现是使研究对象的某种特征被 错误分类,如暴露者被认为是非暴露者,病人被 当做非患者等,研究对象不正确地反映某些信息 致使研究者判断错误等。
(三)、混杂偏倚(confounding bias)
第3节 常见的偏倚及其控制
无论是哪种研究方法,在研究的设计、实 施、数据处理和分析的各个环节中均会产生偏 倚,从而夸大或缩小暴露因素与疾病之间的关 联。
一、描述性研究中常见的偏倚及控制
(一)、常见的偏倚 1、选择偏倚 (1)选择性偏倚 (2)无应答偏倚 (3)幸存者偏倚
2、信息偏倚 (1)报告偏倚 (2)社会期望偏倚 (3)测量偏倚 (4)调查人员所引起的偏倚
2、信息偏倚
(1)报告偏倚
调查对象在回答调查人员问题时,由于回答不 够准确所造成的偏倚。
(2)社会期望偏倚
对社会上一些敏感的或是有争论的话题,调查 对象常按社会上大多数的观点回答,掩盖自己真实的 想法,因而造成社会期望偏倚。
(3)测量偏倚
是指测量仪器或量具不准确,或在测量过程中 因操作失误所导致的偏倚。
2、标准化(standardization)
当需要比较两个率之间差异时,按照统计学 标准化的方法,使可疑的混杂因素在两组间得到 同等的加权,从而获得有可比性的标准化率,以 避免混杂因素的影响。
3、多因素分析(multivarate analysis)
当样本量不够大,不足以进行分层分析时, 或者是多种因素对疾病存在综合影响时,可采 用多因素分析的方法。 常用的多因素分析的方法有多元回归分析、 聚类分析、Logistc回归分析、Cox回归模型等。
(二)、准确的资料收集
1、要严格执行设计规定的要求 制定明确而严格的资料收集方法和质量控 制方法。 2、尽量采用客观指标 要制定统一的调查表,对调查表的内容要 有客观、明确的标准。研究中用到的仪器、设 备、试剂等测量结果要予以标准化。
3、调查人员的培训 调查人员的素质、态度、技术方法的熟练 程度、掌握判别结果的标准等对资料质量的影 响非常大。研究开始之前,要培训调查员,统 一资料收集方法,统一测量指标的标准,必要 时进行资料收集技巧的 培训。 同时,要进行预调查或预试验。
(4)调查人员所引起的偏倚
调查中,调查人员未采用统一的调查方式对待 所有的调查对象,或者为了获得所需要的内容,进行 诱导性询问而产生的偏倚。
(二)、偏倚的控制
1、选择偏倚的控制方法 严格按照抽样设计方案进行研究对象的选取, 坚持随机化原则。 提高抽中对象的受检率。 在横断面研究中,要考虑幸存者偏倚的问题, 尽可能病例选择面广一些,并注意收集有关 病程、疾病类型方面的资料,以便在分析结 果时,得出合理的结论。
对象造成的偏倚
随机分配
分组机会均等,各组非研究因素均匀 分布,资料可比,提高研究的正确性
随机化是控制偏倚的有效方法之一。
2、匹配(matching)
就是在选择病例与对照时,要求两者的某 些因素或特征即匹配因素相一致,以排除匹配 因素的干扰,提高研究效率。 但要注意所匹配的因素应是已知的混杂因 素,否则不能匹配。匹配使用得当可以有效控 制混杂因素,提高研究真实性。还要避免匹配 过度,即把不必要的项目列入匹配,可能丢失 信息增加工作难度,反而降低了研究效率。
二、队列研究中常见偏倚及其控制
(一)、常见偏倚 1、选择偏倚 研究对象进入、排除、不参与等与研究暴 露或处理因素存在关联,由此增大或减少暴露 与疾病、处理与效应的关联,导致效应估计的 偏倚。
2、失访偏倚 研究过程中,某些选定的研究对象因为种种 原因脱离了观察,研究者无法继续随访他们从而 造成对研究结果的影响。 队列研究观察人数多,随访时间长,失访是 不可避免的,一项研究的失访率最好不超过5%或 稍高,否则应慎重考虑结果的解释和推论。
二、系统误差
系统误差(systematic error)是指测量值 与总体值之间出现的差异。 在实际观测过程中,由受试对象、研究者、 仪器设备、研究方法、非实验因素影响等原因 造成的有一定倾向性或规律性的误差。 观察值有系统性、方向性、周期性的偏离真 值,可直接影响原始资料的准确性,必须查明原 因、予以矫正,系统误差必须避免。
外部真实性
指研究结果被外推至不同时间、不同地区、不同人群是 所反映的可靠程度。
一、随机误差( random error )
也称为抽样误差(sampling error),又 称机遇(chance)。随机误差是样本值与总体值 之间的差异。 随机误差不可避免,用统计学方法来估计, 增大样本含量可减少,没有固定方向和固定大小, 一般呈正态分布。
心肌梗死 对 照
高脂肪膳 食 60 32
低脂肪 膳食 40 68
OR= (60╳60)/(40╳40)=2.3
OR= (60╳68)/(40╳32)=3.2
表8-3 无差异性错误分类和差异性错误分类的示例 图 8-3
7、混杂偏倚 队列研究中,年龄、性别、吸烟是3个最 常见的混杂因素。
2、信息偏倚的控制方法
为使调查对象能提供准确的信息,必须在调查 问卷上下功夫。 对于调查员,关键是进行严格的培训,增强工 作的责任感。统一调查程序、方法。 测量仪器要选用标准一致的,不易产生偏性和 稳定的仪器,使用前还要统一校正,从而保证 测试结果的准确与可靠。 对调查环境加以选择与控制的。这主要是根据 调查目的和对象的特点来加以考虑。
医学研究是群体医学的范畴,数据来源于个 体,存在个体差异。 研究的精确性与真实性 精确性 真实性 随机误差 系统误差
第1节 误差概述
误差(error)
在流行病学研究中,无论采用哪种研究方法, 所得结果与真实情况均会存在一定的差异,有 时甚至还能得出错误的结论。这种研究结果和 真实情况间的差异就称为误差。
正向偏倚 某一特征的测量值大于真实值 夸大研究的结果 负向偏倚
某一特征的测量值小于真实值 减小研究的结果
1946年,Berkson做最著名的偏倚研究并给 予证实,又称为Berkson偏倚。 1976年,Miettinen详细讨论了偏倚的定义, 并给出分类框架,分三类 选择偏倚 信息偏倚 混杂偏倚
3、盲法(blingding)
在研究中,研究对象或/和调查者均不知道 研究对象的分组情况及研究内容,以避免或消除 研究对象、调查者主观心理因素的影响,保持观 察的客观性,称为盲法。 盲法是减少信息偏倚,尤其是控制调查偏倚 的重要方法。
4、限制(restriction)
限制是指对研究对象选择的条件加以控制。 是控制混杂偏倚的方法之一。 当认为某因素可能是混杂因素时,我们在选 择研究对象时可以对此加以限制。 研究口服避孕药与心肌梗死的关系时,考虑 年龄可能为混杂因素,只选择某一年龄组的妇女 作为研究对象。
1、选择偏倚
(1)选择性偏倚
在调查过程中,没有按随机抽样方案进行,而是 随意或随便选择研究对象。
(2)无应答偏倚
调查对象由于种种原因拒绝合作或不依从降低应 答率而产生的偏倚。 (3)幸存者偏倚 研究中常常选择某疾病的现患人群为研究对象, 而患该病的人可能有一部分已死亡,这种调查结果很 难代表所研究疾病的全貌。
偏倚(bias)的概念
系统误差又称为偏倚,在研究或推论过程 中所获得的结果系统地偏离真实值。 研究中必须认识偏倚的来源及其产生的原因, 最大限度的减少偏倚的发生,以便取得有价值的 研究结果。
第2节 偏倚的分类及控制
偏倚可以从很多途径进入流行病学研究,研 究对象的选择方法,研究变量的测量方法以及一 些未被完全控制的混杂因素,都有可能使研究结 果产生偏倚。 偏倚的方向有两种: 正向偏倚 负向偏倚
一、分类
(一)、选择偏倚(selection bias)
研究对象的选取过程中,由于选取方式不当,导致
入选对象与未入选对象之间存在系统差异,由此造成的
偏倚称为选择偏倚。例如研究对象采用志愿者,方便样 本,或者研究对象的无应答或失访等。
选择偏倚对结果的影响是在选择研究对象时 出现了系统误差,认为地夸大或减小了研究因素 与疾病之间的关联程度,是研究阶段设计阶段经 常出现的错误。
心肌梗死 对 照
高脂肪 膳食 60 40
低脂肪 膳食 40 60
心肌梗死 对 照
OR= (60╳60)/(40╳40)=2.3
研究真实数据 研究真实数据
OR= (48╳68)/(52╳32)=2.0
差异性错误分类 差异性错误分类
错误分类数据 错误分类数据
心肌梗死 对 照
高脂肪 膳食 60 40
低脂肪 膳食 40 60
在研究某因素与某疾病之间的关系时,由于 一个或多个外部因素的影响,缩小或夸大了研究 因素与疾病之间的真正的联系,称为混杂偏倚。 导致混杂产生的因素就称为混杂因素。混杂 偏倚是在研究的设计阶段未能对混杂因素加以控 制和在资料分析时未能进行正确的校正所造成的 偏倚。
混杂因素具备的特征
(1)混杂因素必须是所研究疾病的独立危险因 素,如果不找出或不避开,所得研究结果可 能不是研究因素造成的。 (2)混杂因素必须与所研究的暴露因素存在统 计学联系。 (3)混杂因素不应是暴露因素与疾病因果链中 的一个环节或中间变量。
误差分为两类: 随机误差 系统误差 流行病学研究中,研究者要考虑到这两种 误差,并且必须要设法避免减少这两种误差的 来源,以使研究结果与真实客观情况相一致, 才能提高研究的真实性。
医学科学研究的真实性
真实性(效度) 定义 指研究收集的数据、分析结果和所得结论 与客观实际的符合程度。 内部真实性 指研究结果能准确反映目标人群真实状况的程度。
6、错分偏倚 包括暴露错分和疾病错分以及暴露和疾病 的联合错分。主要原因是使用的仪器不准确, 检验技术不熟练,诊断标准定义不明确或掌握 不当,询问技巧欠佳造成结果不真实。
无差异性错误分类和差异性错误分类
无差异性错误分类 无差异性错误分类
研究真实数据 研究真实数据
错误分类数据 错误分类数据 高脂肪膳 食 48 32 低脂肪 膳食 52 68
二、偏倚的控制
(一)、严格的科研设计 多数偏倚的产生与设计密切相关,如果研 究结束时再行注意为时已晚,有的则不能校正, 因此研究者应充分了解和估计可能产生的偏倚, 用严谨的科研设计来避免这些偏倚。
1、随机化(randomization)
随机化可分为随机抽样和随机分配两种不同 的形式。 随机抽样 代表性 避免因主观、任意选择研究
4、资料的整理
原始资料收集上来后,要进行检查、纠正、 验收、归类等程序。 目的:一是保证资料的质量和完整性; 二是熟悉资料,便于下一步工作; 三是使原始资料系统化、条理化。
(三)、科学的资料分析
如果在研究的设计、资料的整理阶段某种或 某些偏倚未被充分控制,可以在数据分析时加以 控制。 1、分层(stratification) 分析时,将可疑的或已知的混杂因素按其不 同水平分层后,再进行统计分析。 注意:有些层样本数少时,可减少分层或采 用多因素分析。