偏倚及其控制 实习
偏移
偏倚及其控制【目的】:了解偏倚的类型及常见偏倚的测量与控制方法。
【时间】:4学时【内容】:见实习指导。
先复习偏倚的概念及其分类,然后就习题内容对常见偏倚加以讨论。
偏倚:在进行流行病调查研究或推论过程中,由于某种或某些因素影响,导致所得结果或推论与真实情况存在着系统差别,该系统差别称为偏倚。
偏倚主要分为三大类:选择偏倚:是在研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象之间存在系统差异,由此造成的偏倚称为选择偏移。
信息偏倚:是来自于测量或资料收集方法的问题,使得获取的资料存在系统误差。
混杂偏倚:当我们研究某个因素与某种疾病的关联时,由于某个与疾病有制约关系,又与所研究的暴露因素有关联的外来因素的影响,掩盖或夸大了所研究的暴露因素与疾病的联系。
这种现象叫混杂,该外来因素叫混杂因素,造成的偏倚叫混杂偏倚。
着重讨论课题一、二、四。
作业为课题五【课题一】该习题主要讨论选择偏倚中的入院率偏倚。
问题1:这两种不同来源研究对象研究结果的差异可能是由入院率偏倚所造成的。
入院率偏倚又称Berson,s偏倚,自Berson于1946年首先从理论上证实了该种偏倚存在的可能性以来,引起了学者们的注意。
该例就是加拿大流行病学工作者于1978年在实际调查资料的基础上证实了入院率偏倚的存在。
问题2:以表7-1中水杨酸类药与过敏之间关系为例,入院率偏倚的大小与方向为:入院率偏倚=(0.18-1.15)/1.15=-0.84,即以医院病例为研究对象对水杨酸类药与过敏之间关系的OR值被低估了84%。
问题3:由于入院率偏倚是以医院病例为研究对象的,病例与对照的入院率不同所造成的,而其入院率又很难准确估计,因此在医院选择研究对象进行病例对照研究时很难控制该种偏倚。
在流行病学研究中,对于产生该种偏倚的可能性可采用多种对照组加以判断,并对研究结果的真实性作出估计,其中一个对照组应来自一般社区人群,如果通过不同对照组所获得结果差异不大,则可认为无入院率偏倚,相反,则提示可能存在入院率偏倚。
14临床科研中偏倚及其控制(一)
研究 A(研究对象 200 人,随机分配到两组) 膳食改良组 降胆固醇药物组
0
5
10
15
五年内发生 心肌梗死风险(%)
研究 B(研究对象 2000 人,随机分配到两组) 膳食改良组 降胆固醇药物组
0
5
10
15
五年内发生 心肌梗死风险(%)
图3 膳食与药物预防心机梗死的样本变异性示例
图3研究A和研究B中膳食改良组五年内发生心梗死的风 研究A和研究B 险为9% 险为9%,降胆固醇药物组为6% 9%,降胆固醇药物组为6% A样本较小(200人),两组效应指标(心肌梗死风险) 样本较小(200人),两组效应指标(心肌梗死风险) 的95%可信限较大,从而发生重叠,统计检验无显著性 95%可信限较大,从而发生重叠,统计检验无显著性 差异 研究B样本较大(2000人),两组效应指标的95%可信 研究B样本较大(2000人),两组效应指标的95%可信 限较小,从而未发生重叠,统计检验有显著性差异 一般而言,研究样本越大,效应估计值的抽样误差越 小(95%可信限越小),统计检验能发现的两组间效应 小(95%可信限越小),统计检验能发现的两组间效应 差值越小
(三)研真实值的部分,即 误差是指对事物某一特征的测量值偏离真实值 误差是指对事物某一特征的测量值偏离真实值的部分,即 测定值与真实值之差。即研究结果与客观实际存在不符合的地 方。 分类
系统误差(偏倚):有固定方向与大小。来自研究对象选 有固定方向与大小。来自研究对象选
(六)研究偏倚的意义
临床流行病学研究中少不得“ 临床流行病学研究中少不得“中庸之道”,即 不偏不倚。 偏倚可发生在研究设计、实施、分析以至推论 的各个阶段。 加大样本量并不能使之减少。只有深入研究, 加大样本量并不能使之减少。只有深入研究, 才能了解、认识各类偏倚,以便在研究过程中 尽量加以避免或控制,才能保证研究结果的真 尽量加以避免或控制,才能保证研究结果的真 实性。
控制偏倚的重要措施
控制偏倚的重要措施1. 引言在学术研究和决策制定过程中,控制偏倚是非常重要的。
偏倚可能导致错误的结论或决策,影响研究的可信度和决策的有效性。
因此,采取一些重要的措施来控制偏倚是至关重要的。
本文将介绍控制偏倚的重要措施,并为每个措施提供详细的解释和操作指南。
通过了解这些措施,读者将能够更好地理解如何在研究或决策过程中避免偏倚的影响。
2. 随机分配随机分配是控制偏倚的重要措施之一。
在实验设计中,随机分配使每个处理或实验组在起始条件下具有相同的概率分配。
通过随机分配,实验组与对照组之间的差异可以更好地归因于处理效应而非其他因素。
随机分配的具体操作包括:•使用随机数生成器来为实验对象分配处理组。
•确保实验对象的特征在处理组之间以随机方式分布。
•进行足够的重复次数以保证统计结果的可靠性。
通过随机分配,我们可以最大程度地控制开始状态的偏倚,从而更准确地评估处理效应。
3. 双盲设计双盲设计是在实验或研究过程中控制偏倚的另一个重要措施。
在双盲设计中,既实验人员也被测试对象不知情。
这样可以通过避免实验人员的偏见和预期来减少偏倚的影响。
在双盲设计中,需要注意以下几点:•实验人员不知道每个实验对象的处理组归属。
•为了实现双盲,可以使用编码、加密或标记技术。
•收集和记录数据时,要确保实验人员不知道实验对象的信息。
双盲设计有助于减少实验人员对研究结果的主观影响,提高研究的可信度。
4. 控制变量控制变量是控制偏倚的另一个重要措施。
在许多实验或研究中,存在许多可能干扰结果的变量。
通过控制这些变量,我们可以更好地理解处理效应。
控制变量的方法包括:•确保实验组和对照组在其他所有方面都保持一致,除了处理变量。
•监测和记录潜在干扰变量,并在结果分析中进行控制。
•进行适当的统计分析,考虑到变量之间的相互作用。
通过控制变量,我们可以消除其他因素对研究或实验结果的影响,从而得出更准确的结论。
5. 多中心研究多中心研究是控制偏倚的另一种重要方法。
临床研究中的偏倚及控制讲解
临床研究中的偏倚及控制讲解在医学领域,临床研究对于推动医学进步、改善医疗质量至关重要。
然而,在临床研究的过程中,偏倚的存在可能会导致研究结果的不准确和不可靠,从而影响临床决策和患者的治疗效果。
因此,了解和控制临床研究中的偏倚是至关重要的。
一、什么是临床研究中的偏倚偏倚,简单来说,就是在研究过程中,由于各种因素的影响,导致研究结果偏离了真实情况。
在临床研究中,偏倚可能来自研究设计、研究对象的选择、数据的收集和分析等多个环节。
常见的偏倚类型包括选择偏倚、信息偏倚和混杂偏倚。
选择偏倚发生在研究对象的选择过程中。
例如,如果研究某种疾病的治疗效果,但只选择了病情较轻的患者,那么得出的治疗效果可能会过于乐观,无法反映真实情况。
信息偏倚则与数据的收集有关。
比如,患者回忆病史时不准确,或者医生在诊断和评估时存在主观偏差,都可能导致信息偏倚。
混杂偏倚是指除了研究因素之外,还有其他因素同时影响了研究结果。
比如,在研究吸烟与肺癌的关系时,如果没有考虑到空气污染这个混杂因素,可能会得出错误的结论。
二、偏倚产生的原因1、研究设计不合理研究方案不完善,如样本量不足、对照组选择不当、随访时间过短等,都可能导致偏倚的产生。
2、研究对象的选择偏差如果纳入和排除标准不明确,或者在招募研究对象时存在倾向性,就可能导致研究对象不能代表总体人群,从而产生偏倚。
3、测量误差在收集数据时,使用的测量工具不准确、测量方法不一致或者观察者的主观判断差异,都可能引入测量误差,进而导致偏倚。
4、随访丢失在长期的随访研究中,部分研究对象失去联系或拒绝继续参与,导致数据不完整,也可能产生偏倚。
5、数据分析方法不当错误的统计分析方法或不合理的数据分析策略,可能会放大或掩盖偏倚的影响。
三、偏倚对临床研究的影响偏倚会严重影响临床研究的质量和可靠性。
如果研究结果存在偏倚,可能会导致错误的临床决策,浪费医疗资源,甚至对患者的健康造成危害。
例如,一项关于某种新药物疗效的研究,如果因为选择偏倚只纳入了对药物反应良好的患者,可能会高估药物的疗效,从而使医生在临床实践中过度使用该药物,而实际上它对大多数患者可能并没有那么有效。
医学科研中常见的偏倚类型及控制方法
信息偏倚的控制
严格的调查设计和研究人员的科学态度,严 格的质量控制措施 尽量采用“盲法”收集资料 尽量收集客观指标的资料 采用调查技巧避免无应答、回忆和说谎偏倚 收集资料的范围可以适当广泛些,借以分散 调查人员和研究对象对某项因素的注意力, 减少某些偏见带来的偏倚
三、混杂偏倚(confounder bias)
暴露因素与疾病发生的关联程度受到其他因 素的歪曲或干扰而造成的系统误差
在研究设计阶段和资料分析阶段未能对混杂因 素加以控制或未进行校正,使得研究结果与真 实情况不符
混杂偏倚会影响病因研究的因果关系、疾病治 疗的效果和预后因素的评价
混杂因素存在的条件
混杂因素对研究结果有影响 混杂因素与暴露因素伴随存在 混杂因素在比较人群中的分布不均衡
Wilcox等人在调查流产回忆准确性的研究中 发现,调查10年前流产的有82%的回忆完整, 调查20年前流产的有73%人回忆完整。在受 孕前6周流产者能回忆起来的有54%。而在受 孕13周流产者能回忆起来的有93%
病例组和对照组的回忆误差也可能不一致,病 例组往往比对照组记忆准确。原因是调查事件 的重要性对两组人是不一样的,选择不易忘记 的指标做调查,并重视问卷和询问技术,有助 于减少调查中的回忆偏倚
主要内容
偏倚的类型 混杂因素与交互作用 偏倚的控制
误差(error)
➢定义:
指对事物某一特征的度量值偏离真实值的部分, 即测量值与真实值之差
➢分类:
随机误差(random error) 系统误差(systematic error),即偏倚(bias)
举例:用动脉血压计测量某人血压(实际值 为80mmHg),各次测量的均值为 100mmHg。下图为系统误差和随机误差的 示意图
临床研究中的偏倚及控制讲解
bias) 指在研究的实施阶段判断研究对象的暴露或疾病状况
时发生的的系统误差。
可发生于各种类型的流行病学研究 可来自研究对象、研究者本身、用于测量的仪器、设备和方法
Your site here
CTC
信息偏倚常见种类
回忆偏倚 报告偏倚 测量偏倚 调查者偏倚 错分偏倚
Your site here
错误分类数据 高脂肪膳 食 60 32 低脂肪 膳食 40 68
定义:研究对象有意夸大或缩小某些信息所导致的偏倚,称报告偏倚。
查者可能会隐瞒实情。但当调查职业病对健康的危害或环境污染时,
被调查者可能会夸大某些信息。 控制方法:采用敏感问题随机应答技术;或者间隔一段时间重复调查。
Your site here
CTC
测量偏倚
定义:由于研究中所用的仪器、设备、试剂、方法和检验
皮肤癌 实际人群 有高血压 75 75 150 1 1 外伤 合计 OR P
无高血压
合计
425
500
425
500
850
1000
75*25%+(7575*25%)*40%
75*60%+[(75-75*60%)*40%]
住院率(皮肤癌=60%;外伤=25%;高血压=40%) 有高血压 57 41 98 0.578 <0.001
呼吸道疾病与骨关节疾病关系研究 骨关节疾病 一般人群 住院病人 呼吸道疾病 case control case control + 17 207 5 15 _ 184 2376 18 219 OR=1.06 OR=4.06
Your site here
CTC
因不同住院率而住院的A、B病患者及其与因素X的关系
15临床科研中偏倚及其控制(二)讲解
(4)通过与所收集资料有联系的鲜明记忆目标帮助患者联想回忆; (5)收集到的患者记忆资料与相关客观记录核实; (6)通过调查知情人或相应调查技术获取敏感问题的正确信息; (7)对研究对象要做好宣传、组织工作,以取得研究对象的密切合作,
(三)常见信息偏倚
1.回忆偏倚(recall bias) 2.诊断怀疑偏倚(diagnostic suspicion bias) 3.暴露怀疑偏倚(exposure suspicion bias) 4.测量偏倚(measurement bias) 5.报告偏倚(reporting bias) 6.沾染偏倚 7.归类错误偏倚(misclassification bias) 8.家庭信息偏倚(family information bias) 9.临床资料遗漏偏倚(missing clinical data bias) 10.顺序偏倚(sequence bias) 11.不敏感测量偏倚(non-sensitive bias)
逐项对数据进行复核,发现资料间相互矛盾的地方就可能存在错 误。例如,某人性别为男性,而生育史中记载先兆流产3次,这就显 然存在逻辑错误。
e计算机检查
• e1资料录入时检查
资料录入时可通过设置某些变量的类型(字符型、日期型或数字 型)、取值范围、有效数字位数及逻辑检查,也可以通过双输入(例如 应用Epi Data软件)部分或全部数据来检查数据的录入质量。
错分有均衡与非均衡之分。均衡错分使偏倚趋向无效,而非均衡错分 对结果判断有影响。
实例:队列研究中病例错分
表 1 队列研究中病例错分所致的偏倚
错分情况
临床研究中常见偏倚及其控制
汇报人:
202X-12-28
CATALOGUE
目 录
• 临床研究中的偏倚概述 • 常见偏倚类型及控制方法 • 临床研究中的伦理问题与偏倚控制 • 临床研究中的质量控制与偏倚控制 • 临床研究中偏倚控制的未来展望
01
CATALOGUE
临床研究中的偏倚概述
偏倚的定义与分类
由于研究对象的选取标准或方法 不严谨,导致研究结果偏离真实 情况。控制方法:采用随机抽样 、扩大样本量、提高研究对象的 代表性等。
信息偏倚
由于信息采集或记录不准确、不 完整,导致研究结果出现误差。 控制方法:采用标准化操作规程 、提高数据采集和记录的准确性 等。
实施偏倚
由于研究过程中的操作或执行不 当,导致研究结果偏离真实情况 。控制方法:采用标准化操作规 程、加强培训和监督等。
偏倚可能干扰对因果关系的判断,导 致错误地认为某些因素与疾病之间存 在关联。
偏倚的识别与控制
识别方法
通过文献回顾、专家咨询、预实验等方法 来识别可能存在的偏倚。
样本量估算
Hale Waihona Puke 合理估算样本量,确保研究具有足够的代 表性,减少抽样误差对结果的影响。
控制方法
采取科学的研究设计、严谨的实验操作、 准确的数据采集和合理的统计分析等措施 来控制偏倚的产生。
应用价值。
04
CATALOGUE
临床研究中的质量控制与偏倚 控制
研究设计阶段的质量控制
明确研究目的和假设
在研究开始前,应清晰地定义研究目的和假 设,确保研究具有科学性和可行性。
科学选择样本
根据研究目的和假设,选择合适的样本来源和样本 量,确保样本具有代表性和可靠性。
最新临床研究中常见偏倚及其控制
偏倚 机遇 研究结论
外部真实性:外推到样本所属总体或其他人群
实例:美国退伍军人高血压治疗临床试验
研究对象是143例30~73岁退役军人,平均舒张压 115~129mmHg,均无高血压并发症。研究设计严谨,采用 随机分组、双盲观察,研究对象始终配合很好,统计学处 理正确。研究结果发现采用双氢克尿噻与利血平联合用药 能明显降低心、脑、肾等并发症。
临床研究中常见偏倚及其 控制
提纲
一、概述 二、选择偏倚及其控制 三、信息偏倚及其控制 四、混杂偏倚及其控制
3.机遇对研究结果的影响
1)假阳性:如实际上两种方法治疗疗效相同,如少数病人 的抽样研究发现甲、乙两方法疗效不同,这是由于机遇的 影响而发生的假阳性错误,统计上称一类错误,用α表示。 弃真
人群A、B两病及C因素分布
病种 有C因素 无C因素 总人数
A病 750
4250
5000
B病 750
4250
5000
OR=(750×4250)/(4250×750)=1
假设:A病入院率60%,B病25%,危险因素C的入 院率40%
病种 有C因素
无C因素 总人数
A病
750×60%=450
4250×60% 3120
750×40%×40%=120
=570
=2550
B病 750 750×25%=188
4250×25% 1476
750×75%×40%=225
=413
=1063
OR=(570×1063)/(2550×413)=0.575
2.检出症候偏倚
1)概念:指某因素与某病在病因学上虽无关联, 但由于该因素的存在而引起该疾病症状或体征的 出现,从而使患者及早就医,接受多种检查,导 致该人群较高的检出率,以至得出该因素与该疾 病相关联的错误结论。
实习五 偏倚及其控制
实习五偏倚及其控制【目的】了解偏倚的类型及常见偏倚的测量与控制方法。
【时间】2~4学时【内容】课题一:某研究所采用病例对照研究方法来研究服用缓泻药对风湿性关节炎的影响。
选择社区人群病例和住院病例进行的两次研究结果见下表。
不同来源研究对象的病例对照研究结果社区人群资料医院资料危险因素风湿性关节炎病例对照合计风湿性关节炎病例对照合计服用缓泻药90 55 145 15 3 18 未服缓泻药1910 1945 3855 85 97 182 合计2000 2000 4000 100 100 200 OR 1.67 5.711、如何解释两种不同来源研究对象研究结果的差异?其可能的原因是什么?2、与以社区人群为研究对象相比,对以医院病例为对象的病例对照研究结果所产生偏倚的大小与方向予以测量。
3、在流行病学研究过程中,如何控制该种偏倚?课题二:在医院内做病例对照研究,调查大量饮用咖啡者心肌梗死的危险性是否提高,得出大量饮用咖啡对心肌梗死发病并无影响的结论。
而队列研究得出,大量饮用咖啡者心肌梗死发病危险性是对照组的2倍。
问:可能存在何种偏倚影响病例对照研究的结果?分析其产生的原因。
应如果控制?课题三:德国Robert-Koch研究所开展了一项青少年健康状况的调查,共发出家庭问卷26784份,初步得到反馈问卷17142份。
分析应答人群特征:非德国籍家庭应答率为45%,德国籍家庭应答率为65%;农村家庭应答率为67%,城市家庭应答率为55%;德国西部家庭应答率为61%,德国东部家庭应答率为68%,首都柏林家庭应答率为54%。
问:1、你认为仅根据应答家庭的资料能否反映真实情况?为什么?2、在流行病学调查研究过程中,可能产生无应答偏倚的原因有哪些?3、如何控制与处理无应答偏倚?课题四:研究类风湿关节炎家族史的病例对照研究,选择类风湿关节炎病人为病例组时,有家族史者的OR=3.30,OR的95%可信限为1.84~5.90。
偏倚的控制方法
偏倚的控制方法一、偏倚的认识。
1.1 偏倚是什么呢?简单来说啊,偏倚就像是一个捣蛋鬼,总是在我们做研究或者判断事情的时候,悄悄地把结果往歪了带。
它不是那种明目张胆的错误,而是一种隐藏在背后的、慢慢扭曲真相的力量。
比如说啊,在做医学研究的时候,如果样本选取有问题,就可能产生偏倚。
好比只选了身体好的年轻人做某种疾病的研究样本,那得出的结论肯定是不准确的,这就被偏倚这个捣蛋鬼给坑了。
1.2 偏倚的种类还不少呢。
有选择偏倚,这就像在挑苹果的时候,只挑大的红的,忽略了那些小的青的,最后得出的关于苹果口感的结论就可能片面。
还有信息偏倚,就像传话游戏一样,一个人传一个人的时候信息变了味,在研究中可能是测量方法不准确或者调查对象记错了信息之类的情况。
2.1 样本选取要随机且具有代表性。
这就好比从一筐鱼里挑鱼做样本,不能只挑那些活蹦乱跳的,要闭着眼睛随便捞,大的小的、健康的不太健康的都要有。
在社会调查中也是一样,不能只调查高收入人群来了解整个社会的消费情况,得各种收入水平、各种职业、各个年龄段的人都涵盖到,这样才能让这个样本能代表整体的情况,把偏倚这个捣蛋鬼堵在门外。
2.2 测量方法要科学准确。
这可不能含糊,就像木匠做活,尺子得是准的。
在科学研究里,如果是测量长度,那尺子得是经过校准的;如果是调查人们的心理状况,问卷设计得合理、问题得清晰明确。
不能搞一些模棱两可的问题,让人家回答的时候一头雾水,不然得到的数据肯定乱七八糟,偏倚就趁机钻空子了。
2.3 调查人员的培训很关键。
调查人员就像是战场上的士兵,得训练有素。
如果调查人员在调查过程中态度不好,或者对调查内容理解不透彻,那就容易出问题。
比如说在调查老年人的健康状况时,调查人员要是没有耐心,可能就会漏记一些重要信息,这就像战场上的士兵因为粗心大意丢了阵地一样,会让偏倚这个敌人有机可乘。
所以啊,要让调查人员清楚调查的目的、熟悉调查的流程、掌握正确的调查方法,这样才能减少偏倚的产生。
临床研究中常见偏倚及其控制
4.测量偏倚(measurement bias)
❖ 1)测量环境与条件不对等 (1)病例在医院调查,对照在家里或工作场所调查; (2)病例与对照使用不同的调查表; (3)调查者对病例与对照的态度与认真程度不同; (4)由不同调查员调查病例与对照; (5)调查病例与对照的时间间隔太长; (6)调查员无意或有意地套取符合病因假说的信息。
临床研究中常见偏倚 及其控制
提纲
❖ 一、概述 ❖ 二、选择偏倚及其控制 ❖ 三、信息偏倚及其控制 ❖ 四、混杂偏倚及其控制
一、概述
误差(error)
➢定义:
指对事物某一特征的度量值偏离真实值的部分, 即测量值与真实值之差
➢分类:
随机误差(random error) 系统误差(systematic error),即偏倚(bias)
❖ 2)测量差错 (1)调查员未按要求进行培训与预调查; (2)使用的仪器设备不精良或未按要求校正; (3)使用的试剂药品不规范; (4)调查表设计不科学,记录不完整; (5)调查询问方式、态度不恰当; (6)调查或研究工作丧失科学态度。
(四)选择偏倚的控制
1.控制选择偏倚的基本方法 ❖ 1)研究者对整个研究过程可能出现的各种选择偏
倚应有充分的了解、掌握 即在选择研究对象、研究方法等过程中是
否存在产生选择偏倚的原因?是什么原因?在设 计时应周密考虑,并采取针对性措施在相应的环 节降低其产生的可能性,以减少或避免其产生。 ❖ 2)严格掌握研究对象的纳入与排除标准,随机化
1.回忆偏倚(recall bias)
1)概念:回忆偏倚是指研究对象在回忆以往发生的 事情或经历时,由于在准确性和完整性上的差异 所致的系统误差。在病例对照研究中最常见。
偏倚的控制——精选推荐
14
3.多因素分析法 当样本数量不够大,分层分析常不适用,因为应用分层分组 的方法 Mantel-Haenszel 只能平衡少数混杂因素的作用,且对连续性变量只能用等级 分层法,常引起不合理的分组,或者希望研究多种因素(包括暴露因素和各种混杂因 素)对研究疾病的综合影响时,可考虑应用多因素分析的方法。在多因素分析时,研 究因素和每个混杂因素,都被放在同等地位做分析。常用的多元分析法有:多元协 方差分析、Logistic 回归模型、cox 比例风险模型和对数线性模型(Loglinear models) 等。
值得注意的是对研究对象针对潜在的混杂因素实行限制后,可得到同质的研究对象,
3
从而防止某些混杂偏倚,有利于对研究因素与疾病之间的关系做出较为难确的估计。 但是在这种情况下,研究工作就丧失了概括性,即从研究对象中排除某些人群后, 所选择的病例不能代表患者总体,对照也不代表一般人群,因而所获得的结论常具 有很大局限性,影响研究对象对总体的代表性,使研究结果外推至一般人群时的外 推真实性受限。
13
(三)分析阶段
1.分层分析 分层是指将科研资料按某些影响因素分成数层(亚组)进行分析。 分层是最常用的检出和控制混杂偏倚的方法之一,也是分析阶段控制偏倚的常用手 段,特别适用于在设计阶段考虑不周或实施阶段执行不力,但尚有一定资料可寻的 可疑混杂因素作分层分析处理。可以将研究资料按照混杂因素分层,可用 Mantel-Haenszel 分层分析方法进行分析,得到将混杂因素调整后的效应估计值。
临床研究中的偏倚及控制讲解
信息偏倚常见种类
回忆偏倚 报告偏倚 测量偏倚 调查者偏倚 错分偏倚
回忆偏倚(RECALL BIAS)
定义:由于研究对象不能准确、完整地回忆以往发生的事 情和经历时所产生的系统误差。
事件或因素频率低,被遗忘 事件久远 对调查事件的关心程度和回忆的认真程度
例:
孕妇接受X线照射:医院记录与回忆符合率73% 流产史:前10年发生的,完整回忆率为82%;20年以前则为
举例:用动脉血压计测量某人血压(实际值为 80MMHG),各次读数的均值为100MMHG
系统误差
测
量
频
次
随机误差
80
100
系统误差与随机误差间的关系
舒张压(mmHg)
一 两类误差特点
随机误差特点:
没有固定方向和固定大小,一般呈正态分布 难以避免 可以用统计学方法控制、分析、估计
系统误差特点:
入院率偏倚的控制
尽量从一般人群中获取样本 多个医院 解决办法: 1.选取社区病人,或选择两个或两个以上的对照组,一个来自于社
区,一个对照组来自于医院不同科室的病人2.病例的选择尽量不要在同一所医院,尽量在不同等级的医院中随 机抽样,样本的代表性好些。
时间效应偏倚
定义:许多疾病尤其是一些慢性病从接触暴露因素到发病需要很长时间, 在这段时间内实际上这些人是有暴露史的,但是没有出现临床症状、 体征或者未能应用现有的技术检测出来,而被错误的划入健康组或对 照组,由此而产生的系统误差称为时间效应偏倚。(常导致研究结果 被低估)
控制:尽量选用最敏感、先进的检测技术或开展队列研究。
75*60%+[(75-75*60%)*40%]
75*25%+(75-
一文解析临床研究中的偏倚及控制方法
一文解析临床研究中的偏倚及控制方法在临床科研过程中,我们都致力于一点,就是让分析所得的关联性(association)尽量接近病因性(causation)。
除了应用统计学方法以外,非常重要的就是从根本上分析造成偏倚(bias)的原因并控制误差和偏倚。
正如LinkLab前文所提及的,我们需要重点分析和排除的误差包括:随机误差和系统误差(bias),以及发现和解释效应修正(effect modification)。
其中随机误差是随机分布且不可预测的,因此除了增加样本量或重复测量取均值外别无他法。
但对于系统误差和效应修正却可以得到控制或解释,帮助理解所得结论。
系统误差包括:混淆偏倚(confounding)、选择偏倚(selection bias)和信息偏倚(information bias)。
其中,信息偏倚(information bias)是指在研究的实施阶段中从研究对象获取研究所需的信息时产生的系统误差,其原因是由于诊断疾病、测量暴露或结局的方法有问题,导致被比较各组间收集的信息有差异而引入的误差。
本文将不对其进行描述。
阅读此文前强烈建议您阅读LinkLab 2015年11月6日《流行病学也好玩(四):一种方法教会你理清科研思路》,之后就能轻松理解清楚误差和偏倚,以及有效的解决方法。
混淆偏倚(confounding)E:暴露变量(exposure);Y:结果变量(outcome);C:混淆因素在研究暴露与疾病的联系时,C作为混淆因素(confounder)必须满足:1)与exposure相关联;2)与outcome相关联且不是因为exposure;3)不在E和Y的因果链上。
但并不是满足这三个条件就是混淆因素。
由于混杂变量的存在,造成了观察到的联系强度偏离了实际情况,则称为混杂偏倚。
小测试:假设A=exposure,Y=outcome,哪些图的L不是混淆因素呢?答案就是最后一个图。
混淆因素严重干扰我们对于risk的估计,所以必须想办法控制这些variable。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
病例对照研究,高度关联——虚假关联 无症状的子宫内膜癌早期病人如服用雌激素易发生子宫出血而频繁就医, 由此被更能被及早发现并选入病例组,而未服用雌激素者,没有或很少 有子宫出血症状,减少了就诊机会,相比不易被发现诊断,从而使得病 例组的暴露比例增高,得出服用雌激素和子宫内膜癌间有统计学关联的 结果。
业人群的健康水平普遍较一般人群高,或对职业暴露的耐受性高,因而表现 出对某些疾病的易感性低,研究结果可能低估职业暴露与疾病之间的关联。
选择偏倚的控制
✓ 主要应通过科学的研究设计和认真的实施,避免其发生。因为存在选择性 偏倚的资料一般情况下很难给予纠正,因需要掌握研究总体有关情况(总人 群的比值比ORT)或样本选择概率(������ ������ ������ ������)。
1、入院率偏倚(Admission rate bias、Berkson’s bias)
✓ 定义:以医院住院、就诊的病人为研究对象时,由于不同疾病在不 同医院的入院率(就诊率或住院率)不同导致的系统误差。
✓ 医院:技术专长、服务质量 ✓ 病人:疾病严重程度、经济状况、地理位置
✓ 举例:社会阶层(暴露)与颈椎病的病例对照研究 假定人群中患颈椎病和冠心病各6000人,并且两类人群中属
成高估或低估效应值。
信息偏倚的控制
✓ 1、严格信息标准 制定明细的资料收集方法和采取严格的质量控制方法——仪器、设备校正
准确、试剂符合要求;统一调查用表,调查人员要予以培训,统一标准和 认识。 ✓ 2、盲法收集信息
实验性、观察性研究中均可采取盲法,使研究对象或研究者或数据分析人 员不知晓分组或暴露或结局情况,避免诊断怀疑偏倚、暴露怀疑偏倚、报告 偏倚。 ✓ 3、采用客观指标
于上等社会阶层的均各占20%(暴露率)。 表 1 人群中社会阶层与颈椎病的研究
社会阶层
病例组(颈椎病) 对照组(冠心病)合计
上等阶层 非上等阶层 合计
1200 4800 6000
1200 4800 6000
2400 9600 12000
OR=1200×4800/1200×4800=1 ������������=1,p>0.05
若该值为0,无偏倚; 若该值 > 0,正偏倚(高估); 若该值 < 0,负偏倚(低估)。
偏倚的分类
选择偏倚(Selection bias) 信息偏倚(Observational bias or Information bias) 混杂偏倚(Confounding bias)
选择偏倚(Selection bias)
采取与对照组不可比的方法探寻认为与某病或某结局有关的因素,如多次认 真询问病例组某因素的暴露史,而不认真询问对照组,由此产生的系统误差。 对两组研究对象采取不同的调查方式,结果会出现很大差异。
✓ 病例对照研究、回顾性队列研究
✓ 4、诊断怀疑偏倚(diagnostic expose bias) 定义:由于研究者(来源)事先了解研究对象研究因素的暴露情况,主观
上倾向于应该或不应该出现某种结局,作诊断分析时会作出有倾向性的判断, 由此而导致的系统误差。 ✓ 也可以来源于研究对象——事先知晓分组或其暴露情况
✓ 临床试验、前瞻性队列研究,特别是诊断亚临床病例、判断药物的不良反 应…
信息偏倚的分类
✓ 5、测量偏倚(detection bias) 定义:研究者对研究所需数据进行测量时所产生的系统误差。
✓ 1.掌握发生环节 研究者对整个研究中可能出现的各种选择性偏倚应有充分的了解、掌握。
✓ 2.严格选择标准 严格掌握研究对象纳入与排除的标准。
✓ 3.研究对象的合作 在研究中采取相应措施,尽量取得尽可能高的应答率。
如无应答者比例较高(>10%),应对无应答者进行抽样调查,以判断无应 答对研究结果有无影响。 ✓ 采用多种对照
Chapter 8 biases and their control
第八章 偏倚及其控制
四川大学华西公共卫生学院流行病与卫生统计学系
提纲
研究的真实性 研究的误差 选择偏倚 信息偏倚 混杂偏倚
一、研究的真实性
研究的真实性 真实性(效度,validity)
定义 指研究收集的数据、分析结果和所得结论与客观实际的符合程度。 内部真实性(internal validity):研究结果与实际研究对象真实情况的符合 程度,回答研究是否有效、真实的问题。 外部真实性(external validity):样本研究结果与推论总体研究对象真实 情况的符合程度,即普遍性(generalizability),回答研究的外推性问题。
4、无应答偏倚(Non-response bias)
✓ 定义:某个样本中的无应答者的患病状况及对某些研究因素的暴露情 况与应答者不同,由此产生的系统误差称为无应答偏倚。
✓ 应答率;队列研究中的失访(loss to follow up)率
✓ 产生无应答的主要原因: 1、调查对象不了解研究调查内容,对调查内容不感兴趣 2、调查对象不能正确理解调查内容(文化低、高龄等); 3、调查对象的身体状况如病重、外出; 4、调查问卷设计过于繁琐,涉及隐私; 5、调查方式、方法 …
致的系统误差。 1、缩小信息:保护调查对象声誉隐瞒不良暴露史——青少年吸烟史 2、夸大信息:职业危害(为获取福利) 3、夸大/缩小信息:治疗性临床试验研究对象知晓分组或治疗目的(盲法
使用不当)
信息偏倚的分类
✓ 3、暴露怀疑偏倚(expose suspicion bias) 定义:研究者(来源)事先了解研究对象的患病情况或结局,可能会对其
以医院为基础的病例对照研究,在多个医院选择对照、设立多病种对照、 同时选择医院和社区来源的对照
信息偏倚(观察偏倚,Observational bias)
✓ 定义:指在研究的实施阶段(观察、收集资料及测量时)从研究对象获取 研究所需的息时所产生的系统误差。在各类流行病学研究中均可发生。
✓ 可来自研究对象、研究者、也可来自测量的仪器、设备、方法等。 其表现是使研究对象的某特征被错误分类。 有差异错误分类(differential misclassification) 无差异错误分类(non-differential misclassification)
系统误差(systematic error)又称为偏倚(bias) 定义:研究所获的结果系统地偏离真实值的情况。 来自研究对象的选取、资料测量和分析阶段的方法学缺陷,有固定方法 和大小的一种误差。
三、偏倚(bias)的测量
✓ 偏倚的测量 通常以相对数表示 设OR’:实际样本测量值;OR:真实值 偏倚=(OR’-OR)/OR
露情况 2、现患病例为存活病例,与死亡病例相比,可能既往暴露程度较低
✓ 举例:男性血清胆固醇水平和冠心病 队列研究发现高胆固醇血症与冠心病的RR为2.4。而病例对照研究中, RR为1.16。(队列研究的血清胆固醇来自第一次基线资料,病例 对照研究的胆固醇,是第六次测量时现患病例与对照的资料) 原因:病例对照研究中的现患病例已改变了他们高胆固醇的饮食习 惯、戒烟、多进行体育锻炼。
✓ 来源:研究调查人员分析、测试条件、技术水平、调查方式、熟练程度不 一致;仪器、设备校正不准确、试剂、程序不符合要求…
信息偏倚的结果
✓ 无差异错误分类 定义:暴露或疾病的错误分类同研究分组无关,各比较组间不存在差异;
在多数情况下模糊了研究组的差异,使OR偏低。
✓ 有差异错误分类 定义:暴露或疾病的错误分类同研究分组有关,各比较组间存在差异;造
3、检出症候偏倚(Detection signal bias)
✓ 检出偏倚:指某因素与某疾病无关联,但由于该因素的存在而引起某些 症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群 该病的检出率较一般人群高,以致得出该因素与该疾病有关联的错误结 论。
✓ 慢性疾病如肿瘤、动脉硬化、结石等进行病因研究时要特别注意
4、患冠心病不属上等阶层:共4800人 正常入院:4800×60%=2880 实际入院人数: 2880 表 3 社会阶层与颈椎病的病例对照研究(2)
社会阶层 上等阶层 非上等阶层 合计
病例组(颈椎病) 对照组(冠心病) 合计
660
912
1572
1200
2880
4080
1860
3792
5652
OR=660×2880/912×1200=1.73(P<0.001) 说明由于研究对象的入院率的不同,使原本无关的因素和疾病间出现统 计学关联。
2、现患病例-新发病例偏倚(Neyman bias)
✓ 定义:指以现患病例为对象进行研究与以新发病例为对象进行研究 时相比,因研究对象的特征差异所导致的系统误差。
✓ 现况研究;病例对照研究,若以现患病例进行研究与队列研究、实 验性研究得到的病例及研究结果不同
✓ 现患病例 vs 新发病例、死亡病例、疾病轻型、不典型病例 1、现患病例可能对既往危险因素回忆不清或改变了危险因素的暴
信息偏倚的分类
✓ 1、回忆偏倚(recall bias) 定义:研究对象(来源)在回忆以往研究因素的暴露情况等信息时,由于
准确性或完整性上的差异导致的系统误差。以回顾性的病例对照研究中最为 常见。
原因:调查事件发生事件已久;调查事件发生频率低,未留下深刻印象…
✓ 2、报告偏倚(report bias) 定义:研究信息收集时,研究对象(来源)有意夸大或缩小某些信息而导
举例:社会阶层与颈椎病的病例对照研究
疾病的入院率不同:假定颈椎病者入院率为25%,冠心病者入院率为60%, 上等阶层因接受保健检查(暴露者)的入院率为40%。则实际入院人数为:
1、患颈椎病并属上等阶层:共1200人, 正常入院:1200×25%=300人
接受保健检查入院:900×40%=360人 实际入院人数:300+360=660人