简32008级临床医学等偏倚和病因2010
临床研究中常见偏倚及其控制
临床研究中常见偏倚及其控制临床研究中常见偏倚及其控制1.引言在临床研究中,偏倚(bias)是一个非常重要的概念。
它指的是在研究过程中可能导致研究结果与真实情况不一致的因素。
控制偏倚是确保研究结果的可靠性和有效性的关键步骤。
本文将介绍临床研究中常见的偏倚类型及其控制方法。
2.偏倚类型2.1 选择偏倚(Selection bias)选择偏倚是指参与研究的样本群体与目标总体不完全一致,从而导致研究结果的错误。
控制选择偏倚的方法包括:- 随机抽样:通过随机选择样本,减少选择偏倚的可能性。
- 匹配:在研究设计阶段根据特定标准选取对照组样本,使其与受试组样本在某些特征上匹配,减少选择偏倚的影响。
- 敏感性分析:通过分析不同样本选择策略下的研究结果,评估选择偏倚的影响程度。
2.2 测量偏倚(Measurement bias)测量偏倚是指在对研究对象进行测量时,存在的误差或倾向性,导致测量结果与实际情况存在偏差。
控制测量偏倚的方法包括: - 标准化测量工具:使用标准化的测量工具或问卷,确保测量结果的准确性和可比性。
- 培训和校准:对参与测量的研究人员进行培训和校准,提高测量的一致性和准确性。
- 双盲设计:在实验研究中,采用双盲设计,使研究人员和受试者在不知道实际处理情况的情况下进行评估,减少主观判断的干扰。
2.3 回忆偏倚(Recall bias)回忆偏倚是指在调查研究中,受试者对过去事件的回忆存在偏差,导致研究结果的失真。
控制回忆偏倚的方法包括: - 限定回溯时期:对受试者进行限定回溯时期,减少过远过近的回忆,提高回忆的准确性。
- 不透露假设:在调查过程中,不透露研究者的假设和研究目的,减少受试者对回忆的主观干扰。
- 避免听证:避免向受试者介绍其他受试者的回忆情况,以免互相影响。
3.控制偏倚的方法3.1 随机化随机化是控制偏倚的重要手段,它可以通过评估和平衡干扰因素的分布,减少干扰因素对研究结果的影响。
在临床研究中,常用的随机化方法有简单随机化、分层随机化、区组随机化等。
临床流行病学--偏倚
实例: 实例: 表1
9
临床流行病学
表2 过敏及代谢性疾病与疲劳综合症的关系 曾住院6 过敏及 一般人群 曾住院6个月以上者 代谢性 疲劳综合症 疲劳综合症 疾病 病例 对照 计 病例 对照 计 13 136 149 有 1 21 22 无 127 2508 2635 27 208 235 小计 140 2644 2784 28 229 257 OR=1.89 OR=0.37
4
临床流行病学
机遇对研究结果的影响具体表现在假 阳性和假阴性错误上。 阳性和假阴性错误上。 假阳性错误在统计学上又称Ⅰ类错误, 假阳性错误在统计学上又称Ⅰ类错误, 即α水平 水平 假阴性错误在统计学上又称Ⅱ类错误, 假阴性错误在统计学上又称Ⅱ类错误, 即β水平 水平 可信范围和可信区间是表明机遇所致的 围绕真实值的随机变动范围
9、错误归类或错分偏倚 对每种疾病或暴露的诊断或测定都存在 有一定的灵敏度和特异度, 有一定的灵敏度和特异度,均不可能达到 100%,因此会产生假阳性和假阴性, 100%,因此会产生假阳性和假阴性,从而发 生错分。 生错分。 均衡性错分( 均衡性错分(即病例组和对照组受到同等程度 的错分)产生偏倚较小, 的错分)产生偏倚较小,在多数情况下模糊 了研究组的差异,结果趋近于无效假设。 了研究组的差异,结果趋近于无效假设。 非均衡性错分可使结果发生正偏倚或负偏倚。 非均衡性错分可使结果发生正偏倚或负偏倚。 可使结果发生正偏倚或负偏倚
14
临床流行病学
实例之二: 实例之二:分别采用病例对照研究和队列研究 的方法观察冠心病与高胆固醇血症之间的关 系。 结果:病例对照研究中OR=1.16 结果:病例对照研究中OR=1.16 队列研究中RR=2.4 队列研究中RR=2.4 原因:病例对照研究的对象主要是现患病例, 原因:病例对照研究的对象主要是现患病例, 他们已改变了高胆固醇饮食习惯, 他们已改变了高胆固醇饮食习惯,因此病例 组中暴露比例明显下降,接近于对照组。 组中暴露比例明显下降,接近于对照组。
临床研究中常见偏倚及其控制
暴露怀疑偏倚往往会夸大研究因素与研究结果间的联系,造成正偏。
如研究某因素与一种疾病的关系时,研究者从主观上认为两者有联系并希望出现阳性结果,在收集基本情况或随访信息时,会在下意识中充分挖掘病例组的暴露信息而忽略对照组的暴露信息。
4.测量偏倚(measurement bias)
临床研究中常见偏倚 及其控制
单击添加副标题
单击此处添加文本具体内容,简明扼要地阐述你的观点
提纲
概述
选择偏倚及其控制
信息偏倚及其控制
混杂偏倚及其控制
/CONTENTS
一、概述
误差(error) 定义: 指对事物某一特征的度量值偏离真实值的部分,即测量值与真实值之差 分类: 随机误差(random error) 系统误差(systematic error),即偏倚(bias)
调查手段要简便易行,对调查内容中的敏感问题采取适当的处理技巧。
尽量在一般人群中选择研究对象 能够代表源人群
PART ONE
2.在应用具体研究方法是控制选择偏倚的主要针对性措施
在横断面调查时,采用随机抽样,并保证一定的样本含量,以增强样本的代表性,必要时可采用分层随机抽样的方法,尽量提高应答率。 在病例对照研究中,最好用人群中全部新发病或新发病的随机样本;对照应能代表产生病例的人群。若难以做到,则在多个医院选择病例,同时选择医院与社区对照,并尽可能选用新病例,不用死亡病例和老弱对象。
二、选择偏倚及其控制
选择偏倚概念
选择偏倚产生环节与原因
常见选择偏倚
选择偏倚的控制
(一)选择偏倚概念
选择偏倚:是指所选择的研究对象(样本)与所研究的目标人群之间在某些特征方面存在的系统误差。 本质:是研究对象缺乏代表性。常见于病例对照研究、临床试验和横断面调查。
临床科研中常见偏倚及防止方法
第九章临床科研中常见偏倚及其控制方法第一节真实性、偏倚与机遇的概念一、真实性指一项观察或研究所推论观点的正确性及可靠程度,即所得结果反映研究对象的真实情况。
临床医学研究的目的是从样本人群,通过观察或研究,努力取得研究变量同结果变量间的真实联系,并将此真实联系推广到样本人群及其所属目标人群(或参照人群)范围内。
流行病学上将能正确反映样本人群及目标人群真实状况的研究结果的外延性称作内部真实性,若将该项研究成果推广到目标人群以外的其他人群仍然得到同样的结果,表明该项研究成果不但具有内部真实性,而且同时具有外部真实性。
一项没有内部真实的研究结果,不可能具有外部真实性,但有内部真实性的研究成果,不一定具有外部真实性。
样本偏倚是临床科研中特别值得注意的问题,许多临床研究是在三级医院中进行的,而三级医院是重病集中的场所,容易将疾病描绘得严重一些,在三级医院中所获得的研究结论有时并不适用于一般人群。
例如急性心肌梗死病死率,三级医院的资料常低于一般社会人群,原因是心肌梗死死亡的病人50%是发生在未送医院之前。
样本偏倚与后面要讲的选择性偏倚不同,样本偏倚仅涉及将医院里的研究结论推广到群体时产生,而不涉及内部真实性,而选择性偏倚涉及内部真实性,因此,临床工作者必须注意树立群体观点。
(见图9-1)(图9-1内部真实性与外部真实性二、偏倚指研究所得资料的推论偏离真值。
或者说,自样本人群所得变量与结果变量的联系,不能反映目标人群的暴露变量与结果变量的真实联系。
在临床科研中,偏倚是在研究对象各组间某变量有否差异的过程中产生的一种系统误差。
例如,甲治疗组的疗效优于乙治疗组;急性心肌梗死范围大的患者其预后比梗死范围小的患者要差;CT诊断脑瘤的符合率比放射性核素扫描为高等。
临床研究中所获得之各组变量间的差异,有时并非代表真实情况,这种现象就是偏倚(对真实情况的偏离)。
必须指出,与基础科学研究相比较,临床科研特别容易产生偏倚,因为临床科研的对象是人,不可能象动物那样做到组间基本情况均相等,而且病人还有心理变化,拒绝试验或中途退出试验等影响科研结果正确性的情况。
一文解析临床研究中的偏倚及控制方法
一文解析临床研究中的偏倚及控制方法在临床科研过程中,我们都致力于一点,就是让分析所得的关联性(association)尽量接近病因性(causation)。
除了应用统计学方法以外,非常重要的就是从根本上分析造成偏倚(bias)的原因并控制误差和偏倚。
正如LinkLab前文所提及的,我们需要重点分析和排除的误差包括:随机误差和系统误差(bias),以及发现和解释效应修正(effect modification)。
其中随机误差是随机分布且不可预测的,因此除了增加样本量或重复测量取均值外别无他法。
但对于系统误差和效应修正却可以得到控制或解释,帮助理解所得结论。
系统误差包括:混淆偏倚(confounding)、选择偏倚(selection bias)和信息偏倚(information bias)。
其中,信息偏倚(information bias)是指在研究的实施阶段中从研究对象获取研究所需的信息时产生的系统误差,其原因是由于诊断疾病、测量暴露或结局的方法有问题,导致被比较各组间收集的信息有差异而引入的误差。
本文将不对其进行描述。
阅读此文前强烈建议您阅读LinkLab 2015年11月6日《流行病学也好玩(四):一种方法教会你理清科研思路》,之后就能轻松理解清楚误差和偏倚,以及有效的解决方法。
混淆偏倚(confounding)E:暴露变量(exposure);Y:结果变量(outcome);C:混淆因素在研究暴露与疾病的联系时,C作为混淆因素(confounder)必须满足:1)与exposure相关联;2)与outcome相关联且不是因为exposure;3)不在E和Y的因果链上。
但并不是满足这三个条件就是混淆因素。
由于混杂变量的存在,造成了观察到的联系强度偏离了实际情况,则称为混杂偏倚。
小测试:假设A=exposure,Y=outcome,哪些图的L不是混淆因素呢?答案就是最后一个图。
混淆因素严重干扰我们对于risk的估计,所以必须想办法控制这些variable。
临床研究中的偏倚及控制讲解
无应答偏倚(NONRESPONDENT BIAS)
无应答者:调查研究中那些因各种原因不回答或不能回答所提出问题 的人、不依研究设计接受治疗者。
当无应答者和应答者在某些特征上不同,当一项调查中无应答者占一 定比例时,就可以使研究的结果产生偏倚。
主要发生于现况调查 当无应答率较高时,如大于15%,从应答人群中得出的有关研究因素与疾
队列研究:高胆固醇者患冠心病OR值=2.4(有统计学意义) 病例对照研究:高胆固醇者患冠心病OR值=1.16(无统计学意义)
原因:
冠心病存活者改变生活习惯(戒烟、体育锻炼、注意饮食) 冠心病存活者本身的胆固醇水平就低于死亡者
控制:
在病例对照研究和现况研究的病例选择时,尽量选择新发病例
例:
病例对照研究发现:服用雌激素与子宫内膜癌发病有正关联。 原因:雌激素促进子宫内膜生长,导致出血,频繁接
受检查,促使早期发现子宫内膜癌患者。 控制方法:对观察对象进入研究的条件加以限制,使得病例
组和对照组间主要的非研究因素特征保持一致。(都是晚 期病例,年龄等因素齐同)
排除偏倚
定义:在进行研究 对象的选择时,按照研究设计要求,那些 对研究因素(干预措施)禁忌者、无法跟踪调查者、拒绝 参加者、等不符合研究标准的研究对象不能纳入研究计划。 如果研究者没有按照对等的原则或标准从实验组和对照组 中排除某些研究对象,导致研究因素与研究疾病之间的联 系被错误估计称为排除偏倚。
高 脂 肪 膳 低脂肪
食
膳食
心肌梗死
60
40
对照
32
68
OR= (60╳68)/(40╳32)=3.2
图 4 无差异性错误分类和差异性错误分类的示例
信息偏倚的控制
医学科研中常见的偏倚类型及控制方法ppt课件
45
设计阶段的控制
随机分配(randomized allocation):主要适用 实验研究,即将研究对象随机分配到试验组 和对照组
随机分配的目的:使研究对象的非处理因素 和混杂因素在各组间趋于均衡,组间基线情 况有良好的可比性,而使得处理因素的真实 差别得以显示
27
在研究口服避孕药与下肢血栓性静脉炎关系的队列研 究中,观察者会对口服避孕药的妇女更加频繁、仔细 的收寻静脉炎的证据,尤其是对病情较轻,需要仔细 检查才能确诊的病例。而对未口服避孕药的妇女检查 较马虎,造成暴露与疾病结果的偏倚
在开放性的药物临床试验中,也容易发生诊断怀疑偏 倚
28
来自研究者的偏倚之沾染偏倚
21
来自研究对象的偏倚之无应答偏倚
无应答偏倚:研究对象拒绝回答或因研究对象 失访而缺失答案所造成的偏倚
是否有无应答偏倚取决于无应答者在疾病暴露 因素方面的特征是否与应答者有差异
22
美国曾采用邮寄问卷形式,调查美国退伍军人 吸烟习惯。30天后总结收集的回复,结果发现, 不 吸 烟 者 有 85% 回 复 了 问 卷 , 而 吸 烟 者 仅 67%
对于一些敏感问题的调查,容易引起不应答偏 倚,例如我国南方调查农村婴儿死亡原因,有 28%的人拒绝提供婴儿死亡原因
23ห้องสมุดไป่ตู้
来自研究对象的偏倚之回忆偏倚
回忆偏倚:因研究对象的记忆失真或记忆不完 整所造成的研究结果偏倚
病例对照研究和回顾性队列研究最容易出现回 忆偏倚
回忆偏倚的产生与调查时间至事件发生时间、 以及与事件的重要性有关,同时也与调查员的 调查过程和询问技术有关
临床科研中常见的偏倚和常用的防止方法
2. BerKson’s Bias
因入院率不同导致的偏倚
防止方法:采用人群对照 A 为肺癌患者 B为冠心病患者
例如 :
入院率 住院病人中 A病总数:
A病在人群中共6000例
其中20%吸烟
B病在人群中共6000例
其中20%吸烟
A病有吸烟者
6000×20%=1200例
B病有吸烟者
6000×20%=1200例
结论:两组在生长发育上并无差异
五、分层(Stratification)
分分析阶段。
如何杰金病预后和初诊时纵隔肿块大小有关。经 过根治性淋巴结放疗进入缓解期,但复发率不同。
肿块大者:74%,肿块小者:27%,无者:19%。
五、分层(Stratification)
400 24
6
800 32
4
1200 8 0.67
2400 64 2.6
六、标准化(Standardization)
比较两个率,如两组对象内部构成不同,可用 率标准化加以校正
甲乙医院所用的权相等
甲医院标准率=(1/3×0.06)+(1/3×0.04)+(1/3×0.0067) =0.036
乙医院标准率=(1/3×0.06)+(1/3×0.04)+(1/3×0.0067) =0.036
理论上:两组进行比较,除研究因素外, 其他因素两组应相同
事实上不可能 可采用限制法,其缺点是结论的局限性。
如: 研究年龄对急性心梗预后的影响,可限 于白人男性无并发症,前壁心梗中进行 研究。
四、配对(Matching)
配对常可消除可能存在的混杂偏倚
经常配对的因素为年龄,性别和种族,其他因 素也可配对,如研究预后,病期、严重度、先 前治疗也可配对
临床科研中常见偏倚及其预防 ppt课件
PPT课件
31
பைடு நூலகம்
回忆偏倚
发生于病因与危险因素的病例对照研究 中,询问的发病因素与结果或研究时间 隔时间较长;
如家族史、用药史等。
PPT课件
32
归类错误偏倚
每项诊断试验的灵敏度和特异度不可能达到 100%,就会产生假阳性和假阴性,即误诊和 漏诊-在研究中将病人分入对照组,而将非病 人分入病例组。
结果:该饮食与急性肝炎发生无关。
许多慢性病,自接触有效暴露到出现临床症状,其 间经过漫长过程。在此期间,他们实际是有暴露史 但未出现症状,也未能用现有手段发现异常的病人。 这类病人常被归入健康对照内。在遗传病中同样(疾 病发生的外显年龄)。
研究结果的过低估计。
PPT课件
27
领先时间偏倚
研究肿瘤等慢性病,自症状出现,临床处 理,平均存活12月;
第三因子在在目标人群中同所研究的结果变量存在 固有联系,如也为一危险因子。
第三因子同所研究的暴露因素存在固有联系,如吸 烟与饮酒
PPT课件
35
产生混杂的条件
第三因子在在目标人群中同所研究的结果变 量存在固有联系,如也为一危险因子;
第三因子同所研究的暴露因素存在固有联系, 如吸烟与饮酒;
否定或排除条件:若第三因子为暴露与疾病 因果联系中的一中间环节,那么该第三因子 不可能为一混杂因子。
假阴性:如实际两种治疗一种比另一种好,但由于抽 样研究中机遇的影响,两者疗效十分相近而作出假阴 性的错误判断;统计上称二类错误,用β表示。
PPT课件
8
可信区间
直接估计机遇在临床研究中的作用大小; 表明机遇所致的围绕真实值变动的范围,
通常用95%或99%可信区间表示; 变动范围越窄,真实值越稳定。
简3级临床医学等偏倚和病因-PPT精品文档77页
本来X对A和B是无效应的(OR=1), 现在入院率不同,夸大了 X对A的效应(负偏倚)
例2: 不同来源研究对象估计药物与疾病联系的OR值比较
药物
临床疾病
研究对象 社区人群OR 医院患者OR P值
水杨酸类药 轻泻药 安眠药 心脏类药材
过敏 运动骨骼类疾病 循环系统疾病 循环系统疾病
1.15 1.53 6.38 30.65
(在非暴露组中,混杂因素与疾病之间效应的RR
不等1,说明F与D有联系)
RR Ⅰ ≠1 EF D
(在非病例组中,混杂因素与暴露因素之间的效
应RR不等1,说明F与E有联系)
(4 ) 多元模型分析
3 混杂偏倚的方向大小测量
混杂偏倚(RRθ) = CRR-aRR/aRR(F)
RR(θ) = 1, 即为零效应 ▲ RR(θ) >1, 为危险效应
0.18 5.07 3.27 19.17
0.02 0.02 0.32 0.47
引自:ROBERTS RS,1978
可见社区人群研究的结果与 医院人群研究所得结果会相 距甚远
(二)信息偏倚(Information bias)
定义:
在测量或采取资料时获得不正确(准确)信息或产生 的系统误差
类型: 诊断怀疑偏倚(diagnostic suspicion bias) 暴露怀疑偏倚 (exposure suspicion bias) 回忆偏倚 (recall bias) 报告偏倚 (reporting bias) 测量偏倚 (measurement bias) 错误分类偏倚 (misclassification bias)
附图2 直接因果关联的歪曲
E(静脉吸毒—共用注射器)
F(性乱—多个性伴侣)
偏倚控制及病因推断
偏倚控制及病因推断一、流行病学研究的偏倚1.偏倚的概念和分类2.偏倚的控制方法为了解5年内城市人口高血压的患病情况,随机抽取城市人口的15%进行调查,为防止调查产生偏倚,下列措施不正确的都是A.对于那些检查血压时不肯合作的人应以较合作的人代替B.对5年内死亡的调查人群的成员应追踪其死亡是否与高血压有关C.应当使用统一的血压计D.应反复多次对调查人群观察、测量E.对5年期间调查人群中搬出该城市的那部分人应尽量查明新地址继续测量他们的血压变化情况『正确答案』A二、病因及其推断1.病因环境的因素(生物、理化、社会等环境);宿主因素(宿主的核心是遗传,宿主的年龄、性别、性格、适应能力都与疾病的发生有关)。
2.病因的类型直接病因与间接病因、必要病因与充分病因(和组分病因)、危险因素。
3.病因研究的基本方法有实验医学、临床医学和流行病学。
应用流行病学方法研究病因,可分为四个阶段:总结现象,建立假设,检验假设和病因推导。
因素与疾病关联的形式有:虚假的关联,间接的关联,因果联系。
4.因果关系的判断标准①关联的强度;②关联的重复性;③关联的合理性;④关联的时间性;⑤研究设计的因果论证强度。
诊断试验和筛检试验一、诊断试验和筛检试验概念、目的、应用原则及区别(1)筛检:运用快速、简便的检验、检查或其他措施,在健康的人群中。
发现那些表面健康,但可能有病或有缺陷的人。
筛检所用的各种手段和方法称为筛检试验(查瘤标CEA、AFP)。
(2)筛检的目的:①早期发现可疑患者,做到早诊断、早治疗,提高治愈率。
实现疾病的二级预防。
②发现高危人群,以便实施相应的干预,降低人群的发病率,实现疾病的第一级预防。
③识别疾病的早期阶段;④合理分配卫生资源。
(3)筛检的应用原则筛检试验必须要快速、简便、经济、可靠、安全、有效及易为群众接受。
怎么考?提问:1.直肠癌筛查首选?2.乳腺癌筛查首选?诊断与诊断试验的概念、目的与应用原则诊断病理+CT+实验室检查等做出诊断诊断的目的做出及时、正确的判断,采取对应治疗诊断试验和筛检试验的区别为加强妇女保健工作,某大型企业组织全体女职工进行健康检查,采用快速的医学检查方法,从表面健康的女职工中查出乳腺癌和宫颈癌的可疑患者,再进一步确诊后给予早期治疗,这种疾病防治策略属于A.早期特异预防B.疾病的筛检C.高危人群的健康体检D.重点疾病的抽样调查E.一般健康促进『正确答案』B二、诊断试验和筛检试验的评价方法和评价指标1.评价的方法及步骤①确定“金标准”(目前被公认的最可靠、最权威的、可以反映有病或无病实际情况的诊断方法称为金标准);②选择研究对象;③确定样本含量;④盲法同步测试;⑤整理分析资料;⑥质量控制。
临床分析如何识别和纠正检验结果的偏倚
临床分析如何识别和纠正检验结果的偏倚在医疗诊断中,检验结果起着至关重要的作用。
然而,我们常常会面临检验结果的偏倚问题。
这些偏倚可能源于检验方法的局限性,样本的处理与分析过程中的误差,甚至操作人员的主观判断等原因。
因此,临床分析师需要具备一定的技巧和知识,以便识别和纠正这些偏倚,从而提高诊断的准确性和可靠性。
一、检验结果偏倚的类型1. 分析偏倚:包括系统误差和偶然误差。
系统误差是指在长期的检验过程中,检验方法存在的固有缺陷,导致结果偏离真实值的程度相对稳定。
例如,测定特定物质时常常受到干扰物的影响,造成结果的偏倚。
而偶然误差则是由于个别实验操作中的不确定性因素,导致结果的波动。
2. 样本采集与处理的偏倚:包括标本质量、操作人员技术水平、采集和保存条件等方面。
例如,当病人样本保存不当或者采样过程中出现污染时,就会影响结果的准确性。
3. 数据分析偏倚:主要涉及统计方法及数据处理过程中的误差。
例如,数据的选择、排除和加权等都可能影响分析结果的准确性。
二、识别和纠正偏倚的方法1. 标准化:在临床分析中,标准化是识别和纠正偏倚的关键。
标准化的主要思想是建立准确的参考值范围,并使用内部和外部参照物进行校准。
内部参照物是指通过同一样本分别测定多次,计算其平均值和变异程度来建立的参照范围。
而外部参照物则是通过与国际或国内标准样品进行比对,以确保结果的准确性。
2. 质量控制:质量控制是将标准品与待检样本一同测定,用于持续监测检验方法和仪器的准确性和稳定性。
通过比对标准品的结果和实验室内部和外部质控数据,及时发现和纠正偏倚。
3. 样本采集和处理的标准化:在样本采集和处理过程中,严格按照标准化操作要求进行。
包括采集样本的时间、部位、方法等,以及标本的保存、运输和处理。
4. 数据分析的严谨性:在数据分析过程中,注意选择合适的统计方法,并对数据进行充分的验证。
不仅要关注结果的显著性和可靠性,还要注意结果的稳定性和可重复性。
第四章 临床研究常见的偏倚 及控制方法
18
三、偏倚的分类(Meittinen 1976) 1. 选择性偏倚(selection bias)
-主要产生于设计阶段;
2. 测量偏倚(information bias)
-主要产生于实施阶段;
3. 混杂偏倚(confounding bias)
-主要产生于设计、资料分析阶段。
临床 研究 结论
内部真实性 可否推论 外部真实性
靶人群 以外的 人群
9
例:美国一项高血压病治疗效果的临床试验研究。
研究对象:143例30~73岁退伍军人。 平均舒张压115~129mmHg, 均无高血压并发症。
研究设计:随机分组,双盲观察分析,依从性好。 研究中采取了各种措施防止偏倚发生。
研究结果:试验组采用双氢克尿噻和利血平联合 用药,明显降低心、脑、肾等并发症。 试验组与对照组组差异显著。
88暴露怀疑偏倚暴露怀疑偏倚exposuresuspicionbiasexposuresuspicionbias88暴露怀疑偏倚暴露怀疑偏倚exposuresuspicionbiasexposuresuspicionbias当观察者认为某病与某因素有关联当观察者认为某病与某因素有关联当观察者认为某病与某因素有关联当观察者认为某病与某因素有关联对可能有因素暴露的病例组及未暴露的对可能有因素暴露的病例组及未暴露的对可能有因素暴露的病例组及未暴露的对可能有因素暴露的病例组及未暴露的对照组搜索可疑致病因素时主观采用对照组搜索可疑致病因素时主观采用对照组搜索可疑致病因素时主观采用对照组搜索可疑致病因素时主观采用不同的深度和广度的调查和观测方法而不同的深度和广度的调查和观测方法而不同的深度和广度的调查和观测方法而不同的深度和广度的调查和观测方法而不同的深度和广度的调查和观测方法而不同的深度和广度的调查和观测方法而不同的深度和广度的调查和观测方法而不同的深度和广度的调查和观测方法而5959导致的误差
流行病学研究中常见的偏倚及其控制
两种结果
无差异性错误分类(均衡性) 暴露或疾病的错误分类同研究分组无关,各比 较组间不存在差异;在多数情况下模糊了研究 组的差异,使OR偏低
差异性错误分类(非均衡性) 暴露或疾病的错误分类同研究分组有关,各比 较组间存在差异;造成高估或低估效应值
37
无差异性错误分类
研究真实数据 高脂肪 膳食 60 40 低脂肪 膳食 40 60 错误分类数据 高脂肪膳 食 48 32 低脂肪 膳食 52 68
14
假设上述病例组和对照组按照肝硬化入院率30%、支气管炎入 院率60%,乙肝入院率为40%的比例到医院就医。
肝硬化合并乙肝的入院人数=200*0.3+(200-200*0.3)*0.4=116 肝硬化不合并乙肝的人员人数=800*0.3=240 支气管炎合并乙肝的入院人数=200*0.6+(200-200*0.6)*0.4=152 支气管炎不合并乙肝的入院人数=800*0.6=480
41
第四节 混杂偏倚
混杂因素 与研究的因素和研究的疾病均有关,若在比较的 人群组中分布不均可以掩盖或夸大因素与疾病之间 真正关联的因素。
混杂偏倚 在流行病学研究中,由于一个或多个混杂因素的 存在,掩盖或夸大了研究因素与疾病(事件)的真 实联系。 42
混杂因素必须满足的条件:
必须与所研究的疾病有关; 必须与所研究的因素有关; 必须不是研究因素与研究疾病因果链上的中间环节
混杂偏倚与前两种偏倚的区别。
43
混杂偏倚 假关联 继发关联 直接因果关联的歪曲
E C ? D
(1)继发关联
E F ? D 图5 混杂偏倚引起假关联 F
E ? D
44
(2)直接因果关联的歪曲 (3)直接因果关联的歪曲
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在流行病学研究中,数据和指标的变动(波动) 称为变异或误差
生物误差(真实的客观变化)和测量变异(测量过
程的误差)
▲ 误差来源
随机误差(由抽样时而造成的样本与总体的差异,其
特点是没有固定方向和大小的误差)
系统误差(由方法、仪器等造成的测量值系统偏离了
真实值,其特点是有固定方向和大小)
例:如何产生抽样差?
样本C,高胆固醇率=0% 219,164,190,188,233
相对总体高胆固醇率=25%(>240mg/dl)
从25个变量的相对总体中抽取3组数据,每组 为5个,得到3个样本的不同阳性率
(1) 总体高胆固醇阳性率=25%,从总体中抽取 3个样本,得到3个不同P,即 PA=40%,PB=20%,PC=0%
现患病例—新发病历偏倚 (prevalence incidence bias)
无应答偏倚 (non—respondent bias)
易感性偏倚 (susceptibility bias)
时间效应偏倚 (time effect bias) 领先时间偏倚 (lead time bias)
P71--73
举例:
入院偏倚(admission rate bias)
☆ 产生原因: 1 如研究病因,病例与对照选择了不同对象
2 疾病与非疾病在治疗方面的疗效、离医院 距离、病情程度、入院率不同
3 暴露因子本身作用的独立性,导致了不同 的入院率
例1
研究A 病与因素X的关系,以B 病作对照。假定在某人 群中A、B两病均为1000人,两组病人暴露于X者各为 200人三者入院率又相对独立
(二)研究中的偏倚(bias)
★ 偏倚定义:
使测量系统地偏离了真实值的原因(系统误差)
偏倚的方向:பைடு நூலகம்
正方向:使原来的真实值被夸大了 负方向:使原来的真实值被缩小了
RR(θ) = 1, 即为零效应 RR(θ) >1, 为危险效应 RR(θ) <1, 为保护效应
二 常见偏倚及其种类:
☆ 选择偏倚、信息偏倚、混杂偏倚
(一) 选择偏倚(selection bias)
☆ 定义:由于研究对象的确定、诊断、选择方法不正确,使被入
选的研究对象与目标人群的重要特征具有系统的差异,
使得样本推论总体出现了系统的偏离。
主要种类:入院率偏倚 (admission rate bias)
检出症侯偏倚 (detection signal bias)
结论:
本来X对A和B是无效应的(OR=1), 现在入院率不同,夸大了 X对A的效应(负偏倚)
例2: 不同来源研究对象估计药物与疾病联系的OR值比较
药物
临床疾病
研究对象 社区人群OR 医院患者OR P值
水杨酸类药 轻泻药 安眠药 心脏类药材
过敏 运动骨骼类疾病 循环系统疾病 循环系统疾病
1.15 1.53 6.38 30.65
(2) 说明抽样的个体不同造成了抽样误差
1 流行病研究的精确性
▲ 精确性概念 测量中的随机误差大小
衡量的办法 方差 标准差、标准误
提高精确度的办法
增加样本含量 研究的个体均匀 提高设计水平
2 流行病学研究的真实性
★ 真实性(validity)
——指收集的数据、分析结果和所得结论 与客观实际 的符合程度,它是科学研究的核心追求。
附表2 取自医院病例样本中A、B两病 及C因素关系的人数分布
病种 A病 B病
有X因素 128 176
无X因素 320 640
总人数 448 816
合计
304
^
960
1264
OR=(128 × 640)/(320× 176)=1.454
提示: 说明本来X因素与A病无关联(OR=1), 而以医院病例作为样本所得结果, 提示X为A病的危险因素,为B病的 保护因素
0.18 5.07 3.27 19.17
0.02 0.02 0.32 0.47
引自:ROBERTS RS,1978
可见社区人群研究的结果与 医院人群研究所得结果会相 距甚远
(二)信息偏倚(Information bias)
定义:
在测量或采取资料时获得不正确(准确)信息或产生 的系统误差
类型: 诊断怀疑偏倚(diagnostic suspicion bias)
相对总体
180,174,215,305 233,276,146,195 205,188,190,295 170,164,248,162 220,219,228,250
样本A,高胆固醇率=40% 305,276,195,215,170 样本B,高胆固醇率=20% 295,146,220,162,228
附表:人群A、B两病及X因素的人群分布
病种
有X因素
无X因素
总人数
A病
200
800
1000
B病
200
800
1000
解:
A病具有x因素同B病等同
OR=(200×800)/(200 × 800)=1 A、B、X三者间并无关联,OR=1
现假设A、B病入院率不同,分别为40%、80%,且具有 X因素者的入院率40%,根据上述不同入院率计 算住院病人: A病有X因素人数:
200 × 40%+200 ×(100-40%) × 40%=128
因A病入选
A病由于X因入选
B病有X因素人数:
200× 80%+200 ×(100-80%) × 40%=176
因B病入选
B病由于X因入选
A病入选而无X因素人数:
800 × 40%=320
B病入选而无X因素人数:
800 × 80%=640
暴露怀疑偏倚 (exposure suspicion bias) 回忆偏倚 (recall bias) 报告偏倚 (reporting bias) 测量偏倚 (measurement bias) 错误分类偏倚 (misclassification bias)
☆(1 )内部真实性(internal validity) 1 概念:即研究结果与实际研究对象真实情况的 符合程度
2 控制:限制研究对象的类型和环境条件 ☆(2) 外部真实性(external validity)
1 概念:即研究结果与推论对象真实情况的符合程度 2 控制:增加研究对象的异质性,代表性范围扩大
第二讲
第四章
偏倚的控制与病因推断
公共卫生学院 黄河浪
2010 PPT
A会不会导致D ? 从A到D究竟有多远 ? 能够用A来解释D吗 ?
A
D
例
打 靶 为
····
即准确又精确
··· 精确但不准确
·
· 即不准确又不精确
·
第一节 流行病学研究的偏倚
一 偏倚(bias)的概念
(一)流行病学研究的精确性与真实性