九章常见偏倚及其控制

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
✓差异性错误分类 暴露或疾病的错误分类同研究分组有关, 各比较组间存在差异;造成高估或低估 效应值
43
研究真实数据
无差异性错误分类
错误分类数据
高 脂 肪 低脂肪
膳食
膳食
心肌梗死
60
40
对照
40
60
O R = (60╳ 60)/(40╳ 40)=2.3
高 脂 肪 膳 低脂肪

膳食
心肌梗死
48
52
对照
41
(四)暴露怀疑偏倚:研究者事先知道研 究对象的患病情况,而采用不可比的方 法在病例组和对照组中探索可疑的致病 因素导致的偏倚。
(五)测量偏倚:指对研究所需指标或数 据进行测量时产生的偏倚。
42
两种结果
✓无差异性错误分类 暴露或疾病的错误分类同研究分组无关, 各比较组间不存在差异;在多数情况下 模糊了研究组的差异,使OR偏低
34
4.随机选择研究对象;多个医院选择研究 对象;同时选择医院和社区的对象。
5.选择新发病例作为对象。 6.采取严格科学的研究设计。
35
二、 信息偏倚
指在研究的实施阶段从研究对象获取 研究所需的信息时所产生的偏倚。
可来自研究对象、研究者、也可来自 测量的仪器、设备、方法等。
其表现是使研究对象的某特征被错误 分类。
随机误差
系统误差
来源 大小和方向 减少和控制
测量工具、个体内及 个体间的无规律变异
测量工具、个体内及 个体间的无规律变异, 及不合理的抽样、测 量、分析、结果解释 等
不可预测,但可用统 计学方法检验和量化
对结果的方向和大小 大多可预测,但不可 用统计学方法检验和 量化
可通过改善研究设计、 根据误差来源及对结
又称为观察偏倚或错分偏倚。
36
一、信息偏倚的种类
(一)回忆偏倚:指研究对象在回忆以往发生的事 情或经历时,由于在准确性和完整性上的差异所 致的偏倚。
小儿白血病---母亲怀孕时接受x线的回忆
死于白血病的小儿的母亲增加了暴露于x线 的回忆。
病例
医院
对照
社区
认真回忆暴露史
暴露经历易遗忘或不重视
37
类风湿关节炎的家族史
增大样本量减少
果影响的规律采取针
对性的措施以避免和
控制
8
第二节 研究的真实性
定义 内部真实性 外部真实性
9
一、定义
真实性(效度): 指研究收集的数据、分析结果和所得结论
与客观实际的符合程度。
10
二、内部真实性
内部真实性(internal validity) 定义 研究结果与实际研究对象真实
情况的符合程度,它回答一个研究本身是否 真实或有效。
32
68
O R = (48╳ 68)/(52╳ 32)=2.0
研究真实数据
差异性错误分类
错误分类数据
高 脂 肪 低脂肪
膳食
膳食
心肌梗死
60
40
对照
40
60
O R = (60╳ 60)/(40╳ 40)=2.3
高 脂 肪 膳 低脂肪
39
(三)诊断怀疑偏倚:研究者事先已经知道 研究对象的暴露史,怀疑他们已经患某种 疾病,于是在对暴露者和未暴露者作诊断 或分析时,采取了不可比的做法,从而导 致偏倚。 多见于临床试验、队列研究,特别是 在诊断亚临床病例、判断药物的不良反应 时最易产生。
40
• 研究口服降糖灵治疗2型糖尿病是否导致 心血管病死亡率升高 降糖灵组:死亡者均尸体解剖,寻找心 血管病的死因。 其他组:(对照组、胰岛素组) 难得解剖
控制方法 选取具体环节或已选取人群的具体特征 分析研究对象的选取是否同暴露或处理因素有关
16
(二)、选择偏倚的种类 (1)入院率偏倚(Berkson’s bias)
指利用医院门诊或住院病人作为研究 对象时,由于入院率的不同而导致的偏倚。
17
社会阶层与颈椎病 假定某人群中有6000人患颈椎病, 6000人患冠心病,并且在患这两种疾病 的人中各有20%的人属于上等社会阶层。 这两种疾病的病人社会阶层情况: 1.患冠心病并属上等阶层:1200人 2.患颈椎病并属上等阶层:1200人 3.患冠心病不属上等阶层:4800人 2.患颈椎病不属上等阶层:4800人
纳入健康对照组。 在遗传病中:未到外显年龄的观察
对象被分入健康对照组。 可产生负偏倚。
33
二、选择性偏倚的控制: 主要应通过科学的研究设计和认真的实施,避免
其发生。因为存在选择性偏倚的资料一般情况下很 难给予纠正。 1.研究者对整个研究中可能出现的各种选择性偏倚应 有充分的了解、掌握。 2.严格掌握研究对象纳入与排除的标准。 3.在研究中采取相应措施,尽量取得尽可能高的应答 率。 如无应答者比例较高(>10%),应对无应答者进行 抽样调查,以判断无应答对研究结果有无影响。
关节炎史
双亲均无 双亲之一有 双亲均有
对照(%)
55 37 8
类风湿关节炎患者 类风湿关节炎患者的同胞
(%)
(%)
27
50
58
42
15
8
类风湿关节炎患者 比其同胞、对照更能提供阳性家族史 38
(二)报告偏倚:研究对象有意夸大或缩 小某些信息而导致的偏倚。 如隐瞒与隐私有关的暴露史 保护调查对象声誉隐瞒不良暴露史 夸大职业暴露
23
以医院中心肌梗死病人为病例进行病 例对照研究,得到结论:大量饮用咖啡与 心肌梗死无关。
而队列研究表明:大量饮用咖啡者心 肌梗死发病危险性是对照的2倍。
原因: Neyman bias ➢50%的心肌梗死患者入院前死亡。调查对
象只是心肌梗死后的幸存者; ➢死亡者多是大量饮用咖啡者且时间较长; ➢入院的未死亡病例只是一般的饮用者;
第九章 流行病学的常见偏倚及控制
重点: 掌握选择偏倚、信息偏倚和混杂偏倚概念; 掌握各种偏倚产生原因及控制措施;
1
本章内容 第一节 误差与研究的真实性 第二节 研究的真实性 第三节 偏倚
2
第一节 误差
一、随机误差 二、系统误差 三、随机误差与系统误差的区别
3
一、随机误差 定义:由于多种无法控制及不能预测的
的代表性范围扩大。
12
第三节 研究的偏倚
选择偏倚 信息偏倚 混杂偏倚
13
一、选择偏倚(selection bias) (一) 定义
研究对象的选取过程中,由于选取方式不当, 导致入选对象与未入选对象之间存在系统差异, 由此造成的偏倚称为选择偏倚。例如研究对象 采用志愿者,方便样本,或者研究对象的无应 答或失访等。
14
描述性研究的选择偏倚
主要体现在样本对总体的代表性上 如不是采用随机抽样而是使用方便样本,或某些特定群
体(志愿者、因特网利用者等)造成的外部效度(外推) 受限问题。 控制方法 尽量采用随机抽样,避免样本选取的偏向 对特定群体的结果在外推上要谨慎等
15
分析性研究的选择偏倚
主要体现 研究对象进入、排除、不参与或失访等与研 究暴露或处理因素存在关联,由此增大或减少暴露与疾 病、处理与效应的关联,导致效应估计的偏倚。
结果:雌激素服用率高于对照组。
27
Feinstein从同一医院中随机选取妇 科其他良性肿瘤患者为对照进行研究:口 服雌激素与子宫内膜癌无关联。
28
(4)无应答偏倚: 某个样本中的无应答者的患病状况,以及对
某一或某些研究因素的暴露情况与应答者不同, 由此产生的偏倚称为无应答偏倚。
安阳县食管癌普查,普查率仅20%左右, 不能代表总体。 造成无应答的主要原因:
31
(6)志愿者偏倚 志愿者与非志愿者在关心健康、注
意饮食卫生及营养食疗、戒烟戒酒、体 育锻炼等方面有系统差别。如选择志愿 者为对象,而非志愿者常落选,可能会 产生偏倚。
例如:观察体育锻炼预防冠心病的 效果 实验组为志愿者,非志愿者为对照组。
32
(7)时间效应偏倚 潜隐期的病人(特别是慢性病)被
或可控制的因素引起的使研究结果或推 论系统地偏离真实情况的的误差。在研 究设计、资料的收集、分析、解释或发 表过程中,都有可能发生系统误差,导 致结论系统地与真实值不同。
系统误差又叫偏倚。
6
系统误差来自于对象选取、测量和 统计分析等的方法学缺陷,有固定方向 和固定大小的误差 。
7
三、随机误差和系统误 差的区别
18
社会地位 病例组(颈椎病) 对照组(冠心病) 合计
上等阶层
1200
1200
2400
非上等阶层 4800
4800
9600
合计
6000
6000
12000
OR=1200×4800/1200×4800=1 χ2=1 , P>0.05
19
又假定患冠心病者入院率为60%,颈椎病 为25%,上等阶层者因接受保健检查的 入院率为40%。那么实际入院人数为:
30
(5)排除偏倚:在研究对象的确定过程中, 没有按照对等的原则或标准,而自观察组或 对照组中排除某些研究对象,这样导致该因 素与疾病之间的错误估计,称为排除偏倚。
利血平与乳腺癌关系: 病例组含有高血压患者(部分服利血平), 对照组排除高血压患者。 高血压患者增加了病例组利血平的暴露率,
可能会导致偏倚。
24
此外,现患病例有时会主动改变其对危 险因素的暴露,导致对危险因素与疾病关 系的低估。
队列研究发现高胆固醇血症与冠心病的 RR为2.4。而病例对照研究中,RR为1.16。
原因:病例对照研究中的现患病例已改 变了他们高胆固醇的饮食习惯。
25
(3)检出偏倚:指某因素与某疾病无关联, 但由于该因素的存在而引起某些症状或 体征的出现,从而使患者及早就医,接 受多种检查,导致该人群该病的检出率 较高,以致得出该因素与该疾病有关联 的错误结论。
因素引起的一类表现不恒定、随机变化的 误差叫随机误差。又叫机会。来源包括: 1、测量方法或测量工具本身产生随机变 异; 2、个体内的随机生物学变异; 3、个体间的随机变异。
4
随机误差 可用统计学方法来估计,增大样本含
量可减少,没有固定方向和固定大小, 一般呈正态分布。
5
二、系统误差 定义:是指研究过程中,由一些已知
研究对象不了解研究目的;调查内容不当, 过于繁琐,涉及隐私;对象不能正理解调查内容 (文化低、高龄等);对象病重、外出。
29
失访偏倚:是一种无应答,主要发生在前 瞻性队列研究和实验研究中。
(1)随访过程中因种种原因拒绝继续留在 观察组中。
(2)观察对象在出现预期的结果之前死于 其他疾病或事故。 如果暴露组与对照组观察对象均有 500人,随访过程中均失访100人,其结 果是否可靠???
雌激素与子宫内膜癌
1975年,Ziel和Finkle:口服雌激素 是子宫内膜癌危险因素(高度联系,方 法病例对照研究)
26
1978年,Horwitz和Feinstein:口服 雌激素与子宫内膜癌的高度关联是虚假的, 是一种检出偏倚。 (1)人群中有一定量无症状的子宫内膜癌 早期病人。 (2)无症状的子宫内膜癌早期病人如服用 雌激素易发生子宫出血而就诊,由此被发 现而选入病例组。 (3)对照组为一般住院病人。
接受保健检查入院:900×40%=360人 实际入院人数:300+360=660人
4.患颈椎病不属上等阶层:共4800人 正常入院:4800×25%=1200 实际入院人数:1200
21
颈椎病与社会地位的关系:
社 会 地 位 病 例 组 ( 颈 椎 病 )对 照 组 ( 冠 心 病 ) 合 计
上 等 阶 层 6 6 0
9 1 2
1 5 7 2
非 上 等 阶 层 1 2 0 0
2 8 8 0
4 0 8 0
合 计
1 8 6 0
3 7 9 2
5 6 5 2
OR=660×2880/912×1200=1.73(P<0.001)
22
(2)现患病例-新病例偏倚(Neyman bias) 病例对照研究中如选择现患病例作病例,
他们是过去一段时间新发病例的幸存着, 如果幸存者所反映的暴露情况比新发病例 高或低,则会导致此种偏倚的出现。 如性别与结肠癌关系的研究:发病率男性稍 高于女性,但生存期女性明显高于男性。 现患病例的样本比新发病例样本女病人比 例较大。
1.患冠心病并属上等阶层:共1200人, 正常入院:1200×60%=720人
接受保健检查入院:480×40%=192人 实际入院人数:720+192=912人
2.患冠心病不属上等阶层:共4800人 正常入院:4800×60%=2880 实际入院人数: 2880
20
3.患颈椎病并属上等阶层:共1200人, 正常入院:1200×25%=300人
改善措施 限制研究对象的类型和研究的环境条
件。
11
ห้องสมุดไป่ตู้
三、外部真实性
外部真实性(external validity) 定义 研究结果与推论对象真实情况的
符合程度,又称为普遍性(generalizability)。 它回答一个研究能否推广应用到研究对象以外 的人群。
改善措施 增加研究对象的异质性,使得研究对象
相关文档
最新文档