(精品)流行病课件:偏倚及其控制
合集下载
偏倚及其控制PPT课件
第七章 偏倚及其控制
兰州医学院公共卫生学院 流行病学与统计学教研室
白亚娜 教授
.
1
概述 误差
随机误差:随机抽样所得均值与总体参数的差异。 系统误差:误差向量的方向一致或基本一致时的误差。
偏倚
随机误差以外的误差,即系统误差。样本人群测得的变 量值系统地偏离了目标人群中该变量值的真实值,使在 研究结果或推论结果时与真实情况间出现偏差的一类系 统误差。
.
20
结论:从此例可以看出,在分析饮酒与肺癌 的关系时,由于受到吸烟这个混杂作用的影 响,使得饮酒与肺癌的联系被夸大,把饮酒 与肺癌无关歪曲成有关。因此,吸烟为研究 饮酒与肺癌关系的正混杂因子, 被夸大的作用 称为正混杂作用。
.
21
混杂的控制
设计阶段控制混杂的方法有: 限制 配比 随机化
分析阶段控制混杂的方法 分层分析 多元分析
.
6
选择偏倚的控制
严格掌握研究对象的入选与排除标准 设立均衡可比的对照 随机化分组
.
7
信息偏倚 (information bias )观察偏倚 (observation bias)测量偏倚(measurement bias)
发生在资料收集阶段,对比较组所采用的观察或测量方 法不一致。
回忆偏倚(recall bias) 被研究者对过去的暴露史或既往 史记忆失真或回忆不完整。
偏倚。
2. 若cRR≠aRR(f)则f有混杂作用,cRR存在f的混杂
偏倚。
3. cRR>aRR(f)为正混杂,亦称阳性混杂,即由于f的 混杂作用,使cRR高估了研究因素与研究疾病之间的联 系。
4. 若cRR<aRR(f)为负混杂,亦称阴性混杂,即由于f 的混杂作用,使cRR低估了因素与研究疾病之间的联系。
兰州医学院公共卫生学院 流行病学与统计学教研室
白亚娜 教授
.
1
概述 误差
随机误差:随机抽样所得均值与总体参数的差异。 系统误差:误差向量的方向一致或基本一致时的误差。
偏倚
随机误差以外的误差,即系统误差。样本人群测得的变 量值系统地偏离了目标人群中该变量值的真实值,使在 研究结果或推论结果时与真实情况间出现偏差的一类系 统误差。
.
20
结论:从此例可以看出,在分析饮酒与肺癌 的关系时,由于受到吸烟这个混杂作用的影 响,使得饮酒与肺癌的联系被夸大,把饮酒 与肺癌无关歪曲成有关。因此,吸烟为研究 饮酒与肺癌关系的正混杂因子, 被夸大的作用 称为正混杂作用。
.
21
混杂的控制
设计阶段控制混杂的方法有: 限制 配比 随机化
分析阶段控制混杂的方法 分层分析 多元分析
.
6
选择偏倚的控制
严格掌握研究对象的入选与排除标准 设立均衡可比的对照 随机化分组
.
7
信息偏倚 (information bias )观察偏倚 (observation bias)测量偏倚(measurement bias)
发生在资料收集阶段,对比较组所采用的观察或测量方 法不一致。
回忆偏倚(recall bias) 被研究者对过去的暴露史或既往 史记忆失真或回忆不完整。
偏倚。
2. 若cRR≠aRR(f)则f有混杂作用,cRR存在f的混杂
偏倚。
3. cRR>aRR(f)为正混杂,亦称阳性混杂,即由于f的 混杂作用,使cRR高估了研究因素与研究疾病之间的联 系。
4. 若cRR<aRR(f)为负混杂,亦称阴性混杂,即由于f 的混杂作用,使cRR低估了因素与研究疾病之间的联系。
流行病学研究中偏倚及其控制.ppt
用住院病例进行研究可能没有包括:①抢救不及时 而死亡的病例;②距离医院远的病例;③无钱住院 的病例;④病情轻的病例。
若只选择住院病例进行研究则可产生虚假的OR值。 如在一般人群中和住院病人中研究骨和运动器官疾 病与呼吸道疾病之间的关系,由于研究对象的来源 不同,其研究结果的OR值不同(表7-1)。
2020/1/28
⑷检出(征候)偏倚(detection signal bias )亦称揭 露伪装偏倚( unmasking bias):某因素在病因学 上与某疾病本无关联,但可引起所研究疾病的症 状或体征,从而促使患者及早就诊,提高了早期 病例检出率,从而过高地估计了暴露程度,得出 因素与疾病关联的错误结论。
如妇女服用雌激素与子宫内膜癌关系的实例。
2020/1/28
主讲人 李志春
EPIDEMIOLOGY(BIAS)
2. 常见的信息偏倚:
⑴回忆偏倚(recall bias)
⑵诊断怀疑偏倚(diagnostic suspicion bias)
⑶暴露怀疑偏倚(exposure suspicion bias)
⑷报告偏倚(reporting bias)
2020/1/28
主讲人 李志春
EPIDEMIOLOGY(BIAS)
⑸ 易感性偏倚(susceptibility bias) 观察对象可能因各种主客观不同,暴露于
危险因素的概率不同,使得各比较组对所研究 疾病的易感性有差异,从而或缩小了暴露因素 与疾病的关联强度,导致某因素与某疾病间的 虚假联系,由此产生的偏倚称为易感性偏倚。 如健康工人效应(healthy worker effect)
2020/1/28
主讲人 李志春
EPIDEMIOLOGY(BIAS)
流行病学研究中的偏倚及其控制课件
02
03
描述性研究
收集并描述特定时间、地 点、人群中疾病的发生情 况。
分析性研究
通过对特定人群的调查和 分析,探讨疾病的影响因 素和预防措施的效果。
实验性研究
通过随机对照试验等方法 ,评估预防和治疗措施的 效果。
02
流行病学研究中的偏倚
选择偏倚
总结词
选择性偏倚是流行病学研究中常见的偏倚之一,它是指研究 样本的选择不具有代表性或可比性,导致研究结果存在偏差 。
02
流行病学研究通过收集和分析数 据,探讨疾病的发生率、流行趋 势、影响因素以及预防措施的效 果。
流行病学研究目的
描述疾病的分布和流 行趋势,确定高危人 群和重点防控对象。
评估预防措施的效果 ,为制定防控策略提 供科学依据。
探讨疾病的影响因素 ,为预防和控制疾病 提供理论依据。
流行病学研究类型
01
研究设计
采用回顾性或前瞻性的设计方法,对病例和对照进行调查和随访,收集 与疾病或健康问题相关的暴露因素和结局信息。
03
偏倚控制
选择合适的对照,确保与病例在关键特征上匹配;对暴露因素和结局信
息进行准确测量和记录,采用盲法减少偏倚;对数据进行严格的分析和
解释,确保结果的可靠性。
基于社区的队列研究
研究对象
对研究结果负责,尊重研究对象和社区。
研究设计中的伦理原则
1 2
科学性
研究设计应科学、合理,数据收集和分析应准确 、可靠。
伦理性
研究应符合伦理原则,不侵犯研究对象权益。
3
透明和可重复性
研究过程应透明,可被其他研究者重复验证。
05
流行病学研究案例分析
基于医院的病例对照研究
流行病学课件 8-偏倚及控制
火柴与肺癌
1000 1000
820
OR
180 340
8.8
(95%
CI
7.2,
10.9)
660
吸烟、火柴与肺癌
想分别了解一下吸烟者与不吸烟者 中火柴与肺癌的关系
结果发现在1000名病例中,900名 为吸烟者,其中810名曾携带火柴
在1000名对照中,300名为吸烟者, 其中270名曾携带火柴
群体
– 个体间遗传变异(genetic variability between individuals) – 环境变异(environmental variability) – 测量变异
• 抽样
– 抽样方法(manner of sampling) – 样本含量(size of sampling) – 测量方法
内部真实性和外部真实性
内部真实性(Internal validity) 从当前研究对象得到的结果能准确地反映目 标/参考/源人群的真实情况的程度
外部真实性/外推性(External validity/generalizability) 从当前研究对象得到的结果被外推至目标人 群以外的其他人的程度 内部真实性是外部真实性的先决条件
分层绘制2×2表,计算火柴与肺癌 的关联效应值
吸烟、火柴与肺癌
• OR粗 = 8.8 (7.2, 10.9) • OR吸烟者 = 1.0 (0.6, 1.5) • OR不吸烟者 = 1.0 (0.5, 2.0)
误差
(error)
变异(variation) 个体
– 个体变异(individual variation) – 测量变异(measurement variation)
32
与源人群进行比较,本研究选择的对照: ☼胰腺癌病人相同诊治医生的其他病人
偏倚及其控制PPT课件
.
6
.
7
第二节 偏 倚
一、偏倚的概念 二、偏倚的方向和分类 偏倚按其产生的原因可分为三大类:
选择偏倚
信息偏倚 混杂偏倚
.
8
一、偏倚的概念
偏倚是指在流行病学研究中样本人群 所测得的某变量值系统地偏离了目标人群 中该变量的真实值,使得研究结果或推论 的结果与真实情况之间出现偏差,这是由 于系统误差造成的。
在流行病学研究中,无论应用何种研究方法, 均必须考虑是否能得到正确的结果和结论。在研 究中应尽量保证研究结果与客观、真实情况一致。 但是,由于各种因素的影响,往往使测量结果与 事物的真实情况之间发生一定的差异,即出现误 差。由于误差的存在,影响了研究结果的真实性, 有时还可能导致错误的结论,所以我们必须认识、 估计和排除各种误差。偏倚是误差的一种。因此, 进行研究时研究者应进行科学严谨的设计,深入 了解,认识各类偏倚产生或出现的原因和条件, 在研究中尽量加以避免或控制,以保证结果的真
(1)抢救不及时而死亡的病例;
(2)距离医院远的病例;
(3)无钱住院的病例;
(4)病情轻的病例;
.
12
举例
在一般人群中和住院病人中研究骨和 运动器官疾病与呼吸道疾病之间的关系, 由于研究对象的来源不同,其研究结果的 OR值不同。
.
13
表7-1 不同人群骨和运动器官疾病与呼吸道疾病之间关系的OR值 呼吸道 一般人群骨和运动器官疾病 住院病人骨和运动器官疾病
实性。
.
1
第一节 误差
一、误差概念 二、误差的种类
.
2
一、误差的概念
误差是指对事物某一特征的测量值偏 离真实值的部分。因此,必须有“金标准” 或相对可靠的标准来测量真实值,才能度 量误差。
临床流行病学--偏倚ppt课件
精选课件
8
临床流行病学
实例:
表1 呼吸道疾病与骨关节疾病的关系
一般人群
曾住院6个月以上者
呼吸道 骨关节疾病
骨关节疾病
疾病 病例 对照 计 病例 对照 计
有 17 207 224
5 15 20
无 184 2376 2560 18 219 237
小计 201 2583 2784 23 234 257
OR=1.06
精选课件
6
临床流行病学
二、偏倚的主要类型
在研究设计、测量及分析过程中,根 据可以导致研究结果系统地偏离真实值 的因素不同,偏倚主要有三种类型:
1、选择偏倚(selection bias):主要发生在 设计阶段,研究对象的代表性较差。
2、信息偏倚(information bias):主要发生 在观察、测量的实施阶段,收集的信息 不准确;
5、易感性偏倚(健康工人效应)
一方面在职工人绝大多数是健康者, 而一般人群中包括了部分非健康者;另 一方面在岗工人往往对所存在的暴露因 素不敏感,其易感性与一般人群不同。
精选课件
20
6、无应答偏倚与失访偏倚
临床流行病学
7、结局竞争偏倚
如果某因素与多种结局(疾病) 有关,这些结局的平均潜伏期存在差 异,则结局出现竞争。先发生某病的 个体,因死亡而“失去”发生另一种 疾病的机会,使后一种疾病实际测量 的发病率低于应该的发病率,导致该 因素与后一种疾病的联系强度减弱。
精选课件
5
临床流行病学
(三)真实性(validity) 指一项观察或研究所作推论的正确
及可靠程度。 医学研究的目的是通过对样本人群
的观察和研究,取得研究变量同结果变 量之间的真实联系,并将此真实联系推 广到样本人群所属的目标人群范围内。
流行病学研究中的偏倚及其控制ppt课件
病例对照研究中如选择现患病例作病例, 他们是过去一段时间新发病例的幸存着, 如果幸存者所反映的暴露情况比新发病例 高或低,则会导致此种偏倚的出现。
如性别与结肠癌关系的研究:发病率男性稍 高于女性,但生存期女性明显高于男性。 现患病例的样本比新发病例样本女病人比 例较大。
以医院中心肌梗死病人为病例进行病 例对照研究,得到结论:大量饮用咖啡与 心肌梗死无关。
当θ>1时,若θ’>θ>1,则为远离无效值偏倚。
若θ>θ’>1,则为趋向无效值偏倚。
当θ<1时,若θ’<θ<1,则为远离无效值偏倚。
若θ<θ’<1,则为趋向无效值偏倚。
(三)无论θ>1或θ<1,若θ和θ’在1的两侧,则 为颠倒偏倚。
3.举例: (1)RR=1.5 RR’=2.0时,为远离无效值
正偏倚。
(五)测量偏倚:指对研究所需指标或数 据进行测量时产生的偏倚。
两种结果
✓无差异性错误分类
暴露或疾病的错误分类同研究分组无关, 各比较组间不存在差异;在多数情况下 模糊了研究组的差异,使OR偏低
✓差异性错误分类
暴露或疾病的错误分类同研究分组有关, 各比较组பைடு நூலகம்存在差异;造成高估或低估 效应值
研究真实数据
队列研究发现高胆固醇血症与冠心病的 RR为2.4。而病例对照研究中,RR为1.16。
原因:病例对照研究中的现患病例已改 变了他们高胆固醇的饮食习惯。
(三)检出偏倚:指某因素与某疾病无关 联,但由于该因素的存在而引起某些症 状或体征的出现,从而使患者及早就医, 接受多种检查,导致该人群该病的检出 率较高,以致得出该因素与该疾病有关 联的错误结论。
OR=1200×4800/1200×4800=1 χ2=1 , P>0.05
如性别与结肠癌关系的研究:发病率男性稍 高于女性,但生存期女性明显高于男性。 现患病例的样本比新发病例样本女病人比 例较大。
以医院中心肌梗死病人为病例进行病 例对照研究,得到结论:大量饮用咖啡与 心肌梗死无关。
当θ>1时,若θ’>θ>1,则为远离无效值偏倚。
若θ>θ’>1,则为趋向无效值偏倚。
当θ<1时,若θ’<θ<1,则为远离无效值偏倚。
若θ<θ’<1,则为趋向无效值偏倚。
(三)无论θ>1或θ<1,若θ和θ’在1的两侧,则 为颠倒偏倚。
3.举例: (1)RR=1.5 RR’=2.0时,为远离无效值
正偏倚。
(五)测量偏倚:指对研究所需指标或数 据进行测量时产生的偏倚。
两种结果
✓无差异性错误分类
暴露或疾病的错误分类同研究分组无关, 各比较组间不存在差异;在多数情况下 模糊了研究组的差异,使OR偏低
✓差异性错误分类
暴露或疾病的错误分类同研究分组有关, 各比较组பைடு நூலகம்存在差异;造成高估或低估 效应值
研究真实数据
队列研究发现高胆固醇血症与冠心病的 RR为2.4。而病例对照研究中,RR为1.16。
原因:病例对照研究中的现患病例已改 变了他们高胆固醇的饮食习惯。
(三)检出偏倚:指某因素与某疾病无关 联,但由于该因素的存在而引起某些症 状或体征的出现,从而使患者及早就医, 接受多种检查,导致该人群该病的检出 率较高,以致得出该因素与该疾病有关 联的错误结论。
OR=1200×4800/1200×4800=1 χ2=1 , P>0.05
流行病学研究中的常见偏倚及其控制 ppt课件
ppt课件
16
4. 志愿者偏倚(volunteer
bias)
一般情况下,志愿者与非志愿者在关心 健康、注意饮食习惯、禁烟、禁酒及体 育锻炼等方面可能存在系统的差别,因 而,志愿者被入选为观察对象,而非志 愿者落选,这样的研究结果往往有选择 偏倚。例如,一项以体育锻炼预防冠心 病的研究,干预组都是志愿者,而将非 志愿者作对照,以比较该项措施的效果, 这样就可能会得出不正确的结论。
存在明显的差异。
ppt课件
12
3.检出征候群偏倚(detection signal bias)
检出征候群偏倚是指某因素与某疾病在 病因学上虽无关系,但由于该因素的存 在会引起该病的临床症状或体征的出现, 从而使患者及早就医,接受多种检查, 导致该人群有较高的检出率,致使过高 地估计该因素与该疾病的关联。
ppt课件
13
例如,1975年,Ziel等以病例对照 研究,从美国加州洛杉矶妇女中调查口 服雌激素与子宫内膜癌的关系,结果表 明子宫内膜癌患者雌激素暴露比例明显 高于对照组,认为子宫内膜癌与服用雌 激素密切相关。
ppt课件
14
表6-4 更年期服用雌激素与子宫内膜癌的关系
雌激素服 用史 有 无 合计 OR
病例
暴露
A
非暴露
B
非病例
C
D
总人群比数比: OR AD
BC
表6-6 实际抽样人群疾病与暴露分布
暴露
非暴露
病例
Ao
Bo
非病例
Co
样本比数比:
OR
Ao Do Bo Co
ppt课件
Do
26
选择概率为:
Ao
A
Bo
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
reliability, reproducibility, repeatability, precision
真实性(Validity)
概念
研究收集的数据、分析结果和所得结论与客观实际的 符合程度。也称“有效性”、“效度”。如果研究结果与 客观实际存在不符合的地方,就是研究误差(反面)。
影响真实性的因素(误差来源)
改善措施
限制研究对象类型 限定研究的环境条件 限定干预措施
外部真实性(external validity)
研究结果与推论对象真实情况的符合程度,又称普遍性 (generalizability),回答一个研究能否推广应用到研 究对象以外的人群。
改善措施
增加研究对象的异质性
Other populations
样本A
高胆固醇率
305,195, 276,215,170 = 40%
样本B 295,146,220,162,228 = 20%
样本C 219,164,190,188,233 = 0%
源群体与样本 高胆固醇率的样本变异性示例
研究 A(研究对象 200 人,随机分配到两组) 膳食改良组
降胆固醇药物组
9% 6%
?external validity
+
exposure
-
disease
+-
?internal validity
Reference/target/sou rce population
Study sample
内部真实性与外部真实性的联系
推论代表性不好,内部真实性可能好,而外部真实性差。 增加研究对象的同质性(如限制类型如年龄、职业、体质 特征或疾病分型等),可改善内部真实性。 增加研究对象的异质性,可改善外部真实性。 在实际研究需综合考虑研究对象的同质性和异质性问题。
又称“疑诊偏倚” (4) 暴露怀疑偏倚(exposure suspicion bias) (5) 测量偏倚(detection bias) (6) 诱导偏倚(inducement bias)
回忆偏倚(recall bias)
是指研究对象在回忆以往发生的事情或经历时,由 于在准确性或完整性上的不同而产生的系统误差。在 病例对照研究中尤为常见,其产生与许多原因有关。
数据分析阶段
✓ 可以对无应答或中途退出者与应答或完成随访者作 一些基线变量比较。
✓ 也可以根据先前的知识来估计可能存在的偏倚及其 方向,并进行灵敏度分析。
✓ 还可以利用一些附加的方法学研究来量化预期存在 的偏倚,如用不同对象入院率来估计伯克森偏倚等。
第二节 信息偏倚(information bias)
变异的来源
个体生物学变异、测量误差 个体间遗传学变异、环境变异、
测量误差 抽样方式、样本大小、测量误差
源群体
180 ,174,215,305 233,276,146,195 205,188,190,295 170,164,248,162 220,219,228,250
高胆固醇率 = 25% (>240mg/dL)
0
5
10
15
五年内发生
心肌梗死风险(%)
研究 B(研究对象 2000 人,随机分配到两组)
膳食改良组
9%
降胆固醇药物组
6%
0
5
10
15
五年内发生
心肌梗死风险(%)
膳食与药物预防心机梗死的样本变异性示例
二、研究的真实性和可靠性
真实性/准确性/效度
validity, accuracy
可靠性/可重复性/精密度/信度
举例
在绝经期妇女开展了口服雌激素与子宫内膜癌关系的病例对照 研究,发现两者之间存在高度的关联,结论是口服雌激素是妇 女子宫内膜癌的危险因素。
绝经期 妇女
口服 雌激素
子宫 出血
医院 就诊
未口服 雌激素
子宫 出血
医院 就诊
病例
就诊 机会
对照
易感性偏倚(susceptibility bias )
研究对象暴露于某一可疑致病因素与否,与很多主、 客观因素有关。这些因素均可直接或间接地影响观察 人群或对照对所研究疾病的易感性,从而导致某因素 与某疾病间的虚假联系,由此而产生的偏倚被称为易 感性偏倚。
小儿白血病---母亲怀孕时接受x线的回忆
死于白血病的小儿的母亲增加了暴露于x线的回忆。
病例 医院
对照
社区
认真回忆暴露史 暴露经历易遗忘或不重视
类风湿关节炎的家族史
关节炎史 对照(%)
双亲均无
55
双亲之一有
37
双亲均有
8
类风湿关节炎患者 (%) 27 58
例:阿司匹林与心肌梗死关系的病例对照研究 –不应包括慢性关节炎患者 –也不应包括慢性胃溃疡患者
5、测量
方法:在理论上可以通过比较总人群与实际抽样人群研究 疾病与暴露因素的分布的两个四格表进行测量。
举例:以病例对照研究为例
总人群 OR AD BC
根据选择概率
样本人群 OR0 OR
选择偏倚的大小和方向可表示为:
可靠性(Reliability)
概念
反映研究结果中随机误差大小的程度,随机误差小则 研究可靠性高。也称“信度”、“精密度”。随机抽样误 差可以通过统计学方法估计,并且可以通过增大样本含量 减少。
系统误差、随机误差和样本大小的关系
误
随机误差
差
系统误差
样本大小
三、偏倚 (bias)
概念
在流行病学研究设计和实施中由于方法的局限 或错误所产生的系统误差使研究结果系统地偏 离真实值,以及解释结果的片面性,称为偏倚 (bias)。
又称观察偏倚、测量偏倚、衡量偏倚
1、定义 在收集资料的过程中,由于测量暴露或/和
结局的方法缺陷,致使获 得的信息产生系 统误差。
2、本质 通常表现为研究对象的某种特征被错误分类
(misclassification),也即使用的方法偏离了 金标准。在对疾病状态和暴露状态判断时都 有可能发生。
3、来源
假定三种疾病的入院率分别为: 皮肤癌=60% 骨折=25% 高血压=40%
则有: 皮肤癌 not 高血压=0.6×4800=2880 骨折 not 高血压=0.25×4800=1200 皮肤癌 with 高血压=0.6×1200+0.4×(1200-720)=912 骨折 with 高血压=0.25×1200+0.4×(1200-300)=660
职业流行病学研究-队列研究 健康工人效应(healthy worker effect) 志愿者偏倚
排除偏倚(exclusive bias )
在选择研究对象的过程中,没有按照既定的原则或标 准自观察组或对照组中排除某些不符合标准的研究对象 所导致的对某因素与某疾病之间联系的错误估计,称为 排除偏倚。
随机误差: 没有方向和大小、呈正态分布,来自随机
抽样和测量随机变异
系统误差 固定方向和大小、来自对象选取、测量和
统计学分析等方法学缺陷
真实性的两个方面
内部真实性 外部真实性
内部真实性(internal validity)
定义 研究结果与实际研究对象真实情况的符合程度,回答
一个研究本身是否真实或有效。
偏倚及其控制
Bias and Control
概述
一、研究结果的变异性(variability)
描述性和分析性数据(指标)的变动或波动。可存在于不 同的水平,包括个体水平、群体 水平和样本水平。
变异的来源
生物学变异 测量变异 随机变异 系统变异
变异的水平
变异性的水平 个体水平 群体水平 样本水平
① 检测方法不统一 ② 诊断标准不统一 ③ 观察条件不统一 ④ 询问方式不统一 ⑤ 研究对象引起,如记忆不准、态度的影响等 ⑥ 综合引起的偏倚,“诱、供、信”造成
4、种类
(1) 回忆偏倚(recall bias) (2) 报告偏倚(reporting bias) “说谎偏倚” (3) 诊断怀疑偏倚(diagnostic suspicion bias)
✓ 采用严格科学的研究设计。明确定义源人群和样本 人群,根据研究性质预测获取样本过程中可能产生 的各种选择偏倚,采取措施减少或控制 。
✓ 明确对象纳入标准、统一疾病诊断和监测程序。
资料收集阶段
✓ 加强随访、提高应答率。
✓ 在资料收集阶段尽可能多地收集有关暴露史的各种 信息,包括暴露程度、暴露时间、暴露改变以及改 变的原因等。
选择性偏倚的一种形式,是指利用医院就诊或住院病 人作为研究对象时,由于入院率的不同而导致的偏差。
当利用医院病人作为病例和对照时,由于对照是医院 的某一部分病人,而不是全部目标人群的一个随机样本, 又由于病例只是该医院或某些医院的特定病例(因为病 人对医院及医院对病人双方都有选择性),所以作为病 例组的病例也不是全体病人的随机样本。由此产生的病 例和对照就与人群中的研究对象存在着某些差异,难免 产生偏倚。
Neyman bias 检出症候偏倚(detection signal bias ) 易感性偏倚(susceptibility bias ) 排除偏倚(exclusive bias ) 无应答偏倚(non-respondent bias )
入院率偏倚(admission rate bias ) Berkson’s bias
3、来源
(1)任意挑拣样本结构(sampling frame),即所谓“典 型样本”。常见于现况研究和病例对照研究 (2)主观挑拣研究对象- “随便抽样”或“随意抽样” (3)失访或无应答(lost to follow-up or non-respondent) (4)入院率的影响
4、种类
入院率偏倚(admission rate bias ) Berkson’s bias 现患病例或新发病例偏倚(prevalence-incidence bias )
真实性(Validity)
概念
研究收集的数据、分析结果和所得结论与客观实际的 符合程度。也称“有效性”、“效度”。如果研究结果与 客观实际存在不符合的地方,就是研究误差(反面)。
影响真实性的因素(误差来源)
改善措施
限制研究对象类型 限定研究的环境条件 限定干预措施
外部真实性(external validity)
研究结果与推论对象真实情况的符合程度,又称普遍性 (generalizability),回答一个研究能否推广应用到研 究对象以外的人群。
改善措施
增加研究对象的异质性
Other populations
样本A
高胆固醇率
305,195, 276,215,170 = 40%
样本B 295,146,220,162,228 = 20%
样本C 219,164,190,188,233 = 0%
源群体与样本 高胆固醇率的样本变异性示例
研究 A(研究对象 200 人,随机分配到两组) 膳食改良组
降胆固醇药物组
9% 6%
?external validity
+
exposure
-
disease
+-
?internal validity
Reference/target/sou rce population
Study sample
内部真实性与外部真实性的联系
推论代表性不好,内部真实性可能好,而外部真实性差。 增加研究对象的同质性(如限制类型如年龄、职业、体质 特征或疾病分型等),可改善内部真实性。 增加研究对象的异质性,可改善外部真实性。 在实际研究需综合考虑研究对象的同质性和异质性问题。
又称“疑诊偏倚” (4) 暴露怀疑偏倚(exposure suspicion bias) (5) 测量偏倚(detection bias) (6) 诱导偏倚(inducement bias)
回忆偏倚(recall bias)
是指研究对象在回忆以往发生的事情或经历时,由 于在准确性或完整性上的不同而产生的系统误差。在 病例对照研究中尤为常见,其产生与许多原因有关。
数据分析阶段
✓ 可以对无应答或中途退出者与应答或完成随访者作 一些基线变量比较。
✓ 也可以根据先前的知识来估计可能存在的偏倚及其 方向,并进行灵敏度分析。
✓ 还可以利用一些附加的方法学研究来量化预期存在 的偏倚,如用不同对象入院率来估计伯克森偏倚等。
第二节 信息偏倚(information bias)
变异的来源
个体生物学变异、测量误差 个体间遗传学变异、环境变异、
测量误差 抽样方式、样本大小、测量误差
源群体
180 ,174,215,305 233,276,146,195 205,188,190,295 170,164,248,162 220,219,228,250
高胆固醇率 = 25% (>240mg/dL)
0
5
10
15
五年内发生
心肌梗死风险(%)
研究 B(研究对象 2000 人,随机分配到两组)
膳食改良组
9%
降胆固醇药物组
6%
0
5
10
15
五年内发生
心肌梗死风险(%)
膳食与药物预防心机梗死的样本变异性示例
二、研究的真实性和可靠性
真实性/准确性/效度
validity, accuracy
可靠性/可重复性/精密度/信度
举例
在绝经期妇女开展了口服雌激素与子宫内膜癌关系的病例对照 研究,发现两者之间存在高度的关联,结论是口服雌激素是妇 女子宫内膜癌的危险因素。
绝经期 妇女
口服 雌激素
子宫 出血
医院 就诊
未口服 雌激素
子宫 出血
医院 就诊
病例
就诊 机会
对照
易感性偏倚(susceptibility bias )
研究对象暴露于某一可疑致病因素与否,与很多主、 客观因素有关。这些因素均可直接或间接地影响观察 人群或对照对所研究疾病的易感性,从而导致某因素 与某疾病间的虚假联系,由此而产生的偏倚被称为易 感性偏倚。
小儿白血病---母亲怀孕时接受x线的回忆
死于白血病的小儿的母亲增加了暴露于x线的回忆。
病例 医院
对照
社区
认真回忆暴露史 暴露经历易遗忘或不重视
类风湿关节炎的家族史
关节炎史 对照(%)
双亲均无
55
双亲之一有
37
双亲均有
8
类风湿关节炎患者 (%) 27 58
例:阿司匹林与心肌梗死关系的病例对照研究 –不应包括慢性关节炎患者 –也不应包括慢性胃溃疡患者
5、测量
方法:在理论上可以通过比较总人群与实际抽样人群研究 疾病与暴露因素的分布的两个四格表进行测量。
举例:以病例对照研究为例
总人群 OR AD BC
根据选择概率
样本人群 OR0 OR
选择偏倚的大小和方向可表示为:
可靠性(Reliability)
概念
反映研究结果中随机误差大小的程度,随机误差小则 研究可靠性高。也称“信度”、“精密度”。随机抽样误 差可以通过统计学方法估计,并且可以通过增大样本含量 减少。
系统误差、随机误差和样本大小的关系
误
随机误差
差
系统误差
样本大小
三、偏倚 (bias)
概念
在流行病学研究设计和实施中由于方法的局限 或错误所产生的系统误差使研究结果系统地偏 离真实值,以及解释结果的片面性,称为偏倚 (bias)。
又称观察偏倚、测量偏倚、衡量偏倚
1、定义 在收集资料的过程中,由于测量暴露或/和
结局的方法缺陷,致使获 得的信息产生系 统误差。
2、本质 通常表现为研究对象的某种特征被错误分类
(misclassification),也即使用的方法偏离了 金标准。在对疾病状态和暴露状态判断时都 有可能发生。
3、来源
假定三种疾病的入院率分别为: 皮肤癌=60% 骨折=25% 高血压=40%
则有: 皮肤癌 not 高血压=0.6×4800=2880 骨折 not 高血压=0.25×4800=1200 皮肤癌 with 高血压=0.6×1200+0.4×(1200-720)=912 骨折 with 高血压=0.25×1200+0.4×(1200-300)=660
职业流行病学研究-队列研究 健康工人效应(healthy worker effect) 志愿者偏倚
排除偏倚(exclusive bias )
在选择研究对象的过程中,没有按照既定的原则或标 准自观察组或对照组中排除某些不符合标准的研究对象 所导致的对某因素与某疾病之间联系的错误估计,称为 排除偏倚。
随机误差: 没有方向和大小、呈正态分布,来自随机
抽样和测量随机变异
系统误差 固定方向和大小、来自对象选取、测量和
统计学分析等方法学缺陷
真实性的两个方面
内部真实性 外部真实性
内部真实性(internal validity)
定义 研究结果与实际研究对象真实情况的符合程度,回答
一个研究本身是否真实或有效。
偏倚及其控制
Bias and Control
概述
一、研究结果的变异性(variability)
描述性和分析性数据(指标)的变动或波动。可存在于不 同的水平,包括个体水平、群体 水平和样本水平。
变异的来源
生物学变异 测量变异 随机变异 系统变异
变异的水平
变异性的水平 个体水平 群体水平 样本水平
① 检测方法不统一 ② 诊断标准不统一 ③ 观察条件不统一 ④ 询问方式不统一 ⑤ 研究对象引起,如记忆不准、态度的影响等 ⑥ 综合引起的偏倚,“诱、供、信”造成
4、种类
(1) 回忆偏倚(recall bias) (2) 报告偏倚(reporting bias) “说谎偏倚” (3) 诊断怀疑偏倚(diagnostic suspicion bias)
✓ 采用严格科学的研究设计。明确定义源人群和样本 人群,根据研究性质预测获取样本过程中可能产生 的各种选择偏倚,采取措施减少或控制 。
✓ 明确对象纳入标准、统一疾病诊断和监测程序。
资料收集阶段
✓ 加强随访、提高应答率。
✓ 在资料收集阶段尽可能多地收集有关暴露史的各种 信息,包括暴露程度、暴露时间、暴露改变以及改 变的原因等。
选择性偏倚的一种形式,是指利用医院就诊或住院病 人作为研究对象时,由于入院率的不同而导致的偏差。
当利用医院病人作为病例和对照时,由于对照是医院 的某一部分病人,而不是全部目标人群的一个随机样本, 又由于病例只是该医院或某些医院的特定病例(因为病 人对医院及医院对病人双方都有选择性),所以作为病 例组的病例也不是全体病人的随机样本。由此产生的病 例和对照就与人群中的研究对象存在着某些差异,难免 产生偏倚。
Neyman bias 检出症候偏倚(detection signal bias ) 易感性偏倚(susceptibility bias ) 排除偏倚(exclusive bias ) 无应答偏倚(non-respondent bias )
入院率偏倚(admission rate bias ) Berkson’s bias
3、来源
(1)任意挑拣样本结构(sampling frame),即所谓“典 型样本”。常见于现况研究和病例对照研究 (2)主观挑拣研究对象- “随便抽样”或“随意抽样” (3)失访或无应答(lost to follow-up or non-respondent) (4)入院率的影响
4、种类
入院率偏倚(admission rate bias ) Berkson’s bias 现患病例或新发病例偏倚(prevalence-incidence bias )