第九章 流行病学研究中的偏倚及其控制

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

检出症候偏倚

某人进行了一项更年期服用雌激素与子宫内膜 癌关系的病例对照研究,分别在同一个医院的 不同科室选择了研究对象,经分析得到下表结 果
检出症候偏倚

在肿瘤科,子宫内膜癌病人多由于她们服用雌激素后出 现子宫出血而到医院检查,能及早发现该人群中的子宫 内膜癌病人,且多为早期的病人,而没有服用者,由于 没有子宫出血症状,减少了就诊机会,使该病不易及早 被诊断出来,因而能得出雌激素和子宫内膜癌之间相关 联的结论 在妇科,这些患者大多数接受妇科检查,因此子宫内膜 癌的检出与是否服用雌激素使妇科检查几率增加之间没 有关系

健康工人效应

为了探讨职业暴露对人类健康的危害,McMichael等在 美国俄亥俄州的一个轮胎生产工厂,选择在岗及退休男 性工人6678人作为暴露组,进行了回顾性队列研究。观 察期间为1964~1972年共9年时间。以国家卫生统计中 心编制的1968年美国男性年龄别死亡率作参比 下表是同时期与钢铁工人、俄亥俄州人口及美国全国人 口相比较的橡胶工人全死因死亡率(1/10万人年)

现患-新发病例偏倚

现患病例-新病例偏倚的测量可依据队列研究 和病例对照研究两研究不同的联系强度来估计 假设队列研究的联系强度为OR1,病例对照研 究的联系强度为OR2,现患病例-新病例偏倚
OR2 OR1 1.16 2.40 选择偏倚= 0.517 OR1 2.40

为负值,说明由于该偏倚的存在,使得病例对 照研究中高血胆固醇与冠心病之间的联系强度 降低了51.7%

假如在人群进行一项病例对照研究,以B病为对照,研 究A病与某因素X的关系。设人群中患A病与B病者各为 5000人,暴露于因素X者各为750人,不暴露于因素X者 各为4250人,X 在A、B患者中的暴露率均为15% 暴露X 有 无 A病 750 4250 B病 750 4250 合计 1500 8500
变异的水平
高胆固醇率
源群体
180 ,174,215,305 233,276,146,195 205,188,190,295 170,164,248,162 220,219,228,250
样本A
205,276,195,215,170
= 40% = 20% = 0%
样本B
295,146,220,162,228
0575入院率偏倚为正值说明由于入院率偏倚的存在使得暴露x与疾病a之间的联系强度高估了425425病例对照研究样本的联系强度为or则入院率偏倚可估计为现患新发病例偏倚在framingham心血管病的研究中采用队列研究获得血清胆固醇与冠心病关系的结果不同于另一项病例对照研究的结果具体结果见下表病例对照研究收集的大部分是现患病例而队列研究可观察新发病例这两种不同的病例所提供的有关所研究的暴露等情况会有很大的差别就此例进一步分析发现许多患冠心病的患者在被诊断为该病后改变了其原来的生活习惯或嗜好如戒烟多食低胆固醇食物多进行体育锻炼等从而使用于病例对照研究的患者血中胆固醇水平降低或与一般人相比血胆固醇水平增长速度较慢所致现患病例新病例偏倚的测量可依据队列研究和病例对照研究两研究不同的联系强度来估计病例对照研究的联系强度为or为负值说明由于该偏倚的存在使得病例对照研究中高血胆固醇与冠心病之间的联系强度降低了5171162400517240oror某人进行了一项更年期服用雌激素与子宫内膜癌关系的病例对照研究分别在同一个医院的不同科室选择了研究对象经分析得到下表结在肿瘤科子宫内膜癌病人多由于她们服用雌激素后出现子宫出血而到医院检查能及早发现该人群中的子宫内膜癌病人且多为早期的病人而没有服用者由于没有子宫出血症状减少了就诊机会使该病不易及早被诊断出来因而能得出雌激素和子宫内膜癌之间相关联的结论在妇科这些患者大多数接受妇科检查因此子宫内膜癌的检出与是否服用雌激素使妇科检查几率增加之间没有关系为了探讨职业暴露对人类健康的危害mcmichael等在美国俄亥俄州的一个轮胎生产工厂选择在岗及退休男性工人6678人作为暴露组进行了回顾性队列研究
6% 9%
15
五年内发生 心肌梗食与药物预防心机梗死的样本变异性示例
影响真实性与可靠性的因素
☼随机分布的,不可预测的 ☼不可避免的
真实值 观测值 + 误差
随机误差
☼可估计误差大小 ☼通过增加样本量或重复测 量取均值可以减小 ☼系统的偏离真实值
+
系统误差
☼可避免的 ☼是必须控制的
偏倚是有方向的。当研究结果因偏倚而被夸大 时,称为正偏倚;当研究结果因偏倚而被缩小 时,称为负偏倚

研究的偏倚及其控制
如果用RR来表示人群中因素和疾病真实的联系
强度, RR 表示研究获得的因素和疾病的联系强 度,则相对于危险因素,正偏倚时, RR >RR; 负偏倚时,RR <RR。相对于保护因素,正偏倚 时, RR < RR,负偏倚时, RR >RR
当前研究对象得到的结果能否适用于目标人群 以外的其他人群(外推性)

内部真实性是外部真实性的先决条件
内部真实性与外部真实性的联系
推论代表性不好,内部真实性可能好,而外部真实 性差。 增加研究对象的同质性(如限制类型如年龄、职业、
体质特征或疾病分型等),可改善内部真实性。
增加研究对象的异质性,可改善外部真实性。 在实际研究需综合考虑研究对象的同质性和异质性 问题。

健康工人效应

下表为暴露组观察期间各年龄组的观察死亡数与以1968年美国男 性年龄别死亡率作参比计算的期望死亡数之比
健康工人效应 健康工人效应

下表是暴露组在岗工人及全部队列人口某些死因的SMR
健康工人效应

根据上述资料,如何解释全死因及其它一些死 因观察死亡数低于期望死亡数的现象?根据以 上数据是否能说明橡胶行业职业暴露对人群健 康不但没有危害而且还有保护作用,为什么?
真实性 vs. 可靠性
真实性差 可靠性好
真实性好 可靠性差
真实性 vs. 可靠性
真实性好 可靠性好
真实性差 可靠性差
内部真实性 vs. 外部真实性

内部真实性(internal validity): 从当前研究对象得
到的结果能否准确地反映目标/源人群的真实情 况

外部真实性(external validity /generalizability): 从
有 无 合计
A病 570 2550 1000
B病 413 1063 1000
合计 1600 400 2000
ad OR= =0.575 bc
入院率偏倚的测量
假设总体的联系强度为OR1,病例对照研究样
本的联系强度为OR2,则入院率偏倚可估计为
OR1 OR 2 1.00 0.575 入院率偏倚 0.425 OR1 1.00
胆固醇水平
到第6次检查时 为止总共发生 新冠心病人数
到第6次检查 时为止未发生 新冠心病人数
合计
72 230 302
≥75%分位数 <75%分位数
85 116 203
462 1511 1973
547 1627 2174
38 113 151
34 117 151
合计
OR值
2.40(95%CI:1.78, 3.32)
分析性研究
现况调查 生态学研究
病例对照研究 队列研究
实验法
临床试验 现场试验 社区试验
理论法
从统计关联到因果联系
偶然关联 (随机误差) 暴露与疾病 有无关联 虚假关联 有统计学关联 间接联系 直接联系 是否符合因果推断标准 因果关联 选择偏倚 信息偏倚 混杂偏倚
思考 ?
有人用病例对照研究方法探讨冠心病与喝咖啡的关系, 选择同一医院的非冠心病的其他慢性病患者为对照,结 果显示冠心病组喝咖啡的量和次数显著地大于对照组, 提示喝咖啡可能是冠心病的一个原因 但进一步调查显示,这些慢性病患者较急性病患者或正 常人喝咖啡少,提示该研究所选的对照组不是全部非冠 心病病例的一个无偏样本,而可能包含了严重的选择偏 倚,从而导致了喝咖啡与冠心病有关的“假关联”结果
1.16(95%CI:0.68, 1.97)
注:*胆固醇值系第1次检查时的观测值;**胆固醇值系第6次检查时的观测值
现患-新发病例偏倚

病例对照研究收集的大部分是现患病例,而队列研究可 观察新发病例,这两种不同的病例所提供的有关所研究 的暴露等情况会有很大的差别 就此例进一步分析发现,许多患冠心病的患者在被诊断 为该病后,改变了其原来的生活习惯或嗜好,如戒烟、 多食低胆固醇食物、多进行体育锻炼等,从而使用于病 例对照研究的患者血中胆固醇水平降低,或与一般人相 比血胆固醇水平增长速度较慢所致
在研究某些职业暴露的危害时,以一般人口作 参比易受“健康工人效应”的影响,如何控制 该种偏倚的产生?

健康工人效应的控制

不以一般人群作参比,对照组除研究因素之外的其它能 影响疾病的因素与暴露组相一致 用一般人群作参比,选择最好是与暴露组相同地区、相 同年代、相同人群特征构成者 方法校正



第一节 研究的真实性与可靠性
真实性,准确性,效度… validity, accuracy:测量结 果与真实情况符合的程度


内部真实性 外部真实性

可靠性,可重复性,精密度,信度… reliability, reproducibility, repeatability, precision:在相同条 件下重复测量同一个体/标本获得相同结果的稳 定程度

描述性研究:样本对总体的代表性 分析性研究:增大或减少暴露与疾病、处理与效应 的关联,导致效应估计的偏倚
选择偏倚 selection bias
入院率偏倚 现患-新发病例偏倚 检出症候偏倚
纳入/排除偏倚
无应答偏倚 失访偏倚 易感性偏倚(志愿者偏倚和健康工人效应)
入院率偏倚
B病有C因素人数: 750 25% 750 750 25% 40% 413 A病住院而无C因素人数:
4250 60% 2550

B病住院而无C因素人数:
4250 25% 1063
入院率偏倚

现在医院进行病例对照研究研究A病与某X的关系; 假定A病患者住院率60%,B病患者住院率25%,同时具 有X因素者的住院率为40%,则该医院进行的病例对照 研究的样本构成如下: 暴露X
(偏倚 bias)
随机误差和系统误差的区别
系统误差 误 差
随机误差 样本大小
随机误差和系统误差的区别
真实值 观测值 + 误差
随机误差
+
系统误差 (偏倚 bias)
第二节 研究的偏倚及其控制
Bias是古典文化中七贤人之一
Lydia国王克利萨斯向Bias咨询建造、部 署战舰防御爱奥尼亚人的最好方法,Bias 为了避免战争、流血,骗克利萨斯国王说, 爱奥尼亚人正在买马准备陆地战,后来, Bias向克利萨斯国王承认,他说了谎,爱 奥尼亚人实际上也在建造战舰,克利萨斯 国王对Bias的本意表示赞许,与爱奥尼亚 人讲和,后人将“背离事实”称为bias
Bias
(600-540BC)
(Hunter D. Father of all bias? BMJ 2002;324:1071
研究的偏倚及其控制

偏倚 bias 是指研究设计、实施、分析和推断 过程中存在的各种对暴露因素与疾病关系的错 误估计,它系统地歪曲了暴露因素与疾病间的 真实联系,是一种系统误差
研究人群各亚组预期死亡数按一定比例折扣(如90%) 通过实际调查获得能够代表本地区的职工和一般人 群死亡率的比值,以此为校正系数乘以研究人群各 亚组预期死亡数进行校正;或用各亚组的死亡率比 值(如年龄)作为校正系数,分别乘以研究人群相 应各亚组的预期死亡数进行校正
样本C
219,164,190,188,233
高胆固醇率 = 25% (>240mg/dL)
源群体与样本高胆固醇率的样本变异性示例
研究 A(研究对象 200 人,随机分配到两组) 膳食改良组 降胆固醇药物组
6% 9%
五年内发生 心肌梗死风险(%)
0
5
10
15
研究 B(研究对象 2000 人,随机分配到两组) 膳食改良组 降胆固醇药物组
内部真实性 vs. 外部真实性
其他人群 ? 外部真实性 (外推性)
疾病
+
暴露

+

? 内部真实性
目标/源人群
研究样本
影响真实性与可靠性的因素

变异

生物学变异 测量变异 随机变异 系统变异
变异的水平
变异性的水平 个体水平 群体水平 样本水平
变异的来源 个体生物学变异、测量误差 个体间遗传学变异、环境变异、 测量误差 抽样方式、样本大小、测量误差
选择偏倚 信息偏倚 混杂偏倚

selection bias information bias confounding bias
选择偏倚 selection bias

选择偏倚是流行病学研究中由于被选入到研究中的研究
对象与没有被选入者在暴露或疾病有关的特征上的差异 所造成的系统误差

表现:
Chapter 9 Bias
第九章 流行病学研究中的偏倚及其控制
路 滟
电话:86-25-86862755 (o) 电邮:luyan@
南京医科大学公共卫生学院流行病与卫生统计学系
讲课提纲
第一节 研究的真实性与可靠性 第二节 研究的偏倚及其控制 总结
流行病学的方法
观察法
描述性研究


为正值,说明由于入院率偏倚的存在,使得
暴露X与疾病A之间的联系强度高估了42.5%
现患-新发病例偏倚

在Framingham心血管病的研究中,采用队列研究获得血 清胆固醇与冠心病关系的结果不同于另一项病例对照研 究的结果,具体结果见下表
队列研究* 病例对照研究**
合计
第6次检查 时现患冠心 病人数 第6次检查时 不患冠心病 人为对照
2 ad ( ad bc ) n 2 OR= =1.00 (a b)(a c)(b dbc )(c d )
入院率偏倚


现在医院进行病例对照研究研究A病与某X的关系; 假定A病患者住院率60%,B病患者住院率25%,同时具 有X因素者的住院率为40%,现就上述不同的入院率计 算住院病人: A病有C因素人数: 750 60% 750 750 60% 40% 570
相关文档
最新文档