第九章 流行病学研究中的偏倚及其控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 研究的真实性与可靠性
真实性,准确性,效度… validity, accuracy:测量结 果与真实情况符合的程度
内部真实性 外部真实性
可靠性,可重复性,精密度,信度… reliability, reproducibility, repeatability, precision:在相同条 件下重复测量同一个体/标本获得相同结果的稳 定程度
分析性研究
现况调查 生态学研究
病例对照研究 队列研究
实验法
临床试验 现场试验 社区试验
理论法
从统计关联到因果联系
偶然关联 (随机误差) 暴露与疾病 有无关联 虚假关联 有统计学关联 间接联系 直接联系 是否符合因果推断标准 因果关联 选择偏倚 信息偏倚 混杂偏倚
思考 ?
有人用病例对照研究方法探讨冠心病与喝咖啡的关系, 选择同一医院的非冠心病的其他慢性病患者为对照,结 果显示冠心病组喝咖啡的量和次数显著地大于对照组, 提示喝咖啡可能是冠心病的一个原因 但进一步调查显示,这些慢性病患者较急性病患者或正 常人喝咖啡少,提示该研究所选的对照组不是全部非冠 心病病例的一个无偏样本,而可能包含了严重的选择偏 倚,从而导致了喝咖啡与冠心病有关的“假关联”结果
选择偏倚 信息偏倚 混杂偏倚
selection bias information bias confounding bias
选择偏倚 selection bias
选择偏倚是流行病学研究中由于被选入到研究中的研究
对象与没有被选入者在暴露或疾病有关的特征上的差异 所造成的系统误差
表现:
健康工人效应
下表为暴露组观察期间各年龄组的观察死亡数与以1968年美国男 性年龄别死亡率作参比计算的期望死亡数之比
健康工人效应 健康工人效应
下表是暴露组在岗工人及全部队列人口某些死因的SMR
健康工人效应
根据上述资料,如何解释全死因及其它一些死 因观察死亡数低于期望死亡数的现象?根据以 上数据是否能说明橡胶行业职业暴露对人群健 康不但没有危害而且还有保护作用,为什么?
胆固醇水平
到第6次检查时 为止总共发生 新冠心病人数
到第6次检查 时为止未发生 新冠心病人数
合计
72 230 302
≥75%分位数 <75%分位数
85 116 203
462 1511 1973
547 1627 2174
38 113 151
34 117 151
合计
OR值
2.40(95%CI:1.78, 3.32)
样本C
219,164,190,188,233
高胆固醇率 = 25% (>240mg/dL)
源群体与样本高胆固醇率的样本变异性示例
研究 A(研究对象 200 人,随机分配到两组) 膳食改良组 降胆固醇药物组
6% 9%
五年内发生 心肌梗死风险(%)
0
5
10
15
研究 B(研究对象 2000 人,随机分配到两组) 膳食改良组 降胆固醇药物组
内部真实性 vs. 外部真实性
其他人群 ? 外部真实性 (外推性)
疾病
+
暴露
-
+
-
? 内部真实性
目标/源人群
研究样本
影响真实性与可靠性的因素
变异
生物学变异 测量变异 随机变异 系统变异
变异的水平
变异性的水平 个体水平 群体水平 样本水平
变异的来源 个体生物学变异、测量误差 个体间遗传学变异、环境变异、 测量误差 抽样方式、样本大小、测量误差
变异的水平
高胆固醇率
源群体
180 ,174,215,305 233,276,146,195 205,188,190,295 170,164,248,162 220,219,228,250
样本A
205,276,195,215,170
= 40% = 20% = 0%
样本B
295,146,220,162,228
假如在人群进行一项病例对照研究,以B病为对照,研 究A病与某因素X的关系。设人群中患A病与B病者各为 5000人,暴露于因素X者各为750人,不暴露于因素X者 各为4250人,X 在A、B患者中的暴露率均为15% 暴露X 有 无 A病 750 4250 B病 750 4250 合计 1500 8500
为正值,说明由于入院率偏倚的存在,使得
暴露X与疾病A之间的联系强度高估了42.5%
现患-新发病例偏倚
在Framingham心血管病的研究中,采用队列研究获得血 清胆固醇与冠心病关系的结果不同于另一项病例对照研 究的结果,具体结果见下表
队列研究* 病例对照研究**
合计
第6次检查 时现患冠心 病人数 第6次检查时 不患冠心病 人为对照
(偏倚 bias)
随机误差和系统误差的区别
系统误差 误 差
随机误差 样本大小
随机误差和系统误差的区别
真实值 观测值 + 误差
随机误差
+
系统误差 (偏倚 bias)
第二节 研究的偏倚及其控制
Bias是古典文化中七贤人之一
Lydia国王克利萨斯向Bias咨询建造、部 署战舰防御爱奥尼亚人的最好方法,Bias 为了避免战争、流血,骗克利萨斯国王说, 爱奥尼亚人正在买马准备陆地战,后来, Bias向克利萨斯国王承认,他说了谎,爱 奥尼亚人实际上也在建造战舰,克利萨斯 国王对Bias的本意表示赞许,与爱奥尼亚 人讲和,后人将“背离事实”称为bias
描述性研究:样本对总体的代表性 分析性研究:增大或减少暴露与疾病、处理与效应 的关联,导致效应估计的偏倚
选择偏倚 selection bias
入院率偏倚 现患-新发病例偏倚 检出症候偏倚
纳入/排除偏倚
无应答偏倚 失访偏倚 易感性偏倚(志愿者偏倚和健康工人效应)
入院率偏倚
真实性 vs. 可靠性
真实性差 可靠性好
真实性好 可靠性差
真实性 vs. 可靠性
真实性好 可靠性好
真实性差 可靠性差
内部真实性 vs. 外部真实性
内部真实性(internal validity): 从当前研究对象得
到的结果能否准确地反映目标/源人群的真实情 况
外部真实性(external validity /generalizability): 从
健康工人效应
为了探讨职业暴露对人类健康的危害,McMichael等在 美国俄亥俄州的一个轮胎生产工厂,选择在岗及退休男 性工人6678人作为暴露组,进行了回顾性队列研究。观 察期间为1964~1972年共9年时间。以国家卫生统计中 心编制的1968年美国男性年龄别死亡率作参比 下表是同时期与钢铁工人、俄亥俄州人口及美国全国人 口相比较的橡胶工人全死因死亡率(1/10万人年)
2 ad ( ad bc ) n 2 OR= =1.00 (a b)(a c)(b dbc )(c d )
入院率偏倚
现在医院进行病例对照研究研究A病与某X的关系; 假定A病患者住院率60%,B病患者住院率25%,同时具 有X因素者的住院率为40%,现就上述不同的入院率计 算住院病人: A病有C因素人数: 750 60% 750 750 60% 40% 570
现患-新发病例偏倚
现患病例-新病例偏倚的测量可依据队列研究 和病例对照研究两研究不同的联系强度来估计 假设队列研究的联系强度为OR1,病例对照研 究的联系强度为OR2,现患病例-新病例偏倚
OR2 OR1 1.16 2.40 选择偏倚= 0.517 OR1 2.40
为负值,说明由于该偏倚的存在,使得病例对 照研究中高血胆固醇与冠心病之间的联系强度 降低了51.7%
当前研究对象得到的结果能否适用于目标人群 以外的其他人群(外推性)
内部真实性是外部真实性的先决条件
内部真实性与外部真实性的联系
推论代表性不好,内部真实性可能好,而外部真实 性差。 增加研究对象的同质性(如限制类型如年龄、职业、
体质特征或疾病分型等),可改善内部真实性。
增加研究对象的异质性,可改善外部真实性。 在实际研究需综合考虑研究对象的同质性和异质性 问题。
偏倚是有方向的。当研究结果因偏倚而被夸大 时,称为正偏倚;当研究结果因偏倚而被缩小 时,称为负偏倚
研究的偏倚及其控制
如果用RR来表示人群中因素和疾病真实的联系
强度, RR 表示研究获得的因素和疾病的联系强 度,则相对于危险因素,正偏倚时, RR >RR; 负偏倚时,RR <RR。相对于保护因素,正偏倚 时, RR < RR,负偏倚时, RR >RR
6% 9%
15
五年内发生 心肌梗死风险(%)
0
5
10
膳食与药物预防心机梗死的样本变异性示例
影响真实性与可靠性的因素
☼随机分布的,不可预测的 ☼不可避免的
真实值 观测值 + 误差
随机误差
☼可估计误差大小 ☼通过增加样本量或重复测 量取均值可以减小 ☼系统的偏离真实值
+
系统误差
☼可避免的 ☼是必须控制的
检出症候偏倚
某人进行了一项更年期服用雌激素与子宫内膜 癌关系的病例对照研究,分别在同一个医院的 不同科室选择了研究对象,经分析得到下表结 果
检出症候偏倚
在肿瘤科,子宫内膜癌病人多由于她们服用雌激素后出 现子宫出血而到医院检查,能及早发现该人群中的子宫 内膜癌病人,且多为早期的病人,而没有服用者,由于 没有子宫出血症状,减少了就诊机会,使该病不易及早 被诊断出来,因而能得出雌激素和子宫内膜癌之间相关 联的结论 在妇科,这些患者大多数接受妇科检查,因此子宫内膜 癌的检出与是否服用雌激素使妇科检查几率增加之间没 有关系
Chapter 9 Bias
第九章 流行病学研究中的偏倚及其控制
路 滟
电话:86-25-86862755 (o) 电邮:luyan@njmu.edu.cn
南京医科大学公共卫生学院流行病与卫生统计学系
讲课提纲
第一节 研究的真实性与可靠性 第二节 研究的偏倚及其控制 总结
流行病学的方法
观察法
描述性研究
在研究某些职业暴露的危害时,以一般人口作 参比易受“健康工人效应”的影响,如何控制 该种偏倚的产生?
健康工人效应的控制
不以一般人群作参比,对照组除研究因素之外的其它能 影响疾病的因素与暴露组相一致 用一般人群作参比,选择最好是与暴露组相同地区、相 同年代、相同人群特征构成者 方法校正
有 无 合计
A病 570 2550 1000
B病 413 1063 1000
合计 1600 400 2000
ad OR= =0.575 bc
入院率偏倚的测量
假设总体的联系强度为OR1,病例对照研究样
本的联系强度为OR2,则入院率偏倚可估计为
OR1 OR 2 1.00 0.575 入院率偏倚 0.425 OR1 1.00
Bias
(600-540BC)
(Hunter D. Father of all bias? BMJ 2002;324:1071
研究的偏倚及其控制
偏倚 bias 是指研究设计、实施、分析和推断 过程中存在的各种对暴露因素与疾病关系的错 误估计,它系统地歪曲了暴露因素与疾病间的 真实联系,是一种系统误差
B病有C因素人数: 750 25%Baidu Nhomakorabea 750 750 25% 40% 413 A病住院而无C因素人数:
4250 60% 2550
B病住院而无C因素人数:
4250 25% 1063
入院率偏倚
现在医院进行病例对照研究研究A病与某X的关系; 假定A病患者住院率60%,B病患者住院率25%,同时具 有X因素者的住院率为40%,则该医院进行的病例对照 研究的样本构成如下: 暴露X
1.16(95%CI:0.68, 1.97)
注:*胆固醇值系第1次检查时的观测值;**胆固醇值系第6次检查时的观测值
现患-新发病例偏倚
病例对照研究收集的大部分是现患病例,而队列研究可 观察新发病例,这两种不同的病例所提供的有关所研究 的暴露等情况会有很大的差别 就此例进一步分析发现,许多患冠心病的患者在被诊断 为该病后,改变了其原来的生活习惯或嗜好,如戒烟、 多食低胆固醇食物、多进行体育锻炼等,从而使用于病 例对照研究的患者血中胆固醇水平降低,或与一般人相 比血胆固醇水平增长速度较慢所致
研究人群各亚组预期死亡数按一定比例折扣(如90%) 通过实际调查获得能够代表本地区的职工和一般人 群死亡率的比值,以此为校正系数乘以研究人群各 亚组预期死亡数进行校正;或用各亚组的死亡率比 值(如年龄)作为校正系数,分别乘以研究人群相 应各亚组的预期死亡数进行校正