常见偏倚及控制.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢分类:
随机误差(random error) 系统误差(systematic error),即偏倚(bias)
举例:用动脉血压计测量某人血压(实际值 为80mmHg),各次测量的均值为 100mmHg。下图为系统误差和随机误差的 示意图。
发
系统误差
生
频
次
随机误差
80
100
舒张压 (mmHg)
血压计法测量舒张压值的分布
低 116 1511 1627 7.13
合计 201 1973 2174 9.25
诊断信息偏倚(detection signal bias)
指某疾病与暴露因素之外存在另外一个临床症 状或体征,这种症状或体征不是该疾病的危险 因素,但人们往往因为这种症状或体征就诊, 从而间接提高了该疾病早期病例的检出率,但 过高估计了暴露因素的程度,造成暴露因素和 该疾病关系的偏倚
患者是否就医取决于就医条件和对某医疗单 位的信任等多种因素,而患者就医机会不同 将造成研究的结果不同
用住院病例进行研究时可能没有包括: 抢救不及时而死亡的病例 距离医院远的病例 无钱住院的病例 病情轻的病例
表1 呼吸道疾病与骨骼运动器官疾病的关系 (一般人群)
呼吸道 疾病
骨骼运动器官疾病
随机误差
➢定义:
指由于个体差异和在研究过程中许多微小 的不可控制因素造成的误差(测量误差和 个体差异)
➢特点:
不可避免 具有规律性,一般呈正态分布 重复是控制和缩小随机误差的主要方法
偏倚(系统误差)
➢定义:
指由于对实验因素或条件控制不严而发生的 一种误差
➢特点:
研究结果系统的偏离真实情况 研究结果具有一定倾向性和周期性 研究过程中应加以控制甚至消除
OR
有 无 合计 发生率(%)
有Baidu Nhomakorabea
17 207 224 7.59 1.06
无
184 2376 2560 7.19
合计 201 2583 2784 7.22
20.05,P0.824
表1 呼吸道疾病与骨骼运动器官疾病的关系 (住院6个月以上病人)
呼吸道 疾病
有
骨骼运动器官疾病
OR
有 无 合计 发生率(%)
➢分类:
选择偏倚、信息偏倚、混杂偏倚
一、选择偏倚(selection bias)
研究者在挑选研究对象时由于选择条 件受限制或设计失误所致的系统误差。
➢常见种类:
就诊机会偏倚 现患病例-新发病例偏倚 诊断信息偏倚 ……
就诊机会偏倚
又称伯克森偏倚(Berkson rate bias),或入院 率偏倚,指利用医院门诊或住院病人作为研 究对象时,由于患者就医机会不同导致研究 结果的偏差
二、信息偏倚(information bias)
在对研究对象的信息收集、测量时出现 的系统误差 可以来自被研究对象 也可以来自研究者本身 非盲法研究较易发生
信息偏倚常见的种类
无应答偏倚 回忆偏倚 说谎偏倚 诊断怀疑偏倚 沾染偏倚 测量偏倚
来自被调查对象 来自调查者本身
来自研究对象的偏倚之无应答偏倚
子宫 内膜癌
有
服用雌激素
OR
有 无 合计 发生率(%)
59 89 148 39.86 1.67
无
42 106 148 28.38
合计 101 195 296 34.12
24.34,P0.037
选择偏倚的控制
对研究过程中可能出现的偏倚有充分的了解,在 设计时考虑周全 严格掌握研究对象的纳入和排除标准,保障较好 的代表性 病例对照研究中首选新病例,对照组不应为慢性 病病例 队列研究中增大样本量,降低失访,必要时将失 访人群特征与未失访人群对照 采用多重对照
对于一些敏感问题的调查,容易引起不应答偏 倚,例如我国南方调查农村婴儿死亡原因,有 28%的人拒绝提供婴儿死亡原因
来自研究对象的偏倚之回忆偏倚
回忆偏倚:因研究对象的记忆失真或记忆不完 整所造成的研究结果偏倚
病例对照研究和回顾性队列研究最容易出现回 忆偏倚
回忆偏倚的产生与调查时间至事件发生时间、 以及与事件的重要性有关,同时也与调查员的 调查过程和询问技术有关
5
15
20 25.00 4.06
无 合计
18 219 237 23 234 257
7.59 8.95
24.89,P0.027
现患病例-新发病例偏倚
又称奈曼氏偏倚(Neyman’s bias),主要是由 于研究中所用的病例类型不同所产生的差别
病例对照研究结果与队列研究的结果会有差 异
表2 冠心病与高胆固醇血症的关系 (病例对照研究)
Wilcox等在调查流产回忆准确性时发现,调查10年 前 流 产 的 有 82% 回 忆 完 整 , 调 查 20 年 前 流 产 的 有 73%回忆完整。在受孕前6周流产者能回忆起来的有 54%,而在受孕13周流产者能回忆起来的有93%
血胆固醇水平
冠心病
OR 2
P
高 低 合计 发生率(%)
有 38 113 151 25.17 1.16 0.29 0.589
无 34 117 151 22.52
合计 72 230 302 23.84
表2 冠心病与高胆固醇血症的关系 (队列研究)
冠心病
血胆固 醇水平
有
无
RR
合计
发病率 (%)
2
P
高 85 462 547 15.54 2.18 35.50 <0.001
医学科研中常见的偏倚类型及控制方法
(Bias and Control)
Department of Health Statistics,SMMU 2012.06.09
主要内容
偏倚的类型 混杂因素与交互作用 偏倚的控制
误差(error)
➢定义:
指对事物某一特征的度量值偏离真实值的部分, 即测量值与真实值之差。
表3a 妇女绝经期服用雌激素与子宫内膜癌的关系 (以阴道出血就诊的病例)
子宫
服用雌激素
内膜癌
有
无
OR
合计 发生率(%)
有
45 72 117 38.46 9.82
无 合计
7 110 117 52 182 234
5.98 22.22
235.70,P0.001
表3b 妇女绝经期服用雌激素与子宫内膜癌的关系 (以刮宫和子宫切除的病例)
无应答偏倚:研究对象拒绝回答或因研究对象 失访而缺失答案所造成的偏倚
是否有无应答偏倚取决于无应答者在疾病暴露 因素方面的特征是否与应答者有差异
美国曾采用邮寄问卷形式,调查美国退伍军人 吸烟习惯。30天后总结收集的回复,结果发现, 不 吸 烟 者 有 85% 回 复 了 问 卷 , 而 吸 烟 者 仅 67%
随机误差(random error) 系统误差(systematic error),即偏倚(bias)
举例:用动脉血压计测量某人血压(实际值 为80mmHg),各次测量的均值为 100mmHg。下图为系统误差和随机误差的 示意图。
发
系统误差
生
频
次
随机误差
80
100
舒张压 (mmHg)
血压计法测量舒张压值的分布
低 116 1511 1627 7.13
合计 201 1973 2174 9.25
诊断信息偏倚(detection signal bias)
指某疾病与暴露因素之外存在另外一个临床症 状或体征,这种症状或体征不是该疾病的危险 因素,但人们往往因为这种症状或体征就诊, 从而间接提高了该疾病早期病例的检出率,但 过高估计了暴露因素的程度,造成暴露因素和 该疾病关系的偏倚
患者是否就医取决于就医条件和对某医疗单 位的信任等多种因素,而患者就医机会不同 将造成研究的结果不同
用住院病例进行研究时可能没有包括: 抢救不及时而死亡的病例 距离医院远的病例 无钱住院的病例 病情轻的病例
表1 呼吸道疾病与骨骼运动器官疾病的关系 (一般人群)
呼吸道 疾病
骨骼运动器官疾病
随机误差
➢定义:
指由于个体差异和在研究过程中许多微小 的不可控制因素造成的误差(测量误差和 个体差异)
➢特点:
不可避免 具有规律性,一般呈正态分布 重复是控制和缩小随机误差的主要方法
偏倚(系统误差)
➢定义:
指由于对实验因素或条件控制不严而发生的 一种误差
➢特点:
研究结果系统的偏离真实情况 研究结果具有一定倾向性和周期性 研究过程中应加以控制甚至消除
OR
有 无 合计 发生率(%)
有Baidu Nhomakorabea
17 207 224 7.59 1.06
无
184 2376 2560 7.19
合计 201 2583 2784 7.22
20.05,P0.824
表1 呼吸道疾病与骨骼运动器官疾病的关系 (住院6个月以上病人)
呼吸道 疾病
有
骨骼运动器官疾病
OR
有 无 合计 发生率(%)
➢分类:
选择偏倚、信息偏倚、混杂偏倚
一、选择偏倚(selection bias)
研究者在挑选研究对象时由于选择条 件受限制或设计失误所致的系统误差。
➢常见种类:
就诊机会偏倚 现患病例-新发病例偏倚 诊断信息偏倚 ……
就诊机会偏倚
又称伯克森偏倚(Berkson rate bias),或入院 率偏倚,指利用医院门诊或住院病人作为研 究对象时,由于患者就医机会不同导致研究 结果的偏差
二、信息偏倚(information bias)
在对研究对象的信息收集、测量时出现 的系统误差 可以来自被研究对象 也可以来自研究者本身 非盲法研究较易发生
信息偏倚常见的种类
无应答偏倚 回忆偏倚 说谎偏倚 诊断怀疑偏倚 沾染偏倚 测量偏倚
来自被调查对象 来自调查者本身
来自研究对象的偏倚之无应答偏倚
子宫 内膜癌
有
服用雌激素
OR
有 无 合计 发生率(%)
59 89 148 39.86 1.67
无
42 106 148 28.38
合计 101 195 296 34.12
24.34,P0.037
选择偏倚的控制
对研究过程中可能出现的偏倚有充分的了解,在 设计时考虑周全 严格掌握研究对象的纳入和排除标准,保障较好 的代表性 病例对照研究中首选新病例,对照组不应为慢性 病病例 队列研究中增大样本量,降低失访,必要时将失 访人群特征与未失访人群对照 采用多重对照
对于一些敏感问题的调查,容易引起不应答偏 倚,例如我国南方调查农村婴儿死亡原因,有 28%的人拒绝提供婴儿死亡原因
来自研究对象的偏倚之回忆偏倚
回忆偏倚:因研究对象的记忆失真或记忆不完 整所造成的研究结果偏倚
病例对照研究和回顾性队列研究最容易出现回 忆偏倚
回忆偏倚的产生与调查时间至事件发生时间、 以及与事件的重要性有关,同时也与调查员的 调查过程和询问技术有关
5
15
20 25.00 4.06
无 合计
18 219 237 23 234 257
7.59 8.95
24.89,P0.027
现患病例-新发病例偏倚
又称奈曼氏偏倚(Neyman’s bias),主要是由 于研究中所用的病例类型不同所产生的差别
病例对照研究结果与队列研究的结果会有差 异
表2 冠心病与高胆固醇血症的关系 (病例对照研究)
Wilcox等在调查流产回忆准确性时发现,调查10年 前 流 产 的 有 82% 回 忆 完 整 , 调 查 20 年 前 流 产 的 有 73%回忆完整。在受孕前6周流产者能回忆起来的有 54%,而在受孕13周流产者能回忆起来的有93%
血胆固醇水平
冠心病
OR 2
P
高 低 合计 发生率(%)
有 38 113 151 25.17 1.16 0.29 0.589
无 34 117 151 22.52
合计 72 230 302 23.84
表2 冠心病与高胆固醇血症的关系 (队列研究)
冠心病
血胆固 醇水平
有
无
RR
合计
发病率 (%)
2
P
高 85 462 547 15.54 2.18 35.50 <0.001
医学科研中常见的偏倚类型及控制方法
(Bias and Control)
Department of Health Statistics,SMMU 2012.06.09
主要内容
偏倚的类型 混杂因素与交互作用 偏倚的控制
误差(error)
➢定义:
指对事物某一特征的度量值偏离真实值的部分, 即测量值与真实值之差。
表3a 妇女绝经期服用雌激素与子宫内膜癌的关系 (以阴道出血就诊的病例)
子宫
服用雌激素
内膜癌
有
无
OR
合计 发生率(%)
有
45 72 117 38.46 9.82
无 合计
7 110 117 52 182 234
5.98 22.22
235.70,P0.001
表3b 妇女绝经期服用雌激素与子宫内膜癌的关系 (以刮宫和子宫切除的病例)
无应答偏倚:研究对象拒绝回答或因研究对象 失访而缺失答案所造成的偏倚
是否有无应答偏倚取决于无应答者在疾病暴露 因素方面的特征是否与应答者有差异
美国曾采用邮寄问卷形式,调查美国退伍军人 吸烟习惯。30天后总结收集的回复,结果发现, 不 吸 烟 者 有 85% 回 复 了 问 卷 , 而 吸 烟 者 仅 67%