预防医学-偏倚和病因
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
与其自身对暴露的易感性有关。由于各比较组中 的研究对象的易感性不同而产生的偏倚称之为易 感性偏倚
易感性偏倚(例)
健康工人效应(healthy worker effect ) 暴露于同一种危险因素后, 不同人的易感性可能不同, 高
易感性的人可能有主动避免继续暴露的倾向, 而低易感性 可能并不在意暴露.例如调查喷漆的职业暴露与患支气管 哮喘的关系时, 那些对油漆气味过敏或耐受性差的人, 可 能一开始就不选择喷漆工的职业, 或者虽然选择了这一职 业但因不适应而很快调离此岗位。这时的病例对照调查结 果, 将会低估暴露油漆后产生支气管哮喘的作用,甚至可 能得出暴露油漆与支气管哮喘无关的相反结论。在流行病 学观察研究中完全避免此类偏倚是困难的, 因此在评价职 业暴露的危险性时,应考虑易感性偏倚的问题,有利于获得 较客观的结论。
定义
研究对象的选取过程中,由于选取方式不当, 导致入选对象与未入选对象之间存在系统差异, 由此造成的偏倚称为选择偏倚。
常见选择偏倚
入院率偏倚 检出症候偏倚 现患病例-新病例偏倚 无应答偏倚 易感性偏倚 时间效应偏倚 领先时间偏倚
入院率偏倚
入院率偏倚( admission rate bias ),(伯克 森偏倚Berkson bias)
1.θ >1时: (1) θ ’>θ >1时,夸大危险效应,为正偏倚。 (2)θ >θ ’>1时,缩小危险效应,为负偏倚。
2.θ <1时: (1) θ ’<θ <1时,夸大保护效应,为正偏倚。 (2)θ <θ ’<1时,缩小保护效应,为负偏倚。
(二)趋向无效值偏倚、远离无效值偏倚或颠倒偏倚: 无效值指产生零效应的值。例如,对于RR或OR等 于1时即无效值。就RR或OR而言:
倚。
(2)RR=0.6 RR’=0.8时,为趋向无效值负偏 倚。
(3)RR=1.2 RR’=0.9时,为颠倒负偏倚。
二﹑常见偏倚及其分类
选择偏倚(selection bias) 信息偏倚(information bias) 混杂偏倚(confounding bias)
一、选择偏倚(selection bias)
由于入院率的不同,使本来不存在联系的B病与因素X之 间出现了统计学上的联系。这种联系是一种虚假的联系,此 即入院率偏倚。
检出症候偏倚
检出症候偏倚(detection signal bias,detection bias,unmasking bias) 某因素如能引起或促进某症候(与所研究疾病 的体征或症状类似)的出现,部分所研究的病例 因为某种与所研究疾病无关的症状或体征而就医, 接受多种检查,使该人群有较高的检出率,以致 得出该因素与该疾病相关联的错误结论。
时间效应偏倚
时间效应偏倚(time effect bias) ������ 对于肿瘤、冠心病等慢性病,从开始暴露于
内外危险因素到发病有一个漫长的发病过程。在 进行病例对照研究时,特别是在选择对照组时, 往往容易把暴露后即将发病的人、已发生早期病 变而未能检出的人作为非病例而进入对照组,从 而导致研究结果发生偏倚。
诊断怀疑偏倚:主要发生在随访性质的研究,如队 列研究、实验研究等。研究者事先已经知道了研究 对象对研究因素的暴露情况,因而会在研究过程中 对暴露组会更加仔细的寻找某种结果,但对于对照 组的研究对象则不会这样,从而产生偏倚。
暴露怀疑偏倚:发生于研究者事先知道研究对象患 有某种疾病,而在资料收集过程中会对患病者比对 未患病者更仔细收集暴露因素,而产生偏倚。
入院率偏倚(例)
病例 对照
入院率偏倚(例)
假设: ������ 患A病者的住院率为40%, ������ 患B病者的住院率为80%, ������ 暴露于因素X者的住院率为40%。 ������ A病、B病及因素X是独立的,这样实际住院
人数应为:
入院率偏倚(例)
患A病且暴露于因素X者为: 200×0.4+(200-200×0.4)×0.4=128 ������ 患A病而不暴露于因素X者为: 800×0.4=320 ������ 患B病且暴露于因素X者为: 200×0.8+(200-200×0.8)×0.4=176 ������ 患A病而不暴露于因素X者为: 800×0.8=640
陷等)与实施过程的不恰当所致。 内部真实性(internal validity)指研究结果能准确
反映目标人群真实状况的程度。 外部真实性(external validity)指研究结果被外推
至不同时间、不同地区、不同人群时所能反映的可 靠程度。
Random error and Bias
Random error
果系统的偏离真实值. ������ 特点: 具有方向性
可以测量其大小和方向 不能用统计学方法处理 能够预先考虑到而加于预防和控制
偏倚的方向: (一)正偏倚和负偏倚:
凡夸大真实效应者为正偏倚。 凡缩小真实效应者为负偏倚。 假如某特征的真实值为θ ,而测得值为θ ’。 θ =1.0为零效应; θ >1为危险效应; θ <1为保护效应。
1946年由J. Berkson 提出。是指利用医院就诊 或住院病人作为研究对象时,由于入院率的不同 而导致的偏差。
入院率偏倚(例)
若在某医院住院病人中选择研究对象进行病例对 照研究,以B病为对照研究A病与某因素X的关系。
设人群中A病与B病患者各为1000人,患这两种 疾病的病人,暴露于因素X者各为200人,非暴露 于因素X者各为800人,暴露率均为20%, OR=1,A病与因素X无关。
Bias
举例:用血压计和动脉内套管测量某人血压的系统误差和随机误 差可用以下图示。
动脉内套管测量均值 血压计法测量均值
发
系统误差
生
频 次
随机误差
80
100
图9-1 血压计法测量舒张压值的分布
舒张压 (mmHg)
(二)偏倚的概念
流行病学研究中的各种系统误差被称为偏倚(bias)。 ������ 概念:偏倚只指在研究或推论过程中所获得的结
提高精确性的方法
增加研究样本量: 样本量可用统计学中有关样本大小的公式计算。
样本量的大小与研究设计、研究总体、把握度等 因素有关。 提高信息获取的效率: 样本大小相同的两项研究,正确的设计者将获得 更加精确的估计,更具有统计效率。
2.流行病学研究的真实性
流行病学研究的真实性是研究中的系统误差的问题 系统误差:由研究设计(方法的本身特点、设计的缺
分类: 随机错分(无差异错分)偏倚 非随机错分(有差异错分)偏倚
随机错分:
指在对比的各组都存在相同比例的被错误分类的个体(研 究组与比较组错分的几率是相同的).
对研究结果的影响:
①在病例对照研究中,对两组暴露测量方法一致,而该暴 露变量是二分变量,一般来说,资料的效应估计(OR或 RR)低于实际值,使效应估计趋于无效值,低估研究因 素与疾病之间的联系。
例如, 在研究冠心病与高胆固醇血症的相关关系 的病例对照研究中, 其OR为1.6, 而在同一目标人 群中同样内容的队列研究, 其相对危险度达到 2.18. 试分析其原因
������ 其重要原因是病例对照研究时, 由于冠心病 的死亡病例不可能进入病例组, 而已确定为冠心 病者是存活的病例, 可能回改变原来的暴露状况, 如更注意饮食控制, 会使血胆固醇水平逐步下降, 甚至他们本身的胆固醇水平就比死亡病例低, 因 此会造成比值比趋向1的现象。
无应答偏倚
无应答偏倚(non-respondent bias) ������ 研究对象因各种原因对研究的内容不予回答而
产生的偏倚,称为无应答偏倚(non-respondent bias)
易感性偏倚
易感性偏倚 (susceptibility bias) ������ 研究对象是否发生疾病不仅与暴露有关,还
回忆偏倚:研究对象在回忆以往发生的事情或经历 时, 由于在准确性和完整性上的不同而产生的系 统误差.
报告偏倚: (说谎偏倚)由于研究对象有意夸大或缩 小某些信息而导致的系统误差.此类偏倚常见于对 一些敏感问题的调查.(例如对性问题的调查, 在校 学生的吸烟史,个人和家庭收入等)
测量偏倚: 对研究所需指标或数据进行测量时所 产生的系统误差。
当θ >1时,若θ ’>θ >1,则为远离无效值偏倚。 若θ >θ ’>1,则为趋向无效值偏倚。
当θ <1时,若θ ’<θ <1,则为远离无效值偏倚。 若θ <θ ’<1,则为趋向无效值偏倚。
(三)无论θ >1或θ <1,若θ 和θ ’在1的两侧,则为颠 倒偏倚。
3.举例: (1)RR=1.5 RR’=2.0时,为远离间偏倚(lead time bias) ������ 在应用筛检发现的病例进行预后或疗效研究
时,有相当一部分患者是属于早期病例,其生存 期自筛检之日算起。在观察某因素对预后的影响 时,即使措施无效,也会因为确诊时间的领先而 出现这些病例的生存期长于症状出现后被医院确 诊病例的生存期的假象。
二、信息偏倚(information bias)
定义
又称测量偏倚、观察偏倚或错误分类偏倚 (misclassification bias) ,是来自于测量或资 料收集方法的问题,使得获取的资料存在系统误差。 来源:测量方法有问题、诊断标准不明确,资料收 集不完整等。
常见信息偏倚
诊断怀疑偏倚(diagnostic suspicion bias) 暴露怀疑偏倚(exposure suspicion bias) 回忆偏倚(Recall Bias) 报告偏倚(reporting bias) 测量偏倚(detection bias) 错误分类偏倚(misclassification bias)
1.流行病学研究的精确性
流行病学研究中的精确性(Precision)就是研究中 随机误差的问题。
随机误差主要来源于研究对象的选择过程,即抽样。 随机误差不可避免,因此,精确性具有相对性,随
机误差可用统计学方法评价。 随机误差的大小(研究的精确性)与样本大小有关,
与抽样方法及观察值的变异(变量的变异度)有关。
检出症候偏倚(例)
子宫内膜癌与服用雌激素: 1975年Ziel等进行病例对照研究发现这两者之间
有密切的关系,其后又有许多学者报道了类似的研 究结果.对此类结果, 后来有学者发现:服雌激素导 致子宫容易出血频繁就医接受检查早发现(从而提 高了检出率,用这样的病人作研究病例时,由于服 用雌激素起了提醒作用, 造成了上面的错误结论.)
第四章 偏倚的控制与病因推断
刘伟新 公共卫生学院
第一节流行病学研究中的偏倚
一﹑偏倚的概念 • 流行病学研究的精确性 • 流行病学研究的真实性 • 偏倚的概念 二﹑常见偏倚及其分类 三﹑偏倚的控制
一﹑流行病学研究的精确性与真实性
误差 ������ 概念:真实值与研究结果值之差。 ������ 类型: 随机误差与系统误差 随机误差是流行病学研究的精确性问题 系统误差是流行病学研究的真实性问题
现患病例-新病例偏倚
现患病例-新病例偏倚(prevalence incidence bias,Neyman bias)
������ 1955年Neyman提出,指因现患病例与新 病例的构成不同,新发病例可以包括某种疾病的 各种类型的病例,包括病情较轻可能很快就痊愈 者以及病情较重可能很快就死亡者,而现患病例 仅包括新、旧病例,把已痊愈的轻型病例和由于 病重已死亡者排除在外。由于存活病例与死亡病 例、轻型病例和重型病例在一些特征上存在差异, 因此只研究现患病例将导致的偏倚。
所用仪器, 设备校正不准, 试剂不符合要求, 使用 方法的标准或程序不统一, 分析, 测试条件不一致, 以及操作人员的技术问题等等, 都可导致测量结 果的不正确。
错误分类偏倚(misclassification bias) 指由于在测量暴露和疾病时标准不统一或者方法
不当,导致在病例组与非病例组,暴露组与非暴露 组之间的错误分组,从而引起的偏倚。
易感性偏倚(例)
健康工人效应(healthy worker effect ) 暴露于同一种危险因素后, 不同人的易感性可能不同, 高
易感性的人可能有主动避免继续暴露的倾向, 而低易感性 可能并不在意暴露.例如调查喷漆的职业暴露与患支气管 哮喘的关系时, 那些对油漆气味过敏或耐受性差的人, 可 能一开始就不选择喷漆工的职业, 或者虽然选择了这一职 业但因不适应而很快调离此岗位。这时的病例对照调查结 果, 将会低估暴露油漆后产生支气管哮喘的作用,甚至可 能得出暴露油漆与支气管哮喘无关的相反结论。在流行病 学观察研究中完全避免此类偏倚是困难的, 因此在评价职 业暴露的危险性时,应考虑易感性偏倚的问题,有利于获得 较客观的结论。
定义
研究对象的选取过程中,由于选取方式不当, 导致入选对象与未入选对象之间存在系统差异, 由此造成的偏倚称为选择偏倚。
常见选择偏倚
入院率偏倚 检出症候偏倚 现患病例-新病例偏倚 无应答偏倚 易感性偏倚 时间效应偏倚 领先时间偏倚
入院率偏倚
入院率偏倚( admission rate bias ),(伯克 森偏倚Berkson bias)
1.θ >1时: (1) θ ’>θ >1时,夸大危险效应,为正偏倚。 (2)θ >θ ’>1时,缩小危险效应,为负偏倚。
2.θ <1时: (1) θ ’<θ <1时,夸大保护效应,为正偏倚。 (2)θ <θ ’<1时,缩小保护效应,为负偏倚。
(二)趋向无效值偏倚、远离无效值偏倚或颠倒偏倚: 无效值指产生零效应的值。例如,对于RR或OR等 于1时即无效值。就RR或OR而言:
倚。
(2)RR=0.6 RR’=0.8时,为趋向无效值负偏 倚。
(3)RR=1.2 RR’=0.9时,为颠倒负偏倚。
二﹑常见偏倚及其分类
选择偏倚(selection bias) 信息偏倚(information bias) 混杂偏倚(confounding bias)
一、选择偏倚(selection bias)
由于入院率的不同,使本来不存在联系的B病与因素X之 间出现了统计学上的联系。这种联系是一种虚假的联系,此 即入院率偏倚。
检出症候偏倚
检出症候偏倚(detection signal bias,detection bias,unmasking bias) 某因素如能引起或促进某症候(与所研究疾病 的体征或症状类似)的出现,部分所研究的病例 因为某种与所研究疾病无关的症状或体征而就医, 接受多种检查,使该人群有较高的检出率,以致 得出该因素与该疾病相关联的错误结论。
时间效应偏倚
时间效应偏倚(time effect bias) ������ 对于肿瘤、冠心病等慢性病,从开始暴露于
内外危险因素到发病有一个漫长的发病过程。在 进行病例对照研究时,特别是在选择对照组时, 往往容易把暴露后即将发病的人、已发生早期病 变而未能检出的人作为非病例而进入对照组,从 而导致研究结果发生偏倚。
诊断怀疑偏倚:主要发生在随访性质的研究,如队 列研究、实验研究等。研究者事先已经知道了研究 对象对研究因素的暴露情况,因而会在研究过程中 对暴露组会更加仔细的寻找某种结果,但对于对照 组的研究对象则不会这样,从而产生偏倚。
暴露怀疑偏倚:发生于研究者事先知道研究对象患 有某种疾病,而在资料收集过程中会对患病者比对 未患病者更仔细收集暴露因素,而产生偏倚。
入院率偏倚(例)
病例 对照
入院率偏倚(例)
假设: ������ 患A病者的住院率为40%, ������ 患B病者的住院率为80%, ������ 暴露于因素X者的住院率为40%。 ������ A病、B病及因素X是独立的,这样实际住院
人数应为:
入院率偏倚(例)
患A病且暴露于因素X者为: 200×0.4+(200-200×0.4)×0.4=128 ������ 患A病而不暴露于因素X者为: 800×0.4=320 ������ 患B病且暴露于因素X者为: 200×0.8+(200-200×0.8)×0.4=176 ������ 患A病而不暴露于因素X者为: 800×0.8=640
陷等)与实施过程的不恰当所致。 内部真实性(internal validity)指研究结果能准确
反映目标人群真实状况的程度。 外部真实性(external validity)指研究结果被外推
至不同时间、不同地区、不同人群时所能反映的可 靠程度。
Random error and Bias
Random error
果系统的偏离真实值. ������ 特点: 具有方向性
可以测量其大小和方向 不能用统计学方法处理 能够预先考虑到而加于预防和控制
偏倚的方向: (一)正偏倚和负偏倚:
凡夸大真实效应者为正偏倚。 凡缩小真实效应者为负偏倚。 假如某特征的真实值为θ ,而测得值为θ ’。 θ =1.0为零效应; θ >1为危险效应; θ <1为保护效应。
1946年由J. Berkson 提出。是指利用医院就诊 或住院病人作为研究对象时,由于入院率的不同 而导致的偏差。
入院率偏倚(例)
若在某医院住院病人中选择研究对象进行病例对 照研究,以B病为对照研究A病与某因素X的关系。
设人群中A病与B病患者各为1000人,患这两种 疾病的病人,暴露于因素X者各为200人,非暴露 于因素X者各为800人,暴露率均为20%, OR=1,A病与因素X无关。
Bias
举例:用血压计和动脉内套管测量某人血压的系统误差和随机误 差可用以下图示。
动脉内套管测量均值 血压计法测量均值
发
系统误差
生
频 次
随机误差
80
100
图9-1 血压计法测量舒张压值的分布
舒张压 (mmHg)
(二)偏倚的概念
流行病学研究中的各种系统误差被称为偏倚(bias)。 ������ 概念:偏倚只指在研究或推论过程中所获得的结
提高精确性的方法
增加研究样本量: 样本量可用统计学中有关样本大小的公式计算。
样本量的大小与研究设计、研究总体、把握度等 因素有关。 提高信息获取的效率: 样本大小相同的两项研究,正确的设计者将获得 更加精确的估计,更具有统计效率。
2.流行病学研究的真实性
流行病学研究的真实性是研究中的系统误差的问题 系统误差:由研究设计(方法的本身特点、设计的缺
分类: 随机错分(无差异错分)偏倚 非随机错分(有差异错分)偏倚
随机错分:
指在对比的各组都存在相同比例的被错误分类的个体(研 究组与比较组错分的几率是相同的).
对研究结果的影响:
①在病例对照研究中,对两组暴露测量方法一致,而该暴 露变量是二分变量,一般来说,资料的效应估计(OR或 RR)低于实际值,使效应估计趋于无效值,低估研究因 素与疾病之间的联系。
例如, 在研究冠心病与高胆固醇血症的相关关系 的病例对照研究中, 其OR为1.6, 而在同一目标人 群中同样内容的队列研究, 其相对危险度达到 2.18. 试分析其原因
������ 其重要原因是病例对照研究时, 由于冠心病 的死亡病例不可能进入病例组, 而已确定为冠心 病者是存活的病例, 可能回改变原来的暴露状况, 如更注意饮食控制, 会使血胆固醇水平逐步下降, 甚至他们本身的胆固醇水平就比死亡病例低, 因 此会造成比值比趋向1的现象。
无应答偏倚
无应答偏倚(non-respondent bias) ������ 研究对象因各种原因对研究的内容不予回答而
产生的偏倚,称为无应答偏倚(non-respondent bias)
易感性偏倚
易感性偏倚 (susceptibility bias) ������ 研究对象是否发生疾病不仅与暴露有关,还
回忆偏倚:研究对象在回忆以往发生的事情或经历 时, 由于在准确性和完整性上的不同而产生的系 统误差.
报告偏倚: (说谎偏倚)由于研究对象有意夸大或缩 小某些信息而导致的系统误差.此类偏倚常见于对 一些敏感问题的调查.(例如对性问题的调查, 在校 学生的吸烟史,个人和家庭收入等)
测量偏倚: 对研究所需指标或数据进行测量时所 产生的系统误差。
当θ >1时,若θ ’>θ >1,则为远离无效值偏倚。 若θ >θ ’>1,则为趋向无效值偏倚。
当θ <1时,若θ ’<θ <1,则为远离无效值偏倚。 若θ <θ ’<1,则为趋向无效值偏倚。
(三)无论θ >1或θ <1,若θ 和θ ’在1的两侧,则为颠 倒偏倚。
3.举例: (1)RR=1.5 RR’=2.0时,为远离间偏倚(lead time bias) ������ 在应用筛检发现的病例进行预后或疗效研究
时,有相当一部分患者是属于早期病例,其生存 期自筛检之日算起。在观察某因素对预后的影响 时,即使措施无效,也会因为确诊时间的领先而 出现这些病例的生存期长于症状出现后被医院确 诊病例的生存期的假象。
二、信息偏倚(information bias)
定义
又称测量偏倚、观察偏倚或错误分类偏倚 (misclassification bias) ,是来自于测量或资 料收集方法的问题,使得获取的资料存在系统误差。 来源:测量方法有问题、诊断标准不明确,资料收 集不完整等。
常见信息偏倚
诊断怀疑偏倚(diagnostic suspicion bias) 暴露怀疑偏倚(exposure suspicion bias) 回忆偏倚(Recall Bias) 报告偏倚(reporting bias) 测量偏倚(detection bias) 错误分类偏倚(misclassification bias)
1.流行病学研究的精确性
流行病学研究中的精确性(Precision)就是研究中 随机误差的问题。
随机误差主要来源于研究对象的选择过程,即抽样。 随机误差不可避免,因此,精确性具有相对性,随
机误差可用统计学方法评价。 随机误差的大小(研究的精确性)与样本大小有关,
与抽样方法及观察值的变异(变量的变异度)有关。
检出症候偏倚(例)
子宫内膜癌与服用雌激素: 1975年Ziel等进行病例对照研究发现这两者之间
有密切的关系,其后又有许多学者报道了类似的研 究结果.对此类结果, 后来有学者发现:服雌激素导 致子宫容易出血频繁就医接受检查早发现(从而提 高了检出率,用这样的病人作研究病例时,由于服 用雌激素起了提醒作用, 造成了上面的错误结论.)
第四章 偏倚的控制与病因推断
刘伟新 公共卫生学院
第一节流行病学研究中的偏倚
一﹑偏倚的概念 • 流行病学研究的精确性 • 流行病学研究的真实性 • 偏倚的概念 二﹑常见偏倚及其分类 三﹑偏倚的控制
一﹑流行病学研究的精确性与真实性
误差 ������ 概念:真实值与研究结果值之差。 ������ 类型: 随机误差与系统误差 随机误差是流行病学研究的精确性问题 系统误差是流行病学研究的真实性问题
现患病例-新病例偏倚
现患病例-新病例偏倚(prevalence incidence bias,Neyman bias)
������ 1955年Neyman提出,指因现患病例与新 病例的构成不同,新发病例可以包括某种疾病的 各种类型的病例,包括病情较轻可能很快就痊愈 者以及病情较重可能很快就死亡者,而现患病例 仅包括新、旧病例,把已痊愈的轻型病例和由于 病重已死亡者排除在外。由于存活病例与死亡病 例、轻型病例和重型病例在一些特征上存在差异, 因此只研究现患病例将导致的偏倚。
所用仪器, 设备校正不准, 试剂不符合要求, 使用 方法的标准或程序不统一, 分析, 测试条件不一致, 以及操作人员的技术问题等等, 都可导致测量结 果的不正确。
错误分类偏倚(misclassification bias) 指由于在测量暴露和疾病时标准不统一或者方法
不当,导致在病例组与非病例组,暴露组与非暴露 组之间的错误分组,从而引起的偏倚。