偏倚及控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
病例组特异度= 0.70,灵敏度= 0.90; 对照组特异度= 0.90,灵敏度= 0.60; 60 70 原OR= =3.5; 30 40 66 75 ˆ OR 5.8,发生正偏倚 25 34
常见的信息偏倚
5. 报告偏倚(reporting bias)
是由研究对象有意夸大或缩小某些信息
表10-11 均衡错分所致偏倚(病例组对照组特异度、灵敏度相同) 实际的暴露情况 病 例 组 对 照 组 暴露 未暴露 合计 暴露 未暴露 合计 错分暴露 54 12 66(a) 27 21 48(b) 未暴露 6 28 34(c) 3 49 52(d) 合 计 60(A) 40(C) 100(n1) 30(B) 70(D)100 (n2)
研究中的真实效应用RR(θ )表示: RR(θ )>1,为危险效应;
RR(θ )=1.0 ,为零效应(null value);
RR(θ )<1,为保护(预防)效应。 RR( )表示RR偏倚了的RR。
当真实效应为危险效应,即RR(θ)>1时,
Fra Baidu bibliotek
>θ >1,偏倚夸大了危险效应,为正偏倚;
θ > >1,偏倚缩小了危险效应,为负偏倚;
第九章
流行病学中常见的偏倚 及其控制
第一节 研究结果的变异性
一、概述 二、个体水平的变异性 三、群体水平的变异性
四、样本水平的变异性
第二节 研究的真实性
一、概述
真实性或效度(validity)是指研究收集的数 据、分析结果和所得结论与客观实际的符合程度。
二、内部真实性(internal validity) 三、外部真实性(external validity)
设 hA为A病(研究疾病)的入院率 hB为B病(对照疾病)的入院率 hC为C因素(研究因素)的入院率 当hA = hB时,不发生入院率偏倚; hC =0时,也不发生入院率偏倚。 当hA > hB,且hC > 0时,发生入院率偏倚,它使 OR值减小,偏倚程度的大小取决于hC的大小, hC 越小,偏倚程度越小。 当hA < hB,且hC > 0时,也发生入院率偏倚,它 使OR值增加,偏倚程度的大小也取决于hC的大小。
恶性黑素瘤住院而无高血脂人数:(5000-750)×60% =2550 骨折住院而无高血脂人数:(5000-750)×25%=1063 住院病例恶性黑素瘤同高血脂关联的OR=(570 ×1063)/(2550×413)=0.575 结论:以医院病例作为样本所得观察结果,高血脂是 恶性黑素瘤的保护因素,而骨折则是一危险因素。
9. 非同期对照偏倚
(non-contemporary comparing bias)
10. 异地对照偏倚 11. 易感性偏倚(susceptibility bias) 12. 时间效应偏倚(time effect bias) 13. 领先时间偏倚(lead time bias)
选择偏倚的控制
1.对整个研究中可能出现的各种选择偏倚应 有充分的了解,严密掌握对象选取的各个 环节; 2.遵循随机化抽样原则,避免样本选取的偏 向; 3.严格掌握研究对象的纳入与排除的标准;
常见的信息偏倚 1. 诊断怀疑偏倚(diagnostic suspicion bias) 2. 暴露怀疑偏倚(exposure suspicion bias) 3. 回忆偏倚(recalling bias) 4. 归类错误偏倚(misclassification bias)
4. 归类错误偏倚(misclassification bias)
1. 入院率偏倚(admission rate bias) 又称伯克森偏倚(Berkson’s bias)
是指利用医院或住院病人作为研究对象 时,由于入院率不同而导致的偏差。
表1 人群恶性黑素瘤、骨折两病及高血脂的人 群分布 病种 有高血脂者 750 750 无高血脂者 4250 4250 总人数 5000 5000
随机误差
抽样误差由总体中个体的变异引起, 抽样误差无一定方向,可相互抵消。
误差
系统误差:即偏倚。
(systematic error)
研究中常见的偏倚
一、偏倚的定义
偏倚(bias)指在研究设计、实施或分析阶 段,由于某种或某些因素的影响,使得研究 或推论的结果与真实的情况存在系统误差。
二、偏倚的方向 假定某一欲观察或测量效应值的真实值为θ , 而反映在样本中的观测值为 。设定凡是夸 大真实效应者为正偏倚,缩小真实效应者为 负偏倚。
当真实效应为保护效应,即RR(θ )<1时, θ < <1,缩小了保护效应,为负偏倚;
<θ <1,夸大了保护效应,为正偏倚。
颠倒偏倚(switchover bias),指无论θ >1或 θ <1,若θ 和 分别在1.0的两侧,则为颠倒 偏倚。即所产生的偏倚跨过零效应值1.0,由 保护效应偏离为危险效应或由危险效应偏离 为保护效应。
5. 资料校正方法
(三)混杂偏倚(confounding bias)
在评价被研究的因素和疾病之间的关联 时,由于一个或多个既与研究疾病有制约关 系,又与暴露因素密切相关的外来因素使得 资料中研究因素的效应与外来因素的效应混 在一起,从而全部或部分地掩盖或夸大了所 研究的因素与疾病之间的真实联系,这些影 响称之为混杂(confounding)或混杂偏倚。
又叫错分偏倚 均衡性错分 偏倚趋向无效值
非均衡性错分 正偏倚或负偏倚
表10-6 暴露组、非暴露组真实情况 病 人 非病人 合 计 暴 露 100 400 500 未暴露 80 420 500
100 / 500 100 80 RR 1.25; AR 0.04 80 / 500 500 500
90 / 500 90 90 ˆ ˆ RR 1.0; AR 0 90 / 500 500 500
队列研究中,若错分发生在暴露及非暴露 组间,均衡性错分导致:
ˆ ˆ RR 1.0; AR 0
表10-6 暴露组、非暴露组真实情况 病 人 非病人 合 计 暴 露 100 400 500 未暴露 80 420 500
产生混杂因素的条件:
1) 必须是所研究疾病独立的危险(预防)因 子;
ˆ R E 1.0 O df
2) 在暴露组和非暴露组间分布不均;
ˆ R D 1.0 O ef
3) 一定不是研究因素与研究疾病因果链上的 中间变量。
1.
E
2.
E
3.
E
4.
E
D
D
D
D
F
F
F F’
E:暴露因子 病
F F’
出现的系统误差。
(观察、收集资料及测量等实施阶段)
混杂偏倚 外来因素全部或部分掩盖或夸大了所研
究因素与疾病间的真实联系。
(设计、分析阶段)
(一)选择偏倚(selection bias) 在设计阶段选择观察对象时,由于选取 方式不当,导致被选入的对象同落选的对象 间与研究有关的特征方面有系统的差别,导 致研究结果系统地偏离真实情况,即选择偏 倚。
4.采取相应措施,尽量取得研究对象的合作, 以获得尽可能高的应答率;
5.尽量采取多种对照。
(二)信息偏倚(information bias) 在研究设计的实施阶段,在资料的观察、 测量及收集的方法上,诊断试验的灵敏度、特 异度方面以及患者在提供各种有关信息的准确 性方面都可能有所不足,且这种不足或缺陷在 各比较组间不一致,于是导致在研究的实施阶 段产生系统误差,又称为测量偏倚 (measurement bias)或观察偏倚 (observation bias)。
第三节 偏倚及其控制
一、误差(error)
科研设计、实施及分析过程中产生的各种 误差(error),可能导致研究结果不能 真实、精确地反映实际正确的结果。
误差:指对事物某一特征的度量值偏离真 实值的部分,即测量值与真实值之差。
误差的分类
指随机抽样所得均值对总体均值的 (random error)误差,主要由抽样误差引起。
例如:RR(θ )=0.5, RR( )=1.5,由 保护效应偏离为危险效应;或RR(θ )=1.5, RR( )=0.5 ,则由危险效应偏离为保护效 应。
三、偏倚的种类 选择偏倚研究者在挑选研究人群时,由于选择条
件受限制或设计失误所致的系统误差。 (设计阶段)
信息偏倚在收集和整理有关暴露或疾病资料时所
2. 检出征候偏倚(detection signal bias) 3. 患病率-发病率偏倚(prevalence-incidence bias),又叫奈曼偏倚(Neyman bias) 4. 无应答偏倚(nonrespondent bias)
5. 志愿者偏倚(volunteer bias)
6. 失访偏倚(loss-to follow-up bias) 7. 健康工人偏倚(healthy worker bias) 8. 转组偏倚(migration bias)
病 种
有高血脂者
无高血脂者
2550
总人数
3120
恶性黑素瘤(病例) 570
骨
折(对照)
413
1063
1476
根据不同的入院率计算住院病人数:
恶性黑素瘤伴有高血脂人数:(750×60%)+[(750750×60%)×40%]=570
骨折伴有高血脂人数:(750×25%)+[(750750×25%)×40%]=413
表10-7 50%暴露组人员错分到非暴露组的情况 病 人 非病人 合 计 暴 露 50 200 250 未暴露 130 620 750
50 / 250 50 130 ˆ ˆ RR 1.15; AR 0.027 130 / 750 250 750
表10-8 50%非暴露组人员错分到暴露组的情况 病 人 非病人 合 计 暴 露 90 410 500 未暴露 90 410 500
100 / 500 100 80 RR 1.25; AR 0.04 80 / 500 500 500
表10-10 均衡性错分发生在两组间情况 病 人 非病人 合 计 暴 露 100×0.8=80 420 500 未暴露 80×0.8=64 436 500
80 / 500 80 64 RR 1.25; AR 0.032 64 / 500 500 500
特异度= 0.70,灵敏度= 0.90; 60 70 原OR= =3.5; 30 40 66 52 ˆ OR 2.1,发生负偏倚 34 48
若对某种错分所用方法的灵敏度、特异度已 知,那么可用下列公式回复原有分布:
A pn1 c / p p 1 B pn2 d / p p 1 D n2 B
而导致的偏倚,故也被成为说谎偏倚。
6. 测量偏倚(detection bias)
指对研究所需指标或数据进行测定或测
量时产生的偏差。
信息偏倚的控制
1. 对拟进行的研究要制定明细的资料收集方法 和严格的质量控制方法; 2. 尽可能采用“盲法”(blinding)收集资料; 3. 尽量采用客观指标的信息; 4. 通过一定技巧调查远期暴露史(如联想回忆)
原有OR= 60×70/30×40
C n1 A
=3.5
例题中:A=(0.7×100-34)/(0.7+0.9-1)=60
B=(0.7×100-52)/(0.7+0.9-1)=30
C=100-60=40; D=100-30=70
表10-12 非均衡错分所致偏倚(病例组对照组特异度、灵敏度不同) 实际的暴露情况 病 例 组 对 照 组 暴露 未暴露 合计 暴露 未暴露 合计 错分暴露 54 12 66(a) 18 7 25(b) 未暴露 6 28 34(c) 12 63 75(d) 合 计 60(A) 40(C) 100(n1) 30(B) 70(D)100 (n2)
恶性黑素瘤 骨 折
恶性黑素瘤伴有高血脂同骨折伴有高血脂间的OR= (750×4250)/(4250×750)=1.0 结论:社区样本人群中恶性黑素瘤同高血脂无任何关 联。
现假定恶性黑素瘤和骨折入院率不同,分别为60%及 25%,另外有高血脂因素的入院率为40%
表2 来自医院恶性黑素瘤和骨折两病及高血脂的病例分布