偏倚及其控制

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

样本大小
7 南京医科大学康达学院
变异的水平
变异性的水平 个体水平 群体水平 样本水平 变异的来源 个体生物学变异、测量误差 个体间遗传学变异、环境变异、 测量误差 抽样方式、样本大小、测量误差
8
南京医科大学康达学院
源群体
180 ,174,215,305 233,276,146,195
样本A
高胆固醇率
1200
1200 2400
4800
4800 9600
6000
6000 12000
21
南京医科大学康达学院
三、某医院中调查全部病人的结果
假定三种疾病的入院率分别为: 皮肤癌=60% 骨折=25%
高血压=40%
则有: 皮肤癌 not 高血压=0.6×4800=2880 骨折 not 高血压=0.25×4800=1200 皮肤癌 with 高血压=0.6×1200+0.4×(1200-720)=912 骨折 with 高血压=0.25×1200+0.4×(1200-300)=660 有高血压 皮肤癌患者 骨折患者 合计 912 660 1572 无高血压 2880 1200 4080 合计 3792 1860 5652

所以,对当前吸烟与肺气肿开展横断面研究,计算出来的 现患比 (prevalence ratio)会低估真实的关联
23
南京医科大学康达学院
临床试验中的选择偏倚

临床试验中最大的选择偏倚来源仍是失访

例如,
☺ ☺
某药物不良反应更常发生于病重者 发生不良反应者更易失访

于是:

药物治疗组最后坚持随访的人中病重者少 (即,
心肌梗死
60
40
心肌梗死
60
40
40 60 对照 OR= (60×60)/(40×40)=2.3
32 68 对照 OR= (60×68)/(40×32)=3.2
34 南京医科大学康达学院
信息偏倚的测量
RR ' RR 信息偏倚 RR

信息偏倚 OR 'OR OR
若信息偏倚 = 0,则不存在选择偏倚 若信息偏倚 > 0,则存在选择偏倚,此时 OR ' OR 若信息偏倚 < 0,则存在选择偏倚,此时 OR ' OR
概述
第一节 选择性偏倚 第二节 信息偏倚 第三节 混杂偏倚 总结
4
南京医科大学康达学院
概 述
一、研究结果的变异性(variability) 变异的来源
生物学变异 测量变异 随机变异 系统变异
5 南京医科大学康达学院
6
南京医科大学康达学院
系统误差、随机误差和样本大小的关系
误 差
随机误差 系统误差
信息截尾)

药物治疗组表现为药效更好
24
南京医科大学康达学院
5、测量
方法:在理论上可以通过比较总人群与实际抽样人群研究 疾病与暴露因素的分布的两个四格表进行测量。 举例:以病例对照研究为例
25
南京医科大学康达学院
总人群
AD OR BC
样本人群
OR 0 OR
根据选择概率

A0 D 0 OR 0 0 BC
9
南京医科大学康达学院
二、研究的真实性(Validity) 概念
研究收集的数据、分析结果和所得结论与客观 实际的符合程度。也称“有效性”、“效度”。
影响真实性的因素
随机误差 系统误差
10
南京医科大学康达学院
真实性的两个方面:
内部真实性(internal validity) 定义 研究结果与实际研究对象真实情况的符合程度,回 答一个研究本身是否真实或有效。 改善措施 限制研究对象类型 限定研究的环境条件 限定干预措施
2 = 81.3
OR = 0.58 ( 0.51 - 0.65 )
22 南京医科大学康达学院
横断面研究中的选择偏倚
例如,吸烟与肺气肿

吸烟是致肺气肿的原因之一,有肺气肿的人继续吸烟较不
吸烟者,生存期缩短

因此,对肺气肿患者进行横断面研究,可能更多接受调查 的是不吸烟的人 (因为继续吸烟的人生存期也短)
35
南京医科大学康达学院
6、控制 (1)制定研究的资料收集方法和严格的质量控制方法
(2)尽可能采用盲法收集资料
(3)尽量采用客观指标 (4)提高询问技巧或通过适当的调查技术以避免回忆 偏倚 (5)对资料进行校正
36
南京医科大学康达学院
第三节 混杂偏倚(confounding bias)
0
选择偏倚的大小和方向可表示为:
OR0 OR 选择偏倚 1 OR
若选择偏倚 = 0,即 1 ,则不存在选择偏倚 若选择偏倚 > 0,即 1 ,则存在选择偏倚,此时 OR 0 OR 若选择偏倚 < 0,即 1 ,则存在选择偏倚,此时 OR 0 OR
• 产生虚假和间接联系的结论
15 南京医科大学康达学院
★ 统计学联系的本质
病因 + 偏倚 + 机遇
偏倚可导致:虚假联系+间接联系 ★ 偏倚的种类
概括起来三大类
选择性偏倚
信息偏倚
混杂偏倚
16
南京医科大学康达学院
第一节 选择性偏倚(selection bias)
1、定义 由于选择研究对象方法上的错误或缺点使研
18
南京医科大学康达学院
3、来源
( 1 )任意挑拣样本结构 (sampling frame) ,即所谓“典 型 样本”。常见于现况研究和病例对照研究 (2)主观挑拣研究对象 (3)失访或无应答(lost to follow-up or nonrespondent) (4)入院率的影响
(5)根据暴露信息作出诊断的病例,再用这类病例去
26 南京医科大学康达学院
6、控制
(1) 首先研究者对在整个研究中可能出现的各种选择偏 倚应有充分的了解、掌握 (2) 严格掌握研究对象的纳入与排除标准 ① 不任意挑拣样本结构 ② 不任意挑拣研究对象 (3) 尽量获得尽可能高的应答率。应答率达90%以上 (4) 尽量采用多种对照 (5) 医院病例作为研究对象,下结论要慎重
2 南京医科大学康达学院
5、有人调查喝生水与某病的关联,进行了病例对照研 究。病例组当面询问其喝生水的情况,对照组用电
话询问,结果如下:
病例组 喝生水 不喝生水 400 250 对照组 400 500
2 = 44.16 , OR= 2.00
结论:喝生水和某病有关联。
3 南京医科大学康达学院
讲课提纲
11
南京医科大学康达学院
外部真实性(external validity)
研究结果与推论对象真实情况的符合程度,又称普 遍性(generalizability),回答一个研究能否推广 应用到研究对象以外的人群。
12
南京医科大学康达学院
Other populations
?external validity
5、测量
以队列研究资料为例,论述错分偏倚产生的条件和类型
31
南京医科大学康达学院
错分不产生偏倚的条件是 RR=RR’, 也即
ac ab a 'c' a 'b'
当暴露组和非暴露组检查的灵敏度(Se)和阳性预测值 (PPV)都相等时,即可满足上述条件。 暴露组 非暴露组
a Se ac
“说谎偏倚”
(3) 诊断怀疑偏倚(diagnostic suspicion bias) 又称“疑诊偏倚” (4) 暴露怀疑偏倚(exposure suspicion bias) (5) 测量偏倚(detection bias)
(6) 诱导偏倚(inducement bias)
30
南京医科大学康达学院
33
南京医科大学康达学院
非特异性错误分类
研究真实数据 高脂肪 膳食 心肌梗死 60 低脂肪 膳食 40 心肌梗死 错误分类数据 高脂肪 膳食 48 低脂肪 膳食 52
Leabharlann Baidu对照
40
60
对照
32
68
OR= (60×60)/(40×40)=2.3
OR= (48×68)/(52×32)=2.0
特异性错误分类 研究真实数据 高脂肪 膳食 低脂肪 膳食 错误分类数据 高脂肪 膳食 低脂肪 膳食
disease
exposure
+ -
+ ?internal validity
Reference/target/sou rce population
Study sample
13 南京医科大学康达学院
内部真实性与外部真实性的联系
推论代表性不好,内部真实性可能好,而外部真实 性差。 增加研究对象的同质性(如限制类型如年龄、职业、 体质特征或疾病分型等),可改善内部真实性。 增加研究对象的异质性,可改善外部真实性。
28 南京医科大学康达学院
3、来源
① 检测方法不统一
② 诊断标准不统一
③ 观察条件不统一 ④ 询问方式不统一 ⑤ 研究对象引起,如记忆不准、态度的影响等 ⑥ 综合引起的偏倚,“诱、供、信”造成
29
南京医科大学康达学院
4、种类
(1) 回忆偏倚(recall bias)
(2) 报告偏倚(reporting bias)
究结果系统地偏离真实值。
2、实质 被选入的研究对象与没有被选者特征上的差
异所造成,造成样本不能代表总体,或两个
样本(或两组研究对象)不是来自同一总体,
后者造成研究之外的因素在两组分布不均衡。
17
南京医科大学康达学院
选择偏倚


概述:威胁内部真实性
选择偏倚 (根据研究设计)
☻ ☻ ☻

描述性研究 病例对照研究 横断面研究 纵向研究 (观察性或实验性)
205,276,195,215,170
= 40% = 20% = 0%
205,188,190,295
170,164,248,162 220,219,228,250
样本B
295,146,220,162,228
样本C
219,164,190,188,233
高胆固醇率 = 25% (>240mg/dL)
源群体与样本高胆固醇率的样本变异性示例
27
南京医科大学康达学院
第二节 信息偏倚(information bias)
又称观察偏倚、测量偏倚、衡量偏倚
1、定义 在收集资料的过程中,由于测量暴露或/和
结局的方法缺陷,致使获 得的信息产生系 统误差。
2、本质 通常表现为研究对象的某种特征被错误分类
(misclassification),也即使用的方法偏离了 金标准。在对疾病状态和暴露状态判断时都 有可能发生。
a PPV ab PPV ' a' a 'b'
a' Se ' a ' c '
若Se=Se’,PPV=PPV’
ac ab a 'c' a 'b'
32 南京医科大学康达学院
根据各组检查的灵敏度(Se)和特异度(Sp)是否相 同,分为无差异错分偏倚(非特异性错分偏倚)和有差 异错分偏倚(特异性错分偏倚)两种。 非特异性错分 Se=Se’,Sp=Sp’ 但RR≠RR’或OR≠OR’ 特异性错分 Se与Se’或Sp与Sp’至少有一对不等 且RR≠RR’或OR≠OR’ 偏倚方向不确定 偏倚方向趋向 1
偏倚及其控制
Bias and Control
问题与案例讨论
1、如何认识和评价个体和群体的变异? 2、随机误差和系统误差的区别? 3、有人研究HBsAg携带者孕妇宫内传播HBV的频率, 共检查16例引产死胎,其中4例胎儿肝内HBsAg阳 性,从而得出HBsAg携带者孕妇发生宫内HBV传播 的频率高达25%的结论。 4、有人调查公鸭和母鸭患某病的情况,检查市场上出 售的公鸭3028只,母鸭239只,其患病率分别为4.9% (148/3028)和19.7%(47/239)。因而作者得出某病母 鸭患病率比公鸭高的结论。
排除偏倚(exclusive bias)
无应答偏倚(non-respondent bias )
20
南京医科大学康达学院
举例:入院率偏倚
皮肤癌和高血压关系的病例对照研究
一、病例和对照的选择 病例组:皮肤癌患者 二、某社区全部人群调查结果
有高血压 无高血压 合计
对照组:骨折患者
皮肤癌患者
骨折患者 合计
研究该暴露与疾病的联系。
19 南京医科大学康达学院
4、种类
入院率偏倚(admission rate bias ) Berkson’s bias
现患病例或新发病例偏倚(prevalence-incidence bias ) Neyman bias 检出信号偏倚(detection signal bias ) 易感性偏倚(susceptibility bias )
在实际研究需综合考虑研究对象的同质性和异质性 问题。
14
南京医科大学康达学院
三、偏倚 (bias)
概念 在研究设计和实施中出现的系统误差使研究结果系统地 偏离真实值,以及解释结果的片面性,称为偏倚 (bias)。 偏倚的后果 描述性研究 分析性研究 实验性研究 • 样本对总体的推断出现系统误差
• 也可得出虚假和间接联系的假设
相关文档
最新文档