偏倚及其控制

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究者怀虑结论,考虑到其中可能混杂其它因素 ,如吸烟对喝咖啡与心肌梗塞MI间关系的影响,进一 步分层分析得到。表1.2 Smoker MI NoMI % Coffee 80 40 67 Noffee 20 10 67 相对危险度 OR=1 , Pr = 1.00, Nosmoker MI NoMI % 10 20 33 40 80 33 OR=1 Pr = 1.00


严格掌握研究对象纳入与排除的标准。
在研究中采取相应措施,以获得尽可能高的应答率,
并对无应答者进行评价。

尽量采用多种对照。
二、信息偏倚(information bias)
定 义
又称测量偏倚或观察偏倚,是来自于测量或 资料收集方法的问题,使得获取的资料存在系统误 差。由于流行病学的暴露或疾病多为分类测量,所 以 信 息 偏 倚 又 可 称 为 错 误 分 类 偏 倚 (misclassification bias)。 信息偏倚同样影响描述性研究和分析性研究 的结果。
研究的偏倚
选择偏倚 信息偏倚 混杂偏倚 混杂偏倚的分层分析
1946年,Berkson做最著名的偏倚研究并给予证实, 又称为Berkson偏倚。 1976年,Miettinen详细讨论了偏倚的定义,并给出 分类框架,分三类 选择偏倚
信息偏倚
混杂偏倚
一、选择偏倚(selection bias)
定义 研究对象的选取过程中,由于选取方式不当,导
Nishiyama等(1962)对儿童甲状腺癌过去放射性物质暴露 史的调查,在36例和22例两组患儿中, 以常规和查阅医疗记录方法调查:28%和0 而经过深入的调查和询问,有暴露史者分别达47%和50%。

3. 回忆偏倚

定义:是指研究对象在回忆以往发生的事情或经历时, 由于在准确性和完整性上的差异所致的系统误差。 产生原因: 调查事件发生频率低,未给研究对象留下深刻印象而被 遗忘 调查事件是很久以前发生的事情,研究对象记忆不清 研究对象对调查内容或事件关心程度不同,回忆认真程 度不同
• 不同疾病在不同医院的就诊率或住院率各异,其原因是多方面 的 • 医院:技术专长、服务质量
• 患者:疾病严重程度、经济状况、就诊是否方便
两类调查对象估计药物与疾病关联强度的比较
可疑药物 临床疾病 比值比(OR)
以社区为基础
水杨酸类 水杨酸类 过敏 疲乏 1.15 2.09
以医院为基础
0.18 0.72


3. 检出症候偏倚
(detection signal bias,)
指某因素与某疾病在病因学上虽无关联, 但由于该因素的存在而引起该疾病症状 或体征的出现,从而使患者及早就医, 接受多种检查,使该人群有较高的检出 率,以致得出该因素与该疾病相关联的 错误结论。
4. 检出症候偏倚(例)
子宫内膜癌与服用雌激素:


在病例对照研究或横断面研究时,除了很难调查那些死亡病例外, 对那些病程短、已痊愈的病例,轻型、不典型病例、隐伏期的病 例也很难进行调查。 此外,某些病例在患病后,可能会改变原来的暴露情况。

例如 Friedman等人在美国弗明汉地区对心血管系统 疾病的研究中发现
男性居民在队列研究中,具有高胆固醇水平的人,患冠心 病的RR值为2.4; 而在病例对照研中,病例组与对照组却无明显差异 (OR=1.16)。 进一步分析发现,患冠心病的病人在就诊被诊断为该病后, 会改变其原来的生活习惯或嗜好,如戒烟、多食低胆固醇 食物、多进行体育锻炼等等,从而使血中胆固醇水平降低, 或与正常人相比胆固醇水平增长速度较慢所致。
0.01
0.11 0.47 <0.01
2. 现患病例-新病例偏倚
(prevalence incidence bias,Neyman bias)
1955年Neyman提出,在进行回顾性调查时,研究者收集的病例通常 只包括调查时的现患病人,无法对那些因患该病而死亡的病例进 行调查,由此而得出的某种因素与某种疾病的联系会与队列研究 的结果有很大差异。
p
0.02 0.02
缓泻药
缓泻药 安眠药
运动骨骼系疾病
关节炎类风湿病 循环系疾病
1.53
1.48 6.38
5.07
5.00 3.72
0.06
0.01 0.32
维生素类
维生素类 心脏病类 心脏病类
过敏
外伤 循环系疾病 关节炎类风湿病
1.76
0.61 30.65 3.46
0.00
1.92 19.17 49.92
研究的解说涉及到研究的真实性的
问题。研究的真实性直接关系到是否获
得正确的结论,而真实性需要通过变异
性估计来确定。
研究的真实性


内部真实性 外部真实性
一、概 述
真实性(效度) 定义 指研究收集的数据、分析结果和所得结论与客 观实际的符合程度。
研究误差 真实性的反面变异可以是真实的 (如生物学个体变异),而反映研究误差 的变异肯定是不真实的。
together ),这里是指暴露因素对疾病的独立效应
与混杂因素的效应混在一起,造成对暴露因素效
应的估计偏倚。
判定原则
比较混杂因素调控前后的暴露因素效应估计
值,如果存在有意义的差异,就产生了混杂偏倚。
调控的统计方法
设计阶段:标准化率、分层和多变量分析 设计阶段:配比、随机化分配或限制进入
四、混杂偏倚的分层分析


信息偏倚的控制
• 严格的质量控制 • 诊断、测量方法要统一
• 盲法的应用
• 尽量采用客观指标
• 资料校正方法
三、混杂偏倚(confounding bias)
定义
是指暴露因素与疾病发生的相关 ( 关联 ) 程度受
到其他因素的歪曲或干扰。
混 杂 的 本 来 含 义 是 “ 混 合 掺 杂 ” ( mixing

研究因素 外部因素
结局
流行病学研究中随机误差
随机误差是流行病学研究中的精确性(Precision) 问题。 由于随机误差不可避免,精确性具有相对性,随 机误差可用统计学方法评价。 随机误差的大小(研究的精确性)与样本大小有 关,与抽样方法及观察值的变异(变量的变异度) 有关。

提高精确性的方法

增加研究样本量
样本量可用统计学中有关样本大小的公式计算。样本量的 大小与研究设计、研究总体、把握度等因素关。

提高信息获取的效率
样本大小相同的两项研究,正确的设计者将获得更加精确 的估计,更具有统计效率。
偏倚的概念
定义:指在研究或推论过程中所获得的结果系统 的偏离真实值。 偏倚的方向: OR:真值 OR’:测量值 正偏倚与负偏倚、 趋于无效假设 远离无效假设 颠倒
偏倚的大小
偏倚的大小通常以相对数表示:
测量值 - 真实值 Bias= --------------------- ×100% 真实值
偏倚的大小
RR’=1.2 RR=2.00
1.2 -2 Bias= ------------×100%= -40% 2 大小:40% 方向:为负Bias , 趋于无效假设。
健康工人效应(healthy worker effect ) 子宫颈反映异常与OC的关系 肾结石与喝茶习惯的关系 比较组间对疾病的易感性存在差异


易感性偏倚的典型例子是在对职业性疾病研究中的健 康工人效应(healthy worker effect )。
当在对某一有毒物质对作业工人的健康危害进行研究时,可能会 发现暴露于该有毒物质者的死亡率或某些疾病的发病率反而会比 一般人群低。原因可能是接触此类有毒物质者,由于工作性质的 需要,其本来的健康水平就比一般人群高,或者对毒物的耐受性 比一般人群要强,因而对某些疾病的易感性低所致。不认识这一 点就可能会导致错误的结论。
4. 报告偏倚

定义:只由研究对象有意的夸大或缩小某些信息而导致 的偏倚,因此亦被称为说谎偏倚。 例:敏感性问题、吸烟史等 涉及劳保、福利等一些问题的调查如职业危害 对职业人群进行进行健康调查

5. 测量偏倚

定义:指对研究所需指标或数据进行测定或测量时产 生的偏差。 例:仪器、设备校正不准确,试剂不符合要求 使用方法的标准或程序不统一 操作人员的技术问题 调查表设计的科学性,记录是否完整,调 人员对工作的认真程度、访问方式
服雌激素 导致子宫容易出血
接受检查

频繁就医
早发现
在同一医院不同科室进行的进一步研究发现,在服用雌激素的子 宫内膜癌病人中,79%为早期病人;而在非服用雌激素的子宫内 膜癌病人中,早期病人仅占55%。
5. 易感性偏倚 ( susceptibility bias )
• 研究对象是否暴露于某一可疑致病因素,既与各种客观因素 有关,也与研究对象的主观因素有关。这些因素可能直接 或间接的影响观察人群或对照人群对所研究疾病的易感性, 导致某因素与某疾病间的虚假联系。
信息偏倚的来源
• 测量不可靠(暴露、疾病) • 诊断标准不明确(疾病) • 原始记录不完整
常见信息偏倚
• 诊断怀疑偏倚(diagnostic suspicion bias) • 暴露怀疑偏倚(exposure suspicion bias) • 回忆偏倚(Recall Bias) • 报告偏倚 (reporting bias) • 测量偏倚(detection bias)等

偏倚的方向
正偏倚与负偏倚 OR’ > OR: 正偏倚 OR’ < OR: 负偏倚
偏倚的方向



趋于无效假设 (toward the null) OR’=1.3 OR=5.0 OR’=0.9 OR=0.3 远离无效假设 (away from the null) OR’=8.0 OR=2.0 OR’=0.5 OR=0.8 颠倒(switchover bias) OR’=0.5 OR=2.0 OR’=2.0 OR=0.8
1.诊断怀疑偏倚

定义:由于研究者事先了解研究对象对研究因素的暴 露情况,怀疑其已患某病或在主观上倾向于应该出现 某种阳性结果,于是在作诊断和分析时,倾向于自己 的判断。
例:对诊断亚临床病例,判断药物的毒副反应

2. 暴露怀疑偏倚

定义:研究者若事先了解研究对象的患病情况或某种结局, 可能会对其与对照组不可比的方法探询认为与某病或某结局 有关的因素,如多次认真地调查和询问病例组某因素的暴露 史,而漫不经心地调查和询问对照组,从而导致错误结论。
M-H(Mantel-Haenszel)分层分析方法的步骤 对可能的混杂因素进行分层 判定层间RR或OR是否相等或相近
得到控制混杂后的调整RR或OR
再将调整 RR 或 OR 与分层前的粗 RR 或粗 OR ( cRR 或 cOR)进行比较
喝咖啡与心肌梗塞MI关系的研究
2000 年,儿科邀请一位美国医学及生物统计学教授 来院讲学的例子。 有人观察发现喝咖啡的人,很多人患 MI ,这种 现象是表象还是内在因果关系的?
致入选对象与未入选对象之间存在系统差异,由
此造成的偏倚称为选择偏倚。例如研究对象采用
志愿者,方便样本,或者研究对象的无应答或失
访等。
1. 入院率偏倚
admission rate bias,Berkson bias
• 1946年由J. Berkson 提出。是指利用医院就诊或住院
病人作为研究对象时,由于入院率的不同而导致的偏 差。
研究误差的两种常见类型
系统误差称为偏倚 来自于对象选取、测量 和统计分析等的方法学缺陷,有固定方向和固
定大小的误差 。
随机误差 用统计学方法来估计,增大样 本含量可减少,没有固定方向和固定大小,一 般呈正态分布。
A
BΒιβλιοθήκη Baidu
C
D
随机误差和系统误差示意图
6

因素
(危险/保护/干预)
结局
(疾病/健康/疗效)
研究者调查60岁以上老年人MI及非MI病人各 150例,得到如下数据。表1.1 MI NoMI % Coffee 90 60 60 No coffee 60 90 40
相对危险度: OR=90*90/(60*60)=2.25 Pearson chi2(1) = 12.0,Pr = 0.001。
说明喝咖啡人MI发生的危险性是不喝的2.25倍。 两组MI发生率差异有显著意义。 结论:喝咖啡与心肌梗塞MI有关!对否?

6. 无应答偏倚
(non-respondent bias)
指研究对象中那些没有按照研究设计对被调查的
内容予以应答。某个特定样本中的无应答者的
患病状况,以及对某一或某些研究因素的暴露 情况与应答者可能不同,由此而产生的偏倚。
选择偏倚的控制

研究者对在整个研究中可能会出现的各种选择偏倚应 有充分的了解、掌握。采取相应的措施在相应环节阻 断此类偏倚产生的可能性,防止或减少其发生。
相关文档
最新文档