偏倚

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

40
产生混杂作用,夸大了锻炼与心肌梗死间的真实
联系。
37
在体育锻炼与心肌梗死关系的研究中,同样可 发现正常或较低的体质指数对心肌梗死具有保 护作用。由于正常或较低的体质指数可能是体 育锻炼的结果之一,是体育锻炼降低心肌梗死 发生危险性过程中的一个中间环节,而并非是 一个独立的保护因子,因此不能认为体质指数 是该项研究的混杂因子。
2
随机误差和系统误差的区别
随机误差由随机抽样或测量产生,可以通过 扩大样本量和改进抽样方法而减小。 偏倚是因为研究对象的选择方法不当、收集 信息的方法不当、以及一些混杂因素的存在 而产生,研究中应采取针对性的措施控制。
3
第二节 偏倚(bias)
根据偏倚产生的原因,分为:
选择偏倚 (selection bias)
33
信息偏倚的控制
1 校准测量工具
2 统一资料收集方法和人群分类标准
3 盲法单盲、双盲;盲法原则是消除测量偏倚的有 效方法 4 尽量收集客观指标的资料 5 收集资料的范围可以适当宽泛些 6 提高调查技巧 7 严格的调查设计和研究人员的科学态度可能减少 信息偏倚。
34
三、混杂偏倚
研究危险因素与疾病之间的关系时,如果存在第三
采用多种对照,提高对照人群的代表性。
24
(2)病历对照研究:病历和对照应来自同一总 体人群。忌根据暴露状态来选择病例和对照, 尽量采用社区病例和社区对照。在病例对照 研究中选择新发病例
(3)回顾性队列研究:忌根据结局来选择暴露 人群和非暴露人群。 (4)实验研究:通过随机分组和盲法来避免研 究对象和研究者的主观选择。
士为研究对象,询问其母亲当年的妊娠分娩史,
结果发现有关该次妊娠期间的服药史与当年记
录的符合率低于40%,而新生儿体重和新生儿
评分的符合率较高,接近80%。而且这些护士 的母亲的应答准确性还受该次妊娠的产次、年
龄、文化程度等多种因素的影响。
29
2. 报告偏倚(reporting bias)
报告偏倚(reporting bias)源自研究对象对某些信息 的故意夸大或缩小。
信息偏倚 (information bias)
混杂偏倚 (confounding bias)
4
一.选择偏倚 (一)定义: 指被选入的研究对象和未被选入者之间特征 上存在差异,从而使研究产生系统误差。 可产生于设计阶段;抽样阶段;随访阶段。 多见于病例对照研究、现况研究和回顾性队 列研究。
20
例:某饮食与急性肝炎的病例对照研究。
病例组:急肝病人;对照组:同单位其他人。 结果:该饮食与急性肝炎发生无关。 • 研究结果的过低估计。
21
8. 排除偏倚: 在研究中,研究者往往需要将那些对研究 因素禁忌者、不依从者、拒绝参加者等不 符合设计要求的个体排除,但研究者在排 除时在研究组和对照组没有采用对等原则, 从而造成的偏倚。
• 应减少到最小程度;
• 研究中应了解退出的原因;
• 处理时可做“最坏打算”校正或评价
18
例如:当观察某因素致子宫癌发生情况时,不少 妇女在随访过程中死于车祸或死于乳腺癌,因此, 这些妇女成为失访者,她们同观察中涉及的某暴 露因素或预期结果无关。若数量不大,不至于引 起偏倚。若是数量较大且与研究中的有关变量牵 连,则将产生偏倚。
流行病学研究中的偏倚 第一节 流行病学研究中的误差 第二节 偏倚
1
第一节 误差 • 随机误差(random error)
由无法控制及不能预测的因素引起的一类表现不 恒定,随机变化的误差。来源于测量工具/个体间 的变异;不能消除,但可减小。
• 系统误差(systematic error)
又叫偏倚,由已知或可控制的因素引起的使研 究结果或推论系统地偏离真实情况的误差。可 发生于流行病学研究设计、实施、分析以及推 论的各个阶段。
19
7. 时间效应偏倚
许多慢性病,自接触有效暴露之日起至出现临床表 现止,其间经过一段漫长的潜隐过程,在此期间他 们实际上是有暴露史但未出现症状或未能用现有检 查手段发现疾病的病人,但由于无明显症状,因此, 常被归入健康对照组内。如此产生的偏倚称为时间 效应偏倚(time effect bias)。
诊断试验的灵敏度、特异度以及患者提供有
关信息的准确性不足,并且这种不足在比较
组之间存在差别。
27
1. 回忆偏倚 发生于病因与危险因素的病例对照研究中,
询问的发病因素与结果与研究时的间隔时间 较长; 如家族史、用药史等。
28
例如:在一次有关乳腺癌和围生期特征关系的 病例对照研究中,以患有和未患有乳腺癌的护
9
口服雌激素与子宫内膜癌病例对照研究: 病例组:子宫内膜癌患者 对照:无子宫内膜癌患者 结果:子宫内膜癌患者口服雌激素比例高; 结论:口服雌激素是子宫内膜癌的危险因素。
偏倚:无症状早期子宫内膜癌病人服雌激素后易致出 血就诊。即病例入选受暴露因子影响,具有该暴露 因子的病例会早期出现临床症状,入选病例与未入 选病例之间存在系统差别。
因子,且第三因子与研究因素及疾病之间均有联系, 研究因素与第三因子的效应混在一起,便产生混杂 偏倚,从而掩盖或夸大研究因素与疾病之间的联系。 如研究吸烟与肺癌关系,发现饮酒是肺癌的危险因
素-吸烟的混杂偏倚。
35
混杂因素的特征
一个因素作为混杂因素必须符合三个条件:
①混杂因素必须同疾病有关联(作为病因或病因 标志物) ②混杂因素必须同暴露有关联; ③混杂因素不能是暴露的效应,尤其不能是暴露 与疾病之间的中间变量。 满足这些基本条件的混杂因子如果在所比较的 各组分布不均,就可导致混杂偏倚的发生。
16
例:体锻与冠心病队列研究:
研究组为志愿者,对照组为非志愿者 结论:体锻减少冠心病发生 • 偏倚:志愿参加研究者更关心自己的健康:注 意饮食及营养,禁烟酒、坚持体锻。
17
6. 失访偏倚
失访是一种无应答,只是发生在队列及干预的 前瞻性研究中; 包括:失访或退出;
主动失访常常与暴露因素或结果有关。
11
例: 病例对照研究大量饮用咖啡与心梗; 病例组:医院心梗病人,对照组:医院非心梗病人; 结果:大量饮用咖啡与心梗无关; • 偏倚:调查对象为存活者,只是一般饮用咖啡或减 少饮用量,入院前死亡病人多是大量饮用咖啡者。
12

一项观察冠心病与高胆固醇血症关系的队列研究 发现其RR为2.4,而同时在病例对照研究中,其OR 仅为1.16。原因是病例对照研究中现患病例已改变了 他们的饮食习惯。
10
3. 现患-新发病例偏倚(奈曼偏倚)
奈曼偏倚(Neyman bias)又称现患-新发病例偏倚 (prevalence-incidence bias)。病例对照研究往往只 纳入现患病例或存活病例,即同时纳入新、旧病 例而不包括死亡病例和那些病程短的病例。由此 形成的病例样本与单纯由新病例构成的样本相比, 其病情、病型、病程和预后等都不尽相同,既往 暴露状况也各有特点。
非糖尿病患者共发生肺炎1000例。假定:
(1)糖尿病这一暴露因素对肺炎入院率无影响时,
肺炎病例入院率均为40%
(2)糖尿病患者的入院率为80%,非糖尿病患者 的入院率为40%
以所有入院肺炎病例为病例组,并随机抽取500例社区非肺
炎人群作为对照组,进行比较。
7
肺炎入院率
糖尿病 糖尿病患者:40%, 非患者40% 肺炎病 例 有 无 合计 OR 80 400 480 非肺炎 对照 45 455 500 2.0 合计 125 855 980
肺炎入院率
糖尿病患者:80%, 非患者40% 有 160 400 560 无 45 455 500 4.0
8
合计 205 855 1060
2. 检出征候偏倚
检出症候偏倚(detection signal bias):指某因素与疾 病虽然没有因果联系,但由于这种因素的存在,引 起或促进了该疾病相关症状和体征出现,从而使患 者及早就医,接受多种检查,使得该人群有较高的 检出率,从而得出该因素与该疾病相关联的错误结 论。
22
9. 领先时间偏倚 研究肿瘤等慢性病,自症状出现,临床处理,
平均存活12月;
筛检诊断,临床处理,平均存活15月;
结论:筛检措施能延长生存时间。 • 偏倚:延长3月Leabharlann 间系提早发现及诊断时间。23
选择偏倚的控制
1.设计阶段:
(1)通用原则: 制定科学可行的随机抽样方案,避免随意抽样、 偶然抽样、主观故意选择所致的偏倚。 制定合适的清楚地纳入和排除标准,有利于准 确制定研究对象,避免抽样误差。 提高应答率,减少失访和无应答。
13
4.无应答偏倚
无应答偏倚(non-response biass)由于调查 对象不合作或不参加调查,降低了研究的 应答率。主要发生于现况调查,在病例对 照研究和队列研究中各比较组应答率的不 同也可造成对研究结果的歪曲。 因无应答者可能在某些重要特征上与应答 者有所区别,超过一定比例可引起偏倚。
31
3. 调查者偏倚
由于研究者倾向于获得阳性结果,建立或验证 假说。在研究中有意或无意诱导研究对象提供 所需要的信息,由此产生的误差。
例:调查奶制品与食物中毒关系的病例对照研究。
32
4. 测量偏倚(measurement bias) 由于研究中所使用的仪器、设备、试剂、方 法和条件不精良、 不标准、不统一,或研究 指标设定不合理、数据记录不完整造成的研 究结果,系统地偏离其真值的现象称为测量 偏倚(measurement bias)。
14
例:调查吸烟在男女人群中的比例; 人群调查表返回:
• 男性回答率90%以上;女性回答率50%,且
多数为女性吸烟者未回答。
• 结果:低估女性吸烟率。
15
5. 志愿者偏倚
一般来说,志愿参加观察研究者与非志愿者在关心 健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持 锻炼等方面有系统差异,因志愿者常被入选为观察 对象,而非志愿者常落选,故这样的观察或研究结 果肯定存在选择偏倚,这种偏倚称为志愿者偏倚 (volunteer bias)。
25
2.实施阶段:提高应答率。 3.分析阶段:无应答超过10%,需比较参与者 与无应答着的人口学特征,社会经济特征等。 可通过率的标准化、分层分析或多因素分析 等统计学方法来减少选择偏倚。
26
二、信息偏倚
又称观察性偏倚、测量偏倚;
发生在资料收集、解释与发表阶段;
原因:资料的观察、测量、收集方法不当,
30
病例对照研究中病例往往将自己的疾病归咎于 某些特定因素如职业暴露等,而对照并不会特 意强调这些因素。 又如:当暴露因素涉及到生活方式或隐私如饮 酒、收入水平、婚姻生育史和性行为时,被研 究对象会因种种原因而隐瞒或编造有关信息, 有时代理者也会为了病人或死者的声誉而故意 隐瞒某些不良暴露史,从而影响了所提供信息 的准确性,导致报告偏倚发生。
5
常见的选择性偏倚
1. 入院率偏倚(Berkson bias):
入院率偏倚(admission rate bias)又称伯克森 偏倚(Berkson’s bias),指在以医院为基础 的病例对照研究中,目标疾病的入院率因 待研究的暴露因素的存在与否或暴露水平 的不同而存在差异,引起的偏倚。
6
例:研究糖尿病是否为肺炎的危险因素 一定观察期内,某地糖尿病患者共发生肺炎200例,
38
混杂偏倚的控制
1.设计阶段 (1)随机化分组 (2)匹配:用于消除某些潜在的混杂因素,如年龄、 性别、种族等特征。
(3)限制
2.分析阶段 (1)分层分析 ( 2 )标准化 (3)多因素分析:在病因、危险因素、预后因素研 究;可以平衡多个混杂因素,且可以是连续变量; 估计混杂因素的相互作用;减少样本量;决定危险 39 因素或预后因素的相对比重。
36
例如在研究体育锻炼与心肌梗死的关系时, 年龄可能影响两者之间的真实联系。锻炼组中年
轻者所占比例较高,而非锻炼组中年长者所占比
例较高,同时年轻者的心肌梗死危险性低于年长 者。如果体育锻炼对心肌梗死具有保护作用,则 由于不同比较组的年龄分布不同,最终可能会高 估体育锻炼对心肌梗死保护作用,此时年龄因素
相关文档
最新文档