偏倚

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

40
产生混杂作用，夸大了锻炼与心肌梗死间的真实
联系。
37
在体育锻炼与心肌梗死关系的研究中，同样可发现正常或较低的体质指数对心肌梗死具有保护作用。由于正常或较低的体质指数可能是体育锻炼的结果之一，是体育锻炼降低心肌梗死发生危险性过程中的一个中间环节，而并非是一个独立的保护因子，因此不能认为体质指数是该项研究的混杂因子。
2
随机误差和系统误差的区别
随机误差由随机抽样或测量产生，可以通过扩大样本量和改进抽样方法而减小。偏倚是因为研究对象的选择方法不当、收集信息的方法不当、以及一些混杂因素的存在而产生，研究中应采取针对性的措施控制。
3
第二节偏倚（bias）
根据偏倚产生的原因，分为：
选择偏倚 (selection bias)
33
信息偏倚的控制
1 校准测量工具
2 统一资料收集方法和人群分类标准
3 盲法单盲、双盲；盲法原则是消除测量偏倚的有效方法 4 尽量收集客观指标的资料 5 收集资料的范围可以适当宽泛些 6 提高调查技巧 7 严格的调查设计和研究人员的科学态度可能减少信息偏倚。
34
三、混杂偏倚
研究危险因素与疾病之间的关系时，如果存在第三
采用多种对照，提高对照人群的代表性。
24
（2）病历对照研究：病历和对照应来自同一总体人群。忌根据暴露状态来选择病例和对照，尽量采用社区病例和社区对照。在病例对照研究中选择新发病例
（3）回顾性队列研究：忌根据结局来选择暴露人群和非暴露人群。（4）实验研究：通过随机分组和盲法来避免研究对象和研究者的主观选择。
士为研究对象，询问其母亲当年的妊娠分娩史，
结果发现有关该次妊娠期间的服药史与当年记
录的符合率低于40%，而新生儿体重和新生儿
评分的符合率较高，接近80%。而且这些护士的母亲的应答准确性还受该次妊娠的产次、年
龄、文化程度等多种因素的影响。
29
2. 报告偏倚(reporting bias)
报告偏倚(reporting bias)源自研究对象对某些信息的故意夸大或缩小。
信息偏倚 (information bias)
混杂偏倚 (confounding bias)
4
一.选择偏倚（一）定义: 指被选入的研究对象和未被选入者之间特征上存在差异，从而使研究产生系统误差。可产生于设计阶段；抽样阶段；随访阶段。多见于病例对照研究、现况研究和回顾性队列研究。
20
例：某饮食与急性肝炎的病例对照研究。
病例组：急肝病人；对照组：同单位其他人。结果：该饮食与急性肝炎发生无关。 • 研究结果的过低估计。
21
8. 排除偏倚：在研究中，研究者往往需要将那些对研究因素禁忌者、不依从者、拒绝参加者等不符合设计要求的个体排除，但研究者在排除时在研究组和对照组没有采用对等原则，从而造成的偏倚。
• 应减少到最小程度；
• 研究中应了解退出的原因；
• 处理时可做“最坏打算”校正或评价
18
例如：当观察某因素致子宫癌发生情况时，不少妇女在随访过程中死于车祸或死于乳腺癌，因此，这些妇女成为失访者，她们同观察中涉及的某暴露因素或预期结果无关。若数量不大，不至于引起偏倚。若是数量较大且与研究中的有关变量牵连，则将产生偏倚。
流行病学研究中的偏倚第一节流行病学研究中的误差第二节偏倚
1
第一节误差 • 随机误差（random error）
由无法控制及不能预测的因素引起的一类表现不恒定，随机变化的误差。来源于测量工具/个体间的变异；不能消除，但可减小。
• 系统误差(systematic error)
又叫偏倚，由已知或可控制的因素引起的使研究结果或推论系统地偏离真实情况的误差。可发生于流行病学研究设计、实施、分析以及推论的各个阶段。
19
7. 时间效应偏倚
许多慢性病，自接触有效暴露之日起至出现临床表现止，其间经过一段漫长的潜隐过程，在此期间他们实际上是有暴露史但未出现症状或未能用现有检查手段发现疾病的病人，但由于无明显症状，因此，常被归入健康对照组内。如此产生的偏倚称为时间效应偏倚(time effect bias)。
诊断试验的灵敏度、特异度以及患者提供有
关信息的准确性不足，并且这种不足在比较
组之间存在差别。
27
1. 回忆偏倚发生于病因与危险因素的病例对照研究中，
询问的发病因素与结果与研究时的间隔时间较长；如家族史、用药史等。
28
例如：在一次有关乳腺癌和围生期特征关系的病例对照研究中，以患有和未患有乳腺癌的护
9
口服雌激素与子宫内膜癌病例对照研究：病例组：子宫内膜癌患者对照：无子宫内膜癌患者结果：子宫内膜癌患者口服雌激素比例高；结论：口服雌激素是子宫内膜癌的危险因素。
偏倚：无症状早期子宫内膜癌病人服雌激素后易致出血就诊。即病例入选受暴露因子影响，具有该暴露因子的病例会早期出现临床症状，入选病例与未入选病例之间存在系统差别。
因子，且第三因子与研究因素及疾病之间均有联系，研究因素与第三因子的效应混在一起，便产生混杂偏倚，从而掩盖或夸大研究因素与疾病之间的联系。如研究吸烟与肺癌关系，发现饮酒是肺癌的危险因
素－吸烟的混杂偏倚。
35
混杂因素的特征
一个因素作为混杂因素必须符合三个条件：
①混杂因素必须同疾病有关联（作为病因或病因标志物） ②混杂因素必须同暴露有关联； ③混杂因素不能是暴露的效应，尤其不能是暴露与疾病之间的中间变量。满足这些基本条件的混杂因子如果在所比较的各组分布不均，就可导致混杂偏倚的发生。
16
例：体锻与冠心病队列研究：
研究组为志愿者，对照组为非志愿者结论：体锻减少冠心病发生 • 偏倚：志愿参加研究者更关心自己的健康：注意饮食及营养，禁烟酒、坚持体锻。
17
6. 失访偏倚
失访是一种无应答，只是发生在队列及干预的前瞻性研究中；包括：失访或退出；
主动失访常常与暴露因素或结果有关。
11
例：病例对照研究大量饮用咖啡与心梗；病例组：医院心梗病人，对照组：医院非心梗病人；结果：大量饮用咖啡与心梗无关； • 偏倚：调查对象为存活者，只是一般饮用咖啡或减少饮用量，入院前死亡病人多是大量饮用咖啡者。
12

一项观察冠心病与高胆固醇血症关系的队列研究发现其RR为2.4，而同时在病例对照研究中，其OR 仅为1.16。原因是病例对照研究中现患病例已改变了他们的饮食习惯。
10
3. 现患-新发病例偏倚(奈曼偏倚)
奈曼偏倚(Neyman bias)又称现患-新发病例偏倚 (prevalence-incidence bias)。病例对照研究往往只纳入现患病例或存活病例，即同时纳入新、旧病例而不包括死亡病例和那些病程短的病例。由此形成的病例样本与单纯由新病例构成的样本相比，其病情、病型、病程和预后等都不尽相同，既往暴露状况也各有特点。
非糖尿病患者共发生肺炎1000例。假定：
（1）糖尿病这一暴露因素对肺炎入院率无影响时，
肺炎病例入院率均为40%
（2）糖尿病患者的入院率为80%，非糖尿病患者的入院率为40%
以所有入院肺炎病例为病例组，并随机抽取500例社区非肺
炎人群作为对照组，进行比较。
7
肺炎入院率
糖尿病糖尿病患者：40%，非患者40% 肺炎病例有无合计 OR 80 400 480 非肺炎对照 45 455 500 2.0 合计 125 855 980
肺炎入院率
糖尿病患者：80%，非患者40% 有 160 400 560 无 45 455 500 4.0
8
合计 205 855 1060
2. 检出征候偏倚
检出症候偏倚(detection signal bias)：指某因素与疾病虽然没有因果联系，但由于这种因素的存在，引起或促进了该疾病相关症状和体征出现，从而使患者及早就医，接受多种检查，使得该人群有较高的检出率，从而得出该因素与该疾病相关联的错误结论。
22
9. 领先时间偏倚研究肿瘤等慢性病，自症状出现，临床处理，
平均存活12月；
筛检诊断，临床处理，平均存活15月；
结论：筛检措施能延长生存时间。 • 偏倚：延长3月Leabharlann 间系提早发现及诊断时间。23
选择偏倚的控制
1.设计阶段：
（1）通用原则：制定科学可行的随机抽样方案，避免随意抽样、偶然抽样、主观故意选择所致的偏倚。制定合适的清楚地纳入和排除标准，有利于准确制定研究对象，避免抽样误差。提高应答率，减少失访和无应答。
13
4.无应答偏倚
无应答偏倚（non-response biass）由于调查对象不合作或不参加调查，降低了研究的应答率。主要发生于现况调查，在病例对照研究和队列研究中各比较组应答率的不同也可造成对研究结果的歪曲。因无应答者可能在某些重要特征上与应答者有所区别，超过一定比例可引起偏倚。
31
3. 调查者偏倚
由于研究者倾向于获得阳性结果，建立或验证假说。在研究中有意或无意诱导研究对象提供所需要的信息，由此产生的误差。
例：调查奶制品与食物中毒关系的病例对照研究。
32
4. 测量偏倚(measurement bias) 由于研究中所使用的仪器、设备、试剂、方法和条件不精良、不标准、不统一，或研究指标设定不合理、数据记录不完整造成的研究结果，系统地偏离其真值的现象称为测量偏倚(measurement bias)。
14
例：调查吸烟在男女人群中的比例；人群调查表返回：
• 男性回答率90％以上；女性回答率50％，且
多数为女性吸烟者未回答。
• 结果：低估女性吸烟率。
15
5. 志愿者偏倚
一般来说，志愿参加观察研究者与非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面有系统差异，因志愿者常被入选为观察对象，而非志愿者常落选，故这样的观察或研究结果肯定存在选择偏倚，这种偏倚称为志愿者偏倚 (volunteer bias)。
25
2.实施阶段：提高应答率。 3.分析阶段：无应答超过10%，需比较参与者与无应答着的人口学特征，社会经济特征等。可通过率的标准化、分层分析或多因素分析等统计学方法来减少选择偏倚。
26
二、信息偏倚
又称观察性偏倚、测量偏倚；
发生在资料收集、解释与发表阶段；
原因：资料的观察、测量、收集方法不当，
30
病例对照研究中病例往往将自己的疾病归咎于某些特定因素如职业暴露等，而对照并不会特意强调这些因素。又如：当暴露因素涉及到生活方式或隐私如饮酒、收入水平、婚姻生育史和性行为时，被研究对象会因种种原因而隐瞒或编造有关信息，有时代理者也会为了病人或死者的声誉而故意隐瞒某些不良暴露史，从而影响了所提供信息的准确性，导致报告偏倚发生。
5
常见的选择性偏倚
1. 入院率偏倚(Berkson bias)：
入院率偏倚(admission rate bias)又称伯克森偏倚(Berkson’s bias)，指在以医院为基础的病例对照研究中，目标疾病的入院率因待研究的暴露因素的存在与否或暴露水平的不同而存在差异，引起的偏倚。
6
例：研究糖尿病是否为肺炎的危险因素一定观察期内，某地糖尿病患者共发生肺炎200例，
38
混杂偏倚的控制
1.设计阶段（1）随机化分组（2）匹配：用于消除某些潜在的混杂因素，如年龄、性别、种族等特征。
（3）限制
2.分析阶段（1）分层分析 ( 2 )标准化（3）多因素分析：在病因、危险因素、预后因素研究；可以平衡多个混杂因素，且可以是连续变量；估计混杂因素的相互作用；减少样本量；决定危险 39 因素或预后因素的相对比重。
36
例如在研究体育锻炼与心肌梗死的关系时，年龄可能影响两者之间的真实联系。锻炼组中年
轻者所占比例较高，而非锻炼组中年长者所占比
例较高，同时年轻者的心肌梗死危险性低于年长者。如果体育锻炼对心肌梗死具有保护作用，则由于不同比较组的年龄分布不同，最终可能会高估体育锻炼对心肌梗死保护作用，此时年龄因素