流行病学之偏倚及其控制

合集下载

第九章流行病学研究中的偏倚及其控制

检出症候偏倚

某人进行了一项更年期服用雌激素与子宫内膜癌关系的病例对照研究，分别在同一个医院的不同科室选择了研究对象，经分析得到下表结果
检出症候偏倚

在肿瘤科，子宫内膜癌病人多由于她们服用雌激素后出现子宫出血而到医院检查，能及早发现该人群中的子宫内膜癌病人，且多为早期的病人，而没有服用者，由于没有子宫出血症状，减少了就诊机会，使该病不易及早被诊断出来，因而能得出雌激素和子宫内膜癌之间相关联的结论在妇科，这些患者大多数接受妇科检查，因此子宫内膜癌的检出与是否服用雌激素使妇科检查几率增加之间没有关系

健康工人效应

为了探讨职业暴露对人类健康的危害，McMichael等在美国俄亥俄州的一个轮胎生产工厂，选择在岗及退休男性工人6678人作为暴露组，进行了回顾性队列研究。观察期间为1964～1972年共9年时间。以国家卫生统计中心编制的1968年美国男性年龄别死亡率作参比下表是同时期与钢铁工人、俄亥俄州人口及美国全国人口相比较的橡胶工人全死因死亡率（1/10万人年）

现患-新发病例偏倚

现患病例－新病例偏倚的测量可依据队列研究和病例对照研究两研究不同的联系强度来估计假设队列研究的联系强度为OR1，病例对照研究的联系强度为OR2，现患病例－新病例偏倚
OR2 OR1 1.16 2.40 选择偏倚＝ 0.517 OR1 2.40

为负值，说明由于该偏倚的存在，使得病例对照研究中高血胆固醇与冠心病之间的联系强度降低了51.7%

假如在人群进行一项病例对照研究，以B病为对照，研究A病与某因素X的关系。设人群中患A病与B病者各为 5000人，暴露于因素X者各为750人，不暴露于因素X者各为4250人，X 在A、B患者中的暴露率均为15% 暴露X 有无 A病 750 4250 B病 750 4250 合计 1500 8500

流行病学中常见的偏倚及其控制

膳膳食食改改良组组
降降低胆胆固固醇醇药品物组组
0
5
10
15
图 8-2 膳食与药物预防心机梗死的样本变异性示例
流行病学中常见的偏倚及其控制
五年内发生心肌梗死风险（%）
7
第7页
如图8-2, 研究A和B中膳食改良组五年内发生心机梗死风险为 9%, 而降胆固醇药品组为6%。
研究A样本较小（200人）, 两组效应指标（心肌梗死风险） 95%可信限较大, 发生重合, 无显著性差异。
若θ<θ’<1,则为趋向无效值偏倚。
（三）不论θ>1或θ<1，若θ和θ’在1两侧，则为颠倒偏倚。
流行病学中常见的偏倚及其控制
17
第17页
3.举例: （1）RR＝1.5 RR’=2.0时，为远离无效值
正偏倚。
（2）RR＝0.6 RR’=0.8时，为趋向无效值负偏倚。
（3）RR=1.2 RR’=0.9时，为颠倒负偏倚。
流行病学中常见的偏倚及其控制
28
第28页
在美国弗明汉地域对心血管系统疾病研究中发觉: 男性居民在队列研究中，含有高胆固醇水平者，患冠心病OR 值为2.4，而在病例对照研究中，病例组和对照组却无显著差异（OR =1.16）。
原因: 病例对照研究中现患病例已改变了他们高胆固
醇饮食习惯。
流行病学中常见的偏倚及其控制
Hale Waihona Puke 流行病学中常见的偏倚及其控制
36
第36页
有些人以病例对照研究发觉, 子宫内膜癌患者雌激素百分比显著高于对照组, 认为子宫内膜癌与服用雌激素亲密相关。
流行病学中常见的偏倚及其控制
37
第37页
1978年，Horwitz和Feinstein: 口服雌激素与子宫内膜癌高度关联是虚假，是一个检出偏倚。

流行病学第8章偏倚及控制

对象造成的偏倚
随机分配
分组机会均等，各组非研究因素均匀分布，资料可比，提高研究的正确性
随机化是控制偏倚的有效方法之一。
2、匹配（matching）
就是在选择病例与对照时，要求两者的某些因素或特征即匹配因素相一致，以排除匹配因素的干扰，提高研究效率。但要注意所匹配的因素应是已知的混杂因素，否则不能匹配。匹配使用得当可以有效控制混杂因素，提高研究真实性。还要避免匹配过度，即把不必要的项目列入匹配，可能丢失信息增加工作难度，反而降低了研究效率。
二、系统误差
系统误差（systematic error）是指测量值与总体值之间出现的差异。在实际观测过程中，由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。观察值有系统性、方向性、周期性的偏离真值,可直接影响原始资料的准确性,必须查明原因、予以矫正，系统误差必须避免。
在研究某因素与某疾病之间的关系时，由于一个或多个外部因素的影响，缩小或夸大了研究因素与疾病之间的真正的联系，称为混杂偏倚。导致混杂产生的因素就称为混杂因素。混杂偏倚是在研究的设计阶段未能对混杂因素加以控制和在资料分析时未能进行正确的校正所造成的偏倚。
混杂因素具备的特征
（1）混杂因素必须是所研究疾病的独立危险因素，如果不找出或不避开，所得研究结果可能不是研究因素造成的。（2）混杂因素必须与所研究的暴露因素存在统计学联系。（3）混杂因素不应是暴露因素与疾病因果链中的一个环节或中间变量。
2、信息偏倚的控制方法

为使调查对象能提供准确的信息，必须在调查问卷上下功夫。对于调查员，关键是进行严格的培训，增强工作的责任感。统一调查程序、方法。测量仪器要选用标准一致的，不易产生偏性和稳定的仪器，使用前还要统一校正，从而保证测试结果的准确与可靠。对调查环境加以选择与控制的。这主要是根据调查目的和对象的特点来加以考虑。

【流行病学】第08章偏倚及其控制

55 90
非病例 A病
100
80 540 900
病例非病例
选择概率暴露非暴露
α=
β=
a/A b/B
γ= δ= c/C d/D
患B病且暴露于因素X的选择概率：α=55/100=0.55 患B病但未暴露于因素X的选择概率：β=90/900=0.10 患A病且暴露于因素X的选择概率：γ=80/100=0.80 患A病但未暴露于因素X的选择概率：δ=540/900=0.60
➢ 严格选择标准：纳入标准与排除标准 ➢ 研究对象的合作：依从性、失访、无应答 ➢ 采用多种对照：内对照、外对照、全人群资料对照
第二节信息偏倚
一、信息偏倚的相关概念
➢1、又称为观察偏倚（observational bias），指在研究实施过程中，获取研究所需信息时产生的系统误差。
➢2、信息偏倚可来自： ➢ 人：研究对象、调查者， ➢ 物：测量的仪器、设备、方法等。
➢4.无应答偏倚（non-response bias） ➢在流行病学研究中，无应答者是指由于种种原因那些没有对调查信
息予以应答的研究对象。 ➢在特定研究样本中，无应答者的患病状况以及对某些研究因素的暴
露情况与应答者可能会不尽相同，从而导致系统误差。
➢5.易感性偏倚（susceptibility bias） ➢研究对象暴露于某可疑致病因素与否，与许多主、客观原因有关，
720
280
720
280
5.0
2.4
1.4
【问题-4】请问在这两种假定情况下的观察结果（研究结果）与真实结果之间有什么不同？怎样解释这种现象？
【分析-4】
这两种假定情况下的观察结果（OR值）都远低于真实结果，表明这两种假定情况下都产生了偏倚。其原因与暴露因素（膳食脂肪摄入）的系统错误分类有关。这种由于在结局变量或者暴露变量的测量过程中存在系统分类错误（系统测量误差）所致暴露与结局之间的关联受到扭曲的现象，称为信息偏倚，又称测量偏倚或观察偏倚。由于流行病学的暴露和疾病多为分类资料，所以信息偏倚有时又被称为错分偏倚（misclassification bias）。

流行病学研究中常见的偏倚及其控制

8
举例：用动脉血压计测量某人血压，各次读数的均值为 100mmHg，系统误差和随机误差可用以下图示
发生频次
系统误差
随机误差
80
100
舒张压（mmHg）
图1
血压计法测量舒张压值的分布
9
二、偏倚的概念
定义
偏倚(Bias)是在研究的设计、实施、分析阶段发生的系统误差。特点是影响流行病学内部真实性的主要原因。具有方向性，夸大真实值为正偏倚，缩小真实值为负偏倚分类选择偏倚，信息偏倚，混杂偏倚
10
第二节选择偏倚
一选择偏倚的概念选择偏倚(selection bias)指由于研究对象与目标人群的特征存在着系统误差，使效应估计值与真值之间发生的偏差。
是研究者在挑选研究人群时由于选择条件受限制或设计失误所造成的。既可产生与研究开始选择研究对象的时候，也可产生与收集资料过程中出现失访或无应答。常见于现况研究、病例对照研究与回顾性队列研究。
16
二选择偏倚的常见种类 2、现患-新发病例偏倚
又称奈曼偏倚，在病例对照研究中，用于研究的通常是现患病例，而不包括死亡病例或者病程短、轻型、不典型的病例，由此而所产生的系统误差。如： Friedman 等人进行的心血管疾病的研究中发现，队列研究中，高胆固醇水平者患冠心病的 OR 值为 2.4 ，而在病例对照研究中，病例组与对照组无明显差别OR为1.16。
一、研究结果的误差和真实性
随机误差
定义
由于多种无法控制及不能预测的因素引起的一类表现不恒定、随机变化的误差。特点没有固定方向和固定大小一般呈正态分布
7
一、研究结果的误差和真实性
系统误差定义指研究过程中，由一些可控制的因素引起的使研究结果或推论偏离真实情况的误差。特点

流行病学研究中常见偏倚及其控制习题及答案

流行病学研究中常见偏倚及其控制1.下列哪条不是．．控制选择性偏倚的措施：A. 尽量选用新发病例B. 选用中青年病例C. 选用多种对照D. 双盲法调查E. 随机选取对象2.下列哪一种情况不属于偏倚：A.由于抽样而导致的结果偏离真实情况B.由于入选的研究对象与没有入选的研究对象特征上的差异导致的结果偏离真实情况C.研究对象的某种特征被错误的分类导致的结果偏离真实情况D.由于某个或某些混杂因素导致的结果偏离真实情况E. 以上都不对1.队列研究证明暴露因素E是疾病D的危险因素（RR＝3，P<0.05）。

但进行以医院为基础的病例对照研究时，发现病例与对照组暴露情况没有显著性差异（OR=1.1，P>0.05）。

进一步分析显示，这种病例对照研究与队列研究结果之间的差异，是因为患者在诊断出此病后往往会改变其行为习惯，从而使患者的暴露情况改变。

这属于：A．检出偏倚B．易感性偏倚C．Neyman偏倚D．Berksons偏倚E．诊断怀疑偏倚1.在探讨妊娠母亲各种暴露史与先天畸形之间联系的研究中，有人怀疑那些畸形儿的母亲由于内疚而少报了她们的吸烟情况，而那些对照儿童的母亲报告的要准确些，这会产生：A.报告偏倚B.易感性偏倚C.回忆偏倚D.混杂偏倚E.抽样误差2.如上题你的怀疑是正确的，并且实际上吸烟增加了畸形的危险，那么论文中报告的相对危险度与“真正的”相对危险度比是A.低估了B.高估了C.都不是D.不能确定E.没变化2.可以控制混杂偏倚的措施是：A.匹配设计B.分层分析C.因素模型D.随机化E.双盲法3.在以医院为基础进行病例对照研究时，最易出现的偏倚是：4. A.信息偏倚 B.回忆偏倚 C.选择偏倚 D.混杂偏倚 E.失访偏倚5.有人经Case-Control Study 报导子宫内膜癌患者的雌激素使用率入高于一般健康人，故此推断服用雌激素能导致子宫内膜癌，此结论：A.正确B.不正确，因该研究中病例的确定有选择性偏倚C.不正确，因该研究中病例的确定有观察偏倚D.不正确，因该研究中有混杂偏倚E.不正确，因有交互作用1.下列哪个不属于队列研究偏倚控制的内容：A.选择偏倚的控制B.入院偏倚的控制C.信息偏倚的控制D.失访偏倚的控制E.混杂偏倚的控制2.在流行病学研究中，混杂因素：A.与暴露因素有关，与疾病无关B.与疾病有关，与暴露因素无关C.与病例有关，与对照无关D.与暴露有关，与非暴露无关E.与疾病和暴露因素都有关6.混杂因素成立的条件是：（是单选吗？）A.与所研究疾病有关B.与所研究疾病无关C.与所研究暴露有关D.与所研究暴露无关7.下列哪一种偏倚属于选择偏倚？A.回忆偏倚B.测量偏倚C.报告偏倚D.无应答偏倚8.下列哪一种方法不能用来控制混杂偏倚？A.匹配B.严格的质量控制C.分层分析D.多因素分析9.流行病学研究的偏性主要指A.抽样误差B.系统误差C.过失误差D.时间顺序误差E.随机测量误差10.病例对照研究中控制混杂的方法是:A.分析B.叉生分析C.分层分析D.出生队列分析E.暴露人年分析11.流行病学研究的误差指A.测量值之间的差异B.样本和总体之间的差异C.两样本之间的差异D.两个不同质总体之间的差异E.测量值与真值之间的差异12.流行病学研究的偏性主要指A.抽样误差B.系统误差C.随机测量误差D.时间顺序误差下列哪一种情况不属于偏倚：A.由于抽样而导致的结果偏离真实情况B.由于入选的研究对象与没有入选的研究对象特征上的差异导致的结果偏离真实情况C.研究对象的某种特征被错误的分类导致的结果偏离真实情况D.由于某个或某些混杂因素导致的结果偏离真实情况E. 以上都不对下列哪一种偏倚属于选择偏倚：A.回忆偏倚B.测量偏倚C.报告偏倚D.无应答偏倚E.以上都不是下列哪一种偏倚不可能发生在病例对照研究中：A.Berksons偏倚B.混杂偏倚C.检出症候偏倚D.测量偏倚E.失访偏倚队列研究证明暴露因素E是疾病D的危险因素（RR＝3，P<0.05）。

偏倚及其控制

流行病学中常见的偏倚及其控制误差（error）对事物某一特征的测量值偏离真实值的部分。

包括随机误差、系统误差随机误差：指随机抽样所得的均值与总体参数的差异，也称抽样误差。

只能减少，不能避免。

随机误差的两个特点1、样本的观察值都在平均值上下分布，从许多无偏倚样本中得到的观察值均数，假如数量较大，总是趋向于接近总体值；2、随机误差的范围可以用可信区间估计，当保持随机方法而加大样本时，样本均值逐渐向总体均值接近。

系统误差：当对群体的某一特征做一次测量或对某一个体的某一特征做多次测量时，所得均值与总体间的真实性也会产生误差，如果误差向量的方向一致或基本一致时，这种误差称为系统误差。

随机误差和系统误差的区别1、假设一项研究可以将样本量增至无穷大，如果研究样本无穷大能使误差减小到零，则此误差为随机误差。

系统误差不受样本量增加的影响，因此在研究样本无穷大时仍然存在的误差是系统误差；2、适当的重复试验或增加样本含量可以减少随机误差，但不能减少系统误差。

偏倚（bias）：指在流行病学研究中样本人群所测得的某变量系统地偏离了目标人群中该变量的真实值，使得研究结果或推论的结果与真实情况之间出现偏差，这是由系统误差造成的。

选择偏倚（selection bias ）：指被选入到研究中的研究对象与没有被选入者特征上的差异所造成的系统误差。

主要产生于研究的设计阶段，在各类流行病学研究中均可能发生，以在病例对照研究与现况研究中为常见。

常见的选择偏倚1、入院率偏倚（admission rate bias）亦称伯克森偏倚（Berkson’s bias）,是指利用医院就诊或住院病人作为研究对象时，由于入院率的不同或就诊机会的不同而导致的偏倚。

用住院病例进行研究时可能没有包括：1)抢救不及时死亡的病例2)距离医院远的病例3)无钱住院的病例4)病情轻的病例2、现患-新发病例偏倚（Prevalence-incidence bias）又称奈曼偏倚（Neyman bias）,凡因现患病例与新病例的构成不同，只调查典型病例或现患病例的暴露状况，致使调查结果出现的系统误差都属于本类偏倚。

流行病学研究中的常见偏倚

bias）
一般情况下，志愿者与非志愿者在关心健康、注意饮食习惯、禁烟、禁酒及体育锻炼等方面可能存在系统的差别，因而，志愿者被入选为观察对象，而非志愿者落选，这样的研究结果往往有选择偏倚。例如，一项以体育锻炼预防冠心病的研究，干预组都是志愿者，而将非志愿者作对照，以比较该项措施的效果，这样就可能会得出不正确的结论。
合计
组)
组)
1200
1200
2400
4800
4800
9600
OR＝1，χ2检验差异无显著性，说明A病与X因素无关系。
假设A病住院率为25％，B病住院率为60％，具有X因素也有一定的入院率为40％。现就上述不同的入院率计算住院人数：
A病无X因素住院人数＝4800×0.25＝1200人
A病有X因素住院人数＝1200×0.25＋(1200 －300)×0.4＝660人
7
72
110
117
117
9.8
妇科
暴露
非暴露
59
42
89
108
148
148
1.7
1978年，Horwitz指出，这一结论是由检出征候偏倚所致，两者之间的高度关联是虚假的。因为在人群中有一定量的无症状的子宫内膜癌早期病人，她们若不服用雌激素，子宫不致出血，因而不去医院就诊，而不能被发现。
4. 志愿者偏倚（volunteer
2、尽量采用多种对照
理想的是以人群中全体病例和非病例(或其有代表性的样本)作为研究对象。如以医院病例为研究对象，宜在多个医院选择对象，且最好有2个对照组，其中一个对照组来自社区一般人群，在队列研究中，最好也应设多种对照，以减少选择偏倚对结果的影响。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2020/6/16
38
第三节研究的偏倚
E
C
？
E
F
？
D
D
(1)继发关联
图8(-23)直接因果关联的歪曲图 8-4 混杂偏倚引起假关联
E
F
？Hale Waihona Puke D(3)直接因果关联的歪曲
2020/6/16
39
第三节研究的偏倚
四、混杂偏倚的分层分析
M-H(Mantel-Haenszel)分层分析方法的步骤对可能的混杂因素进行分层判定层间RR或OR是否相等或相近得到控制混杂后的调整RR或OR 再将调整 RR 或 OR 与分层前的粗 RR 或粗 OR （cRR或cOR）进行比较
例如静脉吸毒E与性乱F都是HIV感染D的危险因素，吸毒者易发生多性伴行为，即吸毒同HIV感染既存在直接关联（E→D）又存在间接关联（E→F→D）（图8-3,(2)），吸毒与多性伴没有确定的时间先后而呈双向相关（图8-3,(3)），多性伴F将对吸毒E与 HIV感染D的直接因果关联起混杂或歪曲作用。
2020/6/16
7
个体状态
日间变异年龄膳食运动环境
测量误差
仪器标度差仪器精密度差读数或记录错误
2020/6/16
8
第一节研究结果的变异性
三、群体水平的变异性
个体的累计变异群体中的个体具有不同的遗传素质并受环境影响
常大于个体变异根据群体的变异范围确定“正常值”范围，用于判定
个体测得值是否“正常” 群体水平的变异性受测量误差影响
68
OR= (60╳68)/(40╳32)=3.2
图 8-3 无差异性错误分类和差异性错误分类的示例
2020/6/16
30
第三节研究的偏倚
差异性信息偏倚的两种常见类型
回忆偏倚（recall bias）
产生于研究对象记忆过去活动和暴露能力的差异。
调查者偏倚（interviewer bias）
产生于调查者对研究对象有差异性地收集信息。采取盲法，可以降低调查者偏倚。
个体生物学变异，测量误差
群体
个体间遗传学变异，环境变异，测量误差
样本（研究）
抽样方式，样本大小，测量误差
2020/6/16
5
第一节研究结果的变异性
变异的来源分为两个层次
生物学（真实）变异和测量变异生物学变异真实的客观变异测量变异测量过程的误差
随机变异和系统变异随机变异绝对值和方向交错变化，正态分布系统变异绝对值和方向保持恒定
改善措施增加研究对象的异质性，使得研究对象的代表
性范围扩大。
2020/6/16
20
在实际研究时，需要综合平衡考虑研究对象的同质性和异质性问题
2020/6/16
21
第三节研究的偏倚
选择偏倚信息偏倚混杂偏倚混杂偏倚的分层分析
2020/6/16
22
1946年，Berkson做最著名的偏倚研究并给予证实，又称为Berkson偏倚。
2020/6/16
9
第一节研究结果的变异性
四、样本水平的变异性
通过不同样本研究所得结果的差异性为什么高水平的血清总胆固醇是不利的或不
健康的？这可以在关于血清总胆固醇与心血管死亡风
险呈正相关的研究中找到答案。如Framingham心脏研究。
2020/6/16
10
第一节研究结果的变异性
描述性结果的样本变异性
二、信息偏倚（information bias）
定义
又称测量偏倚或观察偏倚，是来自于测量或资料收集方法的问题，使得获取的资料存在系统误差。由于流行病学的暴露或疾病多为分类测量，所以信息偏倚又可称为错误分类偏倚（misclassification bias）。
信息偏倚同样影响描述性研究和分析性研究的结果。
2020/6/16
15
第二节研究的真实性
概述内部真实性外部真实性
2020/6/16
16
一、概述
真实性(效度) 定义指研究收集的数据、分析结果和所得结
论与客观实际的符合程度。研究误差真实性的反面变异可以是真实的（如生物学个体变异），而反映研究误差的变异肯定是不真实的。
2020/6/16
设计阶段：标准化率、分层和多变量分析设计阶段：配比、随机化分配或限制进入
2020/6/16
34
第三节研究的偏倚
继发关联（secondary association）
定义
是一种纯粹由混杂偏倚产生的关联
即怀疑的病因（暴露）E与疾病D并不存在因果关系，而是由于两者（E,D）有共同的原因C， E,D同C存在关联，从而继发产生E与D的关联。
25
第三节研究的偏倚
分析性研究的选择偏倚
主要体现研究对象进入、排除、不参与或失访等与研究暴露或处理因素存在关联，由此增大或减少暴露与疾病、处理与效应的关联，导致效应估计的偏倚。
控制方法选取具体环节或已选取人群的具体特征分析研究对象的选取是否同暴露或处理因素有关
2020/6/16
26
常见选择偏倚
研究B样本较大（2000人），两组效应指标（心肌梗死风险）的95%CI较小，未发生重叠，有显著性差异。
2020/6/16
14
样本越大，效应估计值的抽样误差越小（95%可信限越小），统计检验能发现的两组间效应差值越小。
样本非常大，两组间差异很小的效应值也会有统计学显著差异，但这很少有生物学或临床意义。
样本本CC 219，164，190，188，233 =0%
图 8-1 源群体与样本高胆固醇率的样本变异性示例
2020/6/16
11
第一节研究结果的变异性
在图8-1中，群体高胆固醇率为25%，样本A为40%，样本B为20%，样本C为0%。
增大样本含量，样本的变异性会减少，样本的高胆固醇率对群体的代表性会增大。
52
对照 32
68
OR= (48╳68)/(52╳32)=2.0
研研究究真真实实数数据据
差差异异性性错错误误分分类类
错错误误分分类类数数据据
高脂肪低脂肪
膳食膳食
心肌梗死 60
40
对照 40
60
OR= (60╳60)/(40╳40)=2.3
高脂肪膳低脂肪
食
膳食
心肌梗死 60
40
对照 32
2020/6/16
3
第一节研究结果的变异性
概述个体水平的变异性群体水平的变异性样本水平的变异性
2020/6/16
4
一、概述
第一节研究结果的变异性
变异性(variability) 研究结果包括描述性和分析性数据（指标）
的变动或波动。
表 8-1 变异性的水平和来源
变异性水平
变异的来源
个体
膳膳食食改改良组组
降降低胆胆固固醇醇药物物组组
0
5
10
15
图 8-2 膳食与药物预防心机梗死的样本变异性示例
2020/6/16
五年内发生心肌梗死风险（%）
13
第一节研究结果的变异性
如图8-2，研究A和B中膳食改良组五年内发生心机梗死的风险为9%，而降胆固醇药物组为6%。
研究A样本较小（200人），两组效应指标（心肌梗死风险）的 95%可信限较大，发生重叠，无显著性差异。
E
?
C
D
2020/6/16
35
第三节研究的偏倚
例如高血清胆固醇是冠心病的危险因素，高血清胆固醇可产生沉积于眼睑的黄色瘤，从而导致黄色瘤与冠心病的继发关联。另外，E与C也可以由于相关（因果方向不明）而产生继发关联。
例如吸烟是胰腺癌的危险因素，吸烟又与喝咖啡存在相关（没有确定的时间先后），从而造成喝咖啡与胰腺癌的继发关联。
2020/6/16
6
第一节研究结果的变异性
二、个体水平的变异性
某个体特征测得值的变化，是个体真值随时间的改变，或是由于测量误差引起的变化。
变异来源个体状态
测量误差
表 8-2 个体水平测得值的变异来源特点
日间变异，年龄、膳食或运动改变，环境因素（季节、温度等）仪器标度差，仪器精密度差，仪器读数或记录错误
流行病学 Epidemiology
第九章偏倚及其控制 Biases and Their Control
研究的解说涉及到研究的真实性的问题。研究的真实性直接关系到是否获得正确的结论，而真实性需要通过变异性估计来确定。
2020/6/16
2
第一节研究结果的变异性第二节研究的真实性第三节研究的偏倚
1976年，Miettinen详细讨论了偏倚的定义，并给出分类框架,分三类
选择偏倚
信息偏倚
混杂偏倚
2020/6/16
23
第三节研究的偏倚
一、选择偏倚（selection bias）
定义研究对象的选取过程中，由于选取方式不当，导致入
选对象与未入选对象之间存在系统差异，由此造成的偏倚称为选择偏倚。例如研究对象采用志愿者，方便样本，或者研究对象的无应答或失访等。
2020/6/16
36
第三节研究的偏倚
直接因果关联的歪曲
如果怀疑病因E与疾病D既存在直接关联，又存在间接
关联(图A)或与其他危险（保护）因素F存在相关(图B)，
暴露E与疾病D的直接因果关联程度或方向将可能受到
混杂干扰，即得到歪曲的关联估计值。
E
E
F A?
F B?
D
2020/6/16
D