第十一章常见偏倚及其控制教案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第⼗⼀章常见偏倚及其控制教案
常见偏倚及其控制
(Biases and Their Control)
流⾏病学研究结果的真实性(validity)是极其重要的问题,研究的真实性直接关系到能否获得正确的结论。
进⾏流⾏病学研究时,不论采⽤任何研究⽅法,有许多因素可影响其准确性,使研究结果与真实值情况存在偏差,有时相去甚远。
造成这种偏差的原因,归纳起来有两个⽅⾯:⼀是随机误差(random error),⼆是系统误差(systematic error)即偏倚(bias)。
因此,研究者应尽可能地采取措施减少这两类误差的发⽣,减少随机误差以提⾼研究的精确性(精确度)(precision),减少或避免偏倚以提⾼研究的真实性(validity)。
随机误差难以避免,可通过研究设计和统计学⽅法予以减少与评价。
偏倚是随机误差以外的,可导致研究结果与真实情况差异的系统误差,其可发⽣于研究的各个环节,有⽅向性,理论上可以避免。
偏倚的种类很多,⼀般将其分为三类,即选择偏倚(selection bias)、信息偏倚(information bias)和混杂偏倚(confounding bias)。
【案例⼀】
某研究者计划研究恶性⿊⾊瘤同⾼⾎脂的关系,恶性⿊⾊瘤病例取⾃医院,同时,他从医院某病区随机抽取相应⼈数的⾻折患者作为对照。
在某⼈群中,发现恶性⿊⾊瘤患者共6000例,⾻折患者也是6000例,在恶性⿊⾊瘤患者或⾻折患者中各有20%的⼈同时患有⾼⾎脂。
并假定恶性⿊⾊瘤、⾻折、⾼⾎脂三者之间⽆任何关联,三者的⼊院率是相对独⽴。
恶性⿊⾊瘤和⾻折相对于⾼⾎脂:χ2=0,P>0.05;OR=1200×4800/1200×4800=1.0
表明⼈群中恶性⿊⾊瘤、⾻折、⾼⾎脂三者之间并⽆关联。
若该⼈群患恶性⿊⾊瘤、⾻折和⾼⾎脂的患者⼊院率分别为60%、25%、40%,那么以⼊院病⼈作为对象来研究恶性⿊⾊瘤与⾼⾎脂和⾻折与⾼⾎脂的关系,就可以得出以下的调查结果。
恶性⿊⾊瘤和⾻折相对于⾼⾎脂:χ2=81.25,P=0.0000;OR=912×1200/660×2880=0.58
表明⼈群中⾼⾎脂是恶性⿊⾊瘤的保护因素,⽽对⾻折是⼀个危险因素。
【问题的提出】
⼀、流⾏病学中的偏倚及其种类?
研究的真实性或效度(validity)是指研究收集的数据、分析结果和所得结论与客观实际的
符合程度。
研究结果与客观实际存在不符合的地⽅,这就是研究误差,它是研究真实性的反⾯。
研究误差可以分为系统误差和随机误差两部分:系统误差是指有固定⽅向和固定⼤⼩的误差,来⾃于对象选取、测量和统计分析等的⽅法学缺陷;⽽随机误差没有固定⽅向和固定⼤⼩,⼀般呈正态分布,来⾃于随机抽样变异和测量随机变异等。
研究误差中的系统误差部分,称为偏倚(bias)。
流⾏病学研究从研究设计、实施、分析⾄推断过程中均可发⽣偏倚。
偏倚可存在各种流⾏病学研究类型,如现况研究、病例对照研究、回顾性或前瞻性队列研究和实验流⾏病学研究。
偏倚发⽣的环节繁多,形式各异,⼤致可分为3⼤类。
选择偏倚(selection bias)主要发⽣在研究的设计阶段,如⼊院率偏倚、奈曼偏倚和检出症候偏倚等。
信息偏倚(information bias)主要发⽣在研究的实施阶段,如回忆偏倚、报告偏倚和调查者偏倚等。
混杂偏倚(confounding bias)主要发⽣在研究的设计和分析阶段。
⼆、本次研究是否存在偏倚?偏倚在流⾏病学中的来源如何?
社区样本⼈群中恶性⿊⾊瘤同⾼⾎脂本⽆任何关联,⽽以医院病例作为样本所得观察结果,⾼⾎脂是恶性⿊⾊瘤的保护因素,⽽对⾻折是⼀个危险因素。
则研究中得出的结论与真实情况不符即偏倚。
研究结果具有变异性,变异性(variability)指的是结果包括描述性和分析性数据(指标)的变动或波动,变异可存在于不同的⽔平,包括个体⽔平、群体⽔平和样本(研究)⽔平。
变异的来源可以分为两个层次:1.⽣物学(真实)变异和测量变异,⽣物学变异反映真实的客观变异,测量的变异反映测量过程的误差;2.随机变异和系统变异,随机变异(误差)的绝对值和⽅向
(符号)交错变化,并呈有界范围的正态分布。
系统变异(误差)的绝对值和⽅向保持恒定。
上述的测量误差,就可以再分出随机误差和系统误差。
研究误差中的系统误差部分为偏倚。
三、本次研究若存在偏倚,其⽅向如何?
本次研究中,本来恶性⿊⾊瘤同⾼⾎脂本⽆任何关联,现在⾼⾎脂是恶性⿊⾊瘤的保护因素。
则是夸⼤了其保护效应,或可以说造成了虚假的效应,不管它是危险效应还是保护效应,该偏倚是正偏倚。
偏倚是⼀种系统误差,它或偏向正⽅向,使原来的真值被夸⼤了,或偏向负⽅向,使原来的真值被缩⼩了,因此偏倚是有⽅向的。
偏倚的⽅向有两种(如果某⼀特征的真实值为θ,⽽测量值为θ?)
正向偏倚:当θ?>θ>1或θ?<θ<1时,为正偏倚。
正偏倚则会夸⼤研究的结果;
负向偏倚:当1<θ?<θ或θ<θ?<1时,为负偏倚。
负偏倚则会缩⼩研究的结果。
四、本次研究若存在偏倚,其在流⾏病学中的类别如何?
此次研究的偏倚是选择偏倚中的⼊院率偏倚,因恶性⿊⾊瘤和⾻折⼊院率不同⽽导致的偏倚。
选择偏倚(selection bias)指被选定的研究对象与未被抽取的⼈群在某些特征上存在系统差异⽽出现的误差。
主要发⽣在设计阶段,也产⽣于资料收集阶段的失访、⽆应答等。
以在病例对照研究与现况研究中为常见。
选择偏倚中包括⼊院率偏倚(admission rate bias)、现患-新发病例偏倚(prevalence-incidence bias)、检出症候偏倚(detection signal bias)、易感性偏倚(susceptibility bias)、排除偏倚(exclusive bias)、⽆应答偏倚(non-respondent bias)、失访偏倚(loss to follow up bias)、志愿者偏倚(volunteer bias)和健康⼯⼈效应等。
⼊院率偏倚亦称伯克森偏倚(Berkson?s bias),是指在以医院为基础的病例对照研究中,由于所⽐较各组⼊院率的不同⽽导致的偏倚。
五、如何测量此类偏倚或选择偏倚?
测量⽅法:
总⼈群⽐值⽐样本⽐值⽐
以α、β、γ、δ分别代表A、B、C、D的样本选择概率,(α=a/A,β=b/B,γ=c/C,δ=d/D)
选择偏倚= 或
(1)若得值=0,即=1,则不存在选择偏倚;
(2)若得值>0,即>1,则存在选择偏倚,为正偏倚;
(3)若得值<0,即<1,则存在选择偏倚,为负偏倚。
六、流⾏病学如何控制此类偏倚或选择偏倚?
(1)⾸先研究者对在整个研究中可能会出现的各种选择偏倚应有充分的了解、掌握。
(2)严格掌握研究对象纳⼊与排除的标准。
对照的⼊选原则为:不患所研究的疾病且有暴露于研究因素的可能;不患有与研究因素有关的其他病;在某些⽅⾯与病例组的可⽐等。
(3)在研究中采取相应措施,尽量取得研究对象的合作,以获得尽可能⾼的应答率,减少⽆应答率及队列研究中的失访和实验性研究中的中途退出等。
(4)尽量采⽤多种对照如在病例对照研究中,理想的研究对象应是⼈群中的全体病例和⾮该病病例及正常⼈,或其有代表性的样本。
虽然医院病例容易有Berkson?s偏倚,但由于⽅便、易⾏、应答率⾼等的优点,在实际研究中常常采⽤。
此时最好选⽤两个或两个以上的对照,如不同病种对照,其中之⼀最好取⾃社区⼀般⼈群。
通过不同对照的结果,可对是否存在偏倚进⾏判断,并对结果的真实性进⾏估计。
【案例⼆】
研究者设计病了对照研究中,选取病例组和对照组各100⼈进⾏研究,结果表3、4、5。
注:真实OR=(60×70)/(40×30)=3.5
注:⽆差异性错分后的OR=(66×52)/(48×34)=2.1
表5 差异性错分的暴露状况
注:差异性错分后的OR=(66×75)/(25×34)=5.8
【问题的提出】
⼀、此研究中可能存在偏倚?
此研究中存在信息偏倚,信息偏倚(information bias),⼜称观察偏倚(observational bias)或错分偏倚(misclassification bias),是指在研究的实施阶段从研究对象获取研究所需的信息时所产⽣的系统误差。
由于所收集的有关暴露或疾病的信息不准确或不完整,造成对研究对象的归类错误,这种不准确性在各组中的发⽣程度可以相同,也可以不同,其对研究结果的影响程度取决于各⽐较组受累程度的差别。
⼆、此研究中若存在偏倚,其种类和来源如何?
信息偏倚的种类包括:回忆偏倚(recall bias)、报告偏倚(reporting bias)、诊断怀疑偏倚(diagnostic suspicion bias)、暴露怀疑偏倚(exposure suspicion bias)和测量偏倚(detection bias)等等。
信息偏倚可来⾃于研究对象、研究者本⾝,也可来⾃⽤于测量的仪器、设备、⽅法等。
其中不应答偏倚、回忆偏倚、报告偏倚(说谎偏倚)、社会期望偏倚来⾃于被调查者;诊断怀疑偏倚、暴露怀疑偏倚来⾃于调查者;测量偏倚来⾃于测量仪器。
三、此研究中表4与表3相⽐表明什么?
此研究中表四表⽰错分是⽆差异性的,⽆差异性错分后的OR值⼩于真实OR值,说明资料的效应估计值低于实际值,使效应估计值趋于⽆效值,低估研究因素与疾病之间的联系。
⽆差异错误分(nondifferential misclassfication)指暴露或疾病的错误分类同研究分组⽆关,即在各⽐较组间不存在差异。
她⼤多数情况下模糊了研究组间的差异,⼀般使效应值的估计值偏低。
四、此研究中表5表3相⽐表明什么?
此研究中表四表⽰错分是差异性的,差异性错分后的OR值⼤于真实OR值,说明资料的效应估计值⾼于实际值,使效应估计值远离⽆效值,⾼估研究因素与疾病之间的联系。
差异性错分(differential misclassffication)指暴露或疾病的错误分类同研究分组有关,即在各⽐较组间存在差异。
由于错误分类在组间存在的差异的偏向可能不同,所以它造成⾼估或低估研究效应值。
五、流⾏病学中此类偏倚如何测量?
信息偏倚的测量
重测⼀致性:测量与评价信息偏倚的常⽤⽅法是对调查获得的信息予以重复调查(测量),根据调查与重复调查数据计算Kappa (K)值,来评价重测的⼀致性(consistency),以作为
研究结果内部真实性评价的依据。
κ值判断⼀致性强度的标准,⼀般认为:>0.8,很好;0.6~0.8,较好;0.4~0.6,中度;
<0.4,较差。
偏倚程度与⽅向:信息偏倚
若得值=0,则不存在信息偏倚;若得值>0,则存在信息偏倚,此时ORO>ORT,为正偏倚;若得值<0,则存在信息偏倚,此时ORO
六、在流⾏病学研究过程中,如何控制此类偏倚?
1.研究者对拟进⾏的研究要制定明细的资料收集⽅法和严格的质量控制⽅法
2.尽可能采⽤…盲法?收集资料
3.尽量采⽤客观指标的信息
4.回忆偏倚:可通过⼀定的调查技巧加以避免,如可选择⼀个与暴露史有联系的鲜明的记忆⽬标帮助其联想回忆等等。
此外对在条件允许时询问到的暴露史,尽可能的与客观记录核实。
敏感问题:可通过调查知情⼈或相应的调查技术获取正确的信息。
【案例三】
有医⽣以病例对照研究⽅法探讨饮酒与⾼⾎压的关系。
病例组为在某地医院就诊的⾼⾎压病⼈244例,对照组为该地的⼀个随机样本493例。
病例对照的调查应⽤同⼀的调查表,调查研究对象过去饮酒情况,同时还调查了年龄、性别、体重指数(BMI>24为超重)等变量。
病例组采取当⾯询问其饮酒的情况,但对照组采⽤信函调查的⽅法。
结果表6。
粗OR即cOR=1.78,χ2 =13.03,P =0.0003
考虑到在分析饮酒与⾼⾎压之间的关系时,体重指数可能是潜在的混杂因素。
⾸先,我们对体重是否具备混杂因素的条件进⾏判断。
下⾯表7和表8是对体重指数(F)与⾼⾎压(D)和饮酒(E)的关系的分析。
OR(EF)= 0.65,χ2 =7.71,P =0.006
OR(DF)=1.52,χ2 =7.00,P =0.008
根据表7、8的计算可知,体重符合混杂因素的条件,它有可能成为潜在的混杂因素,歪曲饮酒与⾼⾎压的真正关系,应予进⼀步调查分析。
按体重分层后,饮酒与⾼⾎压的关系资料见表9。
按混杂因素分层后,各层间的⽐值⽐相等,这种相等是否可能由于机遇所致呢?如果层与层间的⽐值⽐不相等就可能存在效应修正作⽤,层与层间的⽐值⽐的均匀性检验可⽤对数⽐值⽐法(logrithms of odds ration)。
本例资料χ2均匀性检验如下:
2
χ2= 0.001,P>0.05
【问题的提出】
⼀、此研究中可能存在哪些偏倚?如何控制?
此研究中存在选择偏倚、信息偏倚、混杂偏倚。
(1)研究者选⾃医院病⼈作为病例组,可能存在选择偏倚。
应尽可能的从社区中选病例,如果这⼀点⽆法做到,可从多个医院中选择病例以减少选择偏倚,另外可采⽤多种对照,通过不同对照的结果,可对是否存在偏倚进⾏判断,并对结果的真实性进⾏估计。
(2)病例组采取当⾯询问其饮酒的情况,但对照组采⽤信函调查的⽅法,两组所⽤的观察⽅法不同,可能存在信息偏倚,病例组与对照组应采⽤同样的调查⽅法,并在调查时应同样重视,不能“厚此薄彼”。
(3)可能存在混杂偏倚,体重是混杂因素。
可以对体重进⾏分层分析,或⽤多因素分析⼆、⼀个因素如果是混杂因素,那么它必须具备哪些条件?本课题中的体重是否具备混杂因素的条件?
⼀个因素如果是混杂因素(confounding factor),那么它必须具备的条件为:(1)必须是所研究疾病的独⽴危险因⼦;(2)必须与所研究的暴露因素有关;(3)⼀定不是暴露因素与所研究疾病因果链上的中间变量。
本课题中的体重具备混杂因素的条件。
理由为:(1)表4计算的OR值=0.65,说明体重与饮酒有关,即体重与暴露因素有关。
(2)表5计算的OR值=1.52,说明体重与研究的疾病有关。
(3)体重不是饮酒与⾼⾎压因果链上的中间变量。
三、各层OR与cOR相⽐有⽆差异?有差异应如何解释?
OR i≠cOR,表明体重是饮酒与⾼⾎压关系的混杂因素,cOR存在混杂偏倚。
混杂偏倚或称混杂(confounding),是指在流⾏病学研究中,由于⼀个或多个潜在的混杂因素的影响,掩盖或夸⼤了研究因素与疾病(或事件)之间的联系,从⽽使两者之间的真正联系被错误地估计。
层与层间的⽐值⽐的均匀性检验表明两层之间的⽐值⽐是相等的,提⽰体重仅仅是饮酒与⾼⾎压关系的混杂因素,⽆效应修正作⽤。
四、本例中ORMH(即aOR),与cOR相⽐有⽆差别?试对超重所产⽣的混杂偏倚的⼤⼩⽅向予以测量。
ORMH(即aOR)≠cOR,即1.89≠1.78。
因为aOR>cOR,混杂作⽤为负混杂,亦称阴性混杂,即由于体重的混杂作⽤,使cOR低估了饮酒与⾼⾎压的关系。
混杂偏倚及其⽅向与程度可⽤下式测量:
混杂偏倚=(cOR-aOR) /aOR= -0.0582,为负值,为负混杂,混杂的程度为0.0582。
五、混杂偏倚该如何测量?
混杂偏倚测量可通过⽐较含有该因素时研究因素与疾病的效应估计值,(如RR,OR),与排除该因素后的效应估计值来实现。
设含有某可疑混杂因素(f)时,研究因素与研究疾病的效应估计值为cRR或cOR,称作粗RR或粗OR;按该可疑混杂因素调整后的效应估计值,即排除掉该因素的可能混杂作⽤后的效应估计值为aRR(f)或aOR(f),称作调整RR或调整OR(可⽤Mantel-Haenszel分层分析⽅法计算)
混杂偏倚测量⽅法如下:
(1)若cOR=aOR(f) ,则f⽆混杂作⽤,cOR不存在f的混杂偏倚。
(2)若cOR≠aOR(f),则f有混杂作⽤,cOR存在f的混杂偏倚。
(3)若cOR>aOR(f)为正混杂,亦称阳性混杂,既由于f的混杂作⽤,使cOR⾼估了研究因素与研究疾病之间的联系。
(4)若cOR
混杂偏倚及其⽅向与程度可以下式测量:
混杂偏倚=cOR-aOR(f)/aOR(f)
若值=0,⽆混杂。
当值≠0时,若为正值,为正混杂;若为负值,为负混杂。
值的⼤⼩为混杂的程度。
六、在流⾏病学研究过程中,如何控制混杂因素的混杂作⽤?
在流⾏病学研究过程中,可以通过下列⽅法控制混杂因素的混杂作⽤:
(1)限制在设计阶段,可对研究对象的⼊选条件进⾏限制,这样可以获得同质的研究对象,从⽽可防⽌某些混杂偏倚。
(2)匹配在为研究对象选择对照时,使对照与研究对象在某个或某些潜在的混杂因素相同或相近,从⽽消除混杂因素的影响。
(3)随机化运⽤随机化的原则将研究对象以同等的机率分配在各处理组中,从⽽使潜在的混杂因素在各组间分布均衡。
(4)分层分析在资料分析阶段,将可疑的或已知的混杂因素按其不同⽔平分层后,再进⾏统计分析。
使⽤分层分析法,即可以评价在各层中暴露与疾病的联系,⼜可以整体估计在分层排除混杂因素后暴露与疾病的总的联系。
(5)标化标化的⽅法是对分层分析的补充⼿段。
当不同暴露强度组间的混杂因素分布不均匀时,可以选择⼀种标准构成,来调整原来分步的不均匀。
(6)多因素分析当样本数不够⼤,不⾜以分层分析,或希望查考多种因素对疾病的综合影响,可应⽤多因素分析。
在多因素分析中,暴露因素与混杂因素都被放在同等的地位进⾏分析。
常⽤的多因素分析⽅法有Logistic回归模型等等。
【扩展的知识】
⼀、变异的⽔平
变异性(variability)指的是结果包括描述性和分析性数据(指标)的变动或波动,变异可存在于不同的⽔平,包括个体⽔平、群体⽔平和样本(研究)⽔平。
变异可存在于不同的⽔平,包括个体⽔平、群体⽔平和样本(研究)⽔平。
1.个体⽔平的变异性是指某个体特征测得值的变化,它可以是个体真值随时间的改变,也可以是由于测量误差引起的变化。
2.群体⽔平的变异性:(1)各个体的累计变异,因为构成群体的各个个体具有不同的遗传素质并受到不同的环境影响;(2)群体的变异程度常常⼤于个体的变异。
⼀般可根据群体的变异范围来确定“正常值”范围,⽤于判定个体测得值是否“正常”;(3)群体⽔平的变异性也受到测量误差的影响。
3.样本(研究)⽔平的变异性是指通过不同样本的研究所得结果的差异性。
但是,研究通常不能针对整个总体⼈群来进⾏,⽽是通过样本⼈群来进⾏,这就引⼊了抽样变异(误差)。
通过不同样本的研究所得的关于总体结果的估计值会有不同,如果排除测量误差,这些样本的估计值与总体真实值(⽤各样本估计值的均值代表)的差异,就是抽样误差。
当样本含量增⼤时,抽样误差就会减少。
⼆、偏倚的定义
选择偏倚(selection bias)指被选定的研究对象与未被抽取的⼈群在某些特征上存在系统差异⽽出现的误差。
1.⼊院率偏倚亦称伯克森偏倚(Berks on?s bias),是指在以医院为基础的病例对照研究中,由于所⽐较各组⼊院率的不同⽽导致的偏倚。
2.现患-新发病例偏倚也称奈曼偏倚(Neyman bias),研究病例⼀般是现患病⼈,不包括死亡病例和那些病程短、轻型、不典型的病例,某些病⼈在患病后,有可能会改变其原来的某
些因素的暴露状况,这样⽤于研究的病例类型(现患病例)与队列研究或实验研究的病例不同,它们多⽤新病例,由此⽽产⽣的偏倚即为现患病例-新病例偏倚。
3.检出偏倚或称检出症候偏倚,指某因素与某疾病在病因学上虽⽆关联,但由于该因素的存在⽽引起该疾病症状或体征的出现,从⽽使患者及早就医,接受多种检查,导致该⼈群较⾼的检出率,以致得出该因素与该疾病相关联的错误结论。
4.易感性偏倚是有些因素可能直接或间接地影响观察⼈群或对照⼈群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系,由此⽽产⽣的偏倚称。
5.排除偏倚在研究对象的确定过程中,没有按照对等的原则或标准,⽽观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计。
6.⽆应答偏倚是指研究对象中那些没有按照研究设计对被调查的内容予以应答者。
某个特定样本中的⽆应答者的患病状况,以及对某⼀或某些研究因素的暴露情况与应答者可能不同,由此⽽产⽣的偏倚。
7.失访偏倚由于失访⽽引起的偏倚。
8.志愿者偏倚志愿参加观察者同⾮志愿者在关⼼健康、注意饮⾷及营养⾷疗、禁烟、禁酒、坚持体育锻炼等⽅⾯有系统差异,因⽀援志愿者被⼊选为观察对象,⽽⾮志愿者落选,由此产⽣的选择性偏倚。
信息偏倚(information bias),⼜称观察偏倚(observational bias)或错分偏倚(misclassification bias),是指在研究的实施阶段从研究对象获取研究所需的信息时所产⽣的系统误差。
1.回忆偏倚(recall bias)指研究对象在回忆以往发⽣的事情或经历时,由于在准确性和完整性上的差异所致的系统误差。
回忆偏倚在病例对照研究中最常见。
2.报告偏倚(reporting bias)指由研究对象有意的夸⼤或缩⼩某些信息⽽导致的偏倚,因此亦被称作说谎偏倚。
3.诊断怀疑偏倚(diagnostic suspicion bias)由于研究者事先了解研究对象对研究因素的暴露情况,怀疑其已患某病,或主观上倾向于应该出现某种阳性结果,于是在作诊断或分析时,倾向于⾃⼰的判断。
由此⽽造成的偏倚称为诊断怀疑偏倚。
4.暴露怀疑偏倚(exposure suspicion bias)研究者若事先了解研究对象的患病情况或某种结局,可能会对其以与对照组不可⽐的⽅法探寻认为与某病或某结局有关的因素,如多次认真地调查和询问病例组某因素的暴露史,⽽漫不经⼼地调查和询问对照组,从⽽导致错误结论,此即暴露怀疑偏倚。
5.测量偏倚(detection bias)测量偏倚指对研究所需指标或数据进⾏测定或测量时产⽣的偏差。
混杂偏倚或称混杂(confounding),是指在流⾏病学研究中,由于⼀个或多个潜在的混杂因素(confounding factor)的影响,掩盖或夸⼤了研究因素与疾病(或事件)之间的联系,从⽽使两者之间的真正联系被错误地估计。