Meta分析中发表性偏倚的识别与处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Methodology Meta分析中发表性偏倚的识别与处理
康德英 洪旗 刘关键 王家良
(四川大学华西医院临床流行病学教研室 成都610041)
摘要:本文介绍了发表性偏倚的类型及产生的背景,并集中比较了三种发表性偏倚的识别与处理方法:漏斗图法、剪补法以及公式法,这些方法为评价Meta分析结果、发现与处理发表性偏倚提供参考。
关键词:发表性偏倚漏斗图剪补法
文献标识码:
Investigating and dealing with publication bias in Meta analysis
KANGDe-ying,H ONG Q i,L IU G u an-jian,WANG Jia-liang(Depart ment of Clinical Epidemiology,West China Hospital,S ichuan U niversity,chengdu610041China)
ABSTRACT:Types of publication bias and its background are introduced in this paper,and publication bias can be investigated and deal with three methods:funnel plot,trim and filling method,and formula method.Those methods can be used to detect publication bias in conducting systematic reviews.
K ey w ords:Publication bias;funnel plot;trim and filling method
1 引 言
Meta分析又称荟萃分析,是对具有相同研究内容、目的、类型的多个医学研究进行综合分析的一系列过程,以达到增大样本含量从而增大检验效能的目的,其结果作为最佳的证据,在卫生决策和临床实践中发挥了越来越大的作用[1]。
因此,确保Meta分析结果真实可靠尤为重要。
而发表性偏倚作为影响Meta分析质量的重要因素之一,日益受到关注。
为此,本文主要介绍了三类比较简单的统计分析方法:漏斗图法、剪补法以及公式法用来正确识别与处理发表性偏倚。
2 发表性偏倚及类型
系统评价,不论定性分析还是定量分析(Meta 分析),均包括以下主要分析步骤,即制定研究计划书、检索相关文献、原始文献严格评价、结果汇总与报告等。
其中检索相关文献是指检索与题目相关的包括公开发表与未公开发表的所有文献。
检索质量将直接影响到纳入研究是否全面、客观、真实,并将最终影响Meta分析的真实性。
检索时应注意查新、查全。
随着现代IT信息技术的不断发展,查新已能较好解决。
但由于偏倚的存在,造成查全较为困难。
而所有的偏倚中,发表性偏倚的控制较为困难且影响程度较大,因此发表性偏倚的识别与处理尤为重要。
发表性偏倚是指有统计学意义的研究结果比无统计学意义的研究更容易投稿和被发表。
对于无统计学意义的研究,研究者可能认为意义不大,不发表或推迟发表;作为杂志编辑则更有可能对这类论文退稿。
因为存在发表性偏倚,即使具备周密的检索策略和手段(如与研究者个人联系),也不可能完全地纳入所有相关研究。
发表性偏倚可使Meta分析过分夸大治疗效应量或危险因素的关联强度,导致临床个体治疗与卫生决策的失误。
发表性偏倚的类型较多,常见的有(1)当完成的临床试验得到阴性结果时,因研究者缺乏信心向国际知名的医学杂志投稿,而转投地方性杂志;
(2)如非英语国家研究者,可能发表于本国的地方性杂志;但当得到阳性结果时,则作者更愿意在国际性杂志上用英文发表,这种发表性偏倚被称为
语言性偏倚;(3)另外还有一些论文不能发表的原因,如博士、硕士读完学位后离开原来研究单位而未能发表;(4)或者一些研究结果可能违背了经费提供方(如制药商)的利益,被迫搁浅不能发表;
(5)出现发表性偏倚的另一种情况是一些作者为提高知名度而一稿多投,或者作为多中心研究的参研单位,同时报告各自部分结果,造成多重发表性偏倚;(6)在试图获取未发表性研究结果时出现矫枉过正,走向另外一个极端,出现补救性偏倚。
3 漏斗图法识别发表性偏倚
最常见的识别发表性偏倚的方法就是漏斗图法[2],以样本含量(或效应量标准误的倒数)与效应量(或效应量对数)作的散点图,效应量可以为RR,OR,RD和死亡比或者其对数值等。
漏斗图所基于的假设是效应量估计值的精度随着样本量的增加而增加,其宽度随精度的增加而逐渐变窄,最后趋近于点状,其形状类似一个对称倒置的漏斗,故称为漏斗图。
即样本量小的研究,数量多、精度低,分布在漏斗图的底部呈左右对称排列;样本量大的研究,精度高,分布在漏斗图的顶部,且向中间集中。
利用漏斗图可以直接观察原始研究的效应量估计值是否与其样本含量有关。
但当存在发表性偏倚时,则表现为漏斗图出现不对称,则呈偏态分布(见图1)。
绘制漏斗图,需要纳入较多的研究个数。
原则上要求5个点以上才能进行。
图1 漏斗示意图
图1所示假设为漏斗图的两种情况,左图中所有研究围绕中心线对称排列,表明没有发表性偏倚,图中空心散点代表结果无效的小样本研究,小样本研究估计的效应量变异较大,出现效应量极端值机会要多于大样本研究;右图,呈不对称分布,表示存在发表性偏倚,所缺失部分恰恰为结果无统计学意义的小样本研究。
4 剪补定量分析法
漏斗图是判断有无发表性偏倚的一种比较简便直观的方法,但只能作为一种主观定性方法,不能进行定量分析。
目前发表性偏倚的定量分析方法比较多,主要有秩相关分析法、回归分析法、剪补法等。
秩相关检验方法由Begg和Mazumdar提出,即检验效应量估计值与其方差(或者是标准误)的相关关系;Begg等提出的回归方法就是效应量与其对应标准误的线性加权回归分析,相对来讲,回归分析的敏感性高一些。
但如果Meta分析纳入少于20个原始研究时,两者的敏感性均较差,此时可以选用较为简单实用的剪补(Trim and fill2 ing method)法。
这些方法均可以看作是漏斗图的定量统计方法[3,4]。
4.1 剪补法基本步骤
该法由Taylor和Tweedie提出,其基本思想是首先剪掉初估后漏斗图中不对称的部分,用剩余对称部分估计漏斗图的中心值,然后沿中心两侧粘补上被剪切部分以及相应的遗漏部分,最后基于贴补后的漏斗图估计合并效应量的真实值。
剪补法的核心问题是估计缺失的研究的数量,可以利用非参数统计方法来实现。
主要步骤如下:1)假设真实合并效应量为(,第j个研究的效应量为Y j,已纳入n个研究,若存在发表性偏倚,则假设还有k0个研究因遗漏未被纳入;2)定义X j=Y j-Δ,按照Wilcoxon符号检验法的排序方法对|X j|排序,秩次范围是从1到n,分别计算正负秩和。
数值最大者定义为T n;3)定义k0的计算模型为L0=[4T n-n(n+1)]/[2n-1],估计值为非负整数;4)采用固定或随机效应模型得到Δ的初估值,并计算的k0初估值,去掉k0取整后数量的不对称研究数(效应量的绝对值最大的k0个研究),得到一个较为对称的漏斗图,利用剩余的原始研究重新估计Δ,再次计算k0值,并重复裁减过程。
采用反复叠代方法,直到k0值趋于稳定,得到k03值。
5)复原被剪切的k03个研究,并同时在漏斗图不对称的另一侧粘补上新的k03个研究并赋值(效应量大小与剪切的原始研究的相同,符号相反,标准误则完全相同),使漏斗图对称,并最终根据n+k03个研究计算Δ估计值。
4.2 实例分析
以Cochrane数据库(2000年1期)中急性缺血性脑卒中的神经节苷脂的Meta分析为例1[3]。
实
例演示见下:
第一步:表1中第1、2列为原始研究的OR 对数值及其标准误,利用固定效应模型首先计算合并效应量的初估值Δ1的对数值=-0.062。
从绘制的漏斗图(图2)中发现存在发表性偏倚。
图中虚线为合并效应量初估值所在的位置。
图2 实例漏斗图
第二步:中心化过程,即每个研究的OR 值的
对数值-Δ1的对数值(-0.062)得到表1的第3列,按照绝对值大小从小到大进行排序后,并赋于原来的正负号(第4列),计算正负秩和,取最大者T n =(10+11+8+7+9+4+2)=51,k 0值=(4351-113(11+1))/(2311-1)=3.43,取整为4。
第三步:去掉离中心线最远的4个研究(秩次
为-8,-9,-10,-11)后,利用剩余7
个研究重
新计算合并效应量,
Δ2的对数值=0.039。
绘制漏斗图见图3。
图3 去掉不对称部分后的漏斗图
第四步:再次中心化,每个研究的OR 值的对
数值-Δ2的对数值(0.039)得到表1的第5列,按照绝对值大小从小到大进行排序后,并赋于原来的正负号(第6列),计算正负秩和,取最大者T n =(10+11+8+7+9+4+2+5)=56,k 0值=(4356-113(11+1))/(2311-1)=4.4,取整为5。
第五步:去掉离中心线最远的5个研究(秩次为-7,-8,-9,-10,-11)后,利用剩余6个研
究重新计算合并效应量,
Δ3的对数值=0.058。
第六步:第三次中心化,每个研究的OR 值的
对数值Δ3的对数值(0.058)得到表1的第7列,按照绝对值大小从小到大进行排序后,并赋于原来的正负号(第8列),结果发现,排序与第6列完全相同,没有变化。
叠代过程结束。
第七步:按照对称的原则粘补5个研究(见第9、10列),分别取第六列秩次(-10,-11,-8,-7,-9)所对应的lnOR -Δ2值的绝对值,作为其效应量的估计值,原来的标准误作为一一对应的新粘补研究的标准误,利用原来的11个研究加上5个增补研究(共计16个研究),计算最终的合并效应量及其95%的可信区间。
调整合并效应量为1.05,95%的可信区间(0.83,1.32);未调整合并效应量估计值为0.94,其95%的可信区间为(0.74,1.18);消除发表性偏倚的影响后,漏斗图的中心位置右移。
综上所述,在漏斗图的基础上,使用剪补法可以在一定程度上纠正发表性偏倚对Meta 分析的影响。
该法可适用于考察纳入研究较多的Meta
分析(如10个研究以上)。
[4]
剪补法计算过程较为烦琐,可以在Excel 中完成。
5 公式法:定量评价发表性偏倚的影
响程度
在探讨发表性偏倚的作用时,最关心的是若存在发表性偏倚,是否从根本上改变了Meta 分析结论的真实性,使结果原本无效的变为有效。
若发表性偏倚对meta 分析的影响较大,则只需要新增少数几个无统计学意义的研究,就能使合并效应量检验无统计学意义;反之,当发表性偏倚影响较小时,则需新增很多个研究,才能改变检验结果。
所以,评价发表性偏倚的作用大小,也就是相当于回答“需新增多少个无统计学意义的研究,使得合并效应无统计学意义(P >0.05)?”这个问题。
那么通过公式法计算出新增的研究个数,就可以定量评价发表性偏倚的影响程度[1]。
如果新增研究个数小于10个以下,则下结论应慎重。
假设meta 分析纳入的原始研究个数为k ,m 则为使合并效应量出现无统计学意义的最少未发表的研究个数。
见下列公式:
Σm
j =1ln (O R ∧
j )=0,m >
k ln (O R ∧
)
1196
2
ω-k ,其
中w
表1 剪补法计算过程
原始结果
研究名称LnOR SE
中心化及排序
去掉4个研究去掉5个研究
LnOR-Δ1符号秩次LnOR-Δ2符号秩次LnOR-Δ3符号秩次
LnOR SE
Angeleri92-1.080.70-1.02-10-1.12-10-1.14-10-1.080.70 Argentino89-0.040.300.021-0.08-2-0.10-2-0.040.30 Bassi84-2.12 1.55-2.06-11-2.16-11-2.18-11-2.12 1.55 Battistin85-0.69 1.27-0.63-8-0.73-8-0.75-8-0.69 1.27 EST940.070.180.1330.0310.0110.070.18 G iraldi90-0.560.78-0.50-7-0.60-7-0.62-7-0.560.78 Hoffbrand88-0.820.64-0.76-9-0.86-9-0.88-9-0.820.64 K irczynsha94-0.220.52-0.16-4-0.26-5-0.28-5-0.220.52 Monaco910.390.460.4560.3560.3360.390.46 SASS940.210.420.2750.1730.1530.210.42 Wender93-0.160.55-0.10-2-0.20-4-0.22-4-0.160.55
1.120.70
2.16 1.55
0.73 1.27
0.600.78
0.860.64
为k个发表研究的平均权重(权重为方差的倒数),ln(O R∧)为合并效应量的估计值对数。
见实例2:以黑素瘤与日照关系的7个病例对照研究的Meta分析为例(具体内容见表2)。
m=(730.6313/1.96)23(105.97/7)-7=70 (个)
m比较大,则说明发表性偏倚的影响程度较小,结论较为可靠。
需新增70个无统计学意义的类似研究,是纳入研究的10倍,使得合并效应无统计学意义,即结果出现根本改变。
表2 黑素瘤与日照关系的7个病例对照研究的Meta分析[1]
研究OR95%CI方差权重权重ln(OR)
1 1.300.90,1.800.0331.868.36
2 1.200.60,2.300.128.50 1.55
3 3.70 2.30,6.100.0616.1421.12
4 2.400.80,7.300.32 3.14 2.75
5 6.50 3.40,12.300.119.2917.40
6 1.490.97,2.320.0520.208.06
7 1.60 1.00,2.600.0616.837.91
合计 1.88 1.56,2.28105.9767.14
固定效应模型的ln(O R∧)=0.6313,合并效应量为1.88,其95%的可信区间为(1.56,2.28)。
上述公式法的优点为简便易行,缺点为当本身合并效应量无统计学意义时,则不能进行。
6 发表性偏倚的处理
导致发表性偏倚的主要因素有:治疗效应量的有无统计学意义,样本含量大小,治疗方案有无创新,是否为重要的研究问题,研究质量的高低,是否受资助以及杂志特色等。
在所有识别发表性偏倚的方法中,漏斗图法最为简捷实用,可以对效应量估计值是否与样本量有关进行直观判断,并通过观察散点图分布是否对称,来判断有无发表性偏倚,绘制漏斗图要求纳入原始研究数目较多,最少应有5个研究。
否则散点个数过少,机遇(chance)也可能造成漏斗图不对称的情况出现。
剪补法也是建立在发表性偏倚造成漏斗图不对称的假设基础之上的。
主要分两大步进行,首先去掉不对称的部分小样本研究,估计合并效应量;然后再粘补上同数量的小样本研究。
与其它定量分析方法相比,剪补法具有较好的结果一致性。
剪补法意义并不在于估计出缺失研究的具体数目,它实际上是一种敏感性分析方法,如果去掉一部分研究与增补一部分研究,合并效应量估计值变化不明显,说明发表性偏倚影响不大,结果比较稳定。
当然剪补法有一定的风险性,当meta分析中
纳入原始研究过少时,使用剪补法有时会出现矫枉过正。
另外根据对称的原则,增补多个不存在的小样本研究,并在此基础上计算合并效应量,也还存在一些争议。
因此在使用时应慎重[5]。
若发表性偏倚较大,则需进一步措施,收集相关资料信息,如与原文作者或研究组联系,查询有无阴性结果的研究,若有,则请他们尽可能的提供相关资料等。
但有时因论文发表年代久远,不易与原作者联系;若不能把发表性偏倚减少到一定程度,考虑采用以下措施:(1)敏感性分析检验效应量估计值的稳定性,如果发现偏倚严重影响了系统评价的结论,则应如实报告,并应提醒读者注意。
(2)考虑排除低质量研究。
当然最好的方法就是防患于未然,研究者应建立完善的检索策略,找出所有的发表文献,积极寻找还未发表或推迟发表的文献;并严格评价所有的纳入原始研究的质量;建立与完善科研课题登记制度以及获取发表与未发表文献信息的快速通道;加强卫生研究能力,广泛倡导阴性科研成果与阳性结果同样重要的观点,将有助于大大减少发表性偏倚的出现。
参考文献
1 《循证医学》[M].王家良主编.人民卫生出版社,2001.
2 Matthias Egger,G eorge Davey Smith,Martin Schneider,etal.
Bias in meta-analysis detected by a simple,graphical test[J].
British Medical Journal315:629-634.
3 S.Duval,Richard Tweedie,Practical estimates of the effect of publication bias in meta-analysis[J].Australasian Epidemiologist (1998)5:14-17
4 Jonathan A C Sterne,Matthias Egger,and G eorge Davey Smith.
Systematic reviews in health care:Investigating and dealing with publication and other biases in meta-analysis[J].BMJ2001;
323:101-105。
5 Matthias Egger and G eorge Davey Smith.meta-analysis bias in location and selection of studies[J].BMJ1998;316:61-66.
(收稿日期:2002-07-24)
·消息·
N e ws
高等教育出版社全国规划教材《循证医学》编写工作会圆满举行
Conference on the textbook of Evidence-B ased Medicine
2002年12月28日,来自全国7所医学院校的24名《循证医学》教材编委一起在成都四川大学华西医院就教材大纲框架、内容、撰写形式及具体内容等进行了认真而热烈的讨论,高等教育出版社生命科学分社(下简称高教社)的栾钢副社长和席雁编辑参与了讨论。
《循证医学》教材是我国第一本为5年制医学生编写的实用教材,主编为中国循证医学中心李幼平教授,副主编是四川大学华西医院临床流行病学教研室任李静副教授。
本教材预计2003年6月正式由高等教育社出版。
本次会议的目的:制定编写内容,落实编者队伍,确定交稿时间,学习撰写要求。
会议期间,大家统一了认识,明确了要求,并对本教材定位等关键问题达成了共识,如教材对象、教材目的、教材内容等,认为循证医学应是首批规划教材中最精彩,最有闪光点的教材之一,应该尽量写出特色和水平,保证学生在有限时间内掌握科学合理的知识结构,突出基础理论、基本知识和基本技能,体现科学性、实用性、启发性、先进性和思想性。
(邹燕供稿)。