几种发表性偏倚评估方法介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的研究 ,以至于研究者能够从临床意义的角度选择一
个认为具有临床意义的最小的效应量值来确定最少需
要多少个未发表的研究 。O rw in’s N fs法回答的是最少 需要多少个未发表的研究才能导致总的效应量值在所
选择的特定的最小效应量值以下 。 ②O rw in’s N fs法允 许研究者规定未发表的研究的平均效应量为某一特定 值而不是“0”,从而 ,研究者能对未发表的研究构建一 系列其他分布的模型 。
失安全系数
我们有多大的把握相信 M eta分析得到的效应量 结果不完全是发表性偏倚造成的假象 ? 对该问题的回 答 ,采用的是失安全系数法 ,在此讨论两种失安全系数
·540·
C h inese Jou rnal of H ealth S tatistics, O ct 2009, V ol. 26, N o. 5
评估是否存在发表偏倚一般遵循如下的逻辑顺 序 : ①森林图 ( forest p lots)和漏斗图 ( funnel p lots)提供 分析资料是否存在发表偏倚的一个直观印象 ; ②秩相 关 ( rank correlation ) 和 回 归 分 析 ( regression p roce2 dures)判断是否存在发表偏倚的证据 ; ③失安全系数 ( fail2safe N , N fs )判断合并的效应量是否受到发表偏倚 的影响 ; ④trim and fill法和累积森林图 ( cumulative for2 est p lot)用于分析如果去除明显的偏倚后效应量是否 会发生改变〔1〕。下面 ,依次介绍这七种方法对发表偏 倚评估的作用 。
题引了起重视 ,但也有学者认为他提出的 N fs在评估出 版偏倚方面存在着问题或者在使用上存在很多限制条
件 ,主要原因如下〔6〕: ① Rosenthal N fs法注重的是统计 学的显著性而并非临床意义的显著性 ,即它回答的是
最少需要多少个未发表的研究才能使 M eta分析的结
论逆转 ,即使有统计学意义的合并效应量变为无统计
在此 ,介绍一种称之为“trim and fill”的方法〔7〕。 The trim and fill法实际上是一种迭代算法 ,先从漏斗 图的阳性面 ( the positive side) (漏斗图中研究文献多 的一边 )去处一些极小样本量的研究 ,重新计算总的 效应量 ,然后将去除的这些原始研究逐步加入到公式 中重新计算 ,如此反复 ,直到漏斗图围绕重新计算的总 的效应量呈左右对称 。 trim and fill法属于一种非参 法 ,计算过程也较为复杂 ,但其作用是较为明显的 ,一 些常用的统计软件 ,如 STATA、Comp rehensive M eta A2 nalysis软件都能执行相应的操作 。利用 trim and fill 法还能大致估计出未发表文献的数量 。
B egg and M azumdar’s秩相关检验的检验统计量 为秩相关系数 ( Kendall’sτ) ,分析标准化效应量及其 方差 (或标准误 )之间的相关性 。τ的解释与任何相关 系数一样 , 0值意味着效应量和精度之间没有关联性 , 偏离 0值意味着它们之间存在着相关性〔2〕。需要注意 的是 ,这里的 τ不要与随机效应模型的 τ2 (表示研究 间的 方 差 ) 相 混 淆 , 两 者 之 间 不 存 在 任 何 关 系〔2〕。 Sterne and Egger认为在采用 τ统计量进行发表偏倚分 析时应持谨慎态度 ,即纳入的研究的样本量应在一定 的范围内 ,至少包括一个中等大小的样本量的研究 ,否 则得到的结论将不可信〔3〕。而且 ,他们也注意到该检 验的检验效能较低 ,除非存在严重的偏倚才有可能将 此检验出来 ,即 τ检验的结果不具有统计学的显著性 不能视作不存在出版偏倚的证据〔3〕。
中国卫生统计 2009年 10月第 26卷第 5期
·539·
几种发表性偏倚评估方法介绍
王 珍 1, 2 张永红 1△ 徐巧巧 2
发表偏倚是指有统计学意义的研究结果比无统计 学意义的研究结果更容易被发表 ,杂志编辑也往往倾 向于录用有统计学意义的论文 ,可能导致 M eta分析过 分夸大治疗效应量或危险因素的关联强度 ,从而导致 临床上基于循证的个体化治疗与卫生决策上的失误 。 因此 ,识别是否存在发表偏倚成了 M eta分析前的一项 重要工作 。
森林图和漏斗图分析
森林图 ,能让分析者和读者既看到树木又看见森 林 ,是 meta分析的核心组成部分 ,也是发表偏倚逻辑 分析的第一步骤 ,能提供所分析资料的一个视觉印象 。 在图中 ,每个研究的效应量及其可信区间以及总的效 应量估计值均反映在图上 。从森林图上能看出总的效 应量估计是基于多个研究还是少数几个研究 、每个研 究的精确性程度 、纳入分析的研究的效应量分布趋势 以及不同研究的效应量之间是否存在显著差别 。森林 图提供给读者一张“脸谱 ”,有助于研究者正确解释分 析结果 ,还能看出研究中的一些异常情况 ,比如极端值 (outliers) ,等等〔1〕。
累积 M eta分析
累积 M eta分析 (Cumulative m eta2analysis)是 M eta 分析的另一种分析方法 ,即先从一个研究入手 ,接着纳 入第二个研究重复第一个过程 ,一直继续下去 ,直到纳 入的所有研究分析完成 。与此类似 ,反映在森林图表 示就是“累积森林图 ”,在森林图的第一行显示的是第 一个纳入的研究的效应量 ,第二行显示的是基于前两
中国卫生统计 2009年 10月第 26卷第 5期
·541·
个纳入研究的累积效应量 ,与累积 M eta分析一样 ,一 直到最后一个研究 。这种方法传统用于耗时较长的研 究 ,随着时间的延长 ,针对某个问题的证据也逐步累 积 ,分析这种证据的累积对效应量改变的影响 。 〔10〕
除此之外 ,累积 M eta分析也能被应用于评估出版 偏倚或小样本量研究对效应量估计产生的潜在影响 。 在应用时 ,需对纳入的研究按照精确度从大到小排序 , 然后逐步顺序纳入研究文献进行累积 M eta分析 。如 果随着较大样本量研究的逐步纳入 ,效应量的点值估 计逐步趋于稳定 ,并且不随纳入较小样本量研究而改 变 ,那么 ,则没有理由认为纳入较小样本量研究对效应 量估计结果产生偏倚 。另一方面 ,如果效应量的点值 估计随着纳入较小样本量研究的确发生了改变 ,那么 , 至少有一个存在偏倚的初步印象 ,从而提示研究者应 对引起效应量改变的真正原因进行调查 。
“trim and fill”法
漏斗图提供给我们的主要信息是如果不存在出版 偏倚 ,漏斗图将围绕总效应左右对称分布 。漏斗图分 析的结果若提示出版偏倚较大 ,则需要进一步的措施 , 收集相关资料信息 ,如与原文作者加强联系 、查询有无 阴性结果的研究等 。如果采取了各种措施后出版偏倚 仍不能减少到一定程度 ,以前的观点是放弃 Meta 分 析 ,但放弃对 M eta分析者或系统评价者来说是一种比 较痛苦的选择 。
法 ,一种为 Rosenthal失安全系数法 ( Rosenthal’s fail2 safe N , Ro senthal’s N fs )〔4〕,另一种为 O rw in’s失安全 系数 (O rw in’s fail2safe N , O rw in’s N fs )〔5〕。
Rosenthal N fs是 Rosenthal在 1979 年提出的一个 概念 ,许多研究者也用它作为评估发表偏倚的指标 。
秩相关和回归分析法
漏斗图提供了效应量和精度之间关系的视觉感 , 但解释时则带有很大的主观性 。漏斗图如提示可能存 在出版偏 倚 , 有 两 种 检 验 偏 倚 大 小 的 方 法 : 一 种 是 Begg and M azumdar’s等级相关检验〔2〕,另一种是 Egg2 e r’s回归分析 〔3〕。
我国学者也通过一个随机模拟的 1: 1配对病例对 照研究的 M eta分析研究结果表明〔4〕:只有当已发表文
献的 U 统计量均小于 0时 , 随着未发表研究数量的增
加 , N fs0, 05才随着增加 。而在未发表文献的 U 统计量可 能大于 0 时 , 随着未发表研究数量的增加 , N fs0, 05反而 减少 。另外 , N fs0, 05和未发表文献数量上不是一种单调 的函数关系 。因此 ,用 N fs作为评价发表偏倚的指标不 太妥当 ,但如果作为评价 M eta分析结果稳定性的指标
。
③Ro
sen
tha
l
N
法
fs
是分
别
计
算
各
独
立
研
究效应量值是否为“0”的统计量 U, 根据 U 值进行分
段 ,删除部分无统计意义的研究 ,并计算相应的安全系 数 ,计算公式为〔5〕:
N fs =
∑U 1164
2
-
k
其中 U 为每一个独立研究效应值是否为“0”检验统计
量 , k为已收集的独立研究的个数 。
Egger’s线性回归法 ,与秩相关检验一样 ,当漏斗 图提示可能存在发表偏倚时 ,也是一种检验偏倚大小 的方法 。与 Begg and M azumdar’s秩相关检验方法不 同的是 Egger采用效应量和精度的实际值而不是秩 。 在 Egger检验中 ,精度 (定义为标准误的倒数 )对标准 正态离差进行回归 。 Sterne and Egger认为该检验方法 的检验效能普遍比秩相关法高 ,但是当发表偏倚的程 度不很严重或者研究的样本量较小时 ,检验效能仍然 很低 。
学意义的合并效应量 (平均效应量水平为“0 ”) 。 ②
Rosenthal N fs公式假定未发表的研究的平均效应量为 0 ,并且假定所有发表和未发表研究的样本量相似的情
况下得到的 ,而且 ,如果所有未发表研究的平均效应量
方向与已发表的研究相反 ,则 Rosenthal N fs可能得出误
导性的结果
漏斗图法是识别发表性偏倚的一种普适方法 ,以 样本含量 (或效应量标准误 )为纵坐标 ,效应量或效应 量对数值为横坐标做散点图 。漏斗图分析基于的假设 是效应量估计值的精度随着样本量的增加而增加 ,其 形状类似于一个对称倒置的漏斗 ,故称为漏斗图 。反 映在图上则为样本量小的研究数越多 ,精度低 ,分布在 漏斗图的底部 ,样本量大的研究 ,精度高 ,分布在漏斗 图的顶部 。利用漏斗图可直观反映原始研究的效应量
trim and fill法的一个主要优点是得到的对漏斗 图校正后的一个效应量估计值 ,它提供的是考虑偏 倚后的效应量的估计值 。在大多数情况下 ,调整后 的效应量实际上已 非 常 接 近 原 始 效 应 量 〔8〕。这 种 方 法的另一个特点是本身就是一种比较直观的视觉展 示 。进行 trim and fill分析的计算程序能产生一种漏 斗图既包括已发表的研究又包括未发表研究 ,让研究 者能看出纳入未发表的研究后效应量的改变情况 。如 果改变较微弱 ,则研究者更加有把握认为自己进行的 M eta分析得到的效应量估计是有效的 。不过 , trim and fill法存在的一个主要问题是它建立在许多假设的基 础上 ,另外还存在关于计算过程的假设问题〔9〕。目前 有学者对计算过程进行了完善 ,完善后的公式比原公 式更稳健 。
1. 苏州大学放射与公共卫生学院流行病与卫生统计教研室 (215123) 2. 湖州师范学院医学院临床教研室 (313000) △通讯作者 :张永红
值是否与样本含量有关 。绘制漏斗图 ,需要纳入较多 的研究个数 ,原则上要求至少 5 个研究 。若以标准误 为纵坐标 ,采用逆向尺度赋值 (纵坐标数值从上到下 数值逐渐增大 ) ,越靠近原点 ,标准误越大 。如果所有 的研究围绕漏斗图的中心线对称排列 ,表明没有发表 性偏倚 ,如果不对称分布 ,表示存在发表偏倚 。
概念定义为 :当 M eta分析结果有统计学意义时 ,为排
除可能的发表偏倚 ,可计算最少需要多少个未发表的
研究才能使 M eta分析的结论逆转 。Rosenthal等也将
此分析 法 称 为 文 件 抽 屉 分 析 (‘File2 drawer’analy2
sis) 。Rosenthal使研究者在系统评价中对出版偏倚问
可能更贴切 。
鉴于 Rosenthal N fs存在的种种问题 , O rw in在 1983 年在 Rosenthal N fs的基础上进行了完善 ,在本文我们称 做 O rw in’s N fs法 。O rw in’s N fs法主要解决以下两个问 题〔6〕: ①O rw in’s N fs法让研究者确定的是总的效应量 变为某一特定值 (而不是“0”)最少需要多少个未发表