元分析常见问题及解决方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元分析常见问题及解决方法
作者:孔博丹许惠芳孔博鉴
来源:《心理技术与应用》2014年第01期
摘要:元分析是心理学研究中的重要手段。国内元分析常出现发表性偏倚缺失以及误用随机效应模型和固定效应模型的问题。本文通过整理相关文献,指出研究者应当遵循漏斗图以及相关统计的指标研究、识别并处理发表性偏倚,遵循假设以及异质性检验的结果来选取适合的模型合并单个研究指标。
关键词:元分析;发表性偏倚;随机效应模型;固定效应模型;异质性检验
一、元分析常见问题
元分析是对已有的同类课题的研究进行综合评价、分析,整合独立研究的成果,以获得普遍性、概括性结论的方法。元分析的优势有两点,一是将哲学中的批判思想转变成为可操作的方法,二是填补了定量分析方法与定性分析方法的鸿沟。在心理学界,元分析被越来越多地应用于分析某领域研究的趋势,整合不统一的研究结论,探寻新的研究方向。近年来,国内介绍、应用元分析的论文逐渐增多。但是,同国外的元分析论文相比,国内元分析论文普遍存在两方面的问题:一是发表性偏倚过程的缺失,发表性偏倚在元分析过程中是一个较为重要的步骤,但是国内的元分析文献中较少涉及此过程;二是随机效应模型和固定效应模型选择标准误用。上述两个问题如果处理不好均有可能影响元分析结果的准确性,甚至有可能得到相反的结果。为此,本研究整理分析有关这两个问题的文献,期待通过对文献的梳理,解决上述两个问题。
二、发表性偏倚的识别及解决办法
(一)如何识别发表性偏倚
发表性偏倚是指由于研究者不能完全占有相关领域的资料而造成元分析结果存在偏倚。发表性偏倚常被称为“文件柜问题”,缘其类似于研究者没有将结果不显著的文献用于分析,就像把它们放在文件柜里(Rosenthal,1979)[1]。造成偏倚的原因有二:一是元分析者很难收集到相关研究领域的所有文献,很多没有公开发表的文献是不易获取的;二是已经发表的文献中,证实了研究假设的居多,而有悖于研究假设的很少,同时元分析者也易将结果显著的研究纳入元分析中(Rosenthal,2001) [2]。偏倚一般体现为结果偏向于研究者的原假设。常用的评定方法有两类:直观的观察法和统计的方法。
直观的观察法常用漏斗图法(funnel plot),它由Light和Pillemer于1984年提出。漏斗图将各个研究表示为直角坐标系里的散点图。一般来说,X轴是效应量值,Y轴是样本量。各个研究表示为坐标系内的点。漏斗图的理论依据是样本量越大,其对效应量值的估计也就越准
确,样本量越小,其误差也越大。具体表现为漏斗图里样本量大的研究集中在图的上方,平均效应量值周围;样本量小的研究散落在图的底部,离平均效应量值较远。元分析者通过观察图形的形状来确定偏倚是否存在。如果没有,各个点应该是成堆的、对称的,聚集在平均效应量周围,就像一个倒着的漏斗一样;如果有,图形会有缺角。漏斗图很直观,且方便,易于操作,但是它的主观性很强。而且漏斗图只能够提供定性的结论,并不能说明偏倚的程度有多大,以及在多大程度上对元分析结果造成影响。针对这些缺点,研究者提出了统计的方法。常见的统计方法包有Fail-safe N、Egger回归系数、Trim and Fill。
(二)Fail-safe N法
罗森塔尔(Rosenthal,1979)提出了Fail-safe N法[3]。他指出,由于证实原假设的文章易发表,就造成了元分析的结果有偏倚。发表性偏倚的原因就是缺乏结论不显著的文章。要确定这些文章的数量,可以通过计算需要合并多少个这些并未纳入元分析的研究从而使原来元分析显著的p值变为不显著来实现。具体做法为:假定缺失的研究显著性水平不足0.05,它们的效应量值为0,计算出Z值,将这些Z值用特殊的方法合并到原来的结果中去,得出总效应量的Z值。将合并后的Z值与p值为0.05的Z值相比较,计算出使前者小于后者需要的研究个数。
有研究者对Fail-safe N提出了批评:一是罗森塔尔所说的显著,仅是局限于统计学意义上的显著,而没有从数量上说明;二是罗森塔尔的模型假定缺失的效应量值均为0,然而缺失的研究的效应量值并不总为0,另外研究的样本量也未被考虑;三是显著性水平p是联合研究后计算出来的,而现在的元分析则是直接计算出p值(B.J.Becker,2005) [4]。
针对以上的这些缺陷,后来的一些研究者提出了改进了的Fail-safe N法。如奥温(Orwin,1983)提出的另一种计算方法[5],在基本思路上仍然沿袭罗森塔尔,即确定需要多少研究才能使得结果的显著性发生变化。与之不同的是,针对罗森塔尔方法中将缺失研究的效应量值定义为0这个缺陷,奥温则将缺失研究的效应量值扩展为一定的数值,即计算出需要多少个效应量值为某一确定值的研究才能够使原先的效应量值的显著性水平发生变化。奥温的方法好处在于研究者可以自己确定出缺失效应量值的最低水平。罗森塔尔(1991)则进一步提出了Fail-safe N法的评定标准,当N值大于5k+10时就不存在发表性偏倚[6]。
(三)回归系数
埃格尔(Egger,1997)提出可以利用回归方程中的截距是否为0来推测发表性偏倚是否存在[7]。这种方法基于漏斗图,将每个研究表示成效应量值的Z分数(θi/vi)为标准误倒数的回归的形式。
Zi为效应量值对应的Z分数,vi为标准误。
如果没有偏倚,漏斗图是对称的,那么直线就应该穿过标准正态分布图形的原点,也就是β0为0。研究者应该报告β0=0时双尾检验的p值。
埃格尔则认为Z值以1/vi的形式加权是缺乏理论支持的,因此,他又提出了未加权的方法。埃格尔认为上一种方法仅考虑将各个研究的方差的倒数作为权重,这种情形只适用于固定效应模型。在随机效应模型中,方差被区分为被试内方差vi和被试间方差τ2,会造成偏差。采用τ2和vi加权能适用于两种模型,因为在固定效应模型中τ2为0。
(四)Trim and Fill法
Trim and Fill法由杜瓦尔(Duval)和特威迪(Twe-edie)提出。这种方法同样是基于漏斗图。其基本思路为:如果漏斗图是不对称的,那么在左边或者右边就会有一些多余的散点,如果将这些散点删去,那么漏斗图又会变得对称。Trim and Fill法采用迭代的方法将这些研究一个个去掉,直到图形对称了以后,再重新计算出效应量值的无偏估计。由于去掉了一部分研究以后,会影响原来样本的方差,使置信区间变小。因此还需采用一定的算法将删去的研究还原,重新计算出样本的方差。
(五)如何处理发表性偏倚
缘其究竟,发表性偏倚是由数据缺失造成的。因此,对发表性偏倚问题的处理等同于对缺失数据的处理。罗宾(Rubin,1976)将缺失数据划分为三种类型:完全随机缺失(missing completely at random)、随机缺失(missing at random)、非随机缺失(not missing at random)[8]。其中,完全随机缺失数据和随机缺失数据是正态分布,非随机缺失数据是偏态分布的。不同的方法适用于不同的缺失值类型。
三、随机效应模型和固定效应模型的原理及
选择
元分析的核心是效应量值,因此确定效应量值的真实值θ以及确定其置信区间是最为重要的步骤。随机效应模型和固定效应模型提供了两种不同的计算方式,其原理大同小异,均是分别对样本的效应量值和方差进行估计。但是,由于两种模型对误差的定义不同,造成了最终的结果有所区别。
(一)固定效应模型(Fixed-Effects Model)
固定效应模型由赫奇斯(Hedges)于1982年提出[9]。他认为,固定效应模型中各个参数是固定的,需要采用一定的方法将这些参数估算出来。当所纳入的研究属于同一分布时,各个研究中均包含有相同的真值(true effect size)。固定效应模型中假定真值θ是由效应量值的观测值和误差共同决定。用公式表达为:
确定真值θ需要估计两个值:一个是平均效应量值的观测值Ti,另一个是误差εi。在对平均效应量值估计之前,首先需要确定权重。元分析中各个研究的被试个数差别可能特别大,所