中介作用于调节作用:原理与应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中介效应与调节效应:原理与应用
姜永志整理编辑
1中介效应和调节效应概念原理
1.1中介效应
考虑自变量X对因变量Y的影响,如果X 通过影响变量M而对Y产生影响,则称M 为中介变量,中介变量阐明了一个关系或过程“如何”及“为何” 产生。

例如,上司的归因研究:下属的表现→上司对下属表现的归因→上司对下属表现的反应,其中的“上司对下属表现的归因”为中介变量。

假设所有变量都已经中心化(即将数据减去样本均值,中心化数据的均值为0)或者标准化(均值为0,标准差为1),可用下列回归方程来描述变量之间的关系(图1 是相应的路径图):其中方程(1)的系数c 为自变量X对因变量Y的总效应;方程(2)的系数a为自变量X对中介变量M的效应;方程(3)的系数b是在控制了自变量X的影响后,中介变量M对因变量Y 的效应;系数c′是在控制了中介变量M 的影响后,自变量X对因变量Y的直接效应;e1-e3 是回归残差。

中介效应等于间接效应(indirect effect),即等于系数乘积ab,它与总效应和直接效应有下面关系:
Y =cX +e1(1)
M =aX +e2 (2)
Y =c' X +bM +e3 (3)
c = c′+ab (4) 简单中介效应中成立,多重中介效应不成立。

中介效应的因果逐步回归法模型
1.2调节效应
如果变量Y与变量X的关系是变量M的函数,称M为调节变量。

就是说,Y 与X 的关系受到第三个变量M的影响。

调节变量(moderator)所要解释的是自变量在何种条件下会影响因变量,也就是说,当自变量与因变量的相关大小或正负方向受到其它因素的影响时,这个其它因素就是该自变量与因变量之间的调节变量。

调节变量可以是定性的(如性别、种族、学校类型等),也可以是定量的(如年龄、受教育年限、刺激次数等),它影响因变量和自变量之间关系方向(正或负)和强弱,调节变量展示了一个关系“何时”和“为谁”而增强或减弱。

如,学生一般自我概念与某项自我概念(如外貌、体能等)的关系,受到学生对该项自我概念重视程度的影响:很重视外貌的人,长相不好会大大降低其一般自我概念;不重视外貌的人,长相不好对其一般自我概念影响不大,从而对该项自我概念的重视程度是调节变量。

在做调节效应分析时,通常要将自变量和调节变量做中心化变换(即变量减去其均值,但现有文献发现中心化并不能改变调节的效应量。

Y =aX +bM +cXM +e (1)
调节效应的基本模型
1.3中介效应与间接效应的联系区别
中介效应都是间接效应,但间接效应不一定是中介效应。

实际上,这两个概念是有区别的。

首先,当中介变量不止一个时,中介效应要明确是哪个中介变量的中介效应,而间接效应既可以指经过某个特定中介变量的间接效应(即中介效应),也可以指部分或所有中介效应的和。

其次,在只有一个中介变量的情形,虽然中介效应等于间接效应,但两者还是不等同。

中介效应的大前提是自变量与因变量相关显著,否则不会考虑中介变量。

但即使自变量与因变量相关系数是零,仍然可能有间接效应,这种观点目前正在激烈的讨论中。

多重中介效应基本模型
1.4调节效应与交互效应的联系区别
调节效应和交互效应这两个概念不完全一样。

在交互效应分析中,两个自变量的地位可
以是对称的,其中任何一个都可以解释为调节变量;也可以是不对称的,只要其中有一个起到了调节变量的作用,交互效应就存在。

这一点从有关讨论交互效应的专著中可以看出。

但在调节效应中,哪个是自变量,哪个是调节变量,是很明确的,在一个确定的模型中两者不能互换。

例如,要研究数学能力的性别差异,将年级作为调节变量,这个问题关注的是性别差异,以及性别差异是否会随年级而变化。

如果从小学一年级到高中三年级都获得了各年级学生有代表性的样本,每个年级各用一份测试题,所得的数据就可以进行上述分析。

但同样的数据却不能用于做年级为自变量、数学能力为因变量、性别为调节变量的分析,因为各年级的测试题目不同,得分没有可比性,因而按调节效应的分析方法,分别不同性别做数学能力对年级的回归没有意义。

要做数学能力对年级的回归,应当用同一份试题测试所有年级的学生。

1.5简单中介效应与调节相应的比较
温忠麟等人(2005)对中介效应与调节效应进行比较后,得出如下结果:
中介效应与调节效应的比较
2中介效应方法的原理与程序
中介效应的检验方法众多,包括依次检验回归系数的因果逐步回归法(casual steps approach),检验c-c'显著性的系数差异法(difference in coefficients)和检验ab显著性的系数乘积法(products of coefficients),因果逐步回归法由于操作简单且易于理解,成为迄今为止使用最多的中介效应检验方法,但这类方法却存在诸多缺陷,已不适应甚至在某种程度上阻碍了中介研究的发展,这种方法目前也受到非常大的质疑,已经有研究者建议放弃该方法的使用。

另外,由于系数差异法在a或b不全为0时,存在第Ⅰ类错误率很高的缺陷(可高达100%),且难以应用到更复杂的涉及多个中介变量或有调节的中介模型分析中而鲜有使用。

目前被推
荐的使用方法主要包括因果逐步回归法的改良法和非参数百分位数Bootstrap法,也有研究者建议使用基于机构方程模型的中介效应检验,另外也要一些其他方法。

传统中介效应方法的相互比较
2.1中介效应的因果逐步回归检验法
2.1.1经典中介效应检验方法的步骤
因果逐步回归法由Baron和Kenny(1986)提出,其检验步骤分为三步:
第一,X对Y的回归,检验回归系数c的显著性(即检验H0:c=0);
第二,X对M的回归,检验回归系数a的显著性(即检验H0:a=0);
第三,X和M对Y的回归,检验回归系数b和c' 的显著性(即检验H0:b=0、H0:c’=0)。

如果系数c,a和b都显著,就表示存在中介效应。

此时如果系数c'不显著,就称这个中介效应是完全中介效应(full mediation);如果回归系数c'显著,但c'<c,就称这个中介效应是部分中介效应(partial mediation)。

中介效应的效果量(effect size)常用ab/c或ab/c'来衡量,但现有研究认为ab/c和ab/c'作为中介效果量指标存在诸多问题。

上述Baron和Kenny(1986)的逐步法,第一步检验的是X对Y的总效应;第二步实际上是检验系数乘积的显著性(即检验H0:ab =0),通过依次检验系数a和b来间接进行;第三步检验用来区分完全中介还是部分中介。

这三步其实是可以分开进行的,区分每一步的目的对理解和讨论逐步法很重要。

依次检验是对系数乘积的间接检验,想法很直观,如果检验结果是a≠0且b≠0,就可以推出ab≠0。

这个推理在代数上没有问题,但在统计检验上如何呢?模拟研究发现,用依次检验来检验H0:ab =0,第一类错误率较低,低于设定的显著性水平(如0.05)。

这就是说,如果依次检验结果a和b都显著,已经足够支持所要的结果,即ab显著。

但依次检验的检验力(power)也较低,即系数乘积实际上显著而依次检验比较容易得出不显著的结论。

2.1.2经典中介效应检验的质疑
(1)依次检验还有用吗?
尽管早有方法文章已经建议使用Bootstrap法直接检验系数乘积,但很多应用工作者还是照用依次检验。

依次检验受到欢迎的原因是方法简单,容易理解和解释。

方法学者不推荐也可以理解,因为依次检验的检验力在各种方法中是最低的。

就是说,依次检验比较不容易检验到中介效应显著。

但如果研究者用依次检验已经得到显著的结果,检验力低的问题对其而言就不是问题!此时,依次检验的结果甚至好过Bootstrap法的结果。

因此,如果检验结果都显著,依次检验的结果强于Bootstrap法检验结果。

(2)先检验总效应还有必要吗?
逐步法中第一步是检验方程(1)的系数c,有些人认为没有必要(Zhao etal.,2010)。

他们的论据是,间接效应(ab)的符号可能和直接效应(c)的符号相反,使得总效应(c)不显著,但中介效应还是存在;也可能存在两条中介路径,其间接效应大小相近但符号相反,使得总效应不显著。

就是说,即使总效应不显著,间接效应还是可能存在。

这里其实涉及两个问题,一是要不要检验系数c?二是中介效应要不要以系数c显著为前提条件?第一个问题的答案是肯定的,因为研究者肯定会关心X是否显著影响Y。

对于特定的两个变量X和Y,如果根据理论、经验或者与他们关系密切的第三个变量M,都无法设想X和Y之间有关系的话,还会去研究X如何影响Y吗?文章将如何立论?所以说,研究者肯定会关心X和Y之间关系。

因果逐步回归法将自变量显著影响因变量作为中介效应检验的前提条件,即如果系数c 不显著,就不存在中介效应了,但有学者认为这个前提条件是不必要的,这个前提条件的存在使得许多本来有意义的中介研究停止在第一步,抑制了中介研究的发展和应用,因为在系数c不显著的情况下完全可能存在中介效应。

另外,以c显著为前提降低了中介效应的统计
检验力也是主要的批评来源。

Mackinnon(2002)通过模拟研究比较了三类中介效应检验方法的表现,发现因果逐步回归法的统计功效(Power)最低,并且容易低估第Ⅰ类错误率,统计功效最低成为因果步骤法的主要批评来源。

有学者认为,因果步骤法统计功效最低主要与因果步骤法需要自变量显著影响因变量(即系数c显著)有关,系数c显著的要求严重降低了统计功效。

放弃系数c显著的因果步骤法称为联合显著法(joint significance),Mackinnon(2002)的模拟研究发现联合显著法的统计功效显著高于因果步骤法。

Shrout和Bolger(2002)指出当ab和c'方向相反时,就可能会导致系数c不显著。

Preacher 和Hayes(2008)指出在有两个中介变量的模型中,如果两个中介效应方向相反,也可能会导致系数c不显著,有研究者将这种现象称之为遮蔽效应,即一旦出现c不显著但中介效用显著时,要进一步去考察是否会存在上述两种情况,研究的解释也应按照遮蔽效应来解释。

多重中介模型
(3)区分完全中介和部分中介是否合适?
因果逐步回归法中最后一步,通过检验方程(3)的系数c来区分完全中介还是部分中介。

如果系数c不显著,属于完全中介。

Baron 和Kenny(1986)认为完全中介是中介效应存在的最强有力的证明。

区分完全中介和部分中介,是对中介效应模型的效应量的一种文字描述,可以帮助解释结果。

但完全中介和部分中介概念是有问题的:
第一,在总效应小(但显著)的时候,间接效应可能占总效应的比重也很小,直接效应已经不显著了,结果是完全中介,与常理相悖。

一般地说,当总效应小且样本也小的时候,容易得到完全中介的结果,但其实完全中介的情况是很少的。

第二,当说M是X 和Y关系的完全中介时,排除了将来探索其他中介的可能性。

Preacher 和Hayes(2008)呼吁放弃完全中介的概念,将所有中介都看作是部分中介,Zhao等人(2010)建议直接报告间接效应和直接效应的显著性。

(4)效果量能否准确反映中介效应
由于中介效应ab 的统计显著性实际上是效果量和样本量共同作用的结果,因此,当中介效应显著后还需要报告独立于样本量的效果量大小,效果量才是研究者最关心的。

Mackinnon(2008)总结了7种中介效果量指标,其中使用最广的是ab/c 和ab/c',但ab/c和
ab/c'作为中介效果量指标存在诸多问题。

就ab/c指标而言,第一,效果量的大小可能不能准确反映中介效应的实际重要性,二者之间可能存在较大差异。

例如当c很小时,即使很小的中介效应ab都会产生较大的效果量值,同理,当c很大时,即使很大的中介效应ab也只能产生较小的效果量值。

第二,尽管许多研究者将ab/c 看成是一个比值,表示中介效应ab在总效应c(c=ab +c')中所占的比例,但实际上,当ab与c'方向相反时,ab /c的值可以大于1,也可以是负值,甚至小于-1,这表明ab/c不是一个比值,不能表示中介效应占总效应的比例。

Shrout 和Bolger(2002)甚至建议ab/c在ab和c'方向相同的情况下使用。

第三,ab/c的使用需要大样本,ab /c只有当样本量大于500 时才稳定。

2.2乘积系数法
系数乘积法由于直接检验中介效应ab 是否显著不为0,无需以系数c显著作为中介效应检验的前提条件,可以直接提供中介效应的点估计和置信区间,且Mackinnon(2002)的模拟研究也发现系数乘积法的统计功效优于因果逐步回归法。

因此,系数乘积法逐渐得到众多研究者的青睐。

系数乘积法分为两类,一类是基于中介效应的抽样分布为正态分布的Sobel 检验法,另一类是基于中介效应的抽样分布为非正态分布的不对称置信区间法(asymmetric confidence interval)。

2.2.1 Sobel中介效应检验法
Sobel检验法就是用中介效应估计值^a^b除以中介效应估计值^a^b的标准误^σ^a^b得到一个z值(z=^a^b/^σ^a^b),将这个z值和基于标准正态分布的临界z值进行比较,如果z 值大于临界z值,说明中介效应存在,如果z值小于临界z值,说明中介效应不存在;或构建一个对称的置信区间(^a^b-zα/2×^σ^a^b,^a^b+zα/2×^σ^a^b),如果置信区间不包括0,说明有中介效应存在,置信区间包括0,说明中介效应不存在(MacKinnon etal.,2002;温忠麟等,2004)。

Sobel检验的前提假设是中介效应^a^b是正态分布且需要大样本,因为只有在正态分布下,才能使用基于标准正态分布的临界z值。

但实际的情况是,即使^a和^b都是正态分布,^a^b也不一定是正态分布,更进一步的说,只要^a^b不为零,^a^b的分布就是偏态分布,并且分布的峰值还会随着中介效应值^a^b的变化而变化。

因此,基于中介效应^a^b是正态分布的Sobel检验仍是不准确的,而且导致了统计功效降低。

Macho和Ledermann(2011)指出Sobel检验的另一个不足是在有多个中介变量的模型中,中介效应估计值的标准误^σ^a^b常用Delta法计算,计算公式比较复杂,且使用不便。

软件具体操作步骤:
下载Sobel插件安装在Spss中(/ahayes/)
步骤一、运行SPSS,打开数据文件;
步骤二、在SPSS 程序的菜单栏中找到“分析”栏目下的“回归”,在“回归”下面找
到已经安装的sobel插件;
步骤三、运行sobel程序,出现对话框;
步骤四、在对话框里的相应的输入框里,输入因变量,自变量,中介变量。

如果需要,也可以输入协变量;
步骤五、把取样(Bootstrap samples)设定为某一数字,一般为1000,建议为5000;
步骤六、点击确定。

Sobel操作界面
Sobel操作图示:
Sobel检验结果输出
2.2.2不对称置信区间法
针对现有中介效应分析中的不足,Zhao(2010)建议使用Preacher和Hayes在2004发展的Bootstrap方法检验中介效应。

不对称置信区间法由于放弃了中介效应的抽样分布为正态分布的前提,对中介效应的抽样分布不加限制,因此得到不对称置信区间。

Bootstrap 法能适用于中、小样本和各种中介效应模型,且目前常用的各种统计软件都能进行Bootstrap 法运算。

该方法主要包括非参数百分位Bootstrap置信区间法和偏差校对非参数百分位Bootstrap置信区间法。

Bootstrap 法是一种从样本中重复取样的方法, 前提条件是样本能够代表总体(当然这也是通常取样进行统计推论的要求)。

Bootstrap 法有多种取样方案, 其中一种简单的方案是从给定的样本中有放回地重复取样以产生出许多样本, 即将原始样本当作Bootstrap总体,从这个Bootstrap总体中重复取样以得到类似于原始样本的Bootstrap样本。

(例如, 将一个容量为500的样本当作Bootstrap总体, 从中有放回地重复取样,可以得到一个Bootstrap样本(容量还是500)。

Zhao等(2010)中介效应分析程序
(1)基于Process插件的操作
PROCESS插件做中介和调节的优点:
近几年来,Hayes开发的基于SPSS和SAS的中介和调节效应分析程序插件Process得到了越来越多的人的应用,主要的优势有这么几点:
第一,中介效应分析一步到位。

在Process之前,中介效应分析要分步进行,分为三步(实际上两步就可以)。

第一步检验总效应,即自变量X对因变量Y的总效应。

但这一步已经被证明是没有必要的甚至是错误的,总效应存在与否不是中介效应的必要条件,因此,先前支持中介效应三步法的一些学者后来做了修正,不再把检验总效应作为前提条件,也就是三步法实际上变成了两步法。

此外,结构方程模型的思路再次证明,第一步检验总效应的做法完全没有必要。

Hayes显然早已发现了这一点,因此,Process插件做的就是两步而不是三步。

Process直接将这两步整合起来,得到一个总的结果,不需要分两步设置和分析,这就
大大简化了步骤,结果呈现更更全面。

值得一提的是,Process虽然两步整合在一起,但其结果也是分步呈现,因而非常方便我们在论文中整理成规范的表格结果。

第二,Process的操作应用。

Process主要应用于SPSS、SAS等传统数据统计分析软件,在SPSS中除了可以可视化操作外,还可以通过Syntax语法等方式操作,扩展功能更为强大。

第三,Process的模型构建。

Process提供了76个模型,分析过程中需要选择对应的模型,设置相应的自变量、因变量、中介或调节变量即可。

第四,调节效应分析前的数据处理自动化。

在Process出来之前,调节效应的分析要经过两个重要环节——变量中心化和构建交互项,虽然这两步的操作不难,但有时候容易忽视或者计算出错。

Process提供了均值中心化之后的交互项设置,可以自动完成,因此更为准确高效。

第五,中介效应的Bootstrap和Sobel检验可以自动处理。

在Process开发之前,中介效应的Bootstrap需要特别设置,Sobel检验需要手工计算(或者用专门的小程序),Process 则可以直接自动化完成,并直接得到中介效应值Sobel检验值Z和显著性水平(基于理论正态分布)。

第六,可以处理带有控制变量的中介、调节效应模型。

在中介效应和调节效应分析中,尤其是调节效应分析,经常需要对控制变量进行控制,Process对此也有专门的设置(协变量中处理即可)。

第七,处理多变量中介、调节效应更方便,例如多重中介效应、有中介的调节效应、有调节的中介效应等。

例如,以往的SPSS分析不能提供多重中介模型的各个具体路径、各个中介变量单独的中介效应检验,如中介效应值及其置信区间和显著性水平等,而Process则可以提供这些结果。

第八,其他注意事项。

Process只能处理显变量路径分析模型,不能处理潜变量模型,潜变量模型需要使用结构方程模型。

那么,是用SPSS的Process插件还是用Amos等结构方程模型处理中介(Mediation)、调节效应(Moderation),哪个更好?对此要考虑这么几个问题,一个是样本量的问题,当样本量比较小时,用SPSS的Process方法比较好,因为小样本的数据更接近t分布而不是正态分布,而结构方程模型主要用于处理大样本。

另一个是测量误差问题,SPSS只能处理显变量,不能分离测量误差,因而其结果不如潜变量的结构方程模型精确。

第三是,SPSS不能像结构方程模型那样提供模型拟合参数,不能进行模型的整体评价。

因此,如果研究者关注的重点是路径关系而不是整体模型效度,或者结构方程模型分析发现变量之间的路径关系符合理论假设但模型拟合不佳(需要规避模型拟合问题)则考虑SPSS的Process方法比较好。

非参数百分位Bootstrap置信区间法的原理和步骤:
第一,以原样本(样本容量为n)为基础,在保证每个观察单位每次被抽到的概率相等(均为1/n) 的情况下进行有放回的重复抽样,得到一个样本容量为n的Bootstrap样本;
第二,由步骤1中得到的Bootstrap样本计算出相应的中介效应估计值^a^b;
第三,重复步骤1和2若干次(记为B,常设B=5000),将B个中介效应估计值的均值作为中介效应的点估计值,将B个中介效应估计值^a^b按数值大小排序,得到序列C;
非参数百分位Bootstrap置信区间法直接进行第四步:
第四,用C序列的第2.5百分位数(LLCI)和第97.5百分位数(ULCI)来估计的95%中介效应置信区间。

偏差校对非参数百分位Bootstrap置信区间法则进行下面两个步骤:
第四,根据原样本数据求取中介效应估计值^a^b*,求^a^b*在序列C中的百分比排位,即得到^a^b<^a^b*的概率Ф(z0); 第五,在标准正态累积分布函数中,根据Ф(z0)求取相应的z0值,求2Z0±Zα/2在标准正态累积分布函数中对应的概率Ф(2Z0±Zα/2),用Ф(2Z0±Z
α/2)在序列C中的百分位值作为置信区间的上、下置信限,构建置信度为1-α的中介效应置信区间。

由于非参数百分位Bootstrap置信区间法产生的置信区间的估计有可能会产生偏差。

一般
使用偏差校正(bias corrected)置信区间调整上限值和下限值,这种方法是对非参数百分位
Bootstrap置信区间法的改进,其中前三步相同。

不管使用何种程序,如果置信区间不包括
0,说明有中介效应存在;置信区间包括0,说明中介效应不存在。

PROCESS插件具体操作步骤:
下载PROCESS插件安装在Spss中(/ahayes/)
步骤一,运行SPSS,打开数据文件;
步骤二,在SPSS 程序的菜单栏中找到“分析”栏目下的“回归”,在“回归”下面找
到已经安装的PROCESS插件;
步骤三,运行PROCESS程序,出现对话框;
步骤四,在对话框里的相应的输入框里,输入因变量,自变量,中介变量。

步骤五,Model Number选择4,把Bootstrap取样(Bootstrap samples)设定为1000,
建议为5000,Bootstrap方法选择偏差校对方法(bias corrected),置信区间选择95%置信
区间;
步骤六,点击确定执行程序。

执行完程序,会出现输出文件。

在输出文件中包括该中介模型的估计值,如R、R2、F,
同时输出文件也包括了因果逐步回归中的a、b、c’的估计值,以及ab的中介效应值。


果置信区间不包括0,那么中介作用显著,支持中介作用的假设;如果包括0,则不显著,
不支持中介作用的假设。

Bootstrap操作图示
Bootstrap结果输出
(2)基于MEDIATE插件的操作
Hayes等也建议使用MEDIATE插件,该插件提供了简单和并行多重中介分析的语言,只需要将Hayes等编辑的语言复制到语法栏中,进行修改即可。

该方法同样适用于自变量为类别变量的中介分析,包括多个自变量、多个因变量和多个中介变量的多重中介分析,具体操作只需要对语法进行修改就可以。

以下是基本语法:
MEDIATE Y=symptoms/X=emotion thought/M=reaction/C=age
educ/total=1/omnibus=1/ciconf=90/cimethod=2/samples=10000.
软件操作流程:
第一,下载解压缩,然后将后缀名sav改为sps;
第二,在spss中打开语法文件;
第三,选中全部命令点击按钮运行,output里面可以看到如下提示,表明mediate加载成功,注意该操作仅在spss英文版本中可运行。

第四,关闭mediate,并新建新的语法编辑框
第五,输入语法,并根据具体研究输入变量名,程序自动执行(整个操作过程要求spss 数据打开)。

MEDIATE 使用需要说明之处:
第一,中介变量和因变量必须是连续变量,自变量可以是分类变量;
第二,接受不超过15个并行中介变量的分析;
第三,使用分类变量进行分析时,自变量的水平或类别不应超过9个;
第四,模型中如果出现变量缺失则无法运行;
第五,所有变量格式都应是数值型,字符串型变量将导致程序运行出错;
第六,所有的回归系数都是基于最小二乘法计算的非标准化回归系数。

MEDIATE 运行加载。

相关文档
最新文档