SPSS多元线性回归

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何用SPSS进行多元线性回归

1、导入数据

首先打开SPSS软件,选中打开其他文件,然后把查找范围定位到数据所在位置(我这里是在桌面),然后在文件类型上选择你的文件类型(我这里是Excel),然后选中数据文件,点击打开。

在弹出的对话框中点击确定

2、进行描述性统计

首先点击菜单栏中的分析-描述统计-描述

出现如下页面,选中想要进行描述性统计的变量到右边变量框中。

如图所示,点击选项,选择需要SPSS汇报的描述性统计:

结果如图,这里只选择平均值、标准偏差、最小值和最大值:

得出描述性统计如图:

注意:结果是可以复制粘贴到Excel里面的。

3、相关性分析

首先点击菜单栏中的分析-相关-双变量

同样按照描述性统计的操作,把想要进行分析的变量选中,选择Pearson相关系数,并进行双尾检验(一般性操作),点击确定即可。

得出如下结果:

一般来讲,相关系数大于0.6就说明可能会存在多重共线性问题,而且相关系数比较显著(右上角有两个星号,说明结果在0.01的水平上显著),结论:GYZCZ和SCALE可能存在多重共线性。

4、回归以及回归诊断

首先点击分析-回归-线性

因变量和自变量选择好,如图所示:

点击右上角的Statistics,出现如下菜单,选择共线性诊断和Durbin-Watson检验(检验序列相关性),然后点击继续。

点击右上角的绘图,出现如下界面,按照图示进行选择,这一步是为了进行异方差的初步验证,然后点击继续。

以上全部设定好了之后,点击确定即可。

主要结果分析:

可决系数R方值为0.432,调整后的R方是0.414,说明模型拟合程度还不错(一般大于0.3都还能接受)。

D.W.值为0.828,说明存在正的序列相关性(如果是横截面数据,则不需要考虑,如果是时间序列数据就需要考虑用差分法、广义最小二乘、可行的广义最小二乘等方法)

F值通过检验(显著性为0.000),说明模型的整体线性性满足。

共线性诊断:看方差膨胀因子(VIF),GYZCZ与SCALE的VIF值大于10,说明存在多重共线性,需要剔除这两个变量。

系数显著性:LAND的系数为-0.006,显著性为0.8,说明这个系数有80%的概率是错的,所以应该为0。FE系数为-1.325,显著性为0.000,说明这个系数有0%的概率是0,所以可以认为这个系数是正确的。

共线性诊断:利用条件数来判断是否存在多重共线性的标准:如果条件数小于30,表明不存在共线性,在30到100之间表明存在一定程度的多重共线性,但不会对模型的回归与解释产生影响,如果高于100则表明存在严重的多重共线

可以看出,模型存在严重的多重共线性,解决办法:剔除GYZCZ与SCALE 变量再做回归。结果如下:

发现剔除掉变量后,共线性问题就不明显了,模型可以用。

异方差检验:由残差直方图可以看出,残差近似于正太分布,说明没有异方

从正太概率图看,与直线拟合的较好,再次说明不存在异方差性。

从残差散布图看,不存在递增或递减的趋势,可以认为该模型不存在异方差性。所以模型为:

CU=0.919-0.006 OFDI-0.022 LAND-1.471 FE+0.230 SOE+0.607 EXT-4.392

INNO-0.245 INV

5、异方差处理-加权最小二乘

首先确定权重,点击-分析-回归-线性,在回归之前,选择保存,在弹出的菜单中选择残差-未标准化,得出残差,如图所示:

在回归之后,可以看到数据面板上有残差数据,如图所示:

点击-分析-回归-权重估计

自变量与因变量选择与最小二乘法估计的模型相同,将残差项作为权重变量,点击确定即可。结果如下:

可以看出,残差的平方项作为权重最合适,模型的结果如下:

可以发现,模型的显著性整体提高了(但R方太高,而且F值特别大,可能出现过度拟合的现象,这是因为我们的模型本身不存在异方差问题,这里仅仅是作为教程参考用)。

6、自相关处理

一、差分法(仅适用于时间序列数据)

点击转换-创建时间序列,如图所示:

此处建立的是一阶差分,然后得出一阶差分后的变量,可以在数据面板中找到,如下图所示:

然后利用一阶差分的变量进行多元线性回归,结果如下:

首先看R方值,在0.3左右,可以接受。再看DW值为2.4,一般认为DW值在1.8~2.2范围内是不存在自相关的。因此,可以考虑两阶差分,两阶差分的结果如下:

两阶差分的结果显示存在负相关性,因此我们选择一阶差分的结果,模型结

果如下:

F值显著,说明模型线性性显著。

系数显著性整体变好,VIF整体偏小。

条件指数小于10,说明差分后的模型不存在多重共线性问题

同时可以看出模型不存在异方差。

二、GLS、FGLS法(仅适用于时间序列数据)

其他软件如Eviews、Stata可以用简单的命令完成广义最小二乘估计。

三、更改模型设定

自相关问题还有可能是模型设定的问题,因此可以考虑加因变量的滞后项、自变量平方、交叉项等办法。

7、逐步回归法

方法与多元线性回归分析方法的处理方式一样,只不过在做回归时,中间有个方法选择,选择逐步即可,如图所示:

模型结果:略

相关文档
最新文档