基于SPSS多元线性回归分析的案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
农民收入影响因素的多元回归分析
自改革开放以来,虽然中国经济平均增长速度为9.5 % ,但二元经济结构给经济发展带来的问题仍然很突出。农村人口占了中国总人口的70 %多,农业产业结构不合理,经济不发达,以及农民收入增长缓慢等问题势必成为我国经济持续稳定增长的障碍。正确有效地解决好“三农”问题是中国经济走出困境,实现长期稳定增长的关键。其中,农民收入增长是核心,也是解决“三农”问题的关键。本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,寻找其根源,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。
一、回归模型的建立
(1) 数据的收集
根据实际的调查分析,我们在影响农民收入因素中引入3个解释变量。即: X财政用于农业的支出的比重, X-乡村从业人员占农村人口的比重, X -2-34 农作物播种面积
y X2 X3 X4
乡村从业人员78年可比财政用于农业农作物播年份占农村人口的价的支出
的比重种面积比重
1989 196.76 9.42 49.23 146553.9
1990 220.53 9.98 49.93 148362.3
1991 223.25 10.26 50.92 149585.8
1992 233.19 10.05 51.53 149007.1
1993 265.67 9.49 51.86 147740.7
1994 335.16 9.2 52.12 148240.6
1995 411.29 8.43 52.41 149879.3
1996 460.68 8.82 53.23 152380.6
1997 477.96 8.3 54.93 153969.2
1998 474.02 10.69 55.84 155705.7
1999 466.8 8.23 57.16 156372.8
2000 466.16 7.75 59.33 156299.9
2001 469.8 7.71 60.62 155707.9
2002 468.95 7.17 62.02 154635.5
2003 476.24 7.12 63.72 152415
2004 499.39 9.67 65.64 153552.6
2005 521.2 7.22 67.59 155487.7
(1) 回归模型的构建
Y=ββX+βX+βX+u i1+223344i
二、回归模型的分析
(1) 多重共线性检验
a系数
非标准化系数标准系数共线性统计量模型 B 标准误差试用版 t Sig. 容差 VIF
1 (常量) -2983.479 803.141 -3.715 .003
X2 -14.221 15.007 -.141 -.948 .361 .579 1.726
X3 5.201 3.760 .258 1.383 .190 .368 2.717
X4 .021 .006 .614 3.677 .003 .459 2.177 a. 因变量: y 表1
多重共线性是指解释变量之间存在相关关系,判断解释变量之间的多重共线性一般可看方差膨胀因子VIF和容忍度这两个指标,如果解释变量之间存在多重共线性,一般采用逐步剔除VIF最大的解释变量来消除解释变量之间多重共线性的问
题。从表1可知,解释变量,X1,X2,X3三者的方差膨胀因子VIF分别为
1.726,
2.717和2.177,均小于10。且三者的容忍度均大于0.1。所以可以判断解释变量X1,X2,X3三者之间不存在多重共线性。
(2)模型异方差的检验
异方差产生的原因有:数据质量原因、模型设定原因。由异方差引起的后果一般会导致回归系数估计结果误差较大、有关统计检验失去意义、模型的预测失效等危害,所以在建立模型的过程中必须要检验模型之间是否存在异方差。若存在异方差解决办法——加权最小二乘法。
从上表散点图判断模型的解释变量之间是否存在异方差,但从上表可以看
到散点图之间的特征不是特别明显。不易于做出结论,故采用|e|与X的等级相关系数进行判定。
表2
从表2可知,在95%的置信水平下,检验统计量与为标准化残差的绝对值(|e|)之间的显著性水平P值均大于0.05,则接受原假设,检验统计量与|e|之间是独立的,不存在相关关系。说明模型不存在异方差。
(3)模型序列相关的检验
序列相关是指各随机误差项之间不独立,则称其存在自相关或序列相关性。自相关产生的原因有:经济变量的惯性、省略解释变量的影响、错误的函数形式的影响、滞后效应、其他原因等。如果随机误差之间存在自相关,则可能导致OLS估计值不具有最小方差性; 很可能高估R2;t-检验与F-检验结果都变得无效;等影响。所以必须检验所构造模型是否存在自相关性。
a系数
非标准化系数标准系数
模型 B 标准误差试用版 t Sig.
1 (常量) -.355 7.59
2 -.047 .963
REST1 1.226 .251 1.252 4.889 .068
REST2 -.676 .252 -.686 -2.680 .073
a. 因变量: RES
在上表中REST1为e(t-1),REST2为e(t-2),用e(t)与e(t-1),和e(t-2)进行回归分析,得到上表。显著性水平均P均为接受原假设,既回归方程的各部分系数均为0,既认定模型不存在序列关。
三、回归模型的确定及解释
a系数
非标准化系数标准系数共线性统计量模型 B 标准误差试用版 t Sig. 容差 VIF
1 (常量) -2983.479 803.141 -3.715 .003
X2 14.221 15.007 -.141 -.948 .361 .579 1.726
X3 5.201 3.760 .258 1.383 .190 .368 2.717
X4 .021 .006 .614 3.677 .003 .459 2.177 a. 因变量: y
由上表可以确立,线性模型的方程为。
Y=-2983.47+14.221X+5.201X+0.021X 234
从构建的模型可以知道,农民的收入水平与X财政用于农业的支出2-
的比重成正相关的关系,财政每增加一元用于农业,农民的收入增加14,。
221元。 X-乡村从业人员占农村人口的比重增加1%,农民收入增加5.201%,3
农民的收入与虽与作物的播种面积成正比比例关系,但是作用较少。