SPSS实验6-回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS作业6:回归分析
(一)回归分析
多元线性回归模型的基本操作:
(1)选择菜单Analyze-Regression-Linear;
(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;
(3)在Method框中,选择Enter方法;
在Statistics框中,选择Estimates、Model fit、Covariancematrix、Collinearity diagnostics选项;
在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;
(4)选择菜单Analyze-Non Test-1-Sanple K-S;
选择菜单Analyze-Correlate-Brivariate;
结果如下:
Regression
能源消费需求的多元线性回归分析结果(强制进入策略)(一)
Model Summary b
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .990a.980 .973 8480.38783
a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电
力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元
b. Dependent Variable: 能源消费标准煤总量/万吨
分析:被解释变量和解释变量的复相关系数为0.990,判定系数为0.980,调整的判定系数为0.973,回归方程的估计标准误差为8480.38783。

该方程有6个解释变量,调整的判定系数为0.973,,接近于1,所以拟合优度较高,被解释变量可以被模型解释的部分较多,未能解释的部分较少。

分析:由上可知,被解释变量的总离差平方和为5.882E10,回归平方和及均方分别为5.766E10和9.611E9,剩余平方和及均方分别为1.151E9和7.192E7,F检验统计量的观测值为133.636,对应的概率p值近似为0。

如果显著性水平a为0.05,由于p值小于a,所以拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。

能源消费需求的多元线性回归分析结果(强制进入策略)(三)
分析:上表各列分别为方程的偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验中t统计量的观测值、对应的概率p值、解释变量的容忍度和方差膨胀因子。

由上可以看出,如果显著性水平a为0.05,几乎所有变量的回归系数显著性t检验的概率p值都大于显著性水平,因此不应拒绝零假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。

同时,从容忍度和方差膨胀因子来看,该方程的解释变量的多重共线性严重,该模型中保留了一些不应该保留的变量,因此该模型目前是不可用的,应重新建模,而且在重新建模时,考虑剔除一些不应该保留的变量。

分析:上表中各列数据项的含义依次为:特征根、条件指数、各特征根解释各解释变量的方差比(各列比例之和等于1)。

依据该表可以进行多重共线性检测。

从方差比来看,第6个特征根既能解释国内生产总值方差的99%,也可以解释建筑业增加值方差的62%,同时还可以解释人均电力消费方差的43%,因此有理由认为这些变量间存在多重共线性。

从条件指数来看,第4、5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。

多元线性回归模型的其他操作:
(1)选择菜单Analyze-Regression-Linear;
(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;
(3)在Method框中,选择Backward方法;
在Statistics框中,选择Estimates、Model fit、R-squared change、Durbin-Watson选项;
在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;
在Save框中,选择Predicted Values中的Standardized,Residuals中的Standardized选项;结果如下:
c. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元
d. Predictors: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元
e. Predictors: (Constant), 工业增加值/亿元, 建筑业增加值/亿元
f. Dependent Variable: 能源消费标准煤总量/万吨
分析:利用向后筛选策略共经过五步完成回归方程的建立,最终模型为第五个模型。

从方程建立的过程来看,随着解释变量的不断减少,方程的拟合优度下降了。

依次剔除方程的变量是国内生产总值、人均电力消费、能源加工转换效率、交通运输邮电业增加值。

如果显著性水平a为0.05,可以看到这些被剔除变量的偏F检验的概率p值均大于显著性水平,因此均不能拒绝检验的零假设,这些变量的偏回归系数与零无显著差异,它们对被解释变量的线性解释没有显著贡献,不应保留在方程中。

最终保留在方程中的变量是工业增加值、建筑业增加值。

方程的DW检验值为0.741,残差存在一定程度的正自相关。

分析:表中的第五个模型是最终的方程。

如果显著性水平a为0.05,由于回归方程显著性检验的概率p值小于显著性水平,因此被解释变量与解释变量的线性关系显著,建立线性模型是恰当的。

分析:表中展示了每个模型中各解释变量的偏回归系数、偏回归系数显著性检验的情况。

如果显著性水平a为0.05,则前四个模型中由于都存在回归系数不显著的解释变量,因此这些方程都不可用。

第五个模型是最终的方程,其回归系数显著性检验的概率p值小于显著性水平,因此工业增加值、建筑业增加值与被解释变量间的线性关系显著,它们保留在模型中是合理的。

最终的回归方程是,能源消费需求=80452.139+0.464工业增加值+0.696建筑业增加值,意味着当工业增加值每增加一个单位或建筑业增加值每增加一个单位,能源消费需求分别平均增加0.464个单位或0.696个单位。

能源消费需求的多元线性回归分析结果(向后筛选策略)(四)
分析:上表展示了变量剔除方程的过程。

各数据项的含义依次是:在剔除其他变量的情况下,如果该变量保留在模型中其标准化回归系数、t检验值和概率p值。

在模型3中,剔除国内生产总值的情况下,如果保留人均电力消费,那么它的标准化回归系数为0.269,但回归系数的检验不显著(概率p值为0.520)。

剔除人均电力消费的情况下,如果保留国内生产总值,那么它的标准化回归系数为0.217,但回归系数的检验不显著(概率p值为0.777)。

Charts
能源消费需求多元线性回归分析的残差累计概率图
分析:上图中,数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果(见下表)表明标准化残差与标准正态分布不存在显著差异,可以认为残差满足了线性模型的前提要求。

标准化残差的非参数检验结果
One-Sample Kolmogorov-Smirnov Test
Standardized
Residual
N 23
Normal Parameters a Mean .0000000
Std. Deviation .95346259
Most Extreme Differences Absolute .162
Positive .108
Negative -.162
Kolmogorov-Smirnov Z .776
Asymp. Sig. (2-tailed) .584
a. Test distribution is Normal.
分析:在上面残差累计概率图种,随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性并不完全满足,方差似乎有增大的趋势。

而计算残差与预测值的Spearman等级相关系数为-0.027(见下表Spearman等级相关分析结果),且检验不显著,因此认为异方差现象并不明显。

能源消费需求多元线性回归分析的残差图
标准化残差与标准化预测值的Spearman等级相关分析结果
Correlations
Standardized Predicted Value Standardized Residual
Spearman's rho Standardized Predicted
Value Correlation Coefficient 1.000 -.027 Sig. (2-tailed) . .904 N 23 23
Standardized Residual Correlation Coefficient -.027 1.000
Sig. (2-tailed) .904 .
N 23 23 原始数据:能源消费数据分析
年份X1 能源消费
标准煤总
量X2/万

国内生产
总值X3/亿

工业增加
值X4/亿元
建筑业增
加值X5/
亿元
交通运输
邮电业增
加值X6/
亿元
人均电力
消费X7/
千瓦时
能源加工
转换效率
X8/%
1985 76682 9016 3448.7 417.9 406.9 21.3 68.29 1986 80850 10275.2 3967 525.7 475.6 23.2 68.32 1987 86632 12058.6 4585.8 665.8 544.9 26.4 67.48 1988 92997 15042.8 5777.2 810 661 31.2 66.54
1989 96934 16092.3 6484 794 786 35.3 66.51 1990 98703 18667.8 6858 859.4 1147.5 42.4 67.2 1991 103783 21781.5 8087.1 1015.1 1409.7 46.9 65.9 1992 109170 26923.5 10284.5 1415 1681.8 54.6 66 1993 115993 35333.9 14188 2266.5 2205.6 61.2 67.32 1994 122737 48197.9 19480.7 2964.7 2898.3 72.7 65.2 1995 131176 60793.7 24950.6 3728.8 3424.1 83.5 71.05 1996 138948 71176.6 29447.6 4387.4 4068.5 93.1 71.5 1997 137798 78973 32921.4 4621.6 4593 101.8 69.23 1998 132214 84402.3 34018.4 4985.8 5278.4 106.6 69.44 1999 133831 89677.1 35861.5 5172.1 5821.8 118.2 69.19 2000 138553 99214.6 4003.6 5522.3 7333.4 132.4 69.04 2001 143199 109655.2 43580.6 5931.7 8406.1 144.6 69.03 2002 151797 120332.7 47431.3 6465.5 93930.4 156.3 69.04 2003 174990 135822.8 54945.5 7490.8 10098.4 173.7 69.4 2004 203227 159878.3 65210 8694.3 12147.6 190.2 70.71 2005 223319 183084.8 76912.9 10133.8 10526.1 216.7 71.08 2006 246270 211923.5 91310.9 11851.1 12481.1 249.4 71.24 2007 265583 249529.9 107367.2 14014.1 14604.1 274.9 71.25。

相关文档
最新文档