SPSS实验6-回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS作业6:回归分析
(一)回归分析
多元线性回归模型的基本操作:
(1)选择菜单Analyze-Regression-Linear;
(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;
(3)在Method框中,选择Enter方法;
在Statistics框中,选择Estimates、Model fit、Covariancematrix、Collinearity diagnostics选项;
在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;
(4)选择菜单Analyze-Non Test-1-Sanple K-S;
选择菜单Analyze-Correlate-Brivariate;
结果如下:
Regression
能源消费需求的多元线性回归分析结果(强制进入策略)(一)
Model Summary b
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .990a.980 .973 8480.38783
a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电
力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元
b. Dependent Variable: 能源消费标准煤总量/万吨
分析:被解释变量和解释变量的复相关系数为0.990,判定系数为0.980,调整的判定系数为0.973,回归方程的估计标准误差为8480.38783。该方程有6个解释变量,调整的判定系数为0.973,,接近于1,所以拟合优度较高,被解释变量可以被模型解释的部分较多,未能解释的部分较少。
分析:由上可知,被解释变量的总离差平方和为5.882E10,回归平方和及均方分别为5.766E10和9.611E9,剩余平方和及均方分别为1.151E9和7.192E7,F检验统计量的观测值为133.636,对应的概率p值近似为0。如果显著性水平a为0.05,由于p值小于a,所以拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。
能源消费需求的多元线性回归分析结果(强制进入策略)(三)
分析:上表各列分别为方程的偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验中t统计量的观测值、对应的概率p值、解释变量的容忍度和方差膨胀因子。
由上可以看出,如果显著性水平a为0.05,几乎所有变量的回归系数显著性t检验的概率p值都大于显著性水平,因此不应拒绝零假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。同时,从容忍度和方差膨胀因子来看,该方程的解释变量的多重共线性严重,该模型中保留了一些不应该保留的变量,因此该模型目前是不可用的,应重新建模,而且在重新建模时,考虑剔除一些不应该保留的变量。
分析:上表中各列数据项的含义依次为:特征根、条件指数、各特征根解释各解释变量的方差比(各列比例之和等于1)。依据该表可以进行多重共线性检测。
从方差比来看,第6个特征根既能解释国内生产总值方差的99%,也可以解释建筑业增加值方差的62%,同时还可以解释人均电力消费方差的43%,因此有理由认为这些变量间存在多重共线性。
从条件指数来看,第4、5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。
多元线性回归模型的其他操作:
(1)选择菜单Analyze-Regression-Linear;
(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;
(3)在Method框中,选择Backward方法;
在Statistics框中,选择Estimates、Model fit、R-squared change、Durbin-Watson选项;
在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;
在Save框中,选择Predicted Values中的Standardized,Residuals中的Standardized选项;结果如下:
c. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元
d. Predictors: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元
e. Predictors: (Constant), 工业增加值/亿元, 建筑业增加值/亿元
f. Dependent Variable: 能源消费标准煤总量/万吨
分析:利用向后筛选策略共经过五步完成回归方程的建立,最终模型为第五个模型。从方程建立的过程来看,随着解释变量的不断减少,方程的拟合优度下降了。依次剔除方程的变量是国内生产总值、人均电力消费、能源加工转换效率、交通运输邮电业增加值。如果显著性水平a为0.05,可以看到这些被剔除变量的偏F检验的概率p值均大于显著性水平,因此均不能拒绝检验的零假设,这些变量的偏回归系数与零无显著差异,它们对被解释变量的线性解释没有显著贡献,不应保留在方程中。最终保留在方程中的变量是工业增加值、建筑业增加值。方程的DW检验值为0.741,残差存在一定程度的正自相关。