SPSS实验6-回归分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS作业6:回归分析

(一)回归分析

多元线性回归模型的基本操作:

(1)选择菜单Analyze-Regression-Linear;

(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;

(3)在Method框中,选择Enter方法;

在Statistics框中,选择Estimates、Model fit、Covariancematrix、Collinearity diagnostics选项;

在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;

(4)选择菜单Analyze-Non Test-1-Sanple K-S;

选择菜单Analyze-Correlate-Brivariate;

结果如下:

Regression

能源消费需求的多元线性回归分析结果(强制进入策略)(一)

Model Summary b

Model R R Square Adjusted R Square Std. Error of the Estimate

1 .990a.980 .973 8480.38783

a. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 人均电

力消费/千瓦时, 建筑业增加值/亿元, 国内生产总值/亿元

b. Dependent Variable: 能源消费标准煤总量/万吨

分析:被解释变量和解释变量的复相关系数为0.990,判定系数为0.980,调整的判定系数为0.973,回归方程的估计标准误差为8480.38783。该方程有6个解释变量,调整的判定系数为0.973,,接近于1,所以拟合优度较高,被解释变量可以被模型解释的部分较多,未能解释的部分较少。

分析:由上可知,被解释变量的总离差平方和为5.882E10,回归平方和及均方分别为5.766E10和9.611E9,剩余平方和及均方分别为1.151E9和7.192E7,F检验统计量的观测值为133.636,对应的概率p值近似为0。如果显著性水平a为0.05,由于p值小于a,所以拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。

能源消费需求的多元线性回归分析结果(强制进入策略)(三)

分析:上表各列分别为方程的偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验中t统计量的观测值、对应的概率p值、解释变量的容忍度和方差膨胀因子。

由上可以看出,如果显著性水平a为0.05,几乎所有变量的回归系数显著性t检验的概率p值都大于显著性水平,因此不应拒绝零假设,认为这些偏回归系数与0无显著差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。同时,从容忍度和方差膨胀因子来看,该方程的解释变量的多重共线性严重,该模型中保留了一些不应该保留的变量,因此该模型目前是不可用的,应重新建模,而且在重新建模时,考虑剔除一些不应该保留的变量。

分析:上表中各列数据项的含义依次为:特征根、条件指数、各特征根解释各解释变量的方差比(各列比例之和等于1)。依据该表可以进行多重共线性检测。

从方差比来看,第6个特征根既能解释国内生产总值方差的99%,也可以解释建筑业增加值方差的62%,同时还可以解释人均电力消费方差的43%,因此有理由认为这些变量间存在多重共线性。

从条件指数来看,第4、5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。

多元线性回归模型的其他操作:

(1)选择菜单Analyze-Regression-Linear;

(2)选择被解释变量(能源消费标准煤总量)和解释变量(国内生产总值、工业增加值、建筑业增加值、交通运输邮电业增加值、人均电力消费、能源加工转换效率)到对应框中;

(3)在Method框中,选择Backward方法;

在Statistics框中,选择Estimates、Model fit、R-squared change、Durbin-Watson选项;

在Plots框中,选择ZRESED到Y框,ZPRED到X框,再选择Histogram和Normal plot;

在Save框中,选择Predicted Values中的Standardized,Residuals中的Standardized选项;结果如下:

c. Predictors: (Constant), 能源加工转换效率/%, 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元

d. Predictors: (Constant), 交通运输邮电业增加值/亿元, 工业增加值/亿元, 建筑业增加值/亿元

e. Predictors: (Constant), 工业增加值/亿元, 建筑业增加值/亿元

f. Dependent Variable: 能源消费标准煤总量/万吨

分析:利用向后筛选策略共经过五步完成回归方程的建立,最终模型为第五个模型。从方程建立的过程来看,随着解释变量的不断减少,方程的拟合优度下降了。依次剔除方程的变量是国内生产总值、人均电力消费、能源加工转换效率、交通运输邮电业增加值。如果显著性水平a为0.05,可以看到这些被剔除变量的偏F检验的概率p值均大于显著性水平,因此均不能拒绝检验的零假设,这些变量的偏回归系数与零无显著差异,它们对被解释变量的线性解释没有显著贡献,不应保留在方程中。最终保留在方程中的变量是工业增加值、建筑业增加值。方程的DW检验值为0.741,残差存在一定程度的正自相关。

相关文档
最新文档