SPSS多元回归实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验八报告
一、数据来源
Employee data. sav
二、基本结果
(1)确定自变量、因变量:
)确定自变量、因变量:
一般而言,因变量y与各自变量xj(j=1,2,3,…,n)之间的多元线性回归模型:
之间的多元线性回归模型:
其中:b0是回归常数;b k (k=1,2,3,…,n)是回归参数;e是随机误差。
是随机误差。
根据employee data.sav的数据,其中Y是当前工资salary,X
1是起始资金
salbegin,X2是工作经验prevexp,X3是工作时间jobtime,X4是工作种类jobcat,X5是受教育年限edcau。
(2)做出因变量与自变量的散点图:
)做出因变量与自变量的散点图:
从散点图可以看出因变量与各自变量之间存在线性关系。
(3)检验因变量Y是否服从正态分布的模型假定——因变量Y并没有很好地服从正态分布。
地服从正态分布。
的残差图
(4)线性回归Y的残差图
此标准化残差图表明,此线性回归的标准化残差呈楔形分布而非带状分布,不满足回归模型同方差的假定。
布,不满足回归模型同方差的假定。
当前薪金多元线性回归分析的残差图
图当前薪金多元线性回归分析的残差图
(5)通过以上检验可以看出,当前薪金并不是好的变量,对当前薪金进行Ln变换(取对数)生成新的随进变量logsale,将logsale作为因变量Y用逐步回归的方法进行回归分析:
的方法进行回归分析:
1)p-p图:
图:
较好的服从了正态分布。
发现取对数后,logY较好的服从了正态分布。
2)logY的标准化残差图:
的标准化残差图:
上图表明因变量Y(logsale)的标准化残差近似呈带状分布,满足模型同方差的假定。
差的假定。
3)逐步回归的判定系数:
)逐步回归的判定系数:
通过逐步回归,得到方程的判定系数如下表。
R²越接近1,说明回归方程解释了因变量总变异量的绝大部分比例。
本估计的回归方程有一个好的拟合,
,可以认为拟合度高。
在模型5中达到0.810,且调整后的R²达到0.808,可以认为拟合度高。
表1 Model Summary f
Model R R Square Adjusted R Square Std. Error of the Estimate
1 .841a.707 .706 .21542
2 .867b.752 .751 .19824
3 .890c.791 .790 .18211
4 .896d.802 .800 .17749
5 .900e.810 .808 .17392
a. Predictors: (Constant), 起始薪金
起始薪金
b. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别
c. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别, 教育水平(年)
d. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别, 教育水平(年), 经验(以月计)
e. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别, 教育水平(年), 经验(以月计), 雇佣时间(以月计)f. Dependent Variable: logsale
4)回归方程总体显著性检验:F检验
检验
表2中,对回归方程总体显著性进行了F检验,5个模型的显著性水平P值均为0,可以认为方程总体性显著,建立方程是有意义的。
表2 ANOVA f
Model Sum of Squares df Mean Square F Sig.
1 Regression 52.772 1 52.772 1.137E3 .000a Residual 21.903 472 .046
Total 74.675 473
2 Regression 56.165 2 28.083 714.596 .000b Residual 18.510 471 .039
Total 74.675 473
3 Regression 59.088 3 19.696 593.920 .000c Residual 15.586 470 .033
Total 74.675 473
4 Regression 59.900 4 14.975 475.360 .000d Residual 14.775 469 .032
Total 74.675 473
5 Regression 60.519 5 12.104 400.165 .000e Residual 14.156 468 .030
Total 74.675 473
a. Predictors: (Constant), 起始薪金
起始薪金
b. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别
c. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别, 教育水平(年)
d. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别, 教育水平(年), 经验(以月计)
e. Predictors: (Constant), 起始薪金
起始薪金, 雇佣类别, 教育水平(年), 经验(以月计), 雇佣时间(以月计)f. Dependent Variable: logsale
5)建立回归方程:
)建立回归方程:
所有自变量显著性水平均为0,可以认为每一自变量都可以很好的解释因变量。
由上面分析可知,模型5拟合度最好,因而可以根据模型5的参数估计值建立回归方程:
立回归方程:
表3 Coefficients a
Model Unstandardized
Coefficients Standardized
Coefficients
t Sig.
B Std. Error Beta
1 (Constant) 9.635 .024 408.429 .000 起始薪金 4.244E-5 .000 .841 33.722 .000
2 (Constant) 9.610 .022 439.304 .000 起始薪金 3.006E-5 .000 .595 17.030 .000 雇佣类别.167 .018 .325 9.293 .000
3 (Constant) 9.274 .041 226.396 .000 起始薪金 2.269E-5 .000 .449 12.591 .000 雇佣类别.156 .017 .303 9.425 .000
教育水平(年).035 .004 .256 9.388 .000
4 (Constant) 9.380 .045 208.261 .000
起始薪金 2.419E-5 .000 .479 13.584 .000 雇佣类别.162 .016 .315 10.022 .000
教育水平(年).028 .004 .203 7.091 .000 经验(以月计).000 .000 -.112 -5.077 .000
5 (Constant) 9.101 .076 119.903 .000 起始薪金 2.475E-5 .000 .490 14.146 .000 雇佣类别.160 .016 .312 10.121 .000 教育水平(年).027 .004 .192 6.841 .000 经验(以月计).000 .000 -.116 -5.326 .000 雇佣时间(以月
.004 .001 .091 4.524 .000 计)
a. Dependent Variable: logsale。