运用SPSS建立多元线性回归模型并进行检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学实验报告
一.实验目的:
1、学习和掌握用SPSS做变量间的相关系数矩阵;
2、掌握运用SPSS做多元线性回归的估计;
3、用残差分析检验是否存在异常值和强影响值
4、看懂SPSS估计的多元线性回归方程结果;
5、掌握逐步回归操作;
6、掌握如何估计标准化回归方程
7、根据输出结果书写方程、进行模型检验、解释系数意义和预测;
二.实验步骤:
1、根据所研究的问题提出因变量和自变量,搜集数据。
2、绘制散点图和样本相关阵,观察自变量和因变量间的大致关系。
3、如果为线性关系,则建立多元线性回归方程并估计方程。
4、运用残差分析检验是否存在异常值点和强影响值点。
5、通过t检验进行逐步回归。
6、根据spss输出结果写出方程,对方程进行检验(拟合优度检验、F检验和t
检验)。
7、输出标准化回归结果,写出标准化回归方程。
8、如果通过检验,解释方程并应用(预测)。
三.实验要求:
研究货运总量y与工业总产值x1,农业总产值x2,居民非商品支出x3,之间的关系。详细数据见表:
(1)计算出y,x1,x2,x3的相关系数矩阵。
(2)求y关于x1,x2,x3的三元线性回归方程
(3)做残差分析看是否存在异常值。
(4)对所求方程拟合优度检验。
(5)对回归方程进行显著性检验。
(6)对每一个回归系数做显著性检验。
(7)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,在做方程的显著性检验和回归系数的显著性检验。
(8)求标准化回归方程。
(9)求当x1=75,x2=42,x3=3.1时y。并给出置性水平为99%的近似预测区间。(10)结合回归方程对问题进行一些基本分析。
四.绘制散点图或样本相关阵
相关性
货运总量
工业总产值
农业总产值 居民非商品支出
货运总量
Pearson 相关性
1
.556 .731*
.724*
显著性(双侧)
.095
.016 .018 N
10 10 10 10 工业总产值
Pearson 相关性
.556 1
.155 .444 显著性(双侧) .095 .650
.171 N
10 11 11 11 农业总产值
Pearson 相关性
.731*
.155 1
.562 显著性(双侧) .016 .650 .072
N
10 11 11 11 居民非商品支出 Pearson 相关性
.724* .444 .562 1
显著性(双侧)
.018 .171 .072 N
10
11
11
11
*. 在 0.05 水平(双侧)上显著相关。
五.建立并估计多元线性回归模型:
0112233Y X X X ββββ=+++
六.残差分析找异常值
由上表分析得,残差分析找异常值后其Cook距离不能大于1,Student化已删除的残差的绝对值不能大于3,综上所述删除第六组观测值继续进行如上操作,再未发现异常值。
七.删除异常值继续回归:
模型汇总
模型R R 方调整 R 方标准估计的误
差
1 .975a.950 .920 12.94188
a. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产
值。
Anova a
模型
平方和 df
均方 F Sig. 1
回归
15968.094 3 5322.698 31.779
.001b
残差 837.462 5 167.492
总计
16805.556
8
a. 因变量: 货运总量
b. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产值。
则回归方程为:123659.510 4.07016.04314.359Y X X X ∧
=-++-
由上述分析知居民的非商品支出的参数估计量3β∧
所对应P 值为0.176大于
α=0.05,所以货运总量与居民非商品支出无显著性差异,即剔除变量:居民的非商品支出,继续做回归。
此时的回归方程为:
12508.501 3.53412.333Y X X ∧
=-++
八.统计检验:
(1)拟合优度检验:
由估计结果图表可知,可决系数2R =0.962,修正的可决系数2R =0.925。 计算结果表明,估计的样本回归方程较好的拟合了样本观测值。 (2)F 检验
提出检验的原假设为0H :i β=0
对立假设为1H :i β至少有一个 不等于零(i=0,1,2)
对于给定的显著性水平α=0.05,P=0.000<α=0.05,所以否定原假设,总体回归方程是显著的。 (3)t 检验
提出的原假设为0H :i β=0 i=0,1,2
由表得,t 统计量为0β所对应的P 值为0.002
1β所对应的P 值为0.021
2β所对应的P 值为0.000
对于给定的显著性水平a=0.05,
因为0β1β 2β所对应的P 值均小于α=0.05,所以货运总量与工业总产值和农业总产值之
间有显著性关系,
(4)预测
假设X1=75,X2=42试预测货运总量并构造其99%的置信区间 将X1=75,X2=42代入估计的回归方程
508.501 3.5347512.33342274.535Y ∧
=-+⨯+⨯= 经计算得Y 的置信区间为(237.71840,312.28406.) (5)相关分析
当维持农业总产值不变的情况下,每增加一单位的工业总产值,货运总量相应的增加3,534亿吨;当维持工业总产值不变的情况下,每增加一单位的农业总产值,货运总量相应的增加12.333亿吨;综上得出农业总产值引起货运总量的变化相比于工业总产值较大。
(范文素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)