运用SPSS建立多元线性回归模型并进行检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学实验报告

一.实验目的:

1、学习和掌握用SPSS做变量间的相关系数矩阵;

2、掌握运用SPSS做多元线性回归的估计;

3、用残差分析检验是否存在异常值和强影响值

4、看懂SPSS估计的多元线性回归方程结果;

5、掌握逐步回归操作;

6、掌握如何估计标准化回归方程

7、根据输出结果书写方程、进行模型检验、解释系数意义和预测;

二.实验步骤:

1、根据所研究的问题提出因变量和自变量,搜集数据。

2、绘制散点图和样本相关阵,观察自变量和因变量间的大致关系。

3、如果为线性关系,则建立多元线性回归方程并估计方程。

4、运用残差分析检验是否存在异常值点和强影响值点。

5、通过t检验进行逐步回归。

6、根据spss输出结果写出方程,对方程进行检验(拟合优度检验、F检验和t

检验)。

7、输出标准化回归结果,写出标准化回归方程。

8、如果通过检验,解释方程并应用(预测)。

三.实验要求:

研究货运总量y与工业总产值x1,农业总产值x2,居民非商品支出x3,之间的关系。详细数据见表:

(1)计算出y,x1,x2,x3的相关系数矩阵。

(2)求y关于x1,x2,x3的三元线性回归方程

(3)做残差分析看是否存在异常值。

(4)对所求方程拟合优度检验。

(5)对回归方程进行显著性检验。

(6)对每一个回归系数做显著性检验。

(7)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,在做方程的显著性检验和回归系数的显著性检验。

(8)求标准化回归方程。

(9)求当x1=75,x2=42,x3=3.1时y。并给出置性水平为99%的近似预测区间。(10)结合回归方程对问题进行一些基本分析。

四.绘制散点图或样本相关阵

相关性

货运总量

工业总产值

农业总产值 居民非商品支出

货运总量

Pearson 相关性

1

.556 .731*

.724*

显著性(双侧)

.095

.016 .018 N

10 10 10 10 工业总产值

Pearson 相关性

.556 1

.155 .444 显著性(双侧) .095 .650

.171 N

10 11 11 11 农业总产值

Pearson 相关性

.731*

.155 1

.562 显著性(双侧) .016 .650 .072

N

10 11 11 11 居民非商品支出 Pearson 相关性

.724* .444 .562 1

显著性(双侧)

.018 .171 .072 N

10

11

11

11

*. 在 0.05 水平(双侧)上显著相关。

五.建立并估计多元线性回归模型:

0112233Y X X X ββββ=+++

六.残差分析找异常值

由上表分析得,残差分析找异常值后其Cook距离不能大于1,Student化已删除的残差的绝对值不能大于3,综上所述删除第六组观测值继续进行如上操作,再未发现异常值。

七.删除异常值继续回归:

模型汇总

模型R R 方调整 R 方标准估计的误

1 .975a.950 .920 12.94188

a. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产

值。

Anova a

模型

平方和 df

均方 F Sig. 1

回归

15968.094 3 5322.698 31.779

.001b

残差 837.462 5 167.492

总计

16805.556

8

a. 因变量: 货运总量

b. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产值。

则回归方程为:123659.510 4.07016.04314.359Y X X X ∧

=-++-

由上述分析知居民的非商品支出的参数估计量3β∧

所对应P 值为0.176大于

α=0.05,所以货运总量与居民非商品支出无显著性差异,即剔除变量:居民的非商品支出,继续做回归。

此时的回归方程为:

12508.501 3.53412.333Y X X ∧

=-++

八.统计检验:

(1)拟合优度检验:

由估计结果图表可知,可决系数2R =0.962,修正的可决系数2R =0.925。 计算结果表明,估计的样本回归方程较好的拟合了样本观测值。 (2)F 检验

提出检验的原假设为0H :i β=0

对立假设为1H :i β至少有一个 不等于零(i=0,1,2)

对于给定的显著性水平α=0.05,P=0.000<α=0.05,所以否定原假设,总体回归方程是显著的。 (3)t 检验

提出的原假设为0H :i β=0 i=0,1,2

由表得,t 统计量为0β所对应的P 值为0.002

1β所对应的P 值为0.021

2β所对应的P 值为0.000

对于给定的显著性水平a=0.05,

因为0β1β 2β所对应的P 值均小于α=0.05,所以货运总量与工业总产值和农业总产值之

间有显著性关系,

(4)预测

假设X1=75,X2=42试预测货运总量并构造其99%的置信区间 将X1=75,X2=42代入估计的回归方程

508.501 3.5347512.33342274.535Y ∧

=-+⨯+⨯= 经计算得Y 的置信区间为(237.71840,312.28406.) (5)相关分析

当维持农业总产值不变的情况下,每增加一单位的工业总产值,货运总量相应的增加3,534亿吨;当维持工业总产值不变的情况下,每增加一单位的农业总产值,货运总量相应的增加12.333亿吨;综上得出农业总产值引起货运总量的变化相比于工业总产值较大。

(范文素材和资料部分来自网络,供参考。可复制、编制,期待你的好评与关注)

相关文档
最新文档