回归分析SPSS习题复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
回归分析习题
1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内(通常为一年)的营业额与经营面积的比值。对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均值数据。(数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标的数据,利用该数据完成下列工作
(1)研究变量间的相关程度。(其余6个变量与“单位面积年营业额”间的相关程度,其余6个变量之间的相关程度);
(2)由(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程;
(3)采用逐步回归方法建立“单位面积年营业额”的预测公式。
表20个商业中心有关指标的数据
2.我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。
1.解:(1)变量间的相关性分析
利用SPSS软件构造所有变量的散点图矩阵和相关矩阵,结果见图1和表1
从散点图矩阵直观可以看出Y “单位面积年营业额”与x2“日人流量(万人) ”和x3“居民年消费额(万元) ”线性关系较密切。
x2“日人流量 (万人) ”与x6 “对商场商品丰富程度满意度” 线性关系较密切
从表1得)3,(x y ρ=0.795**,)2,(x y ρ=0.790**,)6,(x y ρ=.0 .697**,
说明 Y “单位面积年营业额”与x3“居民年消费额(万元) ”,x2“日人流量 (万人) ”,x6 “对商场商品丰富程度满意度”及x5 “对商场设施满意度”在0 .01 水平(双侧)上显著相关线性关。可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公式。
图1散点图矩阵
单位面积 年营业额 (万元/m2) 每小时机 动车流量 (万辆) 日人流量 (万人) 居民年 消费额 (万元) 对商场 环境 满意度 对商场 设施 满意度 对商场商
品丰富程 度满意度
单位面积 年营业额 (万元/m2)
Pearson 相关性
1 .413 .790** .795** .341 .450* .697** 显著性(双侧) .071 .000 .000 .141 .046 .001 N
20
20 20 20 20
20
20 每小时机动车
流量(万辆) Pearson 相关性
.413 1 .751** -.129 .664** .424 .774** 显著性(双侧) .071 .000 .588 .001 .062 .000 N
20
20 20 20 20
20
20 日人流量
(万人) Pearson 相关性
.790** .751**
1
.273
.594** .279
.983**
(2)建立Y “单位面积年营业额”与“居民年消费额”的一元线性回归方程 设 ⎩⎨
⎧++=)
,0(~2
310σεεββN x y 利用SPSS 软件的线性回归分析的模块进行分析,结果见表2~表6和图2~图3
由最小二乘估计得到一元线性回归方程(见表4)
Y (单位面积年营业额)=0.928+0.877x3(居民年消费额)
由回归方程的显著性检验的p 值Sig.= .000,知回归方程在α=0.01的水平上通过检验,
即Y 与x3的线性关系是显著的(见表3方差分析表)
由常量β0的t 检验的p 值Sig.=0.005<0.01知回归方程的常数项不为零。拟合有常数 项的回归方程是合适的 (见表4 系数表)
由方程的拟合优度(可决系数)R 2=0.631,知方程的拟合优度(可决系数)还不够高,即方程有改进的余地,还可以引入有关的变量 。(见表1)
对残差作Shapiro-Wilk 正态性检验,p 值Sig.=0.538>0.05(见表5)知随机误差项ε
i
服
从正态分布的假定满足。
作回归标准化残差的标准P-P 图(见图2),进一步验证了随机误差项
ε
i
服从正态分布的
假定满足
对残差序列作D-W 检验,检验统计量Durbin-Watson=2.125知εεεn ,,,21Λ之间存在 一定的负自相关:εεεn ,,,21Λ相互独立的假定不一定满足(见表2)
以标准化的残差e t 为纵坐标,而以标准化的预测值y i ∧
为横坐标做残差的散点图(见图3)。图中显示散点随机地分布在–2到+2的带子里,可以认为线性回归模型的等方差假定成立 。
结论:
(1)一元线性回归方程
Y (单位面积年营业额)=0.928+0.877x3(居民年消费额)
在α=0.01的水平上通过检验,拟合优度为0.631,方程有改进的余地,还可以引入有关的变量 。
(2)误差项正态分布的假设和和误差项的等方差假设均成立,但误差项的独立性假设不满足。
表3 方差分析表
Anova b
模型 平方和
df
均方 F Sig. 1
回归 8.125 1 8.125 30.824
.000a
残差 4.745 18 .264
总计
12.870
19
a. 预测变量: (常量), 居民年消费额(万元)。
b. 因变量: 单位面积年营业额(万元/m2)
表4
系数a
模型 非标准化系数
标准系数 t Sig.
B 标准 误差
试用版
1
(常量)
.928
.288
3.220
.005