(整理)基于SPSS的多元统计分析三种算法的实例研究.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于SPSS的多元统计分析三种算法的实例研究
摘要
本文主要应用多元统计中的多元回归分析模型、因子分析模型、判别分析模型解决三个有关经济方面的问题,从而能更深的理解多元统计分析这门课程,并熟悉SPSS软件的一些基本操作。
关键词:多元回归分析,因子分析,判别分析,SPSS
第一章 多元线性回归分析
1.1 研究背景
消费是宏观经济必不可少的环节,完善的消费模型可以为宏观调控提供重要的依据。根据不同的理论可以建立不同的消费函数模型,而国内的许多学者研究的主要是消费支出与收入的单变量之间的函数关系,由于忽略了对消费支出有显著影响的变量,其所建立的方程必与实际有较大的偏离。本文综合考察影响消费的主要因素,如收入水平、价格、恩格尔系数、居住面积等,采用进入逐步、向前、向后、删除、岭回归方法,对消费支出的多元线性回归模型进行研究,找出能较准确描述客观实际结果的最优模型。
1.2 问题提出与描述、数据收集
按照经济学理论,决定居民消费支出变动的因素主要有收入水平、居民消费意愿、消费环境等。为了符合我国经济发展的不平衡性的现状,本文主要研究农村居民的消费支出模型。文中取因变量Y 为农村居民年人均生活消费支出(单位:元),自变量为农村居民人均纯收入X 1(单位:元)、商品零售价格定基指数X 2(1978年的为100)、消费价格定基指数X 3(1978年的为100)、家庭恩格尔系数X 4(%)、人均住宅建筑面积X 5(单位:m 2)。本文取1900年至2009年的数据(数据来源:中华人民共和国国家统计局网公布的1996至2010年中国统计年鉴)列于附录的表一中。
1.3 模型建立 1.3.1 理论背景
多元线性回归模型如下:
εββββ+++++=p p X X X Y ......
22110 Y 表示因变量,X i (i=1,…,p )表示自变量,ε表示随机误差项。 对于n 组观测值,其方程组形式为
εβ+=X Y 即
模型假设: ⑴零均值假设:
()0i E ε= i=1,2,…,n
⑵同方差:
()2
i Var εσ=
⑶无自相关:
⑷误差与自变量不相关:
(),0ik i Cov X ε= i=1,2,…,n , k=0,1,…,p ⑸自变量之间无多重共线性 ()1r a n k X p =
+
1.3.2模型建立及SPSS 运算结果分析
假设因变量Y (农村居民年人均生活消费支出)与自变量X 1(农村居民人均纯收入)、X 2(商品零售价格定基指数)、X 3(消费价格定基指数)、X 4(家庭恩格尔系数)、X 5(人均住宅建筑面积)满足下述等式:
01122334455y X X X X X ββββββ=+++++
强行回归:在SPSS 中进行强行回归,会得到如下表格:
⑴输入变量
从表1-1中可以看到,本文先强行将五个自变量与因变量进行线性拟合,希望得到一个线性函数。
表1-1 输入的变量
输入/移去的变量
模型输入的变量移去的变量方法1X5, X2, X4, X1, X3a. 输入a. 已输入所有请求的变量。
描述性统计量
均值标准偏差N Y 1847.2585 983.03837 20 X1 2391.890 1292.8874 20 X2 335.255 59.9815 20 X3 298.050 69.4300 20 X4 50.952 6.3407 20 X5 24.943 4.8762 20
⑵拟合优度检验
表1-2 拟合优度检验
模型汇总b
模
型R
R
方
调整 R
方
标准估计的误
差
更改统计量
Durbin-Wats
on
R 方更
改 F 更改
df
1
df
2
Sig. F 更
改
1 .999
a .99
8
.997 56.89386 .998 1131.67
2
5 14 .000 1.197
a. 预测变量: (常量), X5, X2, X4, X1, X3。
b. 因变量: Y
表1-2是对回归方程的拟合优度检验的说明
样本决定系数20.998
R ,说明自变量可以解释因变量99.8%的变化,而调整后
的样本决定系数221
1(1)0.9971
n R R n p -=--=--,这两个值非常接近1,所以拟合程
度比较高。
⑶方程显著性检验
表1-3 方程显著性检验
Anova b
模型
平方和 df 均方 F Sig. 1
回归 1.832E7 5 3663121.534 1131.672
.000a 残差 45316.766 14 3236.912
总计
1.836E7
19
a. 预测变量: (常量), X5, X2, X4, X1, X3。
b. 因变量: Y
表1-3是对回归方程显著性检验的说明
统计量1131.672F =,对应的概率值0.000p =,说明回归方程显著成立(我们给定显著水平为0.05)。
⑷参数求解及其显著性检验
表1-4 参数求解及显著性检验
系数a
模型
非标准化系数
标准系数 t
Sig.
相关性
共线性统计量
B
标准 误差 试用版 零阶 偏 部分 容差 VIF 1
(常量) -1457.646 936.744
-1.556 .142
X1 .836
.065 1.100 12.808 .000 .998 .960 .170 .024 41.819 X2
3.417 3.837 .209 .891 .388 .755 .232
.012 .003
310.892 X3 -5.293 4.780 -.374 -1.107 .287 .888 -.284 -.015 .002 646.608
X4 16.657 11.904 .107 1.399 .184 -.896 .350
.019 .030 33.443