应用回归分析实训 完全版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用回归分析实训(SPSS)课程号:STAN32110P
结课报告写作要求
1.学生报告采用打印版,请按照附件要求格式提交报告。
2.题目自拟。选题得当,分析过程正确清晰,结论明确。
3.分析所采用的方法必须是课堂讲授过的某一方面或多个方面。所
有软件操作必须使用spss。
4.论文内容方面有雷同者则此课程不及格。
北京房价影响因素的多元线性回归分析关键词:多元线性;回归分析;相关性
一、研究目的和意义
我国房地产市场从20世纪90年代开始建立到如今已经颇具规模,对我国的经济增长产生了很大的影响,甚至成为了国民经济的支柱型产业。但是近年来,房价的飞速发展又不得不引起我们的重视,在促进经济增长的同时,带来的一系列结构性问题将对房地产行业的健康发展甚至国民经济的可持续发展带来影响。因此研究商品房价格的影响因素,有助于科学的把握房地产市场的发展规律,对整个国民经济都具有很大的意义。
二、研究内容和方法
本文主要以北京为中国房地产市场的代表城市进行分析,通过对1999年至2007年的相关经济数据整理建立起多元线性回归模型。
从理论上来讲,房价的波动主要受宏观经济影响,包括地区生产总值,城镇人均可支配收入,建设成本,城市人口密度,货币政策,土地价格以及房地产开发投资额等指标。这里主要选取商品房平均售价作为因变量,城镇人均可支配收入,城市人口密度,以及房地产开发投资额作为自变量来进行分析,通过多元回归方法来了解商品房价格的影响因素
(一)多元回归模型的建立
2004.00 5855.00 16682.82 1970.00 1175.46 2005.00 6842.00 18645.03 2718.20 1246.86 2006.00 7196.00 20667.91 2774.20 1275.59 2007.00
10320.00
23623.35
2931.00
1307.53
表:北京1999~2007年相关经济数据
设定三个自变量指标分别为:城镇人均可支配收入1x ,城市人口密度2x ,房地产开发投资额3x ,商品房平均售价y 作为因变量,并建立如下的多元线性回归模型:
εββββ++++=3322110x x x y
其中0β,1β,2β,3β分别为未知参数,
ε为剩余残差,与三个自变量无关。服从N(0, 2σ).
(二) 回归模型的检验 具体操作步骤为
1、模型拟合度检验
见下表分析结果:
模型汇总b
表:模型拟合度检验
由上表可以看出,其R值和R^2值都很接近于1,所以其模型拟合度较好。
2、自相关性检验
上表中给出了杜宾沃森检验值,DW=2.134接近于2,表明无自相关性,即每个观测值之间不相关。
3、方差分析显著性F检验
见方差分析表:
方差分析表
由上表可以看到F值为72.325,SIG值为0.000,显然小于0.05,说明因变量分别与自变量存在真实的线性关系,显著性检验通过。
4、变量显著性t检验
Coefficients表
由表知,只有城镇人均可支配收入的SIG值小于0.05,但是其VIF值却大于10,另外发现城市人口密度以及房地产开发投资额和商品房均价呈负相关,显然在经济实际上不合理。综合判断,自变量间存在多重共线性。通过相关性检验观察变量间的的相关系数均很接近于1(见下表),说明确实存在较强的共线性。
N 商品房平均售价(元每平方米)9 9 9 9
城镇人均可支配收入(元)9 9 9 9
房地产开发投资额(亿元)9 9 9 9
城市人口密度(人每平方公里)9 9 9 9
表:变量间的相关系数
(三)多重共线性问题的解决以及回归模型修正
(1)××××(作为正文4级标题,用小4号宋体,不加粗,左空两字,20磅行距)×××××××××(小4号宋体,20磅行距)××××××……
多重共线性的解决一般可以从数据处理和统计方法这两方面入手。
数据处理方面可以通过增加样本量来解决,但是由于房地产市场从90年代末才逐步发展,相关统计数据有限。所以我们通过采用逐步回归(stepwise)统计方法来对回归进行修正。
通过逐步回归后发现,只有城镇人均可支配收入与商品房销售均价表现了良好的正相关性,并且通过了相关的检验。分别如下表所示:综合SIG值,F值,VIF 值都符合检验通过的标准。
Anova b
模型平方和df 均方 F Sig.
1 回归 3.979E7 3 1.326E7 72.325 .000a
残差916895.968 5 183379.194
总计 4.071E7 8
a. 预测变量: (常量), 城市人口密度(人每平方公里), 房地产开发投资额(亿元), 城
镇人均可支配收入(元)。
b. 因变量: 商品房平均售价(元每平方米)
表:方差分析
系数a
模型非标准化系数标准系
数t Sig. 相关性共线性统计量
表: t检验
但是从经济意义上来看,房价与房地产开发投资额应该会呈一定的正相关关系,只是由于样本数据太少,或者相关政策的不稳定性导致其检验不显著。而城市人口密度的不显著反而可以理解。因为北京随着其的经济发展,确实会吸引很多外来人口工作,但是房屋的需求量不只是需求欲望决定的,还和购买力有关,显然人口密度和购买力不能构成正比关系。
同理,通过继续分别以(城镇人均人口可支配收入,房地产投资额)以及(城镇人均人口可支配收入,城市人口密度)为自变量做分析查看其T检验结果如下:
表:城镇人均人口可支配收入,房地产投资额