项目二 相关与回归分析报告案例及练习要求
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目二:相关与回归分析
一、实验目的
1、掌握Pearson简单相关分析方法,并根据相关系数判断两变量的相关程度。
2、熟悉偏相关系数、Kendall tau-b和Spearman等级相关系数的计算方法,理解其区别与联系。
3、掌握一元与多元回归分析方法,对回归模型估计和检验,并对结果进行分析。
4、了解曲线回归分析方法。并对回归结果进行分析。
二、实验内容和要求
1、现有杭州市区 1978-2014 年的 GDP、城镇居民年人均可支配收入和年人均消费支出的数据资料(example1.sav),如下:
数据来源:历年《杭州统计年鉴》和《2014年杭州市国民经济和社会发展统计公报》。
要求:
(1)求人均可支配收入、GDP、人均消费性支出与消费价格指数的双变量Pearson相关系数。
相关性
income bcpi
income Pearson 相关性 1 .841**显著性(双侧).000 N 37 37
bcpi Pearson 相关性.841** 1 显著性(双侧).000
N 37 37
**. 在 .01 水平(双侧)上显著相关。
相关性
gdp bcpi
gdp Pearson 相关性 1 .751**显著性(双侧).000 N 37 37
bcpi Pearson 相关性.751** 1 显著性(双侧).000
N 37 37
**. 在 .01 水平(双侧)上显著相关。
相关性
payout bcpi
payout Pearson 相关性 1 .873**显著性(双侧).000 N 37 37
bcpi Pearson 相关性.873** 1 显著性(双侧).000
N 37 37
**. 在 .01 水平(双侧)上显著相关。
(2)画出人均可支配收入与人均消费支出的散点图,求人均消费支出倚人均可支配收入的直线回归方程,解释方程结果,并给出方程的估计标准误差。
(3)求人均可支配收入倚GDP的直线回归方程。解释方程结果,并给出方程的估计标准误差。
(4)求人均消费支出倚GDP的直线回归方程。解释方程结果,并给出方程的估计标准误差。
(5)若将GDP的单位改为万元,再做第3和第4题,观察单位变化对回归方程的影响。
无影响
(6)求人均可支配收入倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
(7)求人均消费支出倚GDP的二次回归方程,并与直线回归方程比较,选出最适合的方程。
(8)以定基居民消费价格指数为控制变量,对居民年人均可支配收入和消费支出进行偏相关分析。
(9)计算居民年人均消费支出倚GDP,居民年人均可支配收入和消费价格指数的多元线性回归方程,确定最终模型并对估计结果进行解释。
*(10)求人均可支配收入对GDP的弹性系数和人均消费支出对GDP的弹性系数(提示:一个变量Y对另一个变量X的弹性系数E定义为:E=Y的增长率÷X的增长率)。
2、由表5-2所示的2013年浙江省各地级市GDP、第三产业就业人数数据资料(example2.sav),进行Kendall tau-b和Spearman等级相关分析。
数据来源:《2014年浙江统计年鉴》。
练习
一、请打开数据文件exercise1.sav,该数据文件是有关浙江省人均可支配收入、服务业产值等基本信息资料。试根据文件中的数据资料,运用SPSS软件进行以下分析。
1、Pearson线性相关分析:计算城镇居民人均可支配收入、地区生产总值、服务业产值和服务业就业人数的Pearson线性相关系数和sig值,并判断变量间的相关程度。
表1 双变量间的Pearson线性相关系数
相关程度判断:各项Sig<0.01,表明在置信度99%下,相关系数在0.990到0.998之间,高度相关
2、偏相关分析:以地区生产总值为控制变量,计算双变量的偏相关系数和sig 值,并将计算结果填入下表。
3、一元线性回归分析
(1)建立居民人均可支配收入倚服务业产值的直线回归方程,将计算结果填入下表:
表2 居民人均可支配收入的一元线性回归
得到的线性回归方程: Y=3205.977+2.050X 。(2)分析回归模型的判别系数及其含义: P值等于0,小于0.05,表明拟合效果显著。
(3)回归方程的经济含义是,服务业产值每增加1亿元,_城镇居民可支配收入增加2.050元。_
(4)回归方程整体显著性检验 sig<0.05,整体拟合效果显著。
4、多元线性回归分析
(1) 建立以居民人均可支配收入为因变量,外商直接投资和服务业就业人数
为自变量的直线回归方程,将计算结果填入下表:
表3 居民人均可支配收入的多元线性回归
得到的线性回归方程:居民可支配收入=-5714.828+38.607*服务业就业人数+34.240*外商直接投资。
(2)分析回归模型的判别系数及其含义:服务业就业人数的P值小于0.05,拟合效果显著,外商直接投资的P值大于0.05,效果不显著。
(3) 假设服务业就业人数不变时,外商直接投资每增加1万美元,_居民可支配收入增加34.240元。 _
(4) 回归方程整体显著性检验表二中的sig小于0,。05,整体拟合效果显著。(5)回归方程的多重共线性诊断结果
。
(6)对模型实施逐步向后回归,请写出回归估计方程和主要诊断结果:
。
5、曲线回归分析
(1)曲线回归的系数表
表4 居民人均可支配收入的二次回归
(2) 以城镇人均可支配收入为因变量,服务业产值为自变量,估计的二次方程是居民人均可支配收入=2037.735+2.824*服务业产值+(-4.669E-005)*(服务业产值)^2 (3) 二次方程的判定系数R2=0.992 ,标准误为 1097.108 ,而对比原线性回归时,R2= 0.980 ,标准误差为 1707.499 ,因此,二次方程比线性回归的拟合效果更好。
(4) 方差分析结果,F值为 1670.577 ,显著性水平为 0.000 ,方程具有统计显著性。
6、等级相关分析
请打开数据文件exercise2.sav,该数据文件是2013年浙江省各地市GDP和年末高校在校生人数的基本信息资料。试根据文件中的数据资料,运用SPSS软件进行以下分析。
表5 2013年浙江省11地市的GDP和高校在校生人数单位:亿元/人