相关分析实验报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关与回归分析实验报告
一、实验目的:
学会根据一组数据,来分析其相关性,根据其相关性的分析,再进行回归分析。学会运用EXCEL中的数据分析软件,并对数据进行回归分析。得出一元线性回归方程,并对其检验评价。
二、实验环境
实验地点:实训楼计算机实验中心五楼实验室3
试验时间:第十二周周二
实验软件:Microsoft Excel 2003
三、实验原理:
变量之间的相关关系需要用相关分析法来进行识别和判断。相关分析,就是借助于图形或若干分析指标对变量之间的依存关系的密切程度进行测定的过程。相关关系通常通过散点图、相关系数进行识别。
一元线性回归(linear regression)是描述两个变量之间相互联系的最简单的回归模型(regression model).通过一元线性回归模型的建立过程,我们可以了解回归分析方法的基本统计思想以及它在经济问题研究中的应用原理。
四、实验内容
1 相关分析:
(选择的变量是什么?然后开始进行相关分析)
以绝对数(元)为自变量x,指数 (1978=100)为因变量y。
图1.1 (1)散点图
图1.2
图1.3
(2)相关系数的计算
在标题栏里找到:工具→数据分析→相关系数→导入数据→输出结果
由图表可知相关系数r=0.9893,由散点图的分布以及相关系数的结果可推测,x 与y相关系数很高,且成一元线性回归,故继续对以上两个变量进行回归分析
所以相关系数R=0.9893,为高度正线性相关。
2 回归分析:
现对变量进行回归分析,工具→数据分析→回归,即可得到下图
图1.4
图1.5
点击确定,即可得到以下结果。
图1.6
(继续对上面两个变量进行回归分析)
(1)三个表格输出:可以输出几个重要的量:R square,Syx,F,2个系数coefficients
R square=0.9893
S yx =δ^=2^^102---∑∑∑n xy y y ββ=461.3088
F=1853.55
(2)回归方程:
回归方程为y ^^=β0+β1X,
β1=∑∑∑∑∑--2)(2xi xi n yi xi xiyi n =0.045
β0 =y -β1x =114.7285091
所以回归方程y=114.7285091+0.045x
(3)方程的评价:
在数据中,F=1853.55,sig F<0.0001说明回归方程整体显著性差,
b 的t 统计量t= 21.66,回归方程比较合理。
五、实验结论 (验证理论、新发现、体会)
从这次的统计结果中,我们可以看出x 与y 存在着高度线性相关。由此我们可以看出我国城镇居民恩格尔系数经历了“高位徘徊——波动下降——较快下降”的变迁。城镇居民生活质量较之于农村,已经有了明显的优势。恩格尔系数越低,说明居民越富裕。反之加快经济发展,大幅度增加城乡居民收入水平直接促进恩格尔系数的下降,城乡居民收入水平提高了,必然会提高生活消费水平。城乡居民在保证食品需求的前提下,增加的消费支出必然投入到非食品消费上,可以提高穿着水平,可以改善居住条件,可以购买耐用消费品提高生活质量,可以用在教育学习方面提高自身素质,可以外出旅游开阔视野、增长见识等。总之非食品消费支出增加越多,恩格尔系数越低。反之,如果城乡居民收入增长不快,就没有额外经济收入来增加非食品消费支出,则恩格尔系数必然呈缓慢下降趋势。
这次的统计学作业是研究相关与回归分析,主要通过建立这两个数据之间的
方程。在做实验时我迷茫了很久,由于上课的时间比较赶,所以我们只能课下自己研究。一开始我对于自变量与应变量的选择还是花了一定时间,但我们必须正确选定自变量与应变量,一般说,事物的原因作自变量X,当事物的因果关系不很明确时,选误差较小的即个体变异小的变量作自变量X,以推算应变量Y。后然才切身感受到只有根据自变量的变化而变化的才是y.这也证实了他与相关分析的差别:相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。
然后是对回归方程的计算。刚开始的时候比较死板,不知道要灵活运用excel计算x. y 等一些数据,看到这么大的数据很无奈,还是拿着计算机一点点摁出来。后来在同学的指导下,知道可以利用excel一步完成。首先输入“X 的平方”,要先在文本框中输入“2”,然后点击菜单栏中的格式,选中“单元格”,然后点击确定。然后在设置中将“2”设置为下标。计算X的平方是在单元格中输入“=power(B4,2)”,然后按回车键。这样就可以很便捷地计算出x2与y2。计算xi*yi只要在单元格中输入“=product(B4:C4)”,按回车键,答案就出来了。
做好这个实验后,我对相关分析有了基础的理解。相关分析的作用要正确理解。相关分析只是以相关系数来描述两个变量间相互关系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质。而且相关并不一定就是因果关系,切不可单纯依靠相关系数或回归系数的显著性“证明”因果关系之存在。然后关于回归系数 r 的取值范围是 [-1,1],当 |r|=1,为完全相关, r =1,为完全正相关, r =-1,为完全负相关,r = 0,不存在线性相关关系,-1£r<0,为负相关,0 在对数据进行描述和分析的过程中,Excel软件的数据处理功能得到了极大的发挥,工具栏中的工具和数据功能对数据的处理是问题解决起来是事半功倍。所以EXCEL是我们统计试验的基础知识。若不知EXCEL的运用则无法进行试验。