实验五:相关与回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验(实训)报告
项目名称相对于回归剖析
所属课程名称统计学
项目种类综合
实验 ( 实训 ) 日期2014-06-01
班级12计算机 2班
学号
姓名陈玉洁
指导教师陈雄强
浙江财经大学教务处制
一、实验(实训)概括:
【目的及要求】
实验目的: 1. 掌握简单有关剖析方法,并依据有关系数判断两变量的有关关系。

2.掌握回归剖析方法,并对回归纳果进行剖析。

实验要求:以浙江省城镇为例进行剖析对人均GDP、居民年人均可支配收入和年人均花费
支出的有关变量之间的关系。

【基来源理】
有关剖析
回归剖析
【实行环境】(使用的资料、设施、软件)
操作系统: Window XP编译软件
二、实验(实训)内容:
【项目内容】
1.分别求人均可支配收入与 GDP、人均花费性支出与 GDP、人均可支配收入与人均花费支
出的有关系数。

2.画出人均可支配收入与人均花费支出的散点图,求人均花费支出倚人均可支配收入
的直线回归方程,解说方程结果,并找出方程的预计标准偏差。

3.画出 GDP与人均可支配收入的散点图,求人均可支配收入倚 GDP的直线回归方程。

解说方程结果,并找出方程的预计标准偏差。

4.画出 GDP与人均花费支出的散点图,求人均花费支出倚 GDP的直线回归方程。

解说方程结果,并找出方程的预计标准偏差。

5.若将 GDP的单位改为亿元,再做第 3 和第 4 题,察看单位变化对回归方程的影响。

6.求人均可支配收入倚 GDP的二次回归方程,并与直线回归方程比较,选出最合适的方程。

7.求人均花费支出倚 GDP的二次回归方程,并与直线回归方程比较,选出最合适的方程。

8.求人均可支配收入对 GDP的弹性系数和人均花费支出对GDP的弹性系数。

【方案设计】
(1)依据变量的观察数据绘制散点图;
(2)计算有关系数,说明有关程度和方向;
(3)成立直线(曲线)回归方程;
(4)计算回归方程的预计标准偏差和判断系数;
(5)对方程进行解说和应用等
【实验(实训)过程】(步骤、记录、数据、程序等)
在国家统计局网站上找到浙江省 GDP、浙江省城镇人均可支配收入、浙江省城镇人均花费性支出的有关数据。

(当前供给: 2002 年-2012 年的数据)并将其录入 Spss 中,以下列图所示:
1.分别求人均可支配收入与 GDP、人均花费性支出与 GDP、人均可支配收入与人均花费支
出的有关系数。

方法:在 Spss 工具栏中选择:剖析 -有关 -双变量 -加入 GDP ,income。

Paycome—确立,获得以下所示的图表:
2.画出人均可支配收入与人均花费支出的散点图,求人均花费支出倚人均可支配收入的
直线回归方程,解说方程结果,并找出方程的预计标准偏差。

方法: 1)在 Spss 工具栏中选择:图表 -散点图 -选择 income 为 x 轴, payout 为 y 轴。

(两种方法) -确立,获得以下所示的图表:
2)而后又在 Spss 工具栏中选择:剖析 -回归 -线性 -将 payout 放起上, income 放下 - 确立,获得以下的表格:
输入/移去的变量 b
模型输入的变量移去的变量方法
1 income a . 输入
a.已输入全部恳求的变量。

b.因变量 : payout
模型汇总
模型R R 方调整R 方标准预计的偏差
1 .996 a .993 .992
a.展望变量: ( 常量 ), income 。

Anova b
模型平方和df 均方 F Sig.
1 回归 1 .000 a
残差9
总计10
a.展望变量 : ( 常量 ), income 。

b.因变量 : payout
系数 a
非标准化系数标准系数
模型 B 标准偏差试用版t Sig.
1 (常量) .000
income .565 .016 .996 .000
a. 因变量 : payout
3.画出 GDP 与人均可支配收入的散点图,求人均可支配收入倚GDP 的直线回归方程。

解说方程结果,并找出方程的预计标准偏差。

方法: 1)在 Spss 工具栏中:图表-散点图 -选择 GDP 为 x 轴, income 为 y 轴。

(两种方法)-确立,获得的图像以下所示:
2)在 Spss 工具栏中:剖析 -回归 -线性 -将 income 放起上, GDP 放下 -确立 ,获得以下所示的图表:
输入/移去的变量 b
模型输入的变量移去的变量方法
1
a
. 输入GDP
a.已输入全部恳求的变量。

b.因变量 : income
模型汇总
模型R R 方调整R方标准预计的偏差
1 .998 a
.996
.996
a.展望变量 : ( 常量 ), GDP 。

b
Anova
模型平方和df 均方 F Sig.
1 回归 1 .000 a
残差9
总计10
a.展望变量 : ( 常量 ), GDP 。

b.因变量 : income
系数 a
非标准化系数标准系数
模型 B 标准偏差试用版t Sig.
1 (常量) .000
GDP .823 .017 .998 .000
a. 因变量 : income
4.画出GDP 与人均花费支出的散点图,求人均花费支出倚GDP 的直线回归方程。

解说
方程结果,并找出方程的预计标准偏差。

方法: 1)在 Spss 工具栏中:图表 -散点图 -选择 GDP 为 x 轴, payout 为 y 轴。

(两种方法) - 确立,获得以下的图形:
2)在 Spss 工具栏中:剖析 -回归 -线性 -将 payout 放起上, GDP 放下 -确立,获得以下的图表:
输入/移去的变量 b
模型输入的变量移去的变量方法
1
a
. 输入GDP
a.已输入全部恳求的变量。

b.因变量 : payout
模型汇总
模型R R 方调整R 方标准预计的偏差
1 .996 a .991 .990
a.展望变量: ( 常量 ), GDP 。

Anova b
模型平方和df 均方 F Sig.
1 回归 1 .000 a
残差9
总计10
a.展望变量 : ( 常量 ), GDP 。

b.因变量 : payout
系数 a
非标准化系数标准系数
模型 B 标准偏差试用版t Sig.
1 (常量) .000
GDP .466 .015 .996 .000
a. 因变量 : payout
注:若将 GDP 的单位改为亿元,再做第 3 和第 4 题,察看单位变化对回归方程的影响。

方法:将 GDP 的单位变成亿元,则在 Spss 工具栏中:变换 -计算变量 -GDP1=GDP/10000 ,获得新的 GDP 以下所示:
此时,依据上边的方法一次做3,4,获得的图形为:
输入/移去的变量 b
模型输入的变量移去的变量方法
1
a
. 输入GDP1
a.已输入全部恳求的变量。

b.因变量 : income
模型汇总
模型R R 方调整R 方标准预计的偏差
1 .998 a .996 .996
a.展望变量: (常量), GDP1。

Anova b
模型平方和df 均方 F Sig.
1 回归 1 .000 a
残差9
总计10
a.展望变量 : ( 常量 ), GDP1 。

b.因变量 : income
系数 a
非标准化系数标准系数
模型 B 标准偏差试用版t Sig.
1 (常量) .000
GDP1 .998 .000 a. 因变量 : income
输入/移去的变量 b
模型输入的变量移去的变量方法
1
a
. 输入GDP1
a.已输入全部恳求的变量。

b.因变量 : payout
模型汇总
模型R R 方调整R 方标准预计的偏差
1 .996 a .991 .990
a.展望变量: (常量), GDP1。

Anova b
模型平方和df 均方 F Sig.
1 回归 1 .000 a
残差9
总计10
a.展望变量 : ( 常量 ), GDP1 。

b.因变量 : payout
系数 a
非标准化系数标准系数
模型 B 标准偏差试用版t Sig.
1 (常量) .000
GDP1 .996 .000
a. 因变量 : payout
6.求人均可支配收入倚GDP 的二次回归方程,并与直线回归方程比较,选出最合适的方程。

方法: 1)在 Spss 工具栏中:图表 -散点图,先察看散点图的特征,选择使用什么回归
比较好。

2)经过察看,得悉选择曲线回归比较好,则在Spss 工具栏中:剖析-回归 - 曲线 -income 上, GDP 下-选择 Quadratic 和 display ANOV A table -确立,获得以下所示的表
格:
模型描绘
模型名称MOD_1
因变量 1 income
方程 1 二次
自变量GDP
常数包括
其值在图中标志为观察值的变量未指定
用于在方程中输入项的容差.0001
个案办理纲要
N
个案总数11
已清除的个案 a 0
已展望的个案0
新创立的个案0
a.从剖析中清除任何变量中
带出缺失值的个案。

变量办理纲要
变量
因变量自变量
income GDP
正当数11 11
零的个数0 0
负值数0 0
缺失值数用户自定义缺失0 0
系统缺失0 0
模型汇总
R R 方调整R 方预计值的标准误
.998 .996 .995
自变量为 GDP。

ANOVA
平方和df 均方 F Sig.
回归 2 .000 残差8
总计10
自变量为 GDP。

系数
未标准化系数标准化系数
B标准误Beta t Sig.
GDP .795 .103 .964 .000 GDP ** 2 .000 .035 .280 .787 (常数).001
数据一般默认 3 位,改正详细为:
( 1)SPSS默认显示至小数点后所以这类状况其实不代表这个数字为取以下方法:
3 位,所以当数字小于1/1000 时就只好显示0.000 了。

0,而是表示它小于1/1000 。

要想显示完好数字,能够采
双击输出表格,右键点击显示0.000 的格子,选择“单元格属性”,在“格式值”选项
卡中选择“小数”项上增添小数点位数至你所需要的位数。

注意,假如你增添的小数点位数许多,而格子又不够宽,此时就会显示×××××。

你只要要从头双击表格,而后双击显示
×××××的格子,而后拖动格子的边框加宽格子的宽度就能够了
改正后的数据表格以下所示:
系数
未标准化系数标准化系数
B 标准误Beta t Sig.
GDP .795 .103 .964 .000
GDP ** 2 .035 .280 .787
(常数).001
7.求人均花费支出倚GDP 的二次回归方程,并与直线回归方程比较,选出最合适的方程。

方法:详细步骤与 6 同样,实验获得的表格以下所示:
模型汇总
R R 方调整R 方预计值的标准误
.996 .992 .990
自变量为 GDP。

ANOVA
平方和df 均方 F Sig.
回归 2 .000
残差8
总计10
自变量为 GDP。

系数
未标准化系数标准化系数
B 标准误Beta t Sig.
GDP .558 .084 .000
GDP ** 2 .294
(常数).000
8.求人均可支配收入对GDP 的弹性系数和人均花费支出对GDP 的弹性系数。

一个变量 Y 对另一个变量X 的弹性系数 E 定义为: E=Y 的增添率÷ X 的增添率,所以需要在 SPSS 中采纳幂函数 power。

模型汇总
R R 方调整R 方预计值的标准误
.998 .995 .995 .026
自变量为 GDP。

ANOVA
平方和df 均方 F Sig.
回归 1 .000
残差.006 9 .001
总计10
自变量为 GDP。

系数
未标准化系数标准化系数
B 标准误Beta t Sig.
ln(GDP) .725 .017 .998 .000 (常数).000 因变量为 ln(income)。

模型汇总
R R 方调整R方预计值的标准误
.996.993.992.027
自变量为 GDP。

ANOVA
平方和df 均方 F Sig.
回归.873 1 .873 .000
残差.006 9 .001
总计.879 10
自变量为 GDP。

系数
未标准化系数标准化系数
B 标准误Beta t Sig.
ln(GDP) .605 .017 .996 .000 (常数).000 因变量为 ln(payout)。

【结论】(结果、剖析)
(2)标准化系数与非标准化系数
SPSS 进行线性回归,获得的系数结果有标准化和非标准化,一般采纳非标准化的回归系数。

二者的主要差别有:
①标准化是去除量纲的。

X i X
x i
X
②标准化回归系数表现了变量间的相对重要性,并且与自变量的失散程度有关,假如其颠簸程度较大,那么就会显得比较重要;不然,就显得不太重要。

标准化回归系数正是用于检测这类重要性的。

③当需要比许多个自变量对因变量相对作用大小时,可采纳标准化回归系数,当不过想解说自变量对因变量的作用时,可采纳非标准化的回归系数。

④标准化的常数项是没有值的,所以,标准化的回归系数不可以用于回归方程。

标准化的回归系数不过用于自变量间进行比较
三、指导教师考语及成绩:
考语:
成绩:指导教师署名:
批阅日期:。

相关文档
最新文档