相关与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6
6
46 36 2116 276 46.4
合计 24 300 106 15048 1182 300.0
利用回归方程内推估计表7-7 y 栏。外推估计,若x=7时, 单位成本为:y7 = 57.2-1.8x7 = 57.2-1.8×7 = 44.6(元)。
y 单位成本元
54 52 50 48 46 44 42 40
三、回归分析的步骤
(一)定性判断现象间有无相关关系
(二)编制相关图表,显示变量间相关关系形态
(三)计算相关系数,测定变量间相关关系的密切程度
(四)配合适当的回归方程式,进行回归计算。
四、简单直线回归分析
(一)简单直线回归的概念
它是对具有显著直线相关的两个变量变化的一般关系进行测 定,只研究一个因变量与一个自变量的线性关系,称一元线性回 归分析,即直线回归分析,其回归方程最简单故又称简单直线回 归分析。
(二)相关表法
1.简单相关表。它是根据原始资料按甲变量x由小到大顺序 列出乙变量y的对应数值形成的相关表,如表7-2。
表7-2 某产品产量与总成本相关表
产量(辆)x 9 10 11 12 13 14 15
总成本(万元)y 102 110 115 120 126 130 135
表7-2显示产量与总成本呈直线正相关。
2.分组相关表。原始资料很多可编制分组相关表,如表7-3。
表7-3 单变量分组相关表
身高(厘米)x 人数(人)f 平均体重(千克)y
150
5
42
151
5
44
152
5
46
153
5
48
154
5
50
合计
25
—
(三)相关图 将对应的变量在直角坐标上描绘出来所形成的图形叫相关图, 也称散点图。图7-2是根据表7-3绘制的相关图,相关图显示儿童 体重与身高之间呈直线正相关关系。
6
6
将b、a值代入回归直线方程得:
y = 57.2-1.8x
表7-7 直线回归计算表
企业n 产量x 单本y x2 y2 xy
y
1
2
52 4 2704 104 53.6
2
3
54 9 2916 162 51.8
3
4
52 16 2704 203 50.0
4
4
48 16 2304 192 50.0
5
5
48 25 2304 240 48.2
4 10 112பைடு நூலகம்100 12544 1120 109.48
5 11 117 121 13689 1287 115.84
6 12 121 144 14641 1452 122.20
合计 63 676 667 76400 7133 675.96
基本步骤如下: 1.绘制散点图7-3。 2.计算相关系数表7-4,r = 0.9722。 3.确定回归方程,计算回归参数a、b值表7-5。
第七章 相关与回归分析
• 学习要点
一、理解相关关系的概念、种类和测定方法。
二、掌握相关系数的概念和计算方法。
三、理解回归分析的概念,相关与回归分析的关系。
四、掌握相关与回归分析的步骤,熟练掌握简单直线的回 归分析方法。
第一节
相关分析
一、相关关系的概念
(一)函数关系
变量间的关系有确定性的与非确定性的两种。变量间的确定 关系叫函数关系,即对自变量的如何一个值因变量都有唯一确定 的值严格的与之对应。函数关系通常可以用数学公式确切的表示 出来。
0.5≤|r|<0.8,显著相关。 0.8≤|r|<1,高度相关。
应当指出,上述标准的划分要求计算相关系数的原始数据足 够多,这样相关系数所表明的关系程度才是可信的。
2.相关系数的计算方法
计算过程见表7-4。
表7-4 产量与总成本相关系数计算表
月份n 产量x 总成本y x2
y2
xy
1
10
110
100 12100 1100
(二)相关关系
相关关系是现象之间确实存在的,但关系值不固定、不严格 的依存关系。当一现象数值发生变化时,另一现象数值也相应发 生变化,但其关系值是不固定的,往往可能出现几个不同的数值 在一定的范围内变动着,这些数值分布在它们的平均数周围。
例如,给定一个x值就有几个y值与之对应,这时变量的相关 关系可由x值与在x值一定的条件下y的平均值与之对应得到说明。 例如儿童按身高x分组,每组有5个儿童的不同体重y值与之对应 , 共25对变量值,如表7-1。
6
46
36 2116 276
合计
24
300
106 15048 1182
计算相关系数:r
61182 24 300
0.822
6106 576 615048 90000
计算结果表明:产量与单位成本为高度负相关。
计算b、a值:b 61182 24 300 1.8
6106 576
a 300 1.8 24 57.2
2
9
101
81 10201 909
3
11
115
121 13225 1265
4
10
112
100 12544 1120
5
11
117
121 13689 1287
6
12
121
144 14641 1452
合计
63
676
667 76400 7133
r
n xy x y
n x2 x2 n y2 y2
6 7133 63 676
x
x
x
(a)正相关
(b)负相关
(c)无相关
图7-1 直线单相关种类
本章只介绍简单直线相关关系的分析方法。
三、直线相关关系的测定
(一)直线相关关系的一般判定
首先是利用定性分析来判断。任何社会经济现象都有质的规 定性,它表明了现象之间的区别与联系,对现象的这种质的规定 性的认识和分析,就是定性分析。一般来说,在定性分析的基础 上进而进行定量分析。所以,根据定性分析来判断是测定相关关 系的最基本方法。如果有些现象之间的关系难以通过定性分析作 出准确判断,可通过编制相关表和绘制相关图的直观显示判断。
b
n xy x n x2 x2
y
a y b x y bx
n
n
表7-5 产量与总成本回归直线计算表
月份n 产量x 总成本y x2 y2 xy
y
1 10 110 100 12100 1100 109.48
2
9
101 81 10201 909 103.12
3 11 115 121 13225 1265 115.84
它表明两个变量在直线相关形式下相关关系密切程度的统计
分析数据,通常用r表示。公式为:
r
n xy x y
n x2 x2 n y2 y2
r的变化范围在-1~1之间,即0≤|r|≤1。当r=0,表示无相 关。|r|=1,表示完全相关。 r>0,正相关。 r<0,负相关。 当 0<|r|<0.3,微相关。 0.3 ≤|r|<0.5 ,低相关。
一般先进行相关分析,对相关关系的密切程度做出判断, 进而决定是否进行回归分析。
(二)回归分析是相关分析的深入和继续
回归分析是指把相关变量的关系转化为函数关系并建立数学 方程式,来研究变量之间数量变动关系的统计分析方法。如果仅 有回归分析而缺少相关分析,就会因为缺乏必要的基础和前提而 影响回归分析的可靠性;若仅有相关分析而缺少回归分析,就会 降低相关分析的意义。只有把两者结合起来才能达到分析研究的 目的。
y 130
120
110
100
0
9 10 11 12 13 x
图7 3 回归直线图
b
n xy x n x2 x2
y
6 7133 6 667
63 676 632
6.363
a y b x 45.848
n
n
将a、b值代入回归直线方程得: y = 45.848+6.363x
绘出回归直线,见图7-3。 利用回归直线方程可以得到内推理论值见表7-5y栏,还可进 行外推估计。 y = 45.848+6.363×13 = 128.57(万元)。
表7-1显示,儿童平均体重与身高之间为直线正相关关系 (见第一列和第三列)。
直线单相关可分为正相关和负相关。甲变量x值增加,乙变 量y值也相应增加称正相关,如图7-1(a);甲变量x值增加,乙 变量y值也相应减少称负相关,如图7-1(b);若y值几乎不受x 值影响称无相关,如图7-1(c)。
y
y
y
x
0 1 2 3 4 5 6 产量件
图7 4 产量与单位成本相关图
表7-1 25名儿童身高、体重相关表
身高
(厘米)x
(1)
体重 (千克)y
(2)
平均体重 (千克)y
(3)
150 40,41,42,43,44, 42
151 41,43,44,46,46, 44
152 41,44,45,48,52, 46
153 43,46,47,49,55, 48
154 44,46,49,51,60, 50
(二)简单直线回归方程
它是借助于数学中的直线方程近似反映两个变量间的一般线
性数量关系,并根据自变量推算因变量。
设x为自变量、y为因变量用y代表y实际观察值的平均值,即
理论值。这样,直线方程为:y = a+bx
估计值(理论值)
式中:a直线截距,表明变量的基础水平;b直线斜率,又 称回归系数,表明x每变动一个单位时影响到y平均变动的数值, b还反映变量x和y之间的数量关系的形式和方向,b为正表明两变 量变动方向相同,是正相关, b为负表明两变量变动方向相反, 是负相关。用最小平方法求解b、a两个参数值,即:
再如表7-6。绘制散点图见图7-4,列计算表见表7-7。
表7-6 产量与单位成本回归直线计算表
企业 产量(件) x 单位成本(元) y x2 y2 xy
1
2
52
4 2704 104
2
3
54
9 2916 162
3
4
52
16 2704 203
4
4
48
16 2304 192
5
5
48
25 2304 240
6
0.9722
6 667 632 6 76400 6762
计算结果表明,产量与总成本之间为直线正相关。
第二节
回归分析
一、回归分析的概念
回归分析是指对具有显著相关关系的变量,根据其相关形态 选择一合适的数学方程来表达变量间的平均变动关系的统计分析 方法。
二、相关与回归分析的关系
(一)相关分析是回归分析的基础和前提
平均
体重 y
千克
60
55
50
45
40
0 150 151 152 153 154 x身高厘米 图7 2 身高体重相关图
相关图可以直观地对相关关系的态势、方向和密切程度做出 显示。
(四)相关系数
相关表和相关图能大致显示变量间相关关系的直观态势,为 了定量研究相关关系的密切程度,就要计算相关系数。
1.相关系数的意义