第九章 相关分析与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
35
用相关系数表示的相关程度的等级有如下几 种情形: r=0:不相关; ︱r︱<0.3:极低度相关; 0.3 ≤︱r︱≤0.5:低度相关; 0.5 ≤︱r︱≤0.8:中度相关; ︱r︱≥0.8:高度相关; ︱r︱=1:完全相关。
36
需注意:变量之间的非线性相关程度较大可能 导致r=0,当r=0或r很小时,不能得出变量无关的结 论。 完全负相关 无线性相关
29
r=
L xy L xx L yy
从公式中可以看出: r取正值或负值决定于分子
L xy 0 r 0 正相关 L xy 0 r 0 负相关
30
r值的意义是: ︱r︱愈接近0,x与y之间的直线相关程度愈
小,反之,︱r︱的值愈接近1,x与y之间的相关
程度愈高。 但需要注意的是r只表示x与y的直线相关密 切程度。当︱r︱值很小甚至等于0时,并不一定 表示x与y之间就不存在其他类型的关系。
0.9202
即产量与生产费用之间的相关系数r=+0.9202,说
明二者之间存在高度正线性相关关系。
34
2.相关系数的意义 相关系数的取值范围是:-1≤r≤1(︱r︱≤1)
︱r︱越接近1,表示相关程度越高;
︱r︱越接近0,表示相关程度越低; ︱r︱=0表示两个变量之间不存在直线相关; r=1表示存在着完全正相关; r=-1表示存在着完全负相关。
y
x
7
相关关系的特点:
相关关系表现为数量相互依存关系;
相关关系在数量上表现为非确定性的相互
依存关系。
8
相关关系的例子
商品的消费量(y)与居民收入(x)之间的关系
商品的消费量(y)与物价(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、 温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系
变化。
40
回归分析的特点: 1.回归分析的两个变量是非对等关系; 2.回归分析中,因变量是随机变量,自变量
是可控制变量。
回归分析的内容: 1.确定现象之间相关关系的数学模型; 2.测定数学模型的拟合精度。
41
(二)相关分析和回归分析的区别与联系 1.联系
二者具有共同的研究对象,而且在具体应用
时,常常必须互相补充。相关分析需要依靠回归
第九章
相关分析与回归分析
1
学习目标:
1.掌握相关分析的概念、分类及与函数关系的区 别; 2.能够利用相关系数对相关关系进行测定,并且 掌握相关函数的性质; 3.明确相关分析与回归分析各自特点以及它们的 区别与联系; 4.掌握回归分析基本理论和方法。
2
第一节
相关分析的一般问题
一、变量之间的关系 (一)函数关系(确定性关系) 函数关系指现象间在数量上存在着确定的、 严格对应的依存关系。 特点:对于某一变量的每一个数值,都有另 一个变量的确定的值与之相对应,并且这种关系 可以用精确的数学函数式表示出来,因此称为函 数关系。
分析来表明现象数量相关的具体形式,而回归分
析则需要依靠相关分析来表明现象数量变化的相 关程度。只有当变量之间存在着高度相关时,进
行回归分析寻求其相关的具体形式才有意义。
42
2. 区别 (1)相关分析研究变量之间相关的方向和
程度,但不能指出变量间相互关系的具体形式,也
5
(二)相关关系(非确定型关系) 指事物之间的关系数值存在着一定的依存关 系,但它们不是确定的和严格依存的,某一现象 在其发展变化中,当数量上为一确定值时,与之 有联系的其他现象可以有若干个数值与之对应, 在这些数值之间表现出一定的波动性,但这些值 按某种规律在一定范围内变化。
6
(1)变量间关系不能用函 数关系精确表达; (2)一个变量的取值不能 由另一个变量唯一确定; (3)当变量 x 取某个值时, 变量 y 的取值可能有几 个; (4)各观测点分布在直线 周围。
直线正相关
16
y
· · ·· ·· ·· ·· · · · · · · · · · ·· · · · · x
曲线相关
17
y
·
·· ··
·
x 完全直线相关
18
y · ··· ··· · · ·· · ··· · · · x 不相关
19
y · ·· · ·
· · · ·
x
完全曲线相关
20
y
·· · · · ··
用相关指数来衡量其相关程度的。
Baidu Nhomakorabea
r x
2 xy y
25
公式中:
2 ——协方差 xy x y
——变量x的标准差 ——变量y的标准差
26
2 = xy
x x y y
2
n
x=
x x n y y n
y=
2
27
完成量(小时)
40 40 40 40 50 50 50 50 50 50 80 80 80 80 80 单位成本(元/小时) 15 15 15 16 14 14 15 15 15 16 14 14 14 14 15 23
相关图
又称散点图。将x置于横轴上,y置于纵轴上, 将(x,y)绘于坐标图上。用来反映两变量之间 相关关系的图形。
9
相关关系的两种情形: 1.现象之间的关系多体现为因果关系,
即某个现象的变化是由另一个或几个现象变化
引起的。 在数量表现上,把起主动作用的因素称 为自变量,一般用x表示;而把因主动因素的 变化而引起变化的因素称为因变量,用y表示。
10
2.两个变量之间有时只存在相互联系而并 不存在因果关系。难以指出哪一个是原因,哪 一个是结果。在这种情况下,需要根据不同的 问题和研究目的来确定哪一个为因变量,哪一 个为自变量。
11
相关关系与函数关系既有区别,也有一定的联系。
有些函数关系由于在实际观察时出现误差,常
常表现为相关关系。 而在研究相关关系时,为了寻求相关关系及数 量关系的一般表现形式,又往往运用函数关系的形 式加以描述。
12
二、相关关系的种类
线性相关
(一)按相关形式不同 非线性相关
正相关 (二)根据相关反向划分(在直线相关中) 负相关
13
完全相关 (三)按相关的程度
不完全相关 不相关(零相关) 单相关 (四)根据相关关系涉及变量的多少 复相关 偏相关 真实相关 (五)按相关的程度 虚假相关
14
y ·· · · · · · · ·· · ·· ·· · · · · x
直线负相关
15
y · ·· · ··· · ·· · ·· · x
L yy=
y2 y2
n
19212 310505
12
2984.9167
10251921 x y 170094 6008.5833 L xy= xy n 12
33
r=
L xy L xx L yy
6008 5833 . 142829867 2984 9167 . .
33 12 33 12 40 13 56 14 58 14 65 20 72 22 80 26 80 26 90 30
30 广告费(万元) 年销售收入(百万元) 12
销售收入 (百万元)
40 30 20 10 0 0 20 40 60 80 100
24
广告费(万元)
二、相关系数 1.简单线性相关系数的计算 对两个变量之间线性相关程度的度量称为简 单相关系数,用r表示。而对于曲线相关来说,是
x
2
y
2
xy
5 200 6 300 7 750 7 700 9 750 12 012 13 860 17 000 19 372 22 500 22 750 25 900 170 094
1 600 1 764 2 500 3 025 4 225 6 084 7 056 10 000 13 456 15 625 16 900 19 600 101 835
4
函数关系的例子
某种商品的销售额(y)与销售量(x)之间的关 系可表示为 y = p x (p 为单价); 圆的面积(S)与半径之间的关系可表示为S = r2 ;
企业的原材料消耗额(y)与产量(x1) 、单位产 量消耗(x2) 、原材料价格(x3)之间的关系可 表示为y = x1 x2 x3 。
例:为了研究分析某种劳务产品完成量与其单位产品成本之间的 关系,调查30个同类服务公司得到的原始数据如表。
完成量(小时)
20 30 20 20 40 30 40 80 80 50 40 30 20 80 50 单位成本(元/小时) 18 16 16 15 16 15 15 14 14 15 15 16 18 14 14
16 900 22 500 24 025 19 600 22 500 23 716 27 225 28 900 27 889 32 400 30 625 34 225 310 505
32
根据表中资料:
L yy x
2
x
n
2
1025 101835
12
2
142829167 .
r= x
2 xy y
x x y y
xx yy
2
2
=
L xy L xx L yy
28
可化简为:
L xx x x
2
x
2
x 2
n
L yy= y y
2
y2
y 2
n
x y L xy = x x y y = xy n
3
(1)是一一对应的确定关系; (2)设有两个变量 x 和 y , 变量 y 随变量 x 一起变化, y 并完全依赖于 x ,当变量 x 取某个数值时, y 依确 定的关系取相应的值,则 称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变 量,y 称为因变量; x (3)各观测点落在一条线上。
38
(三)相关系数有正负号,表示正相关或负相关 (四)相关系数的计算对资料有一定要求,相关 的两个变量必须都是随机的,这也反映对等关系
相关系数的计算与应用有其独立意义,可直
接从给定资料计算,可不经过回归分析。
39
第三节
回归分析
一、回归分析的概念与特点
(一)回归分析的概念
根据现象之间相关关系的形式,配合一条最适合 的直线或曲线(本章只介绍直线),用这条直线,反映 它们之间数量变化的一般关系,即当自变量发生一个 量的变化时,因变量一般会(或平均会)发生多大量的
31
例: 以下表的数据为例,计算12个企业产量与生产 费用之间的简单相关系数。
企业编号 1 2 3 4 5 6 7 8 9 10 11 12 合计 产量x 40 42 50 55 65 78 84 100 116 125 130 140 1 025 生产费用y 130 150 155 140 150 154 156 170 167 180 175 185 1 921
完成量(小时)
20 50 20 30 50 20 50 40 20 80 40 20 50 80 30 单位成本(元/小时) 16 16 18 16 15 18 15 14 16 14 15 16 14 15 15
整理后有
完成量(小时)
20 20 20 20 20 20 20 20 20 30 30 30 30 30 40 单位成本(元/小时) 15 16 16 16 16 18 18 18 18 15 15 15 16 16 14
完全正相关
-1.0
-0.5
0
+0.5
正相关程度增加
+1.0
r
负相关程度增加
37
三、简单线性相关分析的特点 (一)两个变量是对等关系 直线相关分析所研究的两个变量不分彼此不反 映任何自变量和因变量的关系,而是完全对等的。 (二)只能算出一个相关系数 相关系数是一个绝对值在0与1之间的系数,其 值大小反映两变量间相关的密切程度。由于两变量 的关系是对等的,改变两者的地位不影响相关系数 的数值,所以只有一个相关系数。
x 不相关
21
第二节
简单线性相关分析
一、相关关系的一般判断
是依据研究者的理论知识和实践经验,对客观 现象之间是否存在相关关系,以及何种关系作 出判断。 在定性分析的基础上,通过编制相关表、绘制 相关图、计算相关系数等方法,来判断现象之 间相关的方向、形态及密切程度。
22
定性分析
定量分析
相关表
将自变量x的数值按照从小到大的顺序,并配合 因变量y的数值一一对应而平行排列的表。