统计学 第六章 相关与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非线性相关
完全正线性相关
完全负线性相关
负线性相关
不相关
正线性相关
二、相关分析
相关分析:
是研究一个变量(设为y)与其它变量
(设为x或xi , i 1,2,, n)
n
x)2
2 y)
n
Lxy n xy ( x) ( y)
Lxx n x 2 ( x ) 2
r
Lxy Lxx L yy
L yy n y 2 ( y)2
计算相关系数 的“积差法”
例1.某企业10名工人的工龄和年工资资料如下:
1 2 3 4 5 6 7 8 9 10 职工编号 4 4 5 6 7 8 8 9 9 10 工龄X(年) 工资Y(百元) 42 46 50 60 64 68 74 72 80 84
2.按相关的形式可划分为: 线性相关,非线性相关
(1)当两种相关现象之间的关系大致呈现为 线性关系时,称之为线性相关。 (2)当两种相关现象之间的关系不表现为直 线关系,而是近似于某种曲线方程的关系, 则这种相关关系称为非线性相关。
(1)
(2)
(3)
(4)
图中()、()为线性相关,()、()为非线性相关。 1 2 3 4
完成量(小时)
20 30 20 20 40 30 40 80 80 50 40 30 20 80 50 单位成本(元/小时) 18 16 16 15 16 15 15 14 14 15 15 16 18 14 14
完成量(小时)
20 50 20 30 50 20 50 40 20 80 40 20 50 80 30 单位成本(元/小时) 16 16 18 16 15 18 15 14 16 14 15 16 14 15 15
单位:元
人均 人均 国民收入 消费金额 1068.8 1169.2 1250.7 1429.5 1725.9 2099.5 643 690 713 803 947 1148
解:根据样本相关系数的计算公式有
r
n xy x y n x
2 2 2
x n y y
4.按相关关系涉及的变量多少可划分为: 单相关,复相关
(1)当只研究两个变量时,它们之间的相关, 称为单相关。 (2)当所研究的是一个变量对两个或两个以 上其他变量的相关关系时,称为复相关。
例如,某种商品的需求与其价格水平以及收入水平之 间的相关关系便是一种复相关。
相关关系的图示
(1)是一一对应的确定关系; (2)设有两个变量 x 和 y ,变量 y 随变量 x 一 起变化,并完全依赖于 x ,当变量 x 取某个 数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自 y 变量,y 称为因变量 (3)各观测点(x,y)落在一条线上
第六章 相关与回归分析
一、目的:在于提供从数量上研究现象之间联系的
分析方法。
二、要求掌握: 1、相关的意义,现象相关的主要形式以及相关分析的基
本内容 2、相关系数的设计原理,怎样利用相关系数来判断现象 相关的密切程度。 3、回归和相关的区别和联系,建立回归方程的根据是什 么?回归方程的参数说明什么; 4、估计标准误差的分析等等
33 33 12 12
40 13
56 58 14 14
65 20
72 80 22 26
80 26
90 30
40 30 20 10 0 0 20 40 60 80 100
广告费(万元)
(三)相关系数及其计算
1.相关系数
早在1890年,英国统计学家皮尔生(Pearson) 便提出了一个测定两个变量线性关系的计算公 式,通常称为积距相关系数。 计算公式:
y
x
3.相关关系举例
相关关系的例子
商品的消费量(y)与居民收入(x)之间的关系
商品的消费量(y)与物价(x)之间的关系
商品销售额(y)与广告费支出(x)之间的关系
粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温 度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系
x
3.函数关系举例
函数关系的例子
某种商品的销售额(y)与销售量(x)之间的关系 可表示为 y = p x (p 为单价) 圆的面积与半径之间的关系可表示为S = r2
企业的原材料消耗额(y)与产量(x1) 、单位产 量消耗(x2) 、原材料价格(x3)之间的关系可表 示为y = x1 x2 x3
要求:计算相关系数,已知条件如下 xy 4754
x 2 532
x 70 y 640
y 2 42816
例2.某企业200名工人的工龄和年工资资料如下, 计算两者的相关系数,已知条件如下:
( x x)( y y ) 112 ( x x ) 2 260 ( y y ) 2 122 x 600 y 340
二、相关关系的种类
相关关系 按相关程度分类 按相关方向分类 按相关形式分类
按所研究变量多少分类
1.按相关的程度可划分为: 完全相关,不完全相关和不相关
(1)完全相关:当一种现象的数量变化完全 由另一种现象的数量变化所确定时,称这两 种现象间的关系为完全相关。 (2)不相关:当两种现象互不影响,其数量 变化各自独立时,称为不相关现象。 (3)两种现象之间的关系介于完全相关和不 相关之间,称为不完全相关。
4.相关程度评价标准
0<|
r |≤0.3为微弱相关
r |≤0.5为低度相关 r |≤0.8为显著相关 r |≤1为高度相关
0.3<| 0.5<|
0.8<|
三、相关分析与回归分析
(一)概念:
1.相关分析
就是用一个指标来表明现象间相互依存 关系的密切程度。 广义的相关分析包括相关关系的分析 (狭义的相关分析)和回归分析。 是指对具有相关关系的现象,根据其相 关关系的具体形态,选择一个合适的数 学模型(称为回归方程式),来近似地 表达变量间的平均变化关系的一种统计 分析方法。
2 2 2
或化简为 r
n xy x y
2
r
( x x )( y y) ( x x )2
1 x y ( x x )( y y) xy n
2 ( y y)
( x x )2
2 ( y y)
21( x
21( y
2.回归分析
(二)相关分析与回归分析的关系
1.区别
(1)在相关分析中,不必确定自变量和因变量; 而在回归分析中,必须事先确定哪个为自变量, 哪个为因变量,而且只能从自变量去推测因变 量,而不能从因变量去推断自变量。 (2)相关分析不能指出变量间相互关系的具体 形式;而回归分析能确切的指出变量之间相互 关系的具体形式。
整理后有
完成量(小时)
20 20 20 20 20 20 20 20 20 30 30 30 30 30 40 单位成本(元/小时) 15 16 16 16 16 18 18 18 18 15 15 15 16 16 14
完成量(小时)
40 40 40 40 50 50 50 50 50 50 80 80 80 80 80 单位成本(元/小时) 15 15 15 16 14 14 15 15 15 16 14 14 14 14 15
2.联系
它们不仅具有共同的研究对象,而且在具体应用 时,常常必须互相补充。 相关分析需要依靠回归分析来表明现象数量相关 的具体形式,而回归分析则需要依靠相关分析来 表明现象数量变化的相关程度。 只有当变量之间存在着高度相关时,进行回归分 析寻求其相关的具体形式才有意义。 简单说:1、相关分析是回归分析的基础和前 提;2、回归分析是相关分析的深入和继续。
在定性分析的基础上,通过编制相 关表、绘制相关图、计算相关系数 等方法,来判断现象之间相关的方 向、形态及密切程度。
定量分析
(一)相关表
相关表是一种反映变量之间相关关系的统 计表。 将自变量x的数值按照从小到大的顺序排 列,然后再将与其相关的因变量y的对应 数值平行排列,便可形成简单的相关表。
例:为了研究分析某种产品完成量与其单位产品成本 之间的关系,调查30个同类公司得到的原始数据如表。
第六章 相关与回归分析
第一节 相关分析
第二节 一元线性回归分析
第一节 相关分析
一、相关关系的概念和种类 二、相关分析
一、相关关系的概念和种类
一、函数关系与相关关系 (一)函数关系
1. 定义
当一个或几个变量取一定的值时, 另一个变量有确定值与之相对应, 我们称这种关系为确定性的函数 关系。
2.函数关系特点
(二)相关图
相关图也称散点图,是在平面直角坐标系 中,以横轴表示变量 x,纵轴表示变量 y,将两者对应的数值形成的坐标点 (x,y)在图中标出,即可看出变量之间 关系密切程度。如下图 (销售收入与广告费相关图)
销售收入与广告费相关图
30 广告费(万元) 年销售收入(百万元) 12
销售收入 (百万元)
2 xy r x y
式中:分子是两个变量x和y的协方差;分母是两 个变量的标准差。
2.相关关系的测度
(相关系数) 样本相关系数的计算公式 ( x x )( y y ) r 2 2 (x x) ( y y)
n x x n y y
3.按相关的方向可划分为: 正相关,负相关
(1)正相关:两个相关现象间,当一个变量的 数值增加(或减少)时,另一个变量的数值也 随之增加(或减少),即同方向变化。 例如收入与消费的关系。 (2)负相关:当一个变量的数值增加(或减少) 时,而另一个变量的数值相反地呈减少(或增 加)趋势变化,即反方向变化。 例如物价与消费的关系。
r 0.63
【例】在研究我国人均消费水平的问题中,把全国人均消 费额记为y,把人均国民收入记为x。收集到1981~1993年 的样本数据(xi ,yi),i =1,2,…,13,计算相关系数。 表1 我国人均国民收入与人均消费金额数据
年份 1981 1982 1983 1984 1985 1986 1987 人均 国民收入 393.8 419.14 460.86 544.11 668.29 737.73 859.97 人均 消费金额 249 267 289 329 406 451 513 年份 1988 1989 1990 1991 1992 1993
(二)相关关系
1. 定义: 当一个或几个相互联系的变量 取一定数值时,与之相对应的另一变量 的值虽然不确定,但它仍按某种规律在 一定的范围内变化。变量间的这种关系 称为具有不确定性的相关关系。 现象之间客观存在的不严格、不确 定的数量依存关系。
2.相关关系特点
(1)变量间关系不能用函数关系精确表达; (2)一个变量的取值不能由另一个变量唯一确 定;当变量 x 取某个值的时候,变量 y 的取 值可能有几个; (3)各观测点(x,y)分布在某条线的周围。
2
2
13 9156173.99 12827.5 7457 13 16073323.77 12827.5 13 5226399 7457
2
0.9987
人均国民收入与人均消费金额之间的相关系 数为 0.9987
3.相关系数取值及其意义
(1) r 的取值范围是 [-1,1] (2)|r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 (3) r = 0,不存在线性相关关系 (4)-1r<0,为负相关;0<r1,为正相关 (5)|r|越趋于1表示关系越密切;|r|越趋于0表示 关系越不密切
之间相关密切程度与相关方向的一种统计分析方法。
主 要 内 容 包 括
(1)确定现象之间有无相关关系,以及相 关关系的表现形态。 (2)确定相关关系的密切程度。 (3)确定相关关系的数学表达式,即回归 方程 (4)确定估计值的误差。
பைடு நூலகம்
相关关系的判断
定性分析
是依据研究者的理论知识和实践经 验,对客观现象之间是否存在相关 关系,以及何种关系作出判断。