5.8 第五章 回归分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节 一元线性回归分析
二、一元线性回归 2. 一元线性回归方程 描述y的均值E(y)与 x的关系的方程叫做回归方 程。 E ( 1 ) 1 , E ( ) 0 由于 E ( 0 ) 0 , 所以 E ( y) 0 1 x 不难看出,简单线性回归方程的图形是一条直线。 这条直线被称为总体回归直线。 0 是回归直线的截 距, 1 是回归直线的斜率,E(y)是给定某个x的值y的 均值或期望值。 各实际观测点与总体回归线垂直方向的间隔,就是 随机误差项ε,即 y E ( y)
相 关 系 数 ( coefficient of product – moment
correlation),或 Pearson 相关系数(软件中常用 此名称) 说明相关的密切程度和方向的指标。
r ——样本相关系数
第一节 相关分析
(一)相关系数
2. 简单相关系数的计算
现象间相关的形式特点不同,相关系数的计算方法也不同。 直线相关系数(简称相关系数.)——是对两个变量之间 线性相关程度的度量。
20 30 20 20 40 30 40 80 80 50 40 30 20 80 50 单位成本(元/小时) 18 16 16 15 16 15 15 14 14 15 15 16 18 14 14
完成量(小时)
20 50 20 30 50 20 50 40 20 80 40 20 50 80 30 单位成本(元/小时) 16 16 18 16 15 18 15 14 16 14 15 16 14 15 15
第一节 相关分析
(二)相关关系(非确定型关系) 指事物之间的关系数值存在着一定的依存关 系,但它们不是确定的和严格依存的,某一现象 在其发展变化中,当数量上为一确定值时,与之 有联系的其他现象可以有若干个数值与之对应, 在这些数值之间表现出一定的波动性,但这些值 按某种规律在一定范围内变化。
第一节 相关分析
二、一元线性回归 1. 一元线性回归模型及基本假定
假定因变量y主要受自变量x的影响,它们之间的 简单线性回归模型如下 : y 0 1 x 0、1为参数, 为随机误差项。 对于误差项,在回归分析中有如下假设: (1)误差项是随机变量,它的期望值为0; (2)对于所有的x值,误差项的方差 2 为常数; (3)误差项之间相互独立,即与一个值相联系的误 差对与另一个值相联系的误差没有影响; (4)随机误差项服从正态分布。
第一节 相关分析
二、相关关系的种类
线性相关
(一)按相关形式不同 非线性相关
正相关 (二)根据相关方向划分(在直线相关中) 负相关
第一节 相关分析
完全相关 (三)按相关的程度
不完全相关 不相关(零相关)
单相关 (四)根据相关关系涉及变量的多少 复相关 偏相关
第一节 相关分析
三、相关分析
主要内容 1.确定现象之间有无相关关系。 主要通过定性分析判断和相关图、相关表观察得出结 论。这是相关分析的出发点。 2.确定相关关系的表现形式。 若存在相关关系,就需进一步确定相互关系的表现形 式。例如,是线性相关还是非线性相关,这时相关分析的主 要内容。 3.确定相关关系的密切程度和方Fra Baidu bibliotek。 通过相关分析,可以判定现象之间相关关系的密切程度和 方向。例如,变量之间是完全相关、不完全相关还是完全不 相关。
最小二乘法的基本原理就是寻一条总的看来离各散点 最近的一条直线,使实际值y 与 相应的理论值 差达到最小。即:
2、变量 x、 变量 y处于 平等地位。 3、变量 x 和 y 都是随机 变量
Y是因变量,是随机变量; x 是自变
量,是确定变量。可以建立y依x或 x依y两个回归方程。
4、可以计算一个相关系数。 相关系数取值范围在 0到正负1之间
可以计算两个回归系数。回归系数 取值可为正负数、且取值范围不限
第二节 一元线性回归分析
三、相关分析

(一)相关系数


1.简单相关系数的含义:反映密切程度和方向
2.简单相关系数的计算 3.相关系数的性质

(二)决定系数 (三)相关表和相关图


1. 相关表
2. 相关图
第一节 相关分析
(一)相关系数
1.简单相关系数的含义
相关系数 (correlation coefficient) ,又称积差
第一节 相关分析 图5-1 广告费与年销售收入之间的相关图
相关图









完全正线性相关

正线性相关
非线性相关








完全负线性相关
完成量(小时)
整理后有
20 20 20 20 20 20 20 20 20 30 30 30 30 30 40 单位成本(元/小时) 15 16 16 16 16 18 18 18 18 15 15 15 16 16 14
完成量(小时)
40 40 40 40 50 50 50 50 50 50 80 80 80 80 80 单位成本(元/小时) 15 15 15 16 14 14 15 15 15 16 14 14 14 14 15
第一节 相关分析
(二)决定系数
是相关系数的平方,用 r 2表示;用来衡量回归 方程对y的解释程度。
决定系数取值范围: 0 r 1
2
r 越接近于 1 ,表明 x 与 y 之间的 2 相关性越强; r 越接近于0,表
明两个变量之间几乎没有直线相 关关系。
第一节 相关分析
2
SPxy/SSx是以x为自变量、y为依变量时的回归
2
2
SP SS x SS y n xy x y
或r
n x 2 ( x ) 2 n y 2 ( y ) 2
第一节 相关分析
(一)相关系数
3.相关系数的性质 ① 相关系数r的取值范围:-1≤r≤1 ② r>0 为正相关,r < 0 为负相关; ③ |r| 越趋于 1 ,表示关系越密切; |r| 越趋于 0 , 表示关系越不密切。|r|=0, 无相关; |r|=1, 完全相关。 ④ 相关程度的习惯划分法: 0 < |r|<0.3, 微弱相关 0.3 ≤|r|<0.5, 低度相关 0.5 ≤|r|<0.8, 显著相关 0.8 ≤|r|<1, 高度相关
系数byx。 若把y作为自变量、x作为依变量 ,则
回归系数 bxy =SPxy/SSy ,所以决定系数r2等于y
对x的回归系数与 x对y的回归系数的乘积。这就
是说,决定系数反映了x为自变量、y为依变量和
y为自变量、x为依变量时两个相关变量x与y直线 相关的信息 ,即决定系数表示了两个互为因果 关系的相关变量间直线相关的程度。但决定系 数介于 0 和 1 之间,不能反映直线关系的性质 — 是同向增减或是异向增减。
回归分析的特点: 1.回归分析的两个变量是非对等关系; 2.回归分析中,因变量是随机变量,自变量
是可控制变量。
回归分析的内容: 1.确定现象之间相关关系的数学模型; 2.测定数学模型的拟合精度。
回归分析与相关分析的区别
相关分析 1、主要描述两个变 量之间相 关的方向和密切程度 回归分析 确定因变量y 和自变量x之间数量 变动关系的数学表达式,并对因变 量进行预测 变量y 和变量x不是对等关系。
(二)相关关系(非确定型关系)
(1)变量间关系不能用函数关系精确表达; (2)一个变量的取值不能由另一个变量唯一 确定; (3)当变量 x 取某个值时,变量 y 的取值可 能有几个;
第一节 相关分析
相关关系的例子
商品的消费量(y)与居民收入(x)之间的关系
商品的消费量(y)与物价(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、 温度(x3)之间的关系 收入水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系
第一节 相关分析
函数关系的例子
某种商品的销售额 (y) 与销售量 (x) 之间的关 系可表示为 y = p x (p 为单价); 圆的面积(S)与半径之间的关系可表示为S = r2 ;
企业的原材料消耗额(y)与产量(x1) 、单位产 量消耗 (x2) 、原材料价格 (x3)之间的关系可 表示为y = x1 x2 x3 。
特点: ①相关系数有正负号。 ②分析时,两个变量是对等的。(不分自变量 和因变量,两者互换不影响计算结果。) ③抽样时,两个变量都是随机变量。 此外还有复相关系数、非线性相关系数等。
第一节 相关分析
相关系数的计算公式(皮尔逊相关系数)
r
( x x)( y y) ( x x ) y y
第五章
回归分析
2014-11-19
教学目的与要求
1.
2. 3. 4.
正确理解相关关系的含义、种类及相关分 析的主要内容; 掌握相关关系的测定方法; 掌握回归分析的含义和内容; 掌握一元线性回归分析方法。
一、函数关系与相关关系
(一)函数关系(确定性关系) 函数关系指现象间在数量上存在着确定的、 严格对应的依存关系。 特点:对于某一变量的每一个数值,都有另 一个变量的确定的值与之相对应,并且这种关系 可以用精确的数学函数式表示出来,因此称为函 数关系。
第一节 相关分析
负线性相关
不相关
第二节 一元线性回归分析
一、回归分析的概念与种类
相关分析中的相关系数可以从数量上说明变量之间相关 关系的方向和密切程度。但它不能反映一个变量发生一定数 量的变化时,另一个变量会相应的发生多少变动。为了解决 这个问题,就必须采用回归分析的方法。 回归分析是指对具有相关关系的变量,依据其关系形 态,选择一个合适的数学模型,用来近似的表示变量之间数 量平均变化关系的一种统计方法。 回归分析的内容很多,按分析变量的多少不同,可分为 一元回归分析和多元回归分析;按分析变量的表现形态不 同,可分为线性回归分析与非线性回归分析等。本节只讨论 一元线性回归分析的理论与方法。
如果因变量y与自变量x的相关关系是近似直线
的关系,则一元线性回归的模型为:
ˆ a bx y ˆ ——y的估计值或预测值, y
a.b ——截距,回归系数。
确定了a与b的值,直线的位置也就相应地确定了。
第二节 一元线性回归分析
二、一元线性回归 3.参数估计-最小二乘法 设有一组试验数据(如表),若x,y符合线性关系 x y x1 y1 x2 y2 …… …… xn yn
第一节 相关分析
三、相关分析
相关关系的一般判断
是依据研究者的理论知识和实践经验,对客观 现象之间是否存在相关关系,以及何种关系作 出判断。 在定性分析的基础上,通过编制相关表、绘制 相关图、计算相关系数等方法,来判断现象之 间相关的方向、形态及密切程度。
定性分析
定量分析
第一节 相关分析
第一节 相关分析
完成量(小时)
第一节 相关分析
相关图
30 广告费(万元) 年销售收入(百万元) 12
33 12
33 12
40 13
56 14
58 14
65 20
72 22
80 26
80 26
90 30
销售收入 (百万
40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100
元)
广告费(万元)
第一节 相关分析
(一)函数关系(确定性关系)
(1)是一一对应的确定关系; (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变 化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数, 记为 y = f (x),其中 x 称为自变量,y 称为因变 量;
(三)相关表和相关图
相关表——将一个变量按大小顺序排序,另一个 变量对应排列而成的表格。 相关图——也称为散点图。一对数据对应坐标图 上一个点,将成对的观察数据表现为坐标图 的散点而形成的图。 编制相关表、图的意义——有助于分析者直观 判断相关的有无、方向、形态、密切程度。
第一节 相关分析
相关表 例:为了研究分析某种劳务产品完成量与其单位产品成本之间的 关系,调查30个同类服务公司得到的原始数据如表。
相关文档
最新文档