第八章相关分析与回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、回归分析与相关分析的区别与联系
(一)区别 1.相关分析两个变量是对等的,不分自变量和因变量; 回归分析两个变量不是对等的,要区分自变量和因变 量。 2.相关分析计算的相关系数,只能反映变量之间关系 的方向和紧密程度,不能估计推算具体的数值;回归 分析可以根据回归方程,用自变量数值推算因变量的 估计值。 3.相关分析两个变量必须都是随机的;回归分析因变 量是随机变量,自变量不是随机的,是给定的数值。
要求:⑴ 计算该工业企业的工业增加值与利润额的相关系数。 ⑵ 根据相关系数说明其相关关系属于哪种类型?其相关关系的密切程度如何? ⑶ 求出利润额倚工业增加值的回归直线方程。 ⑷ 说明工业增加值每增加一万元时,利润额平均增加多少元?
⑸ 若2006年工业增加值为80万元,试估计其利润额。
1.下列直线回归方程中,( )是错误的。
第一节 相关关系的概念和种类
一、概念
1. 函数关系(function relationship):是指现象 之间的一种确定的数量 依存关系。
y x
Leabharlann Baidu
2.相关关系(correlation relationship):是指现象 之间的一种不完全确定 的关系。
y
x
二、种类
1.按相关因素的多少,分为单相关和复相关 2.按相关的表现形式,分为线性相关和非线性 相关 3.按相关的密切程度,分为完全相关、完全不 相关和不完全相关 4. 按相关关系的方向,分为正相关和负相关
xy
74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0 4544.6
第三节 直线回归分析
一、回归分析的概念 回归分析(analysis of regression)是指对具
有相关关系的变量,选择一个合适的数学模型, 用自变量的数值,推断出因变量的可能值的一种 统计方法。
第八章 相关分析与回归分析
第一节 相关关系的概念和种类 第二节 相关表、相关图与相关系数 第三节 直线回归分析 第四节 直线回归方程的拟合与检测
本章基本要求
了解相关关系的概念和种类; 理解相关关系的判断以及相关分析与回归分析
的区别和联系; 熟练掌握直线相关系数、一元线性回归模型以
及估计标准误差的计算。
③ x增加10,Yc增加2.5
④ x为10,Yc等于502.5
⑤ 0.25是回归系数
本章思考题
1. 回归分析与相关分析的区 别是什么?
2. 在直线回归方程yc=a+bx 中,参数a和b的几何意义 和经济意义是什么?
估计标准误差是因变量的实际值与 其估计值离差的平均数。它是用来说明 回归方程代表性大小的统计分析指标。
(二)估计标准误差的计算
某工业企业2001~2005年工业增加值和利润额资料如下:
年份 2001 2002 2003 2004 2005
工业增加值(万元) 65 70 75 65 75
利润额(万元) 12 14 15 13 16
(二)联系 1.相关分析是回归分析的基础和前提 2.回归分析是相关分析的深入和继续 三、回归分析的内容
(一)建立相关关系的回归方程 (二)测定回归方程的拟合精度
第四节 直线回归方程的拟合与检测
一、一元线性回归方程(equation of one-variable linear regression)
yc abx
式中:x — 自变量, y — 因变量的估计值 a — 截距 b — 斜率
企业产量与生产费用回归计算表
企业 编号
1 2 3 4 5 6 7 8 合计
月产量(千吨)
x
1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 36.4
生产费用(万元)
y
62 86 80 110 115 132 135 160 880
(二)相关系数的意义
相关系数取值及其意义图示如下:
完全负相关
无线性相关
完全正相关
-1.0 -0.5
负相关程度增加
0 +0.5 +1.0
r
正相关程度增加
(三)相关系数的测定方法
企业产量与生产费用相关计算表
企业 编号
1 2 3 4 5 6 7 8 合计
月产量(千吨) 生产费用(万元)
x
y
1.2
62
第二节 相关表、相关图与相关系数
一、相关表与相关图 (一)相关表(correlation table) (二)相关图(correlation diagram)
二、相关系数 (一)相关系数的概念
相关系数(correlation coefficient)是在直线相 关条件下,用来反映相关关系密切程度的统计分 析指标。
估计值
yc
66.80
(y yc)2
23.04
77.12 78.85
91.30 127.69
100.33 93.51
115.80 0.64
129.99 4.04
144.17 84.09
154.49 30.36
880.00 442.22
二、估计标准误差 (standard error of estimate) (一)估计标准误差的概念
x2
1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 207.54
y2
3844 7396 6400 12100 13225 17424 18225 25600 104214
xy
74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0 4544.6
2.0
86
3.1
80
3.8
110
5.0
115
6.1
132
7.2
135
8.0
160
36.4
880
x2
1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 207.54
y2
3844 7396 6400 12100 13225 17424 18225 25600 104214
① y=30+0.2x,r=0.8
② y=-75+1.5x,r=0.91
③ y=5-2.1x,r=0.78
④ y=-12-3.5x,r=-0.96
2.如果直线回归方程为Yc=500+0.25x,则说明(
)
① x每增加一个单位,Yc平均增加0.25个单位
② x每增加一个单位,Yc平均减少0.25个单位