第5章 回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
比较结果表明,以库存资金和广告费用为自变量效果最好。
25
第五节 多元线性回归分析——方法 二(续)
以库存资金和广告为自变量的回归分析报告
10
第一节 回归分析方法概述(续)
回归预测的步骤
第一步,获取自变量和因变量的观测值;
依靠理论与经验确定,选取可以控制的自变量,收集数据
第二步,绘制XY散点图; 第三步,写出带未知参数的回归方程; 第四步,确定回归方程中参数值; 第五步,判断回归方程的拟合优度; 第六步,进行预测。
140000 120000 100000 80000 60000 40000 20000 0
1996年7月 1996年8月 1996年9月 1997年1月 1997年2月 1997年3月 1997年4月 1997年5月 1997年6月 1997年7月 1997年8月 1997年9月 1998年1月 1998年2月 1998年3月 1998年4月 1998年5月 1998年6月 1996年10月 1996年11月 1996年12月 1997年10月 1997年11月
20
第五节 多元线性回归分析——方法二 (续)
月份 库存资金额X1 广告投入X2 (万元) (万元) 1 75.2 30.6 2 77.6 31.3 3 80.7 33.9 4 76 29.6 5 79.5 32.5 6 81.8 27.9 7 98.3 24.8 8 67.7 23.6 9 74 33.9 10 151 27.7 11 90.8 45.5 12 102.3 42.6 13 115.6 40 14 125 45.8 15 137.8 51.7 16 175.6 67.2 17 155.2 65 18 174.3 65.4 员工薪酬总额X3 (万元) 21.1 21.4 22.9 21.4 21.5 21.7 21.5 21 22.4 24.7 23.2 24.3 23.1 29.1 24.6 27.5 26.5 26.8 销售额Y (万元) 1090.4 1133 1242.1 1003.2 1283.2 1012.2 1098.8 826.3 1003.3 1554.6 1199 1483.1 1407.1 1551.3 1601.2 2311.7 2126.7 2256.5
21
第五节 多元线性回归分析——方法 二(续)
销售额与库存资金的关系
2500
y = 11.398x + 171.62 R2 = 0.8906
销售额(万元)
2000 1500 1000 500 0 50 100 150 200
库存资金额(万元)
22
第五节 多元线性回归分析——方法 二(续)
销售额与广告投入的关系
试根据这些数据建立回归模型。然后再进一步根据回归方程预测一个 区内大学生人数为1.6万的店铺的季度销售额。
12
第二节 一元线性回归分析(续)
匹萨店季度销售额与学生人数关系图
25
销售额(万元)
20 15 10 5 0 0 0.5 1 1.5 2 2.5 3
学生数(万人)
13
第二节 一元线性回归分析(续)
11
第二节 一元线性回归分析
【例5-1】 “阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店, 其主要客户群是在校大学生。为了研究各店铺销售额与店铺附近地区 大学生人数之间的关系,随机抽取了十个分店的样本,得到的数据如 下:
ê Ì à Å µ Æ ±º 1 2 3 4 5 6 7 8 9 10 ø Ú ó §ú ý Ç Ä ´ Ñ É Ê ¨ò Ë © £ Í È £ 0.2 0.6 0.8 0.8 1.2 1.6 2 2 2.2 2.6 ¾ È ú Û î ¼ ¶ Ï Ê ¶ ¨ò ª © £ Í Ô £ 5.8 10.5 8.8 11.8 11.7 13.7 15.7 16.9 14.9 20.2
广告投入与销售额 机器设备的使用时间与维修保养费用
回归分析方法——因果关系法的主要类别
一种建立统计观测值之间的数学关系的方法 通过自变量的变化来解释因变量的变化,从而由自变量的取值 预测因变量的可能值
收集两个变量广告投入与销售额的数据,分析二者之间的关系, 利用该关系预测某个广告投入对应的销售额
第一节 回归分析方法概述(续)
确定拟合方程系数值的最小二乘法
原理:因变量估计值与观测值之间均方误差极小
1 n 1 n MSE (Y 'i Yi ) 2 (a bX i Yi ) 2 n i 1 n i 1
极小
a M x bM y
b
(X
i 1
n
i n
M x )(Yi M y )
19
第五节 多元线性回归分析——方 法二
【例5-5】一家皮鞋零售店将其连续18个月的库存占用资金情 况、广告投入的费用、员工薪酬以及销售额等方面的数据 作了一个汇总,这些数据显示在工作表单元格A1:E20(图 5-17)。该皮鞋店的管理人员试图根据这些数据找到销售 额与其它三个变量之间的关系,以便进行销售额预测并为 未来的预算工作提供参考。试根据这些数据建立回归模型。 如果未来某月库存资金额为150万元,广告投入预算为45 万元,员工薪酬总额为27万元,试根据建立的回归模型预 测该月的销售额。
多元线性回归模型的一般形式
Y a b1 X 1 b2 X 2 ... bk X k
多元线性回归预测步骤
第一步,获得候选自变量和因变量的观测值; 第二步,从候选自变量中选择合适的自变量,有几种常用的方法:
最优子集法 向前增选法等
第三步,确定回归系数,判断回归方程的拟合优度; 第四步,根据回归方程进行预测。
y = 28.513x + 260.17 R2 = 0.8374
销售额(万元)
2500 2000 1500 1000 500 0 20 30 40 50 60
70
80
广告投入(万元)
23
第五节 多元线性回归分析——方法 二(续)
销售额与员工薪酬的关系
2500
y = 150.28x - 2146.6 R2 = 0.7096
a. Y与Xk 正线性相关 b. Y与Xk 负线性相关 c. Y与Xk不相关
Y
Y
Y
Xk
Xk
Xk
4
第一节 回归分析方法概述(续)
一元线性回归的拟合线方程
Y a bX
Y
X
利用回归方程进行预测
Yi a bXi
'
5
第一节 回归分析方法概述(续)
最好的拟合线
Y a bX
Y
X
6
3
第一节 回归分析方法概述(续)
自变量与因变量的相关关系
如果决策问题涉及若干个自变量X1, X2 …… Xm ,和因变量Y 每个自变量都有n个观测值,如自变量Xk的观测值有: Xk1, Xk2 …… Xkn对应有n个因变量的观测值, Y1, Y2 …… Yn 以 Xk和Y 为横坐标和纵坐标制作散点图体现二者之间的关系
9
第一节 回归分析方法概述(续)
匹萨店季度销售额与学生人数关系图
21 19
( X ii,yi)i ) (x , Y
^
销售额(万元)
17 15 13 11 9 7 5 0 0.5 1
( X i , Yi )
SSR
SST My
R
2
SSR SST
1.5 2 2.5
学生数(万人)
1 (Yi M Y ) 2 ˆ n 1 SST (Yi M Y ) 2 n SSR R2 3 SST SSR
15
第二节 一元线性回归分析(续)
Northwind Trader 月销售额变化趋势
140000 120000 100000
y = 3456.9x + 16951 R2 = 0.6991
销售额
80000 60000 40000 20000 0 0 5 10 15 20 25
月序号
16
第三节 多元线性回归分析——方 法一
观测值
Βιβλιοθήκη Baidu
预测值
103372.60 99915.74 96458.88
1 2 3
4
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
1997年12月
1998年7月
8
第一节 回归分析方法概述(续)
回归模型的检验
判定系数 R2 用来判断回归方程的拟合优度。 通常可以认为当R2大于0.9时,所得到的回归直线拟合得较好,而 当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。 t 统计量 用来确定因变量和每个自变量之间是否存在显著关系。 如果对于某个自变量,其t统计量的P值小于显著水平(1-置信度、 置信水平),则可认为该自变量与因变量是相关的。 F 统计量 用来确定自变量的全体与因变量之间的关系是否显著。 如果F统计量的P值小于显著水平(1-置信度、置信水平),则可认 为方程的回归效果显著。
(Yi M y ) 2
i 1
在实际操作上,可运用Excel回归分析工具计算系数a和b。
7
第一节 回归分析方法概述(续)
ei Y i Yi
'
1 n 2 1 n MSE ei (Y 'i Yi ) 2 n i 1 n i 1
Northwind Traders公司月销售额观测值及其直线趋势预测值
18
第三节 多元线性回归分析——方法 一(续)
【例5-3】假设未来某月员工的薪酬为25万元,平均户总收入 为33.4千元的情况下,预测该年的销量。
年 员工薪酬(千元) 1 275 2 182 3 376 4 204 5 85 6 267 7 96 8 331 9 196 10 54 11 432 12 373 13 235 14 156 15 372 平均户总收入(千元) 销量(千台) 24.5 1924 32.5 1402 38 2666 28.4 1572 23.5 802 37.8 2026 30.1 970 24.5 2305 21.4 1393 25.6 658 40.2 3021 44.3 2684 26.6 1738 20.9 1246 26.1 2534
17
第三节 多元线性回归分析——方法 一(续)
【例5-3】某一生产空调的企业将其连续15年的销量和员工的 薪酬及当地的平均户总收入情况的数据作了一个汇总,这 些数据显示在工作表单元格A1:D16中,该企业的管理人员 试图根据这些数据找到销量与其他两个变量之间的关系, 以便进行销量的预测并为未来的预算工作提供参考。试根 据这些数据分析一下,建立何种模型比较合适,并假设未 来某月员工的薪酬为25万元,平均户总收入为33.4千元的 情况下,预测该年的销量。
求回归系数a和b的方法:
规划求解 INTERCEPT()和SLOPE()函数 LINEST()函数 回归分析报告 散点图添加趋势线 RSQ()函数 回归分析报告 趋势线
14
求判定系数R2的方法:
第二节 一元线性回归分析(续)
【例5-2】试根据Northwind Trader公司在1996年7 月4日至1998年5月8日期间各种商品的销售额数据 建立线性回归模型,然后再进一步根据回归方程 预测该公司1998年5月和6月的月销售额。
第五章 回归分析
上海财经大学 信息管理与工程学院 计算机应用课程组
内容简介
基础篇
回归分析方法概述 一元线性回归分析 利用规划求解解决一般非线性回归问题的方法
提高篇
多元线性回归分析 将非线性问题转换成线性问题求解的非线性回归分析方法
2
第一节 回归分析方法概述
预测
移动平均、趋势、季节指数模型方法——外推法 基于两个或多个决策变量之间的依赖关系进行预测——因果关系 法
销售额(万元)
2000 1500 1000 500 0 20 22 24 26 28 30
员工薪酬总额(万元)
24
第五节 多元线性回归分析——方法 二(续)
用最优子集法作自变量筛选
G 2 3 4 5 6 7 8 9 自变量集 库存资金 广告 薪酬 库存资金、广告 广告、薪酬 库存资金、薪酬 库存资金、广告、薪酬 X1 X2 X3 X1、X2 X2、X3 X1、X3 X1、X2、X3 H I J R平方 调整后R平方 0.891 0.884 0.837 0.827 0.710 0.691 0.957 0.952 0.870 0.852 0.898 0.885 0.957 0.948