经济管理中的计算机应用 第五章 回归分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15
10
5
0
0
0.5
1
1.5
2
2.5
3
学生数(万人)
10
【例5-2】在工作表的A、B和C三列中列出了Northwind Trader公司在 1996年7月4日至1998年5月6日期间各种商品的销售额数据(图5-14)。试 根据这些数据建立线性回归模型。然后再进一步根据回归方程预测该公司 1998年5月和6月的月销售额。
10 11
8 9
67.7 74
23.6 33.9
21
826.3
2wk.baidu.com.4
1003.3
型。如果未来某月库存资金额
12 13
10 11
性回归模型的建立方法。 将非线性问题变换成线性问题来求解的非线性
回归分析方法。
2
回归分析的概念 回归分析原理简介 回归模型的检验 回归预测的步骤与方法
3
回归分析方法 一种建立统计观测值之间的数学关系的方法; 通过自变量的变化来解释因变量的变化,从而由自 变量的取值预测因变量的可能值。
8
【例5-1】 “阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店, 其主要客户群是在校大学生。为了研究各店铺销售额与店铺附近地区大学 生人数之间的关系,随机抽取了十个分店的样本,得到的数据如下:
µê ÆÌ ± à ºÅ
1 2 3 4 5 6 7 8 9 10
Çø ÄÚ ´ó ѧÉú Êý £¨Íò ÈË £© 0.2 0.6 0.8 0.8 1.2 1.6 2 2 2.2 2.6
t 统计量
对于某个自变量,如果其t统计量的P值小于显著水平 (1-置信度),则可认为该自变量与因变量是相关的。
F 统计量
对于多个自变量,如果其F统计量的P值小于显著水平 (1-置信度),则可认为方程的回归效果显著。
7
回归预测的步骤
第一步,获取自变量和因变量的观测值; 第二步,绘制XY散点图; 第三步,写出带未知参数的回归方程; 第四步,确定回归方程中参数值; 第五步,判断回归方程的拟合优度; 第六步,进行预测。
Y a b1 X1 b2 X 2 ... bk X k
多元线性回归预测步骤
第一步,获得候选自变量和因变量的观测值; 第二步,从候选自变量中选择合适的自变量,
几种常用的方法:
最优子集法 向前增选法等
第三步,确定回归系数,判断回归方程的拟合优度; 第四步,根据回归方程进行预测。
4 5
2 3
77.6 80.7
31.3 33.9
21.4
1133
22.9
1242.1
行销售额预测并为未来的预算
6 7
4 5
76 79.5
29.6 32.5
21.4
1003.2
21.5
1283.2
工作提供参考。
86
81.8
27.9
97
98.3
24.8
21.7
1012.2
21.5
1098.8
试根据这些数据建立回归模
13
二元线性回归方程:
Y ' 105.44 5.93X 1 8.65X 2
销量预测值: 回归方程截距 斜率1(对应员工薪酬) 斜率2(对应平均户总收入) 员工薪酬 平均户总收入 销量预测值(千台)
105.44 5.92 8.65 250 33.4
1874.5
14
【例5-4】一家皮鞋零售店将其连续18个月的库存占用资金
12
【例5-3】某一生产空调的企业将其连续15年的销量和员工 的薪酬及当地的平均户月收入情况的数据作了一个汇总, 如下表所示:
年 员工薪酬(千元)
1
275
2
182
3
376
4
204
5
85
6
267
7
96
8
331
9
196
10
54
11
432
12
373
13
235
14
156
15
372
平均户总收入(千元)
24.5 32.5 38 28.4 23.5 37.8 30.1 24.5 21.4 25.6 40.2 44.3 26.6 20.9 26.1
情况、广告投入的费用、员工薪酬以及销售额等方面的数
据作了一个汇总,数据如下表所示:
该皮鞋店的管理人员试图根 A
B
C
D
E
1 月份 库存资金额X1 广告投入X2 员工薪酬总额X3 销售额Y
据这些数据找到销售额与其它 2 31
(万元) (万元)
75.2
30.6
(万元) 21.1
(万元) 1090.4
三个变量之间的关系,以便进
销量(千台)
1924 1402 2666 1572 802 2026 970 2305 1393 658 3021 2684 1738 1246 2534
该企业的管理人员试图根 据这些数据找到销量与其他 两个变量之间的关系,以便 进行销量的预测并为未来的 预算工作提供参考。试根据 这些数据分析一下,建立何 种模型比较合适,如果未来 某月员工的薪酬为25万元, 平均户月收入为33.4千元, 预测该年的销量。
自变量与因变量的相关关系
a. Y与Xk正线性相关
b. Y与Xk负线性相关
c. Y与Xk不相关
Y
Y
Y
Xk
Xk
Xk
4
一元线性回归的拟合线方程
Y a bX
Y X
5
回归模型的检验
判定系数 R2
用来判断回归方程的拟合优度。 通常当R2大于0.9时,所得到的回归直线拟合得较好, 而当R2小于0.5时,所得到的回归直线很难说明变量之 间的线性依赖关系。
140000.00 120000.00 100000.00
80000.00 60000.00 40000.00 20000.00
0.00 0
月销售额趋势
y = 3456.9x + 16951 R² = 0.6991
99915.802 96458.938
5
10
15
20
25
30
月序号
11
多元线性回归模型的一般形式
¼¾ ¶È Ïú ÊÛ ¶î £¨Íò Ôª £© 5.8 10.5 8.8 11.8 11.7 13.7 15.7 16.9 14.9 20.2
试根据这些数据建立回归模型。然后再进一步根据回归方程预测一个区内 大学生人数为1.6万的店铺的季度销售额。
9
匹萨店季度销售额与学生人数关系图
25
20
销售额(万元)
上海财经大学 信息管理与工程学院
回归分析的概念、相关性概念、最小二乘法, 以及回归模型的统计检验等基本原理。
Excel中的规划求解和回归分析报告等回归分 析工具的使用方法。
一元线性回归问题的各种分析方法。 利用规划求解工具解决一般非线性回归问题的
方法。 多元线性回归问题的自变量筛选方法和多元线