数据模型与决策概述PPT(37张)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t Stat 2.48
12.58
P-value 0.03 0.00
Lower 95% 1.67
40.18
Upper 95% 25.98 57.01
输出结果解读
相关系数r=0.964,已经足够大,说明X与Y之间有 很强的相关性,可以研究回归关系;
误差分布N(0,σ2) 中的σ=9.106; 模型检验:F对应的P值=2.84×10-8 <0.05,应该拒
线性部分反映了由于 x 的变化而引起的 y 的变化
误差 e 是随机变量,通常假设服从正态N(0,σ2)
b0 和 b1称为模型的参数
最小二乘法
n
n
Q(bˆ0,bˆ1) ( yi yˆ)2 ei2 最小
i 1
i 1
最小二乘法的几何解释
最小二乘解
n
n n
n xi yi xi yi
绝原假设(注意:原假设是所以系数全为0); 系数检验:两个P值分别是0.03和0,说明截距和
数据、模型与决策
第六讲 回归模型
一名优秀的管理者具有的最重要的技能之一就是洞 察商务数据的趋势以及基于这种趋势进行精确预测 的能力。
依据历史数据及行业趋势,预测销售额、盈利、成 本、金融工具和金融产品的价格走势
本章介绍一种强有力的基于数据的线性回归预测模 型,其目标是建立一个变量(Y=生产成本)与其它 相关变量(X1=劳动时间、X2=设备支出、X3=人力 成本等)之间变化关系的具体公式。
广告支出(百万)Xi 1.8 1.2 0.4 0.5 2.5 2.5 1.5 1.2 1.6 1.0 1.5 0.7 1.0 0.8
第一年销售额(百万)Yi 104.0 68.0 39.0 43.0 134.0 127.0 87.0 77.0 102.0 65.0 101.0 46.0 52.0 33.0
bˆ1
i 1
i1 i1
n
n
xi2
n
xi
i 1
i1
bˆ0 y ˆ1x
Excel-数据分析-回归
回归统计 Multiple R R Square Adjusted R Square 标准误差
观测值
0.964 0.930 0.924 9.106
14
方差分析
回归分析 残差 总计
销售额
150.0
销售额与广告费的关系
100.0
50.0
0.0
0.0
0.5
1.0
1.5
2.0
Fra Baidu bibliotek
2.5
3.0
广告费支出
广告费用与销售额数据
利用Excel回归分析功能,得到预测方程
销售额与广告费的关系
160.0 140.0 120.0 100.0
80.0 60.0 40.0 20.0
0.0
y = 48.597x + 13.824 R2 = 0.9296
需要掌握Excel或SPSS软件。
回归模型
例 广告支出与销售额
John Brode是J&T产品的营销经理,这是一家大型家用 产品制造商,公司推出一种Apple-Glo的新产品,它是 一种安全的家用清洁剂该产品已经被引进到东北销售 区域,并在最近两年中花费了大量广告活动费用,见 下表。
假设John对销售额与广告效果的分析感兴趣,他正在 考虑把Apple-Glo产品引进到两个新区域,其中一个区 域的广告费用高达200万美元,而另一个区域为150万 美元,John想要预测Apple-Glo产品在这两个区域中每 个区域第一年销售额的期望值。
广告费用与销售额数据
日期 Jan-94 Feb-94 Mar-94 Apr-94 May-94 Jun-94 Jul-94 Aug-94 Sep-94 Oct-94 Nov-94 Dec-94 Jan-95 Feb-95
区域 缅因州 新罕布什尔州 佛蒙特州 马萨诸塞州 康涅狄格州 罗德岛 纽约州 新泽西州 宾夕法尼亚州 特拉华州 马里兰州 西弗吉尼亚州 弗吉尼亚州 俄亥俄州
广告费用与销售额数据
John想了解如下问题: 第一年的广告费用和第一年的销售额之间
的关系如何?存在与这两个数量值有关的 等式吗? 如果广告支出为150美元或200美元,那么第 一年的销售额的期望值分别为多少?
关于销售额估计的可靠性是多少?预测效 果如何?
广告费用与销售额数据
利用Excel绘图功能,画出下列图形
0.0
0.5
1.0
1.5
2.0
2.5
3.0
广告费支出
销售额
初步结论
预测方程为Y= 48.597x + 13.824; 得到x=150万,Y=86.72万; x=200万,Y=111.02万。
R2 = 0.9296,得出两个结论: 一是模型拟合数 据的效果是92.96%,话句话说,模型在多大程 度上解释了数据呢,答案是92.96%,不能解释 的部分为7.04%;另一个结论是,R=0.964,说 明广告支出与销售额关系非常密切。
孩子身高与父母身高的相关系数有多大
相关系数为 0.75
男孩成年身高=(父身高+母身高+13) ÷2 ± 7.5厘米 女孩成年身高=(父身高+母身高 -13) ÷2 ± 6.0厘米
两种趋势的回归模型
一元线性回归模型
一个自变量的简单线性回归模型可表示为
y = b0 + b1 x + e
模型中,y 是 x 的线性函数(部分)加上误差项
df 1.00
12.00 13.00
SS 13130.94
995.06 14126.00
MS 13130.94
82.92
F
Significance F
158.35
2.8433E-08
Intercept X Variable 1
Coefficients 13.82 48.60
标准误差 5.58 3.86
一元回归理论
对于一个因变量和一个自变量,先考察它们的 相关系数r,在Excel中的函数是corr(X,Y)
只有相关系数足够大,才去研究它们回归关系
趋向中间高度的回归
回归这个术语是由英国著名统计学家Francis Galton 在19世纪末期研究孩子及他们的父母的身高时提出来 的。Galton发现身材高的父母,他们的孩子也高。但 这些孩子平均起来并不像他们的父母那样高。对于 比较矮的父母情形也类似:他们的孩子比较矮,但 这些孩子的平均身高要比他们的父母的平均身高高 。 Galton把这种孩子的身高向中间值靠近的趋势称 之为一种回归效应,而他发展的研究两个数值变量 的方法称为回归分析。