数学建模报告公司的销售额预测汇编
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公司的销售额预测
一、问题重述
某公司想用全行业的销售额作为自变量来预测公司的销售量,下表给出了1977—1981年公司的销售额和行业销售额的分季度数据(单位:百万元)
(1)画出数据的散点图,观察用线性回归模型拟合是否合适.
(2)建立公司销售额对全行业的回归模型,并用DW检验诊断随机误差项的自相关性.
(3)建立消除了随机误差项自相关性之后的回归模型.
二、问题分析与假设
销售收入预测的方法主要有时间序列法、因果分析法和本量利分析法等.
时间序列法,是按照时间的顺序,通过对过去几期实际数据的计算分析,确定预测期产品销售收入的预测值.
表1 的数据是以时间顺序为序列的,称为时间序列.由于公司销售额和行业销售额等经济变量均有一定的滞后性,因此,在这样的时间序列数据中,同一变量的顺序观测值之间出现相关现象是很自然的.然而,一旦数据中存在这种自相关序列,如果仍采用普通的回归
模型直接处理,将会出现不良后果,其观测也会失去意义,为此,我们必须先来检验数据是否存在自相关,一旦存在,就要考虑自相关关系,建立新的模型.
定义与符号说明
三、模型建立与求解
一、基本统计回归模型建立
以行业销售额t x 为自变量、以公司销售额t y 为因变量的散点图,其中1,220t =
图1 t y 对t x 的散点图
从图1可以看出,随着行业销售额的增加,公司销售额也增加,而且两者有很强的线性关系,因此可以建立线性回归模型
01t t t y x ββε=++,t ε为随机误差 ()1 假设t ε与t x 是相互独立的,且t ε服从均值为零的正态分布.
由表1的数据以及上述线性回归模型的假设,进行数据处理,得到回归系数估计值及其置信区间和检验统计量,见表2.
表2 模型1的计算结果
将参数估计值代入()1得到,
ˆ 1.454750.176283t t y
x =-+ ()2 由表2知21R =,t y 几乎处处可由()2确定.用Matlab 作出其交互式画面,由此可以给出不同水平下的预测值及其置信区间,通过左方的Export 下拉式菜单,可以输出模型的统计
结果,见图2.
图2 回归分析中的交互式画面
二、自相关性的判别
我们可以看到模型()2的拟合度很高(21R =),即可认为t y 可由模型确定.但此模型并未考虑到我们的数据是一个时间序列.在对时间序列数据做回归分析时,模型的随机误差项可能存在相关性,违背于模型对t 独立的基本假设.现在我们考虑如下模型:
011t t t
t t t y x u ββεερε-=++=+ ()3
其中ρ是自相关系数,1ρ≤,t u 相互独立且服从均值为0的正态分布.
模型()3中,若0ρ=,则退化为普通的回归模型;若0ρ>,则随机误差t ε存在正的自相关;若0ρ<,则随机误差t ε存在负的自相关.大多数与经济有关的时间序列数据,在经济规律作用下,一般随着时间的推移有一种向上或向下的变动趋势,其随机误差表现出正相关性.
D W -检验是一种常用的诊断自相关现象的统计方法.首先根据模型()2得到的残差,计算DW 统计量如下:
2
1
2
2
1
()n
t
t t n
t
t e e
DW e
-==-=
∑∑ ()4
其中n 是观察值个数,残差ˆt t t e y y
=-为随机误差项的估计值.当n 较大时, 122121n
t t t n
t t e e DW e -==⎡⎤
⎢⎥
⎢⎥≈-⎢⎥⎢⎥⎣⎦
∑∑
()5
而()5式的右端
1
2
21
n
t t t n
t
t e e
e
-==∑∑正是自相关系数ρ的估计值ˆρ
,于是 ˆ2(1)DW ρ
≈- ()6 由于ˆ11ρ
-≤≤,所以04DW ≤≤,并且若ˆρ在0附近时,则DW 在2附近,t ε的自相关性很弱(或不存在自相关性);若ˆρ
在1±附近时,则DW 在0或4附近,t ε的自相关性很强. 要根据DW 的具体数值来确定是否存在自相关性,应该在给定的检验水平下依照样本容量和回归变量数目,查D W -分布表,得到检验的临界L d 和U d ,然后由表3中DW 所
三、加入自相关后的模型
根据()4式可计算出0.73465DW =,对于显著性水平0.01,20,1n q α===,查D W -分布表,得到检验的临界值0.95L d =和 1.15U d =,现在L DW d <,由表3可以认为随机误
差存在正自相关,且ρ的估计值可由()6式得ˆ0.63268ρ
=. 作变换,
'1t t t y y y ρ-=-,'1t t t x x x ρ-=-, ()7 则模型()3化为
''''01t t t y x u ββ=++,其中()'
001ββρ=-,'11ββ= ()8
以ρ的估计值代入()7式作变换,利用变换后的数据't y 、't x 估计模型()8的参数,得到
对模型()8也做一次自相关检验,即诊断随机误差t u 是否还存在自相关,从模型()8的残差
可计算出 1.65199DW =,对于显著性水平0.01,1q α==以及19n =时,检验的临界值为0.93, 1.13L U d d ==,故4U U d DW d <<-,所以可以认为随机误差不存在自相关.因此经变换()7得到的回归模型()8是适用的.
最后,将模型()8中的't y 和't x 还原为原始变量t y 和t x ,得到结果为:
11ˆ0.391410.632680.173740.10992t t t t y
y x x --=-++- ()9 四、结果分析与预测
从机理上看,对于带滞后性的经济规律作用下的时间序列数据,加入自相关的模型
()9更为合理,而且在本例中,衡量与实际数据拟合程序的指标——剩余标准差从模型()2的0.081减少到0.0671.当用模型()9对公司的销售额t y 作预测时,先估计未来的全行业销
售额t x ,比如,设t=21时,t x =174.1,容易由模型()9得到ˆt y
=29.1860.
四 、模型的评价
一、模型的优点
经D W -检验认为普通回归模型()1的随机误差存在自相关,由()4,()7式估计出自
相关系数ρ后,采用变换()8的方法得到模型()9,成称为广义差分法.这种方法消除了原模型随机误差的自相关性,得到的()9式是一阶自相关模型.
二、模型的缺点
D W -检验和广义差分法在经济数据建模中有着广泛的应用,但是也存在着明显的不足:若DW 的数值落在无法确定自相关性的区间,则只能设法增加数据量,或选用其他方法;如果原始数据序列存在高阶自相关性,则需要反复使用D W -检验和广义差分,直至判定不存在自相关为止.另外,D W -分布表中数据容量n 的下限是15.
参考文献
[1] 徐金明,张孟喜,丁涛,《MATLAB 实用教程》,北京:清华大学出版社;北京交通大学出版社,2005.7(2007.8重印).
[2]. 姜启源,谢金星、叶俊,《数学模型(第四版)》,北京:高等教育出版社,20011.1(2012.5重印).