数学建模报告公司的销售额预测汇编

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

公司的销售额预测

一、问题重述

某公司想用全行业的销售额作为自变量来预测公司的销售量,下表给出了1977—1981年公司的销售额和行业销售额的分季度数据(单位:百万元)

(1)画出数据的散点图,观察用线性回归模型拟合是否合适.

(2)建立公司销售额对全行业的回归模型,并用DW检验诊断随机误差项的自相关性.

(3)建立消除了随机误差项自相关性之后的回归模型.

二、问题分析与假设

销售收入预测的方法主要有时间序列法、因果分析法和本量利分析法等.

时间序列法,是按照时间的顺序,通过对过去几期实际数据的计算分析,确定预测期产品销售收入的预测值.

表1 的数据是以时间顺序为序列的,称为时间序列.由于公司销售额和行业销售额等经济变量均有一定的滞后性,因此,在这样的时间序列数据中,同一变量的顺序观测值之间出现相关现象是很自然的.然而,一旦数据中存在这种自相关序列,如果仍采用普通的回归

模型直接处理,将会出现不良后果,其观测也会失去意义,为此,我们必须先来检验数据是否存在自相关,一旦存在,就要考虑自相关关系,建立新的模型.

定义与符号说明

三、模型建立与求解

一、基本统计回归模型建立

以行业销售额t x 为自变量、以公司销售额t y 为因变量的散点图,其中1,220t =

图1 t y 对t x 的散点图

从图1可以看出,随着行业销售额的增加,公司销售额也增加,而且两者有很强的线性关系,因此可以建立线性回归模型

01t t t y x ββε=++,t ε为随机误差 ()1 假设t ε与t x 是相互独立的,且t ε服从均值为零的正态分布.

由表1的数据以及上述线性回归模型的假设,进行数据处理,得到回归系数估计值及其置信区间和检验统计量,见表2.

表2 模型1的计算结果

将参数估计值代入()1得到,

ˆ 1.454750.176283t t y

x =-+ ()2 由表2知21R =,t y 几乎处处可由()2确定.用Matlab 作出其交互式画面,由此可以给出不同水平下的预测值及其置信区间,通过左方的Export 下拉式菜单,可以输出模型的统计

结果,见图2.

图2 回归分析中的交互式画面

二、自相关性的判别

我们可以看到模型()2的拟合度很高(21R =),即可认为t y 可由模型确定.但此模型并未考虑到我们的数据是一个时间序列.在对时间序列数据做回归分析时,模型的随机误差项可能存在相关性,违背于模型对t 独立的基本假设.现在我们考虑如下模型:

011t t t

t t t y x u ββεερε-=++=+ ()3

其中ρ是自相关系数,1ρ≤,t u 相互独立且服从均值为0的正态分布.

模型()3中,若0ρ=,则退化为普通的回归模型;若0ρ>,则随机误差t ε存在正的自相关;若0ρ<,则随机误差t ε存在负的自相关.大多数与经济有关的时间序列数据,在经济规律作用下,一般随着时间的推移有一种向上或向下的变动趋势,其随机误差表现出正相关性.

D W -检验是一种常用的诊断自相关现象的统计方法.首先根据模型()2得到的残差,计算DW 统计量如下:

2

1

2

2

1

()n

t

t t n

t

t e e

DW e

-==-=

∑∑ ()4

其中n 是观察值个数,残差ˆt t t e y y

=-为随机误差项的估计值.当n 较大时, 122121n

t t t n

t t e e DW e -==⎡⎤

⎢⎥

⎢⎥≈-⎢⎥⎢⎥⎣⎦

∑∑

()5

而()5式的右端

1

2

21

n

t t t n

t

t e e

e

-==∑∑正是自相关系数ρ的估计值ˆρ

,于是 ˆ2(1)DW ρ

≈- ()6 由于ˆ11ρ

-≤≤,所以04DW ≤≤,并且若ˆρ在0附近时,则DW 在2附近,t ε的自相关性很弱(或不存在自相关性);若ˆρ

在1±附近时,则DW 在0或4附近,t ε的自相关性很强. 要根据DW 的具体数值来确定是否存在自相关性,应该在给定的检验水平下依照样本容量和回归变量数目,查D W -分布表,得到检验的临界L d 和U d ,然后由表3中DW 所

三、加入自相关后的模型

根据()4式可计算出0.73465DW =,对于显著性水平0.01,20,1n q α===,查D W -分布表,得到检验的临界值0.95L d =和 1.15U d =,现在L DW d <,由表3可以认为随机误

差存在正自相关,且ρ的估计值可由()6式得ˆ0.63268ρ

=. 作变换,

'1t t t y y y ρ-=-,'1t t t x x x ρ-=-, ()7 则模型()3化为

''''01t t t y x u ββ=++,其中()'

001ββρ=-,'11ββ= ()8

以ρ的估计值代入()7式作变换,利用变换后的数据't y 、't x 估计模型()8的参数,得到

对模型()8也做一次自相关检验,即诊断随机误差t u 是否还存在自相关,从模型()8的残差

可计算出 1.65199DW =,对于显著性水平0.01,1q α==以及19n =时,检验的临界值为0.93, 1.13L U d d ==,故4U U d DW d <<-,所以可以认为随机误差不存在自相关.因此经变换()7得到的回归模型()8是适用的.

最后,将模型()8中的't y 和't x 还原为原始变量t y 和t x ,得到结果为:

11ˆ0.391410.632680.173740.10992t t t t y

y x x --=-++- ()9 四、结果分析与预测

从机理上看,对于带滞后性的经济规律作用下的时间序列数据,加入自相关的模型

()9更为合理,而且在本例中,衡量与实际数据拟合程序的指标——剩余标准差从模型()2的0.081减少到0.0671.当用模型()9对公司的销售额t y 作预测时,先估计未来的全行业销

售额t x ,比如,设t=21时,t x =174.1,容易由模型()9得到ˆt y

=29.1860.

四 、模型的评价

一、模型的优点

经D W -检验认为普通回归模型()1的随机误差存在自相关,由()4,()7式估计出自

相关系数ρ后,采用变换()8的方法得到模型()9,成称为广义差分法.这种方法消除了原模型随机误差的自相关性,得到的()9式是一阶自相关模型.

二、模型的缺点

D W -检验和广义差分法在经济数据建模中有着广泛的应用,但是也存在着明显的不足:若DW 的数值落在无法确定自相关性的区间,则只能设法增加数据量,或选用其他方法;如果原始数据序列存在高阶自相关性,则需要反复使用D W -检验和广义差分,直至判定不存在自相关为止.另外,D W -分布表中数据容量n 的下限是15.

参考文献

[1] 徐金明,张孟喜,丁涛,《MATLAB 实用教程》,北京:清华大学出版社;北京交通大学出版社,2005.7(2007.8重印).

[2]. 姜启源,谢金星、叶俊,《数学模型(第四版)》,北京:高等教育出版社,20011.1(2012.5重印).

相关文档
最新文档