销售额预测分析报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
销售额预测分析报告
一、模型选择
预测是重要的统计技术,对于领导层进行科学决策具有不可替代的支撑作用。
常用的预测方法包括定性预测法、传统时间序列预测(如移动平均预测、指数平滑预测)、现代时间序列预测(如ARIMA模型)、灰色预测(GM)、线性回归预测、非线性曲线预测、马尔可夫预测等方法。
综合考量方法简捷性、科学性原则,我选择ARIMA模型预测、GM(1,1)模型预测两种方法进行预测,并将结果相互比对,权衡取舍,从而选择最佳的预测结果。
二ARIMA模型预测
(一)预测软件选择----R软件
ARIMA模型预测,可实现的软件较多,如SPSS、SAS、Eviews、R等。使用R软件建模预测的优点是:第一,R是世最强大、最有前景的软件,已经成为美国的主流。第二,R是免费软件。而SPSS、SAS、Eviews正版软件极为昂贵,盗版存在侵权问题,可以引起法律纠纷。第三、R软件可以将程序保存为一个程序文件,略加修改便可用于其它数据的建模预测,便于方法的推广。
(二)指标和数据
指标是销售量(x),样本区间是1964-2013年,保存文本文件data.txt中。
(三)预测的具体步骤
1、准备工作
(1)下载安装R软件
目前最新版本是R3.1.2,发布日期是2014-10-31,下载地址是/。我使用的是R3.1.1。
(2)把数据文件data.txt文件复制“我的文档”①。
(3)把data.txt文件读入R软件,并起个名字。具体操作是:打开R软件,输入(输入每一行后,回车):
data=read.table("data.txt",header=T)
data #查看数据②
回车表示执行。完成上面操作后,R窗口会显示:
(4)把销售额(x)转化为时间序列格式
x=ts(x,start=1964)
①我的文档是默认的工作目录,也可以修改自定义工作目录。
②#后的提示语句是给自己看的,并不影响R运行
x
结果:
2、对x进行平稳性检验
ARMA模型的一个前提条件是,要求数列是平稳时间序列。所以,要先对数列x进行平稳性检验。
先做时间序列图:
从时间序列图可以看出,销售量x不具有上升的趋势,也不具有起降的趋势,初步判断,销售量x是平稳时间序列。但观察时间序列图是不精确的,更严格的办法是进行单位根检验。
单位根检验是通行的检验数列平稳性的工具,常用的有ADF单位根检验、PP单位根检验和KPSS 单位根检验三种方法。
单位根检验的准备工作是,安装tseries程序包。安装方法:在联网状态下,点菜单“Packages—Install packages”,在弹出的对话框中,选择一个镜像,如China(Beijing1),确定。然后弹出附加包列表,选择tseries,确定即可。
安装完附加包后,执行下面操作:
library(tseries) #加载tseries包
adf.test(x) #ADF检验
pp.test(x) #PP检验
kpss.test(x) #KPSS检验
结果:
上面分别给出了ADF检验、PP检验和KPSS检验的结果。其中,ADF检验显示x是不平稳的(P 值=0.99>0.05),而PP检验①和KPSS检验②则表明x是平稳时间序列。再结合时间序列图的判断,我们认为x是平稳时间序列,因而符合建立ARMA模型的前提条件。
3、选择模型
做x的自相关图(左图)和偏自相关图(右图):
acf(x) #做自相关图
pacf(x) #做偏自相关图
无论是自相关系数图(左),还是偏自相关系数图(右),都显著第4阶的系数突破了虚线,表明相关性显著。因此,我们建立4阶AR模型,写作AR(4)。
4、估计模型参数
fit=arima(xse,order=c(4,0,0)) #把估计结果取名为fit
①PP检验的原假设是不平稳,P值=0.01,小于0.05,拒绝原假设,表明序列是平稳的。
②KPSS检验与PP检验和ADF检验不同,它的原假设是平稳的。P值=0.1,大于0.05,接受原假设,表明序列是平稳序列。
fit #查看fit
上面给出了AR模型的回归系数的估计值,其中,截距为44079.31,1到4阶自回归系数分别是0.0344,-0.0174,-0.2002和0.4560。
5、模型效果的检验
模型效果的检验非常重要,因为只有通过检验,才证明是可靠、有效的模型,才能进行后续的预测分析。
主要的检验工具有两个,一是对回归系数的显著性检验。四个自回归系数中,第4个回归系数的T统计值=0.4560/0.1241=3.67,大于2,因此,通过了显著性检验,表明确实存在四阶自相关。这与前面看自相关图和偏自相关系数图的结论相吻合。
第二个检验是残差的白噪声检验(Ljung-Box检验),这个最主要、最关键。一般来说,只要通过了残差的白噪声检验,则表明模型是有效的。
残差白噪声检验的R代码:
tsdiag(fit)
结果:
上边是残差的自相关图,图形显示,除了0阶以外,各阶自相关系数都很小,基本在0左右。表明残差中已经没有多少有用的信息,残差是纯随机序列,即白噪声。换个角度说,时间序列的有价值信息绝大部分都已经被模型提取了,建模获得了成功。
下边是更为精确的Ljung-Box检验结果,所有小圈都在虚线之上(虚线值为0.05),表明在0.05的显著性水平上,各阶自相关系数和零的差别不显著,残差为白噪声序列,模型效果优良。这与上面的残差的自相关图相吻合。
6、ARIMA模型预测
R软件代码:
predict(fit,n.ahead=3) #预测下三年(2014-2016)的数值
若想预测后五年,就把3改成5,依此类推。
结果:
pred即predict(预测)的前四个字母,下面是时间2014-2016,表明要预测2014-2016年三年的。结果在最后一行,2014年销售额预测值为61768.02,2015年为36563.83,2016年为45464.87。
(四)模型的再检验—用AIC准则寻找更优
上面建模预测,通过的显著性检验和残差的白噪声检验,证明模型优良,可以进行预测。一般的预测报告就到此结束了。
但考虑到预测对于企业家的决策重要,而决策的失误将会产生很大的不良后果。因此,更严谨