常用预测模型
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常用预测模型
(一) 灰色预测模型
1. 灰色系统理论
灰色系统理论认为对既含有已知信息又含有未知或非确定信息的系统进行预测,就是对在一定方位内变化的、与时间有关的灰色过程的预测。尽管过程中所显示的现象是随机的、杂乱无章的,但毕竟是有序的、有界的,因此这一数据集合具备潜在的规律,灰色预测就是利用这种规律建立灰色模型对灰色系统进行预测。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理,来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势状况。灰色预测法用等时距观测到的反映预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。
2.灰色预测理论模型数学形式
在通过灰色理论建立预测模型时,常需要先进行累加或累减后计算数据列间的关联度,再建立最终的预测模型。
如原始数据列为: ()()()()()()()()(){}n X X X X X 00000,...3,2,1=;
通过累加后变为: ()()()()()()()()(){}n X X X X X 11111,...3,2,1=;
那么进行m 次累加后有:
()()()()∑=−=k
i m m i X k X 11关联度:是分析系统中各因素关联程度的方法,在计算关联度之前需先计算关联系数。
设:()()()()()()()(){
}n X X X k X 0000ˆ,...,2ˆ,1ˆˆ=,()()()()()()()(){}
n X X X k X 0000,...,2,1= ()()()()()()()()()()()()()()()()k X k X k X k X k X k X k X k X
00000000ˆmax max ˆˆmax max ˆmin min −+−−+−ρρ 则关联系数定义为:式中:()()()()k X k X
00ˆ−为第k 个点()0X 和()0ˆX 的绝对误差;()()()()k X k X 00ˆmin min −为两级最小差; ()()()()k X k X
00ˆmax max −为两级最大差;ρ称为分辨率,0<ρ<1,一般取ρ=0.5;对单位不一,初值不同的序列,在计算相关系数前应首先进行初始化,即将该序列所有数据分别除以第一个数据。 关联系数矩阵确立后,则与()()k X 0()()k X 0ˆ的关联度为:()∑==n k k n r 1
1η 建立预测模型:在前述准备完成后,GM (1,1)通过相应的微分方程建立模型。 ()
()μ=+11d d aX t
X 其中:α称为发展灰数;μ称为内生控制灰数。
设αˆ为待估参数向量,⎟⎟⎠
⎞⎜⎜⎝⎛=μαa ˆ,可利用最小二乘法求解。解得: ()n T T Y B B B 1ˆ−=α
求解微分方程,即可得到预测模型:
()()()()a e a X k X ak μμ+⎥⎦
⎤⎢⎣⎡−=+−11ˆ01 n k ...,2,1,0= 3.灰色预测模型的适用条件
从灰色理论的基本原理知道,灰色模型适用于数据列波动起伏较大、无特别明显规律、随机性强的目标预测。从其模型方程看,相对于时间序列建模型,灰色理论模型更适用于中长期的数据序列预测。
4.灰色预测模型的优劣
由于灰色建模理论应用数据生成手段,弱化了系统的随机性,使紊乱的原始序列呈现某种规律,规律不明显的变得较为明显,建模后还能进行残差辨识,即使较少的历史数据,任意随机分布,也能得到较高的预测精度。灰色预测模型可用不完全信息建立信息尽可能完全的模型。因此,灰色预测在社会经济、管理决策、农业规划、气象生态等各个部门和行业都得到了广泛的应用,已经在各行各业得到充分的应用。
但该模型的应用也具有局限性,主要体现在以下方面:
(1)对数据进行处理的效果与QQ-plot 图类似,而QQ-plot 图在多数统计分析软件中有直接使用模块,致使灰色模型运用不够广泛;
(2)灰色模型在应用时针对具有确定影响因素的预测能力不足,比较适用于结构复杂、变量繁多、难以找到核心变量的随机数据预测中;
(3) 由于诸多客观因素的影响,预测值真正具有实际意义并且预测精度较高的常常仅是整个预测序列中的第一、第二个预测值,而较远的预测值则只是反应未来发展的趋势,要做出中长期的预测比较困难
(二)回归预测模型
1. 一元线性回归模型
1.1 一元线性回归模型的数学形式
一元线性回归法预测的基本思想是:按照两个变量X 、Y 的现有数据,把X 、Y 作为已知数,根据回归方程Y=ax+b 寻求合理的a 、b,确定回归曲线;再把a 、b 作为已知数来确定X 、Y 的未来演变。
一元线性回归方程为:Y=a+bX,
通常用最小二乘法确定参数a 、b;a=Y-bx; b=Lxy/Lxx 。
1.2 一元线性回归模型的适用条件
只有当Y 与X 存在线性关系时,回归直线才有意义,因此在建立数字模型前检验Y 与X 的线性相关程度时,应使用线性相关系数R 进行来判断。式中,R=Lxy/Lxy*Lyy,若R 越接近1,则说明线性相关程度越高。根据R 值可以发现,已知数据线性关系越好,则预测误差越小,反之则越大。历史数据在没有发生突变时,使整段数据直线性趋势较理想,大致上处于一种直线趋势,那么我们所取的一元线性回归法是较合适的。所以在使用一元线性回归法时,一定要注意R 值的大小,使原始数列保持良好的线性关系,这样才能保证预测结果的可靠性。
1.3 一元线性回归模型的优劣
一元线性模型的优点是简单易行,便于掌握,能够充分运用原时间序列的各项数据,计算速度快,对模型参数有动态确定的能力,精度较好。缺点是不能反映事物的内在联系,不能分析两个因素的相关关系,常数的选择对数据修匀程度影响较大,不宜取得太小,只适用于短期预测。
2. 多元线性回归模型
1.1 多元线性回归模型的数学形式
假定从理论上或经验上已经知道输出变量y 是输入变量x1,x2,…,xm 的线性函数,但表达其线性关系的系数是未知的,要根据输入输出的n 次观察结果(c11,x21,…,xml ,yi)(i=1,n)来确定系数的值。按最小二乘法原理来求出系数值,所得到的模型为多元线性回归模型。
多元线性回归模型一般形式为:
u
X b X b X b b Y k k +++++=Λ221101.2 多元线性回归模型的适用条件
在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。该模型有几个假设:(1)解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相关,即无多重共线性。(2)随机误差项具有0均值和同方差(3)随机误差项不存在序列相关关系(4)随机误差项与解释变量之间不相关(5)随机误差项服从0均值、同方差的正态分布。
1.3多元线性回归模型的优劣
事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或