预测方法综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
预测:当期输入,当期输出
前期输入,当期输出
八、指数平滑法
指数平滑采用时间序列本期的实际值与前期对本期
预测值的加权平均作为本期的预测值,相当于用本
期的实际值对预测值进行不断地修正,以适应数据 的变化。
* Yt* Y ( 1 ) Y 1 t t
*
其中,Yt 1和 Yt 分别为第t+1期和第t 期的预测值;Yt 为第t期真实值; 称为平滑系数,反应利用本期实际 值的信息的程度;而1-
y' f ( x, y ) 对常微分方程 : ,其数值解是指由初始点x0 开始 y ( x0 ) y0 的若干离散的x处的值,即对x0 x1 x2 xn, 求出准确值y ( x1 ), y ( x2 ), , y ( xn ) 的相应近似值y1 , y2 , , yn .
季节周期情形: yt a1 yt 4 a2 yt 8 a3
适用情形:数据离散且较少,回归分析效果不好
五、微分方程
dx 单方程情形: f ( x, t ) dt
dx f ( x, y , t ) dt 方程组情形: dy g ( x, y , t ) dt
适用情形:跟变化率有关,尤其是随时间变化的问题
*
则被称为阻尼(平滑)系数。
九、移动平均法
一次移动平均
M t(1) 1 ( yt yt 1 N
1 ( M t(1) N
yt N 1 )
1 ( M t(1) M t(1) n ) N
二次移动平均
M t(2)
(2) M t(1) ) M N 1 t 1
非线性回归中的难点:参数求解
(1)线性化: 优点:可进行参数检验,求解容易 缺点:不是对原模型的直接反映
(2)直接用数值解法 优点:一般来说求解更精确 缺点:缺乏对参数的检验,结果对初值依赖性强 几种常用特殊的非线性表达: (1)多项式
y a0 a1x a2 x2 an xn
的传输噪声过滤过程极为接近,故称为自适应滤波法。
自适应滤波法的基本预测公式为
y
t 1
w1 y w2 y ... wN
t t 1
y
t N 1
wi y
i 1
N
t i 1
其调整权数的公式为
wi =wi +2k ei +1 yt -i +1
该式表明:调整后的一组权数应等于旧的一组权数加上 误差调整项,这个调整项包括预测误差、原观测值和学 习常数等三个因素。学习常数k的大小决定权数调整的 速度。
预测方法综述
一、回归分析
一元回归
多元回归
线性回归 非线性回归 变量选择:相关性 、共线性 模型选择:散点分布 模型检验:线性性、参数、拟合优度、残差
多元回归中的难点:共线性 (1)逐步回归 (2)主成分回归 非线性回归中的难点:模型选择 (1)借鉴相应学科背景下的已有模型 (2)根据散点分布或其连线趋势
特征:拐点个数为n-1时通常选择n次多项式
(2)修正指数曲线
y K b0b1t
(其中t为时间变量)
特征:初期增长迅速,随后增长率逐渐降低,最终以 K为极限 例子:新产品的问世,初期销量增长可能很快,当社会
拥有量接近饱和时,销售量趋于某一稳定水平
解法:三和法
三和法介绍: 将时间序列观测值等分为3个部分,每部分m个时期,根据
(4)含虚拟变量的回归 虚拟变量:定性的自变量 性别(男,女)、企业类型(家电、医药、其他) 某一定性变量有k个水平,需要k-1个虚拟变量:
1 水平1 1 水平2 1 水平k 1 x1 x2 xk 1 0 其他水平 0 其他水平 0 其他水平
功能:比较、建立混合模型等 (5)受限因变量的回归
(3)龚铂茨(Gompertz)曲线
y Kb0
t b1
(其中t为时间变量)
特征:初期增长缓慢,以后增长率逐渐加快,当达到一 定程度后又开始下降,最后接近一条水平线,两 端都有渐近线,上渐近线为y=k,下渐近线为y=0 例子:产品的寿命周期、一定时期内的人口增长 解法:先取对数,再用三和法
ln y ln K (ln b0 )b1t
设时间序列 {yt } 从某时期开始具有直线趋势,且认为未来 时期也按此直线趋势变化,则可设此直线趋势预测模型为
at 2M t(1) M t(2) 2 (1) (2) b ( M M t t t ) N 1
yt T at bT t , T 1, 2,
十一、其它方法
随机微分方程
灰色马尔可夫
灰色神经网络 模糊神经网络 组合预测 插值拟合
混沌时间序列
......
作业要求:编程实现不少于三种(学过的除外)预测方法, 并自己找例子验证(可借用文献中的数据),程序要求对
关键语句要有注释,如果是借助软件,必须截图给出具体
操作步骤,即你所做的东西要有可操作性和可重复性。最 迟当天晚上离开机房前交到邮箱:42540871@qq.com。
因变量只取少数几个整数值(如logistic回归)
二、时间序列分析
ARMA(p,d,q)
平稳序列:ARMA(p,q)
非平稳序列:差分(d)为平稳序列,针对差分后序列建模 步骤: (1)时序图:平稳性 (2)白噪声检验:是否有信息量 (3)自相关图与偏自相关图:参数识别
(4)模型中参数的检验:显著性 (5)残差白噪声检验:信息提取是否充分
十、自适应滤波
自适应滤波法以时间序列的历史观测值进行某种加权
平均来预测,它要寻找一组“最佳”的权数。 方法是先用一组给定的权数来计算一个预测值,然后 计算预测误差,再根据预测误差调整权数以减少误差。 反复进行,直至找出一组三 “最佳”权数,使误差减少 到最低限度。由于这种调整权数的过程与通讯工程中
建立数值解法的一些途径
设 xi 1 xi h, i 0,1, 2, 微分方程 y ' f ( x, y ) y ( x0 ) y0 , n 1, 则可用以下离散化方法求解
a.用差商代替导数(欧拉法)
y ( x h) y ( x ) y ' ( x) h
可以是离散型数据,也可以是连续型变化
特殊情形:
参数求解:离散化,建立差分方程
微分方程求解:
(1)解析解 dsolve(‘方程1’,„,‘方程n’,‘初始条件’,‘自变量’)
(2)数值解 在生产和科研中所处理的微分方程往往很复杂,且大 多得不出一般解.而实际中的对初值问题,一般是要求 得到解在若干个点上满足规定精确度的近似值,或者得 到一个满足精确度要求的便于计算的表达式.
h y i 1 y i [ f ( xi , y i ) f ( xi 1 , y i 1 )] 2 y 0 y ( x0 )
c.泰勒公式 龙格-库塔法 线性多步法
六、马尔可夫链
初始概率分布: P ( 0 ) 一步状态转移矩阵: P n步概率分布:
P ( n ) P ( 0) P n
(6)比较所有可能的模型:优化
(7)预测:点预测和区间预测
ARMA模型的难点: (1)拖尾和截尾在判别上的模糊性 (2)ARMA (p,q)模型中参数的识别 尝试低阶模型或调用minic函数自动识别 (3)疏系数模型的应用
季节模型:简单季节模型和乘积季节模型
适用情形:有明显周期性 难点:关系及参数取值需靠多次尝试,难有定法
b1m 1 ) S1 m K b0b1 ( b1 1 m m 1 b1 1 S 2 m K b0b1 ( ) b1 1 m 2 m 1 b1 1 S3 m K b0b1 ( ) b1 1
1 S3 S 2 m ) b1 ( S 2 S1 b1 1 b0 ( S 2 S1 ) m 2 b ( b 1 ) 1 1 1 b1m 1 K ( S1 b0b1 ) m b1 1
N N
极限概率分布: P( j i pij ), j 1
i 1 j 1
说明:n步概率分布用来预测一段时间过后的概率分布 极限概率分布用来预测充分长时间过后的概率分布
七、神经网络
适用:训练样本足够多,预留一定比例的检验样本 注意:网络模型的构造,节点个数的设置 类型:BP神经网络、RBF神经网络等
三、灰色系统
GM(1,1):一阶微分方程,一个变量 关键:累加生成、累减生成、紧邻均值、时间响应函数 优点:对序列长度没有特殊要求,可适用于短序列 检验:残差,关联度,后验差等 推广:
GM(2,1) 残差修正模型 残差周期修正模型
新陈代谢模型
四、差分方程
一阶方程情形: yt a1 yt 1 a2 二阶方程情形: yt a1 yt 1 a2 yt 2 a3
yi 1 yi hf ( xi , yi ) i 0,1, 2, y0 y( x0 )
, n -1
b.使用数值积分
y ( xi 1 ) y ( xi )
xi 1
xi
f (t , y (t )) dt
xi 1 xi [ f ( xi , y ( xi )) f ( xi 1 , y ( xi 1 ))] 2
预测值的3个局部总和分别等于原序列的3个局部总和来确定
3个系数,即
S1 ห้องสมุดไป่ตู้ yt , S 2
t 1 m
t m 1
y ,S
t
2m
3
t 2 m 1
y
3m
t
S1 m K b0b1 b0b12 b0b1m m K b0b1 (1 b1 b12 b1m 1 ) m 1 m 1 S 2 m K b0b1 b0b1m 2 b0b12 m m K b0b1 (1 b1 b12 b1m 1 ) 2 m 1 2 m 1 2m2 3m 2 m 1 S m K b b b b b b m K b b ( 1 b b b ) 0 1 0 1 0 1 0 1 1 1 1 3