一种基于数据融合和方法融合的时空综合预测算法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Data Sequence attheNearlv
^(f),以(f).
^(f),^(f),
Continuous
正(f),^(f). AutO—Regres
一一删一一一
Time,2【f) MSARIMA Result:石2
TempOral FOrecast
BP Network
Result:^
Sive Model Result:矗
收稿日期:2004 ll 29;修回日期:2005—04—25 基金项目:国家自然科学基金项目(60332020)
万方数据
计算机研究与发展2005,42(7)
对象从一般的事务型数据库、空间数据库,扩展到时 空数据库.实际上,很多应用领域在问题求解过程 中越来越需要同时考虑时间因素和空间因素,例如 交通管理、环境监测,地震救援等.
deliver the final result.The approach was successfully used in the forecasting of railway曲ssenger flow in
an attempt to overcome the limitations of traditional railway passenger flow forecasting methods. The experimental result shows the effectiveness of the approach.
万方数据
徐薇等:一种基于数据融合和方法融合的时空综合预测算法
2.3 时空综合预测算法描述 2.3.1 时间预测
时间预测是对目标对象本身的相关数据序列,
即,。(£)和^(f)进行预测,如果是平稳的时间序 列,可使用简单的指数平滑法:
ቤተ መጻሕፍቲ ባይዱE=口)t—l+(1一以)E—l,
(2)
其中,E是£时刻的预测值,X。一】是£一1时刻的实
Abstract Spatio—temporal data mining is an important research topic in data mining,and in which spatio— temporal forecasting is the most widely used.In order to overcome the limitations of current spatio—temporal forecasting methods, this paper proposes a spatio—temporal forecasting approach based on data fusion and
时空数据挖掘中一个重要的任务是时空预测,时 空预测是在掌握相关信息的基础上,运用经济学、统 计学、地理学、神经网络等定性定量方法以及引入时 间和空间两方面因素后的扩展方法,研究具有时空特 征的事物的未来发展趋势及运行规律.目前的时空预 测研究主要是针对具体问题的应用研究,比如1990 年Phillip讨论了旅馆的选择问题;1997年Cressie 等人对家畜垃圾进行追踪;1998年Kelly等人使用 了加入邻接矩阵的时空自回归方法在住宅定价时考 虑了相邻房产价格的影响;2000年Jothityangk∞n 等人对降雨的时空分布模型做了测试,采用隐马尔 可夫模型模拟了每月的降雨量;2001年Pokrajac等 人在序列相关模型中加入了近邻的残差,完成了农 作物产量的估计.在交通运输领域,Yamashita等人 提出城市交通分析的战略规划模型,该模型使用神 经网络及时空算法预测城市居民出行需求;斐玉龙 等人用神经网络对城市路网节点的短时段交通量进 行了预测等等11 ̄8j.
关键词时空预测;时空数据挖掘;融合;客流预测 中图法分类号TP311


随着空间数据采集和处理能力的增强,空间数 据库在遥感、地理信息系统、医疗影像、交通控制和
环境监测等方面得到广泛的应用.由于空间信息系 统只能存储最近的静态信息,使系统的动态性和推 理机制受到限制,因而能够保存历史数据的时空信 息系统得到了迅速的发展.时空信息系统的发展推 动了时空数据挖掘技术的研究,使数据挖掘的研究
计算机研究与发展 Journal of Conlputer Research and I)evelopment
IsSN 1000一1239/CN 11.1777/TP 42(7): 1 255~1 260,2005
一种基于数据融合和方法融合的时空综合预测算法
徐 薇1 黄厚宽1 王英杰2
1(北京交通大学计算机与信息技术学院北京 100044) 2(中国铁道科学研究院电子计算技术研究所北京 100081)
且空间关系并不是由空间距离单独决定的.为了计
算出稳定、可靠的空间关系,可以采用人工神经网络 来学习隐含的模式和关系.神经网络输出节点权值 的变化表示如下:
△叫ii=叩(£7一o 7)o7(1一o 7)z“,
(4)
式(4)中,o,为计算输出,f,为实际输出.用.厂3(£)和
厂4(£)作为输入训练样本,用厂。(f)和^(£)作为输
型l罄黑
IntegratiVe Spatio·1劬poral
F0recast Linear Regression
f洫e口嘶e
Fig.1 The fOrecasting algo“thm based on the integration of spatial and temporal data.
图1 基于双融合的时空综合预测方法
较小的时间复杂度[1 0|.这里,我们将序列相关模型扩
展为滞后残差时空白回归模型,使模型中的残差包含 目标样本和空间近邻的残差.模型可描述如下:
yr,i=y。(x£,。)+“f,i,f=1,…,行,
,,、

Key words spatio—temporaI forecasting;spatio—temporal data mining;fusion;passenger flow forecasting
摘要 时空数据挖掘是数据挖掘中的重要研究内容,其中时空预测的应用领域最为广泛.针对目前时 空预测方法中的不足,提出了一种基于数据融合和方法融合的时空综合预测算法.该方法首先采用统 计学原理对目标对象本身的时序进行预测;然后通过神经网络解算相邻对象的空间影响,继而对混合数 据序列使用时空自回归预测模型;最后使用线性回归将单个的时间预测、空间预测和时空预测有效地融 合在一起,得到综合预测结果.应用该方法预测铁路客流,突破了传统铁路客流预测方法的局限,实验 结果表明了算法的有效性.
(xuwe妇zy@sohu.com)
An Integrated Spatio-Temporal Forecasting ApprOach Based on Data Fusion and MethOd FusiOn
Xu Weil,Huang Houkuanl,and Wang Yin西ie2
1(&^00Z o,CD聊加£Pr n行d J挖如r卅nfio押%^"oZq纠,&巧i行g Ji∞幻理g‰i傀玲泐,&巧i行g 100044) 2(j起盯i£“据o,C0埘加fi玎g Tk^舢Z9到,吼i行口A∞如my盯Rniz伽y Sfi硎伽,&巧i竹g 100081)
上述这些应用研究采用的方法丰富多样,但研 究手段都是基于时间和空间结合的策略.他们的主 要问题是:如果以时间序列预测为主,从空间上只能 考虑到最近邻的影响;如果以空间预测为主,从时间 上则只能考虑最近时刻的影响.对此,本文提出了 基于数据和方法两方面融合的时空综合预测算法, 该方法利用了数据的多种特征,并针对不同数据序 列采用不同的方法,而且使时空影响同时被综合考 虑,通过铁路客流真实数据验证.结果表明,对具有 时空特征的数据,时空综合预测算法明显优于传统 的预测方法.
庐。(B)是非季节多项式自回归;@臼(∥)是季节多项
式移动平均;口。(B)是非季节多项式移动平均;z, 是初式或变换后的数据.也可以对数据进行预处 理,比如采用小波变换将信号分解重构后再进行时
间序列分析.预测结果可表示为止。和^:. 2.3.2空间预测
在目标对象Oo的相邻对象ol,.一,o。中,存 在相互的空间关系,这种空间关系必然会影响到 0。.空间相关性的度量是比较复杂的,不易测量,而
2.2时空序列构造 首先,需要详细定义预测问题并确定预测目标
对象oo和与该目标有空间关系的相邻对象01, …,o。,并构造时空序列如下:
厂(£)={月(£),£∈(‘o,£。),
i=1,…,4;0≤j≤咒},
(1)
其中,咒为相邻对象个数;胛(£)为目标对象的历史
同期数据形成的序列;.理(£)为目标对象的连续时间
出训练样本,将目标对象o。的空间预测表示为厂。. 2.3.3时空自回归预测
时空自回归模型实现的一种策略是对空间自回 归模型一般化,即将模型中的空间距离矩阵扩展为 时空加权矩阵.假定每个训练数据样本依赖一定数 量的空间近邻(不考虑时间)和一定数量的时间近邻
(不考虑空间),则时空加权矩阵就是时间加权矩阵 和空间加权矩阵的矩阵乘.还有一种方法是时间自 回归模型的一般化,即在模型中加入空间关系,得到 时空白回归模型.第2种方法可以不用进行复杂的 矩阵乘运算,不用对空间属性进行自回归,所以具有
forecasts mixed data sequence using spatio—temporal auto—regressive model, and finally integrates the individual time sequence forecast,spatial forecast and spatio—temporal forecast through linear regression to
近邻数据形成的序列;鸽(£)(J=1,…,咒)为目标的咒
个相邻对象的历史同期数据形成的序列;忍(£)为目 标的相邻对象的连续时间近邻数据形成的序列;£。 为序列的起始时刻;£。为序列的终止时刻.
不同的数据序列分布会有所不同,比如历史同 期序列相对比较平稳;而连续时间近邻数据序列可 能会有震荡.此外每个序列的长度会有所不同.
2基于双融合的时空综合预测算法
2.1时空综合预测模型结构 时空综合预测是指对具有时间和空间两种属性
的数据变化趋势针对不同数据特征采用不同方法进 行建模.
算法的基本思想是采用信息性原理和外推预测 法,从历史数据中挖掘未来状态信息.
算法的核心是时空综合,即考虑目标对象本身j 又考虑相邻对象的影响.
算法的策略是双融合策略,即首先是数据的融 合,其次是方法的融合.数据的融合是指全面利用 横截面和纵截面等动态和静态数据,既使用变量本 身过去的变化,也使用变量与其他变量之间的静态 关系来预测未来.方法的融合是针对不同数据序列 特点使用不同方法,比如对目标对象的时间序列采 用时间序列分析方法,这样可不需假定只受前一时 刻的影响;对相邻对象的空间影响用神经网络求解, 这样则不用计算距离矩阵;对两者的混合数据序列, 采用时空自回归模型,这样可使时间和空间结合更 紧密,强调了时空的连动性,然后将单独的时间预 测、空间预测和时空预测有效地融合在一起,产生最 后的时空综合预测结果.时空综合预测模型结构如 图1所示:
际值,R一。是£一1时刻的预测值,口是平滑系数,它 在[0,1]区间内取值.如果是具有明显周期波动的 数据序列,可使用乘积季节自回归求和移动平均模
型(MSARIMA)【划:
西P(B5)声。(B)(1一B)4(1一B5)哩。=
口。(B)@Q(B5)a。,
(3)
其中,B是后移算子;D是季节差分;d是非季节差 分;s是季节周期;垂,(B5)是季节多项式自回归;
method fusion. The approach first forecasts time sequence of the target object itself with statistical principles and computes influences of neighboring objects employing neural network technique, then
相关文档
最新文档