数学建模 铁路旅客流量预测
ARIMA模型与BP神经网络模型在铁路春运客流量预测中的应用——以广东省为例
技术平台ARIMA模型与BP神经网络模型在铁路春运客流量预测中的应用——以广东省为例江天河(河海大学公共管理学院,江苏 南京 211100)摘 要:春运是我国独有的社会现象,铁路则是春运最重要的交通方式。
预测春运客流量对春运工作的有序、高效、高质量开展具有参考意义。
结合自回归移动平均模型和神经网络的特性,建立ARIMA模型和BP神经网络模型,对春运大省广东铁路春运客流量预测。
结果显示:未来五年广东省铁路春运客流量将持续增加且保持较高增速,预计到2020年突破3500万人次。
关键词:春运;ARIMA模型;BP神经网络模型0 引言自20世纪80年代中后期开始,春节前后交通运输压力骤增,春运问题出现在人们的视野之中,并逐步成为一种独特的社会现象,引起各界广泛关注。
从相关文献来看,目前学界对春运的研究可分为以下几类:(1)社会学、管理学视角,如对春运旅客等候行为的建模和仿真研究、系统工程、安全风险管理与组织改进;(2)地理学、人口学与城乡研究,如发掘春运人口流动背后的转型期中国城市网络结构特征,或分析人口流动和迁移问题;(3)对于春运的经济学思考,如交通方式、售票方式的选择等;(4)春运及与之相关的环境问题之思考;(5)对于春运发展的总结、未来趋势分析和预测,包括定性和定量两种形式。
其中,对于春运铁路客流量定量预测方面的研究方法主要有:指数平滑预测、灰色模型预测、自回归预测、马尔可夫链模型预测等。
1 选题与研究方法春运是较为特殊的客流运输过程。
节前主要由经济发达地区流向欠发达地区,节后则相反。
民工、学生和探亲者在刚性需求下构成了春运客流量的三大主体。
在全国春运客流量排名中,广东省常年位居第一。
从四川、河南、安徽等地外来的剩余农村劳动力在春节前后的返乡和再进城行为,大幅增加了该省春运客流量。
春运的交通方式分为公路、铁路、水路和民航。
基于春运平均运距大于全年平均运距且末端分散这一特性,铁路运输成为春运的首要交通方式:与民航相比,运能大、通达度高;与公路相比,运距长,受天气影响小;与水路相比,运速快、覆盖面广。
基于GM(1,1)残差模型的铁路客运量预测
基于GM(1,1)残差模型的铁路客运量预测作者:田桂英;王花兰来源:《价值工程》2010年第18期摘要:运用灰色GM(1,1)模型,对铁路客运量进行预测,再用GM(1,1)残差模型进行修正,得出精度很高的预测模型,结合实际统计数据对预测结果的精度进行检验。
结果显示,GM(1,1)残差模型的预测结果比灰色GM(1,1)模型有更高的预测精度。
基于此,对2009~2014年广西壮族自治区铁路客运量进行预测。
Abstract: Using gray GM(1,1)model to predict railway passenger numbers and then usingGM(1,1)residual model to correct the result,we could get highly precise prediction and combine the actual statistical data to test the prediction. The results show that GM(1,1)residual model has the higher prediction than grey GM(1,1) residual model.关键词:GM(1,1)残差模型;铁路客运量;预测Key words: GM(1,1)residual model;railway passenger numbers;prediction中图分类号:U29文献标识码:A文章编号:1006-4311(2010)18-0252-020引言随着国民经济的发展、人们生活和工作节奏加快,人们在出行的数量和质量上都有了巨大变化。
铁路客运工作不再局限于追求旅客流量,还要根据旅客流量的统计分析,改进车站硬件设施和提高旅客服务质量。
因此,对未来客运量的预测对铁路部门决策和判断具有重要作用。
灰色系统是指介于白色系统和黑色系统之间的数据系统。
高速铁路客流量预测模型研究
高速铁路客流量预测模型研究高速铁路是当今世界上最主要的公共交通方式之一,因为它的速度快、时间短、效率高等因素而受到广大旅客的青睐。
在高铁站,每天都有成千上万的人从这里出门,进入到不同的城市和不同的地方。
随着高铁的发展和普及,预测高速铁路客流量的准确性就显得格外重要。
本文旨在探讨高速铁路客流量预测模型的研究。
一、预测模型的概念预测模型是指利用数理统计、时间序列等方法来对未来的某种经济和社会现象进行估计的一种模型。
在经济学和管理学领域里,预测模型被广泛应用于市场调研、企业管理等方面。
而在交通运输领域里,预测模型则被用于预测客流量、交通拥堵情况等。
高速铁路客流量预测模型是指利用现代技术和方法,对高速铁路客流量进行准确预测的一种方法。
二、高速铁路客流量预测的重要性高速铁路客流量预测对于高铁站的运营管理至关重要。
只有准确预测客流量,才能够制定合理的运营计划,合理分配人力和物力资源,提高高铁站的运行效率。
同时,也可以更好地服务旅客,为旅客提供更好的出游体验。
三、高速铁路客流量预测模型的种类目前,高速铁路客流量预测模型主要可分为三类:统计模型、神经网络模型和机器学习模型。
1. 统计模型:这种模型的基础是数理统计学原理,通过对历史数据的分析比较,来预测未来的客流量情况,常见的统计模型有回归模型、时间序列模型等。
2. 神经网络模型:这种模型的基础是人工神经网络学原理,通过对不同时间节点的多维数据进行分析,来预测未来的客流量情况,主要包括前馈神经网络、循环神经网络等。
3. 机器学习模型:这种模型的基础是机器学习原理,通过对历史数据的学习、模拟和预测,来拟合出具有一定可靠性的模型,主要包括支持向量机、决策树等。
四、提高高速铁路客流量预测准确性的方法在实际应用中,要想提高高速铁路客流量预测的准确性,需要从以下几个方面入手:1. 提高样本容量:样本容量越大,预测模型的准确性越高,因此需要尽可能多地收集历史数据,并及时更新数据。
基于乘法季节ARIMA模型的铁路旅客运输量的分析与预测
基于乘法季节ARIMA模型的铁路旅客运输量的分析与预测作者:敬林来源:《科技视界》2016年第20期【摘要】随着我国高铁客运市场的快速增长,中国铁路公司及其相关企业有着更大的发展空间。
对铁路旅客运输量作出准确的预测是相关企业和部门准确把握行业发展趋势,做出合理决策与调度的前提。
由于铁路旅客运输量具有较强的趋势性和季节性,本文运用非平稳乘法季节ARIMA模型对我国2005—2015年铁路旅客运输量的月度数据进行拟合,建立了ARIMA (0,1,1)*(0,1,1)模型,在此基础上预测2015年的月度旅客运输量,模型总体效果较好。
【关键词】季节ARIMA模型;模型拟合;铁路旅客运输量0 引言随着我国经济的发展和人民生活水平的提高,人们出行工具的选择也越来越多样化。
但由于铁路运输具有安全,快速,经济,便利等优势,大多数人任然选择火车作为第一出行工具。
自从改革开放以来,随着人口流动的加剧,铁路运输压力不断加大,人们选择铁路出行的质量得不到很好的保障。
通过对铁路旅客运输量的趋势预测,在一定程度上可以为铁路部门提前做好相关工作,制定合理的运输方案,开发更多更好的铁路运输产品,为旅客的出行提供更好的保障及更高的满意度。
目前我国铁路运输还存在一些问题需亟待解决,比如节假日如何合理的安排运力,新修建的高速铁路如何合理规划站点以满足更多的旅客的需求。
另一方面,铁路旅客运量短期具有季节和周期性,因此通过时间序列模型预测铁路客运量是铁路旅客运输组织工作的重要基础和主要依据之一。
客运量短期预测主要是以一段时间内月度甚至日客运量的变化为出发点,研究短期内的客运量变化情况。
短期客运量是一个存在季节和周期变化趋势、并存在一定增长(或降低)趋势的非平稳时间序列,为此本文运用ARIMA这种典型时间序列预测模型,对我国铁路旅客运输量的月度数据进行拟合和预测。
铁路公司、火车站及相关部门只有对未来中国铁路旅客运输量作出较为合理的预测,才能准确把握铁路发展趋势,对新建和改扩建的火车站点以及运力调整等项目做出科学的决策。
数学建模-轨道交通车站客流预测模型研究
轨道交通车站客流预测模型研究李明1 王海霞2¨(1.中铁工程设计咨询集团有限公司,北京100055;2.交通部科学研究院,北京100029) 摘要:研究目的:通过对传统的“四阶段”客流预测方法优缺点的分析,对交通出行方式分担率预测模型进行改进,提高客流量预测的准确性,为轨道交通车站站台尺寸及其它设施的设计提供依据。
研究结论:在交通出行方式分担率的预测模型中,引人“出行者收入水平”这一概念,重新定义了交通出行方式阻抗函数,优化了传统的“四阶段”客流预测方法。
以北京地铁1号线五棵松车站为例,对该车站高峰小时进出站客流进行了预测,将预测得到的客流量与实际客流量进行了对比,证明了本文所提出的方法是一种快捷、有效的客流预测方法。
关键词:轨道交通车站;客流预测;模型中图分类号:U293.1+3 文献标识码:AStudyonthe ModelforPredictingthePassengerV olumeofRail CommunicationStationLInin91,W ANGHal—xia2(1.China Railway EngineeringConsultantsGroup,Beijing 100055,China;2.China AcademyofTransportationSciences,Beijing100029,China)Abstract:Research purposes:Basedon theanalysisofadvantagesanddisadvantagesof conventionalfour··stagepassengervolumepredictionmodel,thetravel modesharepredictionmodelis modified forthepurposesofenhancingtheaccuracyofpassengervolumepredictionandprovidingthe basisfordesignofplatformsizeandother facilities ofrailcommunicationstation.Researchconclusions:Theconceptof”Traveler Income Level”has been used for the travel mode share predictionmodel,anew travel mode resistancefunction isdefined,and also,anewimproved four—stagepassengervolumepredictionmodelispresented.Finally,taking WukesongStation ofline 1 of Beringsubwayas anexample,the peal【passengervolumeofWukesongStationispredictedforecastwiththemethodpresentedin thispaper.1l[Iroush comparisonofthepredictedvolume埘th actualpassengervolume.it isprovedthatthe method isaquickandefficient method forpredicting passengervolume.Keywords:railcommunicationstation;passengervolumeprediction;model轨道交通车站的站台尺寸设计是以车站进出站客流量的预测为基础的,只有较准确地预测出轨道交通车站高峰小时的进出站客流量,才能对车站设施中的车站站台宽度、车站长度、自动售检票机数量等做出准确定位。
GM(1,1)模型和Verhulst模型在旅客运输量预测中的应用
GM(1,1)模型和Verhulst模型在旅客运输量预测中的应用作者:曹原陈波肖悦雯余霆凯陈舒琪来源:《科学与财富》2019年第18期摘要:为提高客运量预测精度,选取GM (1, 1)模型和Verhulst模型,使用Matlab对中国铁路旅客运输量进行预测,并根据预测精度总结GM (1, 1)模型和Verhulst模型的优缺点,最后指出灰色预测模型中的GM (1, 1)模型能更好的预测铁路旅客运输量。
关键词:铁路旅客运输;灰色预测模型; GM (1, 1)模型; Verhulst模型1 简介就全国铁路来说,铁路旅客运输量以旅客发送的人数或者到达人数为依据进行计算。
GM(1,1)预测模型,是对复杂系统中的某个主导因子的特征值进行拟合和预测,展示了其变化的规律,预测了其未来的发展。
由德国生物学家Verhulst提出的Verhulst模型,是其在研究微生物繁殖的规律时提出的一个单序列一阶非线性动态模型。
2旅客运输量预测中的应用(1)数据来源:从中华人民共和国国家统计局查得2009年至2017年客运量,2009年152451.19万人,2010年167609.02万人,2011年186226.07万人,2012年189336.85万人,2013年210596.92万人,2014年230460万人,2015年253484万人,2016年281405.23万人,2017年308379.34万人(2)建立 GM (1,1)预测模型先对原始数列X^((0))做累加处理得:X(1)=(x(1)(1),x(1)(2),…,x(1)(9))=(152451.19,320060.21,506286.28,695623.13,906220.05,1136680.05,1671569.28,1979948.62)依照预测模型,获得数据矩阵B和数据向量Y:在第二步中,估计参数得第三步,建立模型:x(0)(k)-0.08898z(1)(k)=142873.842244,时间响应序列为:1758133.542827e0.08898k-1605682.352827,第四步,求得和,求得:X(0)=(x(0))(1),x(0)(2),…,x(0)(9))= (83.1,61.6,93.2,141.1,213.7,323.4,489.6,741.1,1121.9)(3)建立Verhulst预测模型同理对原始数据进行累加处理,建立预测模型(4)使用Matlab建模分析分别编写程序对上述两种预测模型进行模拟分析:通过导出MATLAB结果并整理数据得到预测结果数据对比表:从图1和图2的模型预测曲线趋势可以看出,GM(1,1)模型的预测结果的增长率相对稳定,而Verhulst模型的增长率则是不断增加的,随着时间向后移动,其误差也会随之增大。
基于SARIMA模型的铁路月度客运量预测
本 文 通 过 构 建 季 节 差 分 移 动 自 回 归 模 型 (SARIMA ) 对 2 0 1 6 年 铁 路 月 度 客 运 量 进 行 精 确 预 测 ,挖掘铁
路 月 度 客 运 量 的 季 节 性 波 动 规 律 ,为铁 路 客 运 管 理 人 员 调 整 列 车 运 行 图 ,制 定 客 车 开 行 方 案 提 供 重 要
第 17卷 第 1 期 2019年 03月
交通运输工程与信息学报 Journal o f Transportation Engineering and Information
Vol.17 N o.l Mar.2019
文章编号:1672-4747 (2019) 01-0025-08
基 于 SARIMA模型的铁路月度客运量预测
0 引言
截 至 2 0 1 6 年 底 ,我 国 铁 路 营 业 里 程 达 到 12.4 万 km,其 中 高 铁 里 程 达 到 2.2万 km,“四纵四横” 客 运 专 线 基 本 成 型 。随着我国铁路总里程的不断 增 加 以 及 高 铁 网 络 的 逐 步 完 善 ,民众选择铁路出
行 较 以 往 更 加 便 捷 。铁路客运量预测及需求分析 一直是铁路旅客运输生产中的一项重要基础工 作 ,基于历史数据分析的铁路月度客运量预测结 果能够间接地反映出铁路客运量的需求变动趋 势 ,铁路运输部门可依据各月份的铁路客运量预 测 值 来 调 整 列 车 运 行 图 、制 定 客 车 开 行 方 案 等 ,
Abstract: The data sequence o f monthly railway passenger traffic volume exhibits a trend o f linear growth in the long term, but it fluctuates significantly with the month in the short term. This study uses the SARIMA model to accurately predict monthly railway passenger traffic volume for 2016 and determine the seasonal fluctuations in monthly traffic, which can provide an important reference for the railway department in adjusting train diagrams and planning passenger trains. It can also help railway terminal staff know passenger peak times in advance, and can improve the efficiency o f railway passenger transport organizations. Key words: railway; passenger traffic volume; SARIMA model; forecasting
基于时间序列的我国铁路客流量预测
应和日历效应, 得到序列ut。 ②干扰问题
通过观察还可以看到, 在2003年5月, 数据有突降, 之后一个月则迅速反弹, 以至于该年6、7月份的客运量
明显高于以往的水平, 所以我们假设该冲击时间的影
响函数形式为:
ut=(
ωB 1- δB
)p+εt
2、模型的确定
以下将根据Lin and Liu(2004)的思路构建铁路客流
X- 11及其改进方法, 其本质是用一系列移动平均来分
图2 分离出季节效应后的铁路客流量扰动图
2 0 0 8. 4 20 统计与咨询
实证分析
从上图可以看出, 2003年1月、2004年1月和2007年
3月的数据有突增现象, 由于其围绕在农历新年附近,
单纯的用西方的经验季节调整方法将无法很好的拟合
我 国 的 数 据 。 这 里 我 们 借 鉴 LinandLiu (2004) 使 用
型预测法。相关模型预测法是找出影响客流量的因素, 加入回归项对日历效应进行调整。本文使用Lin and Liu
建立客流量和各种影响因素之间的函数关系, 得出模 ( 2004) 的regARIMA建模的方法对日历效应进行处理。
型进行预测。在相关模型预测法中, 由于影响客流量的
三 、铁 路 旅 客 周 转 量 分 析
实证分析
基于时间序列的我国铁路客流量预测
文/常国珍 张前登
一 、引 言
离出趋势项和季节项。此外, 由于交易日或某个国家的
客流预测技术是交通运输领域的研究热点之一。 特有的节日与阳历并不完全重合, 这样会导致季节的
一般而言, 客流预测可分为相关模型预测法和时间模 周期效应不稳定。Bell和Hillmer提出在AMIMA模型中应
铁路客流量预测
铁路客流量预测铁路客流量预测目录一、摘要 (2)二、选题背景与意义 (3)三、模型建立与求解 (5)3.1、ARIMA 模型 (5)3.1.1、自回归移动平均模型 (6)3.1.2、季节性预测法 (6)3.1.3、模型求解 (7)3.2、灰色预测模型 (12)3.2.1 、GM(1,1)模型. (6)3.2.2、模型检验 (8)3.2.3、模型求解 (9)四、模型分析与结论 (11)4.1 、方法分析 (11)4.2、模型缺点 (12)五、附录 (12)一、摘要摘要:文章以铁路客流量的短期预测作为切入点,采用定量的时间序列分析方法,建立季节自回归综合移动平均(季节性ARIMA 模型)模型对时间序列进行量化分析。
首先阐述基于该模型的预测的一般过程,即:平稳化处理、差分变换的阶数辨识、参数估计,时间序列模型的构建,然后利用标准 BIC 值,确定较适合的季节自回归综合移动平均模型,取得了较为理想的预测效果。
同时运用灰色预测模型建立铁路客流预测模型,对我国铁路客运量进行预测,灰色模型的方法简单,适合在数据少的情况下预测短期客流量,对未来的结果有很好的预测效果。
关键词:季节性ARIMA 灰色预测铁路客流量预测二、选题背景与意义宏观上来讲铁路客流预测是铁路客运系统合理规划的基础,只有在对规划年度客流的流量、流向、流径进行合理预测与分析的基础之上,才能合理规划未来铁路客运系统的设施设备,合理安排运量,合理确定系统各阶段的发展目标使整个铁路客运系统与社会经济发展、生产力布局相适应,确保国民经济的正常发展。
微观层上来讲主要有以下三方面。
一是铁路客流量预测是铁路设备建设投资的重要依据。
通过对各项客流预测结果分析,可以合理确定研究线路近期、中期、远期在路网中的功能和作用,从而为新线建设、旧线改造和相关客运场站技术设备修建与改造提供客观的依据。
二是铁路客流预测是编制铁路客流计划的基础。
由于我国目前整体运能不足,再加上铁路运输自身的特点,在日常的客流运输组织中需要定期编制相应的客流计划,而准确的客流资料就是该项工作的基础,如果客流资料不完备就会造成运力资源分配的不平衡,从而致使客流滞塞及运力虚糜。
基于sarima模型的广珠城际铁路客流量预测
Passenger Flow Prediction for Guangzhou-Zhuhai Intercity Railway Based on SARIMA Model
LI Jie1, PENG Qiyuan1,2, YANG Yuxiang1
(1. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 610031, China; 2. National United Engineering Laboratory of Integrated and Intelligent Transportation, Southwest Jiaotong University, Chengdu 610031, China)
第 55 卷 第 1 期 2020 年 2 月
西 南 交 通 大 学 学 报 JOURNAL OF SOUTHWEST JIAOTONG UNIVERSITY
文章编号:0258-2724(2020)01-0041-11 DOI: 10.3969/j.issn.0258-2724.20现铁路车站发送客流量的短期预测研究预测步长对短期客流预测效果的影响分析了广珠城际铁路车站发送客流的特征和变化规律结合客流特征及季节性差分自回归滑动平均模型seasonalautoregressiveintegratedmovingaveragesarima的适用性构建了sarima客流预测模型利用python软件中的statsmodels模块完成了sarima客流模型的精细化调参以广州南站小榄站的发送客流量为例验证了模型的有效性
基于 SARIMA 模型的广珠城际铁路客流量预测
李 洁 1,彭其渊 1,2,杨宇翔 1
基于小波包与长短时记忆融合的铁路旅客流量预测模型
基于小波包与长短时记忆融合的铁路旅客流量预测模型成强【摘要】短期铁路客运需求量的实时精准预测可以为实时调整客运服务结构提供依据.铁路旅客流量数据具有时变性、非线性和随机波动性等特点,传统的预测模型无法精准的预测短期内的客流量.本文提出一种基于小波包分解与长短时记忆融合的深度学习预测模型(WPA-LSTM),首先用小波包分解将原始客运量时间序列分解重构成多个不同尺度的低频和高频序列,然后分别针对各个子序列进行LSTM模型训练和预测,最后将各子序列的预测值叠加作为WPA-LSTM模型的输出.采用某高铁367天的日旅客流量数据对模型进行实验验证,并与季节性模型和基于经验模态的长短时记忆融合模型进行对比,实验结果表明,WPA-LSTM模型可有效提高铁路旅客流量预测的精度.【期刊名称】《计算机系统应用》【年(卷),期】2018(027)007【总页数】6页(P121-126)【关键词】深度学习;小波包分析;长短时记忆神经网络【作者】成强【作者单位】重庆交通大学信息科学与工程学院,重庆400074【正文语种】中文随着政企分开以及中国铁路总公司的成立, 铁路系统已经迎来改革发展“新常态”.客运经营作为铁路改革的重头戏, 重点就是要加强对于短期市场变化的应对能力,及时获取相关客运需求信息, 实时调整客运服务机构, 而这就要求我们提高对于短期客运量的预测精度.短期客运量预测是以月度或者日度客运量变化为预测对象, 研究短期内客运量的波动情况. 由于短期客运量受多种随机因素影响, 相比长期客运量具有明显的非线性、随机性和波动性[1], 这在一定程度上增加了预测难度. 在类似客运量时间序列预测方面, 小波分析和神经网络相结合的方法收到广泛关注, 而深度学习[2]的飞速发展又为客运量时间序列的预测提供了新的研究思路和方法.深度学习的概念由Hinton等于2006年提出. 深度学习神经网络提供了高维数据空间和低维嵌套结构的双向映射, 有效解决了大多数非线性降维方法所不具备的逆向映射问题. 杨祎玥等[3]将小波分解和循环神经网络RNN应用在时间序列的预测中, 探索了水文时间序列的预测精度. 但是小波分解仅仅将低频特性持续分解, 而且循环神经网络RNN存在梯度消失和梯度爆发的缺点; 然而小波包分析 (Wavelet Packet Analysis,WPA)不仅对低频部分进行分解, 而且还对高频部分进行分解, 且长短时记忆神经网络LSTM[4]是在RNN的基础上的改进模型, 可以有效处理梯度消失和梯度爆发的问题.因此, 本文利用长短时记忆神经网络LSTM的时间序列预测能力, 结合小波包分析方法, 建立了一个基于小波包分析的长短时记忆神经网络的铁路客运量时间序列预测模型.1 小波包分析1.1 小波包的定义定义子空间是函数的闭包空间, 而是函数的闭包空间, 并令满足下面的双尺度方程[5]:式中, 即两系数也具有正交关系,当时, 可以直接给出:与在多分辨分析中满足双尺度函数方程:相比较, 很显然分别退化为尺度函数和小波基函数序列(其中称为由基函数确定的正交小波包. 或称序列为关于序列的正交小波包.1.2 小波包对时间序列的分解特性小波分析是把时间序列分解成低频信息和高频信息两部分. 在分解中, 低频中失去的信息由高频捕获. 在下一层的分解中, 又将分解成低频和高频两部分, 低频中失去的信息由高频捕获, 如此类推下去, 可以进行更深层的分解. 小波包分析则不然, 它不仅对低频部分进行分解, 而且还对高频部分进行分解. 因此, 在对于实验数据的处理上, 并没有将节假日和周末客流进行单独区分并预测, 而是将完整数据构成的时间序列进行小波包的分解以及重构. 图1为小波包对一维时间序列的分解特性示意图. 在图1中,表示低频,表示高频, 末尾下标的序号数表示小波包分解的层数(也即尺度数). 分解具有关系:图1 小波包对时间序列的分解1.3 小波包算法为了小波包简单地说就是一个函数簇, 它定义为正交尺度函数确定的函数簇. 设则可表示为(其中是尺度参数, 、l是平移参数, 是频率参数, 且小波包分解算法:由即:小波包重构算法:由即:2 深度循环神经网络深度循环神经网络 (Deep Recurrent Neural Network,DRNN)本质上是一种通常意义上的深度神经网络(多层感知机), 其特点是每层都有时间反馈循环, 并且层之间是叠加构成的. 每次神经网络的更新, 新信息通过层次传递, 每层神经网络也获得了时间性上下文信息.然而传统的DRNN模型, 在训练过程中, 梯度下降更加倾向于按照序列结尾处的权值的正确方向进行更新. 也就是说, 越远的序列输入的对权值的正确变化所能起到的“影响”越小, 所以训练的结果就是往往出现偏向于新的信息, 即不太能有较长的记忆功能.由此引出本文将要介绍的LSTM (Long Short-Term Memory, 长短时记忆)递归神经网络, 该算法使用LSTM结构替换了一般的递归神经网络的隐藏层节点, LSTM 结构增加了输入门 (Input gate)、输出门(Output gate)、遗忘门 (Forget gate)和一个内部单元(Cell). 其中LSTM结构如图2所示.输入门: 表示是否允许输入层的信息进入到该隐藏层节点. 门开的则允许输入层输出信号进入, 门关则不允许信号进入, 记为. 输出门: 表示是否将当前节点的输出值输出到下一层. 门开的则允许该隐藏层节点的信号输出, 门关则不允许信号输出, 记为. 遗忘门:表示是否保留当前隐藏层节点存储的历史信息. 门开的则保留当前隐藏层节点存储的历史信息, 门关则不保留当前隐藏层节点存储的历史信息, 记为表示t 时刻存储的信息值,表示时刻存储的信息值,在模型中t时刻的输出值将作为时刻的输入进行预测, 输出层与DRNN的输出层一致. 基于长短时记忆结构的递归神经网络模型结构如图3所示.图2 LSTM 结构3 预测模型结构利用小波包分析方法对铁路旅客流量时间序列进行预处理, 进行多尺度小波包分解和单支重构, 可获得不同的高频和低频序列, 对预处理的数据进行相空间重构后作为LSTM模型的训练数据, 建立一个基于小波包分析的长短时记忆神经网络的铁路旅客客流量时间预测模型, 称为WPA-LSTM模型.WPA-LSTM预测模型结构如图4所示.首先将时间序列数据进行小波包分解和单支重构成多条序列, 然后分别输入LSTM 模型进行预测, 最后将预测值叠加成最终预测值[7].WPA-LSTM模型建立过程如下:(1) 数据准备. 先选取历史旅客流量日数据, 对数据进行归一化处理, 并且保存其最大值和最小值.(2) 小波分解和单支重构. 选择合适的小波包函数和分解初度, 对旅客流量时间序列进行多尺度小波包分解和单支重构, 获得该序列的近似系数和各细节系数, 然后对这些系数分别进行单支重构, 获得一条能够描述原始序列趋势变化的低频序列和保留不同信息的高频序列.图3 基于长短时记忆结构的递归神经网络模型结构(3) 相空间重构. 设置相空间重构的延迟数值, 分别对低频序列和各个高频序列进行相空间重构, 以此形成相应的训练数据和测试数据.(4) LSTM模型训练. 设定LSTM的学习速率、网络层数和每层的节点数目, 利用相空间重构的多组训练数据分别对LSTM模型进行训练.(5) 预测客流量. 用训练好的LSTM模型对子序列的测试样本进行预测, 并将各子序列的预测值进行叠加, 从而得到最终的预测值, 这样就实现了对铁路旅客流量时间序列的建模和预测.4 实例分析以某高铁上, S1到S2方向的2015年12月28日到2017年1月15日, 共计367天的日旅客流量数据为例, 来研究基于小波包分析的LSTM神经网络预测模型. 然后, 又利用了自回归积分滑动平均模型[8](ARIMA)和基于经验模态分解[9,10](EMD)的LSTM神经网络模型进行预测, 并将其预测结果与基于小波包分析的LSTM神经网络模型进行比较. 其中, 训练数据为2015年12月28日到2016年11月3日的295组经过相空间重构的数据, 测试数据为2016年11月4日到2017年1月15日, 共计72组数据.图4 WPA-LSTM 预测模型结构4.1 小波包分解结果首先, 对数据进行归一化处理, 以提高数据在训练过程中的收敛速度. 在这里使用Max-Min归一化方法,对于序列中的最大值和最小值对序列中所有元素有:再挑选合适的小波包分解参数, 将原始信号合理的分解到恰当的多个频段上. 这里使用Daubechies小波1(db1), 对其进行小波包分解和单支重构, 其中单支重构后的情况如图5–图7所示.其中, 第一条曲线为原始序列曲线, 另外八条为db1小波包分解并进行重构后的8个不同尺度的序列.这些序列能够捕捉到原始序列轻微的扰动, 将原始序列中突发性、局部性、隐藏性的信息保留在其中.4.2 预测结果分析各模型预测的结果如图8所示, 预测性能指标如表1所示.通过对比拟合程度(R值)可知, WPA-LSTM模型最优, 其次是ARIMA模型, 最后是EMD-LSTM模型;通过对比归一化均方误差(NMSE)可知, WPALSTM模型最优, 其次是ARIMA模型, 最后是EMDLSTM模型; 通过对比平均绝对百分比误差(MAPE)可知, WPA-LSTM 模型最优, 其次是 ARIMA 模型, 最后是EMD-LSTM模型; 综合考虑上述三项指标, WPALSTM的预测精度最高.图5 旅客流量原始序列与db1分解后的信号对比图1图6 旅客流量原始序列与db1分解后的信号对比图2图7 旅客流量原始序列与db1分解后的信号对比图34.3 误差分析首先, 进行分日期的绝对预测误差对比, 如图9所示. 可以看出, ARIMA模型在对2017年元旦附近,特别是2016年12月30日这一天和2017年1月2日这一天的预测误差较大, 最大值为7000人; EMDLSTM模型也是在2017年12月30日这一天的预测误差最大, 最大值甚至达到了7800人, 而且EMDLSTM模型的绝对误差明显多数高于其他两个模型;而WPA-LSTM模型的绝对误差相对稳定, 在预测时段内没有特别剧烈的变化, 分布相对较平稳.其次, 分析误差分布. 分别以作为阈值上下限, 研究不同模型预测结果中过低预测(低于阈值下限)和过高预测(高于阈值上限)的日期数量占总日期数量的比值, 如表2所示.由表2可以看出, 采用作为阈值时, 三种预测模型的过低预测和过高预测基本相当; 当采用作为阈值时, ARIMA模型和WPA-LSTM模型的过低预测和过高预测基本相当, 而且明显优于EMDLSTM模型. 综上所述, WPA-LSTM模型的预测精度最高, 误差结构相对较好.5 结论与展望将基于小波包分析和长短时记忆神经网络融合的深度学习预测模型用于铁路旅客日流量的预测中, 实验结果证明, 比利用季节性模型ARIMA和基于经验模态分解的长短时记忆神经网络预测模型有着更好的逼近能力和容错性, 有效降低了预报误差, 提高了模型的预测精度, 具有较强的预报和泛化能力.图8 各模型预测结果对比图9 预测值绝对误差对比表1 各模型的预测性能指标模型 R NMSE MAPE ARIMA 0.6506 0.60690.1378 WPA-LSTM 0.7832 0.4178 0.1292 EMD-LSTM 0.5414 0.8118 0.1516 表2 各模型误差分布 (单位: %)±过高预测比例ARIMA 38.03 19.72 12.68 4.23 WPA-LSTM 43.66 14.08 14.08 2.82 EMD-LSTM 32.39 18.31 25.35 5.63阈值为 20%过低预测比例参考文献【相关文献】1褚鹏宇, 刘澜. 基于变权重组合模型的铁路客运量短期预测. 计算机工程与应用, 2017, 53(4): 228–232, 262. [doi:10.3778/j.issn.1002-8331.1506-0091]2罗向龙, 焦琴琴, 牛力瑶, 等. 基于深度学习的短时交通流预测. 计算机应用研究, 2017, 34(1): 91–93, 97.3杨祎玥, 伏潜, 万定生. 基于深度循环神经网络的时间序列预测模型. 计算机技术与发展, 2017,27(3): 35–38, 43. [doi:10.3969/j.issn.1673-629X.2017.03.007]4陈巧红, 孙超红, 余仕敏, 等. 基于递归神经网络的广告点击率预估研究. 浙江理工大学学报(自然科学版), 2016,35(6): 880–885. [doi: 10.3969/j.issn.1673-3851.2016.11.014]5孙崟培, 王朝英. 小波分析和小波包在图像消噪中的应用.通信技术, 2009, 42(1): 285–287.6田苗苗. 小波分析和小波包在图像压缩中的应用. 安徽科技学院学报, 2009, 23(5): 32–34.7任崇岭, 曹成铉, 李静, 等. 基于小波神经网络的短时客流量预测研究. 科学技术与工程, 2011,11(21): 5099–5103,5110. [doi: 10.3969/j.issn.1671-1815.2011.21.031]8刘建军, 廖闻剑, 彭艳兵. 两种时间序列模型在客流量预测上的比较. 计算机工程与应用, 2016,52(9): 228–232, 270.[doi: 10.3778/j.issn.1002-8331.1406-0024]9秦喜文, 邢婷婷, 董小刚, 等. 基于 EEMD 的公路客流量波动性与周期性研究. 东北师大学报(自然科学), 2016,48(1): 44–48. [doi: 10.16163/ki.22-1123/n.2016.01.011]10何九冉, 四兵锋. EMD-RBF组合模型在城市轨道交通客流预测中的应用. 铁道运输与经济, 2014, 36(10): 87–92. [doi:10.3969/j.issn.1003-1421.2014.10.017]。
基于FARIMA的铁路数据网流量趋势预测
基于FARIMA的铁路数据网流量趋势预测孙强;周洋;张治鹏【摘要】利用FARIMA模型,对铁路数据网中的真实数据流量进行建模并分析,提出一种新型的基于FARIMA模型的铁路数据网流量预测方法,该方法能够同时描述网络流量的长相关特性和短相关特性.将FARIMA过程转换为差分过程和ARMA 过程进行趋势预测,并且根据平均绝对误差、绝对百分比误差等多项指标进行比较验证.通过对高速铁路数据网6个月的数据进行建模分析,利用不同的参数设置预测未来2个月的流量趋势,并与真实数据进行对比.实验结果表明该方法比传统的基于ARMA模型的预测方法更为精准,能够适用于铁路数据网流量趋势预测.【期刊名称】《铁道学报》【年(卷),期】2019(041)002【总页数】5页(P84-88)【关键词】铁路数据网;FARIMA模型;长相关性;趋势预测【作者】孙强;周洋;张治鹏【作者单位】北京交通大学电子信息工程学院,北京 100044;北京交通大学电子信息工程学院,北京 100044;北京交通大学电子信息工程学院,北京 100044【正文语种】中文【中图分类】TN919.2近年来随着中国高速铁路的快速发展,铁路通信业务的多样化程度迅速提升,其对通信网络的信息化要求日益增高。
作为铁路通信MIS系统的基础,铁路数据网承载的业务应用越来越多,其重要性提升的同时,复杂程度也逐渐增加。
准确了解当前及未来网络的负载情况,对于网络运营、网络规划具有重要意义,能够避免由于局部资源紧张而带来的网络拥塞[1],实现未来网络动态带宽管理以及智能化调度平台。
当前铁路数据网还处于简单粗略的监控阶段,因此对网络流量进行合理高效的建模分析,预测网络流量趋势迫在眉睫。
针对网络流量建模预测,科研人员提出了很多优秀的模型和算法[2],例如自回归滑动平均模型ARMA(Auto-Regressive and Moving Average Model),但ARMA模型不能表示长相关性。
基于Logistic模型的铁路乘车系数计算与客运量预测
基于Logistic模型的铁路乘车系数计算与客运量预测发布时间:2022-05-06T06:09:18.703Z 来源:《科学与技术》2022年2期作者:李传松1,葛琦2 [导读] 铁路客运量预测方法十分多样李传松1,葛琦21. 南京东站,南京 210000;2. 南京邮电大学,南京 210000摘要:铁路客运量预测方法十分多样,对于有历史运量积累地区,直接采用回归预测或者其他趋势外推预测方法均能得到很好的预测结果。
但对于无历史运量区域客运量的预测,需要调查得到区域人均出行频率即乘车系数,本文主要介绍Logistic模型计算铁路乘车系数方法,采用该方法计算得到全国居民乘车系数,通过乘车系数法快速计算预测新线路的铁路客运量,为运输方案提供依据。
关键词:铁路客运量;乘车系数;交叉分类法;客运量预测;Logistic模型区域的铁路客运量与各地市人口和经济特性密切相关,经济发达、人口众多、流动人口频繁地区铁路客运量大。
目前各类预测铁路客运量方法多样,对铁路客运量进行拟合,预测未来年客运量。
但是目前许多新建设线路均无历史运量积累,无法构建回归预测模型,也无法采用曲线拟合进行趋势外推。
在铁路领域可以入户调查得到铁路人均出行频率,但该方法耗时耗力。
对于铁路系统而言目前已经积累大量数据,可以借鉴城市交通规划中交叉分类法,利用铁路已有的各类客运量数据,计算得到不同城市居民的铁路乘车系数,根据区域经济相互情况比照选用适合的乘车系数,能够较为精确反映出新建线路客运量。
1 交叉分类法和乘车系数法介绍1.1 交叉分类法介绍在城市交通规划理论中交通量预测普遍采用交叉分类法,该方法首先在美国Puget Sound区域交通调查中提出,在美国的城市交通规划广泛应用,国内城市交通规划中也有应用。
交叉分类法是以家庭为单位。
通过长期大量的基础交通调查数据得到美国不同家庭交通出行率,因此只需要预测到规划年家庭数量然后分别乘以不同家庭出行率,即可得到区域交通产生量。
ARMA模型在对我国铁路月发送旅客数进行预测中的运用
ARMA模型在对我国铁路月发送旅客数进行预测中的运用龚海涛(鞍山师范数学系,093班25号)摘要:本文利用数学计算软件MatLab,以我国2002~2010年的铁路月发送旅客数为例建立ARMA模型,进而预测2011年铁路月发送旅客数。
预测值与真值相符,模型正确。
关键词:时间序列;MatLab;铁路月发送旅客数;ARMA模型长期以来,铁路运力有限一直是困扰着我国的一个问题,每年春运都有很多人无法买到回家车票,然而若是一味新建铁路,又会造成淡季的巨大浪费。
如果能对铁路月发送旅客数进行预测,再根据预测数据来安排铁路基建及列车调度,就会避免浪费又会使资源得到合理利用,最直观的好处就是可以使更多人能在春节回家了。
本文将通过分析2002年~2010年的铁路月发送旅客数,建立合理的ARMA模型,对2011年的铁路月发送旅客数进行预测。
1.模型的建立ARMA模型是一类常用的随即时间序列模型,由Box和Jenkins创立,简称B-J方法。
在B-J方法中只有平稳的时间序列才能直接建立ARMA模型,这就要求时间序列y t满足:(1)对任意时间t,其均值恒为常数;(2)对任意时间t和s,其自相关数只与时间间隔t-s有关,而与t和s的起始点无关。
这样时间序列y t的统计特征不随时间推移而变化,称为平稳时间序列。
建立平稳时间序列y t的ARMA模型,其具体形式如下y t=φ1y t-1+φ2y t-2+…+φp y t-p +e t-θ1e t-1-θ2e t-2-…θq e t-q其中y t=φ1y t-1+φ2y t-2+…+φp y t-p +e t为p阶自回归模型,记作AR(p),待估参数φ1,φ2,φp称为自回归系数;y t= e t-θ1e t-1-θ2e t-2-…θq e t-q为q阶滑动平均模型,记作MA(q),实参数θ1, θ2, …, θq为滑动平均系数,是模型的待估参数。
通常情况下,自回归滑动平均模型的建模过程为一下几个步骤:(1)时间序列的分解:因为铁路运量随着我国的经济发展而逐年增长,而且季节波动较大,所以需对其进行分解,消除趋势项和季节项,只保留随机项。
基于线性回归-马尔可夫模型的铁路客运量预测
基于线性回归-马尔可夫模型的铁路客运量预测
李晓东
【期刊名称】《铁道运输与经济》
【年(卷),期】2012(34)4
【摘要】随着我国经济的快速发展和社会进步,旅客出行更加注重运输的便捷性、舒适性、安全性等,客运量规模和增长速度是衡量铁路运营效果的一项重要指标.在分析各种客运量预测模型的基础上,通过对线性回归预测模型的结果进行马尔可夫链改进,可以提高铁路客运量预测的准确性,但回归-马尔可夫预测模型的应用还需要不断完善.
【总页数】4页(P38-41)
【作者】李晓东
【作者单位】沈阳铁路局沈阳客运段,辽宁沈阳 110013
【正文语种】中文
【中图分类】O211.62;U293.1+3
【相关文献】
1.基于灰色关联理论与多元线性回归模型的铁路客运量预测
2.基于灰色马尔可夫链模型的铁路客运量预测研究
3.基于灰色线性回归模型的哈尔滨铁路枢纽客运量预测研究
4.基于灰色线性回归组合模型铁路客运量预测
5.基于灰色马尔可夫模型的烟台市铁路客运量预测研究
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可以看出数据与模型较为相符,于是 客流量-天分布函数y1=7118sin(0.8491t)+52894
(t=1,2,3∙∙∙31)
5.2 灰色关联分析模型
经排序得 1-3 日客流总数-车次关系图条线图
1-3日客流总数-车次关系图
总人数
0
1000
2000
3000
4000
5000
6000
D06 D02 D15 D08 D16 D09 D04 D07 D14 G12 G18 G25 G20 K04 G09 D10 D05 K06 G10 K18 D12 G28 D13 G24 D17 G13 G06 G01 G08 G04 G11 D03 T01 D11 G22 D19 G14 G19 G05 K02 G26 G03 G23 G16 G21 G17 D18 K15 G07 K01 K10 K07 K17 K11 G27 G15 K16 G02 Z02 K12 K08 K03
16000 14000 12000 10000
8000 6000 4000 2000
0
客流量-车站分布图
二. 关键词
铁路客流规律 车辆停靠优化 客流量预测 灰色关联分析法
三. 符号说明
D:时间变量:天数 H:时间变量:小时 ρ:灰色系统关联分析分辨系数 ������1:客流量-D 分布函数 ������2:客流量-H 分布函数 ������3:车次运载贡献率 ������4:车站比例密度 ������5:客流量-平均气温关系函数 ������6:客流量-区间里程分布函数
G11
0.014531 D11
0.014039
G28
0.019578
G12
0.026168 D12
0.019916
K03
0.002142
G13
0.017426 D13
0.018748
K07
0.006127
G14
0.011405 D14
0.027326
K01
0.007198
G15
0.005259 D15
B 题 铁路旅客流量预测
一. 摘要
旅客流量的了解和预测对铁路的发展方向和市场的准确把握非常重要。我们通 过对该铁路公司 ZD190 站至 ZD111 站区段的客运情况分析,对客流量天分布,时 分布,车次,车站,天气,区间,等方面的影响进行考虑对客运专线的客流规律 进行了计算和分析,由于系统的信息存在的不完备性,我们采用了灰色关联分析 法计算各个因素间的关联程度 [1],用 Matlab 进行曲线拟合与方程计算,合理构 建客流量预测模型,对未来两周的客流量进行了预测,并对预测结果进行了检验 与分析。针对 D02~D19 车次,进行了车辆配置和车站停靠方案的优化设计。
车次 D18 D19 G18 G19 G20 G21 G22 G23 G24 G27 K10 K08 T01 G26
贡献率 0.008153 0.012824 0.02421 0.011193 0.023602 0.00824 0.01319 0.008761 0.017783 0.005307 0.006639 0.002557 0.014416 0.008993
20000
10000
0
-4
-2
0
2
4
6
8
可以看出在[-2,7.5]温度区间内客流量与平均气温呈线性关系,设曲线方程为 y=ax+b,则由 Matlab 计算得
a=3029 b=23427 即������5=3029x+23427 作散点 回归直线图
相关系数:0.829088824 标准误差:6051.114716 所得回归直线较为吻合数据点。
平均气温 0.5 -2 -1.5 -1
1月2日
客流量 30917 16149 27517 27896
平均气温 3 1 0 2
1月3日
客流量 48314 25321 40501 42828
平均气温 7.5 4 3.5 4.5
作客流量-平均气温散点图
客流量-平均气温关系图
60000
50000
40000
30000
1-3日客流总数-车次关系图
总人数
0
1000
2000
3000
4000
5000
6000
Z02 K06 K01 K07 K03 G28 G26 T01 K08 K10 G27 G24 G23 G22 G21 G20 G19 G18 D19 D18 D17 D16 D15 D14 D13 D12 D11 D10 D09 D08 D07 D06 D05 D04 D03 D02 K16 G25 K04 K12 K15 G17 G16 G15 G14 G13 G12 G11 G10 G09 G08 G07 G06 G05 G04 G03 G02 K02 K18 K17 G01 K11
100000 80000 60000 40000 20000 0
ZD121 ZD062
车站-客流量关系图
ZD022 ZD192
1 ZD143 ZD120 ZD190-02 ZD326
ZD370 ZD250
ZD311 ZD111-02 ZD190-01 ZD111-01
由 Matlab 得四条函数图线
四. 问题假设
1. 假设客流规律不受特殊或极端情况(大型节假日)的影响。 2. 总体样本数据具有普适性和代表性。
五. 模型建立与求解
5.1 客流量-D 变化关系模型
我们对 2015 年 1 月各天的客流量进行了统计,将所得数据输入 Matlab 作 图,得到
由图像可以看出客流量-天分布具有一定的周期性,假设客流量的天分布呈正弦关 系,设
车次运载贡献率表
车次 K15 K12 K04 G25 K16 D02 D03 D04 D05 D06 D07 D08 D09 D10
贡献率 0.007739 0.00412 0.023524 0.024055 0.00523 0.037236 0.014474 0.029034 0.022839 0.053417 0.028667 0.031504 0.030404 0.023351
第 i 组数据关联系数公式
������������������
=(������������−������������) ������������������+������(������������−������������)������������������
|������������������−������������������|+������(������������−������������)������������������
ZD111-01 ZD111-02 ZD311 ZD326 ZD192 ZD022 ZD250
车站客流量占总客流量比例表
0.259953
ZD062
0.020759
ZD120
0.02045
ZD121
0.161993
ZD143
0.03936
ZD370
0.004716
ZD190-02
0.188689
ZD190-01
40000
20000
0
ZD111-01 ZD111-02 ZD311 ZD062 ZD120 ZD121
1 ZD326 ZD143
ZD192 ZD370
ZD022 ZD250 ZD190-02 ZD190-01
可见不同车站的客流量有较大的差异,同模型Ⅲ,假设客流量为车站的函数,按 各车站 1-3 日客流总量由小到大的顺序将车次排序,得排序后车站-客流量关系柱 状图
由客流量均值-H 曲线,用 Matlab 对各阶多项式进行曲线拟合,比较拟合曲 线,当阶数为 14 时拟合程度较好,得
由图像可看出曲线与数据拟合程度较好,于是
客流量-H 分布函数y2=0.0004������8 − 0.0046������7 + 0.0331������6 − 0.1689������5 +
0.033453
K06
0.022193
G16
0.008491 D16
0.031408
Z02
0.004718
G17
0.008192 D17
0.017561
5.5 车站-客流量 天气模型
通过对 1-3 日各车站客流量的统计,我们得到车站-客流量关系柱状图
100000
车站-客流量关系图
80000
60000
针对所得数据,为了解决数据量较少和周期较短的问题,我们考虑引入灰色
关联分析模型 [2]。灰色关联分析模型能更好的寻求系统中各因素之间的数值关
系,对于一个系统发展变化态势提供了量化的度量。
设反映系统特征的参考数列
比较数列
xt1 ������������2 ···������������������
������������1 ������������2 ···������������������ 对参考数列和比较数列进行无量纲化处理
可见不同车次的客运量确实有较大的差别,经计算得各车次的运载贡献率表
车次 K11 G01 K17 K18 K02 G02 G03 G04 G05 G06 G07 G08 G09 G10
贡献率 0.005722 0.01621 0.005789 0.020852 0.009697 0.004747 0.008896 0.015853 0.010315 0.01676 0.007652 0.015882 0.023399 0.020881