列车运行实绩大数据分析及应用前景展望

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据(Big data),或称巨量资料,指所涉及的
资料量规模巨大到无法透过目前主流软件工具进行分析,而需结合其所在行业特征,研发合适的软件工具以能够在合理时间内达到撷取、管理、处理、并整理成为帮助经营决策具有积极意义的信息。

大数据一般具有4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(精确)。

列车运行实绩数据是典型的大数据,我国铁路网规模巨大,每天运行约28 000列列车,产生海量的列车运行实绩数据,包括列车在各个站的实际到发时刻、列车对轨道区段的占用和释放时刻、信号系统的状态变化数据等。

1 列车运行实绩数据分析
研究数据为京沪高铁2013年12月1日—2014年1月15日的数据。

通过对图定列车运行情况和实际列车运行情况进行比较,分别对列车停站时间、区间运行时间进行了频率分析,对其运行晚点情况进行评价。

然后通过对数据的初步处理,分析列车区间运行时间与发车晚点的关系,以及列车停站时间与到达晚点的关系。

1.1 区间运行时间分析
选取京沪高铁A站—B站两个中间站的数据,进行区间运行晚点时间分析,选取图定运行时间为22 min的列车,绘制实际列车运行时间的频数分布直方图和频率表(见图1)。

从图1中可以看出85.6%的列车正点到达,只有14.4%的列车发生晚点,但晚点偏离不大,证明绝大多数列车按图行车。

但是同样可以看出,79.2%的列车实际运行时间小于图定运行时间,因此该区间的冗余时间较大,为节约区间能力,提高区间能力利用率,该区间的列车运行时间应略有缩短。

1.2 车站停站时间分析
选取B站对列车停站时间进行分析,选取图定停站时分为2 min的列车,绘制实际列车停站时间的频率分布
列车运行实绩大数据分析
及应用前景展望
刘 岩:中国铁道科学研究院,高级工程师,北京,100081
郭竞文:北京交通大学轨道交通控制与安全国家重点实验室,硕士研究生,北京,100044
罗常津:中国铁路信息技术中心,工程师,北京,100844
孟令云:北京交通大学轨道交通控制与安全国家重点实验室,副教授,北京,100044
摘 要:基于京沪高铁一个半月的列车运行实
绩数据,分析得出列车实际区间运行时分和停站
时分的分布特征、列车区间运行时分与发车晚点
之间的关系、列车停站时分与到站晚点之间的关
系,阐述了大数据分析对优化列车运行图编制和
辅助调度指挥工作中的作用,并展望列车运行大
数据分析的应用前景。

关键词:大数据;列车运行实绩数据;列车运行
图;调度指挥
中图分类号:U292.4+5 文献标识码:A
文章编号:1001-683X(2015)06-0070-04

直方图和频率表(见图2)。

从图2可以看出,96.2%的列车正点停站,只有3.8%的列车发生停站晚点,但晚点偏离不大,从而证明绝大多数列车按图停车。

但同样存在74%的列车在B站的实际停站时分小于图定的停站时分,因此在该站的冗余时间较大,为节约车站能力,该站的列车停站时间应略有缩短。

1.3 区间运行时间与列车晚点关系
由于列车进站之前运行速度较低,因此准点列车和早点列车在进站之前最后一个闭塞分区具有较多的冗余时间,使之与晚点列车在区间的开行方案具有较大差别。

因此,列车区间运行时分受到出发站发车晚点的影响。

选择在A站的发车时间数据和A站—B站的区间运行数据来分析区间运行时分和列车发车晚点之间的关系。

以列车从A站出发晚点为横坐标,以列车在A站—B站的实际运行时间为纵坐标,绘制散点图并生成拟合曲线,其中列车在区间的平均运行时间为22.8min。

为了避免个别数据对分析结果的影响,在距离下界35%处绘制参
考线。

随着在A站的出发晚点增大,为了“赶点”,列车的区间运行时分逐渐减小,但减小幅度不大,保持在列车的区间最小运行时间(20min)以上(见图3)。

1.4 停站时间与晚点关系
为了研究列车在到达车站的停站时间和列车在区间
图2 图定停站时间为2 min的列车实际停站时间分布
图3 A站出发晚点和区间运行时间的关系
图1 图定运行时间为22 min的列车实际区间运行时间分布直方图
100
19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
400
300
200
列车实际运行时间列车实际运行时间列车实际停站时分
74.0 96.2 99.7 99.8 100.0
1 2 3 1314 合计
483 145 23 1 1 653
频率
百分比 74.0 22.2 3.5 0.2 0.2 100.0
74.0 22.2 3.50.2 0.2 100.0
有效百分比累积百分比
min
min min
min
直方图
实际停站时分
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
500400300
200
1000
20 21 22 2324 25263334合计
103 369389 27 42611 596
17.3 61.96.41.5 4.5 7.01.0 0.20.2 100.0
17.3 61.96.41.5 4.5 7.01.0 0.20.2 100.0
17.3 79.2 85.687.1 91.6 98.799.7 99.8100.0
频率
百分比 有效百分比累积百分比 A
站 B 站的实际运行时间
33 32 31 30 29 28 27 26 25 24 23 22 21 20
-10 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
A站出发晚点
下界35%处
min min
运行时产生的到达晚点之间的关系,选取A站—B站的区间运行数据和在B站的停站时分数据进行分析。

在B站的图定停站时分为3min的情况下,以B站的到达晚点为横坐标,B站实际停站时间为纵坐标绘制散点图(见图4)。

在到达晚点小于等于0的情况下,由于列车不能早点发车,因此实际停站时间随着晚点的增加而减少;在到达晚点时间大于0的情况下,随着到达晚点时间的增大,列车的实际停站时间逐渐减小,由于实际停站时间要大于等于列车最小停站时分,因此列车实际停站时间的减小幅度也在逐渐减小,最终趋近于最小停站时分,并保持平稳。

为了分析到达晚点和停站时间之间的普遍规律,将图定停站时间设为0,以实际停站时间和图定停站时间的差作为纵坐标,以到达晚点为横坐标,绘制散点图并生成拟合曲线,将目标对象扩散到其他区间来研究到达晚点对停站时间的影响(见图5),得到的拟合曲线趋势与图4基本相同,因此对单个车站图定停站时间分析的到达晚点和停站时间之间关系的结论可基本推广到其他区间。

2 列车运行实绩大数据分析的应用
目前,国内已有关于铁路列车运行大数据的分析,如列车服务网络的复杂性[1]、客票数据挖掘[2]等,但关于列车运行图数据的分析和研究还不多见。

文献[3]提出了一种列车运行监控数据的预处理方法和拟合曲线回归模型,实现对运行图参数的查定与修正。

文献[4]在解决了在原始数据获取和多源数据处理的基础上,搭建了自动
化查标系统,实现了对车站作业标准时间的自动查定。

文献[5]基于轨道区段锁闭时间理论,提出了列车间晚点传播过程的构建方法。

国外对这方面的研究比较深入[6-7]。

如列车服务网络的复杂性、客票数据挖掘等,但关于列车运行图数据的分析和研究还不多见。

通过对列车运行历史数据的分析,可发现运行图中
经常出现晚点的时段和区间,从而对列车运行图做出适当的调整,例如改变列车运行图的结构或优化冗余时间的布局。

通过统计运行图中每趟列车在一段时间(如1个月)内的晚点时间平均值,然后根据列车在不同区间上的晚点情况将列车运行线着色,颜色的冷暖变化表示晚点的严重程度(见图6)。

可以清晰直观地得到列车的晚点分布情况,对合理分配冗余时间,优化列车运行图编制以及提高铁路运输服务的可靠性具有重要意义。

图4 列车在B站停站时分与到达晚点之间的关系
图5 列车停站时分与到达晚点之间的关系
图6 列车运行线晚点分布情况[8]
-5 0 5 10 15 20
列车在B 站的实际停站时间/m i n
5 4
3
2
1
晚点时间/min
晚点时间/min
11 10 9 8 7 6 5 4 3 2 1 0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11
-5 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80
10
8 309 30停站时间差/m i n
3 列车运行实绩大数据分析应用前景展望
从以下3个方面展望列车运行实绩大数据在我国铁路的应用前景。

(1)铁路客流和货流的静态分布及动态变化特征对于制定旅客列车开行方案、货物列车编组计划、编制列车运行图、车站作业计划和调度指挥具有十分重要的参考价值。

通过分析大量客流和货流历史数据并辅以客货运需求调查,进而掌握其演化规律,对优化运输组织,提升铁路运输市场竞争力具有重大意义。

(2)掌握列车运行规律,包括列车到达技术站的时间分布、列车初始晚点发生规律、列车晚点传播规律等,对调度指挥和技术站工作组织具有重要参考价值。

(3)通过分析轨道等固定资源和动车组等活动资源的历史运用数据,得出其运行状态转移规律,可以为基础设施养护和车底维修,提供重要参考依据。

参考文献
[1] 包云,刘军,李婷. 中国铁路旅客列车服务网络性
质研究[J]. 铁道学报,2012,32(12):8-15.
[2] 包云,刘军,马敏书. 车票预售期内旅客购票请求
到达过程分析与仿真[J]. 北京交通大学学报, 2012,36(6):27-32.[3] 王军,张星臣,张懿,等. 基于监控数据挖掘的运
行图参数查定与修正方法[J]. 中国铁道科学, 2011,32(4):117-121.
[4] 陈军华,张星臣,徐彬,等. 基于监控数据挖掘的
运行图参数查定与修正方法[J]. 交通运输系统工程与信息,2011,11(3): 119-123.
[5] 孟令云,Goverde RM P. 基于实际数据分析的列车
晚点传播过程构建方法与实例[J]. 北京交通大学学报,2012,36(6): 15-20.
[6] TeshaleFilleBayissa. How do Delays along the Way Influence
Delays to Final Destination?[D]. Trondheim:NTNU,2013.
[7] PavleKecman,R M P Goverde. Calibration of a Data-driven
Railway Trafficprediction Model[C]//Proceedings of the 3rd International Conference on Models and Technologies for Intelligent Transport Systems. Dresden:DUTpress,2013.
[8] Norio Tomii. Beyond the wave of“Big Data”—How We
c a n R e a l i z e R o b u s t T r a i n O p e r a t i o n u s i n g T r a i n O p e r a t i o n R e c o r d
Data?[J]. Japanese Railway Engineering,2013(179): 1-6.
责任编辑 杨环
收稿日期 2015-04-15。

相关文档
最新文档