数学建模之火车客流量预测
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
铁路旅客流量预测客 (1)
摘要 (1)
一.问题重述 (1)
1.1引言 (1)
1.2问题的提出 (2)
二.问题分析 (2)
2.1根据不同的限制条件整理数据,分析数据的分布 (2)
2.2利用问题一中的结论,建立数学模型 (2)
三.模型假设与符号说明 (2)
3.1.1模型假设 (2)
3.1.2符号说明 (2)
3.2.1模型假设 (3)
3.2.2符号说明 (3)
四.模型的建立与求解 (3)
4.1.1 数据分析处理 (3)
4.1.2利用信息增益的计算公式求出各个特征属性的信息增量 (4)
4.1.3 根据图表分析在不同的特征属性内部客流量的变化规律 (6)
4.1.3.1按车的种类分析 (6)
4.1.3.2按站点分析 (7)
4.1.3.3按时段分析 (8)
4.1.3.4按区间大小分析 (8)
4.2.1灰色预测 (9)
4.2.2问题分析与准备 (10)
4.2.3预测模型的建立 (13)
五.模型的优缺点 (14)
5.1 优点 (14)
5.2 缺点 (14)
六.参考文献 (15)
七. (15)
八.附录 (16)
铁路旅客流量预测客
摘要
铁路客流量预测,可以为制定合理的价格、改善客运站组织方式、优化铁路车辆资源配置、提高客运设备的服务能力提供帮助,对提高铁路客运运输效率具有重要的意义。
影响客流量的因素有很多,例如车次,时间,车站,区间,天气,节假日等。现在我们分析前四个因素对客流量的影响,我们首先引用信息熵概念来计算具体哪个因素对客流量的影响最大,并通过ID3算法生成决策树,根据所得生成树可以快捷方便的分析客流量规律。
在对原始数据进行研究分析后,车站对于客流量的影响最为显著,于是将车站这个因素选定为了主要变量,然后从这个主要变量着手,核心思想是通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化,这种模型对于挖掘和利用原始数据有很好的帮助,同时参考了在问题一中所得出的客流量的一般规律,最终采用累减生成的放松得到了一组灰色序列以弱化数据的随机性和预测未来客流量。
关键字:信息熵ID3算法灰色预测模型
一.问题重述
1.1引言
随着《关于改革完善高铁动车组旅客票价政策的通知》的发布,高铁动车票价将根据市场情况自行定价。铁路部门为了保持市场的竞争力,实现利润最大化,需要了解日常铁路客运流量、淡旺季变动指数、冷热门线路的体情况,而其中对客流的预测是准确把握市场的首要条件,因此铁路客流预测的研究也成为铁路客运服务需要重点研究的方向。
然而铁路客流量受多种因素的影响,比如:“春运”期间铁路客流量骤增,导致铁路运力无法满足客户乘车需求,同时也给铁路客运组织带来巨大压力。在非节假日期间,一些冷门线路区间上座率不足,造成铁路车辆资源的浪费。因此铁路客流量预测,可以为制定合理的价格、改善客运站组织方式、优化铁路车辆资源配置、提高客运设备的服务能力提供帮助,对提高铁路客运运输效率要的意义。
1
1.2问题的提出
针对该铁路公司的ZD190(站)至ZD111(站)区段的客运专线完成以下任务:
(1)根据附件1,按车次、时段(小时)、车站、区间(两个车站之间)等条件分析客流规律。
(2)考虑相关因素的影响,构建客流量预测模型,并预测未来两周的客流量。
二.问题分析
2.1根据不同的限制条件整理数据,分析数据的分布
首先整理数据,剔除多余数据只留下ZD190至ZD111之间的客流量信息,统计客流量数据并整理出平均值,制作出一张主表。之后根据主表分别以车次,时段,车站,区间等条件划分客流量制成四张分表,根据分表的信息,引用信息熵等概念具体分析具体哪个条件对客流量的影规力较大,并通过观察与数据统计分析在分别以车次,时段,车站和区间划分数据时客流量的分布规律。
2.2利用问题一中的结论,建立数学模型
在认真分析了第一问中得出的客流规律以后,考虑到铁路客流量问题中一部分信息是已知的,另一部分是未知的,且系统内各部分因素间关系具有不确定性这些特点,建立灰色系统预测模型,通过一些基本假设的建立来简化现实铁路系统中较为复杂的各种情况,通过鉴别节假日、周末、平时的不同车次、时段、车站、区间之间发展趋势的相异程度综合考虑各种如各车站里程、区段各站点气象等现实条件的影响,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,以此来预测未来两周的客流量。
三.模型假设与符号说明
3.1.1模型假设
1.通过信息熵公式求得不同条件的信息熵。
2.实际情况与模型的情况相同。
3.1.2符号说明
2
3.2.1模型假设
1.假设天气不影响客流量。
3.2.2符号说明
四.模型的建立与求解4.1.1 数据分析处理
3
4.1.2利用信息增益的计算公式求出各个特征属性的信息增量
在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带来的信息越多,该特征越重要。在认识信息增益之前,先来看看信息熵的定义。
熵这个概念最早起源于物理学,在物理学中是用来度量一个热力学系统的无序程度,而在信息学里面,熵是对不确定性的度量。在1948年,香农引入了信息熵,将其定义为离散随机事件出现的概率,一个系统越是有序,信息熵就越低,反之一个系统越是混乱,它的信息熵就越高。所以信息熵可以被认为是系统有序化程度的一个度量。
假如一个随机变量的取值为,每一种取到的概率分别是,那么的熵定义为
4