基于一卡通数据的公交站点识别方法分析与研究

合集下载

城市公共交通一卡通支付系统研究

城市公共交通一卡通支付系统研究

城市公共交通一卡通支付系统研究随着城市化进程的加速,城市公共交通对于人们的生活越来越重要。

与此同时,随着科技的不断进步,城市公共交通一卡通支付系统也在不断发展和完善。

本文将对城市公共交通一卡通支付系统的研究进行探讨,分析其优势、存在的问题以及未来的发展趋势。

一、背景介绍城市公共交通一卡通支付系统是一种无现金支付方式,可以实现在公共交通工具上的刷卡支付。

它的出现极大地方便了人们的出行,提高了城市公共交通系统的运营效率。

一卡通支付系统不仅可以在公交车、地铁等交通工具上使用,还可以在周边服务设施如停车场、商场等进行支付。

二、优势分析1. 方便快捷: 一卡通支付系统可以使乘客不再需要携带零钱,只需刷卡即可完成支付,省去了找零的繁琐过程,大大提高了乘坐体验。

2. 安全可靠: 一卡通支付系统通过加密技术和实名认证等手段保障支付安全,减少了携带现金被盗的风险,提升了用户的支付信任度。

3. 数据共享: 一卡通支付系统可以收集大量的乘客出行数据,这些数据对于城市规划、交通流量掌控和公共交通线路优化等方面具有重要意义。

4. 使用广泛: 一卡通支付系统可以兼容不同类型的交通工具,无论是公交车、地铁还是出租车等,都可以使用同一张卡片进行支付,提高了支付的统一性。

三、问题与挑战1. 技术难题: 一卡通支付系统的建设必须依赖信息化技术,包括网络通信技术、数据处理技术等,这对于中小城市来说可能存在较大的技术难题。

2. 信息安全: 一卡通支付系统涉及大量用户的个人信息和资金交易,系统的安全性至关重要。

目前,一些城市公共交通一卡通支付系统存在着信息泄露和盗刷等风险。

3. 运营模式: 城市公共交通一卡通支付系统的运营模式涉及到政府、公交公司、商家等多方,各方之间的协调与合作是一个复杂的问题。

4. 费用问题: 城市公共交通一卡通支付系统的建设、维护和更新都需要一定的费用投入,这对于一些资源匮乏的地方来说可能是一个挑战。

四、未来发展趋势1. 改进技术: 随着互联网的快速发展,城市公共交通一卡通支付系统可以更好地与其他互联网应用相结合,提供更多的便利和服务。

公交站牌识别问题研究(课堂PPT)

公交站牌识别问题研究(课堂PPT)
2 井岗 VS 井岗村 井岗公交站在长江西路高架桥结尾处,井岗村在靠近合肥绕城高速长江路出 口处,位置相似,名字相似,导致了很多人误以为这是一个公交站,两站又 是一字之差,好几公里的距离。
1


3 .蓬莱路 VS 蓬莱路公交站 这个都会以为是一个公交站,一个在紫云路上,一个是蓬莱路公交始发站。
重庆市主城区公交站名命名调整规范(试行 )
5
相关理论
一、关于公交站牌
• “公交站牌” 是一种俗称, 并未有严格的定 义,在各项交通法规中,也并未有详细的描述 和专门的规定。 随着生活水平的提高以及计 渐渐渗透到人们日常生活的各个角落, 公交站 牌的设计引起了社会的广泛重视。
• 可以这样认为, “公交站牌” 是一种分布于 各个公共交通线路站点的,向公交乘客提供、 传达公共交通车辆相关信息的或长期、 或时 的物质媒介。它的形状、大小、高度、材料及 所承载的有效信息量都应有相应的法规。
4 .天都路 VS 天都路口 都是经开区公交集团的车子,一个在繁华大道上,一个在紫云路上,一字之差, 相差四公里左右。
5 . 七里塘 VS 七里塘镇 七里塘在蜀山区,七里塘镇在新站区新蚌埠路,两个也是一字之差,相差好几十 公里。
6. 谢岗 VS 谢岗村 谢岗在马鞍山路上,合肥工业大学南区东门,谢岗村在北三十岗附近,相差了 20公里。
• 而静态的标识—路牌和站牌,无论在国内或是国外 都有悠久的历史, 并仍然被世界的绝大部分地区 所采用, 是路面交通信息传达媒介的主要组成部 分。其相对优势显而易见:制作成本较低, 便于 维护和管理, 占地面积小, 易于被人们接受等。
7
相关理论
三、关于信息结构
• 从上述对公交站牌的描述我们可以肯定,无论公交站牌的形式和种类如何, 它的本质是传达给人们信息。因此,对公交站牌进行设计的关键在于:如何 组织并使人获取这些信息。公交视觉信息系统的设计有其特殊性, 公交系统 的运行效率对整个城市的发展效率有着极其重要的影响,因此,设计必须保 证信息具有快速、方便、易于常人识别等特征。

基于公交IC卡数据的上车站点推算研究

基于公交IC卡数据的上车站点推算研究

基于公交IC卡数据的上车站点推算研究马晓磊;刘从从;刘剑锋;陈锋;于海洋【摘要】In order to analyze urban bus passengers' travel characteristic, this paper proposes several data mining algorithms for boarding stop inference based on IC card and GPS data. For those buses with GPS devices, a data-fusion method with GPS data is developed to estimate individual passenger's boarding stop. For those buses without GPS devices, an improved Bayesian decision tree algorithm with varying steps is presented to calculate the likelihood of each possible boarding stop. In addition, Markov Chain optimization technique is applied to reduce the computational complexity. Empirical data from Beijing transit route are used to validate the effectiveness of the proposed algorithms. The results demonstrate that the accuracy of identified boarding stop can be guaranteed and the algorithm complexity can be well controlled to meet the requirements of practical application. As a result, the methods can be widely adopted for urban public transportation system.%为了分析城市公交乘客的出行特征,本文利用公交IC卡及GPS数据对公交IC卡乘客上车站点推算进行研究.针对安装车载GPS设备的车辆,运用GPS数据与IC卡数据融合算法进行推算;对于无车载GPS设备的情况,为适应一票制IC卡数据挖掘,对贝叶斯决策树算法进行改进,允许节点跳跃,推算上车站点,并且利用Markov链特性降低算法的运算复杂度.同时,本文以北京公交数据为例,对提出的两种方法进行验证.结果表明,利用本文提出的方法推算上车站点,3站之内误差的准确率达到90%以上,算法在兼顾算法精度的同时合理地控制了运算复杂度,可以实际运用于城市公交系统.【期刊名称】《交通运输系统工程与信息》【年(卷),期】2015(015)004【总页数】7页(P78-84)【关键词】城市交通;公共交通;上车站点推算;贝叶斯决策树算法;IC卡数据;GPS数据【作者】马晓磊;刘从从;刘剑锋;陈锋;于海洋【作者单位】北京航空航天大学车路协同与安全控制北京市重点实验室,北京100091;北京航空航天大学车路协同与安全控制北京市重点实验室,北京100091;北京城建集团有限责任公司,北京100037;北京交通发展研究中心,北京100073;北京航空航天大学车路协同与安全控制北京市重点实验室,北京100091【正文语种】中文【中图分类】U491Abstrraacctt:: In order to analyze urban bus passengers' travel characteristic, this paper proposes several data mining algorithms for boarding stop inference based on IC card and GPS data. For those buses with GPS devices, a data-fusion method with GPS data is developed to estimate individual passenger’s boarding stop. For those buses without GPS devices, an improved Bayesian decision tree algorithm with varying steps is presented to calculate the likelihood of each possible boarding stop. In addition, Markov Chain optimization technique is applied to reduce the computational complexity. Empirical data from Beijing transitroute are used to validate the effectiveness of the proposed algorithms. The results demonstrate that the accuracy of identified boarding stop can be guaranteed and the algorithm complexity can be well controlled to meet the requirements of practical application. As a result, the methods can be widely adopted for urban public transportation system.Key worrddss:: urban traffic; public transit; boarding stop inference; Bayesian decision tree algorithm; IC card data; GPS data随着我国公共交通信息化建设的不断推进,公交IC卡广泛应用于公交系统,为公交线网规划、运行调度管理及公交系统辅助决策提供了重要的数据支撑.在利用IC卡数据进行公交出行分析的过程中,上车站点信息对分析乘客出行规律是必不可少的.但是,我国目前大部分公交采用的是一票制收费模式,即乘客仅在上车刷卡收费,系统中的记录信息仅有乘客上车刷卡时间,无上下车站点信息.因此,准确、快速地推算乘客上车站点,实现IC卡数据有效利用,对于提高公交运营效率,促进城市现代化,具有重要的现实意义.近年来,围绕基于公交IC卡数据的上车站点推算,国内外学者开展了大量研究工作.在国外,Jinhua[1]结合AFC及AVC数据获取上车站点,Barry[2]等人利用GPS数据和IC卡数据进行融合,获取到公交车行驶日志,利用行驶日志及融合数据推算上车站点.然而,国外城市公交系统与我国城市公交系统差异性较大.在国内,针对无GPS数据下单一票制的公交车上车站点推算问题,戴宵等[3]提出了对公交卡乘客的刷卡时间进行聚类分析判断乘客上车站点的方法,郭婕等[4]在对上车站点进行聚类分析的基础上,重点分析了相邻车站的时间间隔,于勇等[5]结合公交运营调度时刻表所提供的车辆及其发车信息,推算各车次到达各站点的时间,提高了上车站点推算精度.但以上研究在数据不完整情况下准确率难以保证.针对具有GPS数据情况,陈君、杨东援[6]将公交IC卡数据与公交GPS数据进行关联,结合调度数据推算公交IC卡乘客上车站点.徐建闽[7]等利用公交GPS定位数据和GIS电子地图中的车站位置获取公交车的到站地点.因此,本文在充分考虑基础数据缺失的基础上,利用海量公交数据进行深度挖掘,对有无车载GPS数据的情况,分别提出了IC卡数据和GPS数据融合算法和基于移动步距的贝叶斯决策树算法,用于上车站点的推算,同时以北京市公交系统为例对算法的有效性进行分析和验证.2.1 数据采集在进行上车站点推算时,涉及到的公交基础数据主要有IC卡数据、GPS数据和GIS站点位置数据.在进行数据采集时,需要采用一些处理海量数据的技术,如分布式数据库管理、并行计算等,将这些多源数据有效地管理,利用数据统计特性进行初步挖掘和存储.2.2 数据解析和质量控制在进行上车站点推算前需要对采集到的数据进行解析和质量控制.主要内容包括:对错误和缺失数据进行纠正和补全;排除冗余文件、错误文件及无法识别计价方式的车辆.在城市公交系统中,为实现车辆运营的实时监控与智能化调度,部分车辆安装了公交车载GPS设备.但是,由于GPS数据只包含速度、经纬度等信息,不包含车辆行驶方向,必须利用已知的公交GIS数据来估计公交车到站时间和站号,并通过获取的到站时间等推算信息和公交IC卡数据进行融合,从而得到一票制IC卡数据的上车站点信息. IC卡数据与GPS数据融合处理的流程如图1所示.3.1 数据整合与匹配在进行IC卡和GPS数据融合之前,需对数据进行整合和匹配,由于GPS数据通常存在于文本文件中,需要将有用的信息进行提取,并存储到GPS数据库中,同时通过车辆信息表和GPS数据中的SIM卡信息,获取线路号与车辆号,并更新到数据库,完成数据预处理.3.2 公交行驶方向和到站时间的推算Step 1车辆行驶方向的推算.本文利用站点信息辅助判定车辆的行进方向.例如:657路,上行,站点7,造甲村,所对应link号为5 713,起点为4 703,终止点为4 676,起点的坐标为(39.844 709 38, 116.295 533 09),终点的坐标为(39.842 489 38,116.298 062 45),根据经纬度确定站点方向,并与GPS记录的方向信息进行比对,从而确定公交行驶方向.Step 2到站时间的推算.遍历每一个站点,检索站点方向和GPS记录方向符合的所有记录,获取距离站点最近的GPS轨迹点,通过计算车载GPS轨迹点与站点之间的距离实现车辆到站时间的推算.图2所示的五角星即为距离该站最近的GPS数据点.其中,对于没有获取的到站时间,利用时间关系搜索原始GPS数据补全,具体的算法流程如图3所示.3.3 IC卡数据和GPS数据的融合将系统中交易记录与推算的到站时间进行逐条比对,确定距离该站点到站时间最近的数据,将该交易记录标记为该数据的站点号.对于交易时间与到站时间相差大于5 min的记录,默认为无匹配的站点数据,匹配好的IC卡数据片段如表1所示.3.4 算法验证由于车辆很难准确停靠在停车站点位置,并且推算的车辆到站时间与刷卡时间进行匹配会出现错误,所以与车辆到站时间相比,车辆开门时间与刷卡时间更加匹配.本文采用人工调查的方式验证数据融合算法的准确性.人工调查使用手持GPS设备获取651路公交车GPS数据,手持数据是由若干志愿者手动记录的每15 s公交车地理空间位置信息,调查时间为2011年1月13日8:00 AM–1:00 PM,共手动记录75辆车开门时间.利用车辆开门时间与417位乘客刷卡时间进行匹配,并判定推算出的上车站点为真值.利用GPS数据融合算法推算上车站点,并与真值进行比对,结果表明,上述算法共准确推算出408个上车站点记录,误差为1站的共11个,无误差大于或等于2个站点的记录,上车站点推算准确率达到97.4%. 对于未安装车载GPS的公交车无法获取车辆准确的到站时间,仅有IC卡交易时间作为已有数据.针对该情况,本文对传统的贝叶斯决策树算法进行了改进,提出了基于移动步距的贝叶斯决策树算法,允许结点跳跃,用于上车站点的推算.算法中决策目标是判定刷卡记录所在聚类具体对应的实际站点,决策的依据是计算并比较当前聚类对每个候选站点的隶属度.具体算法流程如图4所示.4.1 IC卡刷卡时间聚类交易刷卡时间按照站点进行分类.在聚类过程中,一票制系统无上车站点的名称和标识,同时对于某个站点存在无交易的概率,即相邻的两个类别不等于两站点相邻.4.2 换乘关系推算假设乘客由前一条线路换乘到一票制线路,可得到3种换乘关系:分段计价换一票制、地铁换一票制和一票制换一票制.对于第一种和第二种情况,由于分段计价和地铁IC卡数据下车站点已知,根据换乘距离和换乘时间得到相应的一票制上车站点.对于第三种情况,由于并不确定两条单一票制线路的方向,所以假设在规定的换乘距离和换乘时间限定下得到的上车站点唯一,则把该站点设为一票制的上车站点.实际上得到的换乘关系包括两个站点,分别是上行换乘站点和下行换乘站点.4.3 基于移动步距的贝叶斯决策树的公交站点推算公交站点推算主要分为生成速度特征矩阵、分割聚类序列和分割片段处理等步骤,具体如下:Step 1速度特征矩阵的生成.站间速度可表示为:式中d为站间距;t为站间刷卡时间间隔.站间速度的概率密度函数可以表示为:式中为归一化的站间速度;u和σ分别为任意两站站间速度的平均值和标准差,数据取自GPS到站时间表,包括每辆车的站间速度.其中平均速度分时段计算.对每一辆公交车来说,任意两站点间的平均站间速度为式中Vij为站点i到站点j的站间速度,Dij为站点i到站点j的站间距,Dn为站点n到站点n-1的站间距,Vn为站点n到站点n-1的站间速度.站间距从站距表中获得,站间速度从到站时间表中获得.Step 2分割聚类序列.在将聚类序列分割为若干片段过程中,需要将生成的聚类序列关联起来,其中每个节点都包含可能的若干换乘站点,并且从车次分割点开始分裂.因为从车次分割点处理不确定因素最小.图5是一分割好的聚类序列,聚类对应的时间差为20 min,每个片段的两个端点均对应可能的换乘站点.对于片段1,可能的起始点为上行5,下行13;对于片段2,可能的终止点为上行11,下行2,共4种可能的组合,如表2所示.Step 3分割片段处理.为了解决车次分割和滞后站点问题,本文通过基于片段概率函数方式对每个片段进行处理.已知每个相邻站点间的距离和速度,先计算任意两相邻站点的最大和最小旅行时间,再计算总旅行时间方差和均值,并且判定该旅行时间服从正态分布.设根据聚类的时间差tij,可得到所在片段的概率密度函数式中uij,σij分别为站点i到站点j的平均速度和标准差.在给定置信度下,其速度的置信区间为:[uij-z⋅σij,uij+z⋅σij],其中z为置信区间对应的临界值.假设在置信度为0.95,对应临界值z= 1.96条件下,四个可能的组合概率密度分别为0.54,0.87,0.000 3,0.因此,组合2,即聚类片段从上行5开始到下行2终止,概率最大,结果如图5所示,与实际站点一致,实现基于贝叶斯决策树算法的IC卡时间聚类公交站点推算.4.4 算法优化原始贝叶斯决策树算法的算法复杂度为O(mn),其中m表示候选站点的个数,n 代表整个站点序列的长度.在决策树构造过程中,若计算节点数过多,会导致决策树过度膨胀.降低算法复杂度的方法是充分利用Markov链特性,即保留节点概率大于删除节点概率.式(5)表明,在决策树第n+1层,路径概率最大的唯一站点序列为Sk+1,Sk,Sk-1,…,S1.即对于决策树为n层节点来说,第n+1层的节点的选取仅仅与第n层的节点有关.式中Xn表示第n层站点序号;P表示节点的隶属函数.由上可得,基于Markov链的贝叶斯决策树算法的复杂度为O(mn) .通过该方法可在不损失算法精度的前提下,把指数级别贝叶斯决策树生成算法的计算量降到线性级别.4.5 算法验证本文针对一票制IC卡数据,对单一票制的线路进行上车站点推算,并将结果与通过GPS到站时间算法得到的上车站点进行比对.使用的IC数据是22路公交数据,时间为2010年4月7日.22路的站距表和实际运行轨迹相符,基础数据完善,不存在站距表缺失情况.所用参数为默认参数,即5%路径选择概率误差界限,3个树杈数,30 min车次强行分割时间间隔.算法所得结果如表3所示,22路公交共有12 675刷卡记录与GPS数据匹配,决策树法推算出12 043个上车站点,占总记录比重的95%.55.8%的结果与GPS数据所示结果精确匹配,3站之内误差的准确率达到总记录的91.9%.与其他大部分国家的一票制公交系统不同,国内的公交系统在乘客上车刷卡时,并不记录上车站点.因此,本文围绕公交上车站点推算问题,针对是否具备GPS数据条件分别提出了IC卡数据和GPS数据融合算法及基于移动步距的贝叶斯决策树算法.在基于移动步距的贝叶斯决策树算法中利用Markov链对算法的运行效率进行优化,在将算法复杂度降为线性的同时保持了推算精度.算法具有较好的适应性,大部分线路三个站点误差内算法精度可以达到90%以上.另外,算法较好地解决了滞后刷卡和车次分割问题.在进行站点的推算过程中,由于IC卡数据和GPS数据融合算法是基于时间来确定站点信息的,当车辆到站时间推算不够精确时,站点识别精度会受到一定影响.同时,站点识别算法依赖于GIS数据,贝叶斯决策树算法也在一定程度上依赖基础数据的准确度.因此,为了进一步提高算法精度,可采用其他辅助信息进一步完善算法,如考虑站点周围土地利用类型,通过其他关联信息联合判断上车站点等.【相关文献】[1] Barry J J, Freimer R, Slavin H. Use of entry-only automatic fare collection data to estimate linked transittrips in New York City[J]. Transportation Research Record: Journal of The Transportation Research Board, Transportation Research Board of The National Academies, Washington, D.C., 2009.[2] Jinhua Zhao. Estimating a rail passenger trip origindestination matrix using automatic data collection systems[J]. Computer-Aided Civil and Infrastructure Engineering. 2007,22(1):376-387.[3]戴霄,陈学武,李文勇.公交IC卡信息处理的数据挖掘技术研究[J].交通与计算机, 2006,24: 40-42. [DAI X, CHEN X W, LI W Y. Data mining technology research of transit IC card information processing[J]. Computer and Communications, 2006, 24: 40-42.][4]郭婕,陈学武.公交IC卡乘客上车站点确定方法及其应用[C].上海:第一届中国智能交通年会论文集, 2005. [GUO J, CHEN X W. The method confirming the station of bus IC card passengers and its application[C]. Proceedings of The 1st China ITS Annual Meeting, Shanghai, 2005.][5]于勇,邓天民,肖裕民.一种新的公交乘客上车站点确定方法[J].重庆交通大学学报, 2009,28(1):121-125. [YU Y, DENG T M, XIAO Y M. A novel method of confirming the boardingstation of bus holders[J]. Journal of Chongqing Jiaotong University, 2009, 28(1): 121-125.] [6]陈君,杨东援.基于智能调度数据的公交IC卡乘客上车站点判断方法[J].交通运输系统工程与信息, 2013,13(1):76-80. [CHEN J, YANG D Y. Identifying boarding stops of bus passengers with smart cards based on intelligent dispatching data[J]. Journal of Transportation Systems Engineering and Information Technology, 2013, 13(1):76-80.][7]徐建闽,熊文华,游峰.基于GPS和IC卡的单线公交OD生成方法[J].微计算机信息, 2008,24(8-1):221-222. [XU J M, XIONG W H, YOU F. The method of singal-line public transportation OD base on GPS and intelligent card[J]. Microcomputer Information, 2008, 24 (8-1):221-222.]。

一卡通调研报告

一卡通调研报告

一卡通调研报告引言一卡通是一种集合多种支付功能于一体的智能卡片,具有方便快捷、安全可靠等优点。

随着移动支付的普及和用户需求的不断增长,一卡通也逐渐成为了人们日常生活中的支付工具。

本报告旨在对一卡通的使用情况进行调研分析,以了解人们对一卡通的认知程度、使用频率、所关注的问题等。

方法调研过程采用了分组访谈和问卷调查相结合的方式。

首先,我们组织了一批受访者,分成四个小组进行面对面的访谈。

访谈内容主要包括一卡通的使用体验、使用场景、与其他支付方式的比较等。

然后,我们通过在线问卷的形式,对更多受众进行了调查。

问卷主要包括多项选择题和开放性题目,用于了解用户对一卡通的满意度、使用频率和支付安全性等方面的意见。

调研结果一卡通的认知程度根据访谈和调查的结果,我们可以得出以下结论:1.大部分受访者对一卡通有一定的认知,了解其基本功能和使用场景。

2.一部分受访者对一卡通的具体细节和技术原理了解较少,只关注其支付功能。

3.个别受访者对一卡通的认知程度较低,不了解其存在和使用方式。

一卡通的使用频率调研结果显示,绝大多数受访者都拥有一张以上的一卡通,并且经常使用。

大部分受访者表示,一卡通的使用频率比现金支付更高,方便快捷。

在使用场景方面,一卡通主要用于日常生活中的购物消费和交通出行。

用户对一卡通的满意度根据调查结果,绝大多数受访者对一卡通的使用体验较为满意。

他们认为,一卡通的快捷支付功能、便携性和安全性较高。

同时,受访者也提出了一些改进建议,例如增加线上支付功能、提高信用卡绑定的便利性等。

一卡通支付的安全性调查发现,用户对一卡通支付的安全性较为关注。

尽管一卡通支付在一定程度上提高了支付过程的安全性,但仍有部分受访者担心卡片丢失或被盗刷的风险。

他们建议银行和相关机构加强一卡通的安全防护措施,以提升用户信任度。

结论通过本次调研发现,一卡通作为一种智能支付工具,在用户中的认知度和使用频率较高。

大部分用户对一卡通的使用体验较为满意,但也存在一些改进的空间。

基于公交刷卡数据和兴趣点数据的城市街区功能类型识别研究——以

基于公交刷卡数据和兴趣点数据的城市街区功能类型识别研究——以
明 ,综合 利 用 公 交刷 卡 数据 和 兴 趣 点数 据 能 较 为准 确 刻 画城 市 街 区 的功 能 特征。 关键 词 城 市功 能识别 公 交刷 卡数据 兴趣 点 街 区
[ 中图分 类 号 ]F 2 9 4 [ 文 献 标 识 码 ]A [ 文 章 编 号 ]2 0 9 5— 8 5 1 X( 2 0 1 6 )
03 —0 06 7一】 9

、 引言 - ● _

城市 功 能 区划 分是 城市 管理 和城 市规 划 的基础 。以往 对 城市 功能 区的划分 多基 于 土 地利用 类 型 ,但 是单 纯考 虑 土地利 用类 型而 不考 虑土 地承 载 的人 E l 和设施 的密度及 功 能属性 难 以准确 反 映城市 区块 功能 。在 土地城 镇 化 向人 的城镇化 转 型 的过程 中 ,城 市 功能 区划分 尤其 要关 注功 能 区 内人 的 因 素 。传 统 的统 计数 据 由于 统计 口径 等 因 素 ,
( 1 9 8 9一) ,中国科学院科技战略咨询 研究 院博士研 究生 ;张耘 ( 1 9 5 5一),北京城 市学 院城市 管理所研 究 员 , 本文通讯作者 ,邮政编码 :1 0 0 1 8 4 。 致谢 :感谢 评审专 家匿名评 审,当然文责 自负 。
67
娥车 典 镙 碍 完 2 0 1 6 年第3 期
街 区层 面 的功 能 属 性 识 别 进 行 了研 究。 其 中 S C D 用 于 刻 画街 区客 流 特 征
的功 能属 性 ,P O I 数据 用 于 刻 画街 区设 施 功 能属 性。 作 者 首先 利 用 公 交 站
点客 流 出行 规律 的功 能属 性 对 城 市 街 区进 行 初 步 的分 类 。在 此基 础 之 上 , 利用 P O I 数 据 的设 施 功 能 属 性字 段 进行 蚁 群 聚 类 ,对 城 市 功 能 进 行 进 一 步 细 分 和识 别 。 最 后 利 用 遥 感 影 像 分 析 对 识 别 结 果 进 行 检 验 。 检 验 结 果 表

基于IC卡数据的公交线网评价

基于IC卡数据的公交线网评价
s i t n e t w o r k i n Na n n i n g ,b y u t i l i z i n g t h e I C c a r d d a t a a t c o mmu t i n g p e a k h o u r s .T h e r e s u l t s c o n f i r m t h e c a p a b i l i t y a n d p r a c t i c a b i l i t y o f t h e e v a l u a t i o n me t h o d , w h i c h f u r t h e r p r o v i d e s a mo r e d i r e c t a n d r e a -
r e c e n t y e a r s . I n o r d e r t o u s e t h e I n t e g r a t e C i r c u i t ( I C ) c a r d d a t a , i n c l u d i n g l a r g e a mo u n t s o f t r a v e l l i n g i n f o r m a t i o n ,
t o e v a l u a t e t h e p e r f o r ma n c e o f t r a n s i t n e t wo r k ,t h r e e i n d i c a t o r s :f l o w di f f e r e n c e ,t h e b a l a nc e b e t we e n s u p p l y a n d de ma n d a n d t r a v e l i n g t i me di f f e r e n c e we r e p r o po s e d t o e v a l ua t e t h e s p a t i a l ma t c h i n g d e g r e e b e t we e n pa s s e n g e r s de ma nd a n d t h e l a y o ut o f t r a n s i t ne t wo r k.Fi n a l l y ,a t e s t i n g e x a mp l e wa s i mp l e me n t e d i n t h e Tr a n s CAD t o e v a l u —

基于公交IC卡数据的上车站点推算研究

基于公交IC卡数据的上车站点推算研究

Bo a r di ng S t o p I nf e r e n c e Ba s e d o n Tr a ns i t I C Ca r d Da t a
M A Xi a o - l e i , LI U Co ng - c o n g , LI U J i a n — f e n g , CHE N F e ng , YU Ha i - ya n g
Ab s ra t c t : I n o r d e r t o a n a l y z e u r b a n b u s p a s s e n g e r s ’ t r a v e l c h a r a c t e r i s t i c , t h i s p a p e r p r o p o s e s s e v e r a l d a t a
第1 5 卷 第4 期 2 0 1 5年 8 月
交通运输系统工程与信息
J o u r n a l o f T r a n s p o r t a t i o n S y s t e ms E n g i n e e r i n g a n d I n f o r ma t i o n T e c h n o l o g y
mi n i n g a l g o i r t h ms or f b o a r d i n g s t o p i n f e r e n c e b a s e d o n I C c a r d a n d GP S d a t a . F o r t h o s e b u s e s wi t h GP S d e v i c e s , a d a t a — f u s i o n me t h o d wi t h GP S d a t a i s d e v e l o p e d t o e s t i ma t e i n d i v i d u a l p a s s e n g e r ’ S b o a r d i n g s t o p . F o r t h o s e b u s e s wi t h o u t GPS d e v i c e s , a n i mp r o v e d Ba y e s i a n d e c i s i o n r t e e a l g o it r h m wi t h v a yi r n g s t e p s i s

公交一卡通数据处理分析技术

公交一卡通数据处理分析技术

公交一卡通数据处理分析技术交通信息工程及控制摘要:城市公共交通一卡通作为的一种便捷的支付工具近年来在公共交通领域发展非常迅速,得到了社会各界的广泛应用和发展。

公交一卡通不仅给城市居民带来了生活上或者出行上的便利,随着一卡通市场的跨界融合和互联互通,从而打破行政区域间隔状态,这将会使城际间公共交通实现一体化,极大促进人们跨区域的经济和文化交流。

公交一卡通是大数据时代“智慧城市”建设不可缺少的一部分,实基础性的,同时也贴近市民生活。

公交信息是公交通行能力技术、公交客流预测技术、公交线路优化技术、公交调度技术等关键技术的基础,而公交一卡通的使用在提供数据的层面也能起到巨大的作用。

基于公交一卡通信息处理来获取公交客流信息,无需耗费人力物力进行基础数的采集,通过已有一卡通数据进行分析即可获得完整、连续的公交客流信息。

关键词:公交一卡通、数据处理公交一卡通在完成对乘客收费的同时,还能记录乘客使用一卡通的卡号、公交车自编号、刷卡时间等信息,这些信息能够准确的反应乘坐公交车出行者的分布情况,是公交车客流量数据采集的主要手段以及实现客流量预测的主要数据来源。

随着一卡通使用的不断普及,以及一卡通采集内容的全面,如何利用一卡通采集到的实时数据进行与智能公交相关的研究越来越受到重视。

数据资源的处理和应用是当前要面临的挑战。

1.公交一卡通数据分析目标公交数据分析目标同样是建立公交数据分析系统的目的,它决定了公交数据分析系统的结构和分析流程,因此研究公交数据分析系统的框架必须首先明确公交数据分析目标。

通过公交数据分析,获得公交运营的基本客流信息,以及全面、准确反映城市公交运营状况及公交乘客公交出行特征的信息。

为公交规划者提供规划依据,为公交管理者提供公交运营决策的依据。

其具体目标主要有两个:(1)获得用于公交运营决策的公交客流信息,包括总客流、线路客流、断面客流、站点客流、客流时空变化分布等。

(2)获得用于公交规划的居民公交出行特征信息,主要包括居民公交品均出行数、起讫点分布、平均换乘次数、出行耗时特征、出行距离特征等。

城市公共交通一卡通技术研究与应用

城市公共交通一卡通技术研究与应用

城市公共交通一卡通技术研究与应用城市公共交通一卡通技术,是指通过一种智能卡片,实现了公共交通支付、消费、查询等多功能的集成卡片,是城市公共交通现代化建设中的重要组成部分。

在城市公共交通领域,智能公交卡一般被称为城市公共交通“一卡通”。

公共交通一卡通技术的起源可以追溯到上世纪70年代初期,当时,欧洲国家开始使用无接触IC卡作为地铁、公交等城市公共交通的票证,用于代替传统的硬币、纸质车票等票证,为城市公共交通的支付方式和安全性带来了革命性的变化。

随着智能卡技术的不断发展,公共交通一卡通技术也逐渐普及,在国内,已有大量城市开始推进公共交通一卡通的建设。

城市公共交通一卡通技术的优势城市公共交通一卡通技术相较于传统的硬币、纸质车票等票证,具有以下优势:1.方便快捷公共交通一卡通可以实现公共交通出行的全流程自动化,包括乘车、扣费、查询余额等,用户只需要持卡刷卡即可完成上述操作,快捷方便。

2.安全可靠公共交通一卡通使用的是IC卡技术,与传统的磁条卡相比,IC卡具有读写速度快、存储量大、抗干扰能力强等优势。

同时,公共交通一卡通的支付方式更加安全可靠,减少了用户被偷盗的风险。

3.环保节能公共交通一卡通的推广可以减少城市交通中的票证浪费,对于城市环境的保护和能源的节约都有一定的贡献。

城市公共交通一卡通技术应用目前,国内城市公共交通一卡通技术的应用范围逐渐扩大,已经应用于公交、地铁、轨道交通、有轨电车以及城市综合交通等领域。

不同城市的公共交通一卡通技术实现方式有所不同,主要分为以下四种:1.自主研发部分城市公共交通管理机构自主研发公共交通一卡通技术,例如北京市的“北京市交通一卡通”和上海市的“上海公共交通卡”。

2.采购方案采购方案是指公共交通管理机构通过公开招标,选定一家公司进行一卡通技术的研发和实施,例如南京市的“南京地铁一卡通”。

3.合作方案合作方案是指公共交通管理机构与第三方公司进行合作,共同推进公共交通一卡通的建设和应用,例如广州市的“羊城通”。

一卡通智能数据分析系统研究及应用

一卡通智能数据分析系统研究及应用

关注学生动态成为一种科学管理的新模式 。通过研发应用一卡通智 统 里面 的价值数据 ,一定 程度上造 成了大量 的数据堆 积 ,失去 了
能数据分析系统 ,提取一卡通的数据库中一段时间 内学生消费数据 其 中的潜在 数据 价值 】。而针对本文研究的高校学生 行为分析没
进行用户行为分析 ,以同等消费行为特征为相似点 ,从中挖掘学生 有有利挖掘 ,相应 的方案也甚少 。
消费均 值和 生活消 费均值 等属性 数据 值进行 聚类 分析 ,同时设 费较 多 ,与学 生正常消费不符 ,一定程度 上证实第二类消费情况
置 聚类 数 目为 2,系统 内点 击 “学生类别查询 ”按钮 ,即可显示 为异 常现象 。
K—means算法聚类后 的一卡通消费 的有用价值数据 。辅 导员老 师
(作者单位 为浙江 师范大学 )
的上 线 申请 。它 的落地 不是 为 了取 代校 园卡实 体卡 片 ,而是 应 参考 文 献
对用 户需 求进行 系统的升级 与改造 ,进一步 扣‘通学校 整体 数据 、
【11公绪晓 .基于 edu roam和 SDN的无线漫游认证授权技术研究 【A1.中国商等教育
结 果 分析
类别 和具 体数据信息 I101 ̄特别是通过算法 中的聚类 中心值 比较 ,
从上述 图 4和 图 5中分析 ,设置聚类数 目K=2,最终 的聚类 从 中发现学生 的消费异 常情 况 ,这将辅助 高校学工一线老师更深
中心值 由学 生的食堂}肖费均值 、商贸消费均值和生活消费均值等 层次 了解 及关 注学 生动态信 息 ,对学 生管理工作具有较 大的参考
值 ( 1. 2,…, k)之间的距离 : II , lI:(其中0<j<n,0<i<k);

基于一卡通数据的大学生消费分析的技术路线研究与实例分析

基于一卡通数据的大学生消费分析的技术路线研究与实例分析

在校园一卡通消费模式的发展方面,国内外诸多高校已经实现了校园一卡通全 覆盖,将校园内的消费、管理、教育等多个方面进行了整合。校园一卡通消费 模式的应用前景十分广阔,它不仅可以提高校园管理水平,方便在校师生的生 活,还可以为校园内商业发展提供宝贵的数据资源。
面对海量的校园一卡通消费数据,如何挖掘出有价值的信息是关键。首先,需 要进行数据采集,收集校园一卡通消费数据,包括消费时间、消费地点、消费 金额等信息。其次,通过数据预处理技术,对数据进行清洗、整理,以保证数 据的准确性和完整性。最后,利用数据挖掘建模,对消费数据进行深入分析, 挖掘出潜在的规律和趋势。
校园一卡通消费数据在校园内的应用场景非常丰富。首先,商户可以利用这些 数据了解学生的消费习惯和需求,以便更好地调整商品结构和价格策略。其次, 学校可以利用这些数据监测校园内商业发展的动态变化,及时发现问题并采取 相应措施。此外,一卡通消费数据还可以与其他数据源进行融合,例如与教务 系统对接,了解学生的选课情况;与图书馆系统对接,了解学生的借阅情况等。 这些综合信息将为学校和学生提供更加全面的服务。
通过对校园一卡通消费数据的分析,我们可以发现一些有趣的现象。例如,通 过消费数据的聚类分析,可以发现学生在不同商户的消费偏好;通过时间序列 分析,可以把握学生群体的消费节奏;通过关联规则挖掘,可以发现不同商品 之间的关联关系。这些分析结果不仅可以为商户制定有针对性的营销策略提供 依据,还可以为学校调整商业布局、完善商业服意义。通过对大学生消费行为的深入了解,我 们可以为高校管理层提供有价值的参考,以制定更为针对性的管理策略。此外, 对于商家而言,一卡通数据也为其提供了宝贵的机会,以更好地理解大学生消 费需求和习惯,从而制定更具针对性的营销策略。
二、技术路线

基于IC卡数据的公交乘客上下站点预测研究

基于IC卡数据的公交乘客上下站点预测研究

第48卷第1期燕山大学学报Vol.48No.12024年1月Journal of Yanshan UniversityJan.2024㊀㊀文章编号:1007-791X (2024)01-0077-09基于IC 卡数据的公交乘客上下站点预测研究迟㊀剑1,2,李秀云1,2,∗,刘艳飞1,2(1.河北民族师范学院数学与计算机科学学院,河北承德067000;2.河北省文化旅游大数据技术创新中心,河北承德067000)㊀㊀收稿日期:2022-06-01㊀㊀㊀责任编辑:温茂森基金项目:国家自然科学基金资助项目(62172352);河北省省级科技计划资助项目(20310301D);河北民族师范学院2019年度重大招标课题资助项目(ZD2019002)㊀㊀作者简介:迟剑(1979-),男(蒙古族),河北承德人,硕士,讲师,主要研究方向为软件工程与数据库;∗通信作者:李秀云(1966-),女(满族),河北承德人,硕士,教授,主要研究方向为动力系统,Email:1370803349@㊂摘㊀要:当前一票制的公交IC 卡收费系统无法获取乘客的上车站点和下车站点,为公交线路客流量分析造成了一定困难㊂本文通过充分研究IC 卡数据以及GPS 数据,构建了以IC 卡数据为基础的乘客上下车站点匹配模型,挖掘数据中包含的公交运行特征以及乘客出行特征㊂模型同时考虑封闭式公交出行链以及非封闭式公交出行链,并采用二分算法以及多概率融合的方法在乘客乘车特征基础上推测乘客的上下车站点,可有效提升公交的高效化运行管理㊂以承德市7号线路为例进行验证,采用线性回归方程对上下车站点匹配结果进行分析,相关系数高达0.977,校验回归方程系数值为0.9785㊂结果表明该模型可实现对公交车乘客上下车站点的有效匹配,具有较好的可靠性㊂关键词:上下车站点;IC 卡数据;GPS 数据;数据挖掘;数据分析中图分类号:TP31;U491㊀㊀文献标识码:A㊀㊀DOI :10.3969/j.issn.1007-791X.2024.01.0090㊀引言目前,随着公交出行人口流量的增大以及智能公交的快速发展,IC 卡成为乘客公交出行的主要方式㊂因此,通过IC 卡统计乘客上下车相关数据变得可行㊂公交车IC 智能系统具有交易数据量大㊁数据采集方便㊁样本量大以及数据连续性强等优点㊂通过对IC 卡数据以及公交车行车GPS 数据分析,可以较为精准地判断乘客的上下车站点,对于城市的公交系统规划和管理具有重要意义[1-2]㊂但由于目前大多数公交采用单一票制,乘客仅在上车时刷卡,因此难以获取乘客下车站点的位置信息㊂吴祥国等[3]针对IC 卡数据和公交GPS 数据,提出可以根据乘客连续多日的出行数据构建出行链进行下车站点推断的思想㊂Yuan 等[4]通过IC 卡数据以及车辆位置信息获得乘客下车站点的相关约束条件,随后采用随机场模型和协同滤波算法提取乘客出行链并推荐乘客下车站点㊂Wang 等[5]通过IC 卡数据以及公交车辆GPS 定位数据,采用不间断出行的方法,推断乘客的乘车规律从而获得相匹配的下车站点㊂刘玮轩等[6]在IC 卡数据的基础上,通过建立时间偏移模型和客流量偏移模型对上车站点进行匹配,通过将乘客进行精准分类,提出不同的下车站点匹配算法㊂Zhou 等[7]通过IC 卡数据以及客流量对北京的通勤出行时间和分时段的客流分布进行了深入分析㊂翁剑成等[8]通过融合IC 卡数据和公交GPS 等数据,分析公共交通的行车路线信息,并建立了基于乘客单体的通勤出行链提取模型,从而挖掘乘客上下车站点信息㊂Zhang 等[9]同样利用IC 卡数据与GPS 技术分析乘客的上车站点位置,并在Transcad 模型中采用最短路径算法推导出原站和站间距离矩阵,以出行链为基本原理推导出中转站与目的地㊂陈君等[10]根据公交乘客出行的时空规律性,提出了基于通勤出行模式和关联出行模式判断下车78㊀燕山大学学报2024站点的算法㊂胡继华等[11]将乘客的出行特征与下车站点吸引权重相融合,然后根据乘客出行链的完整程度建立概率模型来判断乘客的下车站点㊂Li等[12]全面回顾了使用IC卡数据的论文研究,分析出大多数研究没有引入土地利用因素以及应用敏感性分析,从而提出未来的研究方向㊂Yap M等[13]针对公共交通拥挤可能会对乘客的出行体验产生重大影响,从而做出对路线和交通方式的选择进行了研究㊂Bai等[14]通过开发基于人工智能的深度学习模型来预测公交车站点的客流量,该模型基于广州的一条公交线路IC卡售票系统获得的实际乘客数据来预测客流量的大小㊂文献[15-17]同样在IC卡数据和GPS数据融合的基础上引入时空特性对乘客上下车站点进行推断㊂大多数依据IC卡数据进行上下车站点匹配的模型都是针对封闭式公交出行链进行推断,然而乘客出行仍存在一定量的非封闭式公交出行链㊂本模型通过多概率融合的方式对于非封闭式公交出行链的下车站点判断,并取得了较好的效果㊂1㊀数据预处理1.1㊀数据介绍由于承德公交集团GPS数据仅在服务器保存三天,我们针对该数据进行了实时采集并保存到本地㊂本文所使用的数据是承德7号线路2018年采集的GPS数据以及IC卡数据,并筛选出5月1日至5月7日的数据作为研究数据㊂首先,承德市公交IC卡数据主要包括乘客卡号数据㊁IC卡类别㊁公交线路编号㊁车牌号㊁刷卡时间㊁处置时间,如表1所示㊂其中,IC卡类别可分为储值卡㊁成人月票卡㊁老年卡㊁残疾卡等13种类型;公交线路编号中100500007表示7号线路;刷卡时间为乘客上车刷卡的即时时间;处置时间则为POS机的处理时间㊂其次,GPS数据主要包括GPS运行时间㊁车辆编号(车牌号)㊁实时速度㊁站点名称㊁站点坐标等,其中站点坐标采用经纬度显示,如表2所示㊂表1㊀IC卡数据样例Tab.1㊀IC card data samples乘客卡号IC卡类别公交线路编号车牌号刷卡时间处置时间67002109018406510100500301HZ15102018/5/18:242018/5/18:26 67002109018406510100200009HZ20512018/5/118:202018/5/118:21表2㊀GPS数据样例Tab.2㊀GPS data samplesGPS运行时间车辆编号实时速度站点名称站点坐标2018/5/509:03:30HZ766622.824市中心医院(117.925496,40.979900) 2018/5/308:27:29HZ766632.904二道牌楼(117.921923,40.982160)1.2㊀数据处理及标准化本文采用承德公交7号线路2018年5月1日-2018年5月7日的一周数据作为数据集㊂首先,对于GPS数据,采用上述规定时间段内的数据,由于公交在停靠主站期间,车辆处于停滞状态即速度为0时表示车辆未运行,此类数据过多会导致数据检索时时间复杂度的过高且属于无效数据,因此将该类数据作为冗余数据进行清洗;公交在行驶过程中会存在违规行为,忽略违规行为导致的公交车的 滞站 行为数据;为方便时间比较,将GPS运行时间换算为时间戳表示,处理后数据如表3所示㊂其次,对于IC卡数据,筛选刷卡时间位于2018年5月1日至2018年5月7日的数据并将刷卡时间换算为相应的时间戳表示,处理后数据如表4所示㊂表3㊀处理后GPS数据Tab.3㊀Processed GPS dataGPS运行时间车牌号站点名称站点信息15251524218596轻小型修理厂到站15251524628596轻小型修理厂离站15251525008596下营房到站15251525738596下营房离站第1期迟㊀剑等㊀基于IC卡数据的公交乘客上下站点预测研究79㊀表4㊀处理后IC卡数据Tab.4㊀Processed IC card data乘客卡号车牌号刷卡时间67002130002800085961525653606.067002130002800688761525659409.0㊀㊀经数据处理,承德市7号线路2018年5月1日-7日IC卡数据和GPS数据中,IC卡数据共65084条,其中共有25727名乘客乘坐该线路公交车㊂GPS数据共40805条,包含公交车共22辆,经历公交站点25个㊂2 乘客公交出行分析公交出行链作为交通出行链定义的延伸,通常认为乘客在一天内至少连续两次乘坐公交并按照顺序排序从而构成公交出行链㊂公交出行链可分为封闭式公交出行链和非封闭式公交出行链㊂封闭式公交出行链具体定义为:乘客在一天之内存在多次乘坐公交出行,且首次出行站点与末次出行站点属于同一个站点㊂广义的封闭式公交出行链存在中间非换乘和换乘两种情况㊂非换乘公交出行链表明乘客在首次出行和末次出行期间不存在换乘行为,即乘坐一辆公交便可到达目的地,如图1(a)所示,乘客首次出行在站点A乘坐L1线路公交车到达目的站点E下车到达目的地且在末次出行中乘坐同一路线公交车于出发站点E返回目的站点A;换乘公交出行表明乘客乘坐一辆公交无法到达目的地,乘坐期间需换乘其他公交或线路才可到达,如图1(b)所示,乘客首次出行在站点A乘坐L1线路公交车并在站点D 换乘L2线路公交车到达目的站点E,并且在末次出行乘坐相同线路返回站点A,该乘坐方式中间存在换乘行为,但仍属于封闭式公交出行链㊂现实生活中,封闭式公交出行链可表现为上下班通勤㊁上下学等日常行为㊂非封闭式公交出行链具体定义为:乘客在一天内仅从某出发站点搭乘一次公交,或乘客搭乘多次公交但从未未返回出发站点等行为,这些行为导致公交出行链无法闭合㊂日常行为举例为,某乘客早上首次出行乘坐公交车到达目的地,并在下一次出行中采用非公共交通方式返回首次出行的出发站点,或者在首次出行后不再返回㊂因此,在构成封闭式公交出行链时,应符合以下约束条件㊂1)组成约束:乘客每日出行至少存在两次由出发站点至目的站点的公交乘坐行为㊂2)时空约束:前一次乘坐公交车的下车时间戳需小于后一次乘坐公交的上车时间戳;前一次乘坐公交车的下车站点距离后一次乘坐公交车站点应小于某距离阈值,如图2所示㊂3)换乘约束:真实生活中,乘坐公交车外出时的换乘次数应小于某换乘阈值d,即在可接受的换乘次数之内㊂图1㊀封闭式公交出行链Fig.1㊀Closed bus travel chain图2㊀空间约束示意图Fig.2㊀Schematic of spatial constraints80㊀燕山大学学报20243 乘客上车站点推断针对处理后的IC 卡数据和GPS 数据,采用二分时间匹配算法推断乘客的上车站点㊂具体来说,由于IC 卡数据中存在车牌号和刷卡时间,GPS 数据中存在车牌号以及每个站点公交车的到站时间和离站时间㊂以IC 卡数据中某乘客刷卡信息进行说明,IC 卡记录乘客编号为p 1所乘公交车的车牌号为c 1,刷卡时间为t 1㊂首先,筛选GPS 数据中车牌号为c 1的数据,然后顺序查找t s 1<t 1<t e 1所对应的站点s 1即为乘客p 1的上车站点,其中t s 1表示公交车c 1在站点s 1的到站时间,t e 1表示公交车c 1在站点s 1的离站时间㊂经数据分析,在对少量数据进行匹配时,该算法可快速推断乘客的上车站点㊂然而,针对于几十万条甚至更多IC 卡数据以及GPS 数据,顺序检索存在时间复杂度过高的问题,考虑到IC 卡数据和GPS 数据均按时间进行有序排列,本算法融合二分查找算法进行上车站点推断,可将时间复杂度由O (n )降为O (log n )㊂定义GPS 数据为四元组组成形式㊂G =[(t s 1,c 1,s 1,到站),(t e 1,c 1,s 1,离站),(t s 2,c 2,s 1,到站),(t e 2,c 2,s 1,离站),(t s 3,c 1,s 2,到站),(t e 3,c 2,s 2,离站)],站点推断流程图如图3所示㊂㊀㊀经过对IC 卡65084条乘客数据进行统计,可得到5月1日-5月7日各个站点上车人数如图4所示㊂经观察可知,7号线首站轻小型修理厂上车人数最多,于承德市中医院站点站上车人数最少㊂综合分析,上车人数最多的车站位于公交行车线路中部㊂将公交车完整线路运行时间进行序列化,并进行以下定义: 轻小型修理厂 下营房 记作路段A; 下营房 头道楼牌 记作路段B ㊂统计各路段7日内双向公交车累计运行时间,如图5所示,该运行时间柱状图表示在中部站点相对运行时间最长㊂综合各站点上车人数和公交线路运行时间可知,在公交车完整行车时间中,中段时间上车人数相对最多,因此采用二分查找推断策略可有效降低算法的时间复杂度,提高匹配效率㊂图3㊀上车站点推断流程图Fig.3㊀Inferred flow chart of bus boarding stop图4㊀各站上车人数统计折线图Fig.4㊀Line chart of the numbers of passenger boarding at each stop第1期迟㊀剑等㊀基于IC卡数据的公交乘客上下站点预测研究81㊀图5㊀公交车上下行路段运行时间统计图Fig.5㊀Statistical chart of the uplink and downlinksegment running time4㊀乘客下车站点推断乘客公交出行链存在封闭式出行链和非封闭式出行链两种情况,因此做出以下分类对下车站点进行推断:1)封闭式公交出行链,即一天内至少存在两次出行,且出行的出发站点非同一站点,包含乘客换乘线路和不换乘线路两种情况㊂2)非封闭式公交出行链,存在以下几种情况:乘客单向出行,即一天内仅存在一次出行情况,记作情况1;乘客多次出行,且每次出行站点属于同一站点,记作情况2㊂4.1㊀封闭式公交出行链日常中的上班通勤和上下学等行为大多是往返出行的形式㊂假设乘客p1第i次刷卡记录显示在线路L1上的A站点上车,且第i+1次刷卡记录显示在线路L1上的E站点上车,则表示E为乘客p1第i次乘车的下车站点㊂值得注意的是,乘客在E站点下车后可能存在换乘情况,由于本文采用数据集为7号线单线路数据集,因此对下车站点与目的站点不做区分,统称为下车站点㊂4.2㊀非封闭式公交出行链针对非封闭式公交出行链,采用多概率融合的方式对下车站点进行推断㊂首先计算乘客在某时间段内于每个站点刷卡上车的频率,由此计算在每个站点下车的概率;其次采用车站距离泊松分布计算每个站点的下车频率;最后根据每个站点当日刷卡人数即上车人数计算各站点下车概率,通过将三种概率按一定权重比例融合的方式推断乘客最有可能的下车站点㊂假设某线路L1共有站点m个,记作车站集合M={s1,s2, ,s m},根据乘客在某时间段内的刷卡记录统计在每个站点的上车频率N i㊂并计算每个站点可能下车的概率f1i,即f1i=N iðm i=1N i,(1)最终各站点下车概率集合表示为D1= {f11,f12, ,f1m}㊂根据现有研究[18-19],乘客在某站点下车的概率与已乘坐过站的站点数之间呈泊松分布,即f2ij=λ(j-i)e-λ(j-i)!㊂(2)由于由泊松分布获取的各站点下车概率之和不为1,因此将该概率分布进行归一化处理:f2ij=λ(j-i)e-λ(j-i)!ðm-1i=1λ(j-i)e-λ(j-i)!,(3)其中,f2ij表示乘客在站点i上车且在站点j下车的概率㊂λ为该线路乘客在一段时间内平均出行经过的站点的数量㊂若乘客上车站点i的下游站点小于λ,即m-i<λ,此时令λ=m-i㊂由此可得乘客在每个站点下车的概率矩阵D2=[f2ij]mˑm㊂乘客有较大概率在日常乘客流量最大的站点下车,即某站点上车人数越多表示吸引行人的概率越大㊂因此可根据上述上车站点的推断计算每个站点的乘客流量㊂具体计算公式为f3i=v iðm i=1v i,(4)其中,v i表示在站点i上车的人数㊂则乘客在各个站点下车的概率可记作集合D3={f31,f32, ,f3m}㊂综合考虑乘客高频上车站点,站点泊松分布以及站点乘客流量,并赋予不同权重,可以得到乘客在某站点i下车概率模型为f i=ρ1f1i+ρ2f2ji+(1-ρ1-ρ2)f3i,(5)其中,ρ1和ρ2为可调参数,并满足ρ1+ρ2<1㊂4.3㊀实例模拟结果分析本文对承德市7号线路2018年5月1日整天82㊀燕山大学学报2024的IC 卡数据刷卡记录进行下车站点预测㊂其中,参数为该线路站点数量即m =25,公交出行属于中长距离出行,因此出行距离过长或过短的居民较少采用这种交通方式[20],所以采取λ=Round (m /2)=12㊂并将5月1日封闭式公交出行链和非封闭式公交出行链乘客进行统计,满足封闭出行链的乘客数量为798人,满足非封闭出行链的乘客数量共3254人,其中符合情况1的乘客数量为2713人,符合情况2的乘客数量为541人㊂由以上数据统计可知,一天内仅一次乘坐公交车出行的乘客占绝大多数,因此非封闭式公交出行链的下车站点推断的准确性尤为重要㊂首先,对于封闭式出行链下车站点推断举例如表5所示㊂表5㊀封闭出行链下车站点推断举例Tab.5㊀Examples of the alighting stop in closed travel linksIC 卡编号上车站点下车站点670021220007966世纪城二道牌楼670021300002834安定里新居宅670021090877479裕华路西口美风小区670021300027433温州批发市场二道牌楼㊀㊀其次,对于非封闭式出行链下车站点推断进行了广泛的参数敏感度实验㊂从日常生活经验出发,本文采用的概率融合的模型实际包含了主客观概率㊂具体来说,乘客日常刷卡最多的站点作为本次出行所推断的下车站点应属于主观推断,即该通过乘客本身的行为做出的推断,因此f 1i 值应赋予更高的权重,称作主观概率㊂然而在乘客日常出行次数较少甚至为0,或者多个站点刷卡次数相等时,主观推断则会失去效果,此时,由下行站点数和站点吸引权进行的客观推断则会发挥重要作用,称f 2fi 和f 2i 为客观概率㊂根据文献[3],我们将一周内乘车次数不超过两次的乘客定义为弱主观推断;将一周内乘车次数超过两次的乘客定义为强主观推断㊂对IC 卡号为670021090942982的乘客在5月1日出行记录进行下车站点推断㊂该乘客于下营房站点上车,且在5月1日-5月7日一周内乘车次数仅为2次,属于弱主观推断㊂推断该乘客在下游各站点下车概率如图6所示㊂可知,该乘客在(ρ1,ρ2)=(0.1,0.2),(0.1,0.6),(0.3,0.3),(0.5,0.3)时均在新居宅选择下车的概率最大㊂而在(ρ1,ρ2)=(0.1,0.9)选择在温州批发市场下车的概率最大㊂但在不同参数下概率分布的整体趋势大体相同㊂根据对乘客在前5站点下车的概率进行分析,选取(ρ1,ρ2)=(0.1,0.6)时概率分布更为均匀平滑,因此在弱主观推断情况下选取参数ρ1=0.1,ρ2=0.6㊂图6㊀弱主观下车站点概率折线图Fig.6㊀Line chart of weak-subjective alighting stop probability㊀㊀对IC 卡号为670021150203916的乘客在5月1日出行记录进行下车站点推断㊂该乘客于市中心医院站点上车且在5月1日-5月7日一周内乘车次数为6次,属于强主观推断㊂因此应该赋予f 1i 更高第1期迟㊀剑等㊀基于IC 卡数据的公交乘客上下站点预测研究83㊀的权重,经计算,该乘客在下游站点下车的概率如图7所示㊂该乘客在(ρ1,ρ2)=(0.2,0.2),(0.2,0.4),(0.5,0.2),(0.8,0.1)时均在二仙居选择下车的概率最大㊂而在(ρ1,ρ2)=(0.2,0.7)选择在世纪城2期下车的概率最大㊂在不同权重参数下,折线图整体走势大致一致,但在ρ1较小的情况下,容易产生多个站点下车概率十分接近的情况,无法突出主观意愿的重要性㊂综合分析,在乘客一周内乘车次数超过2次(包含2)的情况下,设定可调参数ρ1>0.5,ρ2可采用随机大小(0<ρ2<0.5)㊂最终对非封闭式出行乘客上下车站点举例,如表6所示㊂表6㊀非封闭出行链下车站点推断举例Tab.6㊀Examples of the alighting stop in non-closed travel linksIC 卡号上车站点下车站点670021090942982下营房新居宅670021300027410新居宅福隆小区670021090394160新居宅世纪东路670021090238513新居宅二仙居670021150203916市中心医院二仙居670021560000545市中心医院世纪城2期670021090943023火神庙世纪城2期图7㊀强主观下车站点概率折线图Fig.7㊀Line chart of Strong-subjective alighting stop probability㊀㊀通过对2018年5月1日IC 卡全天刷卡记录进行上车站点和下车站点推断并统计各站点的上车人数和下车人数,结果如表7所示㊂从公交出行链的角度出发,乘客每天的首次出行和末次出行会形成一个闭环结构㊂因此,各个站点的出行量和下车量在理论上应该基本一致[3]㊂根据皮尔逊相关系数式R =ðmi =1(X i -X -)(Y i -Y -)ðmi =1(X i -X -)2ðmi =1(Y i -Y -)2(6)计算相关系数为0.977,并进行线性回归分析如图8所示㊂校验回归方程y =0.9785x +1.8154,说明该算法结果在机理分析层面较稳定,并且推断的承德市7号线路各站点上下车人数在很大程度上处于平衡状态,可以取得较高的推断精度㊂图8㊀线性回归分析Fig.8㊀Linear regression analysis84㊀燕山大学学报2024表7㊀上下车站点统计结果Tab.7㊀Statistics of the boarding and alighting stop站点上车人数下车人数轻小型修理厂315328下营房186182头道牌楼164160美风小区139135安定里115110城隍庙93108二道牌楼163159市中心医院200210火神庙313306文化大厦118113裕华路口西184168新华路206174温州批发市场121114新居宅390331承德市中医院818福隆小区5365中居宅3745老居宅1724新建居宅1418世纪城2期1427世纪东路1417府前路5888世纪城3272小佟沟口159106二仙居1411765 结论本文通过对乘客公交上下车站点进行预测,提出了融合多因素和出行特征的乘客上下车站点预测模型并利用实际数据进行实例分析㊂结果表明,本文提出的算法模型能够针对不同的出行链的公交乘客进行有效的上下车站点预测㊂通过本算法预测得出的上下车人数符合生活中上下车站点人数很大程度上处于平衡状态的实际情况,本算法可以取得较高的预测精度,并具有较高的有效性和可靠性㊂参考文献1BAGCHI M WHITE P R.The potential of public transport smartcard data J .Transport Policy 2005 12 5 464-474.2PELLETIER M P TRÉPANIER M MORENCY C.Smart card data use in public transit a literature review J .Transportation Research Part C Emerging Technologies 2011 194 557-568.3吴祥国.基于公交IC卡和GPS数据的居民公交出行OD矩阵推导与应用 D .济南山东大学2011.WU X G.Derivation and application of OD matrix of residentsᶄbus trip based on bus IC card and GPS data D .Jinan Shandong University 2011.4YUAN N J WANG Y ZHANG F et al.Reconstructing individual mobility from smart card transactions a space alignment approach C//IEEE13th International Conference on Data Mining Dallas USA 2013 877-886.5WANG W ATTANUCCI J P WILSON N.Bus passenger origin-destination estimation and related analyses using automated data collection systems J .Journal of Public Transportation 2011 14 4 131-150.6刘玮轩.基于IC卡数据的站点关联度解析及公交调度方法研究 D .淄博山东理工大学2019.LIU W X.Research on site correlation degree analysis and bus scheduling method based on IC card data D .Zibo Shandong University of Technology 2019.7ZHOU Y YAO L JIANG Y et al.GIS-based commute analysis using smart card data a case study of multi-mode public transport for smart city M//Geo-Informatics in Resource Management and Sustainable Ecosystem.Berlin/Heidelberg Springer 2015 83-94.8翁剑成王昌王月玥等.基于个体出行数据的公共交通出行链提取方法 J .交通运输系统工程与信息2017 173 67-73.WENG J C WANG C WANG Y Y et al.Extraction method of public transportation travel chain based on individual travel data J .Transportation System Engineering and Information 2017 17 3 67-73.9ZHANG R H WU X G CHEN S P.Public transportation trip OD matrix inference using IC card data and GPS information C// 11th International Conference of Chinese Transportation Professionals Nanjing China 2011 587-597.10陈君吕玉坤崔美莉.基于出行模式的公交IC卡乘客下车站点判断方法 J .西安建筑科技大学学报自然科学版2018 50 1 23-29.CHEN J LV Y K CUI M L.Judgment method of bus IC card passenger alighting station based on travel mode J .Journal of Xiᶄan University of Architecture and Technology Natural Science Edition 2018 50 1 23-29.11胡继华邓俊黄泽.结合出行链的公交IC卡乘客下车站点判断概率模型 J .交通运输系统工程与信息2014 14 2 62-67.第1期迟㊀剑等㊀基于IC卡数据的公交乘客上下站点预测研究85㊀HU J H DENG J HUANG Z.Probabilistic model of bus IC card alighting station judgment combined with travel chain J . Transportation Systems Engineering and Information 2014 142 62-67.12LI T SUN D JING P et al.Smart card data mining of public transport destination a literature review J .Information 2018 9 1 18-23.13YAP M CATS O VAN AREM B.Crowding valuation in urban tram and bus transportation based on smart card data J . Transportmetrica A Transport Science 2020 16 1 23-42. 14BAI Y SUN Z ZENG B et al.A multi-pattern deep fusion model for short-term bus passenger flow forecasting J .Applied Soft Computing 2017 58 669-680.15左精力王秋平陈君.城市公交GPS数据与IC卡数据时空特性融合算法 J .交通信息与安全2021 39 2 101-108. ZUO J J WANG Q P CHEN J.Fusion algorithm of urban bus GPS data and IC card data spatiotemporal characteristics J . Traffic Information and Security 2021 39 2 101-108.16陈娴龚小林邬岚.基于IC卡和稀疏GPS数据的中小城市公交乘客上下车站点推算方法 J .交通运输研究2022 81 79-88.CHEN X GONG X L WU L.Calculation method of bus passengers getting on and off in small and medium-sized citiesbased on IC card and sparse GPS data J .Transportation Research 2022 8 1 79-88.17李淑庆刘耀鸿邱豪基.基于IC卡与GPS数据的公交通勤出行特征分析 J .重庆交通大学学报自然科学版2021 40 10 171-177.LI S Q LIU Y H QIU H J.Analysis of the characteristics of public transportation based on IC card and GPS data J .Journal of Chongqing Jiaotong University Natural Science Edition 2021 40 10 171-177.18赵锦焕李文权张健等.公交客流OD矩阵推算 J .交通运输工程与信息学报2009 7 4 124-128. ZHAO J H LI W Q ZHANG J et al.Calculation of bus passenger flow OD matrix J .Journal of Transportation Engineering and Information 2009 7 4 124-128.19孙凯郑长江.基于公交IC卡刷卡数据的站点客流推算 J .贵州大学学报自然科学版2021 38 2 104-110. SUN K ZHENG C J.Calculation of station passenger flow based on bus IC card swiping data J .Journal of Guizhou University Natural Science Edition 2021 38 2 104-110.20CASCETTA E.Estimation of trip matrices from traffic counts and survey data a generalized least squares estimator J . Transportation Research Part B Methodological 1984 18 4/5 289-299.Boarding and alighting stop inference based on transit IC card dataCHI Jian1 2LI Xiuyun1 2LIU Yanfei1 21.College of Mathematics and Computer Science Hebei Normal University for Nationalities Chengde Hebei067000 China2.The Technology Innovation Center of Cultural Tourism Big Data of Hebei Province Chengde Hebei067000 ChinaAbstract At present IC card charging system cannot obtain the passengersᶄboarding and alighting stop points which has caused certain difficulties for the analysis of the passenger flow of bus lines.By fully studying the IC card data and GPS data a passenger boarding and alighting station matching model based on IC card data is constructed to excavate the bus operation characteristics and passenger travel characteristics contained in the data.The model considers both the closed bus travel chain and the non-closed bus travel chain and uses the binary algorithm and multi-probability fusion method to speculate on the passengerᶄs boarding and alighting station based on the passengerᶄs riding characteristics which can effectively improve the efficient operation and management of the bus.Taking Chengde No.7Line as an example for verification the matching results of the boarding and alighting stations are analyzed by using a linear regression equation and the correlation coefficient is as high as0.977and the regression equation coefficient value is0.9785.The results show that the model can achieve effective matching of bus passengers boarding and alighting stops and have good reliability.Keywords boarding and alighting stops IC card data GPS data data mining data analysis。

城市公交站点智能识别与优化

城市公交站点智能识别与优化

城市公交站点智能识别与优化城市公交站点是现代城市交通系统中不可或缺的一部分,负责承载乘客换乘和乘车的功能。

然而,随着城市交通流量的不断增加和公交车辆运行效率的不断提高,公交站点的智能识别与优化成为了当下急需解决的问题。

一、智能识别公交站点的智能识别是指运用先进的技术手段,对公交站点进行准确的识别和定位。

这一技术可以采用多种形式,比如基于全球定位系统(GPS)的定位技术,通过安装在公交车上的设备,实时获取公交车的位置信息,并将其与地图上的站点进行匹配,从而实现对站点的准确识别。

智能识别的好处在于提高了公交换乘的效率和精确性。

乘客可以通过手机APP或公交站牌等方式,获取实时公交车到站信息,避免站台等待时间过长和错过乘车的情况。

同时,公交管理部门也可以通过收集乘客换乘数据,进行优化线路规划和车辆调度,提高公交系统的整体运营效率。

二、公交站点的优化除了智能识别,公交站点的优化也是提高城市公交系统效率的关键步骤。

公交站点的优化可以包括以下几个方面:1. 设施设备的改善:合理布局和优化站点的设施设备,比如增加候车亭、加装座椅和遮阳设备,提供更加舒适的候车环境。

此外,安装自助售票机和刷卡设备,方便乘客购票和刷卡乘车,减少人工劳动和排队时间。

2. 线路规划的优化:通过对公交站点的分布情况和周边居民的出行需求进行分析,合理规划和优化线路的设置和调整。

避免站点过于密集或过于分散,从而提高乘车效率和减少换乘次数。

3. 公交站点的整体设计:通过合理的站点设计和标识,引导乘客快速找到站点,并提供足够的信息服务。

比如,设置指示牌、地图和标识,告知乘客该站点的稍早/稍迟时间、站点名称等信息。

4. 环境的美化和维护:对公交站点周边的环境进行美化和维护,提高站点的整体形象和环境品质。

这不仅有利于乘客的心理感受,也有助于提高城市的形象和吸引力。

总结:城市公交站点的智能识别与优化是目前城市交通系统中亟需解决的问题。

通过采用先进的技术手段,实现公交站点的智能识别,可以提高公交换乘的效率和准确性。

基于智能调度数据的公交IC卡乘客上车站点判断方法

基于智能调度数据的公交IC卡乘客上车站点判断方法

基于智能调度数据的公交IC卡乘客上车站点判断方法陈君;杨东援【摘要】为了能够应用公交IC卡数据分析公交乘客的出行特征,对判断公交IC卡乘客上车站点的方法进行研究.以南宁市智能公交系统为例,采集公交IC卡收费系统和公交智能调度系统的运营数据,应用数据仓库技术建立智能公交数据分析平台.通过将智能调度系统数据与公交IC卡收费系统数据进行关联,判断公交IC卡乘客的上车站点,对提出的方法进行精度分析和算法实现,并应用海量的智能公交系统实际数据对算法进行了试验.研究结果表明,本文提出的方法判断公交乘客上车站点的准确率达到98%以上,算法效率满足实际应用需要,该方法能够用于公交系统的规划和管理工作.%To apply smart card data to the analysis of bus passengers' travel characteristics. The paper proposes the method to identify the boarding stops of smart card passengers. Taking the advanced public transportation systems ( APTS) of Nanning city in China as an example, the paper collects the operation data of automatic fare collection system and intelligent dispatching system. Then, it establishes APTS data analysis platform applying data warehouse technology. The paper also presents the method of identifying boarding stop by matching the data of intelligent dispatching system and automatic fare collection system. The accuracy of the method is analyzed and the algorithm is illustrated. Finally, the algorithm is tested on mass field data. The results show that the accuracy of identifying boarding stops of smart card passengers reaches more than 98% , the algorithm efficiency meets the requirements of practicalapplication, and the method can be used for the planning and management of public transportation system.【期刊名称】《交通运输系统工程与信息》【年(卷),期】2013(013)001【总页数】5页(P76-80)【关键词】交通工程;上车站点;智能调度系统;公交IC卡【作者】陈君;杨东援【作者单位】西安建筑科技大学土木工程学院,西安710055;同济大学交通运输工程学院,上海201804【正文语种】中文【中图分类】U4911 引言通过对公交IC卡数据的分析和挖掘,能够为公交系统的规划和管理提供重要的决策信息.准确获得公交IC卡乘客的上车站点,是应用公交IC卡数据进行公交出行分析的基础[1,2].国外发达国家的大部分公交系统严格按照公交站点时刻表运行,公交卡乘客的上车站点位置可以通过刷卡时间与站点时刻进行关联来判定,如纽约公交系统就采用这种方法推算公交卡乘客的上车站点.国内绝大多数公交系统站点没有时刻表,这种方法在国内难以应用.戴宵等[3]提出通过对公交卡乘客的刷卡时间进行聚类分析判断乘客的上车站点,但该方法的准确性较低[4].近年来公交智能调度系统在国内外开始广泛应用,为判断公交卡乘客的上车站点提供了新的数据来源.本文以南宁市为例,研究在公交智能调度条件下,判断公交卡乘客上车站点的方法.2 研究数据采集与组织2.1 数据采集智能公交系统的原始数据为系统运行所产生,具有多源和海量的特点.笔者对南宁市智能公交系统的运营管理进行了调研,并采集了南宁市公交IC卡收费系统和公交智能调度系统运营的原始数据,包括公交IC卡数据、公交GPS数据、公交站点坐标数据和公交运行记录数据.2.2 数据组织数据组织是按照一定的方式和规则对数据进行归并、存储、处理的过程[5].本文采用数据仓库技术完成这一过程,建立研究工作的数据分析平台,如图1所示.在此平台上,开发程序来测试和验证提出的算法.图1 智能公交数据分析平台建立Fig.1 Establishment of APTS data analysis platform3 判断方法的基本步骤本文通过将公交 IC卡数据、公交 GPS数据、公交站点坐标和公交运行记录4种数据进行关联来判断公交卡乘客的上车站点.这4种数据源主要字段之间的关联关系,如图2所示.图2 4种数据源的关联关系Fig.2 Association of four data sources本文提出的公交卡乘客上车站点判断方法包括3个基本步骤.Step 1 确定刷卡时公交车辆的坐标.(1)初步筛选.将公交IC卡数据与公交GPS数据进行关联,筛选刷卡时公交车辆的可能坐标. 南宁市公交IC卡数据的“刷卡时间”字段精确到“分”,没有“秒”的记录.例如“08:35:45”记录为“08:35:00”,采用了截尾记录方式.公交GPS数据的“时间”字段值精确到“秒”,这样在刷卡这1 min的第0~59 s之间的GPS数据,以及刷卡这1 min前后时间最接近的GPS数据,都可能是与刷卡时间相匹配的GPS数据.将IC卡数据的线路编号、车辆编号、刷卡日期、刷卡时间4个字段与公交GPS数据进行匹配,得到备选的公交GPS数据.(2)最终确定.由于每条公交IC卡记录可能对应几条备选的公交GPS数据,这样需要在这几条备选数据中,确定出与刷卡时间最接近的公交GPS数据.公交车停靠在站点时,速度为0,在离站点较近时车速较低.因此,可以通过比较备选公交GPS数据的“瞬时车速”值,来确定最接近刷卡时间的公交GPS数据.取备选数据中瞬时车速最小这一条数据的“经度”和“纬度”值作为刷卡时公交车辆的坐标.如果备选的几条GPS数据中,出现相同的最小瞬时车速时,取与刷卡这1 min第30 s最近的GPS 数据.Step 2 公交车辆运行上、下行方向的确定.将公交IC卡数据与运行记录数据关联确定刷卡时公交车辆运行的上、下行方向(从主站驶向副站为下行,反之为上行).Step 3 刷卡时公交车辆的坐标与站点坐标匹配.用已得到的刷卡时公交车辆坐标与相应线路、相应方向的公交站点坐标进行匹配,最终得到刷卡时的公交站点,也就是上车站点.4 判断方法的精度影响分析4.1 公交GPS数据时间间隔的影响公交智能调度系统每隔一定的时间间隔接收一条公交车辆的GPS坐标数据.公交GPS坐标数据的时间间隔长度将影响上车站点的判断精度.如果公交GPS数据的时间间隔过大,得到刷卡时公交车辆坐标超出上车站点与相邻站点之间间距的1/2时(图3中的允许误差范围L),将会出现上车站点判断错误,如图3所示.图3 公交GPS数据坐标允许误差范围示意Fig.3 Schematic of allowable error scope of bus GPS data coordinates因此,有必要对影响判断上车站点精度的公交GPS数据时间间隔长度进行分析.假设城市公交站点平均间距为500 m,公交GPS坐标数据的精度在10 m范围以内.这种条件下,允许的误差范围为480 m(500-10×2).公交车按照25 km/h平均车速行驶480 m需要69.12 s.假定公交在站点的平均停站时间为20 s,则公交GPS 数据的时间间隔t超过89.12 s(69.12+20)时,允许误差范围L以内可能出现没有GPS数据可以匹配的情况.时间间隔超过89.12 s的1倍时,则一定会出现.由此可知,在一般情况下,89.12 s为公交GPS数据的最大允许时间间隔T.4.2 公交IC卡数据“刷卡时间”单位的影响南宁市公交IC卡数据的刷卡时间记录精确到分,而实际刷卡时间在这1 min的第0~59 s之间.最有利的情况是刷卡时间恰好是这1 min的第0 s,这时公交GPS 数据的时间间隔只要小于最大允许时间间隔T(89.12 s),就不会产生匹配错误.最不利情况是公交IC卡数据的“刷卡时间”值与实际刷卡时间相差60 s,这时公交GPS数据的时间间隔小于29.12 s(89.12-60)才不会产生上车站点的判断错误.以下分别对最不利情况和最有利情况的上车站点判断正确率进行计算.随机抽取南宁市2008年12月1日2路公交“001151”号公交车全天的GPS数据进行时间间隔长度的统计分析,时间间隔t在29.12 s以内的时间间隔总时长占所有公交GPS数据总时长的比例为68.45%,这部分数据全部能够正确匹配.公交GPS数据的时间间隔t大于29.12 s时,仍能够正确匹配到上车站点的概率为29.12/t,经过计算能够正确判断的比例为21.57%.因此,在最不利情况下,上车站点判断的正确概率为90.02%(68.45%+21.57%).以此方法,再求出最有利情况下判断的正确率.GPS数据时间间隔在89.12 s以内的时间间隔时长占公交GPS数据总时长的比例为99.3%,大于89.12 s时的公交GPS数据仍能够正确判断的概率为0.15%.在最有利情况下,上车站点判断正确的概率为99.45%(99.3%+0.15%).以上分析可知,公交IC卡数据的刷卡时间精确到秒时,上车站点判断的准确率为最有利情况的准确率,即为99.45%;公交IC卡数据的刷卡时间精确到分,且不采用瞬时车速进行辅助判断时,上车站点判断的准确率为最有利和最不利情况的平均值,即为94.74%.4.3 瞬时车速辅助判断的影响分析考虑到南宁市公交IC卡数据的刷卡时间精确到分,对判断上车站点的准确率有一定影响.本文提出采用“公交车停靠在站点时,瞬时速度为0”这一特征进行辅助判断来提高上车站点的判断精度.以下对瞬时车速辅助判断的影响进行分析.首先对公交GPS数据瞬时车速本身的数据质量进行分析,通过将公交GPS数据的相邻坐标点之间的行程车速值与这两个相邻坐标点的瞬时车速均值进行比较来确定.随机抽取了2008年12月1日下午14时南宁市2路公交“001147”号公交车的GPS数据,分别计算行程车速与瞬时车速均值.对两种车速值进行相关性分析,两者的相关性系数为0.90,样本均值相差仅为5.24%,说明瞬时车速与行程车速值整体上很接近,可以推断瞬时车速的总体数据质量很高.考虑瞬时车速的数据质量及其它影响因素,假设采用瞬时车速进行辅助判断后,有80%的IC卡数据最终能够匹配到与刷卡时间最接近的公交GPS数据.这样有80%的IC卡数据判断的正确率为99.45%(与3.2节中最有利条件下的正确率相同),剩余20%的正确率取3.2节中最有利和最不利情况的平均值,为94.74%.因此,采用瞬时车速进行辅助判断后,上车站点判断的准确率为98.45%(99.45%×80%+94.74% ×20%).5 算法提出以南宁市智能公交系统数据环境为例,提出基于智能调度数据的公交IC卡乘客上车站点判断算法如下.Step 0 取出1条IC卡数据,按IC卡数据的“线路编号”和“车辆编号”字段值查找相应线路、车辆的公交GPS数据.Step 1 将该条IC卡数据时间与相应线路和车辆的GPS数据的时间进行比较,找到该条IC卡数据刷卡时间1 min内的GPS数据,以及这1 min前、后时间最接近的各1条GPS数据,作为备选GPS数据.Step 2 取备选GPS数据中瞬时速度最小的数据为刷卡时的GPS数据.如果存在备选GPS数据中的瞬时车速最小值相同,则取相同最小值中最接近刷卡时间这1 min第30 s的数据.Step 3 根据IC数据的线路编号、车辆编号、刷卡时间,在运行记录数据表里查找刷卡车辆的所属班次,根据班次确定上行、下行方向.Step 4 计算刷卡时公交车辆坐标与相应线路、相应方向(上行或下行)所有站点坐标的空间直线距离,距离最小的站点为上车站点,将站点编号和站点名称作为新的字段值写入到IC卡数据表中.Step 5 重复Step0~Step4,直到所有刷卡记录全部获得上车站点.以上算法采用语言编程实现[6].图4 部分计算结果Fig.4 Partial computing results6 算法试验以南宁市2008年12月1日(星期一)~12月5日(星期五)57条智能调度线路的978 077条公交IC卡数据为算例,对本文提出的算法进行测试和分析.算法程序运行的计算机硬件环境为双核2.8 GHz CUP,1 GB内存,300 GB硬盘.每个工作日的公交IC卡数据(约20万条)约8 h完成运算.算法程序的部分运算结果,如图4所示,字段描述如表1所示.本算例5个工作日共计978 077条公交IC卡数据中,最终判断出上车站点的记录为899 174条,比例为91.93%.8.07%的公交IC卡数据未能判断出上车站点,经过分析是由于公交GPS信号受到干扰、公交GPS设备出现故障及少量时段公交智能调度系统未使用,从而导致公交GPS数据或运行记录数据缺失.5个工作日的运算结果统计,如表2所示.表1 运算结果数据字段描述Table 1 Fields description of computing results 卡编号IC_Date 日期消费日期IC_Time 时间消费时间Bus_ID 字符公交车编号Route_ID 字符公交线路编号listno 字符刷卡数据记录号Direction_ID 字符运行上、下行方向GPS_Longitude 数值公交车经度坐标GPS_Laititude 数值公交车纬度坐标Boarding_StopID 字符公交站点编号Boarding_StopName字段名数据类型字段内容Card_ID 字符 IC字符公交站点名称表2 运算结果统计Table 2 Statistics of computing results日期 12月1日12月2日 12月3日 12月4日 12月5日合计189 097 193 322 192 971 192 952 209 735 978 077判断成功数据量(条) 174 228 173 018 178 676 179 294 193 958 899 174判断成功比例(%) 92.13 89.50 92.59 92.92 92.48 91.93未能判断的数据量公交IC卡数据量(条)公交GPS数据缺失(条) 6 751 5 965 6 120 5 790 6 293 30 919运行记录数据缺失(条)8 118 14 339 8 175 7 868 9 484 47 9847 研究结论本文提出对智能公交系统的4种原始数据进行关联来判断公交卡乘客上车站点.通过分析,公交IC卡数据的刷卡时间精确到秒时,应用这种方法判断公交卡乘客上车站点的准确率为99.45%;公交IC卡数据的刷卡时间精确到分,且不采用瞬时车速进行辅助判断,准确率为94.74%;公交IC卡数据的刷卡时间精确到分,并采用瞬时车速进行辅助判断,准确率达到98.45%.本文对提出的算法进行了程序实现,并以南宁市57条智能公交调度线路的5个工作日的海量数据对算法进行了测试,有91.93%的公交卡数据成功确定出了上车站点.未能判断出上车站点的原因是公交GPS数据或运行记录数据缺失.随着公交智能调度系统性能的完善,运营数据缺失情况会进一步减少,能够判断出公交卡乘客上车站点的比例还能得到继续提高.参考文献:【相关文献】[1]Bagchi M,Gleave S D,White e of public transport smart card data for understanding travel behavior[C].Strasbourg, France: European Transport Conference,2003.[2]陈学武,戴霄,陈茜.公交IC卡信息采集、分析与应用研究[J].土木工程学报,2004,37(2):105-110.[CHEN X W,DAI X,CHEN Q.Approach on the information collection,analysis and application of bus intelligent card[J].China Civil Engineering Journal,2004,37(2):105-110.][3]戴霄.基于公交IC信息的公交数据分析方法研究[D].南京:东南大学,2006.[DAIX.Research on transit data analysis based on bus intelligent card information[D].Nanjing:Southeast University,2006.][4]Chen Jun.Validity research of Judging boarding stop by cluster analysis smart card data[C]//The International Conferenceon Remote Sensing,Environmentand Transportation Engineering,2011.[5]朱德利.SQL Server 2005数据库管理与应用高手修烧炼指南[M].北京:电子工业出版社,2007.[ZHU D L.SQL Server 2005 database management and application ofpractice guidelines[M]. Beijing:Electronics Industry Press,2007.][6]Schneider D.Visual Basic 2005程序设计[M].北京:清华大学出版社,2007.[Schneider D.Visual Basic 2005 programming[M].Beijing:Tsinghua University Press,2007.]。

基于IC卡和AVL系统数据的公交乘客上下车站点判别方法

基于IC卡和AVL系统数据的公交乘客上下车站点判别方法

基于IC卡和AVL系统数据的公交乘客上下车站点判别方法侯现耀1陈学武1陈峥嵘2陈素平3(1. 东南大学江苏省交通规划与管理重点实验室,南京210096;2. 江苏省城市规划设计研究院,南京210036;3. 宇恒可持续交通研究中心,北京100004)摘要:通过对公交IC卡和车辆自动定位(A VL)系统的数据分析,给出了利用IC卡数据和A VL数据推导乘客上下车站点的判别方法。

利用IC卡数据的车辆、线路、刷卡时间等信息与A VL数据的车辆、线路和进出站时间进行匹配,根据A VL 数据的站点名称和线路方向等信息,标定对应IC卡记录的乘客上车站点;利用一段时期内的IC卡数据,分析刷卡乘客出行的规律性和稳定性,判别乘客的下车站点。

研究表明,方法可以准确地推导出乘客的上车站点,并可以较准确地判别乘客的下车站点,结果具有较高的准确性,可以为获取公交刷卡乘客的站点OD分布及公交线网OD分布提供依据。

关键词:交通工程学;上下车站点;公交IC卡;A VL系统A Method of Obtaining Public Transit Passengers Boarding and Alighting Stops Based on IC Card andAVL System DataXianyao Hou 1, Xuewu Chen 1, Zhengrong Chen 2, Suping Chen 3(1. Jiangsu Provincial Key Laboratory of Transportation Planning and Management, Southeast University,Nanjing, 210096;项目资助:江苏省普通高校研究生科研创新计划资助项目(CXLX_0139)2. Jiangsu Institute of Urban Planning and Design, Nanjing, 210036;3. China SustainableTransportation Center, Beijing, 100004)Abstract: This paper proposed a method of obtaining public transit passengers boardingand alighting stops based on using the data of IC card and A VL system. The boardingstop was found by matching the data of IC card such as bus route, vehicle label, swipingcard time with the A VL system’s data such as bus route, vehicle number, the time of busgetting in, the time of bus out of the stop and stop name. The alighting stop wasobtained by analyzing the trip characteristics of passengers who use the IC cardregularly. The result shows that the method proposed in this paper can well obtain publictransit passengers boarding and alighting stops.Keywords: Traffic Engineering, Boarding/Alighting Stop, IC Card, A VL System公交IC卡信息包含了大量公交客流信息,可以利用IC卡的信息分析公交刷卡乘客的出行[1]。

基于公交IC卡大数据的公交线路OD推断分析

基于公交IC卡大数据的公交线路OD推断分析

基于公交IC卡大数据的公交线路OD推断分析基于公交IC 卡大数据的公交线路OD 推断分析The Analysis of Bus Line OD Extrapolation Based on Big Data of Bus IC Card王静霞(河北省高速公路指挥调度中心,石家庄050000)WANG Jing-xia(Hebei Province Highway Command and Dispatch Center,Shijiazhuang 050000,China)【摘要】随着互联网科技的不断发展,大数据已经成为人们生活各个领域中不可忽视的一部分;而对于公共交通而言,公交大数据主要集中体现在IC 卡的数据收集上。

日益发达的公共交通系统产生了海量的公交IC 卡刷卡数据,对这些数据加以分析处理,依据相关的模型可以推断居民出行OD 、预测公交出行行为、优化公交线网等。

论文对基于公交IC 卡大数据的公交线路OD 推断做出了相应的分析,并提出了现今存在的问题以及对今后发展的展望。

【Abstract 】With the continuous development of internet technology,big data has become an indispensable part of all areas of our lives.Forpublic transportation,public transport big data is mainly concentrated in the data collection of IC cards.The increasingly developed public transportation system has generated a large number of bus IC card data,and these data are analyzed and processed.According to the relevant models,we can infer the residents'travel OD,predict the bus travel behavior,optimize the bus line network and so on.This paper makes a corresponding narrative of the OD inference based on bus IC card big data,and puts forward the problems existing today and the prospects for future development.【关键词】公交IC 卡;OD 矩阵;数据清洗;聚类分析【Keywords 】bus IC card;OD matrices;data cleaning;cluster analysis 【中图分类号】U412.3;U491【文献标志码】A【文章编号】1007-9467(2019)03-0167-02【DOI 】10.13616/ki.gcjsysj.2019.03.054【作者简介】王静霞(1977~),女,河北任县人,副研究馆员,从事公路工程研究。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

doi: 10.12052/gdutxb.180099基于一卡通数据的公交站点识别方法分析与研究谢振东,冷梦甜,吴金成(广东岭南通股份有限公司,广东 广州 510000)摘要: 针对大众公共交通高峰期部分站点上车难等问题, 通过分析一卡通大数据来推断上车站点客流, 提前预知客流分布状况, 以缓解城市公共交通出行压力. 本文采取了一种基于IC卡数据的聚类分析方法, 建立了数据模型来推算上下班高峰期公交线路站点的客流, 并对测算结果进行对比分析. 最后提出包括开行区间车、大站快车等改善交通运营的相关措施, 为城市交通部门的公交线路设计和综合交通规划提供一定的指引, 确保城市居民日常乘车的便捷性和舒适性.关键词: IC卡数据;聚类分析;客流预测;站点规划中图分类号: U491.1 文献标志码: A 文章编号: 1007–7162(2019)01–0023–06A Study of the Method of Bus Station RecognitionBased on IC Card DataXie Zhen-dong, Leng Meng-tian, Wu Jin-cheng(Guangdong Lingnan Pass Co., LTD., Guangzhou 510000, China)Abstract: With the rapid growth of urban population, the travel demand of public transportation of citizens also rises, which easily causes problems such as difficulty in getting on at some stations during rush hours. It is of great significance to relieve the pressure of urban public transportation by analyzing the big data of IC card to deduce the passenger flow at the boarding station and predict the distribution of passenger flow in advance. For more targeted research on dynamic passenger flow distribution of stations, a kind of clustering analysis method is adopted based on IC card data, through the establishment of data model of bus lines and stations of rush hour traffic, to analyze the measured results, and finally measures are put forward to improve traffic operation, including dispatching station express, shuttle bus and other measures, ensuring urban residents ease and comfort in daily bus ride and at the same time providing guidance for the city traffic department on bus lines design and comprehensive transport planning.Key words: IC card data; cluster analysis; passenger flow forecast; boarding station planning随着我国“智慧交通”建设的不断推进和IC卡在城市公共交通领域的大规模应用,目前大部分公交车上均装有刷卡终端,这样既避免了乘客上车找零的麻烦,又为公交运营企业的结算带来便利,同时也为公交调度管理、优化公交线网和交通辅助决策提供了重要的数据依据. 但是当前我国大部分公交车采用的是一票制,即在IC卡刷卡消费信息中只有交易时间、消费金额、IC卡卡号等信息,不包含上车地点信息. 由于缺乏站点上车人数的信息,从而无法提前预知各站点乘客荷载量的真实需求,因此即使在增加公交数量之后上下班高峰期依然会出现上车难的现象[1-3].近年来,国内外学者基于公交IC卡数据推算上车站点开展了大量研究工作. 在国外,蒙特利尔大学的研究人员Morency等[4]首次将数据挖掘技术应用到公交卡交易数据分析中;Barry等[5]将IC卡数据和GPS数据进行融合,得到公交车行驶日志后利用行驶日志并融合数据推算出上车站点. 然而,国内公交车并非全部装有GPS系统,难以获得准确和全面的数据,即使配备了GPS设备,在车辆实际运行过程中第 36 卷 第 1 期广东工业大学学报Vol. 36 No. 1 2019 年 1 月Journal of Guangdong University of Technology January 2019收稿日期:2018-07-13基金项目:广州市产学研协同创新重大专项产业技术研究专题项目(201604010102)作者简介:谢振东(1966−),男,教授级高级工程师,博士,主要研究方向为智能交通规划、一卡通大数据研究.通信作者:冷梦甜(1991−),男,工程师,硕士,主要研究方向为一卡通大数据分析. E-mail: lengmt@仍然会出现位置漂移,从而无法做到数据之间的精准匹配. 在国内,针对一票制且无GPS数据的公交车上车站点推算问题,郭婕等[6-9]首先对上车站点进行聚类分析,再侧重分析了相邻车站之间的时间间隔,但是在部分数据缺失的情况下难以得到保证结果的准确性. 因此建立一种基于IC卡的海量数据分析方法,用于推测乘客上车地点,这对于促进“智慧交通”建设有重要的意义.因此本文利用海量的IC卡刷卡数据,在对交易时间上进行聚类分析的基础上,以交易次数较多的卡号为主,结合公交车调度信息、公交站点分布等信息,建立了一种新的推算上车站点的方法,通过建模的结果提出公交站点优化方案.1 数据的采集与预处理1.1 数据采集过程本次研究所用的数据(公交IC卡数据)是通过如图1所示的流程进行采集,具体流程如下. (1) 数据的产生过程:乘客在乘坐公交时IC卡与车载终端进行感应,逻辑卡号、车载终端号、交易金额等信息被记录并保存在车载终端内;(2) 数据的传递过程:公交车进入车场时,通过无线传输等方式送至分管清算中心;(3) 数据的接收过程:数据分管中心通过数据通讯方式传送到总的数据库中[10−11].图 1 数据(公交IC卡数据)采集流程[10]Fig.1 Data(Bus IC card data) acquisition process本次研究所用的数据(公交IC卡数据)为广州市内某繁忙路段所有公交终端内记载的数据(时间段为2014年10月至2015年01月),经过简单的数据预处理整理得到了符合分析要求的的80多万条数据记录,所得的IC卡交易数据结构包括线路ID、刷卡终端号码、逻辑卡号、刷卡地、交易金额交易时间和卡类型等信息,其中本次研究所用的数据如表1所示.表 1 公交IC卡刷卡数据(部分字段)Tab.1 Bus IC card data终端ID卡片ID交易时间790064609999994834006020201411270629077000253099999990658270002014112706303240579070999999058528003020141127063034 .........4506702099999905811208002014112719281779006460999999991252101020141127192832650660609999994125005150201411271928521.2 数据预处理过程为更好地提高数据分析结果的准确度,本研究需对1.1节中采集到的大量数据进行清洗、变换、融合等预处理操作[12]. 其中因为一些不可控的原因(刷卡动作、终端环境等)会造成公交IC数据发生异常,这些异常数据可能影响到分析结果的准确性,因此必须进行清洗. 本研究分析了如下4类异常数据[13]. (1)错误的数据:由于卡片和终端感应过程中断或错误而产生字段错配的数据;(2) 冗余的数据:由于数据采集过程中重复操作所产生的多余数据;(3) 不完整的数据:由于外部原因所产生的部分关键字段内容不完整、不能确保真实性的数据;(4) 其他异常数据:由于外部原因导致的极少数与整体趋势相差较多的数据(此类数据可进行单独分析).其次,本次研究为了描述直观、简单,将工作日的6:00~23:00时划分为17个时间段,如表2所示.表 2 时间段与具体时间的对应关系Tab.2 The relation of the time slot andthe specific time时间时间段6:00~7:0067:00~8:007......21:00~22:002122:00~23:0022最后,为了绘图时表达得更加简明清晰,本研究将采用A、B、C等大写英文字母代替该线路上的各站点名称.2 工作日公交客流分布特性分析经研究可知,城市公交工作日客流具有一定的随机性和规律性,和天气状况、节假日、道路状态、社会活动等各种因素密切相关,客流分布特性将从时间(工作日和非工作日)、卡片类型(普通卡和非普通卡)素等方面进行研究分析. 本次研究通过以1 h为间24广 东 工 业 大 学 学 报第 36 卷隔内所采集公交IC 卡刷卡数据为基础,经过数据处理后计算出对应时间段的持卡出行人数,描绘出行人数的变化趋势图.为突出本研究的代表性,本次研究的数据来自于典型的公交线路,是经过广州市区人口较为密集的城区,日均客流量达2 000人次,从中选取了2014年10月到2014年12月中连续10个星期四的数据,其客流分布特征如图2所示.图 2 连续10个星期四各时间段客流量Fig.2 The different weekday(Thursday) passenger flow trend由图2可知,该线路连续10个周四的客流规律基本保持一致:(1) 7:00~10:00出现早高峰,其中客流峰值在时间段8(即8:00~9:00),该时段的特点是客流大且集中,同时增加或减少的过程比较急剧;(2)16:00~19:00出现晚高峰,其中客流峰值在时间段17(即17:00~18:00),该时段的特点为客流分布比较均匀且变化较为缓和,同时峰值比早高峰期低. 通过分析可以得到结论为:工作日的早上乘客出行时间比较集中,晚上返程时间则相对分散[14].为了优化城市公共交通布局,研究上下班高峰期各站点的上车人数,可为公交公司和城市管理部门提供一种新的思路,具有十分积极的意义.3 上车站点客流的推断方法研究通过对IC 卡数据的统计分析,可以得到各站点的上车人数,上车站点人数的推断对于城市交通组织设计和综合交通规划具有重要的意义. 目前大部分城市的公交线路采用的一票制模式,这种刷卡方式的确能有效提高上车刷卡效率,但是又正是因为这样,使得无法通过这些刷卡数据直接获取上车站点信息,从而无法掌握和统计各站点的上车人数. 因此,在这种情况下,本研究为了提取刷卡数据背后所隐藏的出行规律,采用了聚类分析方法来推断站点上车人数.3.1 聚类分析法由前面分析可知,从IC 卡刷卡数据是不能直接获取上车站点信息,但是可以对IC 卡数据中的时间属性进行聚类分析,因为在同一个站点成功上车刷卡的时间会集中在某一个时间点. 其基本思路是将刷卡数据中的交易时间根据时间间隔归类[15],具体的流程如图3所示.图 3 IC 卡数据聚类分析法Fig.3 The cluster analysis of IC card data其中时间距离阈值的选择十分关键,因为阈值过小或者过大都会造成很大的计算误差. 经研究,通常最佳阈值的选择会根据公交的平均行驶速度和站点间距确定,计算公式为式(1)中:T b 为时间距离的最佳阈值;D i, i +1(i =1,2,···,n )为站点距离;n 为公交线路站点数;v 为平均运行速度.在确定时间距离的最佳阈值之后,接下来采用聚类分析法将刷卡数据分类的具体步骤为:(1) 对同一班次公交的IC 卡刷卡数据按照交易时间进行排序;(2) 计算相邻两条数据交易时间,判断两类之间的最小时间差是否大于通过上述公式计算得到的最佳阈值T b ;(3) 若结论为“否”,则将距离最小的两类归为一类,重复步骤(2),若结论为“是”,则聚类结束.通过最短距离的聚类分析后,能够分离出各个站点的刷卡数据,但是由于部分站点可能存在没有乘客上车刷卡的个别现象,因此必须通过采集足够多的数据,将个别的情况加以排除,由此经过多次对比,在误差最小化的前提下合并多天数据.第 1 期谢振东,等:基于一卡通数据的公交站点识别方法分析与研究253.2 上车站点推算方法经过上述聚类分析法已将刷卡数据分离之后,接着计算始发站和各站点的时间差T i (i =1,2,···,n )以及公交线路的上下行方向,再根据如图4所示的流程推断上车站点,具体步骤为:(1) 输入3.1中聚类分析所得某类中的一个IC 卡号,若该卡号在同一公交线路3个月内的使用次数大于20次,则执行步骤(2),若为否,则出错退出;(2) 若该卡号在工作日上班高峰期有刷卡记录,则执行步骤(3),若为否,则出错退出;(3) 导出该卡号在3个月内同时间点(10 min 内,根据各公交线路发车时间间隔来规定)刷卡终端号;(4) 计算该时间点与每一个终端最早刷卡数据中的交易时间进行比较,得出最大的时间差ΔT ;(5) ΔT 与T i 进行匹配,判断该时间点的上车站点.图 4 上车站点推断流程图Fig.4 The inferring flow chart of boarding station注意:其中ΔT 选择原则是不得超过该公交线路始发站与终点站的时间差.4 基于站点的客流量分析研究最佳阈值是根据公交线路的站点分布和平均行驶速度,并结合式(1)计算得到,计算过程为T i (i =1,2,···,n )同时,利用公交站点分布、平均行驶速度和通过聚类分析所得到的分类结果,可以推断上行和下行各站点与始发站之间的时间差,结果如表3所示.表 3 各站点与始发站之间的时间差1)Tab.3 The time difference betweenstations and departure station站点上行时间差T i /s下行时间差T i /sA 03 620±5B 120±53 485±5C 200±53 410±5.........X 3 185±5425±5Y 3 425±5180±5Z3 600±51) 考虑到天气、道路情况等因素,每个站点的时间差允许误差为±5 s得到以上数据之后,再利用上一节图4中所提出的方法,即可推断上下班高峰期各站点的上车人数.经聚类对比,得出4组数据对比如图5所示,分别为上班高峰期上下行各站点上车人数、下班高峰期上下行各站点上车人数.分析4组数据发现,上下班高峰期该公交线路各站点上行站点人数比较多的站点为A 、D 、F 、G 、H 、I 、J 、K 、L 、R 和S ,上车人数较多的区间为D~L ;而下行站点人数较多的站点为F 、G 、H 、I 、J 、K 、L 、P 、R 、S 、X 、Y 和Z ,上车人数较多的区间为F~L. 其中H 和I 两个站点在上下班高峰期上下行的上车人数较多,这是与这两个站点周边存在地铁始发站和客运汽车站有直接的关系.因此根据上述结果,能够给出2个优化公交线路的方案:(1) 在上下班高峰期开通站点D~L 区间车,能够一定程度上缓解乘客乘车难、车内拥堵等问题;(2)在上下班高峰期开通A 、D 、I 、P 、S 和Z 的大站快车,同样能够缓解早晚高峰乘客乘车难的现象.5 结论本文首先简单分析了工作日某公交线路的客流量,发现早晚两个高峰期,并针对高峰期的数据进行了分析. 对交易时间进行了最短距离聚类分析,并结合公交车调度信息及站点分布情况推算出上下行线路各站点与始发站的时间差,和聚类分析中交易次数较多卡号为准的交易时间进行匹配推导出上车站点及该站点的上车人数.本研究还可以综合考虑广州市区内多条公交线路的上下班高峰期各站点上车人数,通过分析可以更加全面地对广州市区内公交线路进行优化;还可以根据公交GPS 信息和GIS 信息推断乘客的下车地点,结合上下车地点能够更好地对优化公交线路提出建议.26广 东 工 业 大 学 学 报第 36 卷20141023201411202014112720141204A B C D E F G H I J K L M N O P Q R S T U V W X Y 站点(b) 上班高峰期(08:00~09:00)下行各站点上车人数(c) 下班高峰期(17:00~18:00)上行各站点上车人数(d) 下班高峰期(17:00~18:00)下行各站点上车人数20141023201411202014112720141204A B C D E F G H I J K L M N O P Q R S T U V W X Y 站点20141023201411202014112720141204C D E F G H I J K L M N O P Q R S T U V W X Y Z站点图 5 上下班高峰期上下行各站点上车人数Fig.5 The up-line and doun-line number of passengers during morning and evening rush hour20141023201411202014112720141204A B C D E F G H I J K L M N O P Q R S T U V W X 站点(a) 站点上班高峰期(08:00~09:00)上行各站点上车人数第 1 期谢振东,等:基于一卡通数据的公交站点识别方法分析与研究27参考文献:谢振东, 方秋水, 徐锋等. 城市交通一卡通技术与应用[M]. 北京: 人民交通出版社, 2014: 17-20.[ 1 ]吴金成, 谢振东, 伍冠桦, 等. 基于交通一卡通数据的交通状态分析及动态控制研究[J]. 广东工业大学学报,2017, 34(3): 77-82.WU J C, XIE Z D, WU G H. A study of traffic status and dynamic control based on IC card data [J]. Journal ofGuangdong University of Technology, 2017, 34(3): 77-82. [ 2 ]LAMOND B, STEWARD N F. Bergman S balancing meth-od [J]. Transportation Research Part B: Methodological, 1981, 15(4): 239-248.[ 3 ]TREPANIER M, MORENCY C. Calculation of transit per-formance measures using smart card data [J]. Journal of Public Transportation, 2009, 12(1): 79-96.[ 4 ]BARRY J J, FREIMER R, SLAVIN H L. Use of entry-only automatic fare collection data to estimate linked transit trips in New York city [J]. Transportation Research Record Journal of the Transportation Research Board, 2009(2112): 53-61.[ 5 ]郭婕, 陈学武. 公交IC卡乘客上车站点确定方法及其应用[C]//第一届中国智能交通年会论文集. 上海: 同济大学出版社, 2005:195-201.[ 6 ]于勇, 邓天民, 肖裕民. 一种新的公交乘客上车站点确定方法[J]. 重庆交通大学学报(自然科学版), 2009, 28(1): 121-125.YU Y, DENG T M, XIAO Y M. A new method for determ-ining the arrival site of bus passengers [J]. Journal ofChongqing Jiaotong University(Natural Science), 2009, 28(1): 121-125.[ 7 ]蔡圻钊. 基于智能公交信息服务的网络安全接入与数据[ 8 ]分析研究[D]. 广州: 广东工业大学自动化学院, 2016.戴霄, 陈学武, 李文勇. 公交IC卡信息处理的数据挖掘技术研究[J]. 交通与计算机, 2006, 24(1): 40-42.DAI X, CHEN X W, LI W Y. Study on data mining tech-nique for bus intelligent card data processing [J]. Traffic and Computer, 2006, 24(1): 40-42.[ 9 ]刘雪琴. 基于交通一卡大数据的公客流分析与预测[D].广州: 广东工业大学自动化学院, 2016.[10]陈学武, 戴霄, 陈茜. 公交IC卡信息采集、分析与应用研究[J]. 土木工程学报, 2004, 37(2): 105-110.CHEN X W, DAI X, CHEN Q. Approach on the informa-tion collection, analysis and application of bus intelligent card [J]. China Civil Engineering Journal, 2004, 37(2): 105-110.[11]罗强, 何利力, 王晓菲. 数据仓库中数据清洗技术分析机[J]. 电脑编程技巧与维护, 2015(2): 61-61.LUO Q, HE L L, WANG X F. Data cleaning technology in data warehouse [J]. Computer Programming Skills and Maintenance, 2015(2): 61-61.[12]谢振东, 吴金成, 刘雪琴. 基于交通一卡通的城市老年人出行行为特征的分析研究[J]. 金卡工程, 2015(10): 18-20.XIE Z D, WU J C, LIU X Q. Study on the characteristics of urban elderly travel behavior based on traffic card [J].Golden Card Project, 2015(10): 18-20.[13]谢振东, 刘雪琴, 吴金成, 等. 公交IC卡数据预测模型研究[J]. 广东工业大学学报, 2018, 35(1): 16-22.XIE Z D, LIU X Q, WU J C. A study of passenger flow pre-diction based on IC card data [J]. Journal of Guangdong University of Technology, 2018, 35(1): 16-22.[14]谢振东, 李之明, 徐锋等. 城市交通一卡通大数据应用[M]. 北京: 人民交通出版社, 2016: 171-188.[15]28广 东 工 业 大 学 学 报第 36 卷。

相关文档
最新文档