出租车GPS数据可视化分析★

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

219
出租车平台所产生的数据,没有深入的挖掘有用的信息来透彻分析,会造成信息浪费。

本文是对来源于成都科泰科技有限责任公司《绵阳GPS数据》的利用和应用问题,主要进行基于大数据处理的出租车GPS数据可视化分析。

通过MATLAB对绵阳出租车GPS数据的算法分析,可以得出本市居民和外来游客的出行特征、兴趣喜好和生活方式等,再结合GIS地图匹配,我们能准确的向出租车上的乘客投放相应范围的优质商家广告,为乘客提供更加优质的服务。

1 分析方案
使用MATLAB、GIS等专业工具提取、处理并存储租车平台所产生的有效数据,结合出租车接客轨迹数据进行分析计算与数据集成,得出出租车上下客的时空分布规律。

出租车GPS轨迹数据提取方案如图1所示,关键技术:(1)大量数据的预处理,包含数据清洗和数据提取,得到可以数据。

(2)有效数据分析,包含对出租车车载系统数据类型的分类研究,对不同类型(如时间、经纬度、载客情况等)进行不同的处理。

(3)结果可视化图形表示,二维形式的直观图形表示。

2 数据处理
2.1 异常数据处理
本文研究的数据主要使用《绵阳GPS数据》,经查证,四川省绵阳市坐标范围为东经102°45′~105°43′和北纬30°42′~
33°03′,市区海拔高度在429m~728m。

此范围以外的坐标数据
属于异常数据,将该异常数据所在组整组剔除。

空车时VarName10的数值为0,有客时VarName10为1。

空重车数据为非0、1时该数据属于异常数据,将该异常数据所在组整组剔除。

此数据包含4368644组数据,样本量很大且表内缺失值所占样本比例<5%,可以使用列删法直接剔除表内缺失数据。

此数据中GPS数据采集时间间隔有15秒采集一次和60秒采集一次两种,本次数据分析的目的是为出租车精准广告投放系统提供精确的绵阳出租车上下客的时空分布规律,60秒时间间隔的数据不采用,只分析15秒时间间隔的数据。

其中,GPS相邻两条数据时间间隔出现异常主要有以下三种情况:(1)出租车GPS信号被高大建筑物遮挡或经过隧道时;(2)出租车GPS传输过程中出现不可避免的延迟和丢包现象时;(3)剔除经纬度和海拔异常数据、空重车异常数据、缺失数据所在组数据时[1]。

由于数据传输延迟一般在2秒以内,所以相邻两组数据时间间隔超过17秒的数据属于异常数据。

由于这类数据时间间隔较大,无法计算出上下客点坐标。

将时间异常的数据所在组整组剔除,对时间异常数据的剔除前需要对时间进行排序,使用MATLAB的对比函数可以快速实现,可以有效解决个别时间排序混乱问题,提高数据清洗的严谨性。

2.2 数据提取
本文使用的数据来源于成都科泰公司提供的绵阳市交通运输管理处的采集数据,主要使用MATLAB工具进行数据处理。

每组数据包含出租车车牌号、记录数据的时间、经度、纬度、高度、Speed、
GpsSpeed、RealGpsSpeed、RealSpeed、空重车。

空重车变量是0时为空载状态,1时为载客状态。

7×24小时不间断采集出租车GPS数据,包含了绵阳1-2月共4368644组数据。

将预处理后的数据按车牌号分组提取出子矩阵,再将每个子矩阵中的数据按时间进行排序,得到相同车牌号并按时间排序的矩阵数据[2]。

提取出空重车变量变化时的数据,上下客事件即发生在这组数据。

其中,当空重车变量发生变化,初步判断从1变为0为出租车下
客点,从0变为1即出租车上客点。

收稿日期:2019-01-14
*基金项目:院级创新训练项目(201812761049)基于大数据处理的精准广告投放系统研究。

作者简介:任亚飞(1982—),女,四川邛崃人,博士,讲师,研究方向:智能交通。

出租车GPS 数据可视化分析*
任亚飞 金睿 莫金亮 刘法超
(四川交通职业技术院,四川成都 611130)
摘要:本文是对来源于成都科泰科技有限责任公司的《绵阳GPS数据》的提取、分析和利用,详细阐述了基于大数据处理的出租车GPS
数据可视化分析。

关键词:大数据处理;GIS地图匹配;出租车GPS数据中图分类号:TP391.41文献标识码:A 文章编号:1007-9416(2019)02-0219-02
学术论坛
DOI:10.19695/12-1369.2019.02.118
图1 出租车GPS轨迹数据提取流程
提取出上下客点,可得到某时段的出租车下客空间分布规律。

对此数据的分析目的是找出绵阳市出租车乘客出行空间特征,主要是对的上下客地点分布和上下客热点区域进行分析,得到绵阳市区出行吸引量较多的区域,进一步找到这些区域对出行乘客吸引程度高的原因。

3 使用Geographic Information System(以下简称GIS)进行GPS数据和路网数据匹配
3.1 下载电子地图并载入数据
OpenStreetMap(OSM)是一款由网络大众共同打造的免费开源可编辑的地图服务。

在OpenStreetMap的官网上直接下载绵阳市电子地图数据。

可选数据格式有SHAPEFILE、GEOJSON、OSM PBF、OSM XML等。

由于本次数据处理需要使用GIS来进行GPS数据和路网数据匹配,所以选择SHAPEFILE格式下载,进行实验。

将GPS轨迹数据(Excel格式)添加为点数据,将OSM数据转为线数据,G P S轨迹数据坐标系和电子地图的数据坐标系统都是WGS1984地理坐标,不用作坐标转换。

但需要在下面的匹配过程中,剔除电子地图中的河流数据和人行天桥数据。

3.2 GPS数据和路网数据匹配
由于数据清洗时剔除了经纬度、海拔、空重车和时间的异常数据和缺失数据,以及数据提取后,400M的原始数据仅剩下8M有用数据,每辆车的数据无法形成轨迹,所以暂时无法使用车辆行驶轨迹和行驶方向等额外信息来进行马尔科夫模型的处理。

本文路网匹配先使用几何算法中的点到线距离对比的方法,在后续研究中,加大数据量后可实现对车辆行驶轨迹的处理和分析。

使用GIS投影工具、邻近表工具、连接工具、字符计算器等联合处理,来计算每个GPS距离最近道路的距离。

在分析过程中,一部分GPS数据由于信号定位问题,如图2所示定位到河流中(图中金黄色的点为出租车GPS上下客的定位点),其数据可以判断为是不可信的。

另一部分的GPS数据由于离道路非常远,如图3所示其最近道路距离值亦非常大,但是根据现有的道路数据,它的计算判断为准确的。

通过获取离GPS数据点最近的道路,计算GPS数据点离道路最近点,求得两点间的距离。

最后,得出出租车用户上下客空间分布规律如下图4所示。

4 GPS数据分析应用
近年来,随着GPS智能终端的普及越来越多的人开始习惯于记录并分享轨迹日志。

基于这些日志可以分析并挖掘出用户的一些行为特征,从而为用户提供个性化的基于位置的智能服务,有效地提升和改善用户的应用体验。

GPS数据的分析与挖掘可以应用到生活的方方面面,可以通过某路段的平均车速监测堵车情况;可以为打车平台对空车进行实时调度;可以作为城市交通规划的重要依据;可以作为出租车公司管理优化依据;可以用来分析出行高峰时间段和区域之间的具体情况;也可结合消费行业分析客户喜好,从而可作为出行规划和选址的依据。

本文通过MATLAB对绵阳出租车GPS数据的算法分析,得出城市出租车上下客点时空分布规律。

在后续研究中,将分析出本市居民和外来游客的出行特征、兴趣喜好和生活方式等,再结合GIS地图匹配,分析得出优秀商家、景点、医疗教育等。

最后,结合特殊时段下,出租车辆所在的当前区域内,合适的优质商家、景点、医疗教育等各方面信息投放于出租车内、顶部和后窗上等位置,推荐给乘客和出行大众[3]。

(1)对于顾客方便:基于物理位置的广告,当顾客对广告内容感
兴趣时,无需多花费考虑的时间,就可以去广告所展现的地方,体图2 GPS数据和路网的匹配
图3 距离路网很远的GPS数据点图
图4 出租车用户上下客空间分布规律
······下转第222页
验相应的服务。

时效性:用户的行为和兴趣都是有时间限制的,一般广告很多人第一眼看到感兴趣时想要前往的概率是非常大的,可前往距离太远当时并没有时间,想着有时间再去,但是很多时候都会忘记。

(2)由于所推荐的广告并不是店家投放,而是由数据分析得出,避免了粗制滥造,优化了顾客选择体验。

5 结语
本文利用城市出租车GPS轨迹数据的可视化分析,得到城市出行的规律和需求,并结合乘客和出行大众的需求,提出了出租车GPS
Visualization Analysis of Taxi GPS Data
REN Ya-fei, JIN Rui, MO Jin-liang, LIU Fa-chao
(Sichuan Vocational and Technical College of Communications,Chengdu Sichuan 611130)
Abstract:This paper extracts analyses and utilizes GPS data of Mianyang taxi from the Chengdu Ketai Science and Technology limited liability company. This paper elaborates the visualization analysis of taxi GPS data based on big data processing.
Key words:Big Data Processing; GIS Map Matching; Taxi GPS Data
数据可视化分析对出租车精准广告服务的基础性和重要性,从而为城市出行提供更优质的服务和体验。

参考文献
[1] 何雯,李德毅,安利峰,等人.基于GPS 轨迹的规律路径挖掘算法[J].吉林大学学报(工学报).2014(06):1764-1770.
[2] 吴川.出租车车联网大数据平台及时空分布态势研究[D].山东大学,2017(11).
[3] 江文君.试论出租车大数据在城市交通中的应用[J].中国高新区,2017(12):194.
Discussion on the Socialization of Meteorological Information Network Operation
Guarantee
WANG Lei,PANG Qian
(Shijiazhuang Meteorological Bureau, Shijiazhuang Hebei 050081)
Abstract:the operation of meteorological information network needs to do a good job to support the normal operation of the business, but due to the higher and higher requirements of various kinds of safeguard work, the personnel and technology of meteorological department have problems in the support work. This paper analyzes the significance of operation support socialization, summarizes the current development of our country in this field,discusses the method of promoting operation support socialization, and helps the meteorological department to gradually realize the socialization of operation support of meteorological information network.
Key words:meteorological networks; operational security; socialization; status of development
自己进行维护,而这几年随着企业开发的气象软件逐渐增多,很多软件也都是由企业负责维护。

4 气象信息网络业务运行保障社会化的措施
4.1 因地制宜
气象信息网络业务会运行保障有很多优势,具有专业性,在一定程度上也能够提升效率降低成本。

但是不同地区在经济、环境、业务上的情况都有很大的区别,所以必须要做好因地制宜,分类开展。

首先需要划分气象信息网络业务的类别,分析业务在维修维护工作上的难度、气象业务的耦合程度,以及气象部门经费的充裕程度。

同时还需要充分考虑到气象信息网络和数据的安全,选择合理的方式和时机开展业务保障的社会化。

另外,针对不同地区,还需要充分考虑当地的技术人员能力、经济发展水平、设备数量、企业力量等方面的因素[4]。

4.2 提高业务保障的广度
随着技术的发展,以及企业对各种智能的要求,各种设备的复杂程度正在升高,技术含量也在增加。

目前大量的业务都需要不同
方面的技术来提供支持,气象部门所使用的设备种类在增多,设备的规模也在扩大。

由于目前气象部门自身的工作压力也在不断升高,所以单纯依靠气象部门自身应难以满足业务维护的需求。

如果让企业和社会力量广泛参与到系统设计、运行监控、维护维修这些领域当中,能够保证相关业务的专业性,也能让气象部门从繁琐的维护保障工作当中解放出来,更好地进行整体规划和研究,提升气象系统的水平。

5 结语
气象信息网络运行保障会的社会化对于气象信息网络业务的开展有很好的帮助,可以提升效率,并且在一定程度上降低气象部门的投入,解决目前运行保障人员不足的问题。

对于社会化建设,不同地区和不同业务要根据情况开展,从而是现实保障的社会化。

参考文献
[1] 周勇,赵志强,刘东君.气象信息网络运行保障社会化相关问题探讨[J].中国信息化,2014(Z2):92-95.
······上接第220页。

相关文档
最新文档