关于出租车载客地点序列推荐技术的研究

合集下载

关于出租车载客地点序列推荐技术的研究

关于出租车载客地点序列推荐技术的研究

t e d p r o i f t or f p a s s e n g e r i f n d i n g .S p e c i i f c a l l y ,t h e p a p e r e s t a b l i s h e s a Ma r k o v De c i s i o n P r o c e s s mo d e l w h i c h i s b a s e d o n t a x i —
Ab s t r a c t : I n mo d e m c i t i e s ,t a x i s p l a y a q u i t e s i g n i i f c a n t r o l e i n i n t e l l i g e n t t r a n s p o r t a t i o n s y s t e m .Ho we v e r ,d u e t o l a c k i n g o f e n o u g h d r i v i n g e x p e ie r n c e a n d k n o w l e d g e o f c i t i e s ,s o me t a x i d iv r e r s t e n d t o t a k e s t o c h a s t i c c r u i s e f o r i f n d i n g p a s s e n g e r s w h e n t h e y a r e i n v a c a n t .T h i s l e a d s t o t h e l o w p r o i f t a s we l l a s t h e e n e r g y c o n s u mp t i o n a n d e n v i r o n me n t p o l l u t i o n .T h i s p a —

基于时空上下文协同过滤的出租车载客点推荐算法

基于时空上下文协同过滤的出租车载客点推荐算法
J o u r n a l o f Co mp u t e r Ap p l i c a t i o n s
I S S N l 0 01— 9 081
2 01 5 . 0 6 . 1 0
计 算机应 用, 2 0 1 5 , 3 5 ( 6 ) : 1 6 5 9—1 6 6 2 , 1 6 6 7
A bs t r a c t : Be c a u s e e x i s t i ng pa s s e ng e r — ind f i n g a l g o it r h ms d o n o t c o ns i de r t a x i ’ S s p a t i o — t e mp o r a l c o n t e x t ,a c o l l a b o r a t i v e
兴趣程度 高的载客点推荐给 目标 出租 车。在基 于福州市 出租车轨迹数据 的实验 中 , 时间衰减 因子为 0 . 7时 , 整体推荐 效果最佳 , 同时该算法在邻居集合的不 同大小时推荐 准确 率均优 于传统协 同过 滤推 荐算 法。结果表 明该 算法与传 统
的 协 同过 滤 算 法相 比 有 更 高 的推 荐 准 确 度 。
( 1 .S ห้องสมุดไป่ตู้ h o o l o f S o tw f a r e E n g i n e e r i n g ,C e n t r a l S o u t h U n i v e n i  ̄,C h a n g s h a H u n a n 4 1 0 0 7 5 ,C h i n a ; 2 .S c h o o l o fI n f o r m a t i o n S c i e n c e a n d E n g i ee n r i n g ,C e tr n a l S o u t h U n i v e =i t y ,C h a n g s h a Hu n a n 4 1 0 0 7 5 ,C h i a; n 3 .F u j i a n K e y L a b o r a t o r y f o r A t u o m o t i v e E l e c t r o n i c s a d n E l e c t r i c Dr i v e( F u j i a n U n i er v s i t y f o T e c h n o l o g y ) ,F u z h o u F u j i a n 3 5 0 1 0 8 ,C h i n a )

出租车车辆定位方案

出租车车辆定位方案

出租车车辆定位方案随着移动互联网和智能交通系统的发展,出租车定位已成为现代化城市交通管理和服务的重要组成部分。

出租车车辆定位方案是用于对出租车进行实时全天候的定位、监控、管理和服务的解决方案。

本文将从技术原理、方案特点、应用场景等角度进行说明。

技术原理出租车定位通常采用卫星定位技术和无线通信技术。

卫星定位是通过GPS卫星对车辆位置进行精准定位,而无线通信则是实现出租车位置信息的实时传输。

两种技术的结合,使得定位结果更加精确和可靠。

具体来说,先安装GPS车载终端,该终端可以接收卫星信号,得到车辆的位置、速度、航向等信息。

然后,通过GPRS/CDMA/3G/4G等无线通信方式,将车辆位置信息传输到服务器上。

此时,出租车车辆定位系统将实时获取所有出租车的位置信息,并对其进行分析、处理和存储。

用户可以通过APP、网站或电话等方式查询自己需求的出租车位置信息。

方案特点1.实时性强:方案可以实现出租车实时定位监控,准确反映出租车的位置信息。

2.精度高:GPS卫星定位技术的应用,使得定位精度高,误差小。

3.扩展性好:方案可以根据需要,进行横向的扩展,可以增加车辆实时视频监控、违章检测等功能。

4.操作简单:系统界面简单友好,使用起来非常便捷。

5.反应效率高:当车辆发生故障或者事故时,出租车公司可以快速反应,及时处理并派遣附近的车辆进行救援。

应用场景出租车车辆定位方案具有广泛的应用场景,主要涉及以下三个方面:出租车公司出租车公司能够实时监控车辆位置、状态和服务信息,对车队进行有效管理,提高服务质量和效率。

公司可以对车辆进行远程指挥,并对司机的表现进行评估和考核,提供更优质的出租车服务。

客户端应用于搭载在用户手机上的APP,客户可以在网上查询附近的出租车位置信息,并选择志愿司机或附近车辆。

精准的出租车定位和实时监控,可以提供更优的乘车体验,提高用户的满意度。

政府定位监管政府可以通过出租车车辆定位系统,加强交通运输管理,优化城市出租车运输乘客质量,通过数据分析实现出租车市场监管和策略制订。

基于时空上下文协同过滤的出租车载客点推荐算法

基于时空上下文协同过滤的出租车载客点推荐算法

基于时空上下文协同过滤的出租车载客点推荐算法作者:钱文逸蒋新华廖律超邹复民来源:《计算机应用》2015年第06期摘要:针对现有出租车载客点推荐算法忽略出租车所处上下文的情况,提出了一种基于时空上下文协同过滤的出租车载客点推荐算法。

该算法将载客点信息映射到空间网格,通过在出租车司机驾驶行为相似度的计算中引入时间衰减因子,得到与目标出租车司机驾驶行为最相似的邻居集合,基于地点上下文过滤从相似邻居集合中选取感兴趣程度高的载客点推荐给目标出租车。

在基于福州市出租车轨迹数据的实验中,时间衰减因子为0.7时,整体推荐效果最佳,同时该算法在邻居集合的不同大小时推荐准确率均优于传统协同过滤推荐算法。

结果表明该算法与传统的协同过滤算法相比有更高的推荐准确度。

关键词:推荐系统;协同过滤;时空上下文;全球定位系统轨迹;载客行为中图分类号: TP181 文献标志码:A英文摘要Abstract:Because existing passengerfinding algorithms do not consider taxis spatiotemporal context, a collaborative filtering recommendation algorithm of taxi passengerfinding based on spatiotemporal context was proposed. The proposed algorithm mapped potential passenger locations to space network, and introduced time delay factor to similarity measure to get the neighbor set which was similar to a target taxis driving behavior. Based on location context, the proposed algorithm chose the target taxis most interest potential passenger location from similar neighbor set. The experimental results on Fuzhou taxi trajectory data show that the proposed algorithm can get the best recommendation result when the time delay factor is 0.7. Meanwhile, compared to the traditional collaborative filtering recommendation algorithms, the proposed algorithm obtains better recommendation result under the neighbor sets with different size, which means the proposed algorithm is more accurate than the traditional collaborative filtering algorithms.英文关键词Key words:recommendation system; collaborative filtering; spatiotemporal context;Global Positioning System (GPS) trajectory; taxi passenger behavior0 引言目前,出租车的服务方式主要采用巡游式和电召式,其中巡游式占主导位置,电召通常为配合巡游型服务的补充方式。

基于Markov的出租车载客点推荐

基于Markov的出租车载客点推荐

系图,为出租车提供载客点推荐,在出租车寻客推 荐上已有取得较多的研究成果(诸如文献[5,7,8, 12,15]),此类文献均是通过各种方法为出租车提供 载客点推荐。然而,目前的研究只是为当前出租车 提供一个载客地点,没有考虑到出租车在该载客点 寻客失败的情况。针对这一不足,本文提出了一种 基于Markov的出租车载客点推荐模型,研究内容 主要是通过评估函数出租车临近载客点以及后续载 客点进行评估,来获得最佳载客点序列,确保岀租 车以最短时间找到乘客。
工作。Markov 决策过程(Markov Decision Process 简
称MDP)必须遵循Markov属性,即下一个状态仅
与当前状态和所采取的的动作相关,并且与先前的
状态和动作无关。每个动作都有一个返回值。对于
每个状态,下一步需要是最佳的,以便能够在有限
的步骤中最大化总收益。
MDP由三元组组成:M= ( S, A, R),分别表示:
状态集,动作集和返回值集。若M序列为{( s0, a0, r0),
(sb ab rj) , (s2, a2, r2)
假设初始代理状态为
1 Markov决策过程
岀租车寻客的载客点选择过程可以被认为是随 机决策过程,它可以进一步通过Markov决策过程 来描述。该过程包括能够转换状态的一系列状态和
作者简介:宋芝明(1991-),男,研究生,主要研究方向:数据挖掘;袁健(1973-),女,副教授,主要研究方向:数据挖掘,人工智能。
宋芝明等:基于Markov的出租车载客点推荐
Recommendation Model of Taxi Passenger-finding Locations Based on Markov Algorithms

基于时空聚类的出租车载客热点区域挖掘研究

基于时空聚类的出租车载客热点区域挖掘研究
areaꎬ so that we can provide information and decision service for taxi operators and managers.
Key words:pick-up hotspotsꎻ grid clusteringꎻ GPS dataꎻ data mining
第 43 卷 第 1 期
2020 年 1 月

测绘与空间地理信息
GEOMATICS & SPATIAL INFORMATION TECHNOLOGY
Vol.43ꎬNo.1
Jan.ꎬ 2020
基于时空聚类的出租车载客热点区域挖掘研究
何 月ꎬ 王崇倡
( 辽宁工程技术大学 测绘与地理科学学院ꎬ辽宁 阜新 123000)
想情况下的最优路径ꎮ 冯琦森 [8] 等人利用出租车轨迹数
据得到居民出行频繁经过的路线ꎬ这些路线可以清晰地
反映城市交通情况和用户移动模式ꎮ 陈红丽 [9] 通过出租
车 GPS 轨迹数据对居民出行在时空分布上的情况进行探
讨性研究ꎬ并且对城市热点与兴趣点的关联进行了分析ꎮ
综上ꎬ目前的研究主要集中于出租车巡游路径推荐
研究热点ꎮ
Zhang [2] 等人研究发现出租车在行驶过程中存在异常
模式ꎬ基于此设计了可以检测出租车运行中出现不诚实
行为的系统ꎮ Liu [3] 等人将收入较高与收入普通的两种出
租车司机的车辆行驶路线做比较ꎬ通过分析发现高收入
的出租车司机在选择路线时采取的策略ꎮ Ge [4] 等人提出
将乘客的上车点和下车点排成序列的方法ꎬ使出租车司
HE Yueꎬ WANG Chongchang
( School of Geomaticsꎬ Liaoning Technical Universityꎬ Fuxin 123000ꎬ China)

基于路径规划的出租车载客率最优化研究

基于路径规划的出租车载客率最优化研究

基于路径规划的出租车载客率最优化研究近年来,出租车行业一直是城市交通中不可或缺的一部分。

为了提高出租车的载客率,许多研究者开始使用路径规划算法来优化司机的行车路径。

本文将探讨基于路径规划的出租车载客率最优化研究。

一、现状分析出租车行业的发展面临着一些挑战。

一方面,城市交通拥堵严重,导致司机往往需要花费大量时间在路上。

另一方面,市中心的载客需求不断增加,但出租车数量有限,难以满足乘客的需求。

为了解决这些问题,许多公司开始研究如何通过路径规划算法来提高出租车的载客率。

路径规划算法可以基于实时交通信息,为司机提供最佳的行车路径,从而减少司机在路上的时间。

二、路径规划算法在出租车载客率最优化研究中,最常见的路径规划算法是基于网络地图和实时交通信息的最短路径算法。

这种算法可以根据出发地和目的地的坐标,计算出最短的行车路径。

然而,最短路径并不一定是最优的路径。

在实际情况中,司机需要考虑更多因素,如路况、乘客需求等。

因此,为了提高出租车的载客率,需要进一步优化路径规划算法。

三、基于乘客需求的路径规划为了更好地满足乘客的需求,一些研究者开始将乘客分布信息纳入路径规划模型中。

通过分析历史乘客数据,可以得到不同时段和不同地点的乘客需求分布情况,从而优化出租车的行车路径。

具体而言,可以通过聚类分析将城市划分为不同的乘客需求热点区域。

然后,通过路径规划算法,司机可以被导航至这些热点区域,提高载客率。

四、基于实时交通信息的动态路径规划为了更准确地优化出租车的行车路径,一些研究者开始使用实时交通信息来调整路径规划。

实时交通信息可以提供道路的拥堵程度、交通事故等信息,从而帮助司机避开拥堵路段,选择更合适的行车路线。

这种基于实时交通信息的动态路径规划算法可以大大减少司机在拥堵路段的停留时间,并且提高出租车的载客率。

五、结果及讨论通过使用基于路径规划的出租车载客率最优化研究,可以提高司机的工作效率,降低乘客的等待时间,并改善城市交通拥堵问题。

出租车上下客载客点的提取

出租车上下客载客点的提取

出租车上下客载客点的提取1.引言1.1 概述概述部分的内容可以如下所述:出租车作为一种重要的城市交通工具,其载客点的提取是解决出行和交通管理问题的关键。

通过对出租车上下客点的提取,可以有效地分析乘客的出行行为和出租车的运营情况,从而为交通规划和出租车运营提供重要参考。

在过去,传统的出租车上下客点提取方法主要依赖于人工调查和统计分析,这种方法存在着调查成本高、数据采集周期长、数据有效性难以保证等问题。

随着全球定位系统(GPS)技术的发展和普及,利用GPS定位技术提取出租车上下客点的方法成为了一种重要的解决方案。

本文将探讨两种主要的方法来提取出租车的上下客点。

第一种方法是使用GPS定位技术,通过收集出租车的GPS轨迹数据,结合数据挖掘和空间分析技术,可以有效地提取出租车上下客点的位置信息。

第二种方法是通过分析历史数据,通过对乘客上下车记录的综合分析和统计,可以揭示出租车客流的分布规律,进而提取上下客点的位置。

通过对这两种方法的研究和应用,可以帮助我们更好地了解出租车载客点的分布规律,为城市交通规划和出租车运营决策提供科学依据。

同时,这些方法的应用也有助于优化出租车的调度和服务,提高乘客的出行体验,促进城市交通的可持续发展。

本文将在接下来的章节中详细介绍提取上客点和下客点的方法,并对它们进行总结和分析。

最后,我们将得出结论,并对未来的研究方向提出展望。

1.2文章结构文章结构部分的内容应包括作者对整篇文章的构成和组织方式进行介绍。

下面是文章结构部分的一个例子:1.2 文章结构本篇长文主要围绕着出租车上下客载客点的提取展开。

整篇文章分为引言、正文和结论三个部分,各个部分的具体内容如下:引言部分将对本文的主题进行概述,并介绍文章结构和目的。

正文部分将详细探讨提取上客点和下客点的方法。

首先,在2.1小节中,将介绍使用GPS定位技术来提取上客点的方法,这一方法可以通过定位信息确定出租车在哪些位置上车的概率较高。

基于多决策分析法对机场出租车载客问题的研究

基于多决策分析法对机场出租车载客问题的研究

基于多决策分析法对机场出租车载客问题的研究机场出租车载客问题是一个涉及到乘车需求、交通拥堵、出租车供给等多个因素的复杂决策问题。

为了解决这个问题,可以采用多决策分析法,并结合实际情况进行研究。

第一步,确定决策目标。

在机场出租车载客问题中,我们的目标是提高乘客乘车的效率和满意度,减少交通拥堵,提高出租车的利用率。

第二步,确定决策准则。

决策准则是评价决策方案的指标,可以包括:乘车时间、乘车费用、交通拥堵程度、客流量等。

通过对这些准则的权重确定,可以量化地比较各个方案的优劣。

第三步,收集数据。

收集机场出租车的乘车需求、交通流量、出租车的供给情况等相关数据。

可以通过问卷调查、实地观察、数据分析等方法进行数据收集。

第四步,建立决策模型。

根据收集到的数据,可以建立一个机场出租车载客问题的决策模型,以便进行决策分析。

可以运用数学模型、统计模型等方法,对不同因素进行综合考虑。

第五步,分析决策方案。

根据决策模型,对不同决策方案进行评估和比较。

可以利用层次分析法、TOPSIS法、灰色关联分析等多种多决策分析方法,综合考虑各个准则的权重,得到各个方案的综合评价。

第六步,制定决策方案。

根据多决策分析的结果,确定机场出租车的载客方案。

可以采取一些改进措施,如调整出租车的调度策略、优化乘车路线等。

第七步,实施决策方案。

将制定的决策方案付诸实施,对其效果进行监测和评估。

可以通过收集乘客的反馈意见、观察交通拥堵情况等方法进行评估。

通过以上的研究过程,可以对机场出租车载客问题进行科学的分析和决策。

多决策分析法能够全面考虑各个因素的重要性,并找到最优的决策方案,提高机场出租车的运行效率和乘客的满意度。

出租车调度与路线规划研究

出租车调度与路线规划研究

出租车调度与路线规划研究一、引言出租车调度和路线规划是城市交通运输系统的重要组成部分,同时也是满足城市居民出行需求的关键。

如何优化出租车的调度和路线规划,提升出租车运营效率和服务质量,一直是学者们关注的热点问题。

本文将从出租车调度和路线规划的基本概念入手,探讨相关研究现状及存在的问题,并以当前最具代表性的技术手段——人工智能为基础,展望出租车调度和路线规划的未来发展方向。

二、出租车调度出租车调度是指对无序的客源进行有效的调度和分配,使得出租车系统能够高效地服务乘客和提高司机的收益。

一般而言,出租车调度包括两个环节,即出租车的空车调度和载客调度。

在空车调度中,出租车需要根据当前时空状况,动态地确定空车的出租车站点或者巡游路线。

而在载客调度中,则需要考虑乘客的位置和出租车的实时状态,实现从空车状态到载客状态的转移。

传统的出租车调度方法主要采用规则制定、驾驶员调度和车队管理等手段,但由于其方法的固定性、约束性和算法的局限性,无法满足现代城市交通运输系统的需要。

人工智能技术的出现,为出租车调度提供了新的思路和方法。

基于人工智能技术的出租车调度可以通过大数据处理,融合城市交通状况、天气情况和市场需求等信息,实现动态调度和优化。

例如,谷歌公司的出租车调度系统利用语音识别技术,能够准确判断城市交通拥堵和客流量,根据这些信息制定出租车的巡游路线和优化调度方案,大幅提升了车队运行效率和服务质量。

三、路线规划路线规划是指在给定起点和终点的情况下,确定最优的出租车行驶路径,包括时间最短和路程最短、避开拥堵等多种不同模式。

与出租车调度的复杂性相比,路线规划的难度更大,因为其需要考虑多种因素影响,如路面交通状况、路程长度、交通拥堵情况、乘客数量和司机经验等。

传统的路线规划方法主要包括最短路径算法、A*算法、遗传算法等。

这些算法可以通过计算车辆行驶时间、路程、拥堵程度和路况等信息,确定最优的出租车行驶路径。

但是,这些算法的计算效率难以满足实时性需求,同时无法考虑到复杂的城市交通情况,导致结果的不可控性和不稳定性。

出租车公司工作人员的路线选择与导航技巧

出租车公司工作人员的路线选择与导航技巧

出租车公司工作人员的路线选择与导航技巧在出租车业务中,准确和高效地选择最佳路线和使用导航技巧对工作人员至关重要。

一个熟练的司机应该能够根据乘客的需求和路况准确选择路线,为乘客提供更好的服务。

本文将探讨出租车公司工作人员的路线选择与导航技巧。

一、了解城市道路首先,一个熟练的出租车司机应该对所在城市的道路网络非常熟悉。

他们应该熟知主要道路、高速公路和常用街区,以及这些道路的交通情况。

这样,司机就能够在选择路线时综合考虑多个因素,比如交通流量、道路质量和速度限制等。

二、使用导航工具现代技术使司机能够轻松使用导航工具来引导他们的路线选择。

出租车公司可以为其工作人员提供配备了导航系统的车辆,这会大大提高司机的效率和准确性。

导航工具可以根据乘客的目的地和交通状况给予实时的导航建议,帮助司机选择最佳路线。

三、了解交通规则与限制出租车司机还应该熟悉市区的交通规则和限制。

他们应该了解停车限制区域、高峰期的交通流量和限行规定等。

有时候,司机可能需要绕道或者选择不同的路线来避开交通限制或者拥堵路段。

四、考虑乘客的需求在选择路线时,司机应该始终考虑乘客的需求。

有些乘客可能对时间很敏感,希望尽快到达目的地,而有些乘客可能更注重路线的美景或者对拥堵情况有顾虑。

好的司机应该善于与乘客沟通,根据他们的需求和喜好选择合适的路线。

五、灵活应对突发情况在出租车行业,突发情况时常发生。

这可能包括交通事故、道路封闭或者路线改变等。

在这些情况下,司机需要快速做出决策,并选择最佳的替代路线。

他们应该了解城市的替代道路和变通的方式,以便能够避免浪费时间和为乘客提供舒适的乘车体验。

六、持续学习与更新知识市区的道路和交通规则可能会发生改变,新的道路也可能会新建或者开通。

因此,出租车司机应该定期更新自己的知识,并持续学习新的导航技巧和路线选择策略。

出租车公司可以组织培训课程,帮助司机不断提升自己的技能。

总结:对于出租车公司工作人员而言,准确和高效地选择路线与使用导航技巧是提供优质服务的关键。

短途载客优先安排模型的研究

短途载客优先安排模型的研究

2020年第4期12计算机应用信息技术与信息化短途载客优先安排模型的研究李 硕* LI Shuo摘 要 出租车是我们日常生活中必不可少的交通工具之一,而机场出租车情景尤为特殊。

机场的出租车司机载客时,所载乘客的目的地有远有近,本文针对短途载客再次返回机场载客这一情况,提出了一种优先安排模型,使得这些出租车的收益尽量均衡。

关键词 进程调度;优先安排模型;出租车载客分析doi:10.3969/j.issn.1672-9528.2020.04.003* 山东师范大学信息科学与工程学院 山东济南 2503581 问题的背景我们去机场或者下飞机后通常的选择的出行方式便是出租车。

而选择在机场载客的出租车尤为特殊。

机场乘客下车后往往会去往市区中心或者机场周边这两个目的地。

从出租车司机的角度考虑,国内多数机场都是将送客(出发)与接客(到达)通道分开的。

出租车到达机场后一般会有两个选择: (a) 前往排队区等候载客。

出租车司机一般前往的指定的区域排队等候,按照 “先来后到”的方式排队等待载客,对于司机来说,等待时间长短取决于排队出租车和乘客的数量多少,需要付出 一定的时间成本。

同时,对于乘客,分为短途乘客(乘客目的地为周边区域)和长途乘客(乘客目的地为市区附近)。

(b) 空载返回市区载客。

表面上看载客返回是较优方案,但空载返回相对于等待载客却赢得了时间收益。

从机场的角度考虑,选择排队载客的司机,由于乘客的目的地和机场的距离不同,往往会接待到两种乘客:短途乘客(目的地为机场周边)和长途乘客(目的地为市中区)。

而出租车司机的收入和乘客的目的地密切相关,这就使得出租车之间的收益存在不平衡。

为保证载客到机场的出租车司机收益均衡,本文针对这一场景提出优化安排模型。

为方便模型的提出,本文假设机场出租车司机不可以选择乘客,且不可拒载,给与短途载客司机一定的优先权。

2 问题分析机场管理者方面拟对短途出租车司机提出一定的优惠政策,使司机不会因为接待短途收益有所亏损。

出租车载客点个性化推荐算法

出租车载客点个性化推荐算法

出租车载客点个性化推荐算法张跃威;屈卫东【摘要】Different taxi drivers may have different driving preferences when they are cruising to pick up passengers. In this paper, we study the behaviors of taxi drivers' finding passengers with three recommender algorithms, and then provide the taxi driver with the personalized recommendation based on his preferences to the pick-up locations. First, we use the algorithm based on users and collaborative filter of projects to recommend pick-up locations for the taxi drivers. The algorithm is verified by the accuracy rate, proving the feasibility of the two algorithms. Next, taking into account the time factor which would affect the taxies' pickup behavior, we add the time factor into the two algorithms above. Finally, propose the latent factor model (LFM) that breaks the taxi-pickup matrix into two simpler matrices that will help the analysis of the preferences. The results show the three algorithms can effectively form recommendation, and the LFM has a higher accuracy rate.%不同的出租车司机在寻找乘客选取载客点时会有不同倾向,利用三种推荐算法对上海出租车司机载客点选取行为进行分析,根据司机对载客点的喜好程度进行个性化推荐.首先,利用基于用户和基于项目的协同过滤的算法来对出租车司机的载客点进行推荐,利用正确率指标来验证算法,实验证实了这两种算法的可行性;之后,考虑到出租车的载客行为受到时间的影响,在上述两种算法基础上增加了时间因子;最后,利用隐含因子模型(LFM),将出租车与载客点的共现矩阵进行分解,根据分解所得矩阵进行兴趣度的分析.实验结果证明,三种方法可有效形成推荐,且LFM算法推荐准确率较高.【期刊名称】《计算机系统应用》【年(卷),期】2017(026)006【总页数】5页(P148-152)【关键词】推荐系统;协同过滤;隐含因子模型;载客点推荐【作者】张跃威;屈卫东【作者单位】上海交通大学自动化系, 上海 200240;上海交通大学自动化系, 上海200240【正文语种】中文在信息爆炸的现代社会, 推荐系统已经在电商、图书等领域得到很多的研究与应用, 推荐系统根据所记录的用户历史数据, 通过数据挖掘、机器学习等算法分析个人的兴趣爱好, 帮助用户过滤掉不相关的知识, 进而形成用户感兴趣的个性化的推荐. 出租车司机对于城市的空间布局及乘客的时空分布有一定的了解, 司机在空载寻找乘客时, 会有自己的倾向, 有的司机喜欢在上班高峰期时候小区门蹲点, 有些习惯在车站、学校等人流量大的地方, 本文的目的在于对出租车司机的载客点的选取进行行为建模, 挖掘每个司机内在的偏好, 继而有针对性的向司机推荐满足其兴趣或者符合其习惯的载客点, 本文采用协同过滤(包含时间上下文的基于项目与基于用户两种方法)与隐含因子算法分析论证了出租车司机载客点的个性化推荐的可行性, 并通过多次试验比较了几种方法的准确度. 全文的结构如下: 第一部分介绍了出租车载客点推荐相关的研究, 第二部分介绍载客点的抽取与地图分割方法, 第三部分利用协同过滤算法验证算法有效性, 之后在协同过滤算法中添加时间因子, 使得准确度有了一定提高, 第四部分使用了隐含因子模型得到推荐的载客点, 使得推荐的准确率进一步提高, 最后部分是全文总结与展望.近年来全球定位系统(gps)在出租车上得到了广泛应用, 针对出租车的信息服务变得越来越重要, 载客点推荐也成为国内外学者研究方向之一[1-8]. Y Ge[4]提出向出租车推荐序列载客点的模型, 文中将地图划分为网格, 对于网格中每一部分进行了收益分析, 形成了时空收益地图, 提出energy-efficient目标函数, 计算行驶距离最小的通过连续载客点的路径, Qu M等人[8]将经过载客点的每条路径的代价(距离、时间、油耗)作为目标函数, 将总消耗最小的载客点序列推荐给司机, Ding Y等[9]根据历史和实时轨迹数据提出Hunts模型, 给司机推荐载客概率高且收益也高的路径. 微软亚洲研究院郑宇团队做了很多轨迹数据挖掘相关的工作[1,6,7], 提出了T-driver[6]、T-finder[7]等模型. 考虑到不同司机的驾驶习惯, Chang K P等[11]根据一个人四个月的轨迹记录, 根据给定的OD点提出适于个人偏好的路径, 而Dai J 等[10]基于海量出租车轨迹数据, 计算出每条路段的三种属性, 根据个人对于每种属性的偏好程度进行推荐.实际上, 现有的大部分文献在司机偏好度方面都是考虑行驶距离、时间、油耗等具体因素, 分析其他的因素较少, 司机在实际驾驶过程中也比较难得到路径或位置的定量值, 很多时候是凭着感觉及对城市的认知去选择路线, 这些感觉及认知是比较难用时间、油耗这种理性思维来描述的. 为此, 本文试图通过推荐算法来挖掘出租车司机对于载客点选择的偏好, 挖掘出租车司机载客地点选取行为习惯, 形成个性化的载客点推荐.2.1 轨迹数据处理本文使用的数据是上海市大众出租车公司的数据[3], 我们从中抽取2007年2月份一个月的1000辆出租车轨迹数据进行分析, 根据出租车gps数据中的载客状态信息提取乘客上车的位置点. gps数据格式如表1所示. 首先, 将出租车的载客状态按照时间序列进行分析, 由于本文分析的是载客点, 所以抽取载客状态由0变为1的记录. 经过数据的清洗、去重、筛选, 共产生17万条载客记录, 本文将这些数据集按照4:1的比例随机分为训练集和测试集, 通过在训练集上建立出租车司机的兴趣模型预测出租车司机在测试集的行为, 计算预测行为和测试集上实际行为的重合度即正确率来评测推荐算法的有效性.2.2 地图处理本文选择的区域是上海市徐家汇, 范围为点(121.4150, 31.2000)和点(121.4800,32.2500)组成的面积为32.5平方公里的矩形区域, 我们按照经纬度精度0.002将地图分为200m×200m的正方形网格, 对每一个网格编号, 共得到813个网格. 然后我们将载客记录根据载客位置点映射到相应的网格中, 例如编号为u 的出租车在一个编号为i的网格内有载客记录, 那么就形成一条记录(u: i), 称u对i 有过正反馈. 这样出租车载客点的空间分布就可以得到.协同过滤的算法是推荐系统中最基本的算法, 其主要思想是利用用户之间与项目之间的相似程度来预测当前用户最可能感兴趣的项目[12]. 协同过滤是典型的利用集体智慧的方法, 该算法简单直接且容易实现,在学术界和业界都得到广泛应用. 协同过滤算法分为两大类,一种是基于用户的,另外一种是基于项目的. 本节首先使用基于用户的方法, 之后使用基于用户的方法, 将两种方法的结果进行了比较, 最后在此基础上考虑了出租车选择载客点时间上的相似性, 在两种方法上分别加入了时间因子, 并对比了加入时间因子后的准确率3.1 基于用户的协同过滤这是推荐系统早期的一种算法, 其目的是找出与当前用户具有相同兴趣的用户作为最近邻, 然后对于当前用户没有正反馈的项目, 利用其最近邻用户对此项目的兴趣来预测当前用户的对此项目的兴趣. 我们将出租车司机看作为用户, 其所经网格看作为项目, 这样就得到1000个键值对, 例如编号为u的出租车所经过的网格{u:[i,j,k,…]},同时也可得出现在某个网格载过客的出租车的集合. 出租车司机载客的习惯体现在他有过正反馈的网格的属性之中. 司机之间兴趣的相似性计算方法采用cosine相似度, 司机u和v载客行为相似度为:其中N(u)表示出租车司机u的载客点集合, 通过计算得到出租车u的K个最近邻, 遍历K近邻有过正反馈的网格, 得到u最感兴趣的网格, 公式(2)度量了司机u对网格i的兴趣:其中, S(u,K)表示与司机u兴趣最接近的K个司机, N(i)表示在网格i有过正反馈的出租车集合, rvi表示司机v对网格i的兴趣, 当v对i有过正反馈时, rvi为1, 否则为0. 最后将K个最大的p所对应的网格推荐给出租车司机u.3.2 基于Item的协同过滤这是当今很多大型网站都在采用的核心算法之一, 其基本思想是推荐给用户那些与他们之前喜欢的物品相似的物品[12], 在本文的理解是推荐给出租车那些与他们之前兴趣所在的网格属性相似的网格, 主要是通过计算网格之间的相似度来形成推荐, 网格相似度公式如下:出租车司机u对网格i的兴趣度如下式, S(j,K)表示与网格j的属性最相近的K个网格地点.同样, 最后将K个最大的p所对应的网格推荐给司机u.3.3 推荐结果分析推荐算法的有效性有多种指标来确定, 其中准确度指标是推荐系统预测用户行为的能力, 是非常重要的离线评测指标, 本文使用准确度指标, 如下面公式所示:R(u)为向司机推荐的其未载过客的网格集合, T(u)为测试集中司机u载过客的网格集合, 在表2中我们对比了两种推荐算法的准确度, 并对比了最热网格和随机网格推荐两种方法. 其中最热网格推荐是选取所有出租车去的最多的网格进行推荐, 随机推荐是向司机随意推荐网格, 将随机推荐作为对比的原因是验证推荐算法的有效性如何.由2表可以看出, 随机推荐的准确率最低, 且与其他三种方法差距较大, 最热网格推荐在推荐个数少的时候优于基于用户的推荐, 但是随着推荐网格增多准确率下降较快, 最热推荐明显的缺陷在于向所有司机同时推荐完全一样的网格地点, 无疑个性化程度很低. 基于用户的推荐算法准确率方面整体不如基于项目的推荐算法.3.4 加入时间因子的协同过滤算法出租车运行时所处的上下文有时间, 空间, 天气, 是否节假日等, 本节考虑其时间上下文, 其基本思想为: 在相近的时间, 若是不同的司机在相同几个的网格都有载客记录, 那么司机之间的相似度与网格之间的相似度都会更高. 在上述两种算法中向用户与项目相似度中分别加入时间因子, tui表示出租车司机在网格地点i发生载客的时间, 精确到分钟, 为时间衰减参数, 根据用户兴趣的变化率而调节, 在这里=0.3. 基于时间的用户相似度与项目相似度计算方法为公式(6)(7), 得到的准确率如表3所示.可见, 考虑时间上下文之后, 基于用户的推荐算法准确率有较大的提升, 基本与基于项目的推荐算法准确率相当, 基于项目的算法准确度略有增加. 这也说明在相似的时间内相同的载客点载到乘客的出租车司机行为相似性也更大.隐含因子模型(Latent Factor Model, LFM)是由Simon Funk提出的一个算法, Koren在Netflix Prize比赛中使用此算法获得了冠军, 引起学术界的广泛关注. LFM是对奇异值分解的改进, 其思想是把用户与项目映射到相同的隐含因子空间, 例如图书属性有文学、医学、建筑、媒体设计等, 每本图书可以按照属于某种属性的概率映射到各个属性空间, LFM就是通过矩阵分解技术建立用户和隐类的关系, 隐类和项目的关系, 最终得到用户对项目的偏好关系. 图1为LFM计算示意图.设出租车与网格之间共现矩阵为R, 若user对item有正反馈则rui为1, 否则为0. 假设隐类的数量为K, 我们要将R分解成两个低维矩阵P, Q, , P代表用户-属性矩阵, puk表示用户u对属性k的兴趣度, , Q代表项目-属性矩阵, qki表示项目i具有属性k的程度, 如公式(8)所示:那么出租车u对网格i的兴趣度的预测值为:我们通过已有的历史记录来学习P、Q, 以公式(10)作为目标函数优化P、Q,其中+是防止过拟合的项. 利用随机梯度下降法最小化上面的目标函数, 首先通过求参数的偏导数找到最速下降方向:然后需要将参数沿着最速下降方向不断向前推进, 通过迭代法不断优化参数, 如下所示:其中是学习速度. 在LFM模型中, 可调参数有四个, 通过大量实验, 我们选取K=20, 迭代次数20, =0.02, =0.02, 得到P、Q之后, 计算u对其没有正反馈的项目的兴趣:公式(15)通过计算rui将最大的k个项目推荐给u.推荐算法性能的优劣同样采用准确率指标, 并与基于时间上下文的协同过滤模型相比较, 如表4所示. 可以看出, 隐含因子模型在推荐准确率方面比基于时间上下文的的协同过滤算法要高, 而且准确率随着推荐网格数量的增多降低的也较慢. 在计算的时间复杂度方面, 协同过滤算法与LFM算法时间复杂度在同一个数量级, 没有质的区别, 而在空间复杂度方面, LFM可以较好的节省内存, 所以在应用于出租车载客点推荐此类问题中LFM算法比传统协同过滤算法在准确率和计算空间复杂度方面都较优.由实验可以得出结论, LFM算法主要特点为: 1)无需考虑分类的方式, 聚类结果是司机载客行为统计自动计算的, 是数据驱动的. 2)分类的粒度可通过设置LFM的分类数控制. 3)不是将每个项目划分到某一类, 而是计算各项目划分到各类别的概率. 4)可得到各个用户对于各类别的偏好概率、类别中每个项目所占的权重.本文试图将推荐算法应用于出租车司机的载客点推荐, 根据司机的历史行为分析司机的载客点选取行为, 使用了三种推荐模型司机进行了推荐, 在基于用户和基于项目的推荐模型中添加了时间因子, 有效提高了基于用户的推荐模型的准确率, 继而使用了一种在Netflix Prize比赛获胜的算法隐含因子分解算法(LFM)进行推荐, 最后对比了三种推荐模型在准确率指标上的优劣, 得出结果表明LFM算法在时间空间复杂度没有提升的情况下, 准确率是最高的, 是最适合的载客点推荐算法. 由于本文只分析了准确度度量, 评判标准比较单一, 以后的工作中还可以对推荐系统的覆盖率、新颖度、多样性等进行评测. 在维度方面, 司机载客时所处上下文也只考虑了一日内的时间因素, 还可以将天气情况或是否节假日等维度各分为若干类别作为相似度计算相似度的输入, 这样可以更精确的刻画司机的载客偏好.1 Zheng Y. Trajectory data mining: An overview. Acm Trans. on Intelligent Systems & Technology, 2015, 6(3): 1–41.2 Hu Y, Yang Y, Huang B. A comprehensive survey of recommendation system based on taxi GPS trajectory. International Conference on Service Science. IEEE. 2015. 99–105.3 荀赟.实时移动路线推荐系统的研究与实现[硕士学位论文].上海:上海交通大学,2012.4 Ge Y, Xiong H, Tuzhilin A, et al. An energy–efficient mobile recommender system. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM. 2010. 899–908.5 Powell JW, Huang Y, Bastani F, et al. Towards reducing raxicab cruising time using spatio-temporal profitability maps. International Conference on Advances in Spatial and Temporal Databases. Springer-Verlag. 2011. 242–260.6 Yuan J, Zheng Y, Xie X, et al. T-drive: Enhancing driving directions with taxi drivers’ intelligence. IEEE Trans. on Knowledge & Data Engineering,2013, 25(1):220–232.7 Yuan NJ, Zheng Y, Zhang L, et al. T-finder: A recommender system for finding passengers and vacant taxis. IEEE Trans. on Knowledge & Data Engineering, 2013, 25(10): 2390–2403.8 Qu M, Zhu H, Liu J, et al. A cost-effective recommender system for taxi drivers. Acm Sigkdd International Conference on Knowledge Discovery & Data Mining. ACM. 2014. 45–54.9 Ding Y, Liu S, Pu J, et al. HUNTS: A trajectory recommendation system for effective and efficient hunting of taxi passengers. IEEE International Conference on Mobile Data Management. IEEE Computer Society. 2013. 107–116.10 Dai J, Yang B, Guo C, et al. Personalized route recommendation using big trajectory data. IEEE International Conference on Data Engineering. IEEE. 2015. 543–554.11 Chang KP, Wei LY, Yeh MY, et al. Discovering personalized routes from trajectories. Proc. of the 3rd ACM SIGSPATIAL International Workshop on Location-Based Social Networks. ACM. 2011. 33–40.12 Ricci F, Rokach L, Shapira B, et al. Recommender systems handbook. Springer, 2011.。

基于蒙特卡罗树搜索的出租车路径推荐方法

基于蒙特卡罗树搜索的出租车路径推荐方法

基于蒙特卡罗树搜索的出租车路径推荐方法
韩东轩;路丹丹;郑斯杰;吴亚东
【期刊名称】《计算机应用与软件》
【年(卷),期】2023(40)2
【摘要】针对出租车路径推荐的问题,研究空闲出租车与潜在乘车请求之间接载最短路径推荐的方法。

通过蒙特卡罗树搜索算法计算潜在乘车请求的权重,利用多臂老虎机算法获得出租车最大载客概率,使得出租车能够快速到达潜在乘车权重较大的街道,减少车辆空载行驶的情况。

与现有技术相比,该方法中用于预测潜在乘车请求的模型可以进行动态概率获取,对纽约真实出租车数据的应用案例表明,该方法的推荐质量明显高于现有方法。

此外,利用三维粒子隐喻车辆刻画推荐结果以简化路径推荐模型的实现方式,可视化道路潜在乘客以及出租车运行状态以帮助城市管理者和用户进行理解。

【总页数】9页(P265-273)
【作者】韩东轩;路丹丹;郑斯杰;吴亚东
【作者单位】西南科技大学计算机科学与技术学院;西南科技大学工程技术中心;四川轻化工大学计算机学院
【正文语种】中文
【中图分类】TP311.11
【相关文献】
1.基于蒙特卡罗搜索树的机动控制研究
2.基于蒙特卡罗树搜索的树图布局
3.基于蒙特卡罗树搜索的多载具自动化存取系统优化算法
4.未知环境下基于深度序列蒙特卡罗树搜索的信源导航方法
5.基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于出租车载客地点序列推荐技术的研究作者:陈轶非李治军姜守旭来源:《智能计算机与应用》2013年第06期摘要:在大城市中,出租车已成为实现智能交通运输系统不可或缺的一环。

然而,由于一些出租车司机的驾驶经验,和对城市活动的熟悉程度的不足,使得其在寻找乘客时会采取毫无目的的随机漫游策略。

这就导致了出租车司机的收益不高,同时也造成了能源的消耗以及环境的污染。

针对此问题,将提出出租车载客地点的推荐模型,使得模型给出的推荐地点序列能获得较高的期望收益。

具体来说,将基于出租车GPS轨迹数据建立出租车载客地点的马尔科夫决策过程模型,并给出求解该模型的2种算法。

仿真实验结果显示,与典型的TopK方法相比,给出的推荐结果能更好地提高单位时间内出租车司机的收益。

关键词:智能交通系统;马尔科夫决策过程;空间数据挖掘;轨迹数据处理中图分类号:TP391 文献标识码:A文章编号:2095-2163(2013)06-0070-040引言在人们日常的出行活动中,出租车正扮演着越来越重要的角色。

如今,已经有数量众多的现代人选择出租车来作为其代步的出行方式。

根据最近一份关于纽约出租车服务的调查[1],结果显示有41%的调查者每周都会乘坐出租车,有25%的调查者甚至每天都会乘坐出租车。

然而,为了方便人们的出行,一些大城市(如纽约、东京、伦敦和北京)都会有大量的空载出租车随机行驶在城市区域中。

这些空载出租车的随机行驶不仅会浪费出租车的汽油,造成环境的污染,而且会造成城市中额外的交通事故。

因此,怎样规划空载出租车的行驶路线使其快速发现乘客,提高出租车的利用率,从而有效减轻资源消耗和环境污染,则成为一个亟待解决的严峻挑战。

近年来,为了出租车的调度和安全,许多大城市(如纽约、北京和新加坡)中的出租车均配置了GPS传感器。

这些出租车会以一定的频率(如2分钟)向数据中心报告其当前所处的位置[2]。

除了地理位置和时间戳信息,出租车的载客状态信息也会通过重量传感器或者出租车的计程器被记录下来。

因此,每天都会产生大量的伴随着出租车载客状态的GPS轨迹信息。

这些轨迹信息的产生也引发了学术界对出租车地点推荐问题的关注和兴趣。

文献[3]提出了一个推荐出租车司机至一系列载客点的模型,目的是使得出租车司机的收益最大化。

该模型使用了skyline路径查询的方法,同时将问题形式化为移动序列推荐(mobile sequential recommendation)问题。

文献[4]提出了出租车司机寻找乘客的学习策略(漫游/等待)。

该文献使用了L1-Norm SVM的学习方法筛选得出用于寻找乘客策略的分类特征。

文献[5]提出了一种能预测出租车收益地点的方法。

该方法建立了空间-时间收益地图,并根据历史数据计算出的潜在收益将临近区域内的司机在该地图上进行评分。

与上述研究类似,本文也将提出一种基于GPS轨迹信息的出租车载客地点推荐系统。

其中,系统的输入为空载出租车当前的地理位置和时间,输出为预推荐的一系列的载客地点,使得这些载客地点能够实现单位时间内的收益最大化。

但与已有研究不同的是,本文将建立基于马尔科夫决策过程[6](Markov Decision Process, MDP)的推荐模型,同时将融合2方面的特征:(1)能以较大的概率发现乘客;(2)推荐地点离当前地点的距离不是太远(否则物质上和时间上的开销都较大)。

实验结果表明,模型给出的推荐结果将有助于减少出租车随机漫游的时间,为出租车司机带来更多的收益。

1预备知识整个MDP过程可表示如下:S0a0S1a1S2a2…,所能获得的总的回报为R(s0,a0)+γR (s1+a1)+γ2R(s2,a2)+…。

MDP的优化目标就是采取某组策略(动作),使得该回报值最大化。

2出租车载客地点的MDP模型的建立2.1状态集合的建立首先,将建立MDP的状态。

可令状态s表示为三元组s=(p,t,x),其中p表示出租车所在的地点,t表示出租车所处的时刻,x表示出租车当前的载客状态:x=0未载客1载客。

现在将对出租车所处的时空状态进行离散化处理。

首先,将出租车的空间位置信息表示在有限的道路网络内,这样p就可以抽象成某种空间实体,如其所属的某条路段r,或者离出租车最近的路口c等;如果没有城市道路网络的精确数据,也可以将虚拟的道路网络划分成固定大小的网格,将p表示为出租车所在的网格,如此就将连续的空间地点离散成为有限个空间状态的集合。

其次,将时间维度也离散成有限的时间区间。

一般地,由于城市中的许多活动均带有一定的周期性,如上下班,火车到站等;同时,这些活动在工作日和双休日内的发生时刻又有着各自的规律性,因此,对时间也将依据2个维度进行划分:(1)按照周几(1-7)或是工作日和双休日进行划分;(2)按照一天内的时间区间进行划分。

对于(2)的划分,可以取相等的时间间隔,如Δt=1小时将每天划分成[00:00~01:00),[01:00~02:00)等24个时间区间;或者根据一些相关的特征来划分时间段,如将一天划分成早晨上班高峰时段,工作时段,下午下班高峰时段,晚间时段等。

这样,t就可以表示在这些离散的区间内。

于是,将时间也离散成了有限的状态。

2.2动作集合的建立根据空间状态的建立方法,可以将一个动作定义为:选取和当前地点相邻的某个抽象点(该点和之前空间状态的建立方法相对应,如该抽象点可以是某个相邻的路段r,或者是某个相邻的网格)。

因此,总的动作集合A便可定义为空间点集P的一个子集:AP。

在此,点p 与p′“相邻”的定义为:p无需经过其他抽象点(路段,网格等)便可以直接到达p′,并简记为p→p′。

于是,当出租车处于某个抽象点p时,所能选取的动作集合可以表示为{p′|p|→p′}。

令s (i)表示选取状态s=(p,t,x)中的第i个分量,那么,一个状态s的动作集合A(s)则表示为A(s)={p′|p=s(1),p|→p′}。

这样,便建立了总体的动作集合A,以及每个状态下的可行的动作子集A(s)。

2.3转移函数的建立在建立状态集合S和动作集合A后,便可以将出租车的每个GPS轨迹点对应至相应的s 和a上,再利用极大似然估计法,便可以求出每个转移函数Psa(s′)的近似估计值P^sa (s′),计算公式如下:P^sa(s′)=状态s下执行a到达状态s′的次数状态s下执行的a次数(1)如果样本数不足,使得P^sa(s′)=00,就可以认为不存在该概率分布的先验知识,于是将其设置为简单的均匀分布,即P^sa(s′)=1|B|,其中B={s|s(1)=a}。

由此即能较准确地估计得到所有情形下的状态转移函数。

2.4回报函数的建立和转移函数类似,在运行MDP之前,回报函数也是未知的。

因此,也可以利用采样的方法,对回报函数进行估计。

本文将采用一种简单的均值方法,计算公式如下:R^(s,a)=∑ni=1Ri(s,a)n(2)其中,n为观察到在状态s采取动作a的总次数,Ri(s,a)表示第i次观察得到的回报值。

而观测值Ri(s,a)则可以根据实际的出租车收益情况进行估计。

举例来说,如果从P点执行动作a=p′到达p′,那么根据出租车在p和p′时是否处于载客状态,可以将Ri(s,a)分成以下4种情况讨论。

令出租车在点p的载客状态记为xp,p和p′的欧几里得距离记为dist(p,p′),则Ri(s,a)的定义如下:其中,r为出租车平均每公里挣得的收益(即乘客所支付的费用),c为出租车平均每公里的开销(油费,零件损耗等),表示异或运算。

第3部分中的1/2则基于一个均匀分布的假设,即改变状态的地点是均匀分布在p和p′之间的。

这就对应于先验知识未知或缺少的情况。

如果样本数不足,得到R^(s,a)=00的形式,则将该R^(s,a)设置为-c×dist(p,p′),即假设在该情况下,无法拉到乘客。

综上,利用式(2)和(3)便能估计得到每个R(s,a)的值。

2.5折价因子的建立折价因子控制了当前的决策对未来的影响程度,或者是希望以多大的权重将未来的收益累加到当前的即时收益中。

一般均设置为一个不以时间变化的常数。

本文依照学术界的主流做法,取γ=0.95,即表示未来收益的权重非常大。

3出租车载客地点的MDP模型的求解在建立MDP模型后,本节将讨论如何对MDP模型进行求解。

为求解得到最优化的MDP 策略和回报值,需再定义如下2个概念:(1)确定性策略(deterministic policy)π:S→A,定义了在某一状态s∈S下需采取的动作π(s)∈A;更一般的策略π可定义为随机策略(stochastic policy):S→∏(A),其中,∏(A)表示的是在动作集合A上的概率分布空间,π(s,a)表示的是在状态下采取动作a的概率。

(2)策略π的值函数(value function)Vπ(s)定义为Vπ:S→R,表示从状态s出发采取策略π所能获得的加权总回报值的期望:Vπ(s1)=E[R(s1,π(s1))+γR(s2,π(s2))+γ2R(s3,π(s3))+…|π],其中si∈S为在时刻i所处的状态。

MDP的目标便是求出最优策略π*,使得π*的值函数Vπ*(s1)=maxπ{E[R(s1,π(s1))+γR(s2,π(S2))+γ2R(s3,π(S3))+…|π]}为求解基于MDP模型,需基于以下2个重要定理:定理1(贝尔曼方程[7])给定MDP模型M=(S,A,P,γ,R)和策略π:S→A,则对所有的s∈S,a∈A,Vπ满足以下关系:其中,在迭代阶段,可以使用同步更新和异步更新两种方法对V进行迭代更新操作。

在同步更新中,可以计算得到每个状态s∈S下的新的V(s)值,再用这些值覆盖所有旧的V(s)的值。

在这种情况下,该算法可以看做是实现了“贝尔曼备份”的操作,对当前值函数进行了一次值估计,然后将该估计值映射到新的值函数中。

在异步更新中,可根据某种顺序循环操作所有的状态s,并在每一次的循环中即时更新状态s对应的V(s)。

4实验分析4.1数据来源本文采用的GPS出租车轨迹数据集[8]来自于清华大学复杂工程系统实验室(Complex Engineered Systems Lab),这些数据通过实验室所部署的传感器网络系统采集得到。

该数据集采获了北京市大约28 000辆出租车在1个月内行驶轨迹的GPS数据,大约覆盖了北京市42%的出租车数量(总数目约为67 000辆),因此该数据集构建了一个极具代表性的样本空间。

同时,从时间的角度,这份数据集覆盖了工作日、双休日,以及节假日。

这就真实地反映了出租车在不同时段、不同交通情形下(拥堵、畅通)的活动模式。

本文同时也节取北京的交通道路网络做为实验对象,该网络有106 579个道路节点,以及141 380个道路区间。

相关文档
最新文档