基于演化博弈的高速路收费通道选择研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于演化博弈的高速路收费通道选择研究
张弓亮;张成科;曹铭;肖继辉
【摘要】收费广场拥堵严重影响了高速路的通行效率和安全畅通。
为找到驾驶员路径选择博弈的稳定策略,以更好地诱导驾驶员合理选择收费通道,提高收费站通行效率,缓解高速路收费广场拥堵问题,本文以驾驶员为研究对象,运用演化博弈的方法,通过“鹰鸽博弈”模型分析,建立收益矩阵,得到在不同成本条件下的两个演化稳定策略,并借助MATLAB软件和仿真演化的路径分析,验证了驾驶员在选择收费通道博弈中存在均衡点的分析结果。
研究表明,存在混合策略是博弈的均衡点,诱导驾驶员的策略选择向均衡点靠近,能均衡各收费通道的车流量,有效减少收费广场的拥堵现象。
%The congestion of toll plaza reduces the efficiency of transportation, and poses negative effects on the safety and smoothness of highway. In order to find out the stable strategy of game theory for better guiding drivers to select toll channel legitimately, and improve the efficiency of transportation and the situation of toll plaza congestion. Drivers is considered as the object of study, and the approach of evolutionary game and the analysis of"Hawk and Dove game"model are applied to obtain two evolutionary stable strategies that are under different cost conditions. By using the simulation of MATLAB software and the analysis of evolutionary path, it can be verified that there is equilibrium existing in the game when drivers choose toll channel. The result shows that mixed strategy is equilibrium of game, and to induce the strategic choices of drivers closing to the equilibrium can balance flow of each toll channel, which can efficiently relieve the congestion of the toll plazas.
【期刊名称】《交通运输系统工程与信息》
【年(卷),期】2015(000)002
【总页数】7页(P29-35)
【关键词】交通运输经济;收费通道选择;演化博弈;驾驶员选择;演化稳定策略
【作者】张弓亮;张成科;曹铭;肖继辉
【作者单位】广东工业大学管理学院,广州510520;广东工业大学经济与贸易学院,广州510520;广东工业大学管理学院,广州510520;东莞市道路桥梁开发建
设总公司,广东,东莞511700
【正文语种】中文
【中图分类】U268.6
随着交通量的迅速增长及节假日旅游经济的发展,高速公路收费站出口拥堵现象屡见不鲜,严重影响了高速公路运营企业的收费效率.如何科学地进行收费站交通流
分配,使收费站流量与路网系统协调稳定,成为众多学者研讨的问题.德国著名的
交通流专家Drik多次把交通流分配问题与博弈论相结合进行研究[1].我国学者肖海燕,刘炳全结合博弈分配,提出交通流分配的新算法并证实其有效性和可行性[2].
孙晓燕,汪秉宏介绍了车辆间博弈行为对交通流的影响,并在元胞自动机交通流模型中引入了合作者和背叛者的概念,提出了最大化车流量的驾驶行为准则[3].然而,经典的博弈理论要求博弈双方是完全理性的,在现实生活中,这种条件很难达到,博弈参与人的选择常常具有非理性的特征.
演化博弈论正是基于有限理性,融合了动态演化过程和博弈分析的一种理论,是博弈理论的新发展.演化博弈理论源于遗传生态学家对动物和植物的冲突与合作行为
的博弈分析[4].Nash最早提出了演化博弈思想的理论成果[4].Smith and Price提
出演化稳定策略(Evolutionary Stable Strategy)的概念,是演化博弈理论诞生的
标志[5].而后,演化博弈理论迅速发展,被广泛应用于各种学科尤其是经济
学.Friedman指出演化博弈具有极大的应用价值,并探讨了其在经济领域动态系统中的应用[6]. W Weibull对演化博弈理论进行了系统性的总结,指出演化博弈的研究对象为有限理性的参与人,并分析了动态演化过程[7].
随着研究的逐渐深入,演化博弈理论被引入交通流分配问题的研究中.李振龙运用了
演化博弈的方法,对驾驶员的路径选择行为进行研究,通过演化模型的建立与分析,提出采用良好的诱导措施有助于交通流的合理分配[8].王国明,李夏苗等建立城市
群道路群网络的交通流演化模型,比较并分析了在不同概率条件下的交通流演化结果[9].张波,隽志才等对出行者路径选择的学习行为进行了演化博弈分析,通过建立动态交通系统模型,证明了当满足一定条件时系统演化能够实现用户均衡[10].上述
文献以演化博弈论作为主要的研究方法,通过对驾驶员路径选择问题进行研究,探讨使路网达到均衡状态的交通流分配问题,从而改善高速路拥堵现象,其强调了系统达到均衡的动态调整过程,认为系统的均衡依赖于达到均衡的路径,对本研究有较大的参考价值.然而,高速路拥堵现象的形成不仅源于路网交通流的失衡,且有
一定程度源于收费广场交通流得不到迅速的疏散[11].缺乏对车辆的正确诱导会导
致高速路各收费通道交通量失衡,并引起收费广场车流密集,这是造成高速路拥堵的原因之一,也是现有文献较少考虑到的.
鉴于此,本研究将运用演化博弈方法对驾驶员在收费广场中的收费通道选择行为进行分析,找出演化均衡点,以期帮助高速路管理人员诱导驾驶员合理选择收费通道,缓解收费广场拥堵问题,改善高速路拥堵现象.
2.1 模型说明
本文以驾驶员为研究对象,设定不同策略选择下的收益,驾驶员的策略为,为每个
纯策略的支付函数(收益).由于驾驶员的支付是自身选择造成的收益与成本的差值,且其他参与人的选择会对自身支付造成影响,因而,驾驶员之间就构成了博弈关系.在n个驾驶员的博弈中,如果存在则称此n人博弈为对称博弈[12],即博弈的参与人没有角色的区分,博弈的收益只依赖于参与人所选择的策略,而不依赖于参与人的身份.
2.2 “鹰鸽博弈”模型
“鹰鸽博弈”模型是演化博弈的基本模型之一,下面探讨此博弈模型下驾驶员的策略选择.假设两个驾驶员为了争夺高速路A通道的优先使用权(收益为v,即二人都希望自己比对方先行)而展开博弈,抛开美德层面来看,为了缩小驾驶成本,博弈开始之前,驾驶员之间不会彬彬有礼、互相谦让,而是相互竞争.他们所能采取的纯策略如下:
鹰(H)策略:为得到A通道的优先使用权,采取主动出击的措施,在遵守交通规则的情况下,超越对方,抢占先机.
鸽(D)策略:炫耀(这里可以理解为暂时不采取任何强硬或者退缩的措施),当对方开始出击超越时,立即退出竞争.
如果双方都采取鹰策略而主动出击,假设其中一方因某种原因而被迫撤退,败下阵来的会付出c的代价(可以理解为丢面子或者在竞争中车辆受到损害).表1是双方策略及收益的支付矩阵.
由以上的支付矩阵可知:
(1)鹰策略对鹰策略:双方都有50%的机会超越对方而获得A通道的优先使用权,即获得v的收益,也有50%的可能退出竞争.
(2)鹰策略对鸽策略:鹰策略者获得了收益v,而鸽策略者在付出成本c之前就退出了竞争.支付矩阵中鸽策略者的收益为0,并不意味着鸽策略者的绝对收益为0.例如,假设驾驶员需要支付2个单位的成本来完成驾驶路程,使用鹰策略者获得
A通道优先使用权的驾驶员可以获得5个单位的收益,其总收益为3个单位,而鸽策略者没有获得通道的优先使用权,只获得3个单位的收益,除去2个单位的驾驶成本,总收益为1个单位.因此,单个鹰策略者与单个鸽策略者的竞争不会改变鸽策略者的收益.
(3)鸽策略对鸽策略:通道资源被两个竞争者平等地分享[13].
当然,现实情况是更多的驾驶员参与到A通道优先使用权的竞争中.现假设有这样一个驾驶员群体由n个驾驶员构成,他们都是博弈的参与人,每一个驾驶员都采用H策略或者D策略,且策略的选择都是随机的,在竞争开始之前,所有驾驶员具有同样的初始收益W0(生物学中,W0被称为动物的达尔文适应性).假定策略I是以p的概率采取鹰策略,以1-p的概率采取鸽策略,即对于一个驾驶员个体来说,可能会以p的概率选择H策略,以1-p的概率选择D策略,具有这样可变行为的驾驶员被认为是采取了混合策略,如果该策略具有不可侵犯性,即小部分的“突变”不能影响该种群的稳定性,就认为其是一个混合稳定演化策略(Evolutionary Stable Strategy,简称ESS).此博弈矩阵是对称的,在对称博弈中,纳什均衡就是演化稳定策略[13].W(H)和W(D)分别为H策略和D策略所带来的期望收益.如果每一个驾驶员只参与一个竞争,由演化博弈理论,可得
当v≥c时,H是演化稳定策略,即驾驶员群体中的绝大多数都会选择此策略.因为. 式中 E(H,H)表示双方均选择H策略时的期望收益;E(I,H )表示一方选择策略I,另一方选择H策略时的期望收益;E(H,I)表示一方选择H策略,另一方选择策略I时的期望收益;E(I,I)表示双方均选择策略I时的期望收益.
由以上四式知:
选择H策略的驾驶员会获得更大的收益,所以H是ESS.
在之后的重复博弈中,驾驶员也是遵循以p的概率采取H策略,以1-p的概率采取D策略进行选择.如果I是ESS,采取构成I的纯策略所获得的收益必然是相等
的.根据Bishop-Cannings[12]定理,存在E(H,I)=E(D,I),即
解得,所以v<c时,的混合策略是演化稳定的.当驾驶员群体中,以的概率选择H 策略,以的概率选择D策略,整个博弈达到稳定状态.
现实中,高速路收费广场一般情况下有6个收费通道,驾驶员通常会有多种选择,但是出于种种原因考虑,驾驶员会偏好选择直线距离最近的收费通道,最终的结果是车辆的数量超过该通道的通行能力,造成交通阻塞,驾驶员需要付出较大的时间成本来等待道路恢复通畅.
现在将6个收费通道分为两类:一类是与车辆行驶道路笔直连接的收费通道,设
为A,也是距离最近的通道,更多的驾驶员倾向于选择此路,因此车辆密度大,容易造成堵塞;另一类通道需要变道,距离较远,设为B,驾驶员若选择此路,由于驾驶路径长了,驾驶员需要付出更多的驾驶成本(包括油耗成本、变道的安全成本等)才能到达目的地,如图1和图2所示.图1中,1、2、3道为A,4、5、6道
为B;图2中,3、4、5道为A,1、2、6道为B.
假设通道A和B都有运营上限且通行能力相同,如果所有驾驶员都选择A或者选择B,车流量大于通道的通行能力,就会造成交通阻塞.如果驾驶员不愿意付出驾
驶成本,都在A通道入口等候,从个体来说,节约了驾驶成本,但是有损整个高
速路出口通道的通行效率.所有的驾驶员都是博弈的参与方,将某一时段某个高速
路出口收费通道上所有驾驶员看作是n个博弈参与人,表2是驾驶员路径选择的
支付矩阵,w为参与人的初始收益;a,k,g分别为选择相应通道需要支付的成本,且满足a,k,g>0.如果驾驶员都选择A,则都会付出a的成本;如果驾驶员都选择B,则会在a的基础上多付出g的成本,其包括时间成本和油耗成本(因
驾驶路程增加).当一部分驾驶员选择A通道,另一部分选择B通道,选A通道的驾驶员排队依次通过,此时不会出现安全成本,也没有增加油耗,因此,相对而言驾驶员不需付出额外的成本;而选B通道的驾驶员需要多付出成本k,在这种情况
下k包括了变道的安全成本.不失一般性,以下我们将驾驶员选择A通道表述为选
择A策略,选择B通道表述为选择B策略.注意到,选择A策略的收益高于选择B 策略的收益,这是基于驾驶员个人自身利益考虑,而不是n个驾驶员整体收益考虑.
驾驶员群体以p的概率选择A策略,以1-p的概率选择B策略,选择A策略的期望收益为
选择B策略的期望收益为由支付矩阵及期望收益可得此博弈的复制动态方程为
令F(p)=0可得该复制动态方程可能的稳定点:,其中0<p*<1,参数需满足
2a-k+g>0.当p1=0时,F′(0)=a+g>0,易判断 p1=0不是演化稳定点;
p2=1时,F′(1)=a-g ;时,.
下面讨论p2与p*是否为演化稳定点.
(1)当a-k<0,2a-k+g>0时,F′(0)>0,F′(p*)>0,F′(1)<0,
p2=1是该博弈的演化均衡点,复制动态方程的趋势图如图3所示.
该情况下,A策略等待时间短、路程近,选择A策略的成本小于选择B策略的成本,B策略作为次优策略会被舍弃,驾驶员群体都会选择A策略以获得更大的收益.n个驾驶员总的期望收益为n(w-a).然而,(A,A)虽然是均衡策略但并不是最优策略,完全理性的驾驶员在最大化自身利益的同时,却实现不了集体利益的最大化[8].他们认为自己选择的是最优策略,但A通道上的车辆数量却大于系统中最优的数量,通道被过度使用,通行效率大大降低,驾驶员收益受到影响,A通道重演“公共地的悲剧”.实际中的例子表现为:最近、最便捷的收费通道常常最拥堵,当驾驶员意识到另一条稍远的道路易于通行时,拥堵却使其无法移动车辆来改变策略选择.
(2)当 a-k>0,2a-k+g>0时,F′()0>0,F′(1)>0,F′(p3)<0,即
是该博弈的演化均衡点,复制动态方程的趋势图如图4所示.
此时,A策略所需的时间成本高,B策略虽然路程稍远,但省去了部分等待时间,选择选择A策略的成本大于选择B策略的成本;只要g>0,无论g为何值,都不影响演化结果,而当驾驶员群体全部选择B策略,会得到更小的收益.当驾驶员群
体以的概率选择A策略,以的概率选择B策略时,博弈会达到演化稳定的状态.实际中的例子表现为:交通高峰期需采取限行或引流措施以疏导交通流,提升通行效率.
接下来用数值模拟的方法,通过动态演化图来证实所论证的平衡点,并反映不同初始值向平衡点演化的轨迹.演化图中,横轴表示时间t,纵轴表示概率p.
取a=5,k=6,g=2,满足a-k<0,2a-k+g>0.初始值分别取0.1,0.3,0.5,0.7,0.9,通过Matlab软件仿真可以得到如图5的动态演化图.
图5显示,从不同的初始值出发,通过不同的路径,最终系统向p=1演化.p值越小,趋向1的速度就越快,p值越大,趋向稳定点的速度就越慢.即驾驶员群体中,更多的人选择B策略,到达演化稳定点的速度就会越快.
取a=5,k=3,g=2,a-k>0,2a-k+g>0,初始值分别取0.1,0.3,0.5,0.7,0.9,得到的动态演化图如图6所示.
图6显示,从不同的初始值出发,通过不同的路径,最终系统向演化.若选择A策略的驾驶员比例p小于p*,则p值随时间不断增加,逐渐达到p*,若选择A策
略的驾驶员比例p大于p*,则p值不断减小,最终也达到p*.如果 p与p*的差值越大,则p演化的速度就越快,p与p*的差值越小,曲线越平缓,趋近p*的速度越慢.
本文针对驾驶员的高速路收费通道选择进行研究,通过对其建立支付矩阵,运用演化博弈理论,得到博弈的演化均衡点,由复制动态方程,得出不同情况下的演化相位图及动态演化图.通过分析可知,在驾驶员通道选择的博弈中,存在均衡点,该
均衡点的演化路径与初始值和驾驶成本相关,从不同的初始值出发都会向均衡点靠
近.p=1时纯策略并不是占优策略,驾驶员的个人理性与集体理性有矛盾之处,为了化解矛盾,提高收费通道的通行效率,管理者应使用一定的方法和策略诱导驾驶员群体向均衡点靠近,使各收费通道的车流量得到合理分配.本文设定的驾驶员选择策略是具有相同通行能力的两类通道,实际上可供驾驶员选择的通道有多种类型且每种通道通常具有不同通行能力,这是在以后的研究中需要进一步考虑的条件.
【相关文献】
[1] Drik H.Pattern rormation,socialforces,and diffusion instability in gamea with success-driven motion[J].The European Journal B,2009,67(3):345-356.
[2]肖海燕,刘炳全.一种基于最短路博弈分配的交通配流新算法[J].华南师范大学学报(自然科学版),2009(1):34-38.[XIAO H Y,LIU B Q.A new traffic assignment algorithm based on the shortest paths and game theory[J]. JournalofSouth China NormalUniversity(Natural Science Edition),2009(1):34-38.]
[3]孙晓燕,汪秉宏.考虑车辆间博弈行为的交通流[J].上海理工大学学报,2012,34(1):14-17.[SUN X Y,WANG B H.The traffic flow considering games between vehicles [J].J.University ofShanghaifor Science and Technology,2012,34(1):14-17.][4] Nash J F.Equilibrium points in n-person games[J]. Proceedings of the National Academy of Sciences,1950,36(1):48-49.
[5] Smith J M,Price G R.lhe logic of animal conflict[J]. Nature,1973,47(1):209-221
[6] Friedman D.Evolutionarygamesin economics[J]. Econometrica,1991,59(3):637-66.
[7] Weibull J W.Evolutionary Game Theory[M].The MIT Press,Cambridge,Massachusetts,1995.
[8]李振龙.诱导条件下驾驶员路径选择行为的演化博弈分析[J].交通运输系统工程与信息,2003,3(2):23-27.[LI Z L.A study of route choice behavior of drivers based on the evolutionary game under the condition of traffic flow guidance
[J].JournalofTransportation Systems Engineering and Information Technology,2003,3(2):23-27.]
[9]王国明,李夏苗,邹华鹏.城市群道路网络上交通流的演化分析[J].交通运输系统工程与信息,2014,14(2):7-12.[WANG G M,LI X M,ZOU H P.Traffic flow evolutionary analysisofurban agglomeration road networks[J]. Journal of Transportation Systems
Engineering and Information Technology,2014,14(2):7-12.]
[10]张波,隽志才,倪安宁.基于累积前景理论的动态交通流演化博弈模型[J].管理工程学报,2014(3):164-173.[ZHANG B,JUAN Z C,NI A N.An evolutionary game model for the dynamic traffic flow based on cumulative prospect theory[J].Journal of Industrial Engineering/Engineering Management,2014(3):164-173.]
[11]张佃中,谭小红.收费广场内车辆排队系统的仿真研究[J].系统仿真学报,2006,18(4):1065-1069.[ZHANG D Z,TAN X H.Simulation research of vehicles’queuing system in
toll plaza[J].Journal of System Simulation. 2006,18(4):1065-1069.]
[12]黄武军,刘天虎,许维胜,等.N人合作博弈的Nash及演化均衡稳定策略分析[J].计算机工程与应用,2010,46(17):11-14.[HUANG W J,LIU T H,XU W S,et al.Stable strategy analysis of Nash and evolutionary equilibrium on N-person cooperative games [J]. Computer Engineering and Applications,2010,46(17):11-14.]
[13] Smith J M.Evolution and the theory of games[M]. Cambridge University Press,1982.
[14]Ding,et al.ESS,NIS and GIS for multi-player matrix game in single population [C].Mathematical Methods in the Applied Sciences.2009.。