一种基于非合作博弈的均衡路由方法
基于不完全信息博弈的传感器网络能量平衡路由
Game Theory-based Energy Balance Routing with Incomplete Information in Wireless Sensor Networks
ZENG Jia1 MU Chun-Di1 Abstract A game theory-based energy balance routing (GTEBR) algorithm was proposed to avoid uneven energy consuming in wireless sensor networks. In GTEBR algorithm, arbitration mechanism and confidence probability are introduced to convert static game of incomplete information into static game of complete but imperfect information and the method of static game is used to solve this problem. Moreover, the calculation method for node is put forward and the existence of Nash equilibrium of the sensor networks is proved in this paper. Simulation results show that the GTEBR algorithm has good convergency and performance. Key words Wireless sensor networks, game theory, energy balance routing, equilibrium, payoff function
非合作纳什均衡博弈论
非合作纳什均衡博弈论
非合作纳什均衡博弈论是博弈论中的一个重要分支,它研究的是在没有任何协调或合作的情况下,参与者如何做出最优的决策。
在这种情况下,每个参与者都会追求自己的最大利益,而不考虑其他参与者的利益。
这种情况下,参与者之间的关系是竞争的,而不是合作的。
在非合作纳什均衡博弈中,参与者的决策是基于他们对其他参与者的行为的预期。
每个参与者都会根据自己的利益来选择自己的策略,而其他参与者也会根据自己的利益来选择自己的策略。
这种情况下,每个参与者都会选择最优的策略,而不考虑其他参与者的策略。
在非合作纳什均衡博弈中,纳什均衡是一个重要的概念。
纳什均衡是指在一个博弈中,每个参与者都选择了最优的策略,而且没有任何一个参与者可以通过改变自己的策略来获得更多的利益。
在这种情况下,每个参与者都会坚持自己的策略,而不会改变自己的决策。
非合作纳什均衡博弈在现实生活中有很多应用。
例如,在市场竞争中,每个企业都会追求自己的最大利益,而不考虑其他企业的利益。
在这种情况下,每个企业都会选择最优的策略,而且没有任何一个企业可以通过改变自己的策略来获得更多的利益。
这种情况下,市场会达到一个纳什均衡状态。
非合作纳什均衡博弈是博弈论中的一个重要分支,它研究的是在没
有任何协调或合作的情况下,参与者如何做出最优的决策。
在这种情况下,每个参与者都会追求自己的最大利益,而不考虑其他参与者的利益。
纳什均衡是一个重要的概念,在现实生活中有很多应用。
基于非合作博弈的无线网络路由机制研究_汪洋
第32卷 第1期2009年1月计 算 机 学 报CH INESE JOURNA L OF COM PU TERSVo l.32N o.1Jan.2009收稿日期:2007-10-25;最终修改稿收到日期:2008-10-23.本课题得到国家 九七三 重点基础研究发展规划项目基金(2006C B805901)和国家自然科学基金(60673187,60803123,10671107,10871114,60736028)资助.汪 洋,女,1982年生,博士研究生,主要研究方向为计算机网络安全、系统性能评价和随机进程代数.E -m ail:w y00@.林 闯,男,1948年生,博士,教授,博士生导师,主要研究领域为计算机网络、系统性能评价、网络安全、Petri 网理论、可信网络与可信计算.李泉林,男,1964年生,博士,副教授,主要研究领域为随机模型、随机过程、随机进程代数、制造系统、通信网络、网络安全和计算机视觉.王竞奇,男,1986年生,博士研究生,主要研究方向为运营管理和博弈论.姜 欣,男,1975年生,博士研究生,主要研究方向为计算网络安全、M ANET 信任管理、系统性能评价.基于非合作博弈的无线网络路由机制研究汪 洋1) 林 闯1) 李泉林2) 王竞奇3) 姜 欣1)1)(清华大学计算机科学与技术系 北京 100084)2)(清华大学工业工程系 北京 100084)3)(美国西北大学凯洛格商学院 美国波士顿)摘 要 无线网络因其分布性、独立性、移动性等特点,网络性能容易受到自私节点的影响.文中综述了无线网络中因自私节点的存在而带来的一些关键问题,特别对含有自私节点的无线环境中基于非合作博弈理论的路由机制进行了分析和研究.为了解决网络中自私节点的问题,目前研究人员主要提出了两种机制:基于信任度的机制和基于非合作博弈的激励机制.文中对上述两类机制进行了总结和分析,特别地,针对无线自组织网络和无线网状网络中各种激励机制进行了详细的研究.网络编码作为一种有效的技术有助于提高无线网络的性能,文中探讨了基于网络编码的优化对含有自私节点的无线网络性能的影响.同时还分析了非合作无线网络中节点共谋的问题,最后提出了当前非合作无线网络研究中存在的理论挑战及潜在的热点方向.关键词 无线网络;博弈论;路由机制;共谋中图法分类号T P 393 DOI 号:10.3724/SP.J.1016.2009.00054Non -C ooperative G ame Based Research on Rou ting Schemes for Wireless NetworksWANG Yang 1) LIN Chuang 1) LI Quan -Lin 2) WANG Jing -Qi 3) JIANG Xin 1)1)(Department of Comp uter S cience and T echnolog y ,T singh ua Univ er sity ,B eij ing 100084)2)(Dep artment of Ind ustr ia l Eng ine ering ,T sing hua Univ er sity ,Beij ing 100084)3)(K e llogg Sc hool of M anag ement ,N or theast Univ ersity ,B oston,M asschusetts,US A )Abstract Since w ir eless netw or ks are usually distributed,independent and m obile,their per -form ance co uld be affected by selfish nodes.In this paper,the author s focus on the issues of self -ish nodes in wireless netw orks.Gam e based m echanism s are introduced to study the w ireless net -w o rk inv olving selfish nodes.In the literature,there are m ainly tw o appro aches to deal w ith theselfish nodes:credit based mechanism s and non -cooperative game and incentive based mecha -nism s.T he authors summ ar ize and analy ze the typical routing m echanism s in these ar eas,and es -pecially discuss the non -cooperative g am e and incentive based ro uting mechanisms fo r w ir eless ad -ho c netw orks and w ir eless m esh netw orks.N etw ork coding as an efficient technolo gy can help to im pr ove netw or k perform ance.T hey also study the optim ization schemes based o n netw ork cod -ing in w ireless netw o rks inv olving selfish no des.M oreover,the autho rs discuss the collusion pro blem in no n -coo perativ e w ir eless netw orks.Finally ,they present the existing challenges and possible research directions in non -cooperative w ireless netw or ks.Keywords w ireless netw o rk;g ame theor y;routing mechanism;co llusion1 引 言无线网络的分布性、独立性、移动性等特点,决定了网络中的许多功能必须依靠节点间的协作来完成,例如,无线自组织网络不依赖于任何固定的基础设施,数据的传输需要通过移动节点之间的相互协作来完成.目前人们通常假设所有网络节点都具有良好的协作性,即每个节点都愿意为其它节点提供网络服务.但是这种假设在实际的无线网络环境中并不一定成立,特别是当网络节点属于多个不同组织时.无线网络节点由于受到自身处理能力、存储空间、电池容量等各种资源的限制,节点都存在一定的自私性,而自私节点通常不愿意帮助其他节点转发信息,这势必会影响无线网络正常的路由和数据转发功能.如何激励自私节点进行合作,从而提高网络性能,是当前无线网络研究领域面临的重大挑战之一,自私节点的非合作关系制约了当前无线网络各种传输和路由机制的实施,严重影响了网络性能.自私节点带给无线网络的首要问题是资源的浪费.由于节点转发数据需要消耗自身的能量和计算资源,某些节点为了最大化自己的利益而有意不参与数据转发工作,这样一来,数据转发所选择的路径可能不是预期的最短高效路径,从而导致整条数据传输路径上网络资源特别是能量资源的浪费.因此,如何保证整条数据转发路径上能量消耗最低是大部分针对含有自私节点的无线网络环境下进行路由协议设计研究的基本目标.对于该问题,人们尝试了采用包括概率论、信息论及贝叶斯网络等理论在内的多种方法来进行各种路由机制的分析和设计,特别是近年来越来越多地采用了经济学方法中的博弈理论.针对无线网络中自私节点的问题,目前主要采用两类机制来处理:基于信任度的机制和基于非合作博弈的激励机制.信任是指某个节点对另一节点预期行为的一种主观判断,信任度是对节点之间信任程度的一种量化.基于信任度的机制的基本思想是如果所有节点能够参与合作来获得整个系统的最优性能,则每个节点就能得到相应的最优回报.因此,基于信任度的机制通过观察、审计、系统范围内的优化点分析和特殊的硬件等来记录节点合作行为并对不合作的节点进行惩罚,从而保证所有节点都能积极进行合作,其主要判断依据是节点间的历史交互信息.根据具体实现方式不同,基于信任度的机制又可以分为基于信誉的机制和基于支付的机制.信誉是一个全局量,即所有与某一节点有过交互行为的节点对该节点的综合评价,它是产生信任度的重要依据.有关信任和信誉的概念及关系,文献[1-2]给出了较为详细的描述.基于支付的机制则模仿了人类社会中货币买卖方式,采用一种虚拟的电子货币用于支付所获得的网络服务,通常来说,这种机制需要有相关硬件或可信的第三方机构提供安全保证.目前,基于信任度的机制的研究工作比较多,具有代表性的主要有文献[3-7,9-11].基于信任度的机制的实现相对来说较为简单易行,已经被应用在部分实际的无线网络环境中.目前这种机制存在的主要问题是整个系统达到性能最优并不能保证每个节点都获得最优回报.因此,节点存在违背协议约定的动机,这种机制并没有从根本上解决节点的自私性带来的问题.同时,这种机制效率比较低,信任度的计算收敛速度比较慢.基于非合作博弈的激励机制借鉴了微观经济学和非合作博弈论中的相关理论,引入了报酬的相关概念,即对节点的合作行为给予相应的报酬激励.基于激励的机制需要解决的关键问题是如何确定需要支付给合作转发节点的报酬值,以保证系统的性能优化.目前通常的解决方案是设计相应的机制来激励节点报出其转发的真实成本,从而实现系统成本的最小化和性能的最优化.在非对称信息博弈(即参与者拥有自己私有信息的博弈)中,如果所有参与者都没有动机对其它参与者说谎或是隐藏其私有信息,所有参与者的占优策略都是报出其真实成本,即无论其它节点如何报价,节点都会愿意报出自己的真实价格,则称这个机制实现了路由选择在保证参与者报出真实成本的基础上进行,也可以称为具有防策略性(Strateg yproof).在经济领域最为人所熟知的实现了防策略性的机制是VCG(Vickrey-Clark-Grov es)机制,它通过额外支付参与者存在的机会成本来实现防策略性.这种机制也被应用在无线自组织网络中,即Ad-hoc VCG机制[12].在这个工作的基础上,研究者们做了一系列的工作[13-15].还有一些算法放宽了Strategyproo f特性的限制,引入纳什均衡的概念[16-17].然而由于无线网络的特性,以非合作博弈论为基础的经济学模型与无线网络的结合目前还存在一些需要解决的问题.本文将重点对不同无线网络环境中各种基于激励机制的研究进行总结和分析.虽然人们对无线网络中自私节点问题已经进行551期汪 洋等:基于非合作博弈的无线网络路由机制研究了部分较为深入的研究,但是目前还没有相关工作对该领域的发展现状进行系统的总结和对未来可行的研究方向进行规划,本文将致力于这一工作.本文将现有的针对无线网路中自私节点问题的各种机制进行了归纳分类,介绍和比较几种典型机制的算法和性能;在此基础上介绍基于网络编码的机制优化策略,用于改进非合作无线网络的性能;同时,详细地分析无线网络中的经典共谋问题,这也是非合作无线网络中的关键问题;通过以上归纳、分析和比较,对该领域有待于进一步研究的方向和可以采用的分析工具提出了一些建议.本文第2节介绍几种典型的基于信任的机制并进行讨论;第3节重点介绍基于非合作博弈的激励机制以及它们在单播和多播环境中的实现;第4节介绍基于网络编码的优化机制在非合作无线网络中的应用;第5节针对无线网络中经典的共谋问题进行讨论,指出了当前亟待解决的问题;第6节详细探讨当前研究中面临的理论挑战和可行的热点方向;第7节对全文进行总结.2 基于信任度的机制本节将详细介绍各种基于信任度的机制.为解决网络中自私节点的问题,基于信任度的机制很早就被提出并被广泛使用.虽然这些机制大部分是在仿真结果的基础上采用启发式算法实现并缺少形式化的分析计算和理论证明,但是它们较早地应用在实际中,并且取得了较好的效果.根据信任度产生依据的不同,该机制又可以分为两类,一类是基于信誉的机制,另一类是基于支付的机制.前者通过节点的信誉来评估其信任度,根据信任度值的高低来判断节点可信与否并作为路由选择的决策依据.在这种机制中,低信任度的节点会逐渐被网络中的其他节点孤立,以致无法获得其他节点的服务.因此,网络节点为了避免自己被孤立,就会通过为其他节点提供良好的服务来提升自己的信任度.基于支付的机制则采用虚拟货币作为信任凭证,用于换取其他节点提供的服务.当一个节点虚拟货币用完时,它将无法获得其他节点的服务,但可以通过为其他节点提供服务来换取虚拟货币.下面我们介绍几种主要的基于信任度的激励机制.2.1 基于信誉的机制斯坦福大学的M arti等人[3]提出了一种看门狗(Watchdog)和选路人(Pathr ater)算法来监控和防止节点的异常行为.出于自私或恶意的原因,节点拒绝转发流经其的数据包,这种行为被称为异常行为.看门狗是指数据包的发送者在将包发出去之后还要监视他的下一跳的节点,如果下一跳的节点没有对包进行转发就说明那个节点可能存在问题.选路人作为一种响应办法,它在收集到其它节点的详细信息的基础上评定每一条路的信任等级,使数据包尽量避免经过那些可能存在自私或者恶意节点的路径.这种机制的问题是,它没有详细区分节点拒绝转发数据包是出于恶意还是物理原因,例如节点暂时电源耗尽等;并且对于自私节点也没有惩罚措施.Bucheg ger等人提出的CONFIDANT机制[4]对无线自组织网络的DSR路由协议进行了扩展.节点间信任关系的建立和路由选择的确定都是通过对路由建立过程及数据转发行为的观察及汇报方式实现的,从而可以使源节点进行路由选择时避免自私或恶意节点.CONFIDANT机制需要为每个节点增加4个功能模块,分别是监控器、信誉系统、路径管理器和信任管理器.监控器的作用类似于Watchdog 的功能,用于监控邻居的行为;信誉系统用于记录观察结果,并对节点进行评估打分;路径管理器用于路由决策,以避免自私或恶意节点存在于选定的路由上;信任管理器用于记录接收到的告警信息并评估该告警信息的可信度,当有足够的证据证明该告警信息可信时,就会将该信息反馈给信誉系统.CON-FIDA NT机制可以有效地检测并隔离自私或恶意的节点,但是它无法避免 诽谤 攻击现象,并且也无法阻止谣言的扩散.M ichiar di等人也基于Watchdog提出了CORE 协议[5]机制,该机制通过基于信誉的计算来激励节点进行合作.信誉的计算是通过特定函数整合主观信誉(subjective reputatio n)、间接信誉(indirect reputatio n)和功能性信誉(functional reputation).其中主观信誉就是直接证据,间接信誉就是从其他节点处获得的间接证据,而功能性信誉则用来表示对节点不同功能重要性的判断.该机制能够防范 诽谤 攻击,因为来自其他节点的间接信誉仅统计正面评价值.但是该机制不能很好地防范节点共谋攻击,同时,也无法区分异常行为的发生原因是主观恶意还是客观故障.2.2 基于支付的机制Buttyan等人[6]引入一种计数器(Nuglet Counter)来激励节点帮助其它节点转发数据包.这种计数器是一个安装在节点上的硬件模块,当节点56计 算 机 学 报2009年发送自己的数据包时,计数器数值减少;在节点转发数据包时,数值增加.所有的节点必须维持计数器的值大于零.文章通过分析和实验,证明了此种机制在一定程度上起到了激励自私节点转发数据包的作用.但是,在非对称数据流的情况下,这种机制还有待于进一步的改进.在文献[7]中,Buttyan 等人除了用一个计数器(nug let counter )统计nuglets 外,还引入了一种惩罚措施,即在节点拒绝转发时减少计数器的数值.同时,他们使用Packet Purse 模型限制节点转发无用的数据包,防止增加网络负载.文献[6]和文献[7]的思想相似.Salem 等人[18]以Nuglet 为基础,给出了一种收费和返还的机制来解决多跳蜂窝网中自私节点的问题.他们对节点预先收取费用,等待得到正确的确认信息后再将费用返还,以此来限制恶意节点和自私节点的行为.另外一个比较经典的机制是Zho ng 等人[10]提出的Sprite 机制.Sprite (ASimple,Cheat -Proof,Cr edit -Based System)主要解决的问题是在无线网络中确定了一条数据传输最优路径Shor testP ath(SP )后,如何保证中间节点v i SP 能够忠实地传递数据包.这是因为如果无法了解中间节点v i 是否真的传递了数据包或者没有一个合适的机制保证,则有可能S P 上的节点可以不用真正传递数据包就得到收益.在这种情况下,将无法保证数据传递正常进行.Sprite 的基本思想是收到数据包节点保留一个该数据包的收据(Receipt ),中央银行根据SP 上各节点提交的收据确定各节点的收益.Sprite 基于的基本网络结构如图1所示.Sprite 机制保证了路径上的所有节点都有激励传递数据包,并且将如实地报告自己是否收到了数据包.但是Sprite 机制没有实现预算平衡.图1 Spr it 机制的网络结构总结一下基于信任度的各种机制,它们虽然已经被较好地应用于实际的网络中,但是其自身的某些特点使得其发展存在一定的限制.首先,多数基于信任度的机制,特别是基于采用了虚拟货币的机制都需要额外的设备以保证机制的顺利实施,一般情况下要求每一个相关网络节点都装有特殊设计的硬件设备,或者网络中存在大家公认可信的第三方机构.这种硬件要求在实际的网络环境中很难实现,第三方机构的存在又很难适应无线网络环境,这一特点严重阻碍了基于信任度机制的发展.其次,信任度的计算较为复杂,特别是直接证据和间接证据的收集过程需要消耗大量的资源,收敛速度慢,并且容易引发广播风暴.另一方面,这些证据的来源主要是节点的历史行为信息,在很多情况下,历史信息并不能准确反应该节点将来行为的可信程度.再有,很多基于信任度的机制并没有从根本上解决节点自私性的问题.在基于信任度的机制中,通常每个节点的收益随着整个系统的收益提高而提高,然而,这一假定在实际中却并不一定成立.事实上,整个系统达到性能最优并不能保证每个节点都获得最优回报.因此,节点存在违背协议约定的动机,基于信任度机制的实施受到了制约.另外,对于当前各种基于信任度的机制来说,大部分是根据针对特定网络的实验结果来说明它的效果,缺少形式化的分析和理论证明,因而,难以证实这种机制的扩展性,难以从理论上支持将基于信任度的机制推广到一般的无线网络中.基于非合作博弈的激励机制则从经济学的角度出发,深入地分析了节点的自私性,且避免了基于信任度机制的种种问题,本文将在下面几节里进行重点介绍.3 基于非合作博弈的激励机制人们利用基于非合作博弈的经济学理论对含有自私节点的无线网络进行研究,提出了多种激励机制.本节将对无线自组织网络和无线网状网络中的几种典型的激励机制进行分析,通过比较和分析指出当前基于非合作博弈的激励机制中有待进一步解决的问题和可行的发展方向.3.1 无线自组织网络中的激励机制无线自组织网络(Wireless Ad -ho c Netw orks)灵活多变,不依赖任何基础设施,通过相邻节点间的互联转发完成网络通信,这种灵活、简单、多变的特性使得其在军事、救援等领域中得到了广泛的应用.然而,无线自组织网络的无线多跳、动态拓扑的特性571期汪 洋等:基于非合作博弈的无线网络路由机制研究给它的发展带来了很大的制约.考虑实际网络中的节点具有自私性,节点之间是非合作的关系,这对无线自组织网络是一个重大挑战.目前,大部分关于基于激励的机制在非合作无线自组织网络中的应用研究主要是基于VCG机制的.这种基于VCG的机制是从经济学上的经典拍卖模型VCG改进而来的,可以有效地解决自私节点为路径选择和数据转发带来的问题.这一小节将首先介绍含有自私节点的非合作无线自组织网络的系统模型,基于该模型介绍用于无线自组织网络的激励机制 Ad-ho c V CG机制.应用Ad-hoc VCG机制,所有参与者都没有动机对其它参与者说谎或是隐藏其私有信息,因此,它能够保证路径选择在各节点都报出真实价格的基础上进行,从而使该机制具有防策略性.我们首先简要介绍具有防策略性的机制设计原则,其后将重点介绍和比较无线自组织网络中的几种典型的基于非合作博弈的激励机制,并指出当前研究中有待解决的问题.3.1.1 系统模型用N=(V,E, )来表示一个无线Ad-ho c网络,其中V=(v1,v2, ,v n)表示网络中的n个节点,即无线网中的无线设备;有向边(v i,v j)组成的集合E V V表示所有可以传递信号的边; :E ú对于E中的每一个边给定了一个成本值.当节点v i向节点v j发送h个数据包时,节点v i的最小成本为h (v i,v j).根据传递数据包的成本的计算方式的不同,可以分为如下两种模型:(1)链成本模型.节点v i发送数据包的成本取决于接受节点v j,可以认为成本发生在链上,当节点v i向节点v j发送数据包时,节点v i的费率为 (v i,v j)= i,j.(2)节点成本模型.每个节点v i发送数据包的成本是确定的c i,与接受节点v j无关,即 (v i,v j)=c i.节点成本模型可以看作是链成本模型的特例.假定网络中的各节点都是具有理性的自私节点,对这两种特性我们有如下定义.一是关于自私性,由于每个节点属于不同的所有者,所以我们假定各节点都是自私的,即各节点的目的都在于最大化自己的效用值.二是关于理性,假设各节点都是理性的,即节点总是选择策略使得自己的收益最大化.在Ad-ho c无线网络中,源点S(Source)希望将数据发送到终点D(Destination),各中间节点(Relay Points)转发数据需要付出一定的成本,例如电池的电量消耗等,在不同的环境中可以有不同的含义,将各节点的成本定义为c=(c1,c2, ,c n),根据自己的成本信息等,各中间节点给出转发数据的报价b=(b1,b2, ,b n),终点D根据各中间节点的报价b=(b1,b2, ,b n)计算得到最短路径SP,在这条路径上所有节点的报价之和最少.位于最短路径S P上的各节点依次传递数据包并得到各自的收益p i,节点v i的效用值为u i=p i-c i.注意这里p i与b i不一定相等,依各种激励机制的不同而变化.我们希望能够设计一个机制,使得在这个机制下能够找到全局最优解,即寻求实际总成本最小的最短路径S P=(S,v1,v2, ,vn,D),记任一路径P的总成本为|P|.在基于报价的机制中,费用的支付方式是一个关键的问题,即中间节点得到的收益必须有人来支付.目前,主要采用中央银行支付和源点支付两种方式.(1)中央银行支付.假设在Ad-ho c无线网络中,有一个虚拟的中央银行,它定期从各节点收取费用,当发生数据传递时,由中央银行负责向中间节点支付.(2)源点S支付.一般来说,源点S是数据传递活动的需求方和受益方,因此由S来支付各中间节点应得的收益.3.1.2 Ad-hoc VCG机制在基于激励的机制中,Ad-hoc V CG[12]是一个最基础的机制,它引入了经济学中的思想,将经典的VCG拍卖模型(二级报价拍卖)应用在无线Ad-hoc 网络中.Ad-hoc VCG的设计目标是激励各中间节点给出转发所需的真实成本,它的基本思路是对位于S P上的所有中间节点v i S P,除支付其所报的价格b i外,还向其支付额外的报酬,这个报酬值为不包括该节点的最短路径SP-v i比原最短路径S P多出的机会成本值,即|S P-v i|-|SP|,以激励节点报出自己的真实成本,从而实现防策略性,达到全局的最优化.在A d-ho c VCG机制下,可以表示每个节点的实际报酬值如下:p i=|S P-v i|-|SP|+c i.加入的这部分机会成本可以保证节点没有动机去任意抬高自己的价格,如果节点被选入最短路径,它的收益并不会随着它的报价提高而增加,这就是Ad-hoc VCG的关键思想之所在.举一个具体的例子来解释Ad-hoc VCG机制,58计 算 机 学 报2009年。
一种基于Nash均衡的路由器队列管理方法
为!! 且 !5 为-& 7 !’
’5&
路由器最佳输出效用 6 是 链 路 带 宽! "! $路 由 器 对 每 个 业 务 处 理 时 间 为 & 个 时 间 单 元 !
’
! " #! 丢弃算法博弈模型 文献 " # 构建了丢弃算法的博 弈模 型 ! 针对获 得的 / 提出 了两 种分组 针对 && 定义的博弈问题 ! ! 0 1 2解! 丢弃算法 ( 这两种算法确定了路由器对分组的丢弃概率 4! 其目的是保证路由器 T Z 6 M [和M / $ 5U? 算法 最佳输出效用 在T 分组丢弃概率函数为 ( Z M 6 [ 算法中 ! "! ! $ % & 8 8 8 8 B > 8 !! !! ! I C B ;’ C B ;9 C 0 \’ 4 5 #& C B ; &8 I C 0 \! ! P9 P &8 % &! ! 其中8 % & ! 表示路由器虚拟队列长度 ! &9!’ 8 I C B ; 和8 C 0 \ 是路由器队列长度的两个阈值 P 5!
自然科学版 " ,卷 !!!!!!!!!!!!!! !!!! 西安电子科技大学学报 ! !!!!!!!!!! !!!! 第 ( ( ! V
"# 博奕论是本世纪应用数学最重要的理论成果 ! 即在该解处 ! 任 何参 与者不 / 0 1 2 均衡 ( 是博奕问题的解 !
能依靠单方面改变自身策略而期望获得更高效益 ! 文献 " # 研究了 / 并给 出了 / , 0 1 2 均衡的存在性 ! 0 1 2 均衡 存在性定理 基于博弈论思想 ! 构建具有 / 利用其 / 实现具有资源分配公平性的路 0 1 2 均衡性的博弈模型 ! 0 1 2 均衡解 ! 由器队列管理方法 ! 是一种研究队列管理技术的新思路 -文献 " # 将非集中控制的路由看作是受约束的博弈问 ) 题$ 文献" # 针对 ? % % 从调度角度研究网络博弈问题 $ 文献 " # 采用多级服务模型 ! 研究具有 U # ? & 模型 ! ’ = K 性能 文献" # 研究了文献 " # 中的用户优化问题 ! 分析了非合作用户对此优化问题的影响 $ 文 的网络博弈 / 0 1 2 均衡 $ V %
非合作通信中OFDM系统盲均衡的方法
非合作通信中OFDM系统盲均衡的方法
姚亦韬;陈志刚;吴嘉
【期刊名称】《电脑与信息技术》
【年(卷),期】2016(24)3
【摘要】针对传统的正交频分复用(OFDM)系统盲均衡方法中存在接收数据短、收敛速度慢的问题,提出了一种基于符号间干扰变步长迭代的多模混合算法的OFDM 系统盲均衡新方法。
该方法首先将接收数据进行了分段复用,然后将修正
的恒模算法与判决引导算法进行多模混合,并在均衡过程中采用了基于符号间干扰的变步长迭代方式。
仿真结果表明,在非合作通信中,该方法不但加快了收敛速度并且保证了稳态收敛性能。
【总页数】6页(P1-5)
【关键词】盲均衡;正交频分复用;多模混合;符号间干扰;非合作通信
【作者】姚亦韬;陈志刚;吴嘉
【作者单位】中南大学软件学院,长沙410075;“移动医疗”教育部-中国移动联合实验室,湖南长沙410083
【正文语种】中文
【中图分类】TN929.5
【相关文献】
1.非合作通信中OFDM系统的载频偏移盲估计方法 [J], 刘明骞;李兵兵;黄少东
2.非合作通信中OFDM系统盲均衡方法 [J], 刘明骞;陈健;李兵兵;郭晓玲
3.OFDM系统中盲、半盲以及非盲信道估计方法的Cramér-Rao界 [J], 李子;蔡跃明;徐友云
4.非合作通信中的盲均衡技术研究 [J], 黄明园;符杰林;仇洪冰
5.LDPC编码的MIMO-OFDM系统中的联合半盲均衡与解码研究 [J], 吴晓;黎勇;刘宏清
因版权原因,仅展示原文概要,查看原文内容请购买。
非合作博弈算法流程
非合作博弈算法流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!非合作博弈算法流程在实际中的应用一、问题定义与建模阶段。
在应用非合作博弈算法之前,首先要明确需要解决的问题和相关的约束条件。
基于非合作博弈的OFDMA无线多跳中继网络上行链路资源分配算法
( . yL bo nomainCo iga dT a miso , o twet ioo gUnv ri , e g u610 , ia 1 Ke a fIfr t o dn n rns sin S uh sJa tn iest Ch n d 0 31Chn ; y
F u d t n I ms T eNa o a Na rl c n e F u d t n o hn 6 0 1 0 ) K y P o r so e h oo ia R o n a o t : h t n t a S i c o n a o fC ia( 1 7 1 8 ; e r ga f c n lgc &D f e i e i l u e i m T l o h t
键 技 术 都 非 常值 得 研 究 ,无 线 资 源 分配 问题 即是
其中之一。
化模 型 ,然 后给 出 了包 含 定价机制 的非合作 功率 分 配 博弈模 型 ,并 且证 明 了在 该模 型 中纳 什均 衡 点的
存 在性和 唯一 性 。最 后 ,提 出了求 解 该非合 作博 弈
关于 OF DMA 网络 无线 资源 分配 的研究 成果 按 场 景可 以分 为单小 区和 多小 区 2种 。在 单小 区场 景
言
近 年 来 ,无 线 多 跳 中继 技术 …因 其 在 提 升 系 统 吞 吐量 、减 少 系 统 发射 功 率等 方 面 所 表 现 出来 占用 带 宽 小 、 码 r- 以及 多用 户 分 集 等优 点 , 无 q o ̄扰 已经 被 L E A vn e 、E E8 21m 等 下 一 代 无 T — d a cd IE 0 .6
一种基于非合作博弈的均衡路由方法
20 6 ; 0 0 2
摘 要 :针 对 路 由器 路 径选 择 中 的资 源 分 配 不 均 衡 问 题 , 出 了基 于 博 弈 论 思 想 的解 决 方 案 . Iv 提 将 P 6协
议 中的任 意 博 路 由过 程 看 作是 多个 非合 作 参 与者 间 的博 弈 问 题 , 出 了 以 单 个 参 与 者在 各 条 于 非 合 作 博 弈 的均衡 路 由方法
张 惠 娟 , 周 利 华 翟 鸿 鸣。 ,
(.西安 电子 科 技 大 学 计 算机 学 院 , 西 西安 70 7 ; 2 同济 大 学 软 件 学 院 , 海 I 陕 101 . 上
3 .交通 银 行 上 海 总行 , 海 上 20 3 ) 0 0 3
t or tc a he e i ppr a h i e e t d,whih r ga ds t e a c s o eofI 6 a n un o e a e ga n m a y o c spr s n e c e r h ny a tr ut Pv s a c op r t me i n p a e s A me m o lwih a p a e ’ a editi uton s r t t nd d a v i i l p t s g v n.T h ly r. ga de t l y r Sr t s rb i ta e y a ely a al n al a hsi i e e p a e ’S a e l y r r t diti in s rbuto w hih a a s r t Na h qu lb i m i s ve c c n s u e he s e ii ru s ol d. Ba e on he sd t N a h s
基于非合作博弈的无线Mesh网络接入控制
3.College of Mathematics,Physics and Information Eng ineer ing,Jiaxing University,Jiaxing 314001,China)
摘要 :为 实现无线 Mesh网络 中网络 负载的均衡性和 资源分 配的公 平性 ,将新站点和 Mesh接入 点之 间的接入控 制过程形 式化 为一 个非合作博弈 ,结合站点的 QoS满意度、连接成本 、网络 负载和站点 离开率 4个 网络连接的参数 函数 ,对网络 负 载与站点 离开率的均衡点进行分析 。引入站点信 息分享机制 ,对站点利 用网络 资源的效 率进行优 化 ,保 证资 源分配的公 平性 。实验仿真表 明,非合 作博 弈模 型和站点信息分享机制能够从整体保证站点利 用资源的效率 ,从 而保证 资源分配的 公 平 性 。 关键词 :无线 Mesh网络 ;非合作博 弈;分享机制 ;资源公 平分配 中图 分 类 号 :TP393 文 献标 识 码 :A doi:10.3969/j.issn.1006-2475.2016.04.010
2016年第 4期 文章编号 :1006-2475(2016)04-0045-05
计 算 机 与 现 代 化 JISUANJI YU XIANDAIHUA
总第 248期
基 于非 合 作 博 弈 的无 线 Mesh网络 接 入 控 制
翟师伟 ,沈士根 ,曹奇英
(1.东华大学计算机科学与技术学 院,上海 201620;2.绍兴文理 学院计算机科学与工程 系,浙江 绍兴 312000; 3.嘉兴学院数 理与信息工程学院 ,浙江 嘉兴 314001)
一种基于非协作博弈的认知无线网络动态频谱共享方法[发明专利]
专利名称:一种基于非协作博弈的认知无线网络动态频谱共享方法
专利类型:发明专利
发明人:衡伟,张国栋
申请号:CN201610243236.7
申请日:20160419
公开号:CN105916154A
公开日:
20160831
专利内容由知识产权出版社提供
摘要:本发明公开了一种认知无线网络中的动态频谱共享方法。
为了提高当前无线网络中的频谱利用率并降低系统频谱共享过程中的通信开销,本发明结合博弈论将频谱共享过程分两步完成。
首先,无线网络中所有的频谱供应商基于已有的法定频谱资源租售部分空闲频谱资源给认知无线频谱供应商;然后,认知无线频谱供应商汇集所有空闲频谱资源并将其以拍卖的形式供应给认知用户。
对于该频谱租赁市场,采用非协作博弈论来模型化整个频谱共享过程,提出相应的策略更新算法以获得纳什均衡策略并保证其收敛性。
经过计算机仿真验证,本发明所提频谱共享方案可以有效提高系统的整体收益并降低频谱共享过程中的通信开销。
申请人:东南大学
地址:211189 江苏省南京市江宁区东南大学路2号
国籍:CN
代理机构:南京瑞弘专利商标事务所(普通合伙)
代理人:陈琛
更多信息请下载全文后查看。
基于非一致性业务均衡的电力通信网路由分配方法
基于非一致性业务均衡的电力通信网路由分配方法
刘俊毅;黄红兵;章毅;刘琦;王甜甜;娄佳
【期刊名称】《电力信息与通信技术》
【年(卷),期】2017(015)010
【摘要】电力通信网所承载的业务种类多样,一种符合电力生产实际的业务路由分配方法可有效降低电力生产控制类与管理信息类业务的安全风险。
文章针对电力通信网的典型结构,综合考虑业务重要度与业务路由配置方法,提出一种非一致性业务路由能量模型。
基于该模型,提出了一种基于K最短路径与遗传算法的业务路由分配与优化方法,实现了全量业务场景下的全局路由自动化分配。
通过仿真实验证明了该方法在降低电力通信网业务风险上的可行性与有效性。
对比传统的最短路径路由分配方法,该方法计算得到的路由在满足电力通信网路由配置原则的基础上实现了非一致性业务的风险均衡,为电力通信网网络优化工作提供了可靠支撑。
【总页数】6页(P103-108)
【作者】刘俊毅;黄红兵;章毅;刘琦;王甜甜;娄佳
【作者单位】[1]国网浙江省电力公司信息通信分公司,浙江杭州310007;[2]中国邮政集团公司浙江省分公司,浙江杭州310005
【正文语种】中文
【中图分类】TN915.853
【相关文献】
1.基于非一致性业务均衡的电力通信网路由分配方法 [J], 刘俊毅;黄红兵;章毅;刘琦;王甜甜;娄佳
2.浅议电力通信网可靠性的业务路由优化分配方法 [J], 朱红玲
3.基于电力通信网可靠性的业务路由优化分配方法 [J], 刘海鹏;杨丽
4.基于电力通信网可靠性的业务路由优化分配方法 [J], 伏志红
5.浅议电力通信网可靠性的业务路由优化分配方法 [J], 朱红玲
因版权原因,仅展示原文概要,查看原文内容请购买。
基于增强学习的非协作认知无线网络路由算法研究
基于增强学习的非协作认知无线网络路由算法研究杨振宇【摘要】认知无线电网络(Cognitive Radio Networks,CRNs)的出现解决了由无线应用发展而引起的频谱稀缺问题.在CRNs中,次用户(Secondary Users,SUs)机会式地接入主用户(Primary Users,PUs)拥有的授权频谱.使用马尔科夫泊松过程(Markov Modulated Poisson Process,MMPP)对Pus的活动进行建模,提出基于增强学习的非协作认知无线网络路由算法.每个SU都想最小化自己流量的端到端时延,同时可以满足PU的服务质量(QoS)需求.为了使SUs的路由决策能够适应环境变化和节点之间非协作交互的影响,我们将路由问题建模为非合作博弈的随机学习过程.然后,我们提出了一种解决路由问题的分布式增强学习算法,减少了SU之间由于信息交互带来的开销.仿真实验的结果表明了所提出的算法能够满足PU的QoS需求,同时减少网络时延.【期刊名称】《西安文理学院学报(自然科学版)》【年(卷),期】2018(021)001【总页数】5页(P68-72)【关键词】认知无线网络;非协作路由;时延最小化;增强学习【作者】杨振宇【作者单位】安徽交通职业技术学院信息工程系,合肥230051【正文语种】中文【中图分类】TN925无线通信系统所需的无线电频谱是一种有限的资源.随着各种无线应用的蓬勃发展,可用的频谱已经越来越少,频谱稀缺问题日益严重.认知无线电网络(Cognitive Radio Networks,CRNs)允许通过支持动态频谱接入(DSA)来提高无线电频谱的使用效率.在CRNs中,次用户(SUs)只有在主用户(PUs)没有占用频谱的情况下才可以使用频谱资源;当PUs需要使用频谱时,SUs必须立即停止数据传输,并将频谱资源让给PUs[1].CRNs中的路由利用中间SUs节点,以多跳方式将源SU的数据转发到目的SU.在设计路由算法的时候需要考虑以下几个问题:1)CRNs是一个动态的环境,所以SUs需要适应环境的变化;2)SUs需要交换大量的路由信息,由于CRNs是一个分布式的环境,需要考虑如何优化路由算法以减少路由开销;3)由于各个SUs之间是非协作的,因此,设计路由算法时考虑到SUs之间的非协作交互;4)CRN路由协议设计是需要考虑PUs的活动模型,在实现高路由性能的同时并满足PU的服务质量(QoS)需求.1 问题建模1.1 系统模型假设CRN中有N个SUs以及M个PUs,网络中有多个源SU发送数据包,并以多跳的方式通过中间SU发送到目的地SU节点.假设PUs也在发送数据包,PUs也可以转发其他PUs的数据包.利用离散时间马尔科夫泊松过程(DT-MMPP)来对PUs的活动进行建模[2-3].SUs之间是非协作的,每个SU只优化自己的路由性能,而不考虑其他SU的路由性能.当一个SU将数据包传输到到下一跳节点后,该SU会收到来自下一跳SU的确认包(ACK).1.2 问题定义每个SU的目标是选择下一跳SU节点来发送数据包,使其被PU干扰的概率小于给定阈值,从而最小化其端到端时延.因此,SUi的优化问题具有如下的形式:(1)其中,是SUi的动作集合,0表示SUi不传输任何数据,表示SUi将数据包传输给第k个下一跳节点.Pthreshold是SUi能接受的最大干扰概率.Pi(nhi,nh-i)是指SUi受到PU影响的概率.Di(nhi,nh-i)是数据包从SUi到终点的传输时延,Wi(nhi,nh-i)是数据包从SUi到下一跳节点的平均时延,Wi(nhi,nh-i)的计算如下所示[4]:(2)其中,ηi是数据包到达SUi的速率,Xi是SUi的服务率,ρi=ηi/μi,E[Xi]=1/μi 是数据包的平均服务时间,是服务时间二阶矩的期望.是从数据包下一跳节点到终点的最短平均时延[5].根据问题(1),成本函数有如下的定义:Costi(nhi,nh-i)=Di(nhi,nh-i)+Li(nhi,nh-i)(3)其中,Li(nhi,nh-i)是干扰的成本,计算如下:(4)B是一个很大的常数.1.3 路由问题的博弈模型每个SU利用空闲的频谱传输数据包,如果有多个SUs传输数据包,每次进行传输之前的频谱感知时间会增加,这就会使数据包的传输成功率降低,同时时延也会增加.因此,本文将CRNs路由问题利用非合作的博弈模型进行建模.博弈模型是由四元组定义的:Si是SUi的状态空间,在t时刻,状态si(t)定义为(ηi(t),Λi(t)),ηi(t)是数据包到达SUi的速率,Λi(t)是数据包到达PU速率的集合;Ai是SUi的动作集合,SUi在t时刻的动作可以是ai(t)=tri(t)或者是ai(t)=notri(t),notri(t)是指不传输任何数据,tri(t)=nhi意味着SUi转发数据包到下一跳SU;Pi是SUi的状态转移概率,Pi=Pr(si(t+1)|si(t),ai(t),a-i(t));Ci是SUi的中间成本,定义为:(5)其中,Costi(si(t),ai(t),a-i(t))是使用公式(3)计算,Dmax是最大的时延.SUi的一个策略被定义为一个概率向量[πi(si,ai)]ai∈Ai∈Oi(si),πi(si,ai)是指在状态si选择动作ai的概率.SUi的期望折合成本函数可以表示为[6]:(6)其中,β∈[0,1)是折合因子.2 基于增强学习的路由策略当SUi转发数据包时,会根据状态si的策略选择动作ai.此时,Q值的更新公式如下所示[7]:(7)其中,υ(t)∈[0,1)是学习速率,Ii是SUi的邻居,Hi是影响SUi时延的SU集合.a-i是集合Ii\{i}的动作集合,b-i是集合Hi\{i}的动作集合.是一跳的期望时延,是下一跳节点到终点的期望时延.令:在计算Q值的时候并不知道以及的值,因此这里采用估计的方法获取这两个值.在介绍估计的方法之前,需要定义两个变量q1,i以及q2,i,其定义如下所示:(8)(9)利用Boltzmann分布[8],可得以下的结论:(10)(11)τ是一个正数.然后,和的表达式可以重写为以下形式[8]:(12)(13)将式(12)、(13)代入(7),可得:(14)于是,根据Boltzmann分布,可以得到SUi的策略如下:(15)基于增强学习的非协作路由算法如表1所示.表1 基于增强学习的非协作路由算法基于增强学习的非协作路由算法foreachSUido ifSUi转发需要数据包then si=sii; 根据πti(si,ai)选择动作ai; ifai(t)=tri(t)then 将数据包转发到下一跳节点; 利用公式(2)计算Wi(si,ai,a-i); 从下一跳节点接收时延Zi(si,ai,b-i); 计算Li(si,ai,a-i); else 设置成本为最大值Dmax; endif 利用公式(14)计算Q值; 利用公式(15)更新策略; endifendfor3 仿真实验及结果分析图1 端到端时延对比利用NS-2网络模拟器,通过与最短路径算法进行对比来评估本文算法的性能.实验网络中一共有100个节点,其中有4个源Sus,两个Pus,其余的是中间SU.模拟实验场地的大小是1 km2.每一个SU的传输范围是100 m,PU每秒发送20个数据包,参数τ的值是1,β的值是0.5.图1和图2分别是时延以及SU被干扰概率的实验结果.如图1所示,使用本文的算法,当PU可接受干扰的概率增加时,SU可以更自由地转发数据包,从而减少了缓冲数据包的数量,所以时延就会降低.当PU可接受干扰的概率低时,本文算法的延迟会大于最短路径算法的延迟.当使用本文提出的路由算法时,在PU可接受干扰的概率低的情况下,SU必须缓冲更多的数据包,此时被转发的数据包就会变少.这是为了保证PU实际受到干扰的概率小于PU可接受干扰的概率.当PU可接受干扰的概率大于0.8时,SU缓冲的数据包数量减少,因此时延会小于最短路径算法的延迟.如图2所示,本文算法所获得的干扰概率总是小于PU的可接受的干扰概率.图3是SU数据包投递率的实验结果.当PU可接受干扰的概率低时,本文算法的数据包投递率略小于最短路径算法.这是由于当PU可接受干扰的概率低时,SU需要缓存部分数据包,以此避免SUs的传输会对PU造成影响.当PU可接受干扰的概率逐渐增大时,本文算法的数据包投递率要比最短路径算法的要高. 图2 SU被干扰的概率图3 数据包投递率4 结论本文提出在认知无线电网络中的SU的分布式路由方案,SU通过本地的信息进行路由,使用MMPP模型对PU行为进行建模.关于SU之间是非协作的,SU需要对环境的变化进行快速适应,将路由问题建模为非合作的随机学习过程.使用多agent的Q学习方法作为路由问题的解决方案框架.仿真实验的结果显示出本文算法优异的性能.[参考文献][1] LIANG Y C,CHEN K C,LI G Y,et al.Cognitive radio networking and communications:an overview[J].IEEE Transactions on Vehicular Technology,2011,60(7):3386-3407.[2] FU F,SCHAAR M V D.A systematic framework for dynamically optimizing multi-user wireless video transmission[J].IEEE Journal on Selected Areas in Communications,2009,28(3):308-320.[3] FU F,SCHAAR M V D.Learning to compete for resources in wireless stochastic games[J].IEEE Transactions on VehicularTechnology,2009,58(4):1904-1919.[4] CHAN W C,LU T C,CHEN R J.Pollaczek-Khinchin formula for the M/G/1 queue in discrete time with vacations[J].IEE Proceedings -Computers and Digital Techniques,2002,144(4):222-226.[5] ROTH U.Highly dynamic destination-sequenced distance-vector routing[C].Proc Acm Sigcomm94 Aug,1994:234-244.[6] MOZER S M C,HASSELMO M.Reinforcement learning:an introduction[J].Machine Learning,1992,8(3-4):225-227.[7] HUSHENG L.Multiagent-learning for aloha-like spectrum access in cognitive radio systems[J].Eurasip Journal on Wireless Communications & Networking,2010,2010(1):1-15.[8] KIANERCY A,GALSTYAN A.Dynamics of boltzmann Q learning in two-player two-action games.[J].Physical Review E,2011,85(4):1574-1604.。
异构无线网络中基于非合作博弈论的资源分配和接入控制_李明欣
ISSN 1000-9825, CODEN RUXUEW E-mail: jos@Journal of Software, Vol.21, No.8, August 2010, pp.2037−2049 doi: 10.3724/SP.J.1001.2010.03638 Tel/Fax: +86-10-62562563© by Institute of Software, the Chinese Academy of Sciences. All rights reserved.∗异构无线网络中基于非合作博弈论的资源分配和接入控制李明欣1+, 陈山枝2, 谢东亮1, 胡博1, 时岩11(北京邮电大学网络与交换国家重点实验室,北京 100876)2(电信科学技术研究院无线移动通信国家重点实验室,北京 100083)Resource Allocation and Admission Control Based on Non-Cooperation Game inHeterogeneous Wireless NetworksLI Ming-Xin1+, CHEN Shan-Zhi2, XIE Dong-Liang1, HU Bo1, SHI Yan11(State Key Laboratory of Switching and Networking Technology, Beijing University of Posts and Telecommunications, Beijing 100876,China)2(State Key Laboratory of Wireless Mobile Communication, China Academy of Telecommunication Technology, Beijing 100083, China)+ Corresponding author: E-mail: limx007@Li MX, Chen SZ, Xie DL, Hu B, Shi Y. Resource allocation and admission control based on non-cooperationgame in heterogeneous wireless networks. Journal of Software, 2010,21(8):2037−2049. /1000-9825/3638.htmAbstract: Radio resource allocation and call admission control are studied in heterogeneous wireless network. Atheoretical model of allocating bandwidth and connections is proposed on basis of non-cooperation game theory.Combining with the utility function of network connections, the existence and uniqueness of Nash equilibrium inthe processes of non-cooperation game allocating is proved. Furthermore, a call admission algorithm is presented toensure communication reliability based on the analysis of relationship of traffic intensity and block probability.Simulation results reveal that the allocated mechanism resolves the issues of allocated bandwidth and connections.And it ensures the reasonableness and fairness in general. In addition, the results also show that the call admissioncontrol algorithm could guarantee the communication reliability by dynamic adjusting allocated number ofconnections.Key words: heterogeneous wireless network; non-cooperation game; Nash equilibrium; utility; call admission control摘要: 对异构无线网络中无线资源分配和呼叫接入控制进行研究.基于非合作博弈理论,提出了不同无线资源的带宽和连接数量分配的理论模型.结合网络连接的效用函数,对非合作博弈的无线资源分配中的纳什均衡点的存在性和唯一性进行论证.而且,进一步对业务量与阻塞率之间的关系进行分析,提出了能够保证通信可靠性的接入控制算法.仿真结果表明,基于非合作博弈论的无线资源分配机制能够有效地解决带宽和连接数量的分配问题,并能在整体上保证分配的合理性和公平性.接入控制算法根据需要能够动态地调整在某一区域分配的连接数量,从而保证∗Supported by the National High-Tech Research and Development Plan of China under Grant Nos.2006AA01Z229, 2007AA01Z222,2008AA01A316 (国家高技术研究发展计划(863)); the Int’l Cooperation Projects of China and Switzerland under GrantNo.2008DFA12110 (中瑞国际合作项目)Received 2008-12-05; Accepted 2009-03-312038 Journal of Software软件学报 V ol.21, No.8, August 2010通信的可靠性.关键词: 异构无线网络;非合作博弈;纳什均衡点;效用;呼叫接入控制中图法分类号: TP393文献标识码: A下一代无线通信系统的目标是利用不同的接入技术,向用户提供普适接入的多媒体服务[1].这就使得移动用户能够接入异构的无线网络,包括无线局域网(wireless local area network,简称WLAN)、通用移动通信系统(universal mobile telecommunications system,简称UMTS)和无线城域网(world interoperability for microwave access,简称WiMax).在异构无线网络中,应该设计能够同时满足用户和运营商需求的无限资源管理机制(radio resource management,简称RRM),它包括带宽分配、拥塞控制、接入控制等方面[2].目前,对无线资源管理的研究与性能评价往往从纯粹工程技术的角度出发,如资源利用率、用户公平性等.这些方法着重从技术上改进和提高某项或几项性能指标,而往往忽略客观存在的非合作的系统行为.传统的资源分配技术的设计与优化在具备较高的技术指标的同时,却对用户的行为缺乏合理的解释.在异构无线网络中,一方面,系统要对不均匀的用户接入分配相应的资源,另一方面,终端系统不愿意受系统的束缚,这对于无线资源的分配和接入控制是具有挑战性的问题.因此,在研究异构无线网络的资源管理时,有必要引入新的研究方法和理论,非合作博弈论为该研究提供了坚实的数学基础和合理的解释.博弈论适用于解决无线网络中资源管理的问题,它已被用于解决许多协议设计问题(比如,资源分配、能量控制等).博弈论的基本概念包括参与者、行动、信息、策略、支付(效用)、结果和均衡,其中参与者、策略和支付是描述一个博弈所需的最少的要素[3].纳什均衡是完全信息静态博弈解的一般概念.构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略.也就是说,没有任何一个策略严格优于纳什均衡战略,其逆定理不一定成立.从资源分配角度,可将其分为静态分配和动态分配:静态分配将为会话连接保留一定数量的资源,直至会话结束;动态分配将根据网络条件和应用需求动态地调整资源分配的数量[4].通常,静态分配方法依赖于统计模型去估算和预测资源需求,需要预先知道应用流的峰值速率等参数,在实时或交互式应用中很难实现.而过于频繁的动态分配则会给系统带来过多的开销.资源分配一般要考虑两个要素,即分配的公平性和利用率.传统的接入控制策略往往是通过比较呼叫请求的资源量和当前系统的有效资源来决定是否接纳新呼叫.这些策略是假设网络容量保持不变,即网络具有固定容量.而在容量会发生变化的情况下,呼叫接入控制策略如果仅考虑当前时刻的容量信息,在下一时刻网络容量发生下降的情况下就可能会导致过高或不可容忍的掉线率.本文对异构无线网络环境下(包括WiMax,UMTS和WLAN)无线资源分配和呼叫接入控制进行了研究.基于非合作博弈理论,提出不同无线资源带宽和接入控制的理论模型.此模型将异构无线资源之间的竞争关系表达为非合作博弈问题;参与者为WiMax网络和UMTS网络(WLAN的带宽只服务于特定区域,不存在竞争分配问题,所以不包含),策略为调整两个网络在不同服务区域的带宽和准予接入的连接数,支付为连接的带宽效用.结合网络连接的效用函数,证明了非合作无线资源分配博弈中的纳什均衡点的存在性和唯一性.基于此非合作博弈分配机制及对业务量与阻塞率之间的关系进行了的分析,提出了能够保证通信可靠性的接入控制算法.该算法通过动态调整带宽资源的分配和连接的数量来保证通信的可靠性.本文第1节描述并定义异构网络模型.第2节建立基于非合作博弈模型,从理论上分析和证明资源分配的纳什均衡.第3节基于非合作博弈的资源分配及通信可靠性理论提出接入控制算法.第4节根据理论分析模型设定参数,建立仿真场景,并对结果进行分析.第5节对无线资源管理领域的相关工作进行回顾.第6节得出结论.1 异构网络模型4G无线通信系统的目标是,为用户在异构无线接入网络中无缝漫游提供便利[5].本节建立了异构无线接入网络模型,包括WiMax,UMTS和WLAN.不失一般性,假定覆盖面积小的接入网络总是在覆盖面积大的接入网络中,比如,WLAN AP的覆盖范围在UMTS AP的覆盖范围中,UMTS AP的覆盖范围在WiMax AP的覆盖范围中.根据以上假定,图1是一个异构无线网络单元的架构图,整个网络可看作是多个异构无线网络单元的组合.李明欣 等:异构无线网络中基于非合作博弈论的资源分配和接入控制 2039Fig.1 Architecture of heterogeneous wireless networks图1 异构无线网络架构定义1. 一个异构无线网络单元含有一个WiMax AP,一个WiMax AP 的覆盖范围内有m 个UMTS AP,一个UMTS AP 中有n 个WLAN AP,其中,m 和n 均大于等于1.系统中所有AP 可以用集合{ap 1,ap 2,…,ap m +1, ap m +2,…,ap m ×n +1}表示.定义2. 服务区域集合{a 1}表示系统中WiMax AP(即ap 1)的覆盖区域减去其中所有UMTS AP(即{ap 2,…, ap m +1}覆盖区域的剩余面积;对于服务区域集合{ap 2,…,ap m +1},则表示每个UMTS AP 的覆盖区域分别减去其中所有WLAN AP 覆盖区域的集合(如图1所示,a 2表示ap 2的覆盖区域减去ap 4的覆盖区域的剩余区域);对于服务区域集合{ap m +2,…,ap m +n +1,…,ap m ×n +1},表示所有WLAN AP(即{ap m +2,…,ap m ×n +1})各自覆盖区域的集合.由定义2可知,{a 1}表示的覆盖区域只有WiMax 信号,{a 2,…,a m +1}表示的区域被WiMax 和UMTS 两种信号覆盖,而{ap m +2,…,ap m +n +1,…,ap m ×n +1}表示的覆盖区域被WiMax,UMTS 和WLAN 这3种信号覆盖.2 基于非合作博弈系统模型本节将无线网络资源带宽分配问题用公式构建为一个非合作博弈系统模型.非合作博弈系统模型的关键部分是:参与者、策略和支付.参与者指的是一个博弈中的决策主题.其目的是提供选择策略以最大化自己的支付(效用)水平.策略是参与者在给定信息集情况下的行动规则.它规定参与人在什么时候选择什么行动.在博弈中,支付是指在一个特定的战略组合下参与者得到的确定效用水平,或者是参与者得到的期望效用水平.支付是博弈参与者真正关心的,参与者的目标是选择自己的战略以最大化其效用函数. 2.1 效用、连接数和带宽网络中,终端的数目和网络资源的消耗程度是动态变化的,当用户数目较少且网络负载量较小时,会造成大量资源的闲置.当系统的用户数较多且网络负载量较大时,过量的资源需求使得网络阻塞的机会大为增加.本文主要探讨异构无线资源间的博弈,使网络侧异构无线资源间的博弈达到平衡,即每种无线接入网络的利益最大化;同时,考虑网络侧的带宽分配及不同连接数对系统的影响.在网络侧无线资源分配博弈过程中,各个无线资源均以自己效用最大为目标,而不同的连接个数也将对系统产生影响.涉及到无线网络资源的效用,文献[5]中提到的一种经典的吞吐量效用函数可归纳为定义3.定义3. 在网络侧无线资源博弈中(如图1所示),i ap b 的效用函数为,log i ap x U b ωα= (1)其中,,i ap x U 表示连接x 在i ap b 覆盖区域的效用,b 表示i ap b 连接x 的带宽,ω和α为常量参数.定义4. 在服务区域的平均连接到达率为λ,每个连接的平均持续时间为1/μ,则呼叫量a =λ/μ,平均连接数量可以表示为WLAN APWiMax APa 1a 2a 3a ia ja 5a4UMTS AP2040 Journal of Software 软件学报 V ol.21, No.8, August 201011/!/!i mm ri r a i C i a r ==⎛⎞⎜⎟=⎜⎟⎝⎠∑∑ (2) 定义5. 1{}ap b 表示WiMax AP 支持的总带宽,21{,...,}m ap ap b b +表示各个UMTS AP 所支持的总带宽,21{,...,}m m n ap ap b b +×+表示各个WLAN AP 支持的总带宽.{ap 1}在{a 1}上的带宽可以表示为11111111122{}, .j i m m n aa a a ap ap ap ap ap i j mb b b b b +×+==+=−−∑∑在UMTS AP{a 2,…,a m +1}上的带宽为1112221211222111112(1)2{,...,}, ,...,.m m i m i m m m m m n m n a a a a a a a a ap ap ap ap ap ap ap ap ap ap i m i m n bb bbb b b bb b +++++++++×+=+=×−+++=−=−∑∑ 在WLAN AP{a m +2,…,a m +n +1,…,a m ×n +1}上的带宽为222111111122111121{,...,,...,}.m m m m n m n m n m n m n m n m m n m n m a a a a a a a a a ap ap ap ap ap ap ap ap ap b b b b b b b b b +++++++++×+×+×++++×++++++++ 定义6. 纳什均衡是所有参与者的最优战略的组合,记为****1(,...,,...,)i n s s s s =.其中,*i s 是第i 个参与者在均衡情况下的最优战略.它是i 的所有可能的战略中使u i 最大化的战略.u i 是所有参与人的策略组合的函数,i 的最优策略通常依赖于其他参与者的战略选择.为了把一个特定的参与者与其他参与者区别开,用s −i =(s 1,…,s i −1,s i +1,…,s n )表示由除i 外的所有参与者的策略组合的向量.*i s 是给定s −i 情况下第i 个参与人的最优策略意味着 **(,)(,), i i i i i i i i u s s u s s s s −−′′∀≠≥ (3)均衡意味着,对所有的i =1,2,…,n ,上式同时成立.也可用另一种表述方式,*i s 是下述最大化问题的解:*****111arg max (,...,,,,...,)i ii i i i i n s S s u s s s s s −+∈∈ (4)2.2 无线网络资源非合作博弈模型(1) 参与者:WiMax 网络和UMTS 网络.(2) 策略:WiMax 可以采用的策略为12121111{,...,,,...,},m m m n a a a a wimax ap ap ap ap S b b b b ++×+=即{ap 1}可以调整在区域{a 2,…, a m +1,a m +2,…,a m ×n +1}上的带宽分配;UMTS 可以采用的策略为211221{,...,,...,},m m n m n m a a a umts ap ap ap S b b b +++×++=即{ap 2,…, ap m +1}可以调整在区域{a 2,…,a m +1,a m +2,…,a m ×n +1}上的带宽分配.(3) 支付:WiMax 的支付(效用)是它向服务区域{a 2,…,a m +1,a m +2,…,a m ×n +1}提供的带宽的效用(效用函数参见定义3);UMTS 的支付是它向{a 2,…,a m +1,a m +2,…,a m ×n +1}提供的带宽的效用.WiMax 的支付可以表示为222112121221221111111112max log log log ...log log i m m m m m m m m m n a a a a ap ap ap apap i ap ap ap ap ap ap a a a ap ap ap ap ap ap wi b b b b b C C C C C C b b b C C C U αααααω+++++++×+=⎛⎞⎛⎞−⎜⎟⎜⎟⎛⎞⎛⎞⎛⎞+⎜⎟⎜⎟⎜⎟+−++⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎝⎠⎝⎠⎝⎠⎜⎟⎜⎟⎝⎠⎝⎠⎛⎞+⎜⎟−⎜⎟=⎝⎠∑11222222212222221111111...log log ...log m m m m m m m m m m m m m n m n m n m n m m n m n ap a a a a a ap ap ap ap ap ap ap ap ap a a a ap ap ap ap ap C b b b b b C C C C b b b C C ααα+++++++++++++×+×+×+×+×+×+⎛⎞⎛⎞⎜⎟⎜⎟++⎜⎟⎜⎟⎝⎠⎝⎠⎛⎞⎛⎞⎛⎞+++⎜⎟⎜⎟−⎜⎟++⎜⎟⎜⎟⎜⎟⎝⎠⎝⎠⎝⎠⎛⎞++⎜⎜⎝⎠11111log m n m n m n m m n m n a a ap ap ap ap b b C C α×+×+×+×+×+⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎛⎞⎛⎞+⎢⎥⎜⎟⎟−⎜⎟⎢⎥⎟⎜⎟⎜⎟⎝⎠⎝⎠⎣⎦(5) UMTS 网络的支付可以表示如下:李明欣 等:异构无线网络中基于非合作博弈论的资源分配和接入控制 2041222211111111111122222222222log log ...log log ()log m m m m m m m m m m m m a a a ap ap ap a a a ap apap ap ap ap ap umtsa a ap ap ap ap apb b b C C C C b b b C C C C U b b n b C C ααααωα++++++++++++⎛⎞⎛⎞⎛⎞+⎜⎟−++⎜⎟⎜⎟⎜⎟⎜⎟⎜⎟⎝⎠⎝⎠⎝⎠⎛⎞⎛⎞⎛⎞+⎜⎟⎜⎟−+⎜⎟⎜⎟⎜⎟⎜⎟⎝⎠⎝⎠⎝⎠=⎛−÷+22222111111111111()log ...()()log log m m m m n m m m m n m m m n m n m n m n a ap ap ap ap a a a ap ap ap ap ap ap ap ap ap b b n C C b b n b b b n C C C C ααα+++×++++×+++×+×+×+×+⎡⎤⎢⎢⎢⎢⎢⎢⎢⎢⎛⎞⎞⎛⎞−÷⎢⎜⎟⎜⎟−++⎜⎟⎜⎟⎜⎟⎜⎟⎢⎝⎠⎝⎠⎝⎠⎢⎢⎛⎞⎛⎞⎛⎞−÷+−÷⎢⎜⎟⎜⎟−⎜⎟⎜⎟⎜⎟⎜⎟⎢⎝⎠⎝⎠⎝⎠⎣⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥ (6) 根据定义6,***(,)wimax umts S S S =是纳什均衡.即满足公式(3),****(,)(,),(,wimax wimax umts wimax wimax umts umts wimax U S S U S S U S ≥ **)(,).umts umts wimax umts S U S S ≥对于参与者WiMax,其最佳反应函数为BR wimax (S umts ),根据公式(4),WiMax 获取最大效用对应的函数为 *arg max (,)wimax wimax S wimax umts S S S = (7)同样,对于参与者UMTS,其最佳反应函数为BR umts (S wimax ),UMTS 获取最大效用对应的函数为*arg max (,)umts umts S wimax umts S S S = (8)策略集合**(,)wimax umts S S 是纳什均衡点,当且仅当满足:**()wimax wimax umts S BR S = (9)和**()umts umts wimax S BR S = (10)为了获得WiMax 的最佳反应函数,公式(5)中的U wimax 对集合112111{,...,,...,}m m n a a a ap ap ap b b b +×+中的每个元素进行微分, 则可得:222111212112()i m n a a a wimax ap ap ap ap ap ap a i ap U C b b C b b b ×+=∂⎛⎞⇒−=+⎜⎟∂⎝⎠∑ (11) …11111111112()i m m m m m m n a a a wimax ap ap ap ap ap ap a i ap U C b b C b b b +++++×=∂⎛⎞⇒−=+⎜⎟∂⎝⎠∑ (12) …111111111112()i m n m n m n m n m n m m n m na a a a wimax ap ap ap ap ap ap ap a i ap U Cb b C b b b b ×+×+×+×+×+×+×=∂⎛⎞⇒−=++⎜⎟∂⎝⎠∑ (13) 为了获得UMTS 的最佳反应函数,公式(6)中的U umts 对集合1221{,...,}m m a a ap ap b b ++中的每个元素进行微分,则可得:2222222122221222221...()()m m n m m n m m n ap ap ap umtsa a a a a a a ap ap ap ap ap ap ap ap ap C C C Ub b b b b n b b b n b +++++++++∂⇒=++∂+−+×−+× (14) …1112211111122111121...()()m m m m n n m n n m n m n m m m m n n m n n m m n m n umts m m n n m n a a a a a a a ap ap ap ap ap ap ap ap apU C C C b b b b b n b b b n b +++×−+×−+×+×++++×−+×−++×+×++×−+×+∂⇒=++∂+−+×−+× (15) 2.3 网络效用优化在所有服务区(即对集合{a 1,a 2,…,a m +1,a m +2,…,a m ×n +1})中的网络效能,可以根据定义3中的公式(1)表示为2042 Journal of Software 软件学报 V ol.21, No.8, August 201012212112121111111111111log log ...log ...log m m m n m n m n m m n m m m n m m n a a a ap ap apap ap ap ap alla a a a a ap ap ap ap ap ap ap ap apb b b C C C C U b b b b b C C C C ααωαα++×+×+×++×++×++×+⎡⎤⎛⎞⎛⎞+⎢⎥+++⎜⎟⎜⎟⎜⎟⎜⎟⎢⎥⎝⎠⎝⎠=⎢⎥⎛⎞⎛⎞+++⎢⎥⎜⎟++⎜⎟⎢⎥⎜⎟⎜⎟⎢⎥⎝⎠⎝⎠⎣⎦(16) 公式(16)中的U all 对集合1112211121{,...,,...,,,...,}m m n m m a a a a a ap ap ap ap ap b b b b b +×+++中的每个元素进行微分,则可得:1222212111120i ap ap alla m n a a a apap apap ap i C C U b b b b b×+=∂=⇒=∂+−∑(17)…1111111111120m m m m i m ap ap alla m n a a a apap ap ap ap i C C U b b b b b+++++×+=∂=⇒=∂+−∑(18)…11111111111120m n m n m n m n m n i m n m ap ap alla m n a a a a apap ap apap api C C U b b b b b b ×+×+×+×+×+×+×+=∂=⇒=∂++−∑(19)22222221222212222210...()()m m n m m n m m n ap ap ap alla a a a a a a ap ap ap ap ap ap ap ap ap C C C Ub b b b b n b b b n b +++++++++∂=⇒=++∂+−+×−+× (20) …12111122111111221110...()()m m n n m n m m m m n n m n n m n m n m m m m n n m n n m m n m n ap ap ap alla a a a a a a ap ap ap ap ap ap ap ap ap C C C Ub b b b b n b b b n b +×−+×++++×−+×−+×+×++++×−+×−++×+×+∂=⇒=++∂+−+×−+× (21) 将公式(11)~公式(13)变形,可以发现它们与公式(17)~公式(19)一致;公式(14)、公式(15)与公式(20)、公式(21)一致.这说明在每个WiMax 和UMTS 信号的区域,达到了网络的优化效能,存在纳什均衡解.对于纳什均衡解的存在性和唯一性,将在第2.4节进行讨论和证明. 2.4 非合作博弈的纳什均衡定义6中纳什均衡的定义可以简单地理解为,一个参与者在其他参与者选择最优策略之后,无论如何改变其策略都无法增加其效用.在第2.2节和第2.3节中,通过推导可以发现存在纳什均衡解,但并不能证明其唯一性.满足纳什均衡存在且 唯一需要满足两个条件:(1) 效用函数是严格凹的122(0);iwimaxa ap Ub ∂<∂(2) 交叉偏导数是负的12(0).i i j wimax a a ap ap U b b ∂<∂∂其中, i ∈{2,…,m +1,…,m ×n +1},j ∈{2,…,m +1},i ∈{j +m ,j +m +n −1}.满足这两个条件意味着两个参与者的反应函数是斜率为负的连续函数,而且二者的斜率不一样,证明如下:证明:① 证明效用函数为严格凹.由公式(5)推得:12222121112222120,()i ap ap wimaxa a a m n ap ap ap a ap ap i C C Ub b b b b ×+=∂=−−<∂+⎛⎞−⎜⎟⎝⎠∑ …1111111211112222120.()m m n m n m n m n m n i ap ap wimaxa a a a m n ap ap ap ap a ap ap i C C Ub b b b b b +×+×+×+×+×+×+=∂=−−<∂++⎛⎞−⎜⎟⎝⎠∑李明欣 等:异构无线网络中基于非合作博弈论的资源分配和接入控制 2043以上各式均为负,UMTS 网络的二阶偏导亦为负. ② 证明交叉偏导数为负.222221221220,()ap wimaxa a a a ap ap ap ap C Ub b b b ∂=−<∂∂+ …111111111220.()m m n m n m n m n m m ap wimaxa a a a ap ap ap ap C Ub b b b +×+×+×+×+++∂=−<∂∂+ 以上各式均为负,对于UMTS 网络的交叉偏导亦为负.证得①和②,由此可知纳什均衡在各个有WiMax 和UMTS 信号覆盖的区域存在且唯一.□3 接入控制算法i a b 表示在a i 服务区的总带宽,11, {1},{1}, ,{2,...1},, {2,...,1},{2,...,1},{2,...,1}i j i i ijj ii j j a ap a a a ap ap a aa ap ap apb j i b b b i j m i j b b b i m m n j m j m m n ′⎧∈∈⎪⎪=+∈+=⎨⎪′⎪++∈+×+∈+∈+×+⎩. 定义7. i ia ab C r ⎡⎤=⎢⎥⎣⎦,其中i a C 表示在区域a i 支持的连接数,r 是一个连接的平均带宽需求.[]1i i a a r C C τ=×+(其中,τ为分配连接数进行调整的阈值,i ∈{1,2,…,m +1,m +2,…,m ×n +1})表示服务区a i 分配的连接数量.定义8. 针对连接,可用M/M/m/m 排队系统来表示,i a C 表示服务区a i 的平均连接数,连接的阻塞率为i a P .()/!()/!i iia m a ma jj a m P aj ==∑ (22)其中,m 表示在服务区域a i 提供的连接数,/i a a λμ=表示服务区域a i 中的业务量(λ为呼叫到达率,1/μ是指连接 被占用的时间服从均值为1/μ的指数分配),j 表示正在通信的连接.服务区域a i 的效率为(1)i i a a a P mη−=(23) 阻塞率通常是网络的关键指标,为保证阻塞率保持在一定的范围(即,(0,1)),i a P t t <∈可通过调整分配给服 务区域a i 的连接数达到目标(相当于提高用M/M/m/m 排队系统中的窗口数量m ).先规划a i 服务区域的连接数i a C ,则可以根据网络非合作博弈分配模型得出在a i 的总带宽i a b .由定义7中的公式可以得到系统每个连接的平均带宽/.i i a a r b C =如果在a i 中已经有n 个连接处于使用状态,则在接入n +1个连接时需要判断:(1) 如果满足条件1(1)(),i i a a r n n C C r r ++<−<和,i a P t ≤则接纳第n +1个连接.(2) 如果满足条件11(1)(),()...()i i a a r n n n C C r r r r r r ++<−<+−++−和,i a P t ≤则接纳第n +1个连接.(3) 如果()(1),i i i a a a r C C n C −+<≤则通过网络非合作博弈的增加分配给a i 的连接数(),i a C k +其中,k ≥1.返回步骤(1)和步骤(2)重新计算,如果满足,则接纳第n +1个连接;否则,拒绝接入.(4) 如果i a P t >,则通过网络非合作博弈的增加分配给a i 的连接数()i a C k +.其中,k ≥1.返回步骤(1)和步骤(2)重新计算,如果满足,则接纳第n +1个连接;否则,拒绝接入.详细的系统伪码如图2所示.2044 Journal of Software软件学报 V ol.21, No.8, August 2010 Algorithm. Admission control algorithm.Variables:1: int time=0;2: int c=0;3: int r=0;8: int k=5;8: int n=0;4: double p=0;5: double b=0;6: double avg_b=0;7: double t=0.1;8: double a=0;9: double tr=0.1;Input:10: c=15;11: n=6;Action:12: r=[c*tr]+113: p=computeBlockProbility(c,a,i);14: b=getBandwidth(c,i);15: avg_b=averageBandwidth(c,b,i);16: a=getTraffic(i);17: while (time<3)18: if ((c−r)<=(n+1)<c||p>t) //Determine whether the number of connections and blocking probability above the threshold 19: c=addConnections(c,k,i); //Increase number of connections20: p=computeBlockProbility(c,a,i); //Blocking probability calculation21: end if22: b=getBandwidth(c,i);23: avg_b=averageBandwidth(c,b,i);24: a=getTraffic(i);25: if ((n+1)<(c−r) && p<=t)26: if (b<avg_b)//Determine whether to accept the request bandwidth27: return true;28: end if29: if (b<(avg_b+getOverplusBandwidth(i)))30: return true;31: end if32: end if33: time++;34: end while35: return false;Fig.2 Admission control algorithm图2 接入控制算法4 仿真模型和性能分析4.1 仿真模型和参数设置仿真模型可参考图1,设置1个WiMax AP,2个UMTS AP和2个WLAN AP,集合定义、覆盖关系按照定义1和定义2,接入点集合为{ap1,ap2,ap3,ap4,ap5},服务区域集合为{a1,a2,a3,a4,a5}.WiMax的传输速率为10Mbps, UMTS的传输速率为2Mbps,WLAN的信道速率为11Mbps(实际最大吞吐量为7Mbps[2]).网络效能函数的参数设ω=1,α=0.7;通信的阻塞率4a P分别取0.1和0.2.4.2 网络资源分配假定在服务区{a1,a2,a3,a5}中的连接数为{10,5,5,20},但是在服务区a4中的连接数是变化的.如图3(a)所示,随着服务区a4中连接数的增加(分别取15,20,25,30),ap1(WiMax AP)分配给服务区a1,a3和a5的带宽下降,而分配给a2和a4的带宽的呈上升趋势;ap1分配给a4区域的带宽呈直线增长,而分配给区域a2的带宽在a4中连接数大于20时则增长很小.如图3(b)所示,ap2(UMTS AP)覆盖的区域为a2和a4,随着服务区a4中连接数的增加,ap2分配给a2的带宽逐渐减小,而分配给a4的带宽则持续增加.ap3(UMTS AP)覆盖的区域为a3和a5,因为ap3和ap2李明欣 等:异构无线网络中基于非合作博弈论的资源分配和接入控制2045服务的区域不存在竞争关系,所以ap 3对于a 3和a 5的带宽影响很小.只有当a 4中连接数较大时(比如大于25),由于ap 1分配给a 3和a 5的带宽减少,而且ap 5的带宽耗尽(最大为7Mbps),才促使ap 2分配给a 3和a 5的带宽重新调整,达到整体上的带宽分配平衡.可以观察到,当a 4中的连接数增加到20时,ap 1分配给a 4和a 5的带宽相等,ap 2分配给a 2和a 4的带宽与ap 3分配给a 3和a 5的带宽相等(因为此时它们的连接数相同).这些数据表明,非合作博弈在网络资源分配方面是公平的.a 4中的带宽来自ap 1,ap 2和ap 4.从图3可以看出,随着a 4中连接数的增多,ap 1和ap 2分配给它的带宽是增加的.Fig.3图3如图4(a)所示,随着a 4中连接数的增多,其总带宽是快速上升的,而在其他服务区域的带宽是减少的.总体上讲,a 4中的每个连接的平均带宽是下降的.这可以解释为,系统中各种无线资源的总量是一定的,但随着某个区域(本节中研究的是a 4,且假定其他区域分配的连接保持不变)中预留的连接数的增大,各个区域的无线资源经过非合作的博弈达到平衡,但各个连接的平均带宽是下降的.Fig.4图4如图5(a)所示,随着业务量的增大,阻塞率也增大.而在一定业务量时,a 4中的连接数越多,阻塞率越小.结合图5(b)可以分析出,在一定业务量时,a 4中的连接数越多,其效率越低.这说明在a 4中预留的连接数的大小受两个800016 18 20 22 24 26 28 30Number of connection in area 4B a n d w i d t h (K b p s )WiMax AP allocate bandwidth to area 1WiMax AP allocate bandwidth to area 2WiMax AP allocate bandwidth to area 3WiMax AP allocate bandwidth to area 4WiMax AP allocate bandwidth to area 5600040002000250016 18 20 22 24 26 28 302000150010005000Number of connection in area 4B a n d w i d t h (K b p s )UMTS AP allocate bandwidth to area 2UMTS AP allocate bandwidth to area 3UMTS AP allocate bandwidth to area 4UMTS AP allocate bandwidth to area 5(a) WiMax AP allocate bandwidth to service areas(a) WiMax AP 在各个服务区的带宽分配(b) UMTS AP allocate bandwidth to service areas(b) UMTS AP 在各个服务区的带宽分配1600016 18 20 22 24 26 28 301400012000100008000600040002000Number of connection in area 4B a n d w i d t h (K b p s )Total bandwidth in area 1 Total bandwidth in area 2 Total bandwidth in area 3 Total bandwidth in area 4 Total bandwidth in area 560016 18 20 22 24 26 28 30Number of connection in area 4B a n d w i d t h (K b p s )Average bandwidth to per connectionWiMax AP allocate bandwidth to per connection UMTS AP allocate bandwidth to per connection WLAN AP allocate bandwidth to per connection4002000(a) Total bandwidth in service areas(a) 各个服务区的总带宽(b) Average bandwidth per connection(b) 每个连接的平均带宽2046 Journal of Software 软件学报 V ol.21, No.8, August 2010因素制约,即阻塞率和系统效率.根据通信网理论,网络的首要指标是呼损(阻塞率),其次才是系统效率[6].因此,阻塞率保持在一定水平(比如0.1),i a P ≤业务量越大,则需要预留的连接数越大,系统的效率也就相对较高.Fig.5图5如图6所示,基于博弈的接入控制算法和静态接入控制算法在阻塞率和系统效率方面进行了对比.基于博弈的接入控制算法参见第3节.静态接入控制算法是指系统分配给某一区域一定的带宽和连接数(本节假设a 4得到的带宽为9 300kbps,分配连接数为20),相当于排队论中的拒绝服务系统(当窗口已满时,拒绝服务).Fig.6图6如图6(a)所示,基于博弈的接入控制算法在a 4中的初始连接数(相当于排队系统中的窗口数量)为15,当40.1a P <且业务量a ≤15时,由于能够保证要求的阻塞率,算法对于连接数不作调整,所以其阻塞率会比静态接 入控制算法略高.当15≤a ≤30时,基于博弈的接入控制算法会通过调整连接数控制其阻塞率一直保持在小于0.1的水平,而静态控制算法由于没有调整机制,其阻塞率快速上升达到0.38.在系统效率方面,当a ≤15时,基于博弈的接入控制算法高于静态接入控制算法,随着业务量的增加(当15≤a ≤30时),系统效率会比静态控制算法 低10%左右.当40.2a P <时的分析与以上类似.这些结果表明,基于博弈的接入控制算法兼顾考虑了质量指标和 效率指标.而对于静态接入控制算法,如果遇到系统中有突发连接增多的情况,其阻塞率无法控制.0.65 10 15 20 25 300.50.40.30.20.10Traffic (Erlang) B l o c k p r o b a b i l i t y15 connections in area 4 20 connections in area 4 25 connections in area 4 30 connections in area 41005 10 15 20 25 3080604020Traffic (Erlang) S y s t e m e f f i c i e n c y (%)15 connections in area 420 connections in area 425 connections in area 430 connections in area 4(a) Legacy readahead(a) 传统预读(b) Demand readahead(b) 按需预读0.45 10 15 20 25 300.30.20.10Traffic (Erlang)B l o c k p r o b a b i l i t yGame admission control algorithm (p <0.1)Game admission control algorithm (p <0.2)Static admission control algorithm5 10 15 20 25 30Traffic (Erlang)1009080706050403020S y s t e m e f f i c i e n c y (%)Game admission control algorithm (p <0.1)Game admission control algorithm (p <0.2)Static admission control algorithm (a) Block probability contrast(a) 阻塞率对比分析(b) System efficiency contrast (b) 系统效率对比分析李明欣等:异构无线网络中基于非合作博弈论的资源分配和接入控制20475 相关工作文献[1]中主要研究了异构无线接入技术,比如蜂窝网络、无线局域网和移动自组织网络的整合问题,并描述了整合不同无线技术的问题.文献[7]中说明了下一代移动系统在当前部署和不断发展的2G/3G基础设施上无缝整合,实现4G接入技术是很重要的,并重点讨论了WiMax与3GPP如何实现无缝整合.文献[8]中对WiMax,UMTS和WLAN整合的异构网络构建模型,并基于此模型提出一种基于受限马尔可夫链的垂直切换算法.这些文献主要是研究异构无线网络中的整合问题和切换问题等,但并未考虑带宽分配和预留连接问题.文献[9]中采用不同的无线资源管理对WiMax网络下行链接的性能进行了研究,尤其是对于QoS控制的调度和流媒体应用的多连接实现.文献[10]中讨论了如何在多无线接入网络中进行分布无线资源管理,并将其分为3类:网络集中、网络分布和终端异构无线网络的资源管理;而且在B3G的无线接入网络架构下建模并分析了相关问题.文献[11]中提出了一种在终端侧建立优先级列表的无线资源管理算法.它是一种用户喜好、终端能力、网络负荷和终端位置与速度的折中.文献[12]中提出了一种非合作博弈论的方法,以优化WLAN中随机信道的接入.在文献[13]中,CDMA系统的接入和速率控制被表达为非合作博弈.文献[14,15]中用博弈论解决CDMA系统中的效率和公平性资源分配、能耗控制等问题.文献[16]中基于博弈论,对在多服务的CDMA网络中不同呼叫类型的接入控制进行了研究.文献[17]中基于博弈论提出了一种支持WiMax轮流检测的带宽分配和接入控制方法.在文献[18]中,无线自组织节点间的数据包转发策略被构建为博弈关系,并对其纳什均衡点研究.文献[4]中提出了一种能够反映供求关系的基于竞价的网络资源定价机制,并设计了端系统的效用函数,研究了资源分配中的纳什均衡点,但它主要考虑的是Internet网络.这些文献均用到了博弈理论,但主要用于集中解决单一网络中的资源管理问题.在文献[19]中,在整合的WLAN和蜂窝网络的环境下提出了一种分层的无线资源管理机制.文献[20]中提出了一种基于合作博弈的带宽分配框架,用于4G异构无线网络,但其假设前提是参与者之间是充分合作的,这与现实中参与者都是理性的且以自己利益最大为原则的情况相违背,不能保证资源分配的公平性.文献[6]中提出了一种基于非合作博弈的无线资源管理框架,但它只探讨了接入异构网络的一个特殊情况,没有讨论针对网络的普遍性及系统的效率问题.文献[21]中提出了一种呼叫接入控制算法,考虑了阻塞率和基于等级服务的机制.它主要通过基于等级服务函数得出最小值来确定分配的信道数,但是权重调整有一定的随意性.文献[22]中提出了一种公平的呼叫接入控制算法.它基于自适应马尔可夫模型,能够适用于不同的业务流,但是它研究的前提是网络容量固定.基于对以上文献的分析,本文提出了一种基于非合作博弈的无线资源分配方法.它建立的模型具有普遍性,能够兼顾公平性和效率.在呼叫接入控制方面,考虑了无线信道数的分配和通信的阻塞率,提出了一种可调整网络容量的算法.它用于解决网络中局部业务量突增而使阻塞率上升的问题,能够使阻塞率低于通信过程中可容忍的水平.6 结束语本文对异构无线网络(包括WiMax,UMTS和WLAN)下的无线资源管理进行了研究,基于非合作博弈论提出并证明了不同服务区域的带宽、连接数量分配机制及接入控制算法.这种分配机制考虑了各种无线资源之间的竞争博弈,对每个服务区域分配一定数量的连接且能够满足带宽分配的公平性.本文提出的接入控制算法不仅考虑了接入连接的带宽是否满足,而且考虑了其所在服务区域的阻塞率情况.如果当某服务区业务量增大时,其阻塞率也增大,则通过基于非合作博弈的分配机制对该区域的分配的连接数进行调整,从而保证通信的可靠性,将业务量保持在一定水平.验证分析表明,基于非合作博弈的带宽和连接分配机制是公平的,相应的接入控制算法可以动态地调整,从而保证系统通信的有效性并兼顾效率.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
! #E #E # $! # + 8 9 4 : : ; : <) : = ? @ A B8 9 C A D 9 A C F C 2 DG D C 0 C H 2 D!& + " " & + ) 4 C D 2 8 9 4 : : ;: <8 : < @ I 2 B AJ D C D A A B C D > K K # # $ # # " 5 : D CG D C 0 8 4 2 D 4 2 C " " " # ! ) 4 C D 2 ’ * 2 D M: <) : == ? D C 9 2 @ C : D 8 4 2 D 4 2 C " " " ’ ’ ) 4 C D 2 !! !! K L K K % # 5 / 0 + ( " % + A 9 2 ? 3 A: < @ 4 A? D N 2 ; 2 D 9 A FB A 3 : ? B 9 AF C 3 @ B C N ? @ C : D C D@ 4 A> 2 @ 49 4 : C 9 A: < @ 4 A B : ? @ A B 2D A IK 2 = A $ !* # I 4 C 9 4B A 2 B F 3 @ 4 A2 D 9 2 3 @ B : ? @ A: < . / 0 #2 32 D? D 9 : : A B 2 @ AK 2 = A C D= 2 D @ 4 A : B A @ C 92 B : 2 9 4 C 3> B A 3 A D @ A F K O > O > > & ; 2 A B 3 -6K 2 = A= : F A ;I C @ 42> ; 2 A B 3 B 2 @ AF C 3 @ B C N ? @ C : D3 @ B 2 @ A @ D FF A ; 2 0 2 C ; C D2 ; ; 2 @ 4 3 C 3K C 0 A D 5 4 A > O O O2 O2 > & 3B 2 @ AF C 3 @ B C N ? @ C : DI 4 C 9 49 2 D2 3 3 ? B A@ 4 A1 2 3 4A ? C ; C N B C ? =C 33 : ; 0 A F -* 2 3 A F: D@ 4 A1 2 3 4 ; 2 A B P > O J ? C ; C N B C ? =# 2N 2 ; 2 D 9 A FB : ? @ A2 B C @ 4 = A @ C 9I 4 C 9 42 3 3 9 ? B A 3@ 4 AN A 3 @F A ; 2 D F@ 4 A< 2 C BF C 3 @ B C N ? @ C : DC D2 ; ; P O2 ; 2 A B 3 C 3> B A 3 A D @ A F -8 C = ? ; 2 @ C : DB A 3 ? ; @ 3C D F C 9 2 @ A@ 4 2 @@ 4 C 32 B C @ 4 = A @ C 99 2 D3 : ; 0 A@ 4 AN 2 ; 2 D 9 A FB A 3 : ? B 9 A > O F C 3 @ B C N ? @ C : D C D@ 4 AB : ? @ A B C DA < < A 9 @ % $ $ 6 & ) ( ’ 0 A 3 : ? B 9 AF C 3 @ B C N ? @ C : D D : D 9 : : A B 2 @ C 0 AK 2 = A 1 2 3 4A ? C ; C N B C ? =$ N 2 ; 2 D 9 AB : ? @ A !B > P 47
( + 路由器作为网络资源分配的核心部件 # 其路径选择算法是影响网络资源分配公平性和均衡性’ 的关键问
题均衡路由算法是指路由器在进行路由选择时 # 其目标不再是单纯 ) 最短路径最佳 * # 而是整个网络路径效用 最佳 # 其本质是网络资源的均衡性分配问题 # 即网络路径带宽和服务器处理能力等网络资源 的均衡 性分 配问
图 +! 任意播路由模型
力! 路由器依照何种路由算法将业务流转发到各链路上 ! 使得链路上任务均衡分配 ! " #! 博弈模型 基于博弈论 ! 可将上述任务模型中任 意 播 路 由 问 题 看 作 是 多 个 任 务 流 在 网 络 中 的 非 合 作 博 弈 该博弈 中! 将路由器看作是网络中多个非合作的参与者 ! 每个参与者在特定服务器和链路上任务流的延迟时间为效 用函数 ! 每个参与者总是期望其效用函数最小 ! 且达到网络中资源分配的公平性 假定 5 矢 量! %! 表 示 参 与 者) 的 策 略 ! 矢量 ’ 转发任务 的 流 速 ! 5 5 5 +! !! ’ 是参与者) 沿路径 +& ) ) 9 $ ) ) ) %! 定义任务在每条路径上的延迟时间为 ! 9$ 5 5 53 &表示整个网络博弈中的解 +! !!
! " " &年#月 第’ ,卷!第’期
!
西安电子科技大学学报 (自然科学版) ! "#$%& ’!" (!) * + * &%!#% * , -$ . * /0
!
Q ? D! " " & R : ; ’ ,!1 : ’
一种基于非合作博弈的均衡路由方法
! 张 惠 娟+! ! 周 利 华+! 翟 鸿 鸣’
3
: !&9 + $ ! !! ’$ ’; ’ )& " " 5)
)9+
$ & +
则参与者) 在网络中的总体延迟时间为
+ + ’ ) ’ 3 = ’ =
7)$ !&9
’9+
&9 :’$ < ’ " 5)
’9+
5 $ & !> " ; " 5! & "$
=9+
$ & !
每个参与者总是期望自身 7)$ 且各个 参与 者都是 自私的 ! 不考虑 其他 参与者 !&最小 ! !! 根据博弈论可知 ! 的期望和动机 因此上述博弈问题的 1 在其他参与者策略确定的情况下 ! 参与者) 期望延 2 3 4 均衡求解变为 ’ 迟时间最小 ! 即 = C D7)$ !& !>
! 陕 西 西 安 !& 上 海 !! +-西安电子科技大学 计算机学院 " + " " & +#!-同 济 大 学 软 件 学 院 " " " " # !# 上海 !! $ ’-交通银行上海总行 " " " " ’ ’ 摘要 ! 针对路由器路径选择中的资源分配不 均 衡 问 题 ! 提出了基于博弈论思想的解决方案将. / 0 #协 议中的任意博路由过程看作是多个非合作参与者间 的 博 弈 问 题 ! 给出了以单个参与者在各条链路上的 以该参与者的延迟时间为博弈效用的路由器路由博弈模型 ! 求解 了 保 证 该 博 弈 模 速率分配为博弈策略 " 型处于均衡状态时的 1 在此基础上 ! 提出了 保 证 多 个 参 与 者 公 平 使 用 网 络 链 路 的 均 衡 路 由 2 3 4 均衡解 算法 仿真实验表明 ! 该算法使得各个参与者在网络中延迟时间少 ! 且对各个参与者是 公 平 的 ! 解决了路 由器路径选择中资源的均衡性分配问题 关键词 ! 资源分配 # 非合作博弈 # 均衡路由 1 2 3 4 均衡 # 中图分类号 ! " # 5 / ’ % ’" ’!! 文献标识码 ! 6!! 文章编号 ! + " " + $ ! , " " ! " " & " ’ $ " ’ % 7 $ " ,
自然科学版 " ,卷 !!!!!!!!!!!!! !!!!! 西安电子科技大学学报 ! !!!!!!!!! !!!!! 第 ’ , " "
3
=9+! =% ) ? ) ? ) ) ’ )
$ ! ) + ’
"
则在该博弈模型中对于参与者) 的最优解为 5= ! => ) ’" " ;" "# 5 ’ 9& ) ( "! !
5 )
$ & ’
根据网络路由实际模型可知 ! 式$ & 受限条件是 ’ ’ %! 5 ’ 9 +! +! ! !! ! ’ #" )
3
$ & , $ & ( $ & #
=9+ +
" 5! "5
’ )
= ’ =
%! ’ 9 +! +! ! ! ’! ! $"
9 +! >
’9+
9! 算法设计
主要通过拉氏函数来求解式 $ & 的最小值问题 文中给出 了该 博弈均 衡解求 解算 法 ! 称为 1S ’ T * ) 算法 基于 1S 给出了完整网络路由均衡算法 1S 即基于非合作博弈的均衡路由算法 T * T *! ) 算法 !
) ’
$ ! ) + ’
" #! ! ! "# # " " ;! # " ""
) ’9+ ’9+ ? ) ? ) ) = )
$ ! ) + =
" # &
$ + ! ) # 其中? #的最小取值 ! " ( ? ) ) 是满足不等式 " " )