博弈论在频谱共享中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论在频谱共享中的应用

胡玉佩,曾令康

北京邮电大学电子信息工程学院,北京 (100876)

E-mail: hypfly73@

摘要:博弈论(Game Theory)是专门用于研究若干个体之间竞争有限资源的数学理论。博弈论已被成功用于研究无线网络资源分配最优化和提高效率的问题。本文首先简单介绍了博弈论的基本概念;然后按照不同的分类准则,考虑无线网络资源分配的实际情况,描述了两种常用的博弈论类型:非合作型博弈论和合作型博弈论,并对这两种博弈论在无线网络资源分配中的应用列举了若干实例。

关键词:博弈论;非合作型博弈论;合作型博弈论;纳什均衡;帕累托最优

1.引言

在目前的无线网络系统中,为了避免或是减轻不同无线技术之间的干扰,广泛采用固定的频谱分配政策,即由国家政府机关进行频谱分配,将一部分频谱分别划分给指定的机构进行特定的服务,如无线电视、蜂窝系统、WLAN等,被指定分配的频谱称为授权频谱(licensed band),未被指定分配的频谱称为未授权频谱(unlicensed band),由国家机关授权使用某授权频谱的机构则被称为该授权频谱的授权用户(licensed user),反之则被称为未授权用户(unlicensed user)。大多数情况下,在无线网络中出现的科技创新都是基于未授权频谱的。近年来,随着无线技术的快速发展,新业务层出不穷,使原本就已非常有限的未授权频谱变得越来越拥挤,加剧了频谱资源有限性引起的频谱资源匮乏问题。

但是,频谱的匮乏是相对的,而不是绝对的,这种匮乏是由当前频谱资源管理上存在着的供新业务使用的频谱匮乏和已授权频谱使用效率不高这两个问题共同引起的。从美国联邦通信管理委员会(Federal Communications Commission)提供的测量数据来看,授权频谱远远没有得到充分的利用,其利用率随着时间的变化和地理环境的不同,一般在15%~85%之间[1]。因此FCC考虑用实时动态的方法代替已有的固定分配方法进行频谱分配,以解决上述资源匮乏问题。按照实时动态分配频谱的思想,FCC提出一项新的政策[2],将认知无线电(Cognitive Radio)技术应用于无线网络系统中。在此类系统中,授权用户划出部分或是全部授权频谱资源,按照一定的准则,使认知用户即未授权用户可以使用该频谱。为了保证授权用户的绝对传输质量,未授权用户的发射功率和工作频谱都要受到严格限制,因此需要未授权用户合理有效地分配资源,提高系统效益。在现有的知识体系中,博弈论是专门用于研究多个利益共同体之间竞争有限资源的数学工具,并且近年来理论体系不断完善,日趋成熟。实际上,博弈论已经在不同领域得到了广泛的利用,如经济学,政治学,生物学等[3]。同样,博弈论在无线网络中的应用已经引起了越来越多的重视,并且对于无线系统的分析起到巨大的推进作用。为了紧跟技术前沿,本文将对博弈论在资源分配中的应用进行简单的介绍。

2.博弈论

博弈论(Game Theory),有时也称为对策论,或者赛局理论,是应用数学的一个分支, 目前在生物学,经济学,国际关系,计算机科学, 政治学,军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化的激励结构(游戏或者博弈)间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,同时它也是运筹学的一个重要学科[3]。

在实际生活中,博弈论经常被用作分析两个及两个以上决策者之间相互作用。一次完整

的博弈包括三个部分[4]:局中人,在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人;策略,一局博弈中,每个局中人都有选择实际可行的完整的行动方案,此方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略;得失,一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为效益函数。

一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

2.1 非合作型博弈论(Non-cooperative game theory)

在非合作型博弈论中,每个局中人与其他局中人之间没有共同协议的束缚,根据自己的当前状况,独立采取自己的最优策略而不经过协商,但是每个局中人的策略又会影响其他局中人的策略的选择。在非合作型博弈论下得出的结果或者可以称之为均衡点,即纳什均衡(Nash Equilibrium) [4],其物理含义是所有局中人采用的策略的集合,且是任何局中人都不想背离的策略集合。系统达到纳什均衡时,任何局中人都无法在其他局中人的策略不变的情况下提高自己的效益,也就是说在纳什均衡状态下,每个局中人所选策略是最优的。纳什均衡是一种稳定的状态,在这种状态下,任何局中人都没有改变自己策略的要求。

为说明非合作型博弈论的特点,特以著名的囚徒困境为例[3]。此例中,两个共同犯罪的囚徒就是两个局中人,他们被安置在两个独立的房间中且需要做出选择,认罪或是否认。每个囚徒都被提前告知惩罚措施:如果两个人都认罪,那么每个人将会分别被判刑入狱两年;如果都否认,两个人都将会被判刑入狱一年;如果一个认罪,一个否认,那么认罪的人将会得到释放,而否认的人将受到严厉的惩罚,被判入狱四年。此问题可总结为图1所示。

认罪否认

认罪 -1,-1 0,-2

否认 -2,0 -2,-2

图1 囚徒困境

由于两个罪犯是被分别放置于两个独立的房间,没有办法互相商量对策,只能从自己的利益出发,那么对于两个罪犯来说最有益于自身的策略是认罪,两个人都认罪的结果就是此次博弈的唯一的纳什均衡解。但是显然这并不是此次博弈的最优解,因为两个人都否认时二人所获得的利益才最大。由此可以看出在非合作型博弈论模式下,纳什均衡解并不一定是最优解,即不是帕累托最优解(Pareto Optimality)[4]。帕累托最优是资源分配的一种理想状态,是指在没有使任何人境况变坏的前提下,任何一个人都没有办法取得更大效益的状态。而帕累托改进是指一种变化,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。一方面,帕累托最优是指没有进行帕累托改进的余地的状态;另一方面,帕累托改进是达到帕累托最优的路径和方法。

非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是没有

相关文档
最新文档