博弈论概要

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

* 略纳什均衡。其中,对于所有 i N , i* 是 i 对 i 的最优反应。
混合 Nash 均衡的存在性:Nash 在 1950 年的指出,每一个有限策略博弈
G N , (Si ), (ui ) 都有混合战略纳什均衡。
Nash 给出的混合 Nash 均衡存在性定理奠定了在客观世界中 Nash 均衡具有
。如果满足 sgn ( P ( si , s-i ) - P ( si¢, s-i )) > sgn (ui ( si , s-i ) - ui ( si¢, s-i )) , potential game) 则该博弈叫做顺序潜博弈(ordinal potential game) 。 超模博弈(Supermodular game):Topkis 在 1998 年给出了存在唯一 Nash 均 衡的超模博弈模型: 策略博弈 G N , ( Si ), (ui ) 对于所有的 i N , 如果满足 Si 是 可行域上的紧子集;效用函数 ui 在 si 上满足上半连续且在 s-i 上连续;同时,效
i (1 ,..., i 1 , i 1 ,..., n ) 表示包括除第 i 个参与人以外各个参与人混合战略的
组合。在混合 Nash 博弈中,参与人 i 的期望效用为:
2012
U i ( ) j ( a j )ui ( a ) aA jN
ui : S R ,其中 S iN Si 。
我们通常把上述三要素构成的博弈模型表征为 G N , ( Si ), (ui ) 。 1 非合作博弈 在非合作博弈论中,Nash 均衡是最基本最核心的概念。分析一个多人博弈, 通常我们需要回答三个问题:第一,这个博弈最终的结局将会如何?Nash 均衡 将会是多人非合作博弈的结果, 也就说每个参与人考虑其它参与人的策略均采用 最佳策略。第二,这样的 Nash 均衡是否总是存在?Nash 证明 Nash 均衡的存在 具有普遍性。第三,存在的 Nash 均衡是否唯一?Nash 均衡的唯一性要根据具体 情况分析而定。然而,Nash 均衡只是给出了多人博弈的最终结果,并没有告诉 我们怎么才能达到 Nash 均衡。一般情况下,博弈中的每个参与人首先任意选择 其策略,随后通过某些准则更新各自的策略直到收敛到均衡状态。
2012
博弈论概要 邓潘亮编写 dengpanliangbupt@gmail.com 编者按:竞争与合作贯穿着人类社会生活的方方面面,博弈 论作为诠释这两种行为的理论,近年来在几乎所有门类的科 学研究探讨的重要方法论之一,本概要对应用博弈论研究科 学与工程问题所常用的定义、模型以及工具进行了总结,目 的为那些试图应用博弈论研究科学和工程问题的研究者提 供一个工具框架,本概要在最后部分还列举了博弈论应用于 认知无线电通信领域的关键文献。更为深入了解和学习请参 考博弈论专著(Fudenberg、Tirole 1991;Myerson 1991; ) 。
si ) > 0 , si Î ;效用函 满足 Si = {si Î hi ( si ) ³ 0} ,同时 hi 为凹函数且存在 hi (
ˆ) + ( s ˆ - s ) u ( s ) > 0 ,则该博弈存在唯一纯 Nash ˆ) u ( s 数 (u1 ,, un ) 满足 ( s - s
潜博弈(Potential game) :Monderer 与 Shapley 在 1996 年给出了具有唯一
Nash 均衡的潜博弈模型:策略博弈 G N , ( Si ), (ui ) ,对于所有的 i N ,满足
P ( si , s-i ) - P ( si¢, s-i ) = ui ( si , s-i ) - ui ( si¢, s-i ) ,则该博弈叫做精确潜博弈( exact
¶ 2ui ( si , Hale Waihona Puke Baidu-i ) ³ 0 ,则该博弈为超模博弈。 用函数 ui 在 ( si , s-i ) 上满足 ¶si ¶s-i
1.3 多 Nash 均衡及其选择 当 Nash 均衡存在多个博弈,我们不经要问如何选取这些均衡点。为了定义 在这种情形下的最优性,一个经典的概念是帕累托最优性(Pareto optimality) : 在不使任何参与人效用变坏的情况下,不可能找到一种策略使某些参与人的 效用变好,所达到的一种状态。 如果存在 u-i 不降低的条件下, 有 ui ui , 定义: 策略博弈 G N , ( Si ), (ui ) , 那么 ui 是原效用 ui 帕累托改进。 帕累托改进是指在具有多个 Nash 均衡条件下, 可以通过适当的改变策略, 至少能提高一部分参与人的效用而不会降低所有其他参与人的效用。 上述帕累托最优性是在假设参与人能够完全获取其它参与人策略, 每个参与人是 理性的以及他们具有合作的动机的前提下定义的。然而,如果现实中这些假设并 不完全存在,Nash 均衡仍然存在么?如果这时仍旧存在多个 Nash 均衡点,我们 该如何的选取?演化博弈能够很好的回答上述两个问题。在演化博弈中,如果具 有理性动机的参与人的效用均值大于整个种群的平均效用, 那么经过多次动态更
2012 1.1 Nash 均衡 在博弈论中,Nash 均衡是最为常见的解,其定义如下:
* 定义: 策略博弈 G N , ( Si ), (ui ) , 策略组合 s * = ( s1* , , sn ) 如果满足以下条 * * 件: ui ( si* , si ) ³ ui ( si , s-i ) , "si Î Si , i = 1, , n ,则为纳什均衡。
0 引言 博弈论是一种研究决策主体的行为发生直接相互作用时的决策以及这种决 策之间均衡问题的数学方法。它与信息论一样在 20 世纪 40 年代到 50 年代经历 了跨越式的发展,1944 年冯诺依曼(Von Neumann)和摩根斯坦恩(Morgenstern)发 表专著 《博弈论与经济行为》 提出大部分的经济问题都应当用博弈的模型来分析, 引出了通用博弈理论。随后,纳什在 1950 年和 1951 年发表的两篇非合作博弈的 论文和塔克(Tucker)在 1950 年定义了 “囚徒困境” 奠定了现代非合作博弈的基石。 六十年代博弈论又得到很大进展,泽尔腾(Selten 1965)把纳什均衡的概念引入到 动态分析研究, 提出 “精炼纳什均衡” 的概念, 奠定了完全信息动态博弈的基础。 针对纳什均衡概念的某些不完善的地方,排除纳什均衡点的缺陷,泽尔腾将那些 包含不可置信威胁战略的纳什均衡从均衡中剔除, 从而给出动态博弈结果的一个 合理的解。 另一个重要的工作是海萨尼(Harsanyi 1967-1968)对不完全信息博弈的 研究,建立了不完全信息博弈的基础工作。博弈论得到了系统阐述与澄清,形成 了完整而系统的体系。同时,在合作博弈方面,纳什(Nash 1950 年 )和夏普里 (Shapley1953 年)研究的“讨价还价”模型,将合作博弈研究推向顶峰。博弈论
2012 作为分析和解决冲突和合作的工具, 目前在生物学、 经济学、 国际关系、 政治学、 军事战略等学科都有广泛的应用。值得注意的是近年来,随着高可靠、大容量无 线通信的需求,各个无线传输链路之间存在资源共享以及相互影响等问题,怎样 协调传输链路之间的相互作用使得系统能够获得最佳总体性能, 博弈论在通信系 统设计中的应用是当前通信与信息领域学术界和工业界共同关注的热点。 博弈论作为分析不同行为主体相互作用的数学工具, 其主要包含以下三个基 本要素: 1. 参与人(Player) 在博弈模型中,能够有权决定自身行为的主体成为参与人 N {1,..., n} 。 在博弈论中,对于参与人有一个重要的前提假设:每个参与人都是“理 性的” ,也就是说,每个参与人都是以个人主体最大化为优化目标。 2. 策略集(Strategy sets) 博弈模型中,参与人所有可能选择的策略构成策略集 Si , i N 。 3. 效用函数(Utility) 在所有博弈参与人的策略 S 确定后,对于第 i 个参与人会产生效用函数
其 中 , 对 于 每 一 个 i 1, , n , si* 为 给 定 其 他 参 与 人 策 略
* * * * * si = ( s1 , , si-1 , si +1 , , sn ) 的情况下第 i 个参与人的最优策略。也就是说在 Nash
均衡的前提下,任何的参与人都不能单方面改变其策略来提高效用。换句话说, Nash 均衡是每个参与人的选取最佳策略的结果,如果
其中 j ( a j ) 为参与人 j 根据其混合策略 j 选择行动 a j 的概率, j ( a j ) 则
jN
为在混合策略组合 之下行动组合 s 的出现概率。 定义: 混合策略博弈 G N , (Si ), (ui ) ,混合策略组合 * 如果满足以下条
* * 件:对于所有 i N ,所有 i ( Si ) ,有 U i ( i* , i ) U i ( i , i ) 则为 G 的混合战
Bi s i si Si : ui ( si , s i ) ui ( si, s i ), si Si 满足标准函数,则该非合作博弈模
T
T
型 Nash 均衡具有唯一性。其中,标准函数满足如下性质:
2012 1. 正值性: I ( B) > 0 2. 单调性:如果 B > B ¢ , 则 I ( B) > I ( B¢) 3. 伸缩性:对于所有的 a > 1 ,有 a I ( B) > I (a B)
均衡。 当前,还有三类特殊的情形能够确保 Nash 均衡具有唯一性: 标准函数不动点:Yates 在 1995 年给出了一种标准函数,这种标准函数能够 证明通过迭代更新收敛到唯一的不动点。可以将该方法扩展到验证是否 Nash 均 衡 具 有 唯 一 性 : 如 果 参 与 人 的 最 优 反 应 函 数
普遍存在性。 1.2 Nash 均衡的唯一性 在 Nash 均衡研究中, 均衡点的唯一性是另外一个重点关注的特性。 如果 Nash 博弈只存在一个均衡点, 我们能够准确的预见到各个用户的均衡策略以及最终博 弈的结果。然而,与存在性定理不同的是均衡点的唯一性只是在某些特殊情况下 出现。对于一般情况,Wilson 在 1971 年给出几乎所有有限博弈都有有限奇数个 纳什均衡(包括混合策略均衡) 。Rosen 在 1965 年给出了 N 个参与人凹博弈解存 在且唯一的条件:策略博弈 G N , ( Si ), (ui ) ,对于所有的 i N ,假设策略集
R ni 上的非空紧凸子集; ui 是 S 上的连续函数且为 Si 上的拟凹函数, i 1, , n ,
则博弈 G 存在纳什均衡。 Nash 均衡存在性定理为应用博弈论解决实际问题的学者们在考察博弈模型 提供了一种先验导引。不需要求解一个博弈的 Nash 均衡,只要满足上述条件, 我们就能提前知道 Nash 均衡是否存在。 在上述所有的定义中,所有参与人都采用确定策略,基于确定策略的 Nash 均衡通常叫纯 Nash 均衡。然而,这种纯 Nash 均衡并不普遍存在,混合 Nash 博 弈的引入解决了 Nash 均衡的适普性问题。在混合 Nash 博弈中,参与人为了避 免自己的策略被其他参与人知道, 同时预计其他参与人的策略来最终决定自身的 最优策略。混合策略博弈 G N , Si , ui ,其中, i ( Si ) 为参与人的一个 混 合 策 略 , (1 ,..., n ) j S j 表 示 一 个 混 合 策 略 组 合 ,
* si* arg max si Si ui (si , s i ) , i 1, , n
s* 则是一个纳什均衡。
在定义了 Nash 均衡之后,我们很自然的关心,Nash 均衡的存在性。基于不动点 理论,有许多不同形式的纳什均衡存在性定理,本书将仅介绍其中最为常见的一 个,如下所示: Nash 均衡存在性定理: 策略博弈 G N , ( Si ), (ui ) 。 若对于所有 i N , Si 是
相关文档
最新文档