纳什均衡和帕累托最优的相关定理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
认知无线网络行为分析与网络效能研究
V1.0.0 (2011- 04-26)
973项目;
认知无线网络的全局性能优化;
纳什均衡及帕累托最优的相关定理;
1. 简介
本文档主要分两大部分:
第一部分,主要是纳什均衡的存在性与唯一性证明定理。 第二部分,帕累托最优的相关定理。
2. 纳什均衡
纳什均衡定义 行动组合12(,,...,)k s s s *=s 是纳什均衡,则对于任意参与者i K ∈,有:
(,)(,)
i i i i i i i i u s u s for all s S --''≥∈s *s *
简言之,就是给定其他参与者策略的情况下,每个参与者选择使自己效用最大化的策略。所有参与者的策略构成的组合即为纳什均衡。
2.1 存在性定理
定理2.1.1[1][2]:
(1)对所有的i K ∈,策略空间(1,2,...,)i S i K =是欧式空间中一个非空的、紧的凸集; (2)效用函数()i u s 是连续的且对i s 是拟凹的。 说明:
在数学中,欧几里得空间 n
R 的子集S 是紧的,如果它是闭合的并且是有界的。(注:若不是在欧式空间中,闭合且有界的集合不一定是紧集。)
如果一个集合所有的极限点都是这个集合中的点,那么这个集合是闭集。 S 是凸集是指,对满足01λ≤≤的λ,只要,x S y S ∈∈
,那么就有
(1)x y S λλ+-∈。简单而言,就是S 中的任何两点之间的直线段都属于S 。
图 2-1左图为凸集,右图为非凸集
定理2.1.2[3]:
如果一个博弈G 是S-模博弈(S-modular games ,SMG ),则至少存在一个纯纳什均衡。
定义1(S-模博弈S-modular games ,SMG ) 一个博弈G ,如果满足:
(1) i K ∀∈,i S 是欧式空间中的一个紧集; (2) i u 在s 上是上半连续;
(3) ,i i i K s s --'∀∈∀≥,()(,)i i i i u s u s s -'-是不减的。 则称G 为超模博弈。 说明:
上半连续:设 X 为拓扑空间, 0x X ∈,而:f X R →为实值函数。若对每个
0ε>都存在 x 0 的开邻域 U 使得0,()()x U f x f x ε∀∈<+,则称 f 在 x 0
上半连续。该条件也可以用上极限等价地表述:
0lim sup ()()x x f x f x →≤
图 2-2上半连续函数的例子(蓝点表0()f x )
图 2-3下半连续函数的例子(蓝点表0()f x )
进一步地,若任意,i i u 具有二阶导,对于所有的i K ∈,满足(1),则该博弈称为
超模博弈(Supermodular games )。
2
0,i i j
u i j K s s ∂≥∀≠∈∂∂ (1)
同理,满足(2)式,称为次模博弈(Submodular games )。
2
0,i i j
u i j K s s ∂≤∀≠∈∂∂ (2)
超模博弈和次模博弈统称为S-模博弈S-modular games (SMG )。
定理2.1.3[4]:
如果一个有有限个参与者的博弈是位势博弈(Potential games ,PGs ),且策略集合是紧的,效用函数是连续的,则至少存在一个纯纳什均衡。
定义2(严格位势博弈Exact Potential games ,EPGs )
如果存在一个函数:P A R →,满足i K ∀∈,有
(,)(,)(,)(,)
i i i i i i i i i i u a a u b a P a s P b a -----=-
如果{}k i u u ∈处处二次可微时,一个博弈是EPGs 的充分条件是
2
2
()(),,,j i i j
j i
u u i j K a a a a ∂∂=
∀∈∈∂∂∂∂a a a S
类似地,满足(,)(,)0(,)(,)0i i i i i i i i i i u a a u b a P a a P b a ----->⇔->,则定义为次序位势博弈Ordinal potential games 。
2.2 唯一性定理
定理2.2.1[4]:
对于一个PGs ,如果(1)策略组合S 是紧的、凸的;(2)P 是在S 上连续可微函数,且对S 是严格凹的,则纳什均衡唯一。
定理2.2.2[5]:
如果最佳响应函数是标准的,则存在唯一纳什均衡。 定义3(标准函数)
()r c 是标准函数,应满足: (1)正:()0r >c ;
(2)单调性:()()if then r r ''≥≥c c c c ;
(3)可扩展性:1,()()for all r r μμμ>>c c 。 定义4(最佳响应Best Response )
(){:(,)(,),}i i i i i i i i i i i B a a A u a a u a a a A ---''=∈≥∀∈
3. 帕累托最优
帕累托最优定义 一个策略组合12(,,...,)PO
k s s s =s 称为帕累托最优,如果不存在其他
策略组合's ,使得
,()()
,()()
P O
i i P O
i i for all i K u u for som e i K u u '∈≥'∈>s s
s s
也就是不可能在不损害任何人的前提下,使某一些人的效用得到提高。
一个重要结论:
对于每一个使得和效用最大(m ax ()i
i K
u ∈∑s )的策略组合s ,都是帕累托最优。
图 3-2 帕累托最优示意图
4. 参考文献
[1] C. U. Saraydar, N. B. Mandayam, and D. J. Goodman, “Efficient powe r control via pricing in wireless data networks,” IEEE Transactionson Communications, vol. 50, pp. 291–303, February 2002.
[2] D. Fudenberg and J. Tirole, Game Theory. Cambridge, MA: MIT Press, 1991.
[3] D. Topkis, “Equilibrium points in non -zero sum n-per son submodular games,” SIAM J.Control Optim., vol. 17, no. 6, pp. 773–787, 1979.
[4] G. Scutari, S. Barbarossa, and D. P. Palomar, “Potential games: A framework for vector power control problems with coupled constraints,” in Proc. IEEE Int. Conf. Acoustics , Speech and Signal Processing, Toulouse, France, May 2006, vol. 4, pp. 241–244.
[5] R. D. Yates, “A framework for uplink power control in cellular radio systems,” IEEE J. Select. Areas Commun., vol. 13, pp. 1341–1347, 1995.