纳什均衡和帕累托最优的相关定理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

认知无线网络行为分析与网络效能研究

V1.0.0 (2011- 04-26)

973项目;

认知无线网络的全局性能优化;

纳什均衡及帕累托最优的相关定理;

1. 简介

本文档主要分两大部分:

第一部分,主要是纳什均衡的存在性与唯一性证明定理。 第二部分,帕累托最优的相关定理。

2. 纳什均衡

纳什均衡定义 行动组合12(,,...,)k s s s *=s 是纳什均衡,则对于任意参与者i K ∈,有:

(,)(,)

i i i i i i i i u s u s for all s S --''≥∈s *s *

简言之,就是给定其他参与者策略的情况下,每个参与者选择使自己效用最大化的策略。所有参与者的策略构成的组合即为纳什均衡。

2.1 存在性定理

定理2.1.1[1][2]:

(1)对所有的i K ∈,策略空间(1,2,...,)i S i K =是欧式空间中一个非空的、紧的凸集; (2)效用函数()i u s 是连续的且对i s 是拟凹的。 说明:

在数学中,欧几里得空间 n

R 的子集S 是紧的,如果它是闭合的并且是有界的。(注:若不是在欧式空间中,闭合且有界的集合不一定是紧集。)

如果一个集合所有的极限点都是这个集合中的点,那么这个集合是闭集。 S 是凸集是指,对满足01λ≤≤的λ,只要,x S y S ∈∈

,那么就有

(1)x y S λλ+-∈。简单而言,就是S 中的任何两点之间的直线段都属于S 。

图 2-1左图为凸集,右图为非凸集

定理2.1.2[3]:

如果一个博弈G 是S-模博弈(S-modular games ,SMG ),则至少存在一个纯纳什均衡。

定义1(S-模博弈S-modular games ,SMG ) 一个博弈G ,如果满足:

(1) i K ∀∈,i S 是欧式空间中的一个紧集; (2) i u 在s 上是上半连续;

(3) ,i i i K s s --'∀∈∀≥,()(,)i i i i u s u s s -'-是不减的。 则称G 为超模博弈。 说明:

上半连续:设 X 为拓扑空间, 0x X ∈,而:f X R →为实值函数。若对每个

0ε>都存在 x 0 的开邻域 U 使得0,()()x U f x f x ε∀∈<+,则称 f 在 x 0

上半连续。该条件也可以用上极限等价地表述:

0lim sup ()()x x f x f x →≤

图 2-2上半连续函数的例子(蓝点表0()f x )

图 2-3下半连续函数的例子(蓝点表0()f x )

进一步地,若任意,i i u 具有二阶导,对于所有的i K ∈,满足(1),则该博弈称为

超模博弈(Supermodular games )。

2

0,i i j

u i j K s s ∂≥∀≠∈∂∂ (1)

同理,满足(2)式,称为次模博弈(Submodular games )。

2

0,i i j

u i j K s s ∂≤∀≠∈∂∂ (2)

超模博弈和次模博弈统称为S-模博弈S-modular games (SMG )。

定理2.1.3[4]:

如果一个有有限个参与者的博弈是位势博弈(Potential games ,PGs ),且策略集合是紧的,效用函数是连续的,则至少存在一个纯纳什均衡。

定义2(严格位势博弈Exact Potential games ,EPGs )

如果存在一个函数:P A R →,满足i K ∀∈,有

(,)(,)(,)(,)

i i i i i i i i i i u a a u b a P a s P b a -----=-

如果{}k i u u ∈处处二次可微时,一个博弈是EPGs 的充分条件是

2

2

()(),,,j i i j

j i

u u i j K a a a a ∂∂=

∀∈∈∂∂∂∂a a a S

类似地,满足(,)(,)0(,)(,)0i i i i i i i i i i u a a u b a P a a P b a ----->⇔->,则定义为次序位势博弈Ordinal potential games 。

2.2 唯一性定理

定理2.2.1[4]:

对于一个PGs ,如果(1)策略组合S 是紧的、凸的;(2)P 是在S 上连续可微函数,且对S 是严格凹的,则纳什均衡唯一。

定理2.2.2[5]:

如果最佳响应函数是标准的,则存在唯一纳什均衡。 定义3(标准函数)

()r c 是标准函数,应满足: (1)正:()0r >c ;

(2)单调性:()()if then r r ''≥≥c c c c ;

(3)可扩展性:1,()()for all r r μμμ>>c c 。 定义4(最佳响应Best Response )

(){:(,)(,),}i i i i i i i i i i i B a a A u a a u a a a A ---''=∈≥∀∈

3. 帕累托最优

帕累托最优定义 一个策略组合12(,,...,)PO

k s s s =s 称为帕累托最优,如果不存在其他

策略组合's ,使得

,()()

,()()

P O

i i P O

i i for all i K u u for som e i K u u '∈≥'∈>s s

s s

也就是不可能在不损害任何人的前提下,使某一些人的效用得到提高。

一个重要结论:

对于每一个使得和效用最大(m ax ()i

i K

u ∈∑s )的策略组合s ,都是帕累托最优。

图 3-2 帕累托最优示意图

4. 参考文献

[1] C. U. Saraydar, N. B. Mandayam, and D. J. Goodman, “Efficient powe r control via pricing in wireless data networks,” IEEE Transactionson Communications, vol. 50, pp. 291–303, February 2002.

[2] D. Fudenberg and J. Tirole, Game Theory. Cambridge, MA: MIT Press, 1991.

[3] D. Topkis, “Equilibrium points in non -zero sum n-per son submodular games,” SIAM J.Control Optim., vol. 17, no. 6, pp. 773–787, 1979.

[4] G. Scutari, S. Barbarossa, and D. P. Palomar, “Potential games: A framework for vector power control problems with coupled constraints,” in Proc. IEEE Int. Conf. Acoustics , Speech and Signal Processing, Toulouse, France, May 2006, vol. 4, pp. 241–244.

[5] R. D. Yates, “A framework for uplink power control in cellular radio systems,” IEEE J. Select. Areas Commun., vol. 13, pp. 1341–1347, 1995.

相关文档
最新文档