进化博弈论读书心得

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

进化博弈论读书报告
汪波
1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS ),随着1978年, Taylor 和Jonker 发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。

1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull 著作了《Evolutionary Game Theory 》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics 》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。

一、进化稳定策略最初的模型
进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。

在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。

它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。

最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。

生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。

故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略I 、J ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为0w ,再假设整个群体中选择I 的概率为p ,()w I 、()w J 分别表示选择相应策略带来的适应度,而(,)E I J 表示个体选择策略I 而对手选择J 时的收益,其他(,)E I I 等表示类同的意义。

若每一个个体都参与到竞争当中,则有
0()=+(1-p)(,)(,)w I w E I I pE I J +(1-1)
0()=+(1-p)(,)(,)w J w E J I pE J J +(1-2)
稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的 适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变 异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。

若 I 是进化稳定策略,则()()w I w J >,且1p
,所以当I J ≠,有 (,)(,)E I I E J I >(1-3)
当(,)(,)E I I E J I =时有(,)(,)E I J E J J >(1-4)
满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别ESS 的标准条件。

上述的策略是在纯策略情形下考虑的,当策略I 是从一个可能策略集合中随机的选择而
构成的,此时的策略称为混合策略。

此时I 若是一个混合进化稳定策略,假设12,,......,k s s s 等是该群体的纯策略,赋予这些纯策略非零的概率值,那么I 必须满足如下条件:
12()().....()(,)k E s E s E s E I I ==== (1-5)
保证所有纯策略的回报是相等的,群体中的个体才不会选择偏离的策略。

此时起满足的条件和上述是相同的形式。

二、对称博弈
1.对称博弈的定义
两人对称博弈对于许多进化博弈论内容而言是基础的,而且,许多进化博弈论中的深刻见解都可以从二人对称博弈这种特殊情形中得到,这也是单独列出对称博弈内容的主要原因。

一个二人对称博弈(,,)G I S u =,可假设有两个玩家的位置,每个位置上有相同的纯策略,而任意的策略的支付则依赖于玩家所选的位置,因此有如下的定义:
博弈(,,)G I S u =称为二人对称博弈,如果{1,2}I =,12{1,2,......,}S S S n ===且对于任意的12(,)s s S ∈有112221(,)(,)u s s u s s =成立。

该对称博弈要求两个位置上的支付矩阵是互为转置的,即若A 为第一人的支付矩阵,B 为第二个人的支付矩阵,则T
B A =,即 111212122212.....................n n n n nn a a a a a a A a a a ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦则112121222112.....................n n T n n nn a a a a a a B A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦
也即有若,ij ji a A b B ∈∈,则ij ji a b =。

例如:囚徒困境情形就是一个非常好的对称博弈的例子。

上述是在纯策略下的情形,现在描述混合策略情形:12{1,2,......,}S S S n ===,用1(,,.....,)n n x x x 表示策略集上的一个概率分布,即为该博弈的一个混合策略,用∆表示其混合策略集,则混合策略组合空间为2
∆⨯∆=∆,此时任意的纯策略i S ∈在对手选择混合策
略x ∈∆时的支付为(,)()i i i u e x e Ax Ax =⋅=。

2.对称博弈的特点
对称博弈是一种很特殊情形,它有自己的特征,一是对称博弈的最优回应对应*
β和通常的最优回应对应β不一样,通常的β是策略组合空间到策略组合空间之间的映射,而*β是策略集到策略集之间的映射,即 *(){:(,)(,),}y x u x y u z y z β=∈∆≥∀∈∆ (1-6)
这是对称博弈策略集相同所决定的。

二是对称博弈有更特殊的形式:双对称博弈。

此时在其他条件满足下当且仅当B A =时称为双对称博弈。

例如:协调博弈就是一个很好的双对称博弈的例子。

三是对称博弈的纳什均衡的形式也有所不同,对称博弈具有不对称的纳什均衡,也具有
对称的纳什均衡。

策略组合2
(,)x y ∈∆被称为对称博弈的纳什均衡,当且仅当
**(),()x y y x ββ∈∈,其中*:β∆→∆,这与通常的纳什均衡的定义是一致的,用NE Θ表示纳什均衡集合。

当x y =时我们称该纳什均衡为对称的,此时纳什均衡可以表示为
{:(,)}NE NE x x x ∆=∈∆∈Θ (1-7)
对称的情形下,它本质是一个策略空间,不同于往常的策略组合空间,当然,对称博弈的纳什均衡并非都要求是对称的,但也可以证明任意的对称博弈一定能够存在至少一个对称的纳什均衡,即对于任意的二人有限对称博弈,NE ∆≠∅。

例如:鹰-鸽博弈、石头-剪刀-布等博弈都是具有混合策略均衡的且是对称的。

以鹰鸽博弈为例:不是一般地,下面支付矩阵为一方甲的支付矩阵:
()20
2v c v A v -⎡⎤=⎢⎥⎣⎦T B A = 其中v 表示一定价值的资源适应度,在此表示获得的支付,双方甲、乙都选择鹰策略则各自获得()2v c -,c 表示双方争斗产生的适应度的下降或者说是损失,若甲选择鹰策略乙选择鸽策略,则甲获得全部资源v 而乙获得0,若都选鸽策略则平分资源。

当v c >时,则鹰策略是纳什均衡,因为此时双方都宁愿冒着受伤的风险获得大于零的资源适应度,而当v c <时,则存在对称的混合纳什均衡,假设此混合策略组合为(,1)x p p =-,则要满足 ()2(1)2(1)p v c v p v p ⋅-+-=⋅- 解得p v c =,则知(,1)NE x v c v c =-∈∆,故(,)NE x x ∈Θ。

四是二人对称博弈的分类,根据支付我们可以将对称博弈分为四类.以
11122122a a A a a ⎡⎤=⎢⎥⎣⎦
为例。

将第一列减去21a ,第二列减去12a 变形得
1121'221200a a A a a -⎡⎤=⎢⎥-⎣⎦
再令1112122212,a a a a a a =-=-得正规化形式
1'
200a A a ⎡⎤=⎢⎥⎣⎦ 构造如下所示的图:2a
III
1a
IIIIV
用2
12(,)a a a R =∈表示该图中平面上的点,若当点在图中的北西象限时,我们说此时的对称博弈是第I 类的,当若当点在图中的北东象限时,我们说此时的对称博弈是第II 类的,
当若当点在图中的南西象限时,我们说此时的对称博弈是第III 类的,当若当点在图中的南东象限时,我们说此时的对称博弈是第IV 类的。

很容易发现,当博弈是第I 类或者是第IV 类的时候,分别有21a a >和21a a <,两个的支付一正一负,此时博弈都存在严格占优的策略,故都存在纯策略纳什均衡。

第I 类的解为{2,2}S ⊂,纳什均衡集合为22{(,)}NE
e e Θ=和2{}NE e ∆=。

第IV 类的解为{1,1}S ⊂,纳什均衡集合为11{(,)}NE e e Θ
=和1{}NE e ∆=。

当博弈是第II 类或者第III 类时,支付函数值同号,此时不仅仅存在对称的纯策略的纳
什均衡,也存在对称的混合策略纳什均衡。

第II 类博弈,二者支付都为正数。

有两个对称的严格占优的纳什均衡,还有一个对称的混合策略纳什均衡,故它的解为{1,2}S ⊂,纳什均衡集合为
1122**{(,),(,),(,)}NE e e e e x x Θ=,12*{,,}NE e e x ∆=。

其中*221121((),())x a a a a a a =++。

这一类博弈常见的例子如调和博弈。

第IV 类博弈,二者的支付都为负数,没有严格占优的策略。

它的解为{1,2}S ⊂,纳什均衡集合为
1221**{(,),(,),(,)}NE e e e e x x Θ=,*{}NE x ∆=。

其中*221121((),())x a a a a a a =++。

这一类常见的博弈如鹰鸽博弈(v c <的情形)。

三、对称博弈下看进化稳定策略
1.进化稳定策略的定义
结论仍然集中二人对称博弈上,{1,2}I =,纯策略集为{1,2,.....,}K k =,混合策略
集为{:1}k i i K x R x +∈∆=∈=∑,当1选择x ∈∆而2选择y ∈∆时,参与者1的支付矩阵为
A ,则此时支付函数为(,)u x y x Ay =⋅。

在对称博弈的下,进化稳定策略有两种等价的定义。

由于对称博弈可以很好的解释单群体博弈,所以此时是在单群体情形下来讨论,假设有一个数量规模很大的群体,里面出现一组规模很小的突变者,他们选择的策略集是相同的且成对竞争,群体主体现在的策略为x ,这组小规模的突变者选择策略y ∈∆,并假设这组小规模突变族所占群体的份额为ε∈(0,1)。

同时假设群体里每个代理人都参与竞争,每个代理人选择现任策略x 的概率为-ε1,选择突变策略y ∈∆的概率为ε,在此时的生物群体下的支付可以看作与其中一个代理人选择策略(-)w y x εε=+∈∆1时竞争产生的支付。

那么相应的,代理人选择现任策略x 的支付函数值为(,)=u(x,(-))u x w y x εε+1,同理有(,)=u(y,(-))u y w y x εε+1。

在这样的生物情形下,直觉告诉我们,群体要能抵抗外来的入侵或者应对突变者的袭击,那么现任策略x 所能得到的支付必须高于入侵者或者突变者的策略y 的支付。

因此,进化稳定策略除了本文第一部分的定义形式外,有另外一种等价的定义形式:
若策略x ∈∆是进化稳定策略(ESS ),如果存在实数()01ε∈,,使得对于所有的()0εε∈,,都满足下面的不等式条件:
(,)=u[x,(-)]>(,)=u[y,(-)],u x w y x u y w y x y x εεεε++∀≠11 (3-1)
其中(,)T
u x w x Aw =。

策略x ∈∆在任意的策略y ∈∆下的最优回应集合为*()y β。

此时若x 是该博弈的进化
稳定策略,则它必须满足*()x y β∈,即x 必须是该博弈的纳什均衡即NE x ∈∆,但还需要满足另外的条件才能保证x 是进化稳定的策略,由此可知,若用ESS ∆
表示博弈的进化稳定策略集合,那么有ESS NE ∆⊂∆,
由进化稳定策略的含义可以更详细的表示ESS ∆的形式如下: *{:(,)(,)()y }ESS NE x u x y u y y y x x β∆=∈∆>∀∈≠, (3-2)
由此我们又回到了进化稳定策略的第一种定义的形式:
称x 是该博弈的进化稳定策略,若满足如下两个条件:
(,)(,),u x x u x y y ≥∀ (3-3)
当存在y 满足(,)(,)u x x u x y =时有(,)(,),u x y u y y y x >∀≠。

( 3-4)
这两个条件就如我们一开始所说的是判断一个策略是不是进化稳定策略的标准。

2.两种等价定义的作用
将上述(3-1)式在定义计数函数::[0,1]f R ⨯∆→下可写为(,)f y ε,且其等于
(,)(,(1))f y u x y y x εεε=-+-
由x 是进化稳定的可知当ε足够小且y x ≠时,(,)0f y ε>,由于函数u 是双线性的, (,)f y ε可写为:(,)(,)(,)f y u x y x u x y y x εε=-+--
当,x y ∈∆固定时,计数函数(,)f y ε是一个关于ε的仿射函数,它的截距为(,)u x y x -斜率为(,)u x y y x --,如下图所示:
(f
(u
条件(3-3)等价于截距是非负的,而条件(3-4)则等价于当截距为零时斜率是正值。

因此当两个条件都满足时,则存在()01ε∈,使得对于所有的()0εε∈,
都有(,)0f y ε>成立,因此ESS x ∈∆。

对于进化稳定策略说明两个地方:一是并非所有的
博弈都有进化稳定策略,有部分博弈是没有进化稳定策略的,例如石头--剪刀--布博弈就不具有进化稳定策略,不然随着时间的推移,就没有玩的意义了,因为玩家知道那个策略是对自己最好的。

二是进化稳定性并不意味着群体平均支付是最优的。

3.进化稳定策略集ESS ∆的结构
从3-1、3-3可知,一个进化稳定策略的支撑不可能包含另外一个进化稳定策略的支撑,更进一步说不可能包含对称的纳什均衡策略的支撑。

例如:假设ESS x ∈∆,存在
()(),C y C x y x ⊂≠,那么(,)(,)u x x u x y =,因为NE x ∈∆,所以(,)(,)u x y u y y >,
所以NE y ∉∆
,与()(),C y C x y x ⊂≠矛盾。

因此有如下推论: 若ESS x ∈∆且()(),C y C x y x ⊂≠,那么NE y ∉∆。

另外,如果博弈的一个进化稳定策略是本质的(即完全混合策略),那么它是该博弈的唯一的进化稳定策略,而且在有限博弈中,支集是有限的,所以进化稳定策略也总是有限的,甚至可能为零。

因此有下面的引理:
集合ESS ∆⊂∆是有限的,且如果int()ESS x ∈∆⋂∆,那么{}ESS x ∆=。

4.ESS 与非合作博弈中的NE 、PE 等之间的关系
(1)从进化稳定策略的定义可以知道一个博弈的进化稳定策略必定是该博弈的纳什均衡,反之则不然,即ESS NE ∆⊂∆。

(2)劣策略肯定不会是进化稳定的,因为它本身不可能成为纳什均衡,弱劣策略也不会是进化稳定策略,就算它是纳什均衡集合中的元素,也不可能成为进化稳定的。

例如若NE x ∈∆且为弱劣策略,则存在y ∈∆,使得(,)(,)u x y u y y ≤,与进化稳定策略的标准中的第二个矛盾,故若x 是弱劣策略,则ESS x ∉∆。

(3)由上可知,若ESS x ∈∆,则策略组合(,)x x 是该博弈的纳什均衡,即(,)NE x x ∈Θ,且是占优的纳什均衡,因此(,)x x 是对纳什均衡的一种精炼,它是完美的纳什均衡即有如下的结论:若ESS x ∈∆,则(,)PE x x ∈Θ。

由此,可以知道:PE NE Θ
⊂Θ。

(4)若ESS x ∈∆
,那么(,)PE x x ∈Θ是一个真平衡。

5.ESS 的特征 (1)进化稳定策略的第一个特征便是“稳定”,它能保证该群体在遭遇其他物种入侵或者群体内发生突变个体时维持群体的稳定,从支付角度看就是进化稳定策略所能获得的支付优于其他的策略,从3-1可明显看出。

(2)ESS 的第二个特征是它存在统一的入侵屏障。

即存在一个入侵屏障()01ε∈,使得对于任意的()0εε∈,有3-1成立。

(3)ESS 的第三个特征是它是局部占优的,且如果该进化稳定策略是本质的(完全混合策略),那么它还是全局占优的。

6、条件削弱下的进化稳定的标准
(1)中度稳定策略
x ∈∆称为一个中度稳定策略(NSS ),如果对于任意一个y ∈∆,存在()01ε∈,使得对于任意的()0εε∈,都有下式成立:
(,)=u[x,(-)](,)=u[y,(-)],u x w y x u y w y x y x εεεε+≥+∀≠11
它与进化稳定策略相差仅在于前者只能是严格大于而后者可以取到等号成立。

所以有第二种等价的方式定义,也是最初梅拉德·史密斯给出的定义形式.,只需将进化稳定策略中的第二个条件弱化即可,(,)(,),u x y u y y y x ≥∀≠。

综上,进化稳定策略和中度稳定策略都是博弈的纳什均衡的一种精炼,在群体博弈下也可以看成是对群体博弈纳什均衡的一种选择。

相关文档
最新文档