进化博弈论读书心得
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
进化博弈论读书报告
汪波
1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS ),随着1978年, Taylor 和Jonker 发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull 著作了《Evolutionary Game Theory 》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics 》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。
一、进化稳定策略最初的模型
进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。
最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略I 、J ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为0w ,再假设整个群体中选择I 的概率为p ,()w I 、()w J 分别表示选择相应策略带来的适应度,而(,)E I J 表示个体选择策略I 而对手选择J 时的收益,其他(,)E I I 等表示类同的意义。
若每一个个体都参与到竞争当中,则有
0()=+(1-p)(,)(,)w I w E I I pE I J + (1-1) 0()=+(1-p)(,)(,)w J w E J I pE J J + (1-2)
稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的 适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变 异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。若 I 是进化稳定策略,则()()w I w J >,且1p =,所以当I J ≠,有
(,)(,)E I I E J I > (1-3)
当(,)(,)E I I E J I =时有 (,)(,)E I J E J J > (1-4)
满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别ESS 的标准条件。
上述的策略是在纯策略情形下考虑的,当策略I 是从一个可能策略集合中随机的选择而
构成的,此时的策略称为混合策略。此时I 若是一个混合进化稳定策略,假设12,,......,k s s s 等是该群体的纯策略,赋予这些纯策略非零的概率值,那么I 必须满足如下条件:
12()().....()(,)k E s E s E s E I I ==== (1-5)
保证所有纯策略的回报是相等的,群体中的个体才不会选择偏离的策略。此时起满足的条件和上述是相同的形式。
二、对称博弈
1.对称博弈的定义
两人对称博弈对于许多进化博弈论内容而言是基础的,而且,许多进化博弈论中的深刻见解都可以从二人对称博弈这种特殊情形中得到,这也是单独列出对称博弈内容的主要原因。 一个二人对称博弈(,,)G I S u =,可假设有两个玩家的位置,每个位置上有相同的纯策略,而任意的策略的支付则依赖于玩家所选的位置,因此有如下的定义:
博弈(,,)G I S u =称为二人对称博弈,如果{1,2}I =,12{1,2,......,}S S S n ===且对于任意的12(,)s s S ∈有112221(,)(,)u s s u s s =成立。
该对称博弈要求两个位置上的支付矩阵是互为转置的,即若A 为第一人的支付矩阵,B 为第二个人的支付矩阵,则T
B A =,即 111212122212.....................n n n n nn a a a a a a A a a a ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦ 则112121222112.....................n n T n n nn a a a a a a B A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦
也即有若,ij ji a A b B ∈∈,则ij ji a b =。
例如:囚徒困境情形就是一个非常好的对称博弈的例子。
上述是在纯策略下的情形,现在描述混合策略情形:12{1,2,......,}S S S n ===,用1(,,.....,)n n x x x 表示策略集上的一个概率分布,即为该博弈的一个混合策略,用∆表示其混合策略集,则混合策略组合空间为2
∆⨯∆=∆,此时任意的纯策略i S ∈在对手选择混合策
略x ∈∆时的支付为(,)()i i i u e x e Ax Ax =⋅=。 2.对称博弈的特点
对称博弈是一种很特殊情形,它有自己的特征,一是对称博弈的最优回应对应*
β和通常的最优回应对应β%不一样,通常的β%是策略组合空间到策略组合空间之间的映射,而*
β
是策略集到策略集之间的映射,即
*(){:(,)(,),}y x u x y u z y z β=∈∆≥∀∈∆ (1-6) 这是对称博弈策略集相同所决定的。二是对称博弈有更特殊的形式:双对称博弈。此时在其他条件满足下当且仅当B A =时称为双对称博弈。
例如:协调博弈就是一个很好的双对称博弈的例子。
三是对称博弈的纳什均衡的形式也有所不同,对称博弈具有不对称的纳什均衡,也具有对称的纳什均衡。策略组合2
(,)x y ∈∆被称为对称博弈的纳什均衡,当且仅当