进化稳定策略及其应用
进化稳定策略及其应用
协调博弈
设某一同质种群的成员任意配对。在这博弈中, (L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。 (S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使 它为ESS必须使E(S*, S)>E(S,S)成立(S*≠S)
在此博弈中参与人选择同一行动要好于选择不同行动,
Maynard Smith & Price(1973)最初的目的是希望理解动物个体之 间的争斗为什么总是一场“有限的战争”,很少造成严重的伤害。 例如,许多蛇类的雄性个体相互之间扭缠打斗时从不使用它们的毒 牙。在Maynard Smith & Price研究这个问题之前,人们通常给出的 解释是,否则许多个体将受到严重伤害,最终对物种生存不利。但 是Maynard Smith & Price不满意这种群体选择的观点,并从个体选 择的角度运用对策论提出了他们自己的生物学解释。他们的分析是 以动物争斗为例进行的。
以上两动态系统有5个平衡点(0,1),(1,0),(0,0),(1,1),
(12p)1 (4q) 4p(1p)
(1/4,1/4).
4q(1q)
(12q)1 (4p)
q q ( 1 q )1 (4 q )
以上已经证明混合策略纳什均衡(1/4,1/4)不是ESS,而 (0,0),(1,1)不是纳什均衡,只证(1,0)是否为ESS,对于两 种群两策略的双矩阵进化博弈,要证平衡点是否为ESS, 只要证明复制者动态方程的平衡点是进化均衡。
定义:如果任何策略y≠x,存在某个 y(0使,1) 得不等式
u [ x ,y ( 1 ) x ] u [ y ,y ( 1 ) x ] 对所有的(0, )
进化稳定均衡与纳什均衡
进化稳定均衡与纳什均衡经济专家论文报告:进化稳定均衡与纳什均衡1. 引言2. 进化稳定均衡的基本概念和理论分析3. 进化稳定均衡和纳什均衡的区别和联系4. 进化稳定均衡在实际问题中的应用5. 总结与展望1. 引言进化稳定均衡和纳什均衡是现代博弈论中的两个重要概念。
前者是指在演化过程中,一种策略能够保持自身的数量和适应性,成为一种稳定的演化策略;后者是指在博弈中,每个参与者采取最佳策略的状态。
本文将分析这两种均衡的概念、性质以及在经济学中的应用,并探讨它们之间的联系和区别。
2. 进化稳定均衡的基本概念和理论分析进化稳定均衡是指一个策略因为拥有适应性而繁衍下来,成为博弈中一种最具竞争力的策略。
在进化过程中,策略需要满足两个条件:稳定和可入侵。
如果一种策略对抗其他策略的成功率高于其他策略对抗该策略的成功率,那么该策略就是稳定的。
可入侵是指其他策略能够通过有限的数量优胜该策略。
进化稳定均衡是指满足进化过程、稳定和可入侵的状态。
在理论分析中,进化稳定均衡和纳什均衡经常被对比。
在一个有限的,重复的博弈中,如果每个参与者受到不完全信息或随机事件的影响,那么进化稳定均衡可能不存在。
但是在无限重复博弈中,可以通过相关策略维护一个进化稳定均衡。
进化稳定均衡的产生依赖于群体的数量和适应性,可以通过对群体动态的分析和博弈理论的结合进行研究。
3. 进化稳定均衡和纳什均衡的区别和联系尽管进化稳定均衡和纳什均衡都是均衡的概念,它们之间有一些显著的差别。
纳什均衡是指博弈中每个参与者采取最佳策略的状态;进化稳定均衡是指具有适应性的策略在演化过程中成为博弈中一种最具竞争力的策略状态。
因此,进化稳定均衡更适用于群体的经济学分析,而纳什均衡更适用于个体的分析。
此外,在某些情况下,进化稳定均衡可能不存在;而纳什均衡总是存在的。
因此,在实际应用中,我们需要谨慎选择使用哪种均衡概念。
4. 进化稳定均衡在实际问题中的应用进化稳定均衡的理论在经济学中得到了广泛应用,其中最突出的是在博弈论和演化经济学方面。
演化博弈理论的原理和应用
演化博弈理论的原理和应用1. 理论简介演化博弈理论是一种理论框架,用于研究多个个体之间相互作用的行为和策略选择。
它是从进化生物学中发展而来,吸收了经济学和社会学等学科的理论和方法,在研究社会行为和经济决策中具有重要应用。
2. 原理概述演化博弈理论主要基于以下几个原理:2.1. 演化机制演化机制是指在一群个体中,通过个体之间的相互作用和遗传机制的作用,使得个体的某种特征或行为在群体中逐渐传播和积累。
这种演化机制可以通过模拟进化算法和遗传算法进行建模和研究。
2.2. 博弈模型博弈模型是演化博弈理论的核心工具,它描述了多个个体在特定环境中的策略选择和收益获取。
著名的博弈模型包括囚徒困境、合作博弈和非合作博弈等。
通过博弈模型的构建和分析,可以揭示个体之间的相互影响和策略的动态演化。
2.3. 演化稳定策略演化稳定策略是指一种策略,在给定环境下,个体之间的策略选择在长期演化过程中保持相对稳定。
演化稳定策略是博弈模型中的重要概念,它可以用来解释和预测实际生活中的社会行为和经济现象。
3. 应用领域演化博弈理论在多个学科和领域中都有广泛的应用,以下列举了一些典型的应用:3.1. 经济学演化博弈理论在经济学中被广泛应用于研究市场竞争、价格形成、企业战略等问题。
例如,通过建立博弈模型,可以分析不同企业之间的竞争策略选择和市场份额变化。
3.2. 生态学演化博弈理论在生态学中被用于研究动物群体中的策略选择和社会行为。
例如,通过建立博弈模型,可以分析动物之间的资源争夺、合作行为和繁殖策略选择。
3.3. 社会科学演化博弈理论在社会科学领域也有重要的应用。
例如,在社会网络中,个体之间的互动和合作行为可以通过演化博弈理论进行建模和分析。
此外,演化博弈理论还可以解释和预测社会行为中的合作与竞争现象。
3.4. 计算机科学演化博弈理论在计算机科学中也有广泛的应用。
例如,在人工智能领域,通过演化博弈理论的方法,可以设计和优化智能体的决策策略,提高系统的性能和适应性。
一般两人对称博弈的复制动态和进化稳定策略例题
一般两人对称博弈的复制动态和进化稳定策略例题一般两人对称博弈是指两个玩家在相同的游戏环境中进行博弈,每个玩家都会根据自己的利益选择不同的策略,从而导致不同的结果。
复制动态和进化稳定策略是指在这样的博弈中,玩家的策略会随着时间的推移而发生变化,最终达到一个稳定的状态。
在一个两人对称博弈中,有两种不同的策略可以选择,分别记作A和B。
假设在初始状态下,玩家A和玩家B各自采取了一种策略,分别记作a和b。
根据复制动态的原理,下一轮博弈中,玩家A和玩家B将继续采用他们上一轮博弈中的策略,如果其中一个玩家的策略获胜,那么他将成为下一轮博弈中的胜者,继续采用他的策略。
如果两个玩家的策略得分相等,那么两个玩家将随机选择一个策略进行下一轮博弈。
这个过程将持续下去,直到达到一个稳定状态。
进化稳定策略是指在一定时间内,玩家的策略会发生变化,而最终达到一个稳定的状态。
在一个两人对称博弈中,如果一个策略可以在当前环境中稳定存在,即如果所有玩家都采用这个策略,那么没有一个玩家会想要改变他们自己的策略,那么这个策略就是进化稳定策略。
举个例子,假设在一个两人对称博弈中,A和B分别可以选择合作(C)或背叛(D),并且根据不同的选择得到不同的收益。
如果两个玩家都选择合作(C,C),则他们每个人都会得到3分;如果两个玩家都选择背叛(D,D),则他们每个人都会得到1分;如果一个玩家选择合作而另一个选择背叛(C,D或D,C),则合作的玩家得到0分,而另一个玩家得到5分。
在这种情况下,合作是一个进化稳定策略,因为如果所有玩家都选择合作,那么没有一个玩家会想要改变他们的策略,因为这是他们能够获得最大收益的策略。
总之,复制动态和进化稳定策略是博弈论中的两个重要概念,通过它们可以更好地理解玩家在博弈中的策略选择,并预测最终稳定的结果。
进化稳定对策名词解释
进化稳定对策名词解释
进化稳定对策是一种策略,用来改善组织进化的稳定性,从而使
组织更容易调整与变化。
它在打破老旧理念、扩张业务范围、改善服
务质量和增强竞争力等方面发挥着重要作用。
它通过改变组织中人员、流程、系统、方法和文化等组成部分,来帮助企业达到各自的业务目标,提高业务效率,使组织可以快速适应环境的变化。
实施进化稳定对策的核心是让组织更好的对自身的稳定性进行评估,然后改进组织内部的运作机制,提升运行稳定性。
一般来说,进
化稳定性对策包括以下几大方面:
首先,巩固组织内部的协调机制,提高组织的工作效率,减少低
效率的复杂流程,确保组织的运行流程更符合业务要求。
其次,发展组织的任务和工作绩效考核体系,确保组织的员工每
人都能有效发挥角色和价值,从而实现企业的可持续发展。
再次,改善组织的人员管理结构,构建流程架构,利用最佳实践
来优化流程,增加整体效率,提高服务质量及客户满意度。
最后,对于日常运营流程,采用合理的运营工具,减少异常发生
的机会,从而提高客户满意度及企业的可持续性。
总的来说,进化稳定可以帮助组织以合理的方式实现良好的发展,提升企业的可持续性,实现企业的战略目标,改善企业的工作效率。
因此,进化稳定对策在企业发展过程中发挥着重要作用,是企业实现
目标的核心策略。
考虑进化稳定的多种群遗传算法在配电网规划中的应用
文 采用 综合 考虑 网损 、 馈线 建 设费用 和 网络 年 维护
0 引 言
配 电网规 划是 指在 负荷 预测 的基础 上 , 通过 最
折 旧费的配 电网规划数学模型, 即以规划年综合费
用 最小 为评 价标 准 。 目标 函数 为
限 的惩罚 , 一般 取值 很大 , 足要 求 时则取值 为 0 满 。
1 配 电网规划 的数学模型
1 目标 函数 . 1
()容量约束 2
只 . 一
为支路潮流; , 为支路最大允许容量 。 配电网规划问题是大规模非线性规划 问题 。 本 式 中
收 稿 日期 :2 0 -40 . 0 70 -8 作者简介 :王浩 (9 1一) 18 ,男, 华北 电力大学 电气 与电子工程学院硕士研 究生
该 规划 的配 电网必须 是连通 的网络 , 且满 足对 所 基 于进 化稳 定 的改进 多种群 遗传 算法 。 算法根 据
2 考虑进化稳 定的多种群遗传算法
21 遗传 算法和 多种 群 遗传算 法 . 遗 传机 理 的并行 优 化搜 索方法 , 它能在 搜 索过程 中
区的作用 。 当检测到当前种群中最优个体所占的比 例超 过 设定 的稳定 控制 参数 时 , 多余个 体进行 突 对
维普资讯
1 0
电
力
科
学
与
工
程
20 07笠
()连 通性 网络 约束 3 有 负荷节 点供 电。 ()辐 射性 网络 约束 4
规划 的配 电网必 须是 辐射 性 网络 。
遗 传算 子 ,即稳定 控制 参数 下 的突变 算子 ,提 出 了 设 置 的稳定 控制参 数对精华 种群 中的多余个 体实施 不 同于一 般变 异算 子 的突变操 作 , 以减轻 选择机 可 制对 低适 应 值个 体所 造成 的 “ 生存 压 力” ,保持种 群 的 多样 性 ,避 免过 早 收 敛 ,同 时又 扩 大搜 索 空 间, 到一般 变异 达不 到 的快速 逃离 局部最 优解 误 起
进化稳定策略
梅纳德· 史密斯和普莱斯(1973)的定义: x∈A是进化稳定策略,如果y∈A,y≠x,存在一个
y ∈(0,1),不等式U[x, εy + (1 − ε)x] > U[y, εx + (1 −
ε)x]对任意ε∈(0, )都成立。 A是群体中个体博弈时的支付矩阵;y表示突变策略; 是一个与突变策略y有关的常数,称之为侵入界限; εy + (1 − ε)x表示选择进化稳定策略群体与选择突变
鸽
0,2
1,1
假设群体中有比例为X的博弈方采用鹰策 略,比例1-x的博弈方采用鸽策略
采用两种策略博弈方的期望得益(选择“鹰” 策略的得益为u1,选择“鸽”策略的得益为u2) 和群体平均期望得益分别为:
u1=-5x+2(1-x)=-7x+2 u2=1-x u =xu1 +(1-x) u2=-6x2+1
动态变化速度
dx F ( x) x(u1 u ) dt
dx F ( x) x(1 x)(1 6 x) dt
解出的复制动态的三个稳定状态分别为X*=0,X*=1和 X*=1/6.
策略群体所组成的混合群体。
进化稳定策略(evolutionarily stable strategy, 简称ESS)是指如体就不可能侵入
到这个群体。或者说,在自然选择压力下,突变
者要么改变策略而选择进化稳定策略,要么退出
系统而在进化过程中消失。可用来描述生物进化
复制动态下的进化稳定策略
生物进化的“复制动态”机制模拟即是
学习速度很慢的成员组成的大群体随机配对 的反复博弈。
鹰鸽博弈的复制动态和进化稳定策略
是同一物种、种群内部竞争和冲突中的
演化稳定策略的定义
演化稳定策略的定义引言在生物学和博弈论中,演化稳定策略是指一种在群体中相对于其他策略具有优势的策略,即当大多数个体采用这种策略时,该策略难以被其他策略所取代。
演化稳定策略的概念最早由生物学家约翰·梅·古德费洛提出,后来被博弈论学者进一步研究和发展。
演化稳定策略的概念演化稳定策略是由基因传递给后代的行为策略,通常与遗传算法和适者生存等演化理论相关。
在一个给定的环境中,个体根据自己的策略产生行动,并与其他个体进行互动。
演化稳定策略具有以下特征:1.稳定性:演化稳定策略是指一种策略能够在群体中趋于稳定的存在,并且难以被其他策略所取代。
这种稳定性可以通过均衡理论来描述和分析。
2.优势性:演化稳定策略相对于其他策略具有一定的优势,能够在相同条件下取得更好的结果。
这种优势可以通过适应度函数或收益函数来衡量。
3.传递性:演化稳定策略会通过基因传递给后代,并且在下一代中继续存在和发展。
这种传递性是演化过程中的关键因素之一。
演化稳定策略与博弈论演化稳定策略的概念在博弈论中得到了广泛的应用和研究。
博弈论是研究个体或群体在决策过程中相互作用的数学模型,其中演化稳定策略是其中重要的概念之一。
在博弈论中,演化稳定策略通常通过均衡概念来描述。
均衡是指一种策略组合,当大多数个体采用该策略时,无论其他个体如何选择,都无法通过改变自己的策略来获得更好的结果。
演化稳定策略通常是一个均衡策略,能够在长期演化过程中保持自身的优势地位。
在博弈论中,存在多种演化稳定策略模型,包括纳什均衡、重复博弈中的有限和无限策略等。
这些模型通过数学方法描述了不同情况下演化稳定策略的存在和发展。
演化稳定策略的实例下面我们通过几个实例来说明演化稳定策略的定义和应用。
实例一:囚徒困境囚徒困境是博弈论中常用的一个例子,其中演化稳定策略能够解释为何个体会选择“合作”而不是“背叛”。
1.如果两个囚犯都选择合作,他们都会被判处较轻的刑期;2.如果一个囚犯选择背叛而另一个囚犯选择合作,那么背叛者将免于刑罚,而合作者将被判处较重的刑期;3.如果两个囚犯都选择背叛,他们都会被判处较重的刑期。
进化稳定对策
A ;翟 tE o fnryS b t t yE S sh l ocp i S a g sihsm c i i ac eeo t nrybo g sa h 扛 c:vli a l t l Sre ( S )iteC ecnetn t t i , a uhs n cnei t vl i al i oyr er uo i a e a g O ree t gf i nh uo i l e c
化论最重要的发展之一 。阐释进 化稳定对策基本理论的产 生 以及 几种重要 的进化稳定 对策模型 , 并运 用进化稳 定对策理论
解 释 一 些生 物 现 象 。
关键词 : 进化稳 定对策 ; 常规战 ; 消耗 战; - g 击者 ; 应变者
中图分类号 : ll Q l 文献标识码 : A 文章编 号 :62 5520 ) 3 3 0 17 —56 (08 一0 —12— 3
Ev l to a i t b e S r t g o u i n rl S a l t a e y y
ZHANG i i . Ca —x a YAN h n Z o g—c e g h n ( oeeo Si c, Clg l f cne e N ra nv sy Bl 103 Cia) o l irt, ei 007,hn m U ei j  ̄
然而, 这种解释不能说 明 自然选择 压力 的条件下 , 体之 间 个 如何逐步 进化 为 仪 式化 非 伤害 的 常规 争斗 。17 , y 9 3年 Ma—
Ke yW o d : S ; o v n o a wa ; h a o t t n; tl tr B u g i r s E S C n e t n l r T eW f at i i r i r o Re i o ; o r e s aa o
浅谈进化稳定策略
浅谈进化稳定策略摘要:本文主要介绍进化稳定策略的概念,进化博弈论在经济学中的发展。
为了便于理解,文中会举出进化稳定策略中的经典例子。
关键词:进化稳定策略鹰鸽博弈进化博弈进化稳定策略(Evolutionarily stable strategy,以下简称:ESS)作为进化博弈的一部分最早来自于达尔文的生物进化论。
本文要介绍的ESS是1974年,梅纳德〃史密斯(Maynard Smith)在博弈论的基础上提出的进化论和博弈论结合,在社会学、经济学和生态学领域获得了广泛的应用。
ESS被提出后,不同领域的学者对之进行了广泛的研究,使其体系日趋完善。
本文试图对进化稳定策略做出简要的介绍,介绍进化博弈论在经济学中的发展。
一、ESS的概念达尔文曾在《物种起源》一书中写到,“能存活下来的物种,并不是最强的,也不是最聪明的,而是看哪个物种最能适应环境的变迁。
”ESS正是这种达尔文进化理论的体现:它并不是一个绝对优势的策略。
ESS是指种群的大部分成员所采取某种策略,这种策略的好处为其他策略所不及。
动物个体之间常常为各种资源(包括食物、栖息地、配偶等)竞争或合作,但竞争或合作不是杂乱无章的,而是按一定行为方式(即策略)进行的。
对某个体而言,最好的策略取决于大多数成员在做什么。
由于种群的其他部分也是由个体组成,它们都力图最大限度地、更多更有效地繁殖自己的后代,因而能够持续存在的必然是这样一种策略:它一旦形成,任何举止异常个体的策略都不能与之比拟。
在环境的每次大变动之后,种群内可能出现一个短暂的不稳定期,但是一种ESS一旦确立,就会稳定下来,偏离ESS的行为就会被自然选择所淘汰。
简而言之,凡是种群的大部分成员采用某种策略,而这种策略的好处为其他策略所不及的,这种策略就是进化稳定策略(ESS)。
ESS策略是生物进化过程中的一个普遍现象,几乎所有的优化都涉及到这样的策略。
1二、鹰鸽博弈——ESS中的经典案例假设有一个特定的物种叫做“鹰和鸽子”,在这一物种中只有两种搏斗策略。
动物进化的稳定性自然选择与遗传平衡
动物进化的稳定性自然选择与遗传平衡动物进化的稳定性:自然选择与遗传平衡自然选择是生物进化中的重要机制之一,它对于动物的进化和适应性有着显著的影响。
通过自然选择,有利的基因在物种中逐渐累积,使得物种适应环境的能力更强,并且能够在环境变化中保持相对的稳定性。
同时,自然选择与遗传平衡也密切相关,二者相互作用,共同塑造动物的进化过程。
一、自然选择对动物进化的影响1. 适应性进化:自然选择使得有利的性状在物种中逐渐增加,从而提高了物种的适应能力和生存竞争力。
例如,长颈鹿的进化过程中,长颈提供了更好的觅食条件,使得长颈鹿可以获取到其他物种无法触及的食物资源。
2. 生存和繁殖:自然选择通过筛选对生存和繁殖有重要意义的性状,影响着物种的生存和繁殖能力。
那些能够更好地适应环境并且成功繁殖的个体,其基因将得到更好的传递和保留。
二、遗传平衡与自然选择的相互作用1. 遗传平衡概述:遗传平衡是指在一定条件下,种群的基因频率保持稳定或波动较小的状态。
它产生于自然选择与遗传漂变等进化机制之间的动态平衡。
2. 确立遗传平衡:当基因型频率在一代到下一代之间不发生变化时,遗传平衡就得以确立。
这通常需要种群处于孟德尔定律成立的假设下,且没有自然选择、突变等因素的干扰。
3. 遗传平衡维持:在自然环境中,外界因素的干扰导致遗传平衡的维持变得更加复杂。
例如,当某个性状对于环境没有明显的优势或劣势时,种群可能保持稳定的遗传平衡状态。
4. 选择压力与遗传平衡:自然选择可以改变物种的遗传平衡状态,当环境对某个性状有明确的选择压力时,基因频率会发生改变。
然而,在某些情况下,选择压力较弱,种群可能保持相对稳定的遗传平衡状态。
综上所述,动物进化的稳定性受到自然选择和遗传平衡的共同影响。
自然选择作为进化的驱动力,通过选择有利的性状使得物种适应环境并提高生存和繁殖能力。
而遗传平衡则是种群基因频率保持稳定的状态,它与自然选择相互作用,共同维持动物进化过程中的稳定性。
进化稳定性对策名词解释
进化稳定性对策名词解释进化稳定性对策名词解释:进化稳定性对策,简称,亦称稳定对策(Stability Hedgehog)。
指进化上的原因促使一个种群趋向于不会随时间而发生显著的变化的策略。
可通过其作用产生有利于物种进化的适应。
一个物种的种群密度和丰富度随时间的变化趋势,是该种群历史生存状况的标志,也是与该种群生存直接相关的重要参数。
理想情况下,这些特征应该不受环境条件的影响而保持相对稳定,即无论环境如何变化,都不会导致有利于生存的生活史特征的改变。
但事实上,并非总是如此。
由于种内基因频率和生殖速率经常发生显著的变化,故各个生物种群并不一定具备长期不变的生活史特征,或者说,对于不同的生物种群来说,基因频率和生殖速率经常不呈现线性变化,反而呈现出曲折的、甚至大幅度波动的变化趋势。
在自然条件下,种群的生活史特征会随着时间的推移而缓慢地变化。
例如:昆虫的幼虫在土壤中的生活时间很短(只有几个小时),羽化成成虫后,通常需要几周的时间才开始交配和产卵。
在一般情况下,一个种群的生活史变化较小,既不显著,也不复杂,可以认为是比较稳定的。
一个稳定的有机体为了维持自身生存所必需的基本要素是进化稳定性对策,即为了防止因衰老、疾病、伤残、营养等原因造成的机体功能的衰退或丧失,以及种群规模的缩减或灭绝,保证种群未来的繁衍与发展,使种群的生活史特征在进化过程中保持相对稳定。
这是一种长期的、全局性的战略,具有明显的生态学意义。
(1)进化稳定性对策的四个目标:①_C_目标:使生命有效地延续下去; ②_N_目标:使繁殖后代的能力有效地增加;③_T_目标:使有利于遗传的选择性有效地扩散到整个群体中;④_E_目标:使有利于遗传的选择性有效地保留在它的表型中。
(2)稳定性对策的概念:稳定性对策的目的是维持种群中基因频率、繁殖能力以及表型的某种稳定性,从而避免环境变化对种群产生不利的影响。
进化上的稳定策略---鹰与鸽子
进化上的稳定策略---鹰与鸽子任何行为都要有策略。
还是由汉密尔顿肇始,生物学家们提出了一种“进化上的稳定策略”——evolutionarily stable strategy,英语简称ESS,是字头缩写,我们把这个简称翻译个名字,就叫“宜斯”一既是译音,中文意思也一目了然——“宜于如此”。
那么这“宜斯策略”的确切含义是什么呢?社会生物学家所下的定义是:“凡是种群的大部分成员采用某种策略,而这种策略的好处是其他的策略所比不上的,这种策略就是进化上的稳定策略,或称宜斯策略。
”这个概念很微妙,但也很重要。
它含有这样的意思,对于个体来说,最佳策略是看群体中大多数成员在于什么,你也去照样干。
换言之,你要“随大流”。
也许你会对这种策略大不以为然,用名人的格言来驳斥它:“只有死鱼才顺着水漂。
”但是别忙,牵扯到策略的问题,都是生死攸关的大事,不可感情用事,亦不得有丝毫犬儒主义。
要知道生物在其进化征途上的任何冒险行为都是以其生存和生殖(未来后代的生存)为代价的。
社会生物学的解释是:由于种群的其余部分也是由个体组成的,而这些个体都力图最大限度地扩大其各自的成就,因而能够持续存在的必将是这样一种策略:它一旦形成,就获得了无与伦比的威力,任何与之相异的个体的策略都无法与之抗衡。
在环境的一次大变动之后,群体内可能会出现一个短暂的不稳定阶段,甚至可能出现波动,但一种“宜斯策略”一旦确立,就会稳定下来;偏离宜斯策略的行为就要受到惩罚。
鹰与鸽子社会生物学家为用宜斯策略解释侵犯行为的演化,假设了一个简化的例子:假定有个种群中共有两种类型(实际决不会只有两种)的个体,一种是鹰型,一种是鸽子型(记住,这是与鹰和鸽子这两种鸟毫不相干的一种比喻)。
鹰搏斗起来总是全力以赴、孤注一掷,除非身受重伤,否则决不肯退却;而鸽子却只是以风度高雅的惯常方式进行威胁恫吓,不会造成任何伤亡。
如果鹰与鸽子相遇,鸽子立即逃之夭夭,因此鸽子是不会受伤的。
但是如果鹰同鹰进行搏斗,它们一直要斗到其中的一只身受重伤或者死亡方才罢休。
ess演化稳定策略
ess演化稳定策略
ESS是指进化稳定策略(Evolutionarily Stable Strategy),是
进化生物学中用于描述生物种群中某一策略的稳定性的概念。
一个策略被称为ESS,意味着当种群中大多数个体采用该策略时,该策略将能够抵抗侵略策略的入侵,从而在演化过程中保持稳定。
具体而言,对于一个策略,如果它能够在种群中获得至少与其他竞争策略相等的平均适应度,并且当一小部分个体改变策略时,这个策略可以保持该竞争策略的适应度优势,那么这个策略就是一个ESS。
ESS的出现和维持主要受到两个因素的影响:选择力和突变力。
选择力是指个体在进化过程中的适应度,突变力是指个体改变策略的概率。
当选择力较强时,ESS相对容易出现,因为个体采用该策略的适应度更高;当突变力较强时,ESS相对容易被打破,因为个体更有可能通过改变策略来适应环境变化。
总之,ESS是一种演化稳定的策略,能够在种群中保持稳定,并抗击其他竞争策略的入侵。
它在进化生物学和博弈论中有广泛的应用。
进化稳定策略与纳什均衡关系
给定一个收益矩阵,基于上下文,我们可以讨论是否存在纳什均衡, 也可以讨论哪个策略是进化稳定的
能否建立起这两个概念的某种关系?
进化稳定策略与纳什均衡的关系
生物体2
S T S T
生物体1
a, a c, b
b, c d, d
S是进化稳定的条件: (i) a>c,或 (ii) a=c且b>d
(S,S)是纳什均衡的条件:a≥c
应满足a(1-x)+ bx > c(1-x)+ dx (注意“x很小”在其中的作用) 结论:在双人双策略的对称博弈中,若(i)a>c或(ii)a=c且b>d,则S是进化稳定的。
生物体2
S T S T
生物体1
a, a c, b
b, c d, d
在双人双策略的对称博弈中,若(i) a>c,或(ii) a=c且b>d,则S是进化 稳定的。这意味着:
生物体2
S (1-x) T (x) S
T 如何用a,b,c,d写出S是进化稳定的条件?
略T 采取S策略的期望收益:a(1-x)+bx 采取T策略的期望收益:c(1-x)+dx
生物体1
a, a1,T入侵S,总体中有1-x部分使用策略S,有x部分使用策
例子:另一种猎鹿博弈
猎人2 猎鹿 猎鹿 猎人1 4, 4 猎兔 0,4 猎人1 猎兔 猎兔 3 ,3 猎人2 猎鹿 4,0
猎兔
4,0
3,3
猎鹿
0,4
4,4
尽管(猎鹿, 猎鹿)是纳什均衡,猎鹿不是进化稳定的。 猎兔是进化稳定的,于是(猎兔, 猎兔)此时也是纳什均衡。
进化稳定策略和严格纳什均衡
传统博弈与演化博弈典型模型
传统博弈与演化博弈典型模型引言博弈论是一门研究决策制定者在互相影响的情况下进行决策的数学理论。
传统博弈理论主要关注个体间的理性决策,而演化博弈理论则更加注重个体之间的学习和适应过程。
本文将重点介绍传统博弈理论中的两个典型模型:囚徒困境和合作博弈,以及演化博弈理论中的两个典型模型:重复囚徒困境和进化稳定策略。
传统博弈理论1. 囚徒困境囚徒困境是博弈论中最经典的模型之一。
在囚徒困境中,两名犯罪嫌疑人被拘留,检察官给每人提供了合作和背叛两种选择。
如果两人都合作,那么两人都将获得较轻的刑期;如果一人合作而另一人背叛,合作的人将获得较重的刑期,而背叛的人将获得较轻的刑期;如果两人都背叛,那么两人都将获得较重的刑期。
囚徒困境的核心是每个人都追求自己的最大利益,然而由于缺乏合作,最终双方都无法达到最优解。
这个模型揭示了在某些情况下,个体的理性选择可能导致整体的低效结果。
2. 合作博弈合作博弈是博弈论中另一个重要的模型。
合作博弈研究的是一组玩家通过合作来达到更好的结果。
在合作博弈中,玩家之间可以讨论、协商并达成共识,以最大化整体利益。
合作博弈的核心是玩家之间的合作和沟通。
通过合作,玩家可以共同制定策略,使得每个人都能获得相对较好的结果。
这个模型强调了合作和协作在博弈中的重要性。
演化博弈理论1. 重复囚徒困境重复囚徒困境是传统囚徒困境的扩展,它考虑了博弈的重复性。
在重复囚徒困境中,两名犯罪嫌疑人将会多次面临同样的囚徒困境,并且每次博弈的结果将会影响下一次博弈。
重复囚徒困境的核心是个体之间的长期利益和互动。
由于博弈会反复进行,玩家们可以根据对方的选择来调整自己的策略。
通过长期互动,玩家们可以建立合作的信任,从而达到互惠互利的结果。
2. 进化稳定策略进化稳定策略是演化博弈理论的关键概念之一。
进化稳定策略指的是一种策略,如果一个种群中绝大多数个体都采用该策略,那么该策略将能够稳定地存在下去。
进化稳定策略的核心是个体之间的遗传和选择。
动物进化稳定对策(ESS)及其研究进展
以赴 地 战 斗 。 不 退 却 ; 鸽 型 对策 者 仅 限 于 威 胁 和 决 而 恫吓 。 对方争斗升级时 , 当 则立 即退 却 。若 冲突 双 方 均 为 鹰 型 对 策 者 , 中一 方 将 受 伤 害 并 且 退 却 。 其 在 一 场争 斗 中 。 获胜 者 收 益 V单 位 , 伤 的失 败 者 受 投 资 W 单 位 。 冲突 的盈 利 是 由争 斗 的 收益 或 投 入 引起
过 渡 的 中 间类 型 , 对 策 集 是 离 散 的 。 型对 策 者 全 力 其 鹰
用 于 一 切 有利 益 冲 突决 策 的分 析 。E S理 论 是 自达 尔 S
文( awn19) D ri,8 7以来 , 化 论 最 主 要 的发 展 之 一 ( ak 进 D r— is1 8 ) 为现 代 理 论 进 化 生 态 学 和 理 论 种 群 进 化 生 n,9 0 。
均 采 取 某 种 对 策后 , 其 他 对 策 者 不 能入 侵 该 种 群 , 若 在
进 化 上 。 种 对 策则 是 稳 定 的, 即 E S概 念 。 S 此 此 S E S是 不
可 被 其 他 策 略替 代 的对 策 ,当 种 群 完 全 由 E S对 策 者 S 组 成 时 , 不 存 在 具有 更 高 适 合度 的突 变 型对 策 。 将 在 一 双 冲 突 者 的遭 遇 战 中 。 突 者 常 采 取 鹰 型 和 冲 鸽 型 2种 战 斗 对 策 。假定 在此 2种 对 策 间 不存 在连 续
核 战 争 各 种 复 杂决 策 的 分析 (ede 18 ) 对 策论 的 Lnrm,96 。
3-进化稳定对策
进化稳定对策
在ESS种群内每个个体的期望赢得为, ESS种群内每个个体的期望赢得为 种群内每个个体的期望赢得为,
V V 1 − 2 C
Байду номын сангаас
而在纯鸽对策种群内每个个体的期望赢得为 V/2。 V/2。 虽然纯鸽对策种群个体平均适合度大于ESS种群 种群, 虽然纯鸽对策种群个体平均适合度大于ESS种群, 但它是一个不稳定的种群, 但它是一个不稳定的种群,随时都有可能受到其 它对策(鹰对策) 它对策(鹰对策)的侵蚀
进化稳定对策与种群遗传学
均研究频率依赖选择问题,但重点不同 均研究频率依赖选择问题, 种群遗传学考察基因频率的动态以及平衡态的性质, 种群遗传学考察基因频率的动态以及平衡态的性质,目 的是探讨不同类型的选择对一个位点上不同基因型的效应。 的是探讨不同类型的选择对一个位点上不同基因型的效应。 为了分析上的方便,对策集经常被高度简化, 为了分析上的方便,对策集经常被高度简化,经常是只考 虑对应于两个等位基因的两个对策 ESS常常假定对策可以无性繁殖或者有机体是单倍体。 常常假定对策可以无性繁殖或者有机体是单倍体 而ESS常常假定对策可以无性繁殖或者有机体是单倍体。 这种遗传学上的高度简化使得人们可以考察更为复杂、 这种遗传学上的高度简化使得人们可以考察更为复杂、更 为广泛的对策集, 为广泛的对策集,以及对策之间更加微妙的适合度相互作 的话说,ESS概念的精髓就是 概念的精髓就是‘ 用。用Maynard Smith 的话说,ESS概念的精髓就是‘假 定简单化的遗传学而考察复杂的生态学’ 定简单化的遗传学而考察复杂的生态学’
最优化理论与博弈论
最优化理论认为,自然选择总是倾向于使生物最有效地 最优化理论认为, 传递它们的基因,因而也将是最有效地从事各种活动, 传递它们的基因,因而也将是最有效地从事各种活动, 包括使它们在时间和能量分配方面达到最优状态。 包括使它们在时间和能量分配方面达到最优状态。但普 遍意义上的最佳策略往往并不存在。 遍意义上的最佳策略往往并不存在。 许多情况下, 许多情况下,一个个体采取某一对策是好还是坏不仅取 决于这个对策本身, 决于这个对策本身,而且往往还取决于种群内其它个体 所采取的对策是什么 博弈论就是用于分析当一个个体的最优行为依赖于其它 个体时个体如何采取行动的一个理论工具
浅议进化稳定策略(ESS)
浅议进化稳定策略(ESS)20生物学通报2005年第40卷第4期浅议进化稳定策略(ESS)蒋学玮冯建菊(塔里木大学植物科技学院新疆阿拉尔843300)进化稳定策略(ESS)是MaynardSmith(1974)在博弈论的基础上提出来的,是进化论和博弈论的结合,在社会学,经济学和生态学领域获得了广泛的应用.Dawkins(1976)非常推崇ESS概念,他认为:我们可能最终不得不承认ESS概念的发明是达尔文以来进化理论上最重要的发展之一,凡是有利害冲突的地方它都适用,ESS概念使我们第1次能够清楚地看到一个由许多独立的自私个体所组成的群体是如何变得像一个有组织的群体.1ESS的定义所谓进化稳定策略是指如果占群体绝大多数的个体选择进化稳定策略,那么小的突变群体就不可能侵入到这个群体,或者说,在自然选择压力下,突变者要么改变原有策略而选择进化稳定策略,要么退出系统在进化过程中消失.这个定义的核心思想是提出了相对优势的概念,与以往的绝对优势概念不同.它并不认为生物在进化过程中会选择最优的策略.针对1个进化事件,生物群体一开始会采取多样化的反应策略.但随着~,-j-j司的推移.最终会停留在一个相对优势的策略上,即群体中的大部分个体采纳的策略而少数突变个体的策略在竞争中获胜的机率将会很小.它类似于纳什均衡当中的吸引域,除非有来自于外部的强大冲击.否则系统就不会偏离进化稳定状态.即系统会"锁定"于此状态.这个定义的直观解释是当1个系统处于进化稳定均衡的吸引域范围之内时,它就能够抵抗来自外部的小冲击.ESS策略是生物进化过程中的一个普遍现象,几乎所有的优化都涉及到这样的策略.2ESS分析的一个案例雌粪蝇(Scatophagestercorana)喜欢在新鲜的牛粪上产卵,由于不新鲜牛粪的表面会结成1个壳.不利于雌蝇产卵.牛粪放置的时间越长.前来产卵的雌蝇就越少.在雌蝇产卵的同时.成群的雄粪蝇会在牛粪的周围等待雌粪蝇的到来.并且,雌蝇遇到的第1个雄粪蝇会防护着它.并与之交配.因此,雄粪蝇面临的问题是:在每堆牛粪上等待雌蝇的最适时间是多长?也就是说.在单位时间内怎样才能和最多的雌蝇交配.最大限度地繁殖自己的后代?分析:对于1只雄蝇来说.最适宜的等待时间依赖于其他雄蝇等待多久的时间.如果1只雄蝇总是花固定的时间等待雌蝇,其他雄蝇(即配偶的竞争者)就可能利用这一点取得竞争的胜利.假如雄蝇固定等待时间较短,那么1只等待时间较长的雄蝇,就会获得和到达粪堆较晚的所有雌蝇的交配机会;相反,假如雄蝇固定等待时间较长,那么1只提早离开粪堆的雄蝇就可能在另一堆牛粪上和早期达到的雌蝇交配.结果:既然任何固定时间的等待都有可能导致竞争失败,那么在雄粪蝇的配偶竞争中,ESS应该是随机地选择在牛粪上等待的时间,即选择不可预知的等待时间. 检验:实验结果支持了这种推断,Parker(1970)测量雄蝇在粪堆上的等待时间的确呈随机分布,而且当雄蝇采取不同的等待时间时,其交配结果非常相似. 在这个案例当中,ESS分析能够用数学的方式对生物群体的行为,竞争,策略和优化进行描述,并得出可靠的结论,对于生物群体这样的复杂系统而言,这是一个重大的进步.3ESS的生物学意义虽然ESS目前最成功的应用是种内或种间个体竞争行为的分析,这在很大程度上依赖于ESS数学解析能力的发展,但是ESS包含的生物学意义远不止于此.它能够帮助我们更好地理解生物进化,生物多样性以及生态系统无可比拟的复杂性.从某种程度上来说.它是一种哲学观点,而不仅仅是一个数学定义.达尔文的进化论认为自然选择是进化的动力.变异是进化的基础.最适应环境的个体有较多的机会传播自己的基因,任何有利的突变都有可能被固定下来,因此进化是渐进累积式的.然而,从ESS的观点来看.进化是一个寻优的过程,当达到一个相对优势的状态时,生物的进化过程就会稳定下来.直到下一次寻优过程启动,宏观上表现为跳跃式的进化模式.这在一定程度上可以解释物种进化的速率差异现象.例如,肺鱼(Dipnoi)在大约7500万年的时间内完成了主要的解剖结构重建,但是在接下来的2.5亿年却没有发生进一步的变化;蝙蝠在几百万年的时间里就从一种食虫动物的祖先中分化出来,但是在接下来的4000万年时间里基本身体构型却保持不变.生物世界是绚丽多彩,复杂多变的,仅仅通过基因来理解生命现象显然是不够的.ESS理论的发展, 可以让人类有更多的思维空间来探索大自然的奥秘.参考文献1MaynardSmith.ThetheoryofgamesandtheevolutionofanimalCO-- nflict.JournalofTheoreticalBiology1974,47:90--221.2DawkinsR..Theselfishgene.Oxford:OxfordUniversityPress.1976:78. 3ParkerG,.A..Thereproductivebehaviorandthenatureofsexualse- lectioninScatophagastercorariaL.Evolution.1970.28:93—108.(BH1。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0
严格对称的纳什均衡是进化稳定策略,但是 进化稳定策略不一定是严格的纳什均衡。 (鹰鸽博弈)
鹰鸽博弈
鹰 鸽
鹰 鸽
-3,-3 0,2
2,0 1,1
有三个纳什均衡:(鹰,鸽),(鸽,鹰)和一个混合策略纳什 均衡(每个参与者以概率1/4选择鹰) ESS要求是对称的纳什均 衡,两个纯策略不是。 鹰策略的种群比例为p(0<p<1),预期回报
5种对策:1 鹰式 2鸽式 3威吓4报复性威胁5试探性威胁
单态ESS
定义 对所有不同于S*的个体策略S,如果有 E(S*, S*)>=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)>E(S,S) 那么,称S*为单态ESS 在单种群进化博弈中,ESS是对称纳什均衡,但对 称纳什均衡不一定是ESS。(交换经济博弈)
进化稳定策略的简介 进化稳定策略,又称演化稳定策略(ESS),是 evolutionarily stable strategy的简写,属于行为生态学的范 畴。 定义:如果任何策略y≠x,存在某个 y (0,1) 使得不等式
u [ x , y (1 ) x ] u [ y , y (1 ) x ] 对所有的 (0, ) y 都成立,那么x △是一个进化稳定策略。
显然只有当p,q都超过1/4或两个都小于1/4时,(3)式才大 于零,其他p,q组合都使(3)式小于零,就是x*·Ay>x·Ay 不成立,同理可证(x*,y*)的一些邻域使得 y*·Bx>y·Bx不 成立,因此(x*,y*) 不是一个ESS。 下验证两个纯策略纳什均衡是ESS。 引入动态方程——复制者动态 行参与者的复制者动态为 p p [ e1 A ( q ,1 q ) ( p ,1 p ) A ( q ,1 q )]
E(H)=P(-3)+2(1-P)=2-5P E(D)=P×0+(1-p)×1=1-p
混合策略纳什均和要求E(H)=E(D)
解得p=1/4。当p<1/4时,选择鹰策略的预期收入超过了 鸽策略;当p>1/4时,则相反。所以进化将导致种群1/4的 参与人使用鹰策略。混合策略(1/4,3/4)是ESS。 证:S*=(1/4,3/4) S为任意其他策略(p,1-p),p≠1/4。 3 2 1 / 4 1 / 4 ,3 / 4 E(S*,S*)= =3/4=E(S,S*) 而 0 1 3 / 4 E(S*,S)= =5/4-2p E(S,S)= =1-4p2 比较上面两式: E(S*,S)>E(S,S)恒成立 混合策略(1/4,3/4)是ESS
3 1 / 4 ,3 / 4 0 2 p 1 1 p
3 1 / 4 ,3 / 4 0 2 p 1 1 p
协调博弈
设某一同质种群的成员任意配对。在这博弈中, (L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。 (S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使 它为ESS必须使E(S*, S)>E(S,S)成立(S*≠S) 在此博弈中参与人选择同一行动要好于选择不同行动, 所以这个条件不满足,最可能背离在这个条件的S是纯 策略L,这种情况下,E(S,S)=3, E(S*, S)=3/4 ,确实背 离了条件E(S*, S)>E(S,S). L D L 3,3 0,0 D 0,0 1,1
进化稳定策略及其应用
最优化理论(optimization theory)和对策论(game theory, 又称博弈论)是进化生物学中两个最常用的、非常相近的研究 途径。它们之间的主要区别体现在适用范围上:优化理论适用 的情形是当一个个体的最优行为不依赖于其它个体的行为时, 而对策论则适用于一个个体的最优行为依赖于其它个体如何行 动的情形。 最优化理论的基本出发点是,自然选择总是倾向于使生物最有 效地传递它们的基因,因而也将是最有效地从事各种活动,包 括使它们在时间和能量分配方面达到最优状态 。但是,最优化 理论也遇到了一定困难,即在许多情况下普遍意义上的最佳策 略往往并不存在。一个个体采取某一对策是好还是坏不仅取决 于这个对策本身,而且往往还取决于种群内其它个体所采取的 对策是什么。
p (1 p )( 1, 1) A ( q ,1 q )
将A带入得 p p (1 p )( 1 4 q ) (4) 同理得列参与人的复制者动态为 q q (1 q )( 1 4 q )(5) 以上两动态系统有5个平衡点(0,1),(1,0),(0,0),(1,1), (1/4,1/4). 以上已经证明混合策略纳什均衡(1/4,1/4)不是ESS,而 (0,0),(1,1)不是纳什均衡,只证(1,0)是否为ESS,对于两种 群两策略的双矩阵进化博弈,要证平衡点是否为ESS, 只要证明复制者动态方程的平衡点是进化均衡。 动态系统的雅可比矩阵为 (1 2 p )(1 4 q ) 4 p (1 p )
局部渐进稳定性判断纳什均衡是否 为ESS
动态方程——复制者动态 增长率 p / p等于参与人的适合度 e1 . A ( p ,1 均适合度 ( p ,1 p ). A ( p ,1 p ) 用此法进行协调博弈分析:
p (1 p )( 1, 1) A ( p ,1 p )
p)
减去他的平
p p e1 A ( p ,1 p ) ( p ,1 p ) A ( p ,1 p )
将A带入得 p p (1 p )( 4 p 1) 当初始状态p0<1/4时,参与人的进化稳定策略是D;当 p0>1/4时,参与人进化稳定策略是L 注: 3 0
多态ESS(对于有多个个人策略)
定义 对所有不同于S*的S m,如果有 E(S*, S*)>=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)>E(S,S) 那么,称S*为一个ESS。
设A= ( a ij ) m m 为进化博弈的行为参与人的支付 矩阵,如果存在 i0 使 a i i a ji , j i0 ,1 j m 则第 i 0 个策略e i 是进化稳定策略
3.1 鹰鸽对策与进化稳定对策概念 的提出
自然界的每一动物都经常要与其它个体争夺食物、领域和配偶等 有限资源。进化稳定对策概念的起源很大程度上是和分析这些动物 争斗行为联系在一起的(Maynard Smith & Price 1973),其后又被 推广应用到其它各式各样频率依赖选择(frequency-dependent selection)的情形(Maynard Smith 1982)。进化稳定对策理论与传 统种群遗传学对频率依赖选择的研究相比,最明显的差别可能主要 是强调的重点不同。种群遗传学家主要考察基因频率的动态以及平 衡态的性质,目的是探讨不同类型的选择对一个位点上不同基因型 的效应。为了分析上的方便,对策集经常被高度简化,经常是只考 虑对应于两个等位基因的两个对策。而ESS理论家对于遗传学系统本 身的问题考虑很少,经常假定对策可以无性繁殖或者有机体是单倍 体。这种遗传学上的高度简化使得人们可以考察更为复杂、更为广 泛的对策集,以及对策之间更加微妙的适合度相互作用。用 Maynard Smith 的话说,ESS概念的精髓就是‘假定简单化的遗传学 而考察复杂的生态学’(Hines 1987)。另外一点不同是,ESS只注 重考虑种群达到平衡时的性质,而基本上忽略了动态。容易看到, 种群遗传学和ESS理论各自都在不同方面上作了一些不现实的假定, 因此二者之间更具有互补性,而不是相互对立。
例如,一个雄性粪蝇在寻觅雌蝇时的最优占位往往取决于其 它雄蝇停落在什么位置;在争夺配偶的战斗中,一个雄性动 物的最佳对策经常取决于他的对手如何行动,有时退让是有 利的,有时激烈争斗是更适合的。在这些例子中,不存在一 个任何情形下都一律适用的最佳对策。这时我们观察到的自 然界生物它们应该采取何种对策呢?为解决这一难题, Maynard Smith(1982;Maynard Smith & Price 1973)创造性 地提出了一个全新概念––进化稳定对策,或称ESS(为英文 全称evolutionarily stable strategy的简写)。当种群内所有 个体都采取了某个对策后,其它对策者都不能侵入该种群, 那么这个对策就是进化上稳定的。这个概念不强调绝对意义 上的优化,而是从相对意义上寻求所谓的最佳:当种群完全 是由ESS对策者组成的时候,ESS对策者的适合度将大于所有 突变对策者的适合度。因而,ESS是一个弱化了的最优化概 念(Ehrlich & Roughgarden 1987)。
假设p是行参与人选择鹰策略(H)的概率,q是列 参与人选择鹰策略的概率。行参与人的预期支付 为: E(H)=q(-3)+2(1-q)=2-5q E(D)=q×0+(1-q)×1=1-q 对于列参与人其支付矩阵与行参与人相同,于是 E’(H)=p(-3)+2(1-p)=2-5p E’(D)=p×0+(1-p)×1=1-p
(1 2 p )( 1 4 q ) 4 q (1 q ) (1 2 q )( 1 4 p ) 4 p (1 p )
q q (1 q )( 1 4 q )
4 q (1 q )
(1 2 q )( 1 4 p )
按照学习规则,当q<1/4时,行参与人将p上调; 当p<1/4时,列参与人将q上调。 (p,q)平面上的的点(1/4,1/4)处的纳什均衡不是稳 定的,此时x*=(1/4,3/4)和y*=(1/4,3/4) 。现在考 虑(x,y)=((p,1-p),(q,1-q))≠(x*,y*) ,检验是否为ESS x*·Ay=1/4(2-5q)+3/4(1-q)=5/4-2q (1) x·Ay=p(2-5q)+(1-p)(1-q)=1+p-q-4pq (2) 由上两式得x*·Ay-x·Ay=4(1/4-p)(1/4-q) (3)