演化与博弈论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

学大师霍尔丹致力于研究果蝇的遗传问题。
1958-1965年,担任伦敦大学学院的动物学讲师,主 办了果蝇实验室并致力于实验遗传学的研究。
天津大学管理与Байду номын сангаас济学部
作者简介
1965年,创建了英国苏塞克斯大学,并担任
生物科学学院院长,致力于对生物演化理论 和种群遗传学的研究。
1973年,发表《动物冲突的逻辑》,该论文从博弈论的角度阐
演化与博弈论
http://www.tju.edu.cn
目录
1. 作者简介 2. 演化博弈论的发展历程 3. 主要研究内容 4. 研究启发
天津大学管理与经济学部
作者简介
John Maynard Smith(1920—2004) ——演化博弈论之父。
演化生物学家,英国Sussex大学生物学教授;
各个植物种群分别占据不同的空间, 使群落具有稳定的结构。
各动物种群位于食物链的不同位置, 形成稳定的金字塔型生态结构。
天津大学管理与经济学部
演化博弈论的发展历程
传统博弈理性假设的局限性 思考2:现实中大量的人们行为,表现出来与完全理性假设不符的非 理性和有限理性特征,人类社会因此永远处于不可预知的无序冲突中?
略是纯策略在空间上的概率分布,纯策略是混合策略的特例。纯策略的
收益可以用效用表示,混合策略的收益只能以预期效用表示。
思考:种群产生可变行为(混合策略)的方式?
天津大学管理与经济学部
基础模型——鹰鸽博弈
天津大学管理与经济学部
拓展模型——全面树敌
天津大学管理与经济学部
两方对称博弈
博弈方2
鹰(H)策略
dx vc v x(u1 u ) x(1 x)[ x( 0) (1 x)(v )] dt 2 2 dx F ( x) 一般地可以把该复制动态方程简记为 dt
只要令复制动态方程中 F ( x)=0 ,即可接触所有的 复制动态稳定状态。不难知道,该复制动态最多有三
v vc v * x x =( v ) / ( v 0 ) 个稳定状态,分别是 、 =1 2 2 2
生命的演化—达尔文进化论
伟大的生物学家、进化论的 创立者查理· 达尔文,生于1809年, 英国人。达尔文在剑桥大学获得 学位后年仅22岁便乘“贝格尔” 号随船考察。1859年,达尔文出 版《物种起源》 。
天津大学管理与经济学部
演化博弈论的发展历程
演化博弈理论的思想渊源:
达尔文创立的生物进化论,提出在生存环境压力下生物种群特 征产生适应性进化的“自然选择”基本思想,成为理论滥觞。 经济学的演化理论可追溯到古典学派。1898年,凡伯伦就向经 济学家们提出了,“经济学为什么不是一门进化的科学?” 20世纪初马歇尔宣称,经济学家的麦加在经济生物学。 “经济学的分析目标应当在于经济生物学,而不是经济力学。 但是,生物学概念比力学的概念更复杂”——《经济学原理》 序言。 经济演化思想见于马克思、熊彼特、哈耶克等大师门的论著。 凡勃伦以后,数理经济学的巨大进展上使经济演化理论难以对 经济学产生影响。 演化经济学作为一门独立学科出现,则是20 世纪80年代。1982年,美国经济学家纳尔逊和温特出版了《经 济变迁的演化理论》一书,分析了企业惯例发生演化的过程。
天津大学管理与经济学部
基础模型——鹰鸽博弈
模型假设
设p为整个种群中选择H策略的频率; W(H)和W(D)分别表示H策略和D策略所带来的适应度 E(H,D)表示个体选择H策略而对手选择D策略所带来的回报 若每一个个体都只参与一个竞争
假想有一个无限的种群, 每一个成员都采取H策略或 D策略,且策略的选择是随 机的,在开始竞争之前, 所有的个体都有同样的适 应值
博 弈 方 1 鹰(H)策略 鸽(D)策略
鸽(D)策略
(V-C)/2, (V-C)/2 0,V
V,0 V/2, V/2
如图所示,争夺一种资源,其价值是v。如果鹰进攻而鸽默许,前 者得到资源后者一无所获(v,0)。如果双方都进攻或都被动, 则各方获得资源的机会均等。同时进攻,导致双方受伤,各自的 成本为c,概率是1/2。上述即为单一种群的策略式要素博弈。 种群的支付取决于选择鹰鸽策略分别在群体中所占的比例。
作者简介
1938年,毕业于伊顿公学,在读期间,他受到英国科学家霍尔丹的著
作的影响,沉迷于达尔文生物演化理论和数学的学习。 1939-1941,剑桥三一学院,工程学学位。工程技术,特别是应用数
学的系统训练对他日后生物学的研究产生了深远的影响。
1942-1947,飞机工程师。 1958,毕业于伦敦大学学院(动物学),师从遗传
衡ESS、演化均衡EE等均衡概念)。
天津大学管理与经济学部
演化博弈基础理论
演化博弈的基本分析过程:
随机组合博弈:生物系统或社会经济系统中存在着许多参
与者(可以分为同类群体和不同类群体),通过随机抽样 选出的参与者(代表某一特定的群体)进行预先规定好的 要素博弈,获得相应收益; 有限理性的行为:根据惯性行为的假设,参与者群体通过
释了为什么本质上是自私的个体能够和平共处甚至相互合作,
并用数学严格刻画了演化稳定策略(ESS)这一基础性的概念。 1982年,《演化与博弈论》,奠定了演化博弈论的理论基础。 1985年退休后,荣誉教授,发表了一百多篇论文。 2003年,最后一本著作——《动物信号发射》
天津大学管理与经济学部
代表作:
(1) Evolution and the Theory of Games (Cambridge Univ. Press, Cambridge). (2) The Theory of Evolution (Cambridge University Press 1993)
天津大学管理与经济学部
天津大学管理与经济学部
基础模型——鹰鸽博弈
动态演化
天津大学管理与经济学部
基础模型——鹰鸽博弈
天津大学管理与经济学部
基础模型——鹰鸽博弈
天津大学管理与经济学部
基础模型——鹰鸽博弈
演化稳定策略ESS的概念:
• ESS定义:对于非常小的正数ε,所有的σ≠σ*,满足:
u( , (1 ) ) u( , (1 ) )
1—x 的博弈方采用鸽策略。则采用两种策略的博弈方的期望得
益和群体平均期望得益分别为:
vc u1 x (1 x ) v 2 u2 v x 0 (1 x) 2
u x u1 (1 x ) u2
天津大学管理与经济学部
两方对称博弈
根据上述得益得到对称博弈的复制动态方程为:
演化博弈论的发展历程
传统博弈理性假设的局限性 博弈理论的研究对象:参与者互动过程中冲突与合作问题; 分析思路:
大量情绪、直觉、性格、感觉 等非理性的主观心理行为 实际行 为方式 的无序 化 为了对人们的互动行为 加以模型化分析, 必须进行合理的理论抽象 产生了博弈论的 “完全理性”概念
知识的未知状态、 不可预测性和多样性 等造成不同层次的有限理性
分析过程:假设参与者“完全理性”,通过推理演绎达到均衡化过程。
天津大学管理与经济学部
演化博弈论的发展历程
传统博弈理性假设的局限性 理性主义分析思路存在的问题: 强理性假设受到Binmore、Simon等许多学者的批评 “全知全能的荒谬理性无异于奥林匹亚山上无知不晓的神”—西蒙 思考1:自然演化形成的生物种群处于稳定状态,其互动的机理?
*
* 和 x =0
天津大学管理与经济学部
两方非对称博弈
有限理性的博弈方也会进行非对称博弈。这时候一个大群体成员间
随机配对反复博弈就不再是合适的分析框架了,必须用两个(或多
个)有差别的有限理性博弈方群体的成员,相互之间随机配对博弈 的分析框架进行分析。 鹰鸽博弈也可以是非对称博弈,因为当人们或者其他动物为了某件 事物发生冲突竞争时,所争夺的目标对冲突各方的价值并不一定是 一致的。例如,当一个国家试图侵略另一个国家,被侵略国家考虑 是否抗击入侵者时,双方所争夺的国土对前者来说意味着一块殖民 地,后者则是自己的祖国,显然对于双方来说价值是完全不同的, 对后者的价值通常要远远高于前者。
天津大学管理与经济学部
主要研究内容
a
b
演化博弈基础理论
对称与非对称演化博弈
c
演化博弈现实拓展
天津大学管理与经济学部
演化博弈基础理论
演化博弈理论的分析对象: 社会经济系统中有限理性的群体参与者通过各种具体的动 态学习模仿过程,如何达到稳定的均衡状态。 演化博弈理论主要解决的问题: (1)构建体现不同理性要求的动态学习模型; (2)运用稳定性理论,分析学习调整过程中均衡的稳定性 ,判断动态模型是否收敛到的Nash均衡(或者演化稳定均
博 弈 方 1 鹰(H)策略 鸽(D)策略
鸽(D)策略
(V-C)/2, (V-C)/2 0,V
V,0 V/2, V/2
一个个体时而采取H策略, 时而采取D策略
一个由鹰策略者和鸽策略 者构成的种群
天津大学管理与经济学部
基础模型——鹰鸽博弈
混合策略:在完全信息博弈中,如果在每个给定信息下,只能选择一种 特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下 只以某种概率选择不同策略,称为混合策略(mixed strategy)。混合策
天津大学管理与经济学部
基础模型——鹰鸽博弈
模型假设
两种动物为争夺价值为V的资源而展开竞争
参与竞争的个体将只采取以下两种策略中的一种:
鹰(H)策略 :战斗,仅当自己受伤或对手撤退时才停止 战斗 鸽(D)策略:炫耀,当对手开始战斗时立刻撤退
天津大学管理与经济学部
基础模型——鹰鸽博弈
博弈方2
鹰(H)策略
即对于群体中很小比例ε的突变行为σ ,采取σ *策略将获得更高 收益, σ *策略即为演化稳定策略。 • ESS定义的涵义:在一个群体处于Nash均衡状态(σ*, σ*)下,当少数变 异者持有变异策略σ入侵时,侵略将被击退,原均衡保持不变.
天津大学管理与经济学部
基础模型——鹰鸽博弈
博弈方2
鹰(H)策略
博 弈 方 1 鹰(H)策略 鸽(D)策略
鸽(D)策略
(V-C)/2, (V-C)/2 0,V
V,0 V/2, V/2
• 演化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。 • 对称博弈是演化博弈的基本模型,含义是两个博弈位置是无差异的。
天津大学管理与经济学部
两方对称博弈
假设在该群体中有比例为x的博弈方采用鹰策略,比例为
选取要素博弈的不同策略,形成了选取不同策略的比例分
布。 动态演化方程:在动态模仿过程中,上述比例分布是不断 变化的。根据不同的理性水平,分为不同的动态演化过程
天津大学管理与经济学部
演化博弈基础理论
演化博弈理论的基本要素:
群体(populations):生物系统或社会经济系统中存在着许多参与
学习能力——20世纪上半叶人类经历两次 大战后,吸取教训,建立磋商、合作、谈 判机制,维护了世界整体和平与稳定。 理性预期能力——核武器的出现,使得 人类第一次具有毁灭自己的能力,反而 维持了恐怖的核平衡。
沈阳918事变博物馆
《火与冰——核冬天》 作者:迈克尔· 罗文—罗宾森
天津大学管理与经济学部
演化博弈论的发展历程
动态的EE等概念。
天津大学管理与经济学部
基础模型——鹰鸽博弈
梅纳德· 史密斯(Maynard Smith)以鹰鸽博弈(hawk-dove game) 开始,成为生物学讨论演化稳定性的标准模式。 该博弈并不是表述老鹰和鸽子两种物种的个体之间对抗,而是同 一物种中不同行为类型的个体间的竞争关系:人类作为一个种群 ,具有鹰派好斗(hawkish)和 鸽派柔弱(dovish)的两面性, 伊拉克战争期间拉姆斯菲 尔德为首的鹰派和鲍威尔 为首的鸽派之间的分歧
者,可以分为同类群体和不同类群体, k1 。每个群体都有自己
的行动集合。 支付函数(payoff function):某种行动对应的收益。对于策略式博弈 表示的要素博弈,又称为适应度函数(fitness function),与参与者选 择的策略及其当前不同策略的比例分布有关。 动态(dynamics):反映群体参与者的学习、模仿过程,常见模仿 者动态模型; 均衡(equilibrium):反映演化的收敛稳定状态,包括静态的ESS、
1982年与Price一起提出了“演化稳定策略ESS”均衡概念, 为演化博弈理论的一个基本概念。他发起设立了许多奖 项,包括欧洲演化生物学会(European Society for Evolutionary Biology)建立 的John Maynard Smith Prize, 面向演化生物学界杰出的年轻学者。 成
相关文档
最新文档