第四章 进化博弈论
动物行为学中的进化博弈理论研究
动物行为学中的进化博弈理论研究动物行为学是研究动物行为的学科,是现代生态学、生物学、心理学和社会学等学科的重要组成部分。
动物行为学的研究对象是具有生命特征的动物,主要研究它们的行为和行为背后的生理机制、进化历程以及环境和社会因素等方面。
其中,进化博弈理论是动物行为学研究中的重要方法和理论基础之一。
进化博弈论是一种用游戏论的方法研究生物进化的理论。
它模拟了个体之间的相互作用和竞争,研究了不同策略的演化及其对个体数量和群体结构的影响。
进化博弈论主要包括两大类博弈:一个是零和博弈,另一个是非零和博弈。
零和博弈是指参与者的利益完全对立,一个人的赢利必然导致另一个人的损失;而非零和博弈则是指参与者的利益不完全对立,即一个人获得好处不一定导致另一个人的损失。
在进化博弈理论中,个体的策略越具有适应性,其在群体中的生存和繁衍就越容易获得优势。
进化博弈论的应用在动物行为学中主要是探究动物间的竞争和合作关系。
动物遵循的交互策略可以追溯至其进化历史和适应环境中的生存需求。
如著名的鹰鸽博弈,在这个博弈中鹰会攻击鸽子并得到食物,鸽子会因此死亡;如果遇到两只鹰,它们会进行搏斗直至一方被杀死。
这样的策略是基于生物的基因编程,以及遗传变异和自然选择的结果。
近年来,进化博弈理论在动物行为学的研究中得到了广泛应用。
例如在群体动物中,进化博弈论可以解释为什么个体在取得財富和获取资源时会出现不同的策略。
举个例子,蚂蚁是非常有组织性的社群生物,它们之间会分工合作,完成不同的任务。
由于生存空间有限,种群之间的竞争很激烈。
如果一只蚂蚁选择的是搜寻食物,而另一只蚂蚁做的是攻击敌人,那么搜寻食物的蚂蚁就有更多的机会获取食物,因此这个策略就会被传承下去,进而大家都遵循这个策略。
除了群体动物,进化博弈理论在其他动物行为的研究中也存在广泛应用。
例如,在进化中,动物会根据风险和收益的情况选择最优策略。
在选择策略的时候,动物会明智地平衡自己的收益和风险。
竞争和合作的进化博弈理论研究
竞争和合作的进化博弈理论研究竞争与合作一直是人们关注的话题,同时也是涉及到人际关系、组织管理、市场竞争等各个领域的热点问题。
如何在竞争与合作之间创造出良好的平衡,是人们长期以来努力解决的问题。
进化博弈理论可以帮助我们更好地理解和解决这个问题。
进化博弈理论源自于生物学领域中对群体行为和生物间相互作用的研究。
其基本思想是以自然选择为出发点,探究动物或人类在不同环境下的行为模式,从而揭示生物间相互作用的规律和演化过程。
进化博弈理论认为,生物在某种程度上会依照“自私原则”行事,然而,在一定条件下,合作交互作用也可以取得理想的效果。
这一理论可适用于组织管理、市场竞争等其他领域,来解析个体之间的行为规律、彼此关系及其演化过程。
竞争与合作的深刻内涵往往会在人们的行为中展现出来。
例如,在组织中,工作机会和晋升机会总是有限的,这就需要组织成员竞争,以获得更好的机会。
然而,如果过分强调竞争则会导致交流紧张、信息不对称等问题产生,从而影响组织效率。
相反,适度的合作交互作用有助于缩短组织运转时间、提高效率和资源利用率。
因此,如何找到竞争与合作之间的平衡点,便是组织管理中的重点课题。
另一方面,在市场竞争中,企业之间往往互相竞争,争夺市场份额。
如果企业过分竞争,不愿和其他企业合作,就会难以吸引合适的顾客和市场资源。
而在一些情况下,企业的合作又可以形成反向合作,各个企业共同维护市场秩序,以实现彼此的利益。
因此,如何在竞争的同时进行合作,既保证企业竞争实力,又维持市场稳定,是市场竞争中需要解决的问题。
进化博弈理论针对这些问题提出了有效的解决方案。
其基本模型是:个体之间的交互都是博弈过程,每个博弈的个体有不同的收益,博弈后会根据参与者的收益对个体进行自然选择。
通过建立数学模型,进化博弈理论能够模拟人类在不同场景下的决策行为,并对可能产生的结果进行预测和解析。
例如,研究者对博弈中的实验对象设定了不同的策略,有的人选择的是合作策略,有的人则选择的是竞争策略,通过不断反复的交互,便可以发现合作策略相对于竞争策略的稳定性较高。
进化博弈基本动态理论
摘要本文主要介绍进化博弈理论的基本动态模型:对称博弈模仿者动态模型和非对称博弈模仿者动态模型及其相关结论。
为了便于理解,在文中引用了一些简单的例子说明它们之间的区别与联系。
在此基础上文中还介绍了理论家们对随机动态所进行的相关研究及其所取得的理论成果。
最后本文比较了经典博弈理论②与进化博弈理论在动态概念上的差别。
关键词:进化稳定策略⑩;模仿者动态;随机稳定均衡进化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。
进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。
进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。
动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的强化动态③(Reinforcement Dynamics)模型等等。
但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonker(1978)提出的模仿者动态(Replicator Dynamics)模型。
模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。
本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。
一、确定性模仿者动态一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。
进化博弈论
进化博弈论
1. 2. 3. 4. 进化博弈论概念 进化博弈论产生及其发展 进化博弈论基本内容 进化博弈论的应用
一、进化博弈论的概念
传统的博弈论由于对参与者完全理性 的假定,得出的结果往往与实际相差很远。 进化博弈来源于对生态现象的研究, 为经济学研究提供了一个全新的分析方法, 较好地克服了新古典经济学及经典博弈理 论中理性假定及多重均衡的困难,能够更 加现实地解释经济现象。
行
26(合作)
216,360
324,324
设合作者的比例为x(0<x<1),则有: 一个典型的合作者的期望支付为 324x+216(1-x) 一个典型的背叛者的期望支付为 360x+288(1-x) 谁更具有适应性?
谢谢!
四、进化博弈论的应用
进化博弈理论还没有形成学术界一致认 可的理论体系,其基本框架仍然处于数理 研究阶段,但它提供了一种全新的分析问 题的方法。在解释社会制度形成、行业发 展趋势、社会习俗演化等现象,获得了极 大的成功。
囚徒困境
列
20(背叛) 20(背叛) 288,288 26(合作) 360,216
观察群体行为的历史
• 对参与人来说,观察群体行为的历史即估算群体分布是非常重 要的。 • 首先,群体分布包含了对手如何选择策略的信息。 • 其次,通过观察群体分布也有助于参与人知道什么是好的策略 什么是不好的策在进化过程中淘汰,模仿是学习过程中的一个重要组成部 分,成功的行为不仅以说教的形式传递下来,而且也容易被模 仿。 • 参与人由于受到理性的约束而其行为是幼稚的(Naive),其决 策不是通过迅速的最优化计算得到,而是需要经历一个适应性 的调整过程,在此过程中参与人会受到其所处环境中各种确定 性或随机性因素影响。因此,系统均衡是达到均衡过程的函数, 要更准确地描述参与人行为就必须考察经济系统的动态调整过 程,动态均衡概念及动态模型在进化博弈理论中占有相当重要 的地位。
进化博弈理论的均衡概念及其拓展
进化博弈理论的均衡概念及其拓展论文报告:进化博弈理论的均衡概念及其拓展研究1. 介绍进化博弈理论的基本概念和历史背景进化博弈理论是一种利用数学模型来研究生物演化行为的理论框架。
它建立在博弈论的基础上,通过对生物演化中基因的选择过程进行模拟,来解释动物行为、遗传进化、社会合作等现象。
进化博弈理论的出现为我们揭示了生物演化过程的新视角,深刻影响了一系列研究领域,如经济学、社会学、生态学等。
2. 论证进化博弈理论的均衡概念进化博弈理论所研究的对象是动态演化过程中的均衡状态。
所谓均衡状态,即当个体在当前环境下选择某种策略时,该策略能够实现最大化收益或最小化风险,且不能被其他策略所替代。
如果出现新的策略,它只有在该策略可以带来更高的收益或更小的风险时才能够被接受,否则就会被淘汰。
从进化博弈理论的角度来看,这种均衡状态能够在演化过程中稳定存在,并不断改进和优化。
3. 探讨进化博弈理论的拓展研究随着研究的不断深入,进化博弈理论不断拓展和完善。
其中主要包括进化模型的变化、策略分类的拓展和类固醇博弈的研究等。
例如,如何在爆炸式增长的人工智能领域中研究进化博弈模型,策略分类的拓展从简单的合作和竞争,到涵盖合作、有限合作和纯自利;类固醇博弈主要是在传统进化博弈的基础上,引入异位互惠机制和抗感染机制等新因素。
4. 分析进化博弈理论的应用领域进化博弈理论作为一种生物学理论,其研究对象并不仅限于生物圈,其应用领域之丰富多彩。
例如,在经济学领域,进化博弈理论可应用于研究市场竞争、战略选择、决策分析等领域;在社会学领域,可应用于解释激励合作行为、规范社会道德行为等。
5. 展望进化博弈理论的未来研究方向进化博弈理论作为一种新兴的研究方法,仍有着许多未解决的问题及待探索的领域。
未来的研究应着重于探讨复杂环境中的进化演化过程、进化博弈中的自动化学习研究、人工智能应用的深入研究等。
五个案例:1. 研究员发现一种动物在群体合作中不断进化和优化的模式,通过应用进化博弈理论,成功分析到该动物顺应环境变化而形成的进化过程,从中推断出一系列新的合作策略。
进化博弈
• 比如,尽管不时出现一些大权在握的战 争贩子,但随着经济发展水平的提高和 富裕程度的提高,战争的可能性在下降。
• 比如,日本还会重新成为军国主义道路 吗?
• 例2例3是同一类型的进化博弈,例1是 另一类。差别之处在于,博弈方调整和 改变自已策略的能力和速度。例1中快, 例2例3中慢。
0
0.5
1
X
• 这个例子的背景是博弈方数量很大,学 习速度很慢。这类情况下博弈方的策略 调整过程称为“复制动态”。
例3:鹰鸽博弈1——好战分子 与和平主义者的人数对比
• 双方要瓜分利益为2。 如果鸽鸽相遇,则和 平均分,各得1,无 损失;如果鹰鸽相遇, 鹰 则鹰得2,鸽得0; 如果鹰鹰相遇,会有 战斗并造成损失4, 鸽 而胜率各为50%。 鹰 -1
0
鸽 -5 2
2 1
0
1
分析:
• 鹰太少的时候,鹰占 便宜的机会多,会诱dx/dt 导更多的人变为鹰; 太多的时候则占便宜 的机会下降,并不有 利。这里因为相争的 好处没变,损失加大, 做一支鹰的诱惑减少, 本例中的均衡鸽博弈是研究动物世界和人类社会中 普遍存在的竞争和冲突现象的经典博弈, 鹰鸽博弈的进化分析则可以揭示人类社 会或动物世界发生战争或激烈冲突的可 能性及其频率,国际关系中霸道和软弱, 侵略与反抗,威胁与妥协等共存的原因 等。
dx/dt=x(uy-u*) • 假设开始时,习惯于 选择同意的博弈方在 dx/dt 总人数中所占比例为X (0<X<1),由于选择 同意明显有利,所以 随着博弈的反复进行, X会增加。增加得是快 是慢取决于选择同意 的好处的大小以及选 择同意的示范户是多 是少
0
0.5
1
X
dx/dt=x(uy-u*) • dx/dt表示与人方便者 dx/dt 所占比例的变化速度 • uy表示与人方便者或 采取合作策略者的预 期得益
博弈论08 进化博弈4
博弈论上次课小结重复博弈就是同样结构的博弈重复进行。
重复博弈属于动态博弈。
可以按重复次数分为有限次重复博弈和无限次重复博弈。
有限次复常常不会改变局中人的选择。
无限次重复博弈没有最后一次,局中人有可能通过选择合作策略获得高收益,但能否实现高收益还取决于局中人对未来的重视程度。
采用以牙还牙策略有可能获得高收益。
蜈蚣博弈逆推归纳法是动态博弈分析中的基本方法,但用该方法推导出来的均衡结果是否合理一直是动态博弈研究中的一个疑问,因为许多博弈实验结果与理论推导结果相去甚远。
例如蜈蚣博弈:蜈蚣博弈上面的蜈蚣博弈中,博弈进行得越久,双方的收益差异越大。
如果双方的收益相差无几,是否也会出现类似的结果呢?乘客困境两个人从一个盛产瓷花瓶的地方旅行归来,他们都买了同样的花瓶。
提取行李的时候,发现花瓶被摔坏了,他们一起向航空公司索赔。
于是,航空公司请两位旅客在2元至100元之间各自写下花瓶的价格。
如果两个人写的一样,航空公司将认为他们讲的是真话,于是按照写的价格如数赔偿;如果两个人写得不一样,航空公司就论定写得低的旅客讲的是真话,并且原则上按照这个价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。
乘客困境从为了获取最大赔偿而言,甲乙两个乘客的最佳策略是都写100元。
但是,比如甲很聪明,他想如果我少写1元变成99元,而乙会写100元,这样我将得到101元,何乐而不为呢?所以他准备写99元。
可是乙更加聪明,他算计到甲会算计他而写99元,因而他就准备写98元。
想不到甲还要更聪明一层,他计算出乙要写98元来坑他,他就准备写97元。
如此下去,精明比赛的结果就是两个人都写2元,这也是这个博弈的唯一纳什均衡。
进化博弈我们是普通人,不是神仙,也不是圣人,不是天生的赢家,我们总是缺乏分析判断能力,记性也不是很好,还常常失去理性,甚至做出错误决策。
但我们又是聪明的,我们善于模仿,我们能够总结经验,我们可以从错误和失败中学习正确的、成功的做法,逐步成为赢家。
进化博弈理论及其应用的文献综述
进化博弈理论及其应用的文献综述进化博弈理论的思想起源于生物学领域,以有限理性的参与人群体为研究对象,考察群体行为的进化趋势。
其应用主要在社会行为、经济行为和制度的演化方面,是研究在非理性人条件下的群体决策行为的重要研究方法。
标签:进化博弈文献综述一、进化博弈的基本理论进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。
进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。
正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。
二、进化博弈理论的应用研究1.社会行为领域Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。
它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。
Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。
个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。
Sandholm对个体行为偏好的进化进行了动态分析。
Juang从进化的视角研究了规则的进化与均衡的选择问题。
Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。
2.制度的演化青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。
演化博弈理论(进化博弈论)
ESS - Example 1
Bishop-Cannings Theorem: If I is a mixed ESS with support a,b,c,…, then E(a,I) = E(b,I) = … = E(I,I). At a stable polymorphic state, the fitness of Hawks and Doves must be the same. W(H) = W(D) => The ESS given is a stable polymorphism.
j xj(t)[1 + (j,x(t))] = v(x(t))
xi(t+) = xi(t)[1 + (i,x(t))] v(x(t))
RD - Example 2
Assumptions : overlapping generations, discrete time model. xi(t+) - xi(t)= xi(t)[ (i,x(t)) - v(x(t))] 1+ v(x(t))
Evolutionary Game Theory (EGT)
Has origins in work of R.A. Fisher [The Genetic Theory of Natural Selection (1930)]. •Fisher studied why sex ratio is approximately equal in many species. •Maynard Smith and Price introduce concept of an ESS [The Logic of Animal Conflict (1973)].
进化博弈论
进化博弈论进化博弈论是一门研究人与其他动物(包括昆虫和其他物种)之间的性的、社会的和经济的行为的学科。
它也是一种分析动物之间的比较方法。
实际上,进化博弈论有时也被称为“比较行为学”,因为它与传统动物行为学(也称为行为生态学)具有明显的差异。
进化博弈论假设,人类和其他动物之间的行为模式是由进化产生的,而进化,又是一种种群整体行为的结果,其中每个个体都希望从该行为中获得自身利益最大化。
进化博弈论的基本想法是,动物和/或人之间的某种特定行为策略最终会被自然选择,因为它们提供了相对于其他行为策略的优势,并增加了这些物种在未来世代中的可能性。
进化博弈论可以从不同角度来解释动物和人之间的行为。
例如,在自发抉择的情况下,进化博弈论研究表明,动物的行为可能会基于某种“自身福利”标准,其中某些行为可能提供动物个体最大的收益。
同样,在社会中,进化博弈论也可以解释人的行为,例如是否为别人做出牺牲。
在进化博弈论的研究中,科学家们研究了不同物种之间的行为,以及不同环境中的各种行为结果,以此来理解行为背后的机制。
例如,研究人员正在尝试探究鸟类是如何利用社会行为来建立优势的。
一项研究发现,在大部分情况下,鸟类会朝互利的方向发展,而不是自利的方向。
另一项研究发现,羊驼和羊群之间的社会行为也具有可预测的模式,这也表明,进化博弈论可以帮助我们理解动物之间社会行为背后的机制。
此外,进化博弈论不仅可以用于研究动物之间的行为,还可以用于研究人与人之间的行为。
在人类社会中,进化博弈论也可以解释不同社会群体之间的某些行为,比如偏见与冲突之间的关系。
由于这一理论对于比较动物和人类之间的行为策略的能力,它经常被用来解释不同社会群体之间的行为差异和争议。
此外,由于进化博弈论可以帮助人们更好地理解社会性质的行为,它也可以被用来解释人类行为的某些方面,比如如何在竞争环境中获得最大的利益。
总之,进化博弈论是一种用于研究人与其他动物之间行为的学科。
它不仅可以帮助我们理解动物之间的行为,而且也可以帮助我们理解人类之间的社会性行为。
演化博弈理论进化博弈论.ppt
ESS - Definition
Standard Definition for ESS (Maynard Smith).
If a > c, then s1 is ESS.
s1 s2
If d > b, then s2 is ESS.源自s1 s2a cb d
Otherwise, ESS given by playing s1 with probability equal to (b-d)/[(b-d)+(a-c)].
ESS - Example 1
Agent Rationality
In GT, one assumes that agents are perfectly rational. In EGT, trial and error process gives strategies that can be selected for by some force (evolution - biological, cultural, etc…). This lack of rationality is the point of departure between EGT and GT.
I is an ESS if for all J I, E(I,I) E(J,I) and E(I,I) = E(J,I) E(I,J) > E(J,J)
where E is the payoff function .
ESS - Definition
动物竞争中的进化博弈理论与应用
动物竞争中的进化博弈理论与应用进化博弈论是研究生物竞争及合作进化的数学模型。
在动物王国中,不同物种之间的生存竞争和繁殖竞赛,就是一个充满博弈策略和身体机能进化的漫长历程。
那么,动物竞争中的进化博弈理论与应用是如何影响着动物世界,让我们在下文中探讨一下。
一、动物竞争中的进化博弈理论1.博弈策略与身体机能的进化在动物界中,竞争条件是十分严峻的。
动物们必须竭尽所能地尽可能地增强其生存能力和繁殖能力。
换言之,动物必须在繁殖竞争和食物争夺战中拥有更好的策略和身体机能。
以游戏论为例,进化博弈理论是通过探讨个体选择策略与族群演化之间的关系,来衡量个体在不同选择策略下的表现。
在动物界中,也存在类似的行为表现。
比如,狮子们在打猎的时候,会根据猎物的情况变化,考虑自己的攻击范围和邻近同伴的分布,制定最佳的猎杀策略。
而猎物则通过自身的反击能力以及躲藏技巧等,增强自身的生存能力。
2.竞争策略和合作策略的选择在动物界中,有竞争也有合作。
对于同一物种的个体而言,合作是为了共同获得更好的食物、移动和繁殖条件。
这种合作也是建立在每个个体通过进化博弈,选择适宜的策略。
而这种策略选择也可以是积极的,比如说,在狮子集体打猎中,成年狮子可以在猎杀之后将猎物剩下的一部分分给幼年狮子;或者是被动的,比如在蜜蜂进巢时,排在最前面的蜜蜂会摧毁其他蜜蜂造成堵塞的树枝和石头等障碍物,以便后续的蜜蜂进入巢穴。
二、进化博弈论在动物学应用1. 好的竞争策略的研究进化博弈论可以很好地解释多种动物之间坚持的竞争策略。
通过针对一种动物的竞争活动进行建模,即可以为研究人员提供预测动物竞争中多种策略的基础。
比如,研究人员使用进化博弈论来研究狮群中狮子之间的竞争策略。
在活动中,成年雄狮之间必须通过自己的威信地位,来争夺配偶和资源。
研究者通过数学模型和实验,发现雄狮之间的参与竞争的比例,直接影响了雌性狮的表现和繁殖成功率。
在进化博弈理论的引领下,科学家们可以更好地解释各种动物间的竞争策略,并在此基础上探讨出更优的科学研究方案和调控手段。
进化博弈理
博弈论(Game theroy)
又称对策论,是研究具有斗争或竞争性质的现象的数学理论和方法。 一般把具有竞争或对抗性质的行为称为博弈行为,在这类行为中, 参加斗争或竞争的各方具有不同的目标和利益(赢得),为了达到各 自的目的,各方必须考虑对手的各种可能的行动策略,并力图选取 对自己最为有利或最合理的策略。 进化博弈理论融合了进化论和博弈思想,自然选择作用下的性状或 行为的进化过程被看作是博弈过程.博弈中的参与者是生物个体, 策略是它的某种性状或行为。如树的高度、种子的大小、攻击行为、 合作行为等。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决 方案。以全体利益而言,如果两个参与者都合作保持沉默,两人 都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判 刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且 只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果 二人判决均比合作为高,总体利益较合作为低。这就是“困境” 所在。例子漂亮地证明了: 非零和博弈中,帕累托最优和纳什均衡是相冲突的。
进化是对生命系统的设计和功能进行解释的最强有力的途 径,其思想已经渗透到了生物学的所有领域。原则上,进化生物 学能够说明生命世界五彩缤纷的多样性和令人惊异的复杂性。尽 管进化博弈思想从萌芽至今才短短几十年,但是它已经被广泛应 用到生物学的各个领域,它可以很好的描述基因、病毒、人类之 间的相互作用,此外,它也已经渗透到人类学、经济学、哲学、 政治、进化心理学等各个领域。
工蜂自愿放弃繁殖能力,而抚养蜂后的后代 。
哥斯达黎加有一种叫吸血蝠的蝙蝠,吸血蝠以热带地区大动物的 血为主食。这种蝙蝠的新陈代谢异常活跃,两夜吃不到血,就会 饿死。事实上,在吸血蝠之间相互哺血的情况是经常出现的,吃 饱的蝙蝠倒挂在洞穴的天棚上吐血,而挨饿的蝙蝠则在下面接血 喝。(完全利他行为)
进化博弈基本动态理论
进化博弈基本动态理论一、进化博弈基本动态理论概述进化博弈理论基于遗传学和生物进化学思想,将生物进化与博弈论相结合,从而形成一种新的理论模型。
其基本思想是博弈参与者的选择行为和赢利条件随时间变化而逐渐进化,最终达到一种动态稳定的平衡状态。
二、博弈参与者的策略选择在进化博弈中,参与者的策略选择通常分为两种类型:基于群体的策略选择和基于个体的策略选择。
基于群体的策略选择是指博弈参与者在探索不同策略的同时,还要考虑到团队选择的影响;而基于个体的策略选择则主要考虑到个体赢利的最大化。
三、动态与稳定的游戏均衡状态博弈模型中的稳定状态通常指的是一种均衡状态,这种状态在一定条件下始终保持不变。
通过进化博弈的思想,我们可以更加全面地理解博弈模型中的动态特性,即博弈中参与者策略的选择和赢利条件随时间变化而逐渐进化。
四、进化博弈在经济学中的应用进化博弈理论在经济学领域中的应用非常广泛,如博弈经济学、商业竞争与战略等,对经济行为及其演变规律进行了深入研究。
进化博弈在理解市场竞争、企业战略以及社会组织行为、政策制定等方面的应用都具有重要的意义。
五、进化博弈在环保领域中的应用近年来,进化博弈理论在环保领域也得到了广泛应用。
通过研究群体生物行为中的策略选择规律,可以有效地提升生态系统的稳定性,同时解决环境保护方面的重大问题,具有巨大的实际应用前景。
案例分析:1、某车厂采用价格竞争策略的演变计算某车厂推出一款新车型,并进行了几轮价格竞争。
通过建立进化博弈模型,我们可以发现,随着时间的推移,厂商的竞争对手可以逐渐学习到其价格策略,从而对其进行有针对性的反击。
最终,在竞争对手的不断反击下,车厂的利润逐渐减少,产生了相应的改变。
2、主持人掀起数据分析“策略大乱斗”在社交媒体上,某位主持人掀起了一场数据分析“策略大乱斗”,吸引了众多参赛选手投稿参赛。
通过分析参赛选手的投稿及策略选择规律,我们可以发现,参赛选手从最开始的“随机选择”,逐渐向“选票策略”、“合作策略”等博弈策略转变,最终形成了一种诸多博弈策略并存的状态。
进化博弈论
进化博弈论
进化博弈论是一种行为学方法,用于研究动物社会行为的演变。
它以进化理论为基础,利用博弈的观点来分析动物如何改变自己的行为来适应当下环境变化,以获得更大的生存福利。
进化博弈论框架可以用来解释动物和其他种群如何演化出适应变化环境的行为策略,以及如何改善社会行为。
进化博弈论的主要概念是:物种是在竞争中演变而来,它们在不断地改变行为以获得更大的生存福利,这种行为就是进化,而博弈则通过分析行为的可能组合,来研究物种之间的竞争关系。
进化博弈论的实际应用
动物的行为的改变受制于环境的变化,而进化博弈论框架可以帮助我们理解动物如何改变自己的行为,以应对变化的环境。
进化博弈论框架可以用来解释不同物种之间的竞争和合作行为,以及种群如何演化出更适应性的行为策略。
此外,进化博弈论也已经被用于研究其他社会行为,比如人类之间的财富分配和政治观点。
进化博弈论也在人工智能和机器学习领域中得到了广泛的应用。
它可以用来研究人工智能的策略学习,并为智能机器人编写适当的算法。
机器学习、自然语言处理和生物信息学也是这个领域的重要应用之一。
最后,进化博弈论可以帮助我们更好地理解动物社会行为的演化和变化,以及其他生物类之间的竞争关系,从而为解释现今动物及其他生物类行为提供理论基础。
它的应用领域也在不断发展和拓展,涵
盖了计算机科学、机器学习、自然语言处理,以及其他更多的领域。
进化博弈理论及应用
下 面,建立一个一般两人非对称博弈模 型,并推到 出复制动态和进 化稳定策略 。假设博弈方 A、B分别 来 自不 同的两个群 体 M,N,来 自 群体 M 的个体有两个可选策略 ,其中选 择策略 1 的 比例为 X ,选择策 略 2的比例为 1 一 X ,来 自 群体 N的个体也有两个可选策略 ,其中选择策 略 3的比例是 Y ,选 择策略 4的比例 为 1一Y 。我们 以群体 中选择 相应策 略 的个体 的比例来近似表示来 自此群体中的个体选择相应 策略的概率 。博 弈方 A ( 策略 1和策略 2 ),博弈方 B ( 策略 3和策略 4) ,对 应的收益
本 文 的 结构 本文首先 给出进化博弈论两 个重要概 念即复制动态方程和进化稳定 策略的说明,然后建立起一个一般两人非对称博弈模型 ,应用进化博弈理论 推导出稳定状态,并在此基础上以中菲黄岩岛对峙事件为例做简单应用 。 二 、进 化 博弈 论 的两 个 重 要 概 念 的 说 明 复制动态方程 :通常情况下 ,博弈方学 习的速度 取决于 两个 因素 , 是模 仿对象 的数量大小 ( 可用相应类型博弈 方的 比例 表示 ) ,因为 这 关系到观察 和模仿 的难易程度 ,二是模仿对象的成 功程度 ( 可用模仿对 象策略得益超过平均得益的幅度表示 ) ,因为这关 系到判断差 异的难 易
进 化 博 弈 理 论 及 应 用
陈 浩 武 彬
摘 要 :博弈论是 2 0 世纪后 5 0年新兴的研 究领域 ,因其在商业、拍卖、军事、生物 学和博彩等方 面的广泛应 用,越 来越被人们所 关 注。博弈论源于数 学,不过从一开始 ,博弈论研 究就不仅 包含 了数 学方 法,还融入 了实验 手段 ,如今 ,博 弈论 已经跨越 多个学科 ,广泛应 用与经济学、政 治学、哲 学、商业和 国际关 系学的分析之 中,成 为理解人类行为的有力工具 。本 文主要讨论博 弈论 中的一个 重要 分 支 一进 化 博 弈 论 ,进 化 博 弈 理 论 是 经 济 学 研 究 方 法 的 一 次创 新 ,该 理 论 从 否定 传 统 理 论 赖 以成 立 的 基 础— — 理 性 人 假 定 出发 而 建 立 起 来 一 个 新 的 分析框架 ,它结合 了生态学、社会学 、心理学及经济学的最新发展成果 ,从有 限理性的社会人 出发来分析参与人 的资源配置行 为。 关 键 词 :博 弈论 ;应 用 ;不 足
进化博弈综述
进化博弈综述进化博弈是生物进化论和博弈论结合的产物。
首先,给出了进化博弈的最基本的均衡概念(进化稳定策略: ESS) ,并讨论了它在不同条件下的拓展。
其次,分析了进化博弈的动态概念,并主要讨论了一种应用非常广泛的动态(模仿者动态) 。
最后,简要介绍了进化博弈的应用领域和发展前景。
标签:进化博弈进化稳定策略模仿者动态进化博弈理论是生态学家Maynard Smith and Price (1973) 在结合生物进化论与传统博弈理论的基础上提出的,以进化博弈理论的最基本均衡概念——进化稳定策略的提出为诞生的标志。
进化博弈理论创立之初是生物学家用来研究生物进化的。
近些年来,由于它在生物学上的巨大成就而被引入经济学,成为经济学常用的博弈论的一个热点领域。
传统的博弈论由于对参与者完全理性的假定,得出的结果往往与实际相差很远。
这也要求博弈论学者有时必须假定参与者的理性是有限的才能更好的应用和发展博弈论。
也正是在这种情况下,进化博弈的出现无疑给博弈论注入了新的活力,也克服了传统博弈论在理论和应用上遇到的尴尬局面。
一、进化博弈的均衡概念传统的博弈论中有许多均衡概念,例如,Nash均衡、子博弈精练纳什均衡、贝叶斯纳什均衡、精练贝叶斯均衡、恰当纳什均衡、完美纳什均衡等等,对这些均衡的研究一直是博弈论的核心内容。
同样作为进化博弈论均衡概念的进化稳定策略在进化博弈的研究中也是至关重要的。
不过,两者之间却存在着很大的差别。
经典博弈论的各种均衡都是建立在参与人是理性的基础上,而进化稳定策略则是进化博弈考虑参与者为有限理性的基础上的均衡结果。
进化稳定策略都是完全理性博弈的纳什均衡,是纳什均衡中对有限理性有稳健性的一部分。
因此,进化稳定策略可以看作是对纳什均衡的一种选择精练。
1.进化稳定策略的定义进化稳定策略是Maynard Smith and Price(1973)以及Maynard Smith(1974)在考察种群个体适应性由各个个体行为共同决定的环境下,个体对成功策略选择效果时提出的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
最优反应动态模拟:初次博弈1个A
A
B
A A B A B B A
最优反应动态:有快速学习能力的小群体成员的 反复博弈 复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈 进化稳定策略(ESS)
4.2 最优反应动态
4.2.1 协调博弈的有限博弈方 快速学习模型 4.2.2 古诺调整过程
4.2.1 协调博弈的有限博弈方快速学习模型
考虑5个有限理性的局中人之间,相邻局中人相互 博弈,快速学习并动态调整。
4.1.3 合作的行为生态
动物的适应性是在和生存环境的相互作用中形成的。 在竞争中,动物最终选择进化稳定策略(Evolutionary Stable Strategy,简称ESS)——该策略是被种群大多数 成员所采取的,而且不会受到其它对策的侵蚀。 一种ESS一旦确立,社会稳定下来,偏离的行为将 会受到自然的惩罚。 有利它主义和合作行为在动物界普遍存在。该行为 也可能发生在没有亲缘关系的情况:如共生现象。
这时博弈分析的核心不是博弈方的最优策略的选择, 而是有限理性的博弈方组成的群体成员的策略调整过 程、趋势和稳定性,这里的稳定性是指采用特定策略 的成员的比例不变,而非某个博弈方的策略不变。
引例: 签协议博弈的复制动态和进化稳定策略
签协议博弈:
局中人2 同意(y) 不同意(n) 同意(y) 不同意(n)
最优反应动态模拟1 博弈方1 博弈方2 2. 32 1.5 1.75
dr 1 2 收敛条件 | dr || | 1 dq2 dq1
问题:两寡头始终假设对方产量不变
4. 3 复制动态和进化稳定性: 两人对称博弈
设某一群体进行随机配对重复博弈,且该博弈为 对称博弈,即群体中个体无角色区分,所有个体 均具有相同的战略空间。
1,1 0,0 0,0 0,0
在有限理性的前提下,并非所有的局中人开始就能 找到最佳策略(y, y)。下面分析(y, y)是ESS。 假设群体中采用“同意”比例为 x ,则不同策略期 望得益和总平均得益为:
uy x 1 (1 x ) 0 x un x 0 (1 x ) 0 0
u x uy (1 x) un x
2
所以,除x=0外,有: uy x 1 (1 x ) 0 x
u y un , u y u
un x 0 (1 x ) 0 0 u x uy (1 x) un x2
在不断的重复博弈过程中,只要局中人有基本的 判断能力,早晚会发现该差异。于是,得益较差的 局中人会或早或迟模仿另一方。 这意味着两种类型局中人的比例x和1-x不是固定不 变的,而是时间的函数: x(t)和1-x (t)。 局中人策略类型比例的动态变化是进化博弈分析 的核心。
上述比例动态变化的速度取决于模仿的速度。该 速度取决于两个因素:
(1)被模仿对象的数量大小(可用x表示);
(2)被模仿对象的成功程度(可用模仿对象的期 望得益超过平均得益的幅度表示,即 u y u )。 所以,上述比例动态变化的速度可以表示为下列 微分方程:
dx x ( u y u) dt
以采用“同意”策略类型局中人的比例为例,其动 态变化速度可用下列微分方程反映:
dx x ( uy u) x ( x x 2 ) x 2 (1 x ) x 2 x 3 dt
dx x ( uy u) x ( x x 2 ) x 2 (1 x ) x 2 x 3 dt
4.1 有限理性与进化博弈论
第四章 进化博弈论
4.1.1 进化博弈的基础假设——有限理性 传统的博弈均衡,例如Nash均衡及其精炼是以 完全理性都是共同知识(common knowledge)为 前提的。 然而,完全理性在现实中很难满足,当社会经 济环境和决策问题较复杂时,人们必须存在很大的 理性局限。有限理性对人们的决策、行为选择方式 有很大影响,有限理性基础上的博弈分析与完全理 性博弈分析也有很大区别。进化博弈分析是有限理 性博弈分析的基本框架。
4.1.4 有 限 理 性 博 弈 的 分 析 框 架
在有限理性博弈中具有真正稳定性和 较强预测 能力的均衡,必须是能够通过博弈方的模仿、 学习 的调整过程达到的,具有能经受错误偏离的干扰 的 均衡,是在受到少量干扰后仍然能够“恢复”的均衡。
4.1.4 有 限 理 性 博 弈 的 分 析 框 架
局中人2 局 中 人 1
1
A
A B 50,50 0,49
B
49,0 60,60
5 4 3
2
两个NASH均衡,但考虑到对对方理性的信任 问题,风险态度等因素,可能选(A,A)。
局中人2
局 中 人 1
A
A B 50,50 0,49
B
49,0 60,60
反应、策略调整规则推导
xi ( t )表示在t 时期,局中人i 的邻居中采用A 策略的数量; 则采用B策略的数量为2-xi ( t )。 则局中人i :
4.1.2 有限理性及其对博弈的影响
有限理性局中人:不满足完全理性假设的局中人 有限理性意味着一般至少有部分局中人不会采用完 全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次 性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性局中人会在博弈过程中学习博弈通过试错 寻找较好的策略
B
B B
B
A B B
A
A A A A A A
A A
初次博弈相邻2个A
B
A
A A A A A A
B
B A
A
B A A
初次博弈相连3个A
A
B B A A A A
A
A A
5.2.2 古诺调整过程
古诺模型反应函数
q1 3 q2 q2 2 q 3 1 2
3 2.125 2.25 4……… 1.875 1.9375