第_7_章_进化博弈论简介汇总
动物行为学中的进化博弈理论研究
动物行为学中的进化博弈理论研究动物行为学是研究动物行为的学科,是现代生态学、生物学、心理学和社会学等学科的重要组成部分。
动物行为学的研究对象是具有生命特征的动物,主要研究它们的行为和行为背后的生理机制、进化历程以及环境和社会因素等方面。
其中,进化博弈理论是动物行为学研究中的重要方法和理论基础之一。
进化博弈论是一种用游戏论的方法研究生物进化的理论。
它模拟了个体之间的相互作用和竞争,研究了不同策略的演化及其对个体数量和群体结构的影响。
进化博弈论主要包括两大类博弈:一个是零和博弈,另一个是非零和博弈。
零和博弈是指参与者的利益完全对立,一个人的赢利必然导致另一个人的损失;而非零和博弈则是指参与者的利益不完全对立,即一个人获得好处不一定导致另一个人的损失。
在进化博弈理论中,个体的策略越具有适应性,其在群体中的生存和繁衍就越容易获得优势。
进化博弈论的应用在动物行为学中主要是探究动物间的竞争和合作关系。
动物遵循的交互策略可以追溯至其进化历史和适应环境中的生存需求。
如著名的鹰鸽博弈,在这个博弈中鹰会攻击鸽子并得到食物,鸽子会因此死亡;如果遇到两只鹰,它们会进行搏斗直至一方被杀死。
这样的策略是基于生物的基因编程,以及遗传变异和自然选择的结果。
近年来,进化博弈理论在动物行为学的研究中得到了广泛应用。
例如在群体动物中,进化博弈论可以解释为什么个体在取得財富和获取资源时会出现不同的策略。
举个例子,蚂蚁是非常有组织性的社群生物,它们之间会分工合作,完成不同的任务。
由于生存空间有限,种群之间的竞争很激烈。
如果一只蚂蚁选择的是搜寻食物,而另一只蚂蚁做的是攻击敌人,那么搜寻食物的蚂蚁就有更多的机会获取食物,因此这个策略就会被传承下去,进而大家都遵循这个策略。
除了群体动物,进化博弈理论在其他动物行为的研究中也存在广泛应用。
例如,在进化中,动物会根据风险和收益的情况选择最优策略。
在选择策略的时候,动物会明智地平衡自己的收益和风险。
进化博弈概述-山东师范大学管科学院
博弈方2 鹰 博弈 方1 鹰 鸽 鸽
v-c/2 ,v-c/2
V,0
0,v
v/2 ,v/2
图5.13 鹰鸽博弈
v 代表双方争夺的利益(可以是军事利益、经 济利益或政治利益,也可以是动物的领地和繁殖机 会),c是争夺中失败一方的损失。
这个博弈也是一个 2×2 对称博弈,直接运用 2×2 对称博弈复制动态的一般公式。用 x 表示采用
采用 B的得益为
xi (t ) 0 2 xi (t ) 60 。根据最优反应动态机制,当 2 xi (t ) 50 2 xi (t ) 49 xi (t ) 0 2 xi (t ) 60 2 2
时,即xi (t ) Nhomakorabea22 61
时,博弈方i在t+1时期会采用A,否则采用B。
一、协调博弈(Coordination Game)
博弈方2 A B 博弈 A 方1 B
50,50 0,49 49,0 60,60
该博弈有两个纯策略纳什均衡:(A,A)和( B,B)。 这两个纳什均衡中,后者明显帕累托优于 前者。但如果博弈方之一有采用A的可能性,或者两 博弈方相互怀疑对方可能采用A,那么前者就是相对 于后者的风险上策均衡。因此,如果是在完全理性博 弈方之间进行这个博弈,通常的预测结果应该是(B ,B),但如果我们考虑博弈方相互对对方理性的信 任问题,或者对风险的敏感性等因素,那么风险上策 均衡(A,A)可能是更好的预测。
“鹰鸽博弈”
鹰鸽博弈研究的实际上并不是鹰和鸽之间的博弈, 而是同一物种、种群内部竞争和冲突中的策略和 均衡问题,其中“鹰”和“鸽”分别指“攻击型” 和“和平型”的两种策略或策略类型。
鹰鸽博弈是研究动物世界和人类社会中普遍存在 的竞争和冲突现象的经典博弈,其进化博弈分析 可以揭示人类社会或动物世界发生战争或激烈冲 突的可能性及其频率,以及国际关系中霸道和软 弱、侵略和反抗、威胁和妥协等共存的原因。
进化博弈论
进化博弈论
1. 2. 3. 4. 进化博弈论概念 进化博弈论产生及其发展 进化博弈论基本内容 进化博弈论的应用
一、进化博弈论的概念
传统的博弈论由于对参与者完全理性 的假定,得出的结果往往与实际相差很远。 进化博弈来源于对生态现象的研究, 为经济学研究提供了一个全新的分析方法, 较好地克服了新古典经济学及经典博弈理 论中理性假定及多重均衡的困难,能够更 加现实地解释经济现象。
行
26(合作)
216,360
324,324
设合作者的比例为x(0<x<1),则有: 一个典型的合作者的期望支付为 324x+216(1-x) 一个典型的背叛者的期望支付为 360x+288(1-x) 谁更具有适应性?
谢谢!
四、进化博弈论的应用
进化博弈理论还没有形成学术界一致认 可的理论体系,其基本框架仍然处于数理 研究阶段,但它提供了一种全新的分析问 题的方法。在解释社会制度形成、行业发 展趋势、社会习俗演化等现象,获得了极 大的成功。
囚徒困境
列
20(背叛) 20(背叛) 288,288 26(合作) 360,216
观察群体行为的历史
• 对参与人来说,观察群体行为的历史即估算群体分布是非常重 要的。 • 首先,群体分布包含了对手如何选择策略的信息。 • 其次,通过观察群体分布也有助于参与人知道什么是好的策略 什么是不好的策在进化过程中淘汰,模仿是学习过程中的一个重要组成部 分,成功的行为不仅以说教的形式传递下来,而且也容易被模 仿。 • 参与人由于受到理性的约束而其行为是幼稚的(Naive),其决 策不是通过迅速的最优化计算得到,而是需要经历一个适应性 的调整过程,在此过程中参与人会受到其所处环境中各种确定 性或随机性因素影响。因此,系统均衡是达到均衡过程的函数, 要更准确地描述参与人行为就必须考察经济系统的动态调整过 程,动态均衡概念及动态模型在进化博弈理论中占有相当重要 的地位。
进化博弈理论的均衡概念及其拓展
进化博弈理论的均衡概念及其拓展论文报告:进化博弈理论的均衡概念及其拓展研究1. 介绍进化博弈理论的基本概念和历史背景进化博弈理论是一种利用数学模型来研究生物演化行为的理论框架。
它建立在博弈论的基础上,通过对生物演化中基因的选择过程进行模拟,来解释动物行为、遗传进化、社会合作等现象。
进化博弈理论的出现为我们揭示了生物演化过程的新视角,深刻影响了一系列研究领域,如经济学、社会学、生态学等。
2. 论证进化博弈理论的均衡概念进化博弈理论所研究的对象是动态演化过程中的均衡状态。
所谓均衡状态,即当个体在当前环境下选择某种策略时,该策略能够实现最大化收益或最小化风险,且不能被其他策略所替代。
如果出现新的策略,它只有在该策略可以带来更高的收益或更小的风险时才能够被接受,否则就会被淘汰。
从进化博弈理论的角度来看,这种均衡状态能够在演化过程中稳定存在,并不断改进和优化。
3. 探讨进化博弈理论的拓展研究随着研究的不断深入,进化博弈理论不断拓展和完善。
其中主要包括进化模型的变化、策略分类的拓展和类固醇博弈的研究等。
例如,如何在爆炸式增长的人工智能领域中研究进化博弈模型,策略分类的拓展从简单的合作和竞争,到涵盖合作、有限合作和纯自利;类固醇博弈主要是在传统进化博弈的基础上,引入异位互惠机制和抗感染机制等新因素。
4. 分析进化博弈理论的应用领域进化博弈理论作为一种生物学理论,其研究对象并不仅限于生物圈,其应用领域之丰富多彩。
例如,在经济学领域,进化博弈理论可应用于研究市场竞争、战略选择、决策分析等领域;在社会学领域,可应用于解释激励合作行为、规范社会道德行为等。
5. 展望进化博弈理论的未来研究方向进化博弈理论作为一种新兴的研究方法,仍有着许多未解决的问题及待探索的领域。
未来的研究应着重于探讨复杂环境中的进化演化过程、进化博弈中的自动化学习研究、人工智能应用的深入研究等。
五个案例:1. 研究员发现一种动物在群体合作中不断进化和优化的模式,通过应用进化博弈理论,成功分析到该动物顺应环境变化而形成的进化过程,从中推断出一系列新的合作策略。
7 演化博弈详解
谁将生存?
? 假定初始人口中TFT的比例为x,ALL-D的 比例为(1-x);
? TFT的预期支付:8x-(1-x)=9x-1; ? ALL-D的预期支付:6x+0(1-x)=6x; ? 9x-1>6x ? x>1/3
均衡
? 如果x>1/3, TFT生存;稳定均衡; ? 如果x<1/3, ALL-D生存;稳定均衡; ? 如果x=1/3,二者同样生存,但不是稳定
strategy),该占优策略是ESS;
博弈重复两次
ALL-C TFT ALL-D
ALL-C 8,8
8,8
TFT ALL-D
8,8 12,-2
8,8 6,-1
-2,12 -1,6 0,0
谁将生存?
? 首先注意到,幼稚的合作型生存能力最差:如 果遇到 ALL-C 和TFT,与 TFT 得到相同的支付, 但如果遇到 ALL-D ,则比 TFT更差;
在两种策略之间选择。
左撇子与右撇子
左撇子 左撇子 1,1 右撇子 0,0
右撇子 0,0 1,1
谁最适合生存?
? 答案依赖于初始的人口分布。
? 假定总人口中有x的比例是左撇子,1-x 的比例是右撇子。那么,左撇子的预期 支付为:x·1+(1-x)·0=x;
? 右撇子的预期支付:x·0+(1-x)·1=1-x;
? 社会秩序是所有人行为选择的结果,但 不是集中设计的,而是自发演化的结果;
? 产权制度:先占原则; ? 教室、图书馆占座位;
鹰-鸽博弈
B
鹰
鸽
鹰
-1,-1
1,0
A
鸽
0,1
0.5,0.5
三个纳什均衡
进化博弈理论及其应用的文献综述
进化博弈理论及其应用的文献综述进化博弈理论的思想起源于生物学领域,以有限理性的参与人群体为研究对象,考察群体行为的进化趋势。
其应用主要在社会行为、经济行为和制度的演化方面,是研究在非理性人条件下的群体决策行为的重要研究方法。
标签:进化博弈文献综述一、进化博弈的基本理论进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。
进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。
正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。
二、进化博弈理论的应用研究1.社会行为领域Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。
它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。
Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。
个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。
Sandholm对个体行为偏好的进化进行了动态分析。
Juang从进化的视角研究了规则的进化与均衡的选择问题。
Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。
2.制度的演化青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。
第_7_章_进化博弈论简介汇总
– 小甲虫期望收益是 5x + (1-‐x) = 1 + 4x
• 大甲虫的期望收益总是超过小甲虫的, 所以,“大体态”是一个进化稳定策略。
进化博弈中的“军备竞赛”
• 生物学家认为在自然界中存在具有囚徒困 境结构的进化博弈现象
– 例如:树木间高矮的关系;植物根系的竞争
• 然后再看根据在总体中的占比,两种生物体随 机相遇所导致的收益期望(x, p, q 的函数)
• 讨论最后这两个期望的大小,判断是否进化稳定
两个采用不同混合策略者相遇的收益
第一类 S(p) 生物 T(1-‐p)
第二类生物
S(q)
T(1-‐q)
a, a c, b
b, c d, d
• 第一种(p策略者)
• 可见,不存在y,使得x<y时小甲虫的期望收益 超过大甲虫。因此,策略“小体态”不是进 化稳定的。
体态博弈中的进化稳定策略:考察大体态
小的 甲虫1 大的
甲虫2 小的 x
5, 5 8, 1
大的 (1-x) 1, 8 3, 3
• 考虑一个很小的正数x,总体中x占比为小 体态,1-‐x占比甲虫为大体态。
考察小体态是否进化稳定策略
小的 甲虫1 大的
甲虫2 小的 (1-x)
5, 5 8, 1
大的 x
1, 8 3, 3
• 考虑一个小正数x,总体中有x占比的个体使用 策略“大体态” ,有1-‐x占比的个体使用策 略“小体态”。(甲虫们随机相遇争夺食物)
– 一只小甲虫的期望收益是 5(1-‐x)+1x = 5-‐4x – 一只大甲虫的期望收益是 8(1-‐x)+3x = 8-‐5x
第七章 博弈论实验讲解
Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解
演化博弈论简介
演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。
他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。
传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。
正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。
我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。
先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。
我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。
从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。
我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。
我这里用演化,避免用演进,可以减少误解。
演化理论中有两条最重要的机制。
一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。
在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。
我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。
我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。
严复说物竞天择,就是这个意思。
另一种机制叫突变机制(mutant),这保证了种群的变化。
如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。
进化博弈论
进化博弈论进化博弈论是一门研究人与其他动物(包括昆虫和其他物种)之间的性的、社会的和经济的行为的学科。
它也是一种分析动物之间的比较方法。
实际上,进化博弈论有时也被称为“比较行为学”,因为它与传统动物行为学(也称为行为生态学)具有明显的差异。
进化博弈论假设,人类和其他动物之间的行为模式是由进化产生的,而进化,又是一种种群整体行为的结果,其中每个个体都希望从该行为中获得自身利益最大化。
进化博弈论的基本想法是,动物和/或人之间的某种特定行为策略最终会被自然选择,因为它们提供了相对于其他行为策略的优势,并增加了这些物种在未来世代中的可能性。
进化博弈论可以从不同角度来解释动物和人之间的行为。
例如,在自发抉择的情况下,进化博弈论研究表明,动物的行为可能会基于某种“自身福利”标准,其中某些行为可能提供动物个体最大的收益。
同样,在社会中,进化博弈论也可以解释人的行为,例如是否为别人做出牺牲。
在进化博弈论的研究中,科学家们研究了不同物种之间的行为,以及不同环境中的各种行为结果,以此来理解行为背后的机制。
例如,研究人员正在尝试探究鸟类是如何利用社会行为来建立优势的。
一项研究发现,在大部分情况下,鸟类会朝互利的方向发展,而不是自利的方向。
另一项研究发现,羊驼和羊群之间的社会行为也具有可预测的模式,这也表明,进化博弈论可以帮助我们理解动物之间社会行为背后的机制。
此外,进化博弈论不仅可以用于研究动物之间的行为,还可以用于研究人与人之间的行为。
在人类社会中,进化博弈论也可以解释不同社会群体之间的某些行为,比如偏见与冲突之间的关系。
由于这一理论对于比较动物和人类之间的行为策略的能力,它经常被用来解释不同社会群体之间的行为差异和争议。
此外,由于进化博弈论可以帮助人们更好地理解社会性质的行为,它也可以被用来解释人类行为的某些方面,比如如何在竞争环境中获得最大的利益。
总之,进化博弈论是一种用于研究人与其他动物之间行为的学科。
它不仅可以帮助我们理解动物之间的行为,而且也可以帮助我们理解人类之间的社会性行为。
博弈论知识点总结
博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。
下面是博弈论的一些基本概念和重要知识点的总结。
1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。
标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。
2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。
纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。
3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。
在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。
4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。
混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。
5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。
博弈树可以用来推导纳什均衡策略和分析博弈过程。
6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。
在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。
7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。
在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。
8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。
进化博弈理
博弈论(Game theroy)
又称对策论,是研究具有斗争或竞争性质的现象的数学理论和方法。 一般把具有竞争或对抗性质的行为称为博弈行为,在这类行为中, 参加斗争或竞争的各方具有不同的目标和利益(赢得),为了达到各 自的目的,各方必须考虑对手的各种可能的行动策略,并力图选取 对自己最为有利或最合理的策略。 进化博弈理论融合了进化论和博弈思想,自然选择作用下的性状或 行为的进化过程被看作是博弈过程.博弈中的参与者是生物个体, 策略是它的某种性状或行为。如树的高度、种子的大小、攻击行为、 合作行为等。
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决 方案。以全体利益而言,如果两个参与者都合作保持沉默,两人 都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判 刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且 只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果 二人判决均比合作为高,总体利益较合作为低。这就是“困境” 所在。例子漂亮地证明了: 非零和博弈中,帕累托最优和纳什均衡是相冲突的。
进化是对生命系统的设计和功能进行解释的最强有力的途 径,其思想已经渗透到了生物学的所有领域。原则上,进化生物 学能够说明生命世界五彩缤纷的多样性和令人惊异的复杂性。尽 管进化博弈思想从萌芽至今才短短几十年,但是它已经被广泛应 用到生物学的各个领域,它可以很好的描述基因、病毒、人类之 间的相互作用,此外,它也已经渗透到人类学、经济学、哲学、 政治、进化心理学等各个领域。
工蜂自愿放弃繁殖能力,而抚养蜂后的后代 。
哥斯达黎加有一种叫吸血蝠的蝙蝠,吸血蝠以热带地区大动物的 血为主食。这种蝙蝠的新陈代谢异常活跃,两夜吃不到血,就会 饿死。事实上,在吸血蝠之间相互哺血的情况是经常出现的,吃 饱的蝙蝠倒挂在洞穴的天棚上吐血,而挨饿的蝙蝠则在下面接血 喝。(完全利他行为)
博弈论有限理性和进化博弈.ppt
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
dx dt
x(u y
u)
x(x
x2)
x2 (1
x)
x2
x3
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
进化稳定策略(ESS)
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
博弈方2
A
B
A 50,50 49,0 B 0,49 60,60
协调博弈
1
2 5
4
3
最优反应动态模拟:初次博弈1个A
A
B
A
B
BA
AB
全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次
性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性博弈方会在博弈过程中学习博弈通过试错 寻找较好的策略
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈
x)u2 ]
x(1 x)(u u)
x(1 x)[ x(a c) (1 x)(b d )]
复制动态 相位图
x
1
x
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
进化博弈基本动态理论
进化博弈基本动态理论一、进化博弈基本动态理论概述进化博弈理论基于遗传学和生物进化学思想,将生物进化与博弈论相结合,从而形成一种新的理论模型。
其基本思想是博弈参与者的选择行为和赢利条件随时间变化而逐渐进化,最终达到一种动态稳定的平衡状态。
二、博弈参与者的策略选择在进化博弈中,参与者的策略选择通常分为两种类型:基于群体的策略选择和基于个体的策略选择。
基于群体的策略选择是指博弈参与者在探索不同策略的同时,还要考虑到团队选择的影响;而基于个体的策略选择则主要考虑到个体赢利的最大化。
三、动态与稳定的游戏均衡状态博弈模型中的稳定状态通常指的是一种均衡状态,这种状态在一定条件下始终保持不变。
通过进化博弈的思想,我们可以更加全面地理解博弈模型中的动态特性,即博弈中参与者策略的选择和赢利条件随时间变化而逐渐进化。
四、进化博弈在经济学中的应用进化博弈理论在经济学领域中的应用非常广泛,如博弈经济学、商业竞争与战略等,对经济行为及其演变规律进行了深入研究。
进化博弈在理解市场竞争、企业战略以及社会组织行为、政策制定等方面的应用都具有重要的意义。
五、进化博弈在环保领域中的应用近年来,进化博弈理论在环保领域也得到了广泛应用。
通过研究群体生物行为中的策略选择规律,可以有效地提升生态系统的稳定性,同时解决环境保护方面的重大问题,具有巨大的实际应用前景。
案例分析:1、某车厂采用价格竞争策略的演变计算某车厂推出一款新车型,并进行了几轮价格竞争。
通过建立进化博弈模型,我们可以发现,随着时间的推移,厂商的竞争对手可以逐渐学习到其价格策略,从而对其进行有针对性的反击。
最终,在竞争对手的不断反击下,车厂的利润逐渐减少,产生了相应的改变。
2、主持人掀起数据分析“策略大乱斗”在社交媒体上,某位主持人掀起了一场数据分析“策略大乱斗”,吸引了众多参赛选手投稿参赛。
通过分析参赛选手的投稿及策略选择规律,我们可以发现,参赛选手从最开始的“随机选择”,逐渐向“选票策略”、“合作策略”等博弈策略转变,最终形成了一种诸多博弈策略并存的状态。
进化博弈论
进化博弈论
进化博弈论是一种行为学方法,用于研究动物社会行为的演变。
它以进化理论为基础,利用博弈的观点来分析动物如何改变自己的行为来适应当下环境变化,以获得更大的生存福利。
进化博弈论框架可以用来解释动物和其他种群如何演化出适应变化环境的行为策略,以及如何改善社会行为。
进化博弈论的主要概念是:物种是在竞争中演变而来,它们在不断地改变行为以获得更大的生存福利,这种行为就是进化,而博弈则通过分析行为的可能组合,来研究物种之间的竞争关系。
进化博弈论的实际应用
动物的行为的改变受制于环境的变化,而进化博弈论框架可以帮助我们理解动物如何改变自己的行为,以应对变化的环境。
进化博弈论框架可以用来解释不同物种之间的竞争和合作行为,以及种群如何演化出更适应性的行为策略。
此外,进化博弈论也已经被用于研究其他社会行为,比如人类之间的财富分配和政治观点。
进化博弈论也在人工智能和机器学习领域中得到了广泛的应用。
它可以用来研究人工智能的策略学习,并为智能机器人编写适当的算法。
机器学习、自然语言处理和生物信息学也是这个领域的重要应用之一。
最后,进化博弈论可以帮助我们更好地理解动物社会行为的演化和变化,以及其他生物类之间的竞争关系,从而为解释现今动物及其他生物类行为提供理论基础。
它的应用领域也在不断发展和拓展,涵
盖了计算机科学、机器学习、自然语言处理,以及其他更多的领域。
进化博弈综述
进化博弈综述进化博弈是生物进化论和博弈论结合的产物。
首先,给出了进化博弈的最基本的均衡概念(进化稳定策略: ESS) ,并讨论了它在不同条件下的拓展。
其次,分析了进化博弈的动态概念,并主要讨论了一种应用非常广泛的动态(模仿者动态) 。
最后,简要介绍了进化博弈的应用领域和发展前景。
标签:进化博弈进化稳定策略模仿者动态进化博弈理论是生态学家Maynard Smith and Price (1973) 在结合生物进化论与传统博弈理论的基础上提出的,以进化博弈理论的最基本均衡概念——进化稳定策略的提出为诞生的标志。
进化博弈理论创立之初是生物学家用来研究生物进化的。
近些年来,由于它在生物学上的巨大成就而被引入经济学,成为经济学常用的博弈论的一个热点领域。
传统的博弈论由于对参与者完全理性的假定,得出的结果往往与实际相差很远。
这也要求博弈论学者有时必须假定参与者的理性是有限的才能更好的应用和发展博弈论。
也正是在这种情况下,进化博弈的出现无疑给博弈论注入了新的活力,也克服了传统博弈论在理论和应用上遇到的尴尬局面。
一、进化博弈的均衡概念传统的博弈论中有许多均衡概念,例如,Nash均衡、子博弈精练纳什均衡、贝叶斯纳什均衡、精练贝叶斯均衡、恰当纳什均衡、完美纳什均衡等等,对这些均衡的研究一直是博弈论的核心内容。
同样作为进化博弈论均衡概念的进化稳定策略在进化博弈的研究中也是至关重要的。
不过,两者之间却存在着很大的差别。
经典博弈论的各种均衡都是建立在参与人是理性的基础上,而进化稳定策略则是进化博弈考虑参与者为有限理性的基础上的均衡结果。
进化稳定策略都是完全理性博弈的纳什均衡,是纳什均衡中对有限理性有稳健性的一部分。
因此,进化稳定策略可以看作是对纳什均衡的一种选择精练。
1.进化稳定策略的定义进化稳定策略是Maynard Smith and Price(1973)以及Maynard Smith(1974)在考察种群个体适应性由各个个体行为共同决定的环境下,个体对成功策略选择效果时提出的。
进化博弈论
四.一.四 有 限 理 性 博 弈 的 分 析 框 架
在有限理性博弈中具有真正稳定性和 较强预测 能力的均衡,必须是能够通过博弈方的模仿、 学习的 调整过程达到的,具有能经受错误偏离的干扰 的均衡, 是在受到少量干扰后仍然能够“恢复”的均衡.
第四章 进化博弈论
四.一 有限理性与进化博弈论
四.一.一 进化博弈的基础假设——有限理性
传统的博弈均衡,例如Nash均衡及其精炼是以完 全理性都是共同知识[common knowledge]为前 提的.
然而,完全理性在现实中很难满足,当社会经济环 境和决策问题较复杂时,人们必须存在很大的理性 局限.有限理性对人们的决策、行为选择方式有很 大影响,有限理性基础上的博弈分析与完全理性博 弈分析也有很大区别.进化博弈分析是有限理性博 弈分析的基本框架.
0.5
1
x
一般两人对称博弈复制动态和进化稳定策略
一般模型
策略1 策略2
局中人2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配 对的反复博弈.
基本模型是两个局中人之间的对称博弈.含义是两个 博弈位置是无差异的.
其中abcd可以是任何得益,根据问题设定.
汉密尔顿法则:
通过亲缘选择促进利他行为的条件是
c b
r
其中,c为利他者付出的代价,b为受益者获得的
好处,r为亲缘系数.
例如,上述合作博弈中,若局中 人I选择利他行为,收益组合由 [一,一]变为[0,五], 故c=一,b= 四,所以,当亲缘系数r>一/四 时,“利他基因在种群基因库 中的频率才会增加”.
演化博弈论简介(2024版)
A
A
A
BA
AA
A A
B
B
A
B
A
A
3、当初始情况为3连A时
A
A
A
AA
A
B
B
A
A
综上可知,32种初始情况下, 只有1种情况稳定于5B,其余31 中情况最后都将稳定于5A。(此时, A为“进化稳定策略”,即ESS, evolutionary stable strategy)
(一)连续型的古诺调整过程 反应函数:
第6讲:演化博弈论简介
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0; 若x>x*,为使x→x*,应满足F(x)<0.
F(x)
F(x)=dx/dt,t↑,则x↓
x* 0
这意味着: 当F'(x*)<0,x*为ESS
x
第6讲:演化博弈论简介
(三)协调博弈的复制动态和ESS
乙
鹰
鸽
鹰 (v-c)/2,(v-c)/2 v ,0
甲
鸽 0 ,v
v/2 ,v/2
第6讲:演化博弈论简介
F
x
dx dt
x 1
x
x
v
2
c
1
x
v 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
S2
a,a
b ,c
c, b
d,d
群体中采用S1的比例为x,S2的比例为1-x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双人双策略对称博弈均衡的一般条件
• 若(S, S)是均衡,a,b,c,d之间的关系? • 若(S, T)是均衡,…? • 若(T, S)是均衡,…? • 若(T, T)是均衡,…?
经常会用到“期望”的概念
• 一个随机的行为,会有多种(以两种 为例)可能的结果(r1, r2),分别对应一 个概率(p1, p2),p1+p2=1
• 但我们可有一个平行的概念--“进化稳 定策略”的概念
(下面我们先学习这个概念,然后看它和纳什 均衡的关系)
进化稳定策略
• 一个策略称为是进化稳定的,若当整个种群都采 取这个策略时,任何采用不同策略的小规模 “入侵”群体经过多代遗传后最终会消亡。
• 形式化定义
– 一种生物体的适应性是指它与一个随机遇到的生物体互 动得到的收益期望
• 则这个行为的结果期望就是
p1r1 + p2r2
• 概率常常用“比率”和“占比”来近似 • 混合策略的收益:在纯策略集合上按概
率分布选择的收益期望
进化博弈论:谁有更强的适应性
博弈与进化博弈若干概念的一种对比理解
• 博弈,纯策略
– 确定性策略,直接对应的收益
• 博弈,混合策略
均衡
– 概率性策略,期望收益
• 进化博弈,纯策略
– 对于个体:确定性策略,直接收益
– 对于群体(策略):适应性-其中个体与其他个体随机相
遇的收益期望
• 进化博弈,混合策略
稳定性
– 对于个体:概率性策略,期望收益
– 对于群体(策略):适应性-其中个体与其他个体随机相 遇的收益期望进化Βιβλιοθήκη 弈的由来• 进化论的主要观点
– 生物体的遗传基因在很大程度上决定了它的 外部特征(行为方式等),因而决定了它是 否能够适应给定的环境。
• 每只甲虫有两个策略:大和小,由其基因决定。
小的 甲虫1
大的
甲虫2
小的
大的
5, 5
1, 8
8, 1
3, 3
小
甲的
虫1 大
的
甲虫2
小的
大的
5, 5
1, 8
8, 1
3, 3
与经典的博弈比较
• 每只甲虫的策略都是由遗传基因硬性决定的
– “策略选择”的概念在此是缺失的
• 因此以策略选择为基础的纳什均衡思想在 此没有直接的对应
生物适应性与新陈代谢
• 对于大甲虫,维持新陈代谢实际上要比 较困难些
– 需要吃较多的食物才能维持较大的体态要求 ;即同样数量的食物,小甲虫从中可获得较 多的收益(适应性)。
• 直观结论是:大体态变异基因使适应性 减弱,经过多次繁衍后,它极可能被 淘汰。
• 然而事实真的是这样吗?
互动与生物适应性
• 当两只甲虫为食物争夺时,可能的结果有:
生物适应性与种群变异
• 例子:体态大小的博弈
– 考虑一种甲虫种群 – 假设每只甲虫对给定环境的适应能力取决于
• 它是否可以发现食物 • 能否有效地从食物中汲取营养
– 假设一个特定的突变基因出现并开始蔓延, 造成携带该突变基因的甲虫体型变大。
– 因此,在该甲虫种群中,便分成两种不同的 群体——小甲虫和大甲虫。
进化博弈论简介
(对应教材第7章)
回顾上一讲(博弈论基础)
• 博弈
– 参与者(player) – 策略(strategy) – 收益,回报(payoff)
• 收益矩阵-形象地描述一个博弈的结构 • 在博弈论的分析中(决定采取什么策略)
– 不是要考虑如何战胜对方,而是基于对对方的行为的预测,自 己如何收益最大(尽可能大)。双方都如此态度。
– 当争夺食物的两只甲虫大小相同时,它们会 平分同样的食物
– 当一只大甲虫和一只小甲虫争夺食物,则大 甲虫会得到大多数的食物
– 对于同样的食物量,大甲虫在适应性上得到 的益处要少,因为所得到的食物中有一部分 要转化用来维持它们消耗较高的新陈代谢
收益矩阵
• 每只甲虫从争夺一定量食物的互动中获得的生 物适应性(不是食物量),可认为是双人博弈 中的收益。
– 适应性较强的生物体往往会繁衍较多的后代 ,于是使得适应性强的基因的物种在总体中 的数量增加。
– 一个物种的成功进化取决于它其中的个体和 其他个体(同种或者不同种)的互动。
进化博弈的由来
• 1960s,从博弈论视角来解释生物进化论
– 由基因决定的生物特征及行为可类比作博弈 中的策略;
– 将生物的适应性(的提高)类比为它的收益。
• 纯策略、混合策略(在可选纯策略集合上的一 个概率分布)
均衡(纳什均衡)
• 均衡:互为最佳应对
• 纳什均衡定理:在考虑混合策略条件下 ,任何有限参与人、有限纯策略的博弈 都存在均衡
• 一般来讲,找到均衡是很困难的,但在 某些限定条件下可能有系统化方法
– 例如,双人双(纯)策略
1. 检查四个策略组合是否为纯策略均衡
• J. M. Smith和G. R. Price,提出“进化稳定 均衡”,标志着进化博弈的诞生。
– John M. Smith. On Evolu)on. Edinburgh Unive Press, 1972
– J. M. Smith and G. R. Price, The Logic of Conflict, Nature, 246, 15-‐18, 1973.
– 称“策略T在x程度上(以x水平)入侵策略S”,指的是 在总体中有x占比的生物体采用策略T,1-‐x占比采用策 略S;其中x是一个小于1的小正数。
– 若存在一个小正数y,当任何其他策略T以任何x<y水平 入侵策略S时,采用策略S的个体的适应性严格高于采取 策略T的个体,则称策略S是进化稳定的(evoluVonarily stable)。
若(1)为空, 则(2)一定有;
2. 利用无差异原理试求混合策略均衡 若(1)不空,
(2)也可能有
囚徒困境(协调)博弈的特征模式
• 双人双策略 • 对称 • 均衡出现在双方采用某一种相同的策略 • “最佳收益”不是均衡,因为参与人之一有
动机改变策略
鹰鸽博弈的特征模式
• 双人双策略 • 对称 • 均衡出现在双方采用不同的策略
考察小体态是否进化稳定策略
小的 甲虫1 大的
甲虫2 小的 (1-x)
5, 5 8, 1
大的 x
1, 8 3, 3
• 考虑一个小正数x,总体中有x占比的个体使用 策略“大体态” ,有1-‐x占比的个体使用策 略“小体态”。(甲虫们随机相遇争夺食物)
– 一只小甲虫的期望收益是 5(1-‐x)+1x = 5-‐4x – 一只大甲虫的期望收益是 8(1-‐x)+3x = 8-‐5x