演化博弈论
演化博弈论
演化博弈论:演化博弈论(Evolutionary Game Theory)不再将人模型化为超级理性的博弈方,而是认为人类通常是通过试错的方法达到博弈均衡的,与生物进化原理具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。
在理论应符合现实意义上,该理论对于生物学、经济学、金融学和证券学等学科均大有用场。
在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。
在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。
与传统博弈理论不同。
有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在)。
演化博弈论
• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。
21世纪 进入2l世纪以来,国内的学者也开始关注演化博弈论,也做出了大 量的研究。
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳
•
pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:
•
•
•
p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:
•
xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态
博弈论与信息经济学-5.演化博弈
猎鹿博弈
猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》 中的一个故事。 古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果 一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才 能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天 不挨饿,而一只鹿却能让两个人吃上10天。
在演化博弈中,认为参与人的选择行为可以依据 前人的经验、学习与模仿他人行为、受遗传因素 的决定等。因而演化博弈把具有主观选择行为的 参与人扩展为包括动物、植物在内的有机体,动 植物参与者的支付可被理解为为某种适应程度。 把博弈论的分析与应用从研究人类的竞争行为扩 展为研究有机体的策略互动关系。这个领域的开 创性工作是由英国生物学家约翰· 梅纳德· 史密斯 (John Maynard Smith)和G.R.普莱斯 (G.R.Price)1973年进行的。演化博弈现在正 逐渐被广泛应用于社会经济学领域。
路径依赖的例子
有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。
路径依赖的例子
一个广为流传、引人入胜的例证是:现代铁路两条铁轨之间的标准距 离是四英尺又八点五英寸。原来,早期的铁路是由建电车的人所设计 的,而四英尺又八点五英寸正是电车所用的轮距标准。那么,电车的 标准又是从哪里来的呢?最先造电车的人以前是造马车的,所以电车 的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢? 英国马路辙迹的宽度是四英尺又八点五英寸,所以,如果马车用其他 轮距,它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来 的呢?从古罗马人那里来的。因为整个欧洲,包括英国的长途老路都 是由罗马人为它的军队所铺设的,而四英尺又八点五英寸正是罗马战 车的宽度。 任何其他轮宽的战车在这些路上行驶的话,轮子的寿命都不会很 长。可以再问,罗马人为什么以四英尺又八点五英寸为战车的轮距宽 度呢?原因很简单,这是牵引一辆战车的两匹马屁股的宽度。故事到 此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器,因为 这 路径依赖些推进器造好之后要用火车运送,路上又要通过一些隧 道,而这些隧道的宽度只比火车轨道宽一点,因此火箭助推器的宽度 是由铁轨的宽度所决定的。 所以,最后的结论是:路径依赖导致了美国航天飞机火箭助推器 的宽度,竟然是两千年前便由两匹马屁股的宽度所决定的。
演化博弈论研究的现状与展望
演化博弈论研究的现状与展望一、本文概述《演化博弈论研究的现状与展望》一文旨在全面梳理和深入分析演化博弈论这一交叉学科领域的研究现状,并在此基础上展望其未来的发展趋势。
演化博弈论,作为一种独特的博弈理论,融合了生物学、生态学、经济学、社会学等多个学科的理论和方法,为研究复杂系统中的动态演化过程提供了新的视角和工具。
本文首先回顾了演化博弈论的发展历程,阐述了其基本概念和核心思想,然后重点分析了当前国内外在演化博弈论研究方面的主要成果和进展,包括理论模型的构建、实证研究的应用以及与其他学科的交叉融合等方面。
在此基础上,文章进一步探讨了演化博弈论在未来可能的研究方向和挑战,旨在为相关领域的研究者提供有益的参考和启示。
二、演化博弈论的基本概念与理论框架演化博弈论,作为一种新兴的理论体系,融合了博弈论与演化理论的精髓,主要研究在动态变化的环境中,参与者如何通过试错、学习、适应和变异等过程,不断调整和优化自身的策略行为。
它突破了传统博弈论中完全理性、完全信息等理想化假设的限制,更贴近现实世界的复杂性和不确定性。
基本概念方面,演化博弈论将参与者视为有限理性的决策者,其策略选择受到历史经验、外部环境以及自身学习能力等多重因素的影响。
同时,演化博弈论强调策略的动态调整过程,而非静态均衡。
它认为,参与者通过不断的试错和学习,逐渐适应环境,并在演化过程中形成稳定的策略分布。
在理论框架上,演化博弈论借鉴了生物演化理论中的自然选择、遗传变异等机制,构建了以策略空间、适应度函数、选择机制和变异机制为核心的理论体系。
策略空间描述了参与者所有可能的策略组合;适应度函数则用于衡量不同策略在特定环境下的表现优劣;选择机制决定了哪些策略能够在演化过程中得以保留和传承;而变异机制则为策略空间引入新的可能性,使得系统能够不断适应外部环境的变化。
通过这一理论框架,演化博弈论能够更好地刻画现实世界中的复杂动态演化过程,为我们理解和预测参与者的行为决策提供有力的分析工具。
演化博弈论
演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。
在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。
演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。
但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。
生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。
模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。
编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。
与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。
其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。
演化与博弈论
演化与博弈论演化与博弈论:共生共存的竞争研究演化和博弈论是生物学和社会学领域的两个重要概念。
它们描述了竞争、合作和共存这些基本生存策略在不同情境下发展的演化和动态变化。
本文将介绍演化和博弈论的基本概念,讨论它们在生物学和社会学中的应用,并探讨两个领域之间的联系。
一、演化与博弈论基本概念演化: 演化是一种逐渐的生物学过程,它涉及生物种群的基因变异、多样性、选择和适应性。
演化理论描述了生物特征随时间和环境变化的逐步改变,从单细胞生物到复杂有机体(如鸟类和哺乳动物)。
博弈论: 博弈论研究决策者在有竞争和合作关系的情境下制定策略和取得优势的过程。
博弈论在经济学和政治学中非常有用,也可以应用于动物和人的社交行为研究。
二、生物学中的演化与博弈论1. 昆虫共生昆虫共生是一种生态互利关系,是昆虫与其他生物之间的合作关系。
以蚂蚁和蚜虫的共生为例,蚜虫从植物上吸取汁液,而蚂蚁则保持它们的羽毛清洁,并且保护它们免受天敌的攻击。
这种关系既是共生又是竞争,因为蚜虫和蚂蚁需要利用不同的资源,但他们同时也相互依赖和协同合作,以便达到最大化的生存和繁殖效益。
2. 环境选择和行为协作环境选择和行为协作在演化中具有很重要的作用。
环境选择是指生物对环境的适应性,通过适应环境中的资源和威胁来生存和繁殖。
行为协作是指合作以提高生存和繁殖效益,例如猎食或保护幼崽。
这些策略是为了提高生存能力和繁殖潜力。
三、社会科学中的演化与博弈论1. 政治和经济博弈在政治和经济博弈中,决策者必须考虑其他参与者的行为和反应,以便制定最优策略。
这包括考虑协作和竞争的因素,以及考虑时间、成本和利益等变量。
2. 社交行为社交行为包括对他人的关注和对他人的行为做出反应。
社交行为包括合作、竞争、合理和报复等多种行为。
博弈论可用于研究这些社交行为,以预测人们可能做出的最佳行为。
四、演化与博弈论之间的联系演化和博弈论之间存在联系,因为它们都涉及到生物和个体在不同情境下定制和执行策略。
演化博弈论简介
演化博弈论简介丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。
他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。
传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。
正因为如此,这些新理论才显示出强大的生命力,获得广泛运用。
我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。
先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。
我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。
从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。
我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。
我这里用演化,避免用演进,可以减少误解。
演化理论中有两条最重要的机制。
一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。
在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。
我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。
我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。
严复说物竞天择,就是这个意思。
另一种机制叫突变机制(mutant),这保证了种群的变化。
如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。
演化博弈论的复制动态方程
演化博弈论的复制动态方程
演化博弈论是一种研究在群体中个体之间的相互作用和竞争的
数学模型。
在演化博弈论中,不同的策略会根据其在竞争中的成功程度而获得不同的收益。
当个体之间的策略的选择不断变化时,演化博弈的复制动态方程可以用来描述不同策略之间的选择和比例的变化。
复制动态方程的基本形式为:
dx/dt = x(f(y) - f(x))
dy/dt = y(g(x) - g(y))
其中,x、y分别表示两种策略在群体中的比例,f和g为策略的收益函数。
这个方程描述了当一种策略的收益高于另一种策略时,该策略的比例会增加。
换句话说,当一个策略在竞争中更加成功时,它将更快地在群体中传播。
复制动态方程提供了一种框架,用于研究演化博弈中的策略选择和变化。
它可以帮助我们更好地理解各种群体行为的演化和变化,从而有助于我们设计更有效的政策和策略来解决各种社会问题。
- 1 -。
生物演化博弈论
生物演化博弈论生物演化博弈论是一种研究生物种群中个体之间相互作用和适应策略的理论。
这个理论主要探讨了在自然选择的过程中,个体之间如何通过博弈来竞争资源、求偶、避免捕食以及其他种种交互行为。
下面我将详细解释生物演化博弈论的几个关键概念。
1. 生物演化:生物演化指的是物种在时间上的变化和适应,通过适应环境的能力以及遗传变异的积累,物种可以适应不同的生存条件和生态位。
2. 博弈:博弈是指在个体之间进行的互动过程,这些个体之间会根据自身利益进行选择和行动。
博弈的目的是为了获得最大的利益或者避免被对手获得利益。
3. 演化博弈:演化博弈是指在生物种群中,个体之间通过博弈来选择最优的适应策略。
这些策略会随着时间的推移而演化,使得物种能够适应环境并增加生存和繁殖的成功率。
4. 适应策略:适应策略是指个体在博弈中采取的行动方式,这些策略可以是攻击、逃避、合作等不同的行为。
个体的适应策略会受到自身遗传基因、环境因素和对手行为的影响。
5. 自然选择:自然选择是演化博弈中的一种机制,它通过选择最适应环境的个体来改变种群的遗传构成。
在博弈过程中,那些采取更有效适应策略的个体会更有可能生存下来,繁殖后代,从而在种群中逐渐增加其基因频率。
6. 博弈策略的稳定性:博弈策略的稳定性指的是在一种演化博弈中,一旦某个适应策略达到一个稳定状态,就很难被其他策略所替代。
这种稳定性可以使得种群中的个体能够在一段时间内保持相对稳定的策略分布。
总的来说,生物演化博弈论是一种研究个体之间相互作用和适应策略的理论,它可以帮助我们理解生物种群中的个体行为和种群演化的原因和机制。
通过研究演化博弈,我们可以更好地理解生物的进化过程以及为什么某些策略在自然选择中具有优势。
演化博弈论(清华大学)
进化博弈 Evolutionary Games第13章 Chapter 13进化博弈 Evolutionary Games目前为止我们学过了具有多种不同特征的博弈: We have so far studied games with many different features:同时和序贯博弈 Simultaneous and sequential moves 零和与非零和博弈 Zero-sum and non-zero-sum payoffs 操纵未来博弈规则的策略性行动 Strategic moves to manipulate rules of games to come 一次性和重复博弈 One-shot and repeated play 许多人同时进行的集体博弈 Games of collective action in which a large number of people play simultaneouslySlide 2进化博弈 Evolutionary Games所有这些博弈中的参与者都是理性的:每个参 与者…… All the players in all these games are rational: each player…………具有内在一致的价值体系 has an internally consistent value system ……能够计算其策略选择的后果 can calculate the consequences of her strategic choices ……作出最符合其利益的选择 makes choice that best favors her interestsSlide 3进化博弈 Evolutionary Games对理性可能的替代方法可以从生物学的进化和进化动 力学中找到,在那里…… One possible alternative to rationality can be found in the biological theory of evolution and evolutionary dynamics, where…………好的策略可以得到更多的奖励 good strategies will be rewarded with higher payoffs ……参与者可以观察或模仿成功者并试验新的策略 players can observe or imitate success and experiment with new strategies ……随着参与者在参加博弈中获得经验,好的策略将会得到 更经常的使用,坏的策略得到更少的使用。
第8章演化博弈论.ppt
The Nobel Memorial Prize in Economic Sciences
2012-Alvin Roth , Lloyd Shapley 2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E. Stiglitz 1996 - James A. Mirrlees, William Vickrey 1994 - John C. Harsanyi, John F. Nash Jr., Reinhard Selten
“for having integrated insights from psychological research into economic science, especially concerning human judgment and decision-making under uncertainty” “for having established laboratory experiments as a tool in empirical economic analysis, especially in the study of alternative market mechanisms”
演化博弈论简介(2024版)
A
A
A
BA
AA
A A
B
B
A
B
A
A
3、当初始情况为3连A时
A
A
A
AA
A
B
B
A
A
综上可知,32种初始情况下, 只有1种情况稳定于5B,其余31 中情况最后都将稳定于5A。(此时, A为“进化稳定策略”,即ESS, evolutionary stable strategy)
(一)连续型的古诺调整过程 反应函数:
第6讲:演化博弈论简介
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0; 若x>x*,为使x→x*,应满足F(x)<0.
F(x)
F(x)=dx/dt,t↑,则x↓
x* 0
这意味着: 当F'(x*)<0,x*为ESS
x
第6讲:演化博弈论简介
(三)协调博弈的复制动态和ESS
乙
鹰
鸽
鹰 (v-c)/2,(v-c)/2 v ,0
甲
鸽 0 ,v
v/2 ,v/2
第6讲:演化博弈论简介
F
x
dx dt
x 1
x
x
v
2
c
1
x
v 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
S2
a,a
b ,c
c, b
d,d
群体中采用S1的比例为x,S2的比例为1-x
演化博弈论__谢识予__ppt
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意 不同意 博弈方2 同意 不同意 1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则不同策略期望得益和平均 u y x 1 (1 x) 0 得益为:
x
un x 0 (1 x) 0 0 u x u y (1 x) un x 2
5.3.2一般两人对称博弈复制动态 和进化稳定策略
一般模型
策略1 策略2 博弈方2 策略1 策略2 a, a c, b b, c d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博 弈。 基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置 是无差异的。 其中abcd可以是任何得益,根据问题设定。
(m-z)/(1-P) 1
x
(m-z)/(1-P)<0 0<(m-z)/(1-P)<1
dx/dt
1
x
(m-z)/(1-P)>1
5.4 复制动态和进化稳定性: 两人非对称博弈
5.4.1 市场阻入博弈的复制动态 和进化稳定策略 5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
dx/dt
0 0.5
1
x
稳定状态、不动点:x*=0, x*=1
进化稳定策略的检验
比例的博弈方偏离“同 意”
策略选择了“不同意”
比例的博弈方偏离“不 同意”
策略选择了“同意”
u y (1 ) 1 0 1 un (1 ) 0 0 0 u (1 ) u y un (1 )
演化博弈论案例
演化博弈论案例演化博弈论是博弈论的一个重要分支,它研究的是在演化过程中个体之间的相互作用和竞争。
在自然界和社会生活中,演化博弈论都有着广泛的应用。
下面,我们将通过一些具体的案例来说明演化博弈论在现实生活中的应用。
案例一,斑马群体的迁徙。
斑马群体的迁徙过程中存在着一种“安全性与效率”的博弈。
斑马在迁徙过程中需要面对掠食者的威胁,为了保护自己,它们会形成一个紧密的群体,以增加自身的安全性。
然而,这种紧密的群体也会降低迁徙的效率,因为群体中的每一只斑马都需要花费更多的精力来保持队形。
因此,斑马群体在迁徙过程中需要在安全性和效率之间进行权衡,这就是一个典型的演化博弈过程。
案例二,企业之间的竞争。
在市场经济中,各个企业之间存在着激烈的竞争。
在这种竞争中,企业需要考虑自身的利润最大化和市场份额的扩大。
如果一个企业选择了高品质的产品,那么它可能会获得更多的市场份额,但同时也需要承担更高的生产成本。
而如果一个企业选择了低品质的产品,那么它的生产成本会降低,但市场份额可能会受到影响。
因此,企业之间的竞争可以看作是一个演化博弈的过程,它需要在产品质量和成本之间进行权衡。
案例三,社会合作与自利之间的博弈。
在社会生活中,个体之间存在着合作与竞争的关系。
在一些公共事务中,个体可以通过合作获得更大的利益,但同时也需要承担一定的成本。
然而,如果个体选择了自私行为,那么整个社会可能会面临一些问题。
因此,社会合作与自利之间的博弈成为了一个重要的研究课题。
演化博弈论可以帮助我们理解在社会生活中个体之间的合作与竞争的动态平衡。
结语。
演化博弈论作为博弈论的一个重要分支,对于理解自然界和社会生活中的种种现象具有重要的意义。
通过以上案例的介绍,我们可以看到演化博弈论在现实生活中的广泛应用,它为我们理解个体之间的相互作用和竞争提供了重要的理论工具。
希望本文的介绍能够帮助读者更好地理解演化博弈论的概念和应用。
演化博弈理论
演化和博弈理论Larry Samuelson1朱宪辰译博弈论由John yon Neumann and Oskar Morgenstern (1944)提出,经John Nash (1950)加入纳什均衡(Nash equilibrium)概念而完善,被二十世纪80年代的策略革命推广之后,非合作博弈论(noncooperative game theory)在经济研究中已经成为一种标准工具。
这个过程当中,人们越来越以博弈观点为基础分析问题。
主要关注两个问题:我们能否期望纳什均衡是这样的:即我们能否预期博弈双方的选择都是在明确对方的选择下做出的最优反应?如果结论是肯定的,在多种博弈中出现的多重纳什均衡(multiple Nash equilibria),我们能预期哪一种呢?二十世纪80年代,研究博弈论的学者们忙于讨论上述问题,并建立了模型。
基于这样的假定:行为人是完全理性的,并且基于相同理性都有共同的知识水平(common knowledge)。
然而,进入二十世纪90年代,讨论的重点由以理性为基础的模型转到以演化论为基础的模型上来。
原因之一是以理性为基础的模型存在局限性。
这些模型可以容易地推动纳什均衡的一个必要条件:博弈双方会相信对方的行为并根据它们做出最佳反应;但是不能证明另一个必要条件,即他们相信的都正确。
同时,纳什均衡之中的理性选择标准产生可选择的精炼纳什均衡增强概念,意图排除具有充分委付的不真实的纳什均衡以迅速放弃从中选择一个方面作为正确的想法。
原因之二是由于博弈所代表的潜在观念有了变化。
一旦用博弈论解释描述理想相互作用状态时,其中完全理性假定就显得十分自然了。
目前像其它经济模型一样,更加普遍地用一个近似的类似于真实的模型来解释博弈游戏,在此完全理性看起来也不是那么恰当了。
演化博弈论涵盖的模型很广泛。
共同主题是在一个动态过程中描述博弈者如何在一个游戏的重复较量过程中调整他们的行为以重新适应。
演化博弈论研究的现状与展望
演化博弈论研究的现状与展望演化博弈论是近年来备受的研究领域,其研究对象是在演化过程中相互作用的个体行为和策略。
本文将简要介绍演化博弈论的核心主题、研究现状,阐述存在的问题与挑战,并展望未来的研究方向。
演化博弈论主要研究个体在演化过程中如何学习和适应环境,以及个体之间的相互作用和策略选择。
其核心主题是探讨博弈论与演化的结合,即个体在博弈过程中的学习、策略选择及演化稳定策略等问题。
目前,演化博弈论的研究已经涉及多个领域,如经济学、生物学、心理学等。
在经济学领域,演化博弈论被广泛应用于解释市场现象,如产业动态、市场竞争等;在生物学领域,演化博弈论被用来解释物种之间的相互作用和进化;在心理学领域,演化博弈论则被用来揭示人类行为和决策的机制。
尽管演化博弈论已经取得了许多重要的研究成果,但仍存在以下问题与挑战:演化稳定策略的普适性:演化博弈论中的演化稳定策略在不同环境和条件下是否具有普适性仍需进一步验证。
复杂动态网络的模拟:现实中的个体相互作用和演化过程往往涉及到复杂动态网络,如何构建和分析这些网络的模型是一个重要挑战。
实验设计与数据分析:演化博弈论需要大量的实验数据来支持理论分析,因此实验设计和数据分析显得尤为重要。
本文以演化博弈论中的囚徒困境为例,说明其研究历程。
研究者通过对囚徒困境的实验研究发现,个体的短视和自私会导致群体的整体利益受损。
随后,研究者通过数学模型和计算机模拟等方法,进一步探讨了演化稳定策略和纳什均衡等问题。
通过对真实世界的实验和观察,发现囚徒困境的演化博弈论可以解释很多现实中的现象,如公共品提供、资源分配等。
演化博弈论的研究方法主要包括实验方法、数学模型和计算机模拟等。
实验方法:演化博弈论的实验通常涉及人类、动物甚至计算机程序等参与者。
通过操控不同的参数和条件,研究者在实验中观察和记录参与者的行为和策略选择,并运用统计分析等方法来验证理论预测。
数学模型:数学模型是演化博弈论中常用的工具,可以用来描述个体之间的相互作用和演化过程。
演化博弈理论
演化博弈理论
演化博弈理论是一种重要的社会进化理论,它探讨社会决策者如何在竞争环境中进行抉择,以及决策者如何在社会环境中形成稳定状态。
演化博弈理论的本质是一种分析技术,它使用博弈理论来分析社会决策者的决策行为,以及决策者之间的互动。
演化博弈理论的基本概念是,当社会决策者在竞争环境中进行抉择时,他们的抉择会受到一定的影响,而这些影响可以通过演化博弈理论来模拟。
演化博弈理论的主要目的是通过模拟分析,探讨社会决策者之间的互动行为,以及相互影响如何影响他们的决策。
演化博弈理论是一种以演化策略为基础的社会进化理论,它将演化策略应用于社会决策者之间的互动行为,以及决策者如何在竞争环境中进行抉择。
演化博弈理论的主要特点是,它认为决策者的决策行为受到互动行为的影响,而且这种影响可以通过模拟分析来探索和模拟。
演化博弈理论最初由经济学家约翰·图尔斯提出,并由另一位经济学家罗伯特·普林斯改进。
图尔斯和普林斯认为,演化博弈理论可以帮助社会决策者更好地理解竞争环境,从而更好地做出决策。
从而,演化博弈理论可以帮助社会决策者把握竞争环境,更好地做出决策,从而形成一种稳定的社会状态。
演化博弈理论的实践应用
也越来越广泛,如商业策略、市场营销、国家战略和外交等,都可以从演化博弈理论中受益。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
混合策略的演化稳定性
胆小鬼博弈
Y
a(q)
b(1-q)
混合策略纳什均衡 ((1/3,2/3),(1/3,2/3))
a(p) 0,0
2,1
X pq*0 p(1 q)*2 (1 p)q*1 (1 p)(1 q)*0
X b(1-p) 1,2
0,0
X / p (1 q)*2 q 0 q 1/3
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E *0 1 E
演化博弈论
演讲人: 杜 同 学 号:S201111054
演化博弈论
➢ 第一章 演化博弈论的概述 ➢ 第二章 演化稳定策略 ➢ 第三章 复制子动态 ➢ 第四章 应用案例 ➢ 第五章 前沿介绍
第一章 演化博弈论概述
什么是演化博弈论(1)
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳
2. 陈星光,周晶,朱振涛. 城市交通出行方式选择的演化博弈分析[J]. 管理工程学报,2009,23(2):140-142.
3. DeokJoo Kim,Sungwook Kim. Adaptive power control algorithm based on the evolutionary game theory[J]. Journal of KISS: Information Networking,2010,37(3):228-293.
Y
a
b
a 2,2
0,3
策略a 是否是演化稳定策略? 有一个规模为E的策略b入侵
策略a的平均适应度:
X b
3,0
1,1
2(1 E) E *0 2 2E 策略b的平均适应度:
3(1 E) E 3 2E 策略b 是否是演化稳定策略?
有一个规模为E的策略a入侵 策略b的平均适应度:
•
pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:
•
•
•
p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:
•
xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
演化博弈论理论的特征
第一,以参与人群体为研究对象,分析动 态的演化过程,解释群体为何达到以及如 何达到目前的这一状态。
第二,群体的演化既有选择过程也有突变 过程。
第三,经群体选择下来的行为具有一定的 惯性。
演化博弈论的产生与发展(1)
• Alchian(1950)建议在经济分析中用自然选择的概念代替利润最大化 的 概念。Nash(1950)的“群体行为解释” 是包含较完整的演化博弈
总体平均收益
k
u(x, x) = xiu(ei , x) i1
一般的两人对称博弈复制子动态(2)
假设
1收益代表博弈对个人适应性影响的增量效应
2每个个体继承父母的单一策略
3假设人的死亡率 相同
采用策略i的个体在时间t的出生率 u(ei , x) ,这里 是背景适应性 (与博弈结果无关),总体动态:
程演化而来的?
第三章 复制子动态
复制子动态的概述
生物种群的繁衍或者社会现象的不断变迁 ,就会产生一个时间上连续的总体动态, 这就是复制子动态(replicator dynamics)
这里的复制子是指纯策略,它可以从父母 无差别的传递给孩子,随着总体状态的改 变,纯策略(复制子)的收益和其适应性 也会相应的改变。
4. 杨波,徐升华.虚拟企业知识转移激励机理的演化博弈析[J]. 情报 理论与实践,2010,33(7):50-54.
5. 徐岩,胡斌,钱任. 基于随机演化博弈的战略联盟稳定性分析 和仿真[J]. 系统工程理论与实践,2011,31(5):920-926.
第二章 演化稳定策略
演化稳定策略概述
1974年,Smith和Price提出 “演化稳定策 略”。
一般的两人对称博弈复制子动态(1)
分析一个简单的情景:总体很大但是有限,总体中的个体 被规定好了选取对称性两人博弈中的纯策略
K:纯策略集合 u:收益函数 pi(t):当前被规定好了采取纯策略i的个体数。∑pi(t)表示总体 x(t)=(x1(t),…, xk(t)):总体状态。每个分量xi(t)表示时间t采取纯策略i的 个体占总体的比例xi(t)=pi(t)/p(t) u(ei,x):纯策略i在随机匹配中得到的期望收益
益和总体平均 收益之差
一般两人对称博弈复制子 动态和ESS
如表3是一个简单的2*2对称博 弈,如果不给出收益的具体数 值,
在一个群体中,有比例为x的 人采用策略1,(1-x)的人采 用策略2。采用两种策略的博 弈方的期望收益和群体平均收 益分别为:
R1 = x*a +(1-x)b ①
R2 = x*c +(1-x)d
演化稳定策略(Evolutionarily stable stragegy,ESS),是指如果占群体绝大多数的 个体选择演化稳定策略,那么小的突变者 群体就不可能侵入到这个群体。
下面我们从最简单的情况入手:考察一个 大但是有限的总体,这个总体中的个体被 规定好了选取对称性两人博弈中的纯策略
囚徒困境的演化稳定策略
定策略
演化稳定策略的定义(1)
Definition 1:
单一群体
x∈A是演化稳定策略,如果y∈A,y≠x, 存在一个 ∈(0,1),使不等式
u[x,εy + (1 − ε)x] > u[y,εy + (1 − ε)x]
对任意ε ∈(0,)都成立。
A:群体中个体博弈时的支付矩阵; y:表示突变策略;
什么是演化博弈论(2)
为什么将演化思想引入到博弈论中? (1)博弈论对生物学的影响。博弈论的策略
对应生物学中的基因 ,博弈论的收益对应 生物学中的适应度。在生物学中应用的博 弈论与经济学中的传统博弈论最大区别就 是非完全理性的选择。
(2)演化化思想对社会科学的影响。例如, 在市场竞争中,我们不必要去理性的想那 个策略才是最优的,最后能够在市场存活 下来的企业,一定是适应能力最强的公司。
一个稳定状态必须对微小扰动具有稳健性才能称为进化稳定策略。 这相当于要求当干扰使x出现高于x*时, dx/dt=F(x) 必须小于0,即 F’(x*) <0 。这就是微分方程的稳定性定理。
如 F(x) =x(1-x)(1-6x) ,不难解出x*=0、 x*=1、 x*=1/6。
进一步证明,只有1/6才是ESS。因为F’(1/6) <0 ,而F’(0) >0 , F’(1) >0 。根据图2也可以看出只有1/6才是进化稳定策略。
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态
与一般的两人对称博弈相似,标准的N总体 复制子动态:
•
xih [u(eih , xi ) ui (x)]xih
Y qp*0 q(1 p)*2 (1 q)p*1 (1 q)(1 p)*0
Y / q (1 p)2 p 0
p 1/3
N-群体的演化稳定策略
定义1:策略组合 x {x1, x2,..., xn} 是纳什均衡, 如果x是演化稳定策略,如果对于任意的策 略组合 y x 存在某个 (0,1) 使得对于所有的
1950s 思想的最早理论成果。
• 1973年,Smith发表了《博弈论和动物冲突的进化》,这标志着演化 博弈论的诞生。1974年,Smith和Price提出演化博弈理论中的基本概
1970s “演化稳定策略”。1978年,生态学家Taylor和Jonker提出了演化博 弈理论的基本动态概念━━复制动态
演化博弈论的应用
➢ 自演化博弈论诞生之日起,它就逐渐的被人们用 来分析生物、经济等领域的问题。
1. Selten Reinhard.A Note on Evolutionary Stable Strategies in Asymmetric Animal Conflicts [J]. Journal of Theoretical Biology,1980,(84).
其他的一些理论成果包括Cressman(1992)以及Samuelson(1997)的著 作。
• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。