第四章 进化博弈论
基于进化博弈论对我国金融监管协调机制的解读
作者: 李成[1];马国校[1];李佳[2]
作者机构: [1]西安交通大学经济与金融学院,西安710061;[2]中国人民银行西安分行,西安710068
出版物刊名: 金融研究
页码: 186-193页
主题词: 监管协调效率;有限理性;进化博弈
摘要:应用进化博弈理论透视中国人民银行与三家金融监管机构的监管协调行为,以及对我国金融监管协调效率进行考量,得出的基本结论是,当前我国金融监管协调机制处于低效率状态,监管各方在博弈过程中存在“搭便车”现象。金融监管合作与否的收益初始状态设置,在一定程度上决定了监管主体的策略选择。因此,通过建立金融监管协调委员会,加强信息共享和强化监管协调的法律约束手段,从根本上改变监管初始状态,为金融监管各方的协调博弈创造良好的制度环境。
经理人道德风险问题的进化博弈论分析
对此 ,本文运用以复制动态 (e lao d nmi )i Rpi tr y a c c s 和进化稳定策略 (S ) E S 为核心 的进化博弈论分析 方法对 上述 问题进行研 究。也就是在经济主体 ( 个人 、 企业等 ) 有限理 性的基本前提 下 ,研 究较长 时期内经理人选 择 “ 背叛”行为的群体比例变动趋势和进化稳定性, 求这 寻 种 “ 背叛”行为产生的内在根源 、 用机制和关键 因素。 作 这是基于以下考虑 :①经理人对 “ 背叛”行为的选择与 涉及的其他经济主体 ( 如所有者、 政府 、 社会公众等 ) 的 反应之 间存在博弈关系 ;②经理人在这些行为选择 中的 理性是有限的;③ “ 背叛”问题本身就是一个普遍程度 、
比例 的问题 ;④ “ 背叛”问题也是一个长期问题 。
背叛”战略都是符合 自己利益的 ;②a<e c>g 和 ,即
对具有强硬反应的博弈方 2“ 不背叛”有利 , 对非强硬反 应 的博弈方 2“ 背叛”有利。 博弈方2 的利益则有四种可能:①b >d f ,即 和 >h 不管博 弈方 1 是否 “ 背叛” ,博弈方 2 采取强硬反应均是
双方选择不 同策略组合时各 自的得益 ( 既包括物质利益
得益 ,也包括精神得益,故可以说是博弈方的 “ 效用” 。 )
纳什博弈论的原理与应用
纳什博弈论的原理与应用
1. 纳什博弈论的概述
纳什博弈论是一种对决策问题进行数学建模和分析的工具,它以数学方法来研究多方参与决策的情况下的决策策略选择。纳什博弈论的核心概念是纳什均衡,即在一个博弈中,如果每名参与者按照自己的最佳策略行动,其他参与者不会改变自己的策略,那么这个状态被称为纳什均衡。
2. 纳什均衡的原理
纳什均衡是纳什博弈论的核心概念,它指的是在一个博弈中,每个决策者按照自己的最佳策略进行决策时,其他决策者都不会改变自己的策略的状态。纳什均衡并不一定就是最优解,只是在当前情况下每个决策者都做出了最优的选择。
•纳什均衡是一个策略组合,每个参与者都有自己的策略,使得每个参与者都无法通过改变策略来获得更好的结果。
•纳什均衡不一定是独一无二的,可能存在多个纳什均衡点。
•纳什均衡可以通过数学方法进行计算,比如通过求解方程组、博弈树等。
3. 纳什博弈论的应用领域
纳什博弈论在许多领域都有广泛的应用,下面列举了一些主要应用领域:
3.1 经济学
•市场竞争:纳什博弈论可以帮助分析市场中的竞争策略,比如价格竞争、广告竞争等。
•博弈理论经济学:纳什博弈论提供了一种独特的分析方法,可以应用于经济学领域的决策问题。
3.2 政治学
•政治选举:纳什博弈论可以应用于分析政治选举过程中的候选人策略选择。
•国际关系:纳什博弈论可以用于分析国家之间的博弈与合作行为,如军备竞赛、贸易谈判等。
3.3 生物学
•进化博弈论:纳什博弈论可以应用于分析生物种群中的进化策略,如食肉动物和食草动物之间的竞争策略。
•动物行为学:纳什博弈论可以提供一种解释动物行为的数学模型,比如鸟类对食物的争夺、昆虫的捕食行为等。
进化博弈论在企业决策中的运用
其中,成功时的总产出率取为这种形式是因为考虑到 竞争性,随着企业完成创新投资的概率的不断增加,企业 成功时的总产出率将不断降低。在这种形式中,若所有的 竞争性企业都完成创新投资,那么在创新投资成功时,每 个企业都将获得超额收益率。
我们发现在如上的收益假设下,若第一阶段显示坏信 息时,第二阶段继续投资的预期产出率 ". ! 3 ). ! & ". 0 ( ) * 4)40 + 5 & ". # 6 ". #7). ",因此在第一阶段后,揭示坏信息时 所有的企业都将放弃投资,继续投资的均衡概率为 "。若第 一阶段投资显示好信息时,第二阶段继续投资的预期产出 率 为 ". #3). ! & ". 0() * 4)4! + 5 & ". ! 6 ). " , ). )- & ". !’() * $)$! +8). ),故此时所有企业都将继续进行创新投资。在第一 阶 段 , 进 行 创 新 投 资 时 的 期 望 产 出 率 为 ". % 3 ). )- & ". !’ ( ) * 4) + 5 & ". % 6 ). " , ). ! * ". )!4), 由 于 达 到 进 化 稳 定 均 衡时企业是否进行创新投资应该是无差异的,故有 ). ! * ". )!4) , ). ), 从 而 有 第 一 阶 段 进 行 创 新 投 资 的 均 衡 概 率 4)’ , ". #!%。
进化博弈论视角下的国际货币体系演变与人民币国际化路径研究
朱孟 楠 陈 唏 ( 门大学 ,福 建 厦 f 3 0 ) 厦 - 6 0 5 j - q
摘 要 :本文 尝试 运 用单群 体 对称 进化 博 弈 模 型解 释 国际 货 币体 系 的变 迁及 现 行体 系 的形 成 。在 此 基础 上 ,本
分别为 :
国际货币体系的演变与预测人 民币 国际化应 采取 的行
动。
按照所研究的群体数 目不 同 。进化博弈可 分为两 大类 :单 群体 对称 动态 博弈 与 多群 体 非对 称 动态 博 弈 。单群体动态博弈适用 于所考察 的对象 只含有 一个 群体 的状况 .群 体 中的个体都有 相同的纯策略集 和收 益状况 .个体之间进行 的博弈是 对称博弈 :多群体 非
对 称 博 弈 所 考 察 的 对 象 中含 有 多个 群 体 ,不 同群 体 中
f 圭+( ) Q ×01= p× P 一= Байду номын сангаас, ×字× p Q p () : 十 1 一
f Q) p fQ。 ) ( 一p × ( , ( Q, = ( , + 1 ) f Q) x Q Q:
文 进一 步 以多群 体 非对 称进 化博 弈 模型 为分 析 工具 ,深 入剖 析 了人 民 币实现 国 际化 应采 取 的行 为 。得 出人 民币 国际 化应 采取 与 国际货 币 “ 合作 ”的策 略 ,并 逐 步在 区域货 币合 作 的基础 上 向国 际货 币合作 推进 。 关键 词 :进 化 博奔 ;国 际货 币 ;体 系
演化博弈论
②
Ra = xR1 +(1-x) R2 ③
甲 策略1 方 策略2
乙方
策略1 策略2
a,a
b, c
c, b
d, d
根据上述收益得到复制动态方程:
dx/dt = x (R1 - Ra) =x(1-x)[(a-b-c+d)x+(b-
d)].
令:dx/dt=F(x) F(x)为x的单元函数。
因为F(x) =x(1-x)[(a-b-c+d)x+(b-d)],该复制动态最多有3个稳定状态 ,分别为x*=0、 x*=1、 x*=(b-d)/(a-b-c+d)。
演化博弈论理论的特征
第一,以参与人群体为研究对象,分析动 态的演化过程,解释群体为何达到以及如 何达到目前的这一状态。
第二,群体的演化既有选择过程也有突变 过程。
第三,经群体选择下来的行为具有一定的 惯性。
演化博弈论的产生与发展(1)
• Alchian(1950)建议在经济分析中用自然选择的概念代替利润最大化 的 概念。Nash(1950)的“群体行为解释” 是包含较完整的演化博弈
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳什均衡可以通过划线法得出
纳什均衡和演化稳定(1)
第四章 进化博弈论
B
B B
B
A B B
A
A A A A A A
A A
初次博弈相邻2个A
B
A
A A A A A A
B
B A
A
B A A
初次博弈相连3个A
A
B B A A A A
A
A A
5.2.2 古诺调整过程
古诺模型反应函数
q1 3 q2 q2 2 q 3 1 2
3 2.125 2.25 4……… 1.875 1.9375
最优反应动态:有快速学习能力的小群体成员的 反复博弈 复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈 进化稳定策略(ESS)
4.2 最优反应动态
4.2.1 协调博弈的有限博弈方 快速学习模型 4.2.2 古诺调整过程
4.2.1 协调博弈的有限博弈方快速学习模型
考虑5个有限理性的局中人之间,相邻局中人相互 博弈,快速学习并动态调整。
进化稳定策略的检验21100011011????????????????????????????????????????????????????????nynyuuuuu210001101????????????????????????????????????????????????????ynnyuuuuu策略选择了不同意意比例的博弈方偏离同????比例的博弈方偏离不同意策略选择了同意nyuu????????01???nyuu??????0???虽然x0x1均为稳态但不一定都是ess
博弈论经典文献
博弈论经典文献
博弈论是现代数学领域中的一门重要学科,其研究对象是人类行为中的决策和交互。以下是博弈论领域的经典文献:
1.《博弈论》 (Game Theory, 1944) 作者:John von Neumann 和Oskar Morgenstern。这是博弈论的经典之作,引领了博弈论的发展。
2.《策略与博弈论》 (Strategies and Games: Theory and Practice, 1999) 作者:Prajit K. Dutta。该书是博弈论的入门级别的经典著作,易于理解。
3.《博弈论与经济行为》 (Game Theory and Economic Behavior, 1944) 作者:John von Neumann 和 Oskar Morgenstern。该书在博弈论和经济学之间建立了重要的联系。
4.《博弈论基础》 (Foundations of Game Theory, 1994) 作者:David M. Kreps。该书涵盖了博弈论的基础知识和一些重要的研究方向。
5.《进化博弈论》 (Evolutionary Games and Population Dynamics, 1998) 作者:Josef Hofbauer 和 Karl Sigmund。该书将博弈论与生物进化理论相结合,研究了生物种群的演化。
6.《博弈论的逻辑基础》 (The Logic of Games and Decision Theory, 1975) 作者:John C. Harsanyi。该书系统地介绍了博弈论的逻辑基础,对博弈论的发展做出了重要贡献。
进化博弈论
进化博弈论
进化博弈论是一门研究人与其他动物(包括昆虫和其他物种)之间的性的、社会的和经济的行为的学科。它也是一种分析动物之间的比较方法。实际上,进化博弈论有时也被称为“比较行为学”,因为
它与传统动物行为学(也称为行为生态学)具有明显的差异。
进化博弈论假设,人类和其他动物之间的行为模式是由进化产生的,而进化,又是一种种群整体行为的结果,其中每个个体都希望从该行为中获得自身利益最大化。进化博弈论的基本想法是,动物和/
或人之间的某种特定行为策略最终会被自然选择,因为它们提供了相对于其他行为策略的优势,并增加了这些物种在未来世代中的可能性。
进化博弈论可以从不同角度来解释动物和人之间的行为。例如,在自发抉择的情况下,进化博弈论研究表明,动物的行为可能会基于某种“自身福利”标准,其中某些行为可能提供动物个体最大的收益。同样,在社会中,进化博弈论也可以解释人的行为,例如是否为别人做出牺牲。
在进化博弈论的研究中,科学家们研究了不同物种之间的行为,以及不同环境中的各种行为结果,以此来理解行为背后的机制。例如,研究人员正在尝试探究鸟类是如何利用社会行为来建立优势的。一项研究发现,在大部分情况下,鸟类会朝互利的方向发展,而不是自利的方向。另一项研究发现,羊驼和羊群之间的社会行为也具有可预测的模式,这也表明,进化博弈论可以帮助我们理解动物之间社会行为背后的机制。
此外,进化博弈论不仅可以用于研究动物之间的行为,还可以用于研究人与人之间的行为。在人类社会中,进化博弈论也可以解释不同社会群体之间的某些行为,比如偏见与冲突之间的关系。由于这一理论对于比较动物和人类之间的行为策略的能力,它经常被用来解释不同社会群体之间的行为差异和争议。此外,由于进化博弈论可以帮助人们更好地理解社会性质的行为,它也可以被用来解释人类行为的某些方面,比如如何在竞争环境中获得最大的利益。
演化博弈理论
演化博弈理论综述
班级:国贸112班
姓名:***
学号:**********
第一部分概述
演化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的强化动态1(Reinforcement Dynamics)模型等等。但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonke r(1978)提出的模仿者动态(Replicator Dynamics)模型。模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。
在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。
博弈论基础知识汇总
博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。一种是“进化博弈论方法”。它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。
博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、
从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈
按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。
权力的进化博弈论解释
权力的进化博弈论解释
在社会科学领域,权力的进化博弈论是一种解释和研究权力的理论框架。它的核心思想是通过分析个体和组织之间的博弈过程来解释权力的产生、演
化和运作。
权力被定义为某个个体或组织在实现自己目标时对他人行为的控制程度。权力的来源可以是经济资源、社会地位、知识、关系网络等。权力的进化博
弈论认为,权力的产生和演化是个体和组织为了实现自己的利益而进行的博
弈过程的结果。
在权力的进化博弈论的框架下,权力被视为一种资源,个体和组织通过
争夺和竞争这种资源来获得更大的利益。权力的进化是一个动态的过程,不
同的个体和组织会根据自己的利益和战略选择不同的行为模式。
权力的进化博弈论强调权力关系的互动性和相互依赖性。个体和组织之
间的权力关系是相互作用的结果,彼此的行为和策略都会影响对方的行为和
策略。在权力的进化过程中,个体会不断调整自己的策略,以适应不断变化
的权力格局。
权力的进化博弈论也关注权力的稳定性和可持续性。权力的稳定性取决
于权力资源的分配公平性、权力机构的合法性以及对抗和协调机制的存在。
权力的可持续性则需要个体和组织能够维持自己的利益并获得其他参与者的
认可和支持。
权力的进化博弈论为我们理解和解释权力的产生、演化和运作提供了一
个有力的理论框架。它强调了个体和组织之间的互动性、相互依赖性以及权
力关系的动态变化,帮助我们更好地理解现实世界中复杂而多变的权力格局。
演化博弈理论进化博弈论.ppt
Agent Rationality
In GT, one assumes that agents are perfectly rational. In EGT, trial and error process gives strategies that can be selected for by some force (evolution - biological, cultural, etc…). This lack of rationality is the point of departure between EGT and GT.
If a > c, then s1 is ESS.
s1 s2
If d > b, then s2 is ESS.
s1 s2
a c
b d
Otherwise, ESS given by playing s1 with probability equal to (b-d)/[(b-d)+(a-c)].
ESS - Example 1
ESS Approach
ESS = Nash Equilibrium + Stability Condition Notion of stability applies only to isolated bursts of mutations. Selection will tend to lead to an ESS, once at an ESS selection keeps us there.
博弈论第4章答案
R R M 4.1.a 标准式
1↖2 L ’ R ’
4,1 0,0 3,0 0,1 2,2 2,2
纯战略纳什均衡:( L, L ’ ) ( R, R ’ )
子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )
精炼贝叶斯纳什均衡:( L, L ’ )
4.1.b 标准式
1↖2 L ’ M ’ R ’
1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4
纯战略纳什均衡:( R, M ’ )
子博弈精炼纳什均衡:( R, M ’ )
精炼贝叶斯均衡: 没有
4.2
标准式
1↖2 L ’ R ’
2,2 2,2 3,0 0,1 0,1 3,0
六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。
求混合战略精炼贝叶斯均衡:
设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−
参与者2选择L ’和R ’的概率分别为,(1)q q −
在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212
120*1*1*0*p p p p p p +=+⇒=
给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:
121212
12[3*0*(1)][0*3*(1)]2*(1)
41:**,*112
p q q p q q p p p p p p q +−=+−=−−===
=又 联立得 所以 L L
M
L L
M L R
L
4.3答案(见4.5)
4.4
表示方法
第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;
演化博弈论简介
演化博弈论简介
丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。正因为如此,这些新理论才显
示出强大的生命力,获得广泛运用。
我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。
先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。我这里用演化,避免用演进,可以减少误解。演化理论中有两条最重要的机制。一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。严复说物竞天择,就是这个意思。
进化博弈与课程思政
进化博弈与课程思政
引言
在当今的教育领域,课程思政已成为一个备受关注的话题。它强调在专业课程教学中融入思想政治教育,实现知识传授与价值引领的有机统一。而进化博弈论,作为生物学和社会科学的一个重要理论框架,为我们提供了理解和应用课程思政理念的新视角。本文将探讨如何将进化博弈论与课程思政相结合,以提升教育效果和人才培养质量。
一、进化博弈论的基本概念
进化博弈论源于生物学,用于描述在进化过程中生物个体之间的相互作用及其策略选择。它认为生物个体在不断演化过程中,通过试错和自然选择,最终找到最优策略。这一理论在社会科学领域得到广泛应用,尤其在经济学、政治学和社会学等领域。
二、课程思政的核心理念
课程思政旨在将思想政治教育融入专业课程,实现全课程育人。其核心理念包括:以立德树人为根本任务,强化价值引领,促进知识教育与价值观教育的有机统一。课程思政的目标是培养具有社会主义核心价值观的高素质人才。
三、进化博弈论与课程思政的结合点
1. 共同强调适应性:进化博弈论和课程思政都关注个体如何在特定环境中做出适应性的策略选择。进化博弈论可以帮助理解个体如何在不断变化的环境中调整自身策略,而课程思政则关注个体如何在社会和道德环境中做出符合社会主义核心价值观的选择。
2. 重视动态博弈:进化博弈论强调博弈的动态性和长期性,这与课程思政理念相呼应。在课程思政中,教师和学生之间的互动和博弈是持续和发展的过程。通过互动和反馈,教师可以更好地了解学生需求,优化教学内容和方法。
3. 强调合作与共赢:进化博弈论中的合作博弈理论强调个体之间的合作与共赢。这与课程思政中强调的集体主义、团队合作和社会责任感等价值观念相契合。通过合作博弈的视角,有助于培养学生的团队合作精神和共赢思维。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 进化博弈论
4.1.1 进化博弈的基础假设——有限理性 传统的博弈均衡,例如Nash均衡及其精炼是以 完全理性都是共同知识(common knowledge)为 前提的。 然而,完全理性在现实中很难满足,当社会经 济环境和决策问题较复杂时,人们必须存在很大的 理性局限。有限理性对人们的决策、行为选择方式 有很大影响,有限理性基础上的博弈分析与完全理 性博弈分析也有很大区别。进化博弈分析是有限理 性博弈分析的基本框架。
采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
最优反应动态模拟:初次博弈1个A
A
B
A A B A B B A
局中人2 局 中 人 1
1
A
A B 50,50 0,49
B
49,0 60,60
5 4 3
2
两个NASH均衡,但考虑到对对方理性的信任 问题,风险态度等因素,可能选(A,A)。
局中人2
局 中 人 1
A
A B 50,50 0,49
B
49,0 60,60
反应、策略调整规则推导
xi ( t )表示在t 时期,局中人i 的邻居中采用A 策略的数量; 则采用B策略的数量为2-xi ( t )。 则局中人i :
上述比例动态变化的速度取决于模仿的速度。该 速度取决于两个因素:
(1)被模仿对象的数量大小(可用x表示);
(2)被模仿对象的成功程度(可用模仿对象的期 望得益超过平均得益的幅度表示,即 u y u )。 所以,上述比例动态变化的速度可以表示为下列 微分方程:
dx x ( u y u) dt
1,1 0,0 0,0 0,0
在有限理性的前提下,并非所有的局中人开始就能 找到最佳策略(y, y)。下面分析(y, y)是ESS。 假设群体中采用“同意”比例为 x ,则不同策略期 望得益和总平均得益为:
uy x 1 (1 x ) 0 x un x 0 (1 x ) 0 0
以采用“同意”策略类型局中人的比例为例,其动 态变化速度可用下列微分方程反映:
dx x ( uy u) x ( x x 2 ) x 2 (1 x ) x 2 x 3 dt
dx x ( uy u) x ( x x 2 ) x 2 (1 x ) x 2 x 3 dt
u x uy (1 x) un x
2
所以,除x=0外,有: uy x 1 (1 x ) 0 x
wk.baidu.com
u y un , u y u
un x 0 (1 x ) 0 0 u x uy (1 x) un x2
在不断的重复博弈过程中,只要局中人有基本的 判断能力,早晚会发现该差异。于是,得益较差的 局中人会或早或迟模仿另一方。 这意味着两种类型局中人的比例x和1-x不是固定不 变的,而是时间的函数: x(t)和1-x (t)。 局中人策略类型比例的动态变化是进化博弈分析 的核心。
4.1.2 有限理性及其对博弈的影响
有限理性局中人:不满足完全理性假设的局中人 有限理性意味着一般至少有部分局中人不会采用完 全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次 性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性局中人会在博弈过程中学习博弈通过试错 寻找较好的策略
4.1.4 有 限 理 性 博 弈 的 分 析 框 架
在有限理性博弈中具有真正稳定性和 较强预测 能力的均衡,必须是能够通过博弈方的模仿、 学习 的调整过程达到的,具有能经受错误偏离的干扰 的 均衡,是在受到少量干扰后仍然能够“恢复”的均衡。
4.1.4 有 限 理 性 博 弈 的 分 析 框 架
B
B B
B
A B B
A
A A A A A A
A A
初次博弈相邻2个A
B
A
A A A A A A
B
B A
A
B A A
初次博弈相连3个A
A
B B A A A A
A
A A
5.2.2 古诺调整过程
古诺模型反应函数
q1 3 q2 q2 2 q 3 1 2
3 2.125 2.25 4……… 1.875 1.9375
这时博弈分析的核心不是博弈方的最优策略的选择, 而是有限理性的博弈方组成的群体成员的策略调整过 程、趋势和稳定性,这里的稳定性是指采用特定策略 的成员的比例不变,而非某个博弈方的策略不变。
引例: 签协议博弈的复制动态和进化稳定策略
签协议博弈:
局中人2 同意(y) 不同意(n) 同意(y) 不同意(n)
最优反应动态:有快速学习能力的小群体成员的 反复博弈 复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈 进化稳定策略(ESS)
4.2 最优反应动态
4.2.1 协调博弈的有限博弈方 快速学习模型 4.2.2 古诺调整过程
4.2.1 协调博弈的有限博弈方快速学习模型
考虑5个有限理性的局中人之间,相邻局中人相互 博弈,快速学习并动态调整。
最优反应动态模拟
1 博弈方1 博弈方2 2.5 3
2 1.5 1.75
dr 1 2 收敛条件 | dr || | 1 dq2 dq1
问题:两寡头始终假设对方产量不变
4. 3 复制动态和进化稳定性: 两人对称博弈
设某一群体进行随机配对重复博弈,且该博弈为 对称博弈,即群体中个体无角色区分,所有个体 均具有相同的战略空间。
4.1.3 合作的行为生态
动物的适应性是在和生存环境的相互作用中形成的。 在竞争中,动物最终选择进化稳定策略(Evolutionary Stable Strategy,简称ESS)——该策略是被种群大多数 成员所采取的,而且不会受到其它对策的侵蚀。 一种ESS一旦确立,社会稳定下来,偏离的行为将 会受到自然的惩罚。 有利它主义和合作行为在动物界普遍存在。该行为 也可能发生在没有亲缘关系的情况:如共生现象。