演化博弈论基础

合集下载

第四章 进化博弈论

第四章 进化博弈论

采用A的得益:xi (t ) 50 [2 xi (t )] 49 采用B的得益:xi (t ) 0 [2 xi (t )] 60 当xi (t ) 22 / 61 时,采用A;当xi (t ) 22 / 61 时,采用B
最优反应动态模拟:初次博弈1个A
A
B
A A B A B B A
最优反应动态:有快速学习能力的小群体成员的 反复博弈 复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈 进化稳定策略(ESS)
4.2 最优反应动态
4.2.1 协调博弈的有限博弈方 快速学习模型 4.2.2 古诺调整过程
4.2.1 协调博弈的有限博弈方快速学习模型
考虑5个有限理性的局中人之间,相邻局中人相互 博弈,快速学习并动态调整。
4.1.3 合作的行为生态
动物的适应性是在和生存环境的相互作用中形成的。 在竞争中,动物最终选择进化稳定策略(Evolutionary Stable Strategy,简称ESS)——该策略是被种群大多数 成员所采取的,而且不会受到其它对策的侵蚀。 一种ESS一旦确立,社会稳定下来,偏离的行为将 会受到自然的惩罚。 有利它主义和合作行为在动物界普遍存在。该行为 也可能发生在没有亲缘关系的情况:如共生现象。
这时博弈分析的核心不是博弈方的最优策略的选择, 而是有限理性的博弈方组成的群体成员的策略调整过 程、趋势和稳定性,这里的稳定性是指采用特定策略 的成员的比例不变,而非某个博弈方的策略不变。
引例: 签协议博弈的复制动态和进化稳定策略
签协议博弈:
局中人2 同意(y) 不同意(n) 同意(y) 不同意(n)
最优反应动态模拟1 博弈方1 博弈方2 2. 32 1.5 1.75
dr 1 2 收敛条件 | dr || | 1 dq2 dq1

演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
令xi(t)为t时期博弈方 i 采用策略A的邻居的数量,则xi(t) = 0,1,2.
协调博弈的有限博弈方快速学习模型
初次博弈1个A
A B B B B A B B B A B A A B A A A
B A
A A A
A
A A
初次博弈为相邻两个A
B A A B A B A A A A A
A
A A
B
初次博弈相连3个A
x0x1签协议博弈的复制动态和进化稳定策略进化稳定策略的检验????比例的博弈方偏离同意策略选择了丌同意????????11?????????????1?????0????00????1?????????????????????????1?????2????????1?????0????????????1是演化稳定策略ess????比例的博弈方偏离丌同意策略选择了同意????????1????????????1?????0????00????1?????????????????????????????2????????????0????????????0丌是演化稳定策略11000000同意博弈方2不同意同意不同意博弈方1一般两人对称博弈复制动态和进化稳定策略一般模型aacbddbc策略1博弈方2策略2策略1策略2博弈方1一般2x2对称博弈?进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈

演化博弈论__谢识予__ppt

演化博弈论__谢识予__ppt

一般2*2对称博弈
dx/dt
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰 鸽
, vc
2
0, v
,
v 2
鹰鸽博弈
复制动态方程和相位图
dx x(v c) (1 x)v F ( x) x(1 x)[ ] dt 2 2
(m-z)/(1-P) 1
x
(m-z)/(1-P)<0 0<(m-z)/(1-P)<1
dx/dt
1
x
(m-z)/(1-P)>1
5.4 复制动态和进化稳定性: 两人非对称博弈
5.4.1 市场阻入博弈的复制动态 和进化稳定策略 5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
最优反应动态模拟
博弈方1 博弈方2
1 2.5 3 2 1.5 1.75
1 2 收敛条件 | dr || dr | 1
dq2
dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
dy/dt
1 x
x=0
dy/dt
1
x
x=0
两群体复制动态的关系和稳定性
y 1

演化博弈论

演化博弈论
其他的一些理论成果包括Cressman(1992)以及Samuelson(1997)的著 作。
• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。
21世纪 进入2l世纪以来,国内的学者也开始关注演化博弈论,也做出了大 量的研究。
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳

pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:



p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:

xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态

演化博弈论

演化博弈论

混合策略的演化稳定性
胆小鬼博弈
Y
a(q)
b(1-q)
混合策略纳什均衡 ((1/3,2/3),(1/3,2/3))
a(p) 0,0
2,1
X pq*0 p(1 q)*2 (1 p)q*1 (1 p)(1 q)*0
X b(1-p) 1,2
0,0
X / p (1 q)*2 q 0 q 1/3
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E *0 1 E
演化博弈论
演讲人: 杜 同 学 号:S201111054
演化博弈论
➢ 第一章 演化博弈论的概述 ➢ 第二章 演化稳定策略 ➢ 第三章 复制子动态 ➢ 第四章 应用案例 ➢ 第五章 前沿介绍
第一章 演化博弈论概述
什么是演化博弈论(1)
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳

演化博弈

演化博弈


ቤተ መጻሕፍቲ ባይዱ
预先规定好的要素博弈如何确定?既然大家 都是有限理性,那由谁来规定要素博弈的结 构和规则(是人为设计的,还是自发演化形 成的) 现有的一些学习模型是否与现实中群体的理 性水平相符? 对于超出2维空间的动态系统以及非线性系 统难于进行稳定性分析(恰好体现了人的认 知能力有限理性)。
我们以一个简单的“签协议博弈” 为例,说明学习速度很慢、理性层次较 低的有限理性博弈方通过模仿学习博弈 和调整策略的复制动态和策略稳定性。
经济活动中的各种合作都可以用签协 议来代表,因为一旦签订协议,那么重 要的经济合作就有了保证。下图中得益 矩阵表示的就是一个关于签协议的博弈。
博弈方2
同意 博 弈 方 1 同意 不同意 不同意



有限理论博弈的有限分析框架是有限理论博弈方构成的, 一定规模的特定群体内成员的某种反复博弈。 例如某个由缺乏足够预见性的个体组成的小群体,其成 员都对当前局面做出反应,或者相互学习、模仿邻居的 优势策略的情况。也可以是在大量博弈方组成的群体中 成员之间随机配对的反复博弈,相当于现实经济中对象 或伙伴不固定的,多个或大量个体之间的较长经济关系。 这些分析框架通常假设博弈方有一定的统计分析能力和 对不同策略效果的判断能力,但没有事先的预见能力和 预测能力。这种分析框架和人们在享受决策活动中的实 际行为模式是比较接近的。

有限理性意味着博弈方往往不会一开始就找到 最优策略,会在博弈过程中学习博弈,必须通 过试错寻找较好的策略;有限理性也意味着均 衡是不断调整和改进而不是一次性选择的结果, 而且即使达到了均衡也可能再次偏离。
三、有限理性下的博弈分析
1、有限理性博弈分析的目标


A.放宽参与者严格的理性要求,分析有限理性 的参与者通过各种学习过程,如何达到稳定的 均衡状态。 B.有限理性博弈分析主要解决:不同条件下具 体的学习过程(构建的学习模型体现了理性的 不同要求)、学习调整过程中均衡的稳定性 (运用稳定性理论,分析原Nash均衡是否收 敛)。

演化博弈论

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。

演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。

第_7_章_进化博弈论简介汇总

第_7_章_进化博弈论简介汇总
– 大甲虫期望收益是 8x + 3(1-‐x) = 3 + 5x
– 小甲虫期望收益是 5x + (1-‐x) = 1 + 4x
• 大甲虫的期望收益总是超过小甲虫的, 所以,“大体态”是一个进化稳定策略。
进化博弈中的“军备竞赛”
• 生物学家认为在自然界中存在具有囚徒困 境结构的进化博弈现象
– 例如:树木间高矮的关系;植物根系的竞争
• 然后再看根据在总体中的占比,两种生物体随 机相遇所导致的收益期望(x, p, q 的函数)
• 讨论最后这两个期望的大小,判断是否进化稳定
两个采用不同混合策略者相遇的收益
第一类 S(p) 生物 T(1-‐p)
第二类生物
S(q)
T(1-‐q)
a, a c, b
b, c d, d
• 第一种(p策略者)
• 可见,不存在y,使得x<y时小甲虫的期望收益 超过大甲虫。因此,策略“小体态”不是进 化稳定的。
体态博弈中的进化稳定策略:考察大体态
小的 甲虫1 大的
甲虫2 小的 x
5, 5 8, 1
大的 (1-x) 1, 8 3, 3
• 考虑一个很小的正数x,总体中x占比为小 体态,1-‐x占比甲虫为大体态。
考察小体态是否进化稳定策略
小的 甲虫1 大的
甲虫2 小的 (1-x)
5, 5 8, 1
大的 x
1, 8 3, 3
• 考虑一个小正数x,总体中有x占比的个体使用 策略“大体态” ,有1-‐x占比的个体使用策 略“小体态”。(甲虫们随机相遇争夺食物)
– 一只小甲虫的期望收益是 5(1-‐x)+1x = 5-‐4x – 一只大甲虫的期望收益是 8(1-‐x)+3x = 8-‐5x

演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x):
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2: 博弈方2 打击 博 弈 方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y):dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变 (Mutation)。 选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变 是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的 策略,也可能是获得较低支付的策略)。 突变其实也是一种选择,但只有好的策略才能生存下来。突变是一种不 断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进 的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型: 博 弈 A 方 B 1 博弈方2 A B 50,50 49,0 0,49 60,60 协调博弈
1 5 4 3 2
5个博弈方,相邻者彼此博弈,初始策略组合为32种。

第6讲:演化博弈论简介

第6讲:演化博弈论简介

dx/dt
可知,当F '(0) <0, F'(1)<0, 而F'(11/61)>0,则
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.
第6讲:演化博弈论简介
复制动态与最优反应动态的比较:
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
第6讲:演化博弈论简介
(三)协调博弈的复制动态和ESS
复制动态方程F(x):
非对称博弈:不同群体间的演化博弈行为
(一) 市场阻入博弈
竞争者
有两个群体:竞争者和在位者
不进入
打击 竞 进入 争 者 不进 0 ,0 1 ,5 在位者 不打击 2 , 2 1, 5
进入 在位者 打击 (0,0) 不打击 (2,2)
(1,5)
第6讲:演化博弈论简介
采用A表示竞争者,B表示在位者
打击 A 进入 不进 0 ,0 1 ,5 B 不打击 2 , 2 1, 5
则复制动态方程F(x):
d x x 1 x x a c 1 x b d Fx xU U 1 d t
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)

演化博弈 两个解

演化博弈 两个解

演化博弈两个解抽象:在进化生物学和博弈论领域,演化博弈是一种研究生物个体通过策略选择和适应性进化来达到最优结果的方法。

演化博弈可以用来解决个体行为和群体结果之间的矛盾。

本文将讨论演化博弈的两个解。

第一部分:演化博弈的基本概念演化博弈是通过模拟生物个体之间相互作用的策略选择来研究群体行为的方法。

在一个演化博弈模型中,个体通过与其他个体的交互来选择最佳策略,该策略可以使个体在演化过程中获得更大的适应度。

适应度在演化过程中被认为是生存和繁殖成功的度量标准。

第二部分:纳什均衡解纳什均衡解是演化博弈中常用的解决方法之一。

纳什均衡是指在一个博弈中,每个参与者选择的策略是其他参与者策略确定的情况下,自己无法通过单方面改变策略来获得更好的结果。

在演化博弈中,纳什均衡解是指一个策略组合,在该组合下,没有个体可以通过改变自身策略来获得更高的适应度。

纳什均衡解可以解释为演化过程中的稳定态。

第三部分:演化稳定策略解除了纳什均衡解,演化博弈还有一个解是演化稳定策略解。

演化稳定策略解是指在演化过程中,如果大多数个体都采用某一策略,并且这些个体在与其他不同策略个体的交互中能够获得更高的适应度,那么这个策略就是一个演化稳定策略。

演化稳定策略解描述了个体在演化过程中能够稳定存在的策略选择。

结论:演化博弈是研究生物个体行为和群体结果之间关系的一种方法。

纳什均衡解和演化稳定策略解是演化博弈中常用的解决方法。

纳什均衡解描述了个体在策略选择中无法通过单方面改变来获得更好结果,而演化稳定策略解描述了个体在演化过程中通过与其他个体的交互来选择更优策略的过程。

两个解在不同的情况下对个体行为和群体结果的解释有所不同,但都是有效的方法来理解演化博弈。

演化博弈理论

演化博弈理论

演化博弈理论综述班级:国贸112班姓名:***学号:**********第一部分概述演化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。

进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。

进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。

动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的强化动态1(Reinforcement Dynamics)模型等等。

但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonke r(1978)提出的模仿者动态(Replicator Dynamics)模型。

模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。

本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。

在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。

在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。

与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。

生物演化博弈论

生物演化博弈论

生物演化博弈论生物演化博弈论是一种研究生物种群中个体之间相互作用和适应策略的理论。

这个理论主要探讨了在自然选择的过程中,个体之间如何通过博弈来竞争资源、求偶、避免捕食以及其他种种交互行为。

下面我将详细解释生物演化博弈论的几个关键概念。

1. 生物演化:生物演化指的是物种在时间上的变化和适应,通过适应环境的能力以及遗传变异的积累,物种可以适应不同的生存条件和生态位。

2. 博弈:博弈是指在个体之间进行的互动过程,这些个体之间会根据自身利益进行选择和行动。

博弈的目的是为了获得最大的利益或者避免被对手获得利益。

3. 演化博弈:演化博弈是指在生物种群中,个体之间通过博弈来选择最优的适应策略。

这些策略会随着时间的推移而演化,使得物种能够适应环境并增加生存和繁殖的成功率。

4. 适应策略:适应策略是指个体在博弈中采取的行动方式,这些策略可以是攻击、逃避、合作等不同的行为。

个体的适应策略会受到自身遗传基因、环境因素和对手行为的影响。

5. 自然选择:自然选择是演化博弈中的一种机制,它通过选择最适应环境的个体来改变种群的遗传构成。

在博弈过程中,那些采取更有效适应策略的个体会更有可能生存下来,繁殖后代,从而在种群中逐渐增加其基因频率。

6. 博弈策略的稳定性:博弈策略的稳定性指的是在一种演化博弈中,一旦某个适应策略达到一个稳定状态,就很难被其他策略所替代。

这种稳定性可以使得种群中的个体能够在一段时间内保持相对稳定的策略分布。

总的来说,生物演化博弈论是一种研究个体之间相互作用和适应策略的理论,它可以帮助我们理解生物种群中的个体行为和种群演化的原因和机制。

通过研究演化博弈,我们可以更好地理解生物的进化过程以及为什么某些策略在自然选择中具有优势。

第8章演化博弈论.ppt

第8章演化博弈论.ppt
在给定其他参与者策略情况下没有一个参与者能通过单方面改变自己的策略而使自己的得益提高从而没有人有积极性打破这种均衡参与者2322354211233161445经典博弈论经典博弈论实证缺陷实证缺陷方法缺陷方法缺陷假设缺陷假设缺陷二十世纪八十年代之后研究工作围绕着修正经典博弈论中的完全理性假设展开研究并试图为纳什均衡的概念寻找动态结构下的解释
The Nobel Memorial Prize in Economic Sciences




2012-Alvin Roth , Lloyd Shapley 2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E. Stiglitz 1996 - James A. Mirrlees, William Vickrey 1994 - John C. Harsanyi, John F. Nash Jr., Reinhard Selten
“for having integrated insights from psychological research into economic science, especially concerning human judgment and decision-making under uncertainty” “for having established laboratory experiments as a tool in empirical economic analysis, especially in the study of alternative market mechanisms”

演化博弈理论

演化博弈理论

演化和博弈理论Larry Samuelson1朱宪辰译博弈论由John yon Neumann and Oskar Morgenstern (1944)提出,经John Nash (1950)加入纳什均衡(Nash equilibrium)概念而完善,被二十世纪80年代的策略革命推广之后,非合作博弈论(noncooperative game theory)在经济研究中已经成为一种标准工具。

这个过程当中,人们越来越以博弈观点为基础分析问题。

主要关注两个问题:我们能否期望纳什均衡是这样的:即我们能否预期博弈双方的选择都是在明确对方的选择下做出的最优反应?如果结论是肯定的,在多种博弈中出现的多重纳什均衡(multiple Nash equilibria),我们能预期哪一种呢?二十世纪80年代,研究博弈论的学者们忙于讨论上述问题,并建立了模型。

基于这样的假定:行为人是完全理性的,并且基于相同理性都有共同的知识水平(common knowledge)。

然而,进入二十世纪90年代,讨论的重点由以理性为基础的模型转到以演化论为基础的模型上来。

原因之一是以理性为基础的模型存在局限性。

这些模型可以容易地推动纳什均衡的一个必要条件:博弈双方会相信对方的行为并根据它们做出最佳反应;但是不能证明另一个必要条件,即他们相信的都正确。

同时,纳什均衡之中的理性选择标准产生可选择的精炼纳什均衡增强概念,意图排除具有充分委付的不真实的纳什均衡以迅速放弃从中选择一个方面作为正确的想法。

原因之二是由于博弈所代表的潜在观念有了变化。

一旦用博弈论解释描述理想相互作用状态时,其中完全理性假定就显得十分自然了。

目前像其它经济模型一样,更加普遍地用一个近似的类似于真实的模型来解释博弈游戏,在此完全理性看起来也不是那么恰当了。

演化博弈论涵盖的模型很广泛。

共同主题是在一个动态过程中描述博弈者如何在一个游戏的重复较量过程中调整他们的行为以重新适应。

演化与博弈论

演化与博弈论

天津大学管理与经济学部
基础模型——鹰鸽博弈
动态演化
天津大学管理与经济学部
基础模型——鹰鸽博弈
天津大学管理与经济学部
基础模型——鹰鸽博弈
天津大学管理与经济学部
基础模型——鹰鸽博弈
演化稳定策略ESS的概念:
• ESS定义:对于非常小的正数ε,所有的σ≠σ*,满足:
u( , (1 ) ) u( , (1 ) )
学习能力——20世纪上半叶人类经历两次 大战后,吸取教训,建立磋商、合作、谈 判机制,维护了世界整体和平与稳定。 理性预期能力——核武器的出现,使得 人类第一次具有毁灭自己的能力,反而 维持了恐怖的核平衡。
沈阳918事变博物馆
《火与冰——核冬天》 作者:迈克尔· 罗文—罗宾森
天津大学管理与经济学部
演化博弈论的发展历程
1982年与Price一起提出了“演化稳定策略ESS”均衡概念, 为演化博弈理论的一个基本概念。他发起设立了许多奖 项,包括欧洲演化生物学会(European Society for Evolutionary Biology)建立 的John Maynard Smith Prize, 面向演化生物学界杰出的年轻学者。 成
天津大学管理与经济学部
基础模型——鹰鸽博弈
模型假设
设p为整个种群中选择H策略的频率; W(H)和W(D)分别表示H策略和D策略所带来的适应度 E(H,D)表示个体选择H策略而对手选择D策略所带来的回报 若每一个个体都只参与一个竞争
假想有一个无限的种群, 每一个成员都采取H策略或 D策略,且策略的选择是随 机的,在开始竞争之前, 所有的个体都有同样的适 应值
者,可以分为同类群体和不同类群体, k1 。每个群体都有自己

第三章-第五节-演化博弈模型ppt课件

第三章-第五节-演化博弈模型ppt课件
处所得到的收益等于两者冲突导致的损失)
dx/dt
③ 假设v=8,c=4(表示种群间和平共
处所得到的收益大于两者冲突导致的损失)
dx/dt
0
ESS: x*=1
1
x
0
1
x
ESS: x*=1
当c≤v时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时,另一方可获得更多收益。
完整版PPT课件
这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。
13
(四)蛙鸣博弈的复制动态和ESS
蛙鸣 A 不鸣
蛙B

不鸣
P-z ,P-z
m-z ,1-m
1-m,m-z
0 ,0
➢ m、P为求偶成功的概率 ➢ z为机会成本(体力消耗、危险性等)
满足:m ∈ (0.5,1],m<P≤1
令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体 比例 则复制动态方程F(x):
则: dx x2 x3
dx dt
xUY
U
dt
当x=0时,稳定;
复制完动整版态P方PT课程件
当x>0时,最终稳定于x*=6 1
dx/dt
dx x2 x3
dt
甲Y
N

Y
N
1,1
0 ,0
0, 0
0,0
0
1x
图1 签协议博弈的复制动态相位图
x*=0,x*=1为稳定状态,此时,dx/dt=0 但x*=1为ESS,即最终所有人都将选择“Y”
A:“进入”的群体比例为x “不进”的群体比例为1-x
B:“打击”的群体比例为y “不打击”的群体比例为1-y

演化博弈论

演化博弈论
十一、 重复博弈的囚徒困境
主要术语解释
参考文献
主题索引
文摘
第一章 导论
《演化与博弈论》致力于讨论生物演化的建模方法,而不是运用上述方法去解决任何具体问题。本章讨论了这种方法的应用范围及其局限性,同时还涉及这些模型的学术价值。
当生物的特定表现型的适应度依赖于其在种群中的频率分布时,演化博弈论就成为从表现型这个角度思考生物演化问题的一种方法。例如,在对鸟的翅膀形态演化和同一鸟类分布行为演化的比较研究中,为了搞清楚翅膀的形态就有必要了解该鸟类所生活其间的大气的状况,以及随翅膀形状不同所导致升力和阻力的差异。同时也有必要将鸟翼是由羽毛所构成的这个约束条件也纳入考虑的范围,因为对于蝙蝠和翼龙来说,这种约束条件显然有所不同。然而这里没有必要去考虑种群中其他成员的行为。恰恰相反,生物分布的演化则主要取决于其他同种生物是如何行动的,因为生物的分布与寻找合适的配偶、避免对资源的竞争、联合防范掠夺者等因素密切相关。
在关于鸟翼形态的案例中,我们想知道为什么自然选择总有利于某些特定的表现型。最优化理论是分析这个问题的比较合适的数学工具。我们面临的问题是要判断哪些特征(比如,一个较高的升力阻力比,一个较小的转向圆)对适应度的变化有作用,而不是面对当个体的生存取决于其他个体的行为时所引致的特殊困难。而这些困难正是下文中所涉及的内容。
定价:22.00
本书是演化博弈论领域内的一本关键性的核心著作,探讨了演化博弈论这一博弈论分支的一般理论进展,对其核心内容进行了全面阐述,重点论述了演化博弈论与非合作博弈论之间的概念性和技术性联系,给出了有关概念的定义及各相关命题,,并从特殊到一般地对各内容进行了数学证明。
目录
出版前言
演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。演化博弈理论源于生物进化论,它曾相当成功地解释了生物进化过程中的某些现象。如今,经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程,也取得了令人瞩目的成绩。演化博弈论目前成为演化经济学的一个重要分析手段,并逐渐发展成一个经济学的新领域。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

dt
2
2
x(1 x)(1 6x)
dx/dt 1/6
1
x
5.3.5 蛙鸣博弈的复制动态 和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈:
雄蛙2
鸣叫
不鸣
鸣叫 P-z, P-z m-z, 1-m 不鸣 1-m, m-z 0, 0
蛙鸣博弈不同均衡的条件
M 1
鸣叫 混合策略
不鸣叫
m=1-P+z m=z
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意 不同意
博弈方2 同意 不同意
1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则 得不益同为策:略期望得益和uy平均x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
进化稳定策略的检验
比例的博弈方偏离“同 意”
策略选择了“不同意”
uy (1 y un (1 )2
uy 1 0
x 1是进化稳定策略ESS
比例的博弈方偏离“不 同意”
策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性:
两人对称博弈 5.4复制动态和进化稳定性:
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
有限理性博弈方:不满足完全理性假设的博弈方 有限理性意味着一般至少有部分博弈方不会采用完
全理性博弈的均衡策略 有限理性意味着均衡是不断调整和改进而不是一次
性选择的结果,而且即使到达了均衡也可能再次偏 离 有限理性博弈方会在博弈过程中学习博弈通过试错 寻找较好的策略
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈
最优反应动态模拟:初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数 最优反应动态模拟
q1
3
q2 2
q2
3
q1 2
1
2
3
4………
博弈方1 2.5 1.5 2.125 1.875
进化稳定策略(ESS)
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
博弈方2
A
B
A 50,50 49,0 B 0,49 60,60
协调博弈
1
2 5
4
3
反应、策略调整规则推导
采用A的得益:xi (t) 50 [2 xi (t)] 49 采用B的得益:xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时,采用A;当xi (t) 22 / 61时,采用B
第五章 有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。 完全理性在现实中很难满足,当社会经济环境 和决策问题较复杂时,人们必须存在很大的理 性局限。有限理性对人们的决策、行为选择方 式有很大影响,有限理性基础上的博弈分析与 完全理性博弈分析也有很大区别。进化博弈分 析是有限理性博弈分析的基本框架。本章介绍 以最优反应动态和复制动态为核心,以进化稳 定策略为基本均衡概念的进化博弈分析,包括 基本方法、概念和各种经典模型等。
x(1 x)(61x 11)
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1
x
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2



vc , vc
2
2
v, 0

0, v
v 2
,v
2
鹰鸽博弈
复制动态方程和相位图
dx F(x) x(1 x)[ x(v c) (1 x)v]
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
dx dt
x(u y
u)
x(x
x2)
x2 (1
x)
x2
x3
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
其中abcd可以是任何得益,根据问题设定。
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
dx dt
x(u1
u)
x[u1
xu1
(1
x)u2 ]
x(1 x)(u u)
x(1 x)[ x(a c) (1 x)(b d )]
复制动态 相位图
x
1
x
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
dx F(x) x(1 x)[x(a c) (1 x)(b d)] dt
uy 0 un
x 0不是进化稳定策略
5.3.2一般两人对称博弈复制动态 和进化稳定策略
一般模型
策略1 策略2
博弈方2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博 弈。
基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置 是无差异的。
博弈方2 3
1.75 2.25 1.9375
收敛条件 | dr1 || dr2 | 1
dq2 dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
相关文档
最新文档