演化博弈论基础资料

合集下载

博弈13:演化博弈

博弈13:演化博弈
假设
博弈方的学习速度很慢,理性层次较低,
而且成员组数目众多,博弈是动态、多次的。
5.3 复制动态和演化稳定性:两人对称博弈
演化博弈的动态模型:
演化博弈基本的选择动态(selection dynamics)表述为:
(t ) (t ) g ( ) i i i
其中θi(t)表示在t时刻选择策略i的个体在群体中所占比例;函数 gi(θ )表示某种具体选择过程,不同学习机制对应不同函数。
1973年,他和乔治·普瑞
斯一起在著名的《自然》 杂志上发表题为《动物冲 突的逻辑》一文。 与博弈论》,被公认为演 化博弈论之父。
1982年出版了著作《演化
•2003年出版了他最后一本著作 ——《动物信号发射》 (与大卫哈珀尔合著),为其学术生涯画上了一个圆 满的句号。
•2004年4月19日,梅纳德· 史密斯在他的书桌前 溘然长逝。

选择动态的基本特征:当初始状态下没有人采取某一纯策略i时 ,则永远不会被采用;参与者只能模仿那些已经存在的策略,即没 有反映出突变机制。
i (t ) 0 i (t ) 0

博弈方策略类型比例动态变化是演化博弈分析的 核心,其关键是动态变化的速度(方向可以用速度的 正负号来反映)。动态变化的速度取决于博弈方学习 模仿的速度。一般情况下,学习速度取决于两个因素 :一是模仿对象的数量大小(可以用相应类型博弈方 的比例表示),这关系到观察和模仿的难易程度;二 是模仿对象的程度(可以用模仿对象策略得益超过平 均得益的大小来表示),这关系到判断差异难易程度 和对模仿激励的大小。
5.2最优反应动态
假定博弈方具有相当快的学习能力,虽然在复杂局面下准 确判断分析和运用预见性的能力稍差,但它们能对不同策 略的结果作出比较正确的事后评估,并相应调整策略。 因此给定前期的经验(博弈结果),各个博弈方在本期才 能找到和采用针对前斯其他博弈方策略的最佳反应策略。 最适合描述这种理性层次博弈方的策略调整的动态机制, 这就是所谓的“最优反应动态”。

第八章--演化博弈--《博弈论与经济》-PPT课件(2024版)

第八章--演化博弈--《博弈论与经济》-PPT课件(2024版)

A
a1 0
0 a2
▪ 1. a1 0, a2 。0
▪ 由表2-1知,此时该博弈的纯纳什均衡为 (e1, e1) ,(e2,e2) 及
▪ 混合策略纳什均衡 X ( a2 , a1 ) ,Y ( a2 , a1 )
a1 a2 a1 a2
a1 a2 a1 a2
▪ 该博弈有2个ESS,e1 与 e2 。
k
▪ 必有 E(e1, X ) E(e2, X ) E(ek , X ) C ,否则, E(X , X ) xiE(ei, X ) ,与 i 1
▪ (*)相矛盾。这样 ,

k
E( X , X ) C xi C E(ei , X )
i 1
, i 1,2,,k
.
▪ 性质2 设 Y 为单总体演化博弈 G 的ESS, X 为 G 的纳什均衡策
▪ 由定理8.1的1阶最优反应条件(1)知,若 X为ESS ,X 必为纳什均衡 策略。
▪ 命题8.1 若 (X, X) 为G的严格纳什均衡,则 X 为ESS。 ▪ 例8.1 在囚徒困境问题中,(坦白,坦白)是严格纳什均
衡,因而“坦白”是ESS。它表明演化稳定性并不排除低 效率均衡策略。 ▪ 命题8.2对单总体演化博弈的支付矩阵 A 进行局部变换,即 任何一列加上一个常数,ESS不变。 ▪ 命题8.2成立的原因是ESS可由支付差所决定。
参与人1的支付矩阵。由于 E(X ,Y ) 关于X 与 Y 是双线性的,即 E(X ,Y ) 满足
▪ E(aX1 bX2 , cY1 dY2 ) acE(X1,Y1) adE(X1,Y2 ) bcE(X2 ,Y1) bdE(X2 ,Y2 ) ,
▪ 因而(1)等价于 ▪ E(X ,Y) (1 )E(X , X ) E(Y,Y) (1 )E(Y, X )

演化博弈论__谢识予__ppt

演化博弈论__谢识予__ppt

一般2*2对称博弈
dx/dt
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰 鸽
, vc
2
0, v
,
v 2
鹰鸽博弈
复制动态方程和相位图
dx x(v c) (1 x)v F ( x) x(1 x)[ ] dt 2 2
(m-z)/(1-P) 1
x
(m-z)/(1-P)<0 0<(m-z)/(1-P)<1
dx/dt
1
x
(m-z)/(1-P)>1
5.4 复制动态和进化稳定性: 两人非对称博弈
5.4.1 市场阻入博弈的复制动态 和进化稳定策略 5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
最优反应动态模拟
博弈方1 博弈方2
1 2.5 3 2 1.5 1.75
1 2 收敛条件 | dr || dr | 1
dq2
dq1
问题:两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性: 两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
dy/dt
1 x
x=0
dy/dt
1
x
x=0
两群体复制动态的关系和稳定性
y 1

演化博弈论考试题及答案

演化博弈论考试题及答案

演化博弈论考试题及答案一、单选题(每题2分,共20分)1. 演化博弈论中,哪种类型的博弈模型是研究个体策略如何随时间演化的?A. 静态博弈B. 动态博弈C. 演化博弈D. 重复博弈答案:C2. 在演化博弈论中,哪种选择压力可以导致策略的演化?A. 随机漂移B. 突变C. 自然选择D. 以上都是答案:D3. 演化博弈论中的“复制动态”是指什么?A. 策略的随机复制B. 策略的有性复制C. 策略的无性复制D. 策略的遗传复制答案:C4. 演化博弈论中,哪种类型的均衡是策略演化的稳定结果?A. 纳什均衡B. 演化稳定策略(ESS)C. 支配策略均衡D. 子博弈完美均衡答案:B5. 在演化博弈论中,哪种策略被认为是不可被其他策略入侵的?A. 优势策略B. 劣势策略C. 演化稳定策略(ESS)D. 混合策略答案:C6. 演化博弈论中,哪种模型可以用来描述个体之间的策略互动?A. 群体模型B. 个体模型C. 空间模型D. 以上都是答案:D群体中的分布?A. 无限群体模型B. 有限群体模型C. 空间群体模型D. 以上都是答案:D8. 演化博弈论中,哪种类型的模型可以模拟个体策略在空间上的分布?A. 无限群体模型B. 有限群体模型C. 空间群体模型D. 以上都是答案:C间点的分布?A. 无限群体模型B. 有限群体模型C. 动态群体模型D. 以上都是答案:C10. 在演化博弈论中,哪种类型的模型可以模拟个体策略在不同时间点和空间上的分布?A. 无限群体模型B. 有限群体模型C. 空间动态群体模型D. 以上都是答案:C二、多选题(每题3分,共15分)1. 演化博弈论中,以下哪些因素可以影响策略的演化?A. 突变B. 随机漂移C. 自然选择D. 社会学习答案:A, B, C, D2. 在演化博弈论中,以下哪些是演化稳定策略(ESS)的特点?A. 不可被其他策略入侵B. 可以被其他策略入侵C. 一旦形成,不易被替代D. 需要所有个体都采取答案:A, C3. 演化博弈论中,以下哪些模型可以用来描述个体策略的演化?A. 复制动态模型B. 适应度景观模型C. 贝叶斯网络模型D. 马尔可夫链模型答案:A, B, D4. 在演化博弈论中,以下哪些因素可以导致策略分布的变化?A. 策略的适应度差异B. 策略的传播机制C. 环境的变化D. 个体的随机行为答案:A, B, C, D5. 演化博弈论中,以下哪些是群体模型的特点?A. 个体策略的分布是连续的B. 个体策略的分布是离散的C. 群体大小可以是无限的D. 群体大小可以是有限的答案:B, C, D三、判断题(每题2分,共20分)1. 演化博弈论只研究动物行为,不涉及人类行为。

演化博弈论

演化博弈论
其他的一些理论成果包括Cressman(1992)以及Samuelson(1997)的著 作。
• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。
21世纪 进入2l世纪以来,国内的学者也开始关注演化博弈论,也做出了大 量的研究。
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳

pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:



p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:

xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
0
X*
1
x
标准的N总体复制子动态

演化博弈

演化博弈


ቤተ መጻሕፍቲ ባይዱ
预先规定好的要素博弈如何确定?既然大家 都是有限理性,那由谁来规定要素博弈的结 构和规则(是人为设计的,还是自发演化形 成的) 现有的一些学习模型是否与现实中群体的理 性水平相符? 对于超出2维空间的动态系统以及非线性系 统难于进行稳定性分析(恰好体现了人的认 知能力有限理性)。
我们以一个简单的“签协议博弈” 为例,说明学习速度很慢、理性层次较 低的有限理性博弈方通过模仿学习博弈 和调整策略的复制动态和策略稳定性。
经济活动中的各种合作都可以用签协 议来代表,因为一旦签订协议,那么重 要的经济合作就有了保证。下图中得益 矩阵表示的就是一个关于签协议的博弈。
博弈方2
同意 博 弈 方 1 同意 不同意 不同意



有限理论博弈的有限分析框架是有限理论博弈方构成的, 一定规模的特定群体内成员的某种反复博弈。 例如某个由缺乏足够预见性的个体组成的小群体,其成 员都对当前局面做出反应,或者相互学习、模仿邻居的 优势策略的情况。也可以是在大量博弈方组成的群体中 成员之间随机配对的反复博弈,相当于现实经济中对象 或伙伴不固定的,多个或大量个体之间的较长经济关系。 这些分析框架通常假设博弈方有一定的统计分析能力和 对不同策略效果的判断能力,但没有事先的预见能力和 预测能力。这种分析框架和人们在享受决策活动中的实 际行为模式是比较接近的。

有限理性意味着博弈方往往不会一开始就找到 最优策略,会在博弈过程中学习博弈,必须通 过试错寻找较好的策略;有限理性也意味着均 衡是不断调整和改进而不是一次性选择的结果, 而且即使达到了均衡也可能再次偏离。
三、有限理性下的博弈分析
1、有限理性博弈分析的目标


A.放宽参与者严格的理性要求,分析有限理性 的参与者通过各种学习过程,如何达到稳定的 均衡状态。 B.有限理性博弈分析主要解决:不同条件下具 体的学习过程(构建的学习模型体现了理性的 不同要求)、学习调整过程中均衡的稳定性 (运用稳定性理论,分析原Nash均衡是否收 敛)。

博弈论与信息经济学-5.演化博弈

博弈论与信息经济学-5.演化博弈

猎鹿博弈
猎鹿博弈源自启蒙思想家卢梭的著作《论人类不平等的起源和基础》 中的一个故事。 古代的村庄有两个猎人。当地的猎物主要有两种:鹿和兔子。如果 一个猎人单兵作战,一天最多只能打到4只兔子。只有两个一起去才 能猎获一只鹿。从填饱肚子的角度来说,4只兔子能保证一个人4天 不挨饿,而一只鹿却能让两个人吃上10天。
在演化博弈中,认为参与人的选择行为可以依据 前人的经验、学习与模仿他人行为、受遗传因素 的决定等。因而演化博弈把具有主观选择行为的 参与人扩展为包括动物、植物在内的有机体,动 植物参与者的支付可被理解为为某种适应程度。 把博弈论的分析与应用从研究人类的竞争行为扩 展为研究有机体的策略互动关系。这个领域的开 创性工作是由英国生物学家约翰· 梅纳德· 史密斯 (John Maynard Smith)和G.R.普莱斯 (G.R.Price)1973年进行的。演化博弈现在正 逐渐被广泛应用于社会经济学领域。
路径依赖的例子
有人将5只猴子放在一只笼子里,并在笼子中间吊上一串香蕉,只要 有猴子伸手去拿香蕉,就用高压水教训所有的猴子,直到没有一只猴 子再敢动手。 然后用一只新猴子替换出笼子里的一只猴子,新来的猴子不知这 里的“规矩”,竟又伸出上肢去拿香蕉,结果触怒了原来笼子里的4 只猴子,于是它们代替人执行惩罚任务,把新来的猴子暴打一顿,直 到它服从这里的“规矩”为止。 试验人员如此不断地将最初经历过高压水惩戒的猴子换出来,最 后笼子里的猴子全是新的,但没有一只猴子再敢去碰香蕉。 起初,猴子怕受到“株连”,不允许其他猴子去碰香蕉,这是合 理的。 但后来人和高压水都不再介入,而新来的猴子却固守着“不许拿 香蕉”的制度不变,这就是路径依赖的自我强化效应。
路径依赖的例子
一个广为流传、引人入胜的例证是:现代铁路两条铁轨之间的标准距 离是四英尺又八点五英寸。原来,早期的铁路是由建电车的人所设计 的,而四英尺又八点五英寸正是电车所用的轮距标准。那么,电车的 标准又是从哪里来的呢?最先造电车的人以前是造马车的,所以电车 的标准是沿用马车的轮距标准。马车又为什么要用这个轮距标准呢? 英国马路辙迹的宽度是四英尺又八点五英寸,所以,如果马车用其他 轮距,它的轮子很快会在英国的老路上撞坏。这些辙迹又是从何而来 的呢?从古罗马人那里来的。因为整个欧洲,包括英国的长途老路都 是由罗马人为它的军队所铺设的,而四英尺又八点五英寸正是罗马战 车的宽度。 任何其他轮宽的战车在这些路上行驶的话,轮子的寿命都不会很 长。可以再问,罗马人为什么以四英尺又八点五英寸为战车的轮距宽 度呢?原因很简单,这是牵引一辆战车的两匹马屁股的宽度。故事到 此还没有结束。美国航天飞机燃料箱的两旁有两个火箭推进器,因为 这 路径依赖些推进器造好之后要用火车运送,路上又要通过一些隧 道,而这些隧道的宽度只比火车轨道宽一点,因此火箭助推器的宽度 是由铁轨的宽度所决定的。 所以,最后的结论是:路径依赖导致了美国航天飞机火箭助推器 的宽度,竟然是两千年前便由两匹马屁股的宽度所决定的。

演化博弈

演化博弈

Taylor和Jonker提出了演化博弈理论的基本动态概念——复制动态
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变迁、产业演化以及股票 市场等,同时对演化博弈理论的研究也开始由对称博弈向非对称博弈深入,并取得了一定
1980s
的成果
演化博弈的产生与发展
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、完整地总结了演 1990s 化博弈理论,其中包含了一些最新的理论研究成果。
则竞争者群体的复制动态方程F1(x):
dx/dt dx/dt 1 x y=1/2 y>1/2 1 dx/dt
x 1 x
y<1/2
复制动态中的非对称博弈
对于博弈方2: 博弈方2 打击 博 弈 方 1 容忍
进入
不进
0, 0
1, 5
2, 2
1, 5
则在位者群体的复制动态方程F2(y):dy/dt 1 x演化博弈的基本分析过程
一般的演化博弈模型的建立主要基于两个方面:选择(Selection)和突变 (Mutation)。 选择是指能够获得较高支付的策略在以后将被更多的参与者采用;突变 是指部分个体以随机的方式选择不同于群体的策略(可能是能够获得高支付的 策略,也可能是获得较低支付的策略)。 突变其实也是一种选择,但只有好的策略才能生存下来。突变是一种不 断试错的过程,也是一种学习与模仿的过程,这个过程是适应性且是不断改进 的。
目录页
PART TWO
最优反应动态
协调博弈的有限博弈方快速学习模型
模型: 博 弈 A 方 B 1 博弈方2 A B 50,50 49,0 0,49 60,60 协调博弈
1 5 4 3 2
5个博弈方,相邻者彼此博弈,初始策略组合为32种。

演化博弈论

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。

演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论,可称为达尔文式的范式革命。

演化博弈模型及其应用

演化博弈模型及其应用

参考内容
内容摘要
在当今复杂多变的社会环境中,合作与竞争并存的现象越来越普遍。这种环 境下,博弈论为我们提供了一个理解和分析这种复杂性的有力工具。特别是合作 竞争博弈模型,它强调了博弈中ቤተ መጻሕፍቲ ባይዱ与者之间的合作和竞争的交互性质,对于我们 理解和解决实际问题具有重要的启示作用。
一、合作竞争博弈模型概述
一、合作竞争博弈模型概述
2、社会学
2、社会学
在社会学领域,演化博弈模型被用来解释社会规范、社会习俗、文化传承等 社会现象的形成和演变。例如,研究者可以通过演化博弈模型来分析个体之间的 行为互动如何影响整个群体的行为模式和文化传承。
3、经济学
3、经济学
在经济学领域,演化博弈模型被广泛应用于研究市场行为、产业演化、金融 风险等方面。例如,研究者可以通过演化博弈模型来分析企业在市场竞争中如何 调整自己的策略,以及这种策略调整如何影响整个市场的竞争格局和稳定性。
四、结论
四、结论
总的来说,合作竞争博弈模型为我们理解和解决实际问题提供了一个有效的 框架。它让我们认识到,在复杂的现实世界中,合作和竞争并存是一种常态。通 过理解和运用这种博弈模型,我们可以更好地处理各种人际关系,实现更大的利 益。
谢谢观看
二、合作竞争博弈模型的策略选 择
二、合作竞争博弈模型的策略选择
在合作竞争博弈模型中,策略的选择是关键。一般来说,主要有以下几种策 略:
1、合作策略:这种策略主要是为了通过合作实现更大的利益。合作策略通常 需要考虑的是如何与其他局中人建立合作关系,以及如何维护这种合作关系。
二、合作竞争博弈模型的策略选择
3、随机演化博弈模型
随机演化博弈模型则考虑了更多随机因素对博弈过程的影响。例如,个体的 策略调整可能会受到随机事件的影响,或者整个群体的策略分布可能会因为随机 因素而发生意想不到的变化。在这种模型中,随机性成为了影响策略演化的重要 因素。

第三章 第五节 演化博弈模型

第三章 第五节 演化博弈模型
0 1
1
y
y
(a) x=0
(b) x≠0 ESS: y*=0
y*∈[0,1]
打击 A 进入 不进 0 ,0 1 ,5
B
不打击 2 , 2 1, 5
A:“进入”的群体比例为x “不进”的群体比例为1-x B:“打击”的群体比例为y “不打击”的群体比例为1-y
乙 鹰 甲
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
② 假设v=8,c=8(表示种群间和平共
处所得到的收益等于两者冲突导致的损失)
dx/dt
(v-c)/2 鹰 (v-c)/2,
鸽 v ,0 v/2 ,v/2

0 ,v
F x
dx v vc x 1 x x 1 x dt 2 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0 1
F x
dx x a c 1 x b d x U1 U x 1 x dt
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
稳定性定理
F(x)=dx/dt,t↑,则x↑
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.

演化博弈论(清华大学)

演化博弈论(清华大学)

进化博弈 Evolutionary Games第13章 Chapter 13进化博弈 Evolutionary Games目前为止我们学过了具有多种不同特征的博弈: We have so far studied games with many different features:同时和序贯博弈 Simultaneous and sequential moves 零和与非零和博弈 Zero-sum and non-zero-sum payoffs 操纵未来博弈规则的策略性行动 Strategic moves to manipulate rules of games to come 一次性和重复博弈 One-shot and repeated play 许多人同时进行的集体博弈 Games of collective action in which a large number of people play simultaneouslySlide 2进化博弈 Evolutionary Games所有这些博弈中的参与者都是理性的:每个参 与者…… All the players in all these games are rational: each player…………具有内在一致的价值体系 has an internally consistent value system ……能够计算其策略选择的后果 can calculate the consequences of her strategic choices ……作出最符合其利益的选择 makes choice that best favors her interestsSlide 3进化博弈 Evolutionary Games对理性可能的替代方法可以从生物学的进化和进化动 力学中找到,在那里…… One possible alternative to rationality can be found in the biological theory of evolution and evolutionary dynamics, where…………好的策略可以得到更多的奖励 good strategies will be rewarded with higher payoffs ……参与者可以观察或模仿成功者并试验新的策略 players can observe or imitate success and experiment with new strategies ……随着参与者在参加博弈中获得经验,好的策略将会得到 更经常的使用,坏的策略得到更少的使用。

第8章演化博弈论.ppt

第8章演化博弈论.ppt
在给定其他参与者策略情况下没有一个参与者能通过单方面改变自己的策略而使自己的得益提高从而没有人有积极性打破这种均衡参与者2322354211233161445经典博弈论经典博弈论实证缺陷实证缺陷方法缺陷方法缺陷假设缺陷假设缺陷二十世纪八十年代之后研究工作围绕着修正经典博弈论中的完全理性假设展开研究并试图为纳什均衡的概念寻找动态结构下的解释
The Nobel Memorial Prize in Economic Sciences




2012-Alvin Roth , Lloyd Shapley 2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E. Stiglitz 1996 - James A. Mirrlees, William Vickrey 1994 - John C. Harsanyi, John F. Nash Jr., Reinhard Selten
“for having integrated insights from psychological research into economic science, especially concerning human judgment and decision-making under uncertainty” “for having established laboratory experiments as a tool in empirical economic analysis, especially in the study of alternative market mechanisms”

演化和博弈理论汇总

演化和博弈理论汇总

演化和博弈理论Larry Samuelson1朱宪辰译博弈论由John yon Neumann and Oskar Morgenstern (1944)提出,经John Nash (1950)加入纳什均衡(Nash equilibrium)概念而完善,被二十世纪80年代的策略革命推广之后,非合作博弈论(noncooperative game theory)在经济研究中已经成为一种标准工具。

这个过程当中,人们越来越以博弈观点为基础分析问题。

主要关注两个问题:我们能否期望纳什均衡是这样的:即我们能否预期博弈双方的选择都是在明确对方的选择下做出的最优反应?如果结论是肯定的,在多种博弈中出现的多重纳什均衡(multiple Nash equilibria),我们能预期哪一种呢?二十世纪80年代,研究博弈论的学者们忙于讨论上述问题,并建立了模型。

基于这样的假定:行为人是完全理性的,并且基于相同理性都有共同的知识水平(common knowledge)。

然而,进入二十世纪90年代,讨论的重点由以理性为基础的模型转到以演化论为基础的模型上来。

原因之一是以理性为基础的模型存在局限性。

这些模型可以容易地推动纳什均衡的一个必要条件:博弈双方会相信对方的行为并根据它们做出最佳反应;但是不能证明另一个必要条件,即他们相信的都正确。

同时,纳什均衡之中的理性选择标准产生可选择的精炼纳什均衡增强概念,意图排除具有充分委付的不真实的纳什均衡以迅速放弃从中选择一个方面作为正确的想法。

原因之二是由于博弈所代表的潜在观念有了变化。

一旦用博弈论解释描述理想相互作用状态时,其中完全理性假定就显得十分自然了。

目前像其它经济模型一样,更加普遍地用一个近似的类似于真实的模型来解释博弈游戏,在此完全理性看起来也不是那么恰当了。

演化博弈论涵盖的模型很广泛。

共同主题是在一个动态过程中描述博弈者如何在一个游戏的重复较量过程中调整他们的行为以重新适应。

演化博弈论简介(2024版)

演化博弈论简介(2024版)

A
A
A
BA
AA
A A
B
B
A
B
A
A
3、当初始情况为3连A时
A
A
A
AA
A
B
B
A
A
综上可知,32种初始情况下, 只有1种情况稳定于5B,其余31 中情况最后都将稳定于5A。(此时, A为“进化稳定策略”,即ESS, evolutionary stable strategy)
(一)连续型的古诺调整过程 反应函数:
第6讲:演化博弈论简介
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0; 若x>x*,为使x→x*,应满足F(x)<0.
F(x)
F(x)=dx/dt,t↑,则x↓
x* 0
这意味着: 当F'(x*)<0,x*为ESS
x
第6讲:演化博弈论简介
(三)协调博弈的复制动态和ESS



鹰 (v-c)/2,(v-c)/2 v ,0

鸽 0 ,v
v/2 ,v/2
第6讲:演化博弈论简介
F
x
dx dt
x 1
x
x
v
2
c
1
x
v 2
① 假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益)
dx/dt
1/6 0
1x
F ‘(0) >0, F’(1)>0,而 F‘(1/6)<0,
S2
a,a
b ,c
c, b
d,d
群体中采用S1的比例为x,S2的比例为1-x

演化与博弈论

演化与博弈论

天津大学管理与经济学部
基础模型——鹰鸽博弈
动态演化
天津大学管理与经济学部
基础模型——鹰鸽博弈
天津大学管理与经济学部
基础模型——鹰鸽博弈
天津大学管理与经济学部
基础模型——鹰鸽博弈
演化稳定策略ESS的概念:
• ESS定义:对于非常小的正数ε,所有的σ≠σ*,满足:
u( , (1 ) ) u( , (1 ) )
学习能力——20世纪上半叶人类经历两次 大战后,吸取教训,建立磋商、合作、谈 判机制,维护了世界整体和平与稳定。 理性预期能力——核武器的出现,使得 人类第一次具有毁灭自己的能力,反而 维持了恐怖的核平衡。
沈阳918事变博物馆
《火与冰——核冬天》 作者:迈克尔· 罗文—罗宾森
天津大学管理与经济学部
演化博弈论的发展历程
1982年与Price一起提出了“演化稳定策略ESS”均衡概念, 为演化博弈理论的一个基本概念。他发起设立了许多奖 项,包括欧洲演化生物学会(European Society for Evolutionary Biology)建立 的John Maynard Smith Prize, 面向演化生物学界杰出的年轻学者。 成
天津大学管理与经济学部
基础模型——鹰鸽博弈
模型假设
设p为整个种群中选择H策略的频率; W(H)和W(D)分别表示H策略和D策略所带来的适应度 E(H,D)表示个体选择H策略而对手选择D策略所带来的回报 若每一个个体都只参与一个竞争
假想有一个无限的种群, 每一个成员都采取H策略或 D策略,且策略的选择是随 机的,在开始竞争之前, 所有的个体都有同样的适 应值
者,可以分为同类群体和不同类群体, k1 。每个群体都有自己

7-演化博弈详解

7-演化博弈详解
第7章 演化博弈
理性与经验
传统博弈理论:每个人都是理性的,并且理 性和博弈结构是共同知识;每个人都在选 择策略最大化自己的利益;只要知道博弈 的结构,就可以预测均衡结果;
但其他社会学家一直对理性人假设有所 怀疑。
进化博弈
生物博弈是基因之间的博弈。 生物行为(策略)是由基因决定的,基因的
生存和繁殖由自然选择决定。最适合生 存的基因不断繁衍,而不适合生存的基因 被淘汰。 生物进化是一个自然选择的过程;最后可 能导致一个稳定状态。
产权制度:先占原则; 教室、图书馆占座位;
鹰-鸽博弈
B



-1,-1
1,0
A

0,1
0.5,0.5
三个纳什均衡
两个纯策略均衡:
(A-鹰,B-鸽); (A-鸽,B-鹰);
一个混合策略均衡:(1/3,2/3) 仅仅“理性”不足以决定均衡。但有限
理性并有一定经验和想象力的人们可以 协调他们的行为。
均衡
如果x>2/3, 物质型更适合生存,将演化 成稳定均衡;
如果x<2/3, 感情型更适合生存,将演化 成稳定均衡;
如果x=2/3, 两类人有同样的适应性,但 这一(二元)均衡是非稳定的;
演化均衡不一定是帕累托最优均衡。
图示
生存能力
2
感情型
1 物质型
0
2/3
X=1
婚姻的习俗
婚姻的主流模式影响个体的行为。 物质主义盛行的社会,任何人都难以不
质的渴望同样重要。
产权规则
产权规则一旦建立,每个人都会预期其他人会遵守这 个规则;给定这样的预期,遵守它是每个人的利益所 在。
给定自己遵守,每个人希望其他人也遵守;任何违反 规则的行为都会被认为是一个威胁,引起愤怒和不满。

演化博弈论

演化博弈论

第6"4结语综上所,钢筋距及其保护层厚度控制均是桥涵工程的重点控制内容,若某方面缺乏合理性,抑制钢筋的性 优势, 桥梁存在通力偏弱、耐久性不足等。

鉴于此,施工单位必须根据其相关点针对性采取相应控制施,以证工程 的 与 。

参考文献[1] 王志•桥梁钢筋混凝土保护层施工控制措施[J]•交通世界,2020(Z1):170-171.[2] 韦剑发,孔锦,钟杰•桥梁墩柱钢筋保护层厚度控制措施[J].水利水电施工,2019(4): 31-33.[3]•桥梁钢筋保护层厚度控制管理方法研究[J] •四川建材,2019(10):150-151.编辑:于璐I 演化博弈% I I 演化博弈论(多学科融合的理论)不再将人模型化为超级理性的博弈方,而是认为人类通常是通过I I 试错的方法达到博弈均衡的,与生物进化原理具有共性,所选择的均衡是达到均衡的均衡过程的函数,I I 因而历史、制度因素及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现I I 实意义上,该理论对于生物学、经济学、金融学和证券学等学科均大有用场。

I I 概述 I 8 在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实I 8的经济生 的与人讲,与人的 理性与 的 是很难实现的。

在企业的合作竞,与人之间是有 的,经济 与博弈的 性所 的 不 和参与人的有 |I 理性 是显而 的。

|I 基本特征的演化博弈理论具有 的 对是 化的某 ,理论 的的是为了理 演化的 过程, 为将达到的及 达到。

影响 化I 的因素具有 的 性和 现 &J, 有通过演化过程的选择制而呈现的If 性。

大 演化博弈理论的 在于 的选择过程,通常群体的选择过程具有的f 性, 过程的 ,而不 产生 。

|所有的演化博弈理论具有上 ~ 而,演化博弈论在经济学的应用与用演化博||弈理论 生物进化现有所不,演化博弈论中的一些生物进化的在经济学法应用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档