演化博弈论-谢识予ppt

合集下载

博弈论最全完整-讲解PPT课件

王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。
艾里克.拉斯缪森（Eric Rasmusen）著，《博弈与信息：博弈论概论》，北京大学出版社，2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著，《信息经济学引论：激励与合约》,上海财经大学出版社，2004年版。
常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著，《博弈论与信息经济学》，上海三联书店、上海人民出版社，1996年版。
Roger B. Myerson著：Game Theory（原文版、译文版），中国经济出版社，2001年版。
是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻，面临决策或者行动的参与人，对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚，则称为完美信息博弈；否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束，然后以精心策划的方式选择自己的行为，按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜？
…… 真的能在博弈中（总是）获胜吗？
对手和你一样聪明！许多博弈相当复杂，博弈论并不
施锡铨编著，《博弈论》上海财大出版社，2000年版。
谢识予编著，《经济博弈论》，复旦大学出版社， 2002年版。
谢识予主编，《经济博弈论习题指南》，复旦大学出版社，2003年版。

演化博弈论谢识予ppt

一般2*2对称博弈
dx/dt
复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态和进化稳定策略
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰鸽
, vc
2
0, v
,
v 2
鹰鸽博弈
复制动态方程和相位图
dx x(v c) (1 x)v F ( x) x(1 x)[ ] dt 2 2
(m-z)/(1-P) 1
x
(m-z)/(1-P)<0 0<(m-z)/(1-P)<1
dx/dt
1
x
(m-z)/(1-P)>1
5.4 复制动态和进化稳定性：两人非对称博弈
5.4.1 市场阻入博弈的复制动态和进化稳定策略 5.4.2 非对称鹰鸽博弈的进化分析
5.4.1 市场阻入博弈的复制动态和进化稳定策略
最优反应动态模拟
博弈方1 博弈方2
1 2.5 3 2 1.5 1.75
1 2 收敛条件 | dr || dr | 1
dq2
dq1
问题：两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性：两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
dy/dt
1 x
x=0
dy/dt
1
x
x=0
两群体复制动态的关系和稳定性
y 1

博弈论最全完整ppt讲解

博弈论基本思想
人们在日常生活中进行着博弈，与配偶，朋友，陌生人，老板/员工，教授等。
类似的博弈也在商业活动、政治和外交事务、战争中进行着——在任何一种情况下，人们相互影响以达成彼此有利的协议或者解决争端。
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
案例1：囚犯困境
支付嫌疑人A
嫌疑人 B
抵赖
坦白
抵赖 -1，-1 0，-9
坦白 -9，0 -6，-6
均衡与均衡结果
均衡战略（坦白，坦白）均衡支付（-6，-6）
第二节纳什均衡
占优战略均衡重复剔除的占优战略均衡
纳什均衡
完全信息静态博弈的几点特性
同时出招，出招一次；知道博弈结构与游戏规则（共同知识）；不管是否沟通过，无法做出有约束力的
如何在博弈中获胜？
…… 真的能在博弈中（总是）获胜吗？对手和你一样聪明！许多博弈相当复杂，博弈论并不能提供
万无一失的应对办法。
例1：无谓竞争（The GPA Rat Race）
你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40％的人能得良好。
所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
与战略式表述
博弈论的基本概念与战略式表述
博弈论（game theory）是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述：G={N,(Si)iN,(Ui)iN} 有三个基本要素：（1）参与人（players）iN={1,2,…,n} ；（2）战略（strategies）,siSi(战略空间)；（3）支付（payoffs）,ui=ui(s-i,si)。

演化博弈论

演化博弈论演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想，不再将人模型化为超级理性的博弈方，认为人类通常是通过试错的方法达到博弈均衡的，与生物演化具有共性，所选择的均衡是达到均衡的均衡过程的函数，因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。

在理论应符合现实意义上，该理论对于生物学以及各种社会科学尤其是经济学，均大有用场。

演化博弈理论最早源于Fisher，Hamilton，Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析，他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。

但直到Smith andPrice(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后，才标志着演化博弈理论的正式诞生。

生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic)，这是演化博弈理论的又一次突破性发展。

模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念，它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程，ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。

编辑本段主要应用领域演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科，是证券投资研究的一个具有生命力和丰富内涵的新领域。

与现代金融学的“理性人”、“有效市场”相关假设不同，演化证券学重视对“生物本能”和“竞争与适应”的研究，强调人性和市场环境在股市演化中的重要地位，是揭示股市生存法则最有潜力的前沿科学。

其开山之作《股市真面目》颠覆了股市运行机理的传统理论，可称为达尔文式的范式革命。

演化博弈论__谢识予答案

dy/dt dy/dt
x=0
1
x
x=0
1
x
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
5.4.2 非对称鹰鸽博弈的进化分析
博弈方2
鹰
鸽
鹰博鸽弈方 1
非对称鹰鸽博弈博弈方1群体复制动态相位图
dx/dt dx/dt
dx/dt
1
x
y>5/6
y=5/6
x 1
y<5/6
1x
非对称鹰鸽博弈博弈方2群体复制动态相位图
第五章有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。完全理性在现实中很难满足，当社会经济环境和决策问题较复杂时，人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响，有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心，以进化稳定策略为基本均衡概念的进化博弈分析，包括基本方法、概念和各种经典模型等。
x——鸣叫雄蛙比例复制动态方程
可能的不动点： x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
1
x
dx/dt
(m-z)/(1-P)<0
(m-z)/(1-P)
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
5.4 复制动态和进化稳定性：两人非对称博弈
A
B
A
B
BA
AB
B
B
B
B

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

第8章演化博弈论.ppt

在给定其他参与者策略情况下没有一个参与者能通过单方面改变自己的策略而使自己的得益提高从而没有人有积极性打破这种均衡参与者2322354211233161445经典博弈论经典博弈论实证缺陷实证缺陷方法缺陷方法缺陷假设缺陷假设缺陷二十世纪八十年代之后研究工作围绕着修正经典博弈论中的完全理性假设展开研究并试图为纳什均衡的概念寻找动态结构下的解释
The Nobel Memorial Prize in Economic Sciences

2012-Alvin Roth , Lloyd Shapley 2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E. Stiglitz 1996 - James A. Mirrlees, William Vickrey 1994 - John C. Harsanyi, John F. Nash Jr., Reinhard Selten
“for having integrated insights from psychological research into economic science, especially concerning human judgment and decision-making under uncertainty” “for having established laboratory experiments as a tool in empirical economic analysis, especially in the study of alternative market mechanisms”

复旦大学-谢识予-经济博弈论5(不讲,自学)

1
不进
2
不打
（1，5）
u 2 s x 0 (1 x ) 5 5 5 x u 2 n x 2 (1 x ) 5 5 3 x u 2 y u 2 s (1 y )u 2 n 5 2 xy 3 x
（0，0）（2，2）
博弈方1位置博弈群体复制动态相位图
dx dt
F ( x ) x (1 x )[ x ( a c ) (1 x )( b d )]
x (1 x )( 61 x 11)
一般2*2对称博弈
dx/dt
复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。
1 x
11/16
5.3.4 鹰鸽博弈的复制动态和进化稳定策略
dy/dt 1 y 1 y
y[u 2 e u 2 ] y (1 y )(1 6 x )
dy/dt
x<1/6
x>1/6
dy/dt 1 y
x=1/6
两群体复制动态关系和稳定性
A
B
Y 1
5/6
C
1/6
D
1
x
5 3
2
协调博弈
反应、策略调整规则推导
采用 A 的得益： xi (t ) 50 [ 2 xi (t )] 49 采用 B 的得益： xi (t ) 0 [ 2 xi (t )] 60 当 xi (t ) 22 / 61时，采用 A ；当 xi (t ) 22 / 61时，采用 B
博弈方2 鹰
vc 2
鸽 v, 0
v 2
鹰鸽
, vc
2
0, v
,

7 演化博弈PPT课件

靠左行靠左行 1，1 靠右行 -1，-1
靠右行 -1，-1 1，1
协调博弈：婚姻
物质型物质型 1，1 感情型 0，0
感情型 0，0 2，2
谁将生存？
假定总人口中，物质型的比例为x，感情型的比例为（1-x）；
那么，对任何一个个体而言，物质型的预期支付：x1+(1-x)0=x；
感情型的预期支付：x0+(1-x)2=2(1-x)； x=2/3
如果x=1/2, 两类人的生存能力相同；二元均衡。
但只有前两个均衡是ESS。
图示
生存能力
1
右撇子
1 左撇子
0
1/2
X=1
与理性人博弈比较
如果策略是理性人选择的结果，这个博弈也有三个均衡：（左撇子，左撇子）；（右撇子，右撇子）；（1/2左，1/2右）;
所以，并非所有的纳什均衡都是演化稳定均衡；但与“混合策略均衡”解释不同：每个人都是
假定总人口中有x的比例是左撇子，1-x 的比例是右撇子。那么，左撇子的预期支付为：x·1+(1-x)·0=x;
右撇子的预期支付：x·0+(1-x)·1=1-x;
x>(1-x)
x>1/2
三个均衡
如果x>1/2，左撇子更具生存能力，他们的比例将增加，直到100%；单元均衡；
如果x<1/2, 右撇子更具有生存能力，他们的比例将增加，直到100%；单元均衡；
第7章演化博弈
理性与经验
传统博弈理论:每个人都是理性的,并且理性和博弈结构是共同知识;每个人都在选择策略最大化自己的利益;只要知道博弈的结构,就可以预测均衡结果;
但其他社会学家一直对理性人假设有所怀疑。

第八章演化博弈《博弈论与经济》 PPT课件

。
j
j
▪ 因Y 为ESS，又 E(X ,Y ) E(Y,Y ) ，因而 E(Y, X ) E(X , X ，) 这与 X 为
纳什均衡相矛盾。
▪ 由性质2立即可得以下命题。
▪ 命题8.3 若 X 为单总体演化博弈 G 的内点ESS，即 X 的分量均为正数，则 X 为 G 的惟一的ESS。
▪ 我们可用以下两个命题确定纯策略意义下的ESS。
▪ 此时，该博弈有2个纯策略纳什均衡 (e1,e1)， (e2, e2) 为 e1 。
。该博弈的ESS
▪ 8. a1 0, a2 0
▪ 表2.1的第6种情况中， 0 。 y(x), x(y) 图形退化为图8-3。图
8-3种两条粗线上每点都是纳什均衡,但惟一的ESS为 e2
y 1
0
图8-3
(a1
a2 ) y12
2a2 y1
a2
▪令
f
( y1)
E(Y ,Y )
E(X
,Y)
(a1
a2 ) y12
2a2 y1
a22 a1 a2
。
▪ f (y) 为开口向下的抛物线，且判别式 0 ，故对
▪ x1 y1 ， f ( y1) 0 ，从而 E(Y,Y ) E(X ,Y ) 。
▪ 对于例2.21给出的斗鸡博弈，支付矩阵 ▪ 仅有惟一的ESS X (2 , 3) 。
则 E(ei , X ) E(X , X )
。
▪ 证明因
m
m
E(X , X ) XAX xi Ai X xiE(ei , X )
（*），
i 1
i 1
▪ Ai 为A 的第 i 行. 因 X为ESS，故有 E(X , X ) E(ei , X )，对 i 1,2,, m

第三章-第五节-演化博弈模型ppt课件

处所得到的收益等于两者冲突导致的损失）
dx/dt
③ 假设v=8，c=4（表示种群间和平共
处所得到的收益大于两者冲突导致的损失）
dx/dt
0
ESS： x*=1
1
x
0
1
x
ESS： x*=1
当c≤v时，种群间宁可发生冲突，也不愿意和平共处以获得更多的收益。主要原因
在于当一方忍让时，另一方可获得更多收益。
完整版PPT课件
这是一种悲剧。目前，人类的现状和理性尚不能解决这种悲剧。
13
（四）蛙鸣博弈的复制动态和ESS
蛙鸣 A 不鸣
蛙B
鸣
不鸣
P-z ，P-z
m-z ，1-m
1-m，m-z
0 ，0
➢ m、P为求偶成功的概率 ➢ z为机会成本(体力消耗、危险性等)
满足：m ∈ (0.5,1]，m<P≤1
令x为采用“鸣”策略的群体比例，1-x为采用“不鸣”策略的群体比例则复制动态方程F(x)：
则： dx x2 x3
dx dt
xUY
U
dt
当x=0时，稳定；
复制完动整版态P方PT课程件
当x>0时，最终稳定于x*=6 1
dx/dt
dx x2 x3
dt
甲Y
N
乙
Y
N
1，1
0 ，0
0， 0
0，0
0
1x
图1 签协议博弈的复制动态相位图
x*=0，x*=1为稳定状态，此时，dx/dt=0 但x*=1为ESS，即最终所有人都将选择“Y”
A：“进入”的群体比例为x “不进”的群体比例为1-x
B：“打击”的群体比例为y “不打击”的群体比例为1-y

《经济博弈论(第三版)》谢识予 PPT课件

24
5
5
5
5
25
25
25
3
43
3
11
33
33
33
7
3
3
7
49
21
21
二、n个厂商连续产量
n
Q qi i 1
n
P P(Q) P( qi ) i 1
n
qi P qi P( qi ) i 1
n
n
qi P( qi ) cqi qi[P( qi ) c]
i 1
i 1
1.3 博弈结构和博弈分类
1.4 博弈论历史和发展简述
1.4.1博弈论的早期研究 1.4.2博弈论的形成 1.4.3博弈论的成长和发展 1.4.4博弈论的成熟及与主流经济
学的融合
1.4.1博弈论的早期研究
博弈论历史没有公认答案对具有策略依存特点决策问题的研究可上溯
到18世纪初甚至更早博弈论真正的发展在本世纪博弈论总体上仍然是发展中的学科
1.3.6 博弈方的能力和理性
完全理性和有限理性
完全理性：有完美的分析判断能力和不会犯选择行为的错误
有限理性：博弈方的判断选择能力有缺陷
个体理性和集体理性
个体理性：一个体利益最大为目标集体理性：追求集体利益最大化合作博弈：允许存在有约束力协议的博弈非合作博弈：不允许存在有约束力协议的博弈
2000年前我国古代的“齐威王田忌赛马” 1500年前巴比伦犹太教法典“婚姻合同问题”
等。
1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理、“逆推归纳法” 1921-1927年波雷尔混合策略的第一个现代表述，
有数种策略两人博弈的极小化极大解

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

dx/dt
1
x
y>1/2
dx/dt
y<1/2
1x
x 1
y=1/2
博弈方2位置博弈群体复制动态相位图
dy dt
y[u2s
u2]
y(1
y)(2x)
dy/dt
1
x
dy/dt
x=0
x=0
1
x
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
5.4.2 非对称鹰鸽博弈的进化分析
u1e y (1) (1 y) 10 10 11y u1d y 0 (1 y) 5 5 5y
其中abcd可以是任何得益，根据问题设定。
复制动态分析
复制动态的进化规则是生物学中生物特征进化规则设x为采用策略1的比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
dx dt
x(u1
u)
x[u1
xu1
(1
0, v2
v1,0
v1 , v2 22
非对称鹰鸽博弈博弈方1群体复制动态相位图
dx dt
x[u1e
u1 ]
x(1
x)(5
6y)
dx/dt
dx/dt
1
x
dx/dt
y>5/6
y<5/6
1x
x 1
y=5/6
非对称鹰鸽博弈博弈方2群体复制动态相位图
dy dt
y[u2e
u2
]
y(1
y)(1
6x)
dy/dt
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈：
同意不同意
博弈方2 同意不同意
1，1 0，0 0，0 0，0
假设群体中采用“同意”比例x
则得不益同为策：略期望得益和uy平均x 1 (1 x) 0 x un x 0 (1 x) 0 0 u x u y(1 x) un x2
博弈方2 3
1.75 2.25 1.9375
收敛条件 | dr1 || dr2 | 1
dq2 dq1
问题：两寡头始终假设对方产量不变
5.3 复制动态和进化稳定性：两人对称博弈
5.3.1 签协议博弈的复制动态和进化稳定策略 5.3.2一般两人对称博弈复制动态和进化稳定策略 5.3.3 协调博弈的复制动态和进化稳定博弈 5.3.4 鹰鸽博弈的复制动态和进化稳定策略 5.3.5 蛙鸣博弈的复制动态和进化稳定策略
x(1 x)(61x 11)
复制动态进化博弈的结果常常取决与带有很大偶然性的初始状态。
1
x
5.3.4 鹰鸽博弈的复制动态和进化稳定策略
博弈方2
鹰
鸽
鹰
vc , vc
2
2
v, 0
鸽
0, v
v 2
,v
2
鹰鸽博弈
复制动态方程和相位图
dx F(x) x(1 x)[ x(v c) (1 x)v]
博弈方策略类型比例动态变化是有限理性博弈分析的核心，其关键是动态变化的速度
以采用“同意”策略类型博弈方的比例为例，其动态变化速度可用下列微分方程反映：
dx dt
x(u y
u)
x(x
x2)
x2 (1
x)
x2
x3
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点：x*=0, x*=1
全理性博弈的均衡策略有限理性意味着均衡是不断调整和改进而不是一次
性选择的结果，而且即使到达了均衡也可能再次偏离有限理性博弈方会在博弈过程中学习博弈通过试错寻找较好的策略
5.1.2 有限理性博弈分析框架
最优反应动态：有快速学习能力的小群体成员的反复博弈
复制动态：学习速度很慢的成员组成的大群体随机配对的反复博弈
dy/dt1ຫໍສະໝຸດ yx>1/6
x<1/6
1y
dy/dt
x=1/6
1
y
两群体复制动态关系和稳定性
Y
A
1
B
5/6
C
1/6
D x
1
dt
2
2
x(1 x)(1 6x)
dx/dt 1/6
1
x
5.3.5 蛙鸣博弈的复制动态和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈：
雄蛙2
鸣叫
不鸣
鸣叫 P-z, P-z m-z, 1-m 不鸣 1-m, m-z 0, 0
蛙鸣博弈不同均衡的条件
M 1
鸣叫混合策略
不鸣叫
m=1-P+z m=z
最优反应动态模拟：初次博弈1个A
A
B
A
B
BA
AB
B
B
B
B
B
A
A
A
B
A
A
A
A
A
A
A
A
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
5.2.2 古诺调整过程
古诺模型反应函数最优反应动态模拟
q1
3
q2 2
q2
3
q1 2
1
2
3
4………
博弈方1 2.5 1.5 2.125 1.875
第五章有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。完全理性在现实中很难满足，当社会经济环境和决策问题较复杂时，人们必须存在很大的理性局限。有限理性对人们的决策、行为选择方式有很大影响，有限理性基础上的博弈分析与完全理性博弈分析也有很大区别。进化博弈分析是有限理性博弈分析的基本框架。本章介绍以最优反应动态和复制动态为核心，以进化稳定策略为基本均衡概念的进化博弈分析，包括基本方法、概念和各种经典模型等。
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性：
两人对称博弈 5.4复制动态和进化稳定性：
两人非对称博弈
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
5.1.1 有限理性及其对博弈的影响
有限理性博弈方：不满足完全理性假设的博弈方有限理性意味着一般至少有部分博弈方不会采用完
1
进入
不进
2
（1，5）
打击
不打
u2s x 0 (1 x)5 5 5x u2n x 2 (1 x)5 5 3x u2 y u2s (1 y)u2n 5 2xy 3x
（0，0）
（2，2）
博弈方1位置博弈群体复制动态相位图
dx dt
x[u1e
u1 ]
x(1
x)(1
2y)
dx/dt
进化稳定策略（ESS）
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方快速学习模型
5.2.2 古诺调整过程
5.2.1 协调博弈的有限博弈方快速学习模型
模型：
博弈方2
A
B
A 50，50 49，0 B 0，49 60，60
协调博弈
1
2 5
4
3
反应、策略调整规则推导
采用A的得益：xi (t) 50 [2 xi (t)] 49 采用B的得益：xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时，采用A；当xi (t) 22 / 61时，采用B
u1 x u1e (1 x) u1d 5 5x 5y 6xy
博
弈鹰
u2e x (5) (1 x) 2 2 7x
方鸽
u2d x 0 (1 x) 5 1 x
1
u2 y u2e (1 y)u2d 1 x y 6xy
博弈方2
鹰
鸽
v1 c , v2 c 22
x)u2 ]
x(1 x)(u u)
x(1 x)[ x(a c) (1 x)(b d )]
复制动态相位图
x
1
x
5.3.3 协调博弈的复制动态和进化稳定博弈
博弈方2 策略1 策略2 策略1 50，50 49，0 策略2 0，49 60，60 一般2*2对称博弈
dx/dt
11/16
dx F(x) x(1 x)[x(a c) (1 x)(b d)] dt
uy 0 un
x 0不是进化稳定策略
5.3.2一般两人对称博弈复制动态和进化稳定策略
一般模型
策略1 策略2
博弈方2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博弈。
基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置是无差异的。
1
Z
蛙鸣博弈复制动态方程和不动点
x——鸣叫雄蛙比例复制动态方程
dx x(1 x)[x(P z 1 m) (1 x)(m z)] dt
可能的不动点： x*=0 x*=1 x*=(m-z)/(1-p)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
1
x
(m-z)/(1-P)<0
dx/dt
(m-z)/(1-P)
进化稳定策略的检验
比例的博弈方偏离“同意”
策略选择了“不同意”
uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2