复旦大学经济博弈论课件--经济博弈论(3)

合集下载

复旦大学经济博弈论课件--经济博弈论242页PPT

复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略

《经济学博弈》PPT课件

《经济学博弈》PPT课件

• 假设n个人参与博弈,给定其他博弈方策略的
条件下,每个博弈方选择自己的最优策略.纳
什均衡指的是"由所有博弈方的最优策略组成
的一个组合"
• n个人制订了一个协议,这n个人是否能自愿遵
守?他们会自觉遵守,这个协议就构成一个纳
什均衡.
• 如果一个协议不构成纳什均衡,它就不可能自
动实施,而需要外力胁迫,这就是无所谓的"协
通过单独改变自己的策略而增加盈利,如能,则
从所分析的策略组合对应的盈利数组引一箭
头,到改变策略后策略组合对应的盈利数组,最
后综合对每个策略组合的分析情况,只有指向、
无指离的策略组合形成对博弈的结果.
2024/2/20
26
具体方法——考察在每个策略组合处各
个博弈方能否通过单独改变自己的策略
而增加得益.如能,则从所分析的策略组合
基本思想——博弈方先找出自己针
对其他博弈方每种策略或策略组合的
最佳对策,即自己的可选策略中与其
他博弈方的策略或策略组合配合,给
自己带来最大得益的策略,然后在此
基础上,通过对其他博弈方策略选择
的判断,包括对其他博弈方对自己策
略判断的判断等,预测博弈的可能结
2024/2/20
14
• 具体方法——对其他博弈方的任一策略组合,
当双方的相对优势策略确定后,哪个格子里面两个
数字都被被划线,那么这个格中所对应的相对
优势策略组合就是一个纳什均衡.
2024/2/20
17
例2、囚徒困境博弈


不招
-8,-8
-15,0
0,-15


-1,-1
不招

经济博弈论Chapter03_331007283

经济博弈论Chapter03_331007283

描求扩证序境。

of play.参无论何时采取行动,参与者都需要考虑他们当前的行动会如何影响未来的行动,包括对手和博它动,指出了博弈的所有可能结果。

决所有的连续决策点。

decision maker in a 博策树。

博节分每一分支都从博弈树上的一个决策点指向另一个决策点或终结点。

terminal node.在一个分支;不过,仅允许有一个分支指向任何一个决将引收益。

终结点并不是所有博弈必需的;一些博弈理论上可以永远进行下去on forever我参Anode is called a 参安均会发生什么?一个名叫卡门的少女正在决定是否要吸烟。

A teenager named Carmen is deciding whether to smoke.首如不一带给她不同的感受和收益。

taste, as well as different payoffs.单门分析一开始,考虑与终结点直接相连的那些行动点。

Start analysis by considering those action nodes that lead directly to terminal nodes.在利在通沿着贯穿整个博弈树的标出的唯一路径,就知道了当所有参与者在正确预测了所有的未来后果下做出最优选择时,这当由The outcome that arises from playing these在在会,甚至根本就没出现!但是,它的可能的出现和潜在的策略在决定今日卡门的招术时发挥了作用。

三每捐但为的所有结果进行赋值(排序)。

可3不多少种?如我均参不However, the equilibrium path of play is complete specification of the rollback equilibrium.它反略得到的。

艾尼塔根在街道花园博弈的反转均衡中,艾米丽得到了最好的结果(the opportunity to make the first move.先不后当这些操纵的招术就是Tactics for such manipulation are第第第第第第第三步:反转求解Step 3: Rollback第一它Slide 47一但一国然对实考有人拿出下。

经济博弈论第三章

经济博弈论第三章
第三章 完全且完美信息动态博弈
本章讨论完全且完美信息动态博弈。
本章对动态博弈分析的概念和方法, 特别是子博弈完美均衡和逆推归纳法作系 统介绍,并介绍各种经典的动态博弈模型。
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
斯塔克博 格模型 先后
> < < 厂商1 >;厂商2 <
古诺模型
同时
选择次序 总产量 价格 总利润 各自利润
3.4.2 劳资博弈
先由工会决定工资率,再由厂商决定雇用多少劳动力。 工会效用:u(W,L),厂商得意:∏(W,L)=R(L)- W×L
max (W , L) max [ R ( L) WL]
不制止 (5,5)
(10,4)
3.1.2 动态博弈的基本特点

策略是在整个博弈中所有选择、行为 得益对应一条路径
动态博弈的非对称性——先后次序决定动 态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有 “先行优势”。


3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.4.1 寡占的斯塔克博格模型


先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同 时选择即可。
Q q1 q2 , P P(Q) 8 Q
c1 c2 2
2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12 u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q2

复旦大学经济博弈论课件--经济博弈论536页

复旦大学经济博弈论课件--经济博弈论536页
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型

经济博弈论ppt课件

经济博弈论ppt课件
• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling

经济博弈论(第三章)

经济博弈论(第三章)

第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。

现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。

这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。

依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。

例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。

动态博弈由于添加了时间因素,因而更加贴近现实。

根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。

在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。

3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。

动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。

一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。

此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。

设有一个商人要从A 地向B 地运输一批货物。

《经济博弈论》PPT课件

《经济博弈论》PPT课件
13
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈

方 1

博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2




弈 方

1, 0
1, 3

经济博弈论03

经济博弈论03


足球
芭蕾
男x
足球
芭蕾
男 x’
芭蕾
(1,2) (-1,-1)(0,0) (2,1)
扩展式表述博弈的战略
男的策略:{足球,芭蕾}

选择足球;还是选择芭蕾。
足球
芭蕾
女的策略:
(足球,芭蕾),(芭蕾,足球)
女x
足球
芭蕾

芭蕾
x
足球
(芭蕾,芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么
❖ 静态博弈:参与人同时选择行动或非同时行动但 后行动者并不知道前行动者采取了什么具体行动;
❖ 动态博弈:参与人行动有先后顺序,且后行动者 能够观察先行动者选择的行动。
博弈的划分
参与人对其他参与人(对手)的特征、战略空 间及支付函数的知识:完全信息博弈和不完全 信息博弈。
❖ 完全信息:每一个参与人对所有其他参与人的 (对手)的特征、战略空间及支付函数有准确 的 知识,否则为不完全信息。
A
开发
N

1/2

1/2
不开发

1/2
N

1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
一、博弈扩展式表述
只包含一个决策结的信息集称为单结信息集, 如果博弈树的所有信息都是单结的,该博弈称 为完美信息博弈。
一个决策结.
B在决策 时不确切地 知道自然的 选择;

复旦大学经济博弈论课件--经济博弈论6-32页PPT资料

复旦大学经济博弈论课件--经济博弈论6-32页PPT资料

2020/3/22
课件
4
6.1.3 不完美信息动态博弈的子博弈
因为原博弈本身不会成为原博
弈的后续阶段,因此子博弈不 能从原博弈的第一个节点开始,
Ll包含所有在初始节点和终点, 但不包含不跟在此初始节点之 后的节点
2R 2
L
L
R
3
不分割任何的信息集。
LR
LR
2020/3/22
课件
2
6.1.1 概念和例子
完美信息:博弈中后面阶段的博弈方有关于前面阶段 博弈进程的充分信息
完美信息动态博弈:动态博弈中的所有博弈方都有完 美信息的博弈
完全信息:各博弈方对博弈结束时每个博弈方的得益 是完全清楚的
不完美信息动态博弈的基本特征之一是博弈方之间在 信息方面是不对称的,如二手车市场
2020/3/22
课件
3
6.1.2 不完美信息动态博弈的表示
多节点信息集扩展形表示
0 1
(-7000) (-10000) (-16000) (-10000)
好1差
1 不卖 1


不卖
2
(0,0) (0,0)
买 不买 买 不买
运输路线扩展形
(2,1) (0,0) (1,-1) (-1,0)
二手车交易扩展形
2020/3/22
课件
15
6.3.1 单一价格二手车交易博弈模型
基本假设:P c V P W
2020/3/22
好1差
1 不卖 1


不卖
2
(0,0) (0,0) 买 不买 买 不买
(P, V-P) (0, 0) (P-C, W-P) (-C, 0)

经济博弈论的

经济博弈论的
n 人类自私的天性,使他们陷入“囚徒困境”,难以自 拔。如何走出“囚徒困境”?
PPT文档演模板
经济博弈论的
1.2.2 赌胜博弈
n 赌博、竞技等构成的博弈问题,在经济中 也有许多应用,赌胜博弈也是一类重要的 博弈问题,对经济竞争和合作也有很大启 示
n 赌胜博弈的特点是一方得等于另一方失, 不可能双赢,属于“零和博弈”
PPT文档演模板
经济博弈论的
1.1.1 从游戏到博弈
n 人生处处皆博弈,人生是永不停歇的博弈过程。 n 作为博弈者,最佳策略是最大限度地利用游戏规则,
最大化自己的利益; n 作为社会最佳策略,是通过规则使社会整体福利增加。
PPT文档演模板
经济博弈论的
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。
济和博弈分析本身都有重要价值
PPT文档演模板
经济博弈论的
一、三厂商离散产量
PPT文档演模板
•{
•0
•P
•4
•8
•6
•2
•8
•16
•12
•4
•5
•6
•5
•20
•25
•30
•5
•5
•6
•4
•20
•20
•24
•5
•5
•5
•5
•25
•25
•25
•3
•43
•3
•11
•33
•33
•33
•7
•3
•3
•7
•49

《经济博弈论》教材教学课件

《经济博弈论》教材教学课件
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖
寡头市场厂商的产量决策;市场开发竞争中策略较量和策 略依存;投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 政治、军事和社会的决策较量 博弈论不能称作游戏理论,也不完全称作对策论
1.1.2 一个非技术性定义
企业之间相互沟通信誓旦旦,价格战仍然会爆发;美 苏两国经常会晤,甚至签订核不扩散条约,但军费一年 高过一年。这些现象都反映了上面所说明的问题。
囚徒困境说明了什么?
在(坦白、坦白)这个组合中,囚徒1和囚徒2都不 能通过单方面的改变行动增加自己的收益,于是谁 也没有动力游离这个组合,因此这个组合是纳什均 衡。
《经济博弈论》教材 教学课件
第一章 导论
本章介绍博弈论的基本概念,包括什么 是博弈和博弈论,给出一些经典博弈例子。 对博弈分类和博弈理论的结构作一些讨论, 对博弈论的发展历史等作简单介绍。目标是 让读者对博弈论的内容和博弈模型有更直观 的概念和印象,本教材的基本内容,以及博 弈分析的基本思想方法等形成初步的认识, 为后面各章展开详细分析作好铺垫和准备。
定义:博弈就是一些个人、队组或其他组织,面对一 定的环境条件,在一定的规则下,同时或先后,一次 或多次,从各自允许选择的行为或策略中进行选择并 加以实施,各自取得相应结果的过程。
四个核心方面
博弈的参加者(Player)——博弈方(单人、两人和多人)
各博弈方的策略(Strategies)或行为(Actions) (有 限策略、无限策略)
有人提出:利用囚徒困境解决反腐败 问题。个体理性与团体理性的矛盾。
囚徒 2
坦白
不坦白
囚坦白 徒 1
不坦白
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


弈鹰
u2e x (5) (1 x) 2 2 7x
方鸽
u2d x 0 (1 x) 5 1 x
1
u2 y u2e (1 y)u2d 1 x y 6xy
博弈方2


v1 c , v2 c 22
0, v2
v1,0
v1 , v2 22
2021/3/11
33
非对称鹰鸽博弈博弈方1群体复制动态相位图
1
y
2021/3/11
35
两群体复制动态关系和稳定性
Y
A
1
B
5/6
C
1/6
D x
1
2021/3/11
36
0.5
1
x
稳定状态、不动点:x*=0, x*=1
2021/3/11
16
进化稳定策略的检验
比例的博弈方偏离“同 意”
策略选择了“不同意”
uy (1 )1 0 1 un (1 ) 0 0 0 u (1 )u y un (1 )2
uy 1 0
x 1是进化稳定策略ESS
复制动态 相位图
2021/3/11
x
1
x
20
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
dx F(x) x(1 x)[x(a c) (1 x)(b d)] dt
x(1 x)(61x 11)
博弈方2 策略1 策略2 a, a b, c c, b d, d
一般2X2对称博弈
进化博弈设定是在一个大群体的成员中进行随机配对的反复博 弈。
基本模型是两个博弈方之间的对称博弈。含义是两个博弈位置 是无差异的。
其中abcd可以是任何得益,根据问题设定。
2021/3/11
18
么么么么方面
Sds绝对是假的
复制动态进化博弈的结果 常常取决与带有很大偶然 性的初始状态。
1
x
2021/3/11
21
5.3.4 鹰鸽博弈的复制动态 和进化稳定策略
博弈方2



vc , vc
2
2
v, 0

0, v
v 2
,v
2
鹰鸽博弈
2021/3/11
22
复制动态方程和相位图
dx F(x) x(1 x)[ x(v c) (1 x)v]
第五章 有限理性和进化博弈
本章介绍有限理性基础上的进化博弈分析。
完全理性在现实中很难满足,当社会经济环境 和决策问题较复杂时,人们必须存在很大的理 性局限。有限理性对人们的决策、行为选择方 式有很大影响,有限理性基础上的博弈分析与 完全理性博弈分析也有很大区别。进化博弈分 析是有限理性博弈分析的基本框架。本章介绍 以最优反应动态和复制动态为核心,以进化稳 定策略为基本均衡概念的进化博弈分析,包括 基本方法、概念和各种经典模型等。
2021/3/11
13
5.3.1 签协议博弈的复制动态和进化稳定策略
签协议博弈:
同意 不同意
博弈方2 同意 不同意
1,1 0,0 0,0 0,0
假设群体中采用“同意”比 例x
则 得不益同为策:略期望得益和uy平均x 1 (1 x) 0 x
un x 0 (1 x) 0 0
u x u y(1 x) un x2
2021/3/11
1
本章分四节
5.1有限理性博弈及其分析框架 5.2最优反应动态 5.3复制动态和进化稳定性:
两人对称博弈 5.4复制动态和进化稳定性:
两人非对称博弈
2021/3/11
2
5.1 有限理性博弈及其分析框架
5.1.1 有限理性及其对博弈的影响 5.1.2 有限理性博弈分析框架
2021/3/11
2021/3/11
4
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群体随 机配对的反复博弈
进化稳定策略(ESS)
2021/3/11
5
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
5.2.2 古诺调整过程
2021/3/11
28
5.4.1 市场阻入博弈的复制动态和进化稳定策略
u1e y 0 (1 y) 2 2(1 y) u1n y 1 (1 y)1 1 u1 x u1e (1 x)u1n 2x(1 y) (1 x)
1
进入
不进
2
(1,5)
打击
不打
u2s x 0 (1 x)5 5 5x u2n x 2 (1 x)5 5 3x u2 y u2s (1 y)u2n 5 2xy 3x
dy/dt
1
x
dy/dt
x=0
x=0
1
x
2021/3/11
31
两群体复制动态的关系和稳定性
y 1
1/2
0
1
x
2021/3/11
32
5.4.2 非对称鹰鸽博弈的进化分析
u1e y (1) (1 y) 10 10 11y u1d y 0 (1 y) 5 5 5y
u1 x u1e (1 x) u1d 5 5x 5y 6xy
M 1
鸣叫 混合策略
不鸣叫
m=1-P+z m=z
1
Z
2021/3/11
25
蛙鸣博弈复制动态方程和不动点
x——鸣叫雄蛙比例 复制动态方程
dx x(1 x)[x(P z 1 m) (1 x)(m z)] dt
可能的不动点: x*=0 x*=1 x*=(m-z)/(1-p)
2021/3/11
26
2021/3/11
14
博弈方策略类型比例动态变化是有限理性博弈分 析的核心,其关键是动态变化的速度
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
dx dt
x(u y
u)
x(x
x2)
x2 (1
x)
x2
x3
2021/3/11
15
动态微分方程的相位图
dx/dt 0
2021/3/11
8
最优反应动态模拟:初次博弈1个A
A
B
BA
B
B
B
A
A
A
A
A
2021/3/11
B
A
AB
B B
A A
A
A A
B A
9
初次博弈相邻2个A
B
A
A
B
AB
AA
A
B
A
A
A
A
A
2021/3/11
10
初次博弈相连3个A
A
B
A
B
A
A
A
A
A
A
2021/3/11
11
5.2.2 古诺调整过程
古诺模型反应函数 最优反应动态模拟
(0,0)
(2,2)
2021/3/11
29
博弈方1位置博弈群体复制动态相位图
dx dt
x[u1e
u1 ]
x(1
x)(1
2y)
dx/dt
dx/dt
1
x
y>1/2
dx/dt
x 1
y=1/2
2021/3/11
y<1/2
1x 30
博弈方2位置博弈群体复制动态相位图
dy dt
y[u2s
u2]
y(1
y)(2x)
蛙鸣博弈复制动态相位图
dx/dt
dx/dt
1
x
(m-z)/(1-P)<0
dx/dt
(m-z)/(1-P)
1x
0<(m-z)/(1-P)<1
(m-z)/(1-P)>1
1x
2021/3/11
27
5.4 复制动态和进化稳定性: 两人非对称博弈
5.4.1 市场阻入博弈的复制动态 和进化稳定策略
5.4.2 非对称鹰鸽博弈的进化分析
2021/3/11
6
5.2.1 协调博弈的有限博弈方快速学习模型
模型:
博弈方2
A
B
A 50,50 49,0 B 0,49 60,60
协调博弈
1
2 5
4
3
2021/3/11
7
反应、策略调整规则推导
采用A的得益:xi (t) 50 [2 xi (t)] 49 采用B的得益:xi (t) 0 [2 xi (t)] 60 当xi (t) 22 / 61时,采用A;当xi (t) 22 / 61时,采用B
比例的博弈方偏离“不 同意”
策略选择了“同意”
uy (1 ) 0 1 un (1 ) 0 0 0 u (1 ) un uy 2
uy 0 un
x 0不是进化稳定策略
2021/3/11
17
5.3.2一般两人对称博弈复制动态 和进化稳定策略
一般模型
策略1 策略2
dt
2
2
x(1 x)(1 6x)
dx/dt 1/6
1
x
2021/3/11
23
5.3.5 蛙鸣博弈的复制动态 和进化稳定策略
动物进化竞争是生物多样性、复杂性的基本机制
蛙鸣博弈:
雄蛙2
鸣叫
不鸣
鸣叫 P-z, P-z m-z, 1-m 不鸣 1-m, m-z 0, 0
相关文档
最新文档