第二章:完全信息动态博弈
完全信息动态博弈和演化博弈的关系
完全信息动态博弈和演化博弈的关系在博弈论的研究领域中,完全信息动态博弈和演化博弈是两个重要的分支。
它们分别从不同的角度研究博弈现象,但二者之间也存在一定的联系和关系。
本文将探讨完全信息动态博弈和演化博弈的关系,并对它们的特点和应用进行分析。
1. 完全信息动态博弈的定义和特点完全信息动态博弈是指博弈参与者在博弈过程中具备完全信息的情况下,根据先后顺序依次做出决策,随着时间的推移,博弈过程也在不断变化。
在完全信息动态博弈中,博弈参与者对于其他参与者的行动和策略都有准确的了解,能够全面考虑对手的决策,以此来优化自己的策略选择。
完全信息动态博弈的特点包括:首先,信息对称,每个博弈者都能了解其他博弈者的策略和收益函数;其次,决策按照时间顺序依次进行,每个博弈者的行动会对其他人的决策产生影响;最后,完全信息动态博弈具有策略的时序性,参与者需要根据他们观察到的其他人的决策来选择自己的策略。
2. 演化博弈的定义和特点演化博弈是指博弈参与者根据其在群体中的优势来选择策略,并通过遗传和选择机制在演化过程中逐步改变策略的过程。
演化博弈考虑的不是个体之间的完全信息,而是从整体出发,通过个体之间的相互作用和进化选择来探讨不同策略之间的稳定性和最终结果。
演化博弈的特点包括:首先,演化博弈关注的是群体中不同策略的相对频率和进化趋势,而不是个体行动的绝对收益;其次,演化博弈中存在着演化稳定策略,即一旦某种策略在群体中形成,就会对其他策略形成一种稳定的威胁;最后,演化博弈的结果依赖于演化的时间尺度和环境的改变。
3. 完全信息动态博弈与演化博弈的关系完全信息动态博弈和演化博弈虽然从不同的角度出发,但也存在一定的联系和关系。
首先,完全信息动态博弈可以看作演化博弈的一种特殊情况,即当演化博弈的时间尺度趋于无穷时,完全信息动态博弈的结果可以看作是演化博弈的极限情况。
因此,完全信息动态博弈可以为演化博弈提供一种基础理论框架。
其次,演化博弈可以用来解释完全信息动态博弈中出现的某些稳定策略。
博弈论基础读书笔记三完全信息动态博弈和逆向归纳法
博弈论基础读书笔记三完全信息动态博弈和逆向归纳法第⼆章完全信息动态博弈先来说明两个概念:1、是指在博弈中,参与⼈同时选择或虽⾮同时选择但后⾏动者并不知道先⾏动者采取了什么具体⾏动。
2、是指在博弈中,参与⼈的⾏动有先后顺序,且后⾏动者能够观察到先⾏动者所选择的⾏动。
这⼀章,我们来讨论关于完全信息(即参与者的收益函数是共同知识的博弈)动态博弈的问题。
在这⾥我们还将博弈分为两种:完美信息博弈:即要选择⾏动的参与者完全知道这⼀步之前所有的博弈过程。
完全但不完美信息博弈:即要选择⾏动的参与者不知道这⼀步之前的博弈过程。
进⾏这章之前先简要的解释⼀些东西:所有的动态博弈的中⼼问题都是可信任性。
下⾯给⼀个经典的⼿雷博弈的例⼦:第⼀,参与者1可以选择⽀付1000美元给参与者2或者是⼀分不给。
第⼆,参与者2观察参与者1的选择,然后决定是否引爆⼀颗⼿雷将两个⼈同炸死。
如果参与者2威胁参与者1如果他不付1000美元就引爆⼿雷,如果参与者1相信这个威胁,则最优选择是⽀付1000美元。
但参与者1却不会对这⼀威胁信以为真,因为它不可置信(参与者2不会蠢到因为1000美元⽽同归于尽,⾄于参与者1考虑参与者2是不是疯⼦的情况在第三章讨论)。
这个例⼦就是典型的完全且完美信息博弈。
在2.1节我们将在后⾯使⽤逆向归纳解,来求解这个问题。
在2.2节我们会丰富前⼀节的博弈模型使之成为完全但不完美博弈,我们会定义这种博弈的⼦博弈精炼解,它是逆向归纳法的延申。
在2.3节研究重复博弈,即多次重复⼀个给定博弈。
这⾥分析问题的中⼼使(可信的)威胁和对以后做出的承诺对当前⾏为的影响。
在2.4节中我们介绍分析⼀般的完全信息动态博弈所需要的⼯具。
不再区别信息是否是完美的。
本节和本章的重点都在语⾔,⼀个完全信息动态博弈可能会有多个纳什均衡,但其中⼀些均衡或许包含了不可置信的威胁和承诺,⼦博弈精炼纳什均衡则是通过了可信检验的均衡。
看到这⾥你可能还是⼀头雾⽔,但是⽆所谓,让我们⼀节⼀节的来讲,看到最后你在回头看前⾯的总结可能会更有利于你对本章的理解。
完全信息动态博弈
-3 1
-3, 0,
-3 0
1, 0,
0 1
1, 0,
0 0
这里有3个纯战略Nash均衡,分别是 {开发,{不开发,开发}} (均衡结果:A
14
开发,B不开发) {开发,{不开发,不开发}} {不开发,{开发,开发}} 在每一个均衡,给定对方的战略,自己 的战略是最优的(效用最大) 均衡结果是(开,不开) , (开,不开) , (不开,开) 。注意均衡与均衡结果不同。 一般定义:扩展式博弈的战略 令 H i 为第 i 个参与人的信息集的集合,
1
选择什么行动, 而不是简单的, 与环境无关的 行动选择。 为了说明,我们考虑房地产开发博弈的 例子。有两个开发商A和B,互为竞争对手,决 定是否进行房地产开发。但他们不是同时行 动,且后行动者可以观察到先行动者的行动。 假定博弈的行动顺序如下: (1)开发商A先行 动,选择开发或不开发; (2)在A决策后,自 然选择市场需求大小; (3) 开发商B在观察到A 的决策和市场需求(自然的行动)后,决定开 发或不开发。 如图是房地产开发博弈的博弈树。
4
路径: (path)从初始结到终点结,由结 和枝所组成的系列。 扩展式 (extensive form) 是对博弈的一种描述,满足以下条件: (1)由结和枝组成的整体结构,由单个 起始结开始到终点结, 中间无闭合的圈。 即没 有以下结构
11
1
(所有前列结全排序) (2)必须说明每个结点属于某个参与人。 (3)在自然选择的结上,有自然选择不同 枝的概率。 (4)有划分每个参与人的结的信息集。 (每个信息集是决策结集合的一个子集, 满足 (a)每个决策结都是同一个参与人的决
11
1
U 2 L R L R 1 D
第二节完全信息动态博弈(1)
一 博弈扩展式表述
只包含一个决策结的信息集称为单结信息集, 如果博弈树的所有信息都是单结的,该博弈称 为完美信息博弈。
完美信息博弈意味着博弈中没有任何两个参与 人同时行动,且后行动者知道所有前序行动 (任何两个决策结都无虚线相连)。
自然总是假定是单结的,因为自然在参与人决 策之后行动等价于自然在参与人之前行动但参 与人不能观测到自然的行动。
第二节 完全信息动态搏弈 -子博弈精炼纳什均衡
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例
一 博弈扩展式表述
战略式主要用于描述和分析静态博弈,给出的是 参与人有什么战略可供选择,用博弈支付矩阵表示; 扩展式主要用于描述和分析动态博弈,给出的是参与 人的相机行动规则(依据条件选择行动),用博弈树 表示。
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈战略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的战略式表述一博弈扩展式表述由战略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈树的基本构造包括决策结和终点结两类
N
大
小
A
开发 不开发
1/2 1/2
A
开发
完全信息动态博弈模型
完全信息动态博弈模型完全信息动态博弈模型是博弈论中一种重要的博弈模型,它描述了一组参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。
下面将详细介绍完全信息动态博弈模型的相关内容。
一、博弈的参与者:完全信息动态博弈模型中,通常包括两个或多个参与者,每个参与者都可以做出自己的决策和行动。
参与者可以是个人、组织、公司等,他们之间存在着相互竞争和合作的关系。
二、博弈的信息:完全信息动态博弈模型中的参与者拥有完全信息,即每个参与者都能够获得关于其他参与者的决策和行动的完整信息。
通过完全信息,参与者能够准确地评估自己的决策和行动对其他参与者的影响,并作出最优化的决策。
三、博弈的行动和策略:在完全信息动态博弈中,参与者可以选择不同的行动和策略来达到自己的目标。
每个参与者根据自己对其他参与者行动和策略的评估,以及自己的目标和利益,选择最优化的行动和策略。
四、博弈的时间顺序:完全信息动态博弈是一个时间序列上的博弈模型,参与者的决策和行动是有序进行的。
参与者按照一定的时间顺序依次进行决策和行动,每个参与者都会考虑前面参与者的行动和决策对自己的影响,进而作出自己的决策。
五、博弈的结果和收益:完全信息动态博弈模型的结果是参与者的收益和利益。
通过多轮反复的博弈过程,参与者根据自己的决策和行动可以获得不同的结果和收益。
每个参与者的最终目标是通过优化自己的决策和行动,获得最大的收益和利益。
完全信息动态博弈模型是博弈论中一种重要的模型,它能够帮助我们分析和理解多方参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。
通过对博弈的参与者、信息、行动和策略、时间顺序以及结果和收益的分析,可以更好地理解和应用完全信息动态博弈模型。
完全信息动态博弈(子博弈完美的纳什均衡)
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
(-1,1,0)
.
例:
2 L
1 R
(200,200) M
S (a,b)
N 1
T
(50,300)
(300,0)
➢ 若 a=100,b=150,SPNE是什么? ➢ 若改变a b的数值,能否使L-N-T成为SPNE? ➢ 什么情况下,2会获得300或更高的支付?
Stage1: 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过;
若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受,而哥哥最 终将一无所获。
均衡路径: 哥哥提出方案为1/2:1/2, 弟弟接受
.
例:要挟诉讼
(要求赔偿S) 指控
B
拒绝
起诉
A
放弃
威胁不可 信
(TX-P-C, -TX-D)
( -C , 0 )
A
不指控
接受
( 0 ,0 ) ( S-C, -S )
若 TX<P 则 A将选择放弃
SPNE:A不指控
.
例:要挟诉讼
威胁可信
拒绝
(要求赔偿S) 指控
B
A
不指控
接受
( 0 ,0 )
起诉
A
(TX-P-C, -TX-D)
放弃
( -P- C , 0 )
(S-P-C,-S)
.
例:要挟诉讼
如果原告将P提前支付,TX-C-P>-C-P, 只要胜诉的可能大于0,原告将起诉。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果TX >P+C , 原告会指控。
动态博弈
案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1
不借
(1, 0) 起诉 (-1, 0) 不还 P1
借 P2 还
放弃 (0, 4)
(2, 2)
2· B 斯塔克尔贝里双头垄断模型 1· 博弈的时间顺序如下(1) 企业1选择产量q1 , (2) 企 业2观察到q1 以后,然后选择产量q2 ; (3) 企业i 的收 益由下面的利润函数给出:
自己避免小企业,小人物的无端指控. 办法之一就是在被指控之前就支付律师费用. 假定被告在被指控之前支付律师费用y , 那么,赔偿 区域为 s [ rx , rx d y ], 纳什均衡解为
s rx (d y) 2
因为即使 rx d 2 c p 成立, ( d y ) 2 c p rx 也可能不满足, 从而原告将不会提出指控. 这样的 承诺行动使被告节省成本 rx d 2 y . 因此,只要 y rx d 2 , 承诺行动就值得. 这 就是为什么大公司、大人物雇佣律师的原因之一.
动 态 博 弈
简单地讲,动态博弈就是参与者的行动选择必须 是有先后顺序的博弈. 参与者的每一次行动选择叫做一步或一个时期. 直观地讲,动态博弈可以看作若干个静态博弈联 合在一起看作一个博弈. 动态博弈分为 完美信息和非完美信息动态博弈. 第二章 完全信息动态博弈 1 完全信息博弈 参与者的收益函数是共同知识的博弈 2 完全且完美信息动态博弈 博弈进行的每一步当中, 要选择行动的参与者都知道这一步之前博弈进行的
显然即使 rx c p , (即上法庭的期望收益小于诉讼 成本), rx d 2 c p 的条件仍可能成立. 子博弈纳什均衡结果将是: 假定这个条件成立, 原告提出指控要求. 原告的支付为 rx d 2 c p , 被告的支付为 rx d 2 , 案件私了. 该博弈模型的实际背景举例: 因为被告打官司的成本不仅包括应诉的法律费 用而且涉及声誉损失( d ),所以,被告越大(大人物 大企业), d 越大, rx d 2 c p 的条件越可能满足. 这是为什么大人物常常受到无端指控的原因之一. 当然,大企业、大人物也可以通过他们的承诺行动使
博弈论——完全信息动态博弈
2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与人在不同的时间选择行动。
完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈静态博弈习惯用战略式(Strategic form representation)表述,动态博弈习惯用扩展式(Extensive form representation)表述。
战略式表述的三要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。
扩展式表述的要素包括:参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件(自然的选择)的概率分布。
n人有限战略博弈的扩展式表述用博弈树来表示1(1,2) (0,3)①结:包括决策结和终点结。
决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。
第一个行动选择对应的决策结为“初始结”,用空心圆表示,其它决策结用实心圆表示。
X表示结的集合,x X表示某个特定的结。
z表示终点结,Z表示终点结集合。
表示结之间的顺序关系,x x´表示x在x´之前。
x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。
以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。
在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。
②枝:博弈树上,枝是从一个决策结到其直接后续结的连线,每一个枝代表参与人的一个行动选择。
在每一个枝旁标注该具体行动的代号。
一般地,每个决策结下有多个枝,给出每次行动时参与人的行动空间,即此时有哪些行动可供选择。
③信息集(information sets):博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。
博弈树上的所有决策结分割成不同的信息集。
每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结。
博弈论前四章笔记整理
博弈论前四章笔记整理第一章:博弈论基础概念。
- 博弈的定义与要素。
- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。
- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。
例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。
- 博弈的分类。
- 按参与者数量可分为两人博弈和多人博弈。
- 按策略空间是否有限分为有限博弈和无限博弈。
如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。
- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。
第二章:完全信息静态博弈。
- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。
以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。
- 占优策略均衡。
- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。
如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。
例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。
- 纳什均衡。
- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。
即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。
与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。
例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。
第三章:完全信息动态博弈。
- 扩展式表述。
- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。
第2章完全信息动态博弈
第2章完全信息动态博弈2.1 完全信息动态博弈的表示法....................................................................................2-12.1.1由静态到动态博弈的范例...............................................................................2-12.1.2动态博弈扩展式的表示法...............................................................................2-3 2.2 子博弈完美均衡与存在性........................................................................................2-4 2.3 完全信息动态博弈之范例........................................................................................2-6 2.4 完全信息重复博弈与无名氏定理............................................................................2-8 2.5 动态博弈在产业竞争的应用....................................................................................2-112.5.1 可信承诺与吓阻进入......................................................................................2-112.5.2 谈判..................................................................................................................2-132.5.3 策略性贸易政策..............................................................................................2-14 2.6 实例与应用:掠夺式定价与连锁店悖论................................................................2-16 2.7 实例与应用:品牌选择............................................................................................2-18 2.8 实例与应用:原油市场............................................................................................2-19 2.9 小结............................................................................................................................2-21 练习题................................................................................................................................2-22 参考文献............................................................................................................................2-232.1完全信息动态博弈的表示法2.1.1由静态到动态博弈的范例考虑以下原为静态博弈的范例,但在允许参赛者可以先后出招后就成为动态的博弈:(1)创新(Innovation)Zenith推新产品不推推10, 2* 15, 0Sony不推3, 3 12, 5如果Sony与Zenith同时出招,均衡为何?如果Sony是产业领导者,先宣布它是否推出新产品,均衡是否会改变?(2) 吓阻进入(Entry Deterrence)旧公司 原价 低价 进 10, 50* -10, 30新公司不进0, 1000, 100*如果新、旧公司同时出招,均衡为何?如果新公司决定进入此产业之后,旧公司是否会采低价之价格战策略?旧公司是否能吓阻新公司进入?如果旧公司是连锁店(chain stores),是否在每个城市或区域都采价格战,以吓阻新集团进入?(3) 出价策略(Bidding Strategy)T 公司进行中的投资计划可能成功或失败,外界认为每股T 公司股票可能在0至20元之间,每点机率都相同,只有T 公司自知其真实价值(信息不对称)。
完全信息动态博弈模型
完全信息动态博弈模型完全信息动态博弈模型是博弈论中的一种重要模型,它描述了参与者具有完全信息(即对所有相关信息都有准确了解)的情况下进行的博弈过程。
在该模型中,参与者能够观察其他人的行为和选择,并根据这些观察作出自己的决策。
在完全信息动态博弈模型中,博弈过程分为多个阶段。
每个参与者在每个阶段都必须做出自己的决策,而后续的决策将依赖于先前的决策。
参与者可以根据观察到的其他人的行为和选择来调整自己的策略。
这种博弈模型特别适用于描述多个参与者之间具有时间序列关系的情况,如竞价拍卖、价格战等。
完全信息动态博弈模型可以用博弈树来表示。
博弈树由一系列节点和边组成,每个节点表示参与者的决策点,边表示参与者的决策选择。
根节点表示博弈的初始状态,而叶节点表示博弈的终止状态。
在每个节点上,参与者根据其他人的选择和观察到的信息来做出决策。
通过沿着博弈树的边一步一步向下移动,参与者可以在每个阶段根据观察到的信息进行反应和调整。
完全信息动态博弈模型需要考虑的核心概念是策略和均衡。
策略是参与者通过决策选择在每个节点上的行为规则,决定了参与者在每个阶段应该如何行动。
而均衡是一种状态,其中所有的参与者都无法通过单方行动来改善自己的收益。
在完全信息动态博弈模型中,通常存在多个均衡解,其中每个参与者都选择出使自己获得最大收益的策略。
通过建立完全信息动态博弈模型,我们可以分析不同参与者的决策行为和相应结果的演化过程。
通过求解均衡解,我们可以预测在不同情况下各参与者的最佳策略选择,从而为参与者提供决策依据。
此外,完全信息动态博弈模型也可以用于研究不同决策因素对博弈结果的影响,并为参与者提供制定最优策略的指导。
总之,完全信息动态博弈模型是博弈论中重要的一个模型,它描述了参与者具有完全信息的情况下进行的博弈过程。
通过建立博弈树、分析策略和求解均衡解,我们可以预测参与者的决策行为和相应结果的演化,并提供决策指导。
这种模型对于研究多个参与者之间具有时间序列关系的博弈情况非常有用,为决策者提供了重要的参考和指导。
完全信息动态博弈
一般来说,由于后行动的博弈方有更多的信息帮助自己选择 行动,可减少决策的盲目性,因此处于较有利的地位。不过, 后行动和具有较多信息并不总是有利的。
乙
左
中
右
上 4,12 3,10 2,12 甲 下 3,12 2,10 1,11
注意:当博弈方按上述子博弈精炼纳什均衡策略组合行动时, 实际上不会进行到博弈的第二、三阶段,两博弈方在第二、 三阶段的行为实际上不会发生。但作为完整策略的表达,在 描述子博弈精炼纳什均衡的策略选择时,必须将其给出。
例 市场进入博弈
进入者
进
● 不进
默许
x ● 在位者
x ' ● 在位者
打击 默许
打击
●
●
●
(0,0) (-1,-1) (1,2)
男方策略是两个:足球,芭蕾。女方是在知道男方决策后才 行动的,其策略可以归纳为四个:追随策略(他选什么我就 选什么)、对抗策略(他选什么我偏不选什么)、芭蕾策略 (无论他选什么我都选芭蕾)、足球策略(无论他选什么我 都选他喜欢的足球)。
动态博弈的非对称性
静态博弈下,各参与人同时选择,既无法知道别人的选择, 也无暇对此作出反应。但动态博弈中,后行动者会根据先行 动者的选择来调整自己的选择,而先行动者也会预期到这一 点,所以会考虑自己的选择对其他参与人有什么影响,从而 调整自己的策略。
纳什均衡不能排除不可信的威胁(或承诺),因此在分析动 态博弈时不能往往不能做出可靠的判断。
不打
(1,0)
(0,4)
当博弈进行到第三阶段即甲选择“不分”时,乙的合理选择 是“打”官司,这一威胁是可信的;则甲在第二阶段的合理 选择是“分”,这一许诺是可信的;乙在第一阶段选择“借” 是合理的。因此,乙的完整策略是“第一阶段选择‘借’ ,
2019最新第二部分 完全信息动态博弈 第二章 展开型博弈体育
h1 左 h12
A h21
B h21
右 h22
C h31
D h31
a
ba
b
c
d cd
(1,2) (0,3) (3,1) (-1,4) (2,1) (0,0) (-1,1) (3,2)
• 局中人1
信息集:H1={h1 ,h21,h31} 行动空间:A(h1)={左,右}; A(h21)={a,b};A(h31)={c,d} 纯策略空间:S1=A(h1)A(h21)A(h31)= {(左,a,c),(左,a,d),(左,b,c),(左,b,d),
纯策略空间:S2=A(h12)A(h22)={(A,C),(A,D),(B,C),(B,D)}
h1 1 左 h12 2
右 2 h22
A
BC
D
(3,1) (5,6)(4,2) (2,7)
• 纯策略组合
S={{左, (A,C)},{左, (A,D)},{左, (B,C)},{左, (B,D)}, {右, (A,C)},{右, (A,D)},{右, (B,C)},{右, (B,D)}}
2. 博弈树规则
(1) 每一个结至多有一个其他结直接位于它 的前面。
(2) 在博弈树中没有一条路径可以使决策结 与自身相连。
(3) 博弈树必须有初始结 (4) 每个博弈树只有一个初始结
3、完美信息与不完美信息
• 定义:假如一个局中人在轮到他行动时知道自 己处于博弈树的那个结上,我们称该局中人有 完美信息。 博弈中的每一个局中人都具有完美信息,则称 该博弈有完美信息。 如果局中人在不知道另外的局中人前面行动的 情况下必须行动,则称该局中人具有不完美信 息。 倘若至少有一个局中人具有不完美信息,则称 该博弈具有不完美信息。
完全信息动态博弈
乙 借 不借 甲 借
乙
不借
甲 (1,0)
(1,0)
分
不分
分
不分
(2,2) (2,2) (0,4) 打
乙 不打 (0,4)
不可信的许诺 (1,0)
可信的威胁
先来后到博弈
在市场经济活动中常常有这样一种现象,当某个厂商先行开 拓或占领了某个市场以后,其他厂商为丰厚的利润所吸引也 会随后跟进。这时,先占领市场者大多都不会无动于衷,而 是利用自己先行一步的优势对后来者进行打击。但这种打击 往往需要付出一定代价,当然如果能够达到挤走后来者的目 的,它就会长期地独占或垄断市场,所以长期地看先到者还 是合算的。那么,当一个先到者面临一个后来者争夺市场的 威胁时,空间应该如何抉择呢?
* A t A n n * Bi t Bi i 1 i 1
(a v c) 2 (2n 1)(a v c) 2 , ] 解得: t [ 2 4n(n 1)b 4n(n 1) b
(a bQ v c)Q n(a w v)[a v nw (n 1)c] b(n 1) 2
Bi qi a bQ w v bqi 0 awv qi ( n 1)b Q qi
i 1 n
n( a w v ) ( n 1)b
子博弈精炼纳什均衡的应用举例
斯坦克尔伯格(Stackelberg)寡头竞争模型 如同在库诺特模型中一样,在斯坦克尔伯格模型中,企业的行动也 是选择产量。不同的是,在斯坦克尔伯格模型中,企业1(称为领头 企业,leader)首先选择产量q1,企业2(称为尾随企业,follower) 观测到q1,然后选择自己的产量q2,此时他们选择的产量以及所得 利润分别是多少?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不完美信息:2不能区 分1是采用了L还是S
L L L ( 2, 2 ) 1
L 2 S L 2 S
( 2 , 2)
(-1,-1) (-1,-1) ( 1, 1)
2
S
S
(-1,-1)
1
S 2
L
S
(-1,-1)
足
2,1
-1,-1
-1,-1
1,2
男
巴
扩展式表述 (extensive form representation) 多用博弈树
男的策略:{足球,芭蕾},选择足球;还是选择芭蕾。 女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾, 芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管他选什么,我都选芭蕾; 4、足球策略:不管他选什么,我都选足球。 策略即:如果他选择什么,我就怎样行动的相机行动方 案。在扩展式博弈里,参与人是相机行事,即“等待” 博弈到达一个自己的信息集(包含一个或多个决策结后, 再采取行动方案。
结 nodes
( 2, 2)
L L 1 S 2 2
S
L
(-1,-1) (-1,-1)
S
( 1 , 1)
信息集分单节信息集 和多节信息集;如果 用虚线匡起来表示2知 道自己位于信息集内, 但不知道是哪一点, 因为他没能观察到对 手的行动;如果博弈 树的所有信息集都是 单结的,称为完美信 息博弈
完美信息(perfect information)与 不完美信息(imperfect information)
第一节 博弈的扩展式表述
在静态博弈中,所有参与人同时行动(或行动虽有先 后,但没有人在自己行动之前观测到别人到行动); 在动态博弈中,参与人的行动有先后顺序,且后行动 者在自己行动之前能观测到先行动者的行动。
博弈论专家习惯用战略式表述来描述和分析静态博弈, 也习惯于用扩展式表述来描述和分析动态博弈。
B3 不开 开
(1,0) (0,8)
B4 不开 开
(0,0) (0,1)
不开
(0,0)
博弈树:不允许的情形
收益:
市场进入的扩展式
B 进入 进入 A 不进入 B 不进入 进入
A
B
-3 ,-3 1 ,0 0 ,1 0 ,0
不进入
市场进入博弈的战略式
B (进入,进入) (进入,不进入) (不进入,进入) (不进入,不进入) A 进入 不进入
参与人的行动空间
参与人的信息集 参与人的支付函数 外生事件(即“自然”的选择)的概率分布
战略式与扩展式
战略式表述 (strategic form representation) 多用矩阵
女 足 巴
男
足球 芭蕾
女
芭蕾
x
足球
女
芭蕾
x’
(-1,-1) (2,1) (1,2)
(-1,-1)
-3 ,-3 0 ,1
-3 ,-3 0 ,0
1 ,0 0 ,1
1 ,0 0 ,0
在市场进入博弈中:A有两个行动:“进入”、“不进 入”。由于是先行动者,只有两个战略:选择“进入”或 “不进入”。 B有两个行动:“进入”、“不进入”。但是,有4个战略: (1)若A选择“进入”,B选择“进入”,若A选择“不进 入”,B选择“进入”,即(进入,进入) (2)若A选择“进入”,B选择“进入”,若A选择“不进 入”,B选择“不进入”,即(进入,不进入) (3)若A选择“进入”,B选择“不进入”,若A选择“不进 入”,B选择“不进入”,即(不进入,进入) (4)若A选择“进入”,B选择“不进入”,若A选择“不进 入”,B选择“不进入”,即(不进入,不进入)
子博弈精练纳什均衡的一个重要改进是将“合理纳什均 衡”与“不合理纳什均衡”分开。
行动 进入
进入者
在位者
合作(40,50)
斗争(-10,0)
不可置信威胁
不进入(0,300) 市场进入阻挠博弈树 特点:剔除博弈中包含的不可置信威胁。
支付函数
承诺行动-破釜沉舟-背水一战
给定进入者进入,剔除(进入,斗争),(进入,默许) 是唯一的子博弈精练纳什均衡-举例(结婚-反对)
2.1-2博弈树的构成
1.结(nodes):结包括决策结(decition nodes)和终点结 (terminal nodes)两类。决策结是参与人采取行动的时点, 终点结是博弈行动路径的终点。在博弈树中,“谁在什么时 候行动”用在决策结旁边标注参与人的办法来表示。参与人 的支付标注在博弈树终点结处。 2.枝(branches):在博弈树上,枝是从一个决策结到它的直 接后续结的连线,每一个枝代表参与人的一个行动选择。 3.信息集(information sets):博弈树上的所有决策结分割 成不同的信息集。每一个信息集是决策结集合的一个子集。 该子集包括所有满足下列条件的决策结:(1)每一个决策结都 是同一参与人的决策结;(2)该参与人知道博弈进入该集合的 的某个决策结,但不知道自己究竟处于哪一个决策结。
扩展式表述所“扩展”的主要是参与人的战略空间
战略式表述简单地给出参与人有些什么战略可以选择, 而扩展式表述要给出每个战略的动态描述:谁在什么 时候行动,每次行动时有些什么具体行动方案可供选 择,以及知道些什么 此时的战略:如果你这样,我将怎样
2.1-1扩展式表述包含的要素
要素:
参与人集合 参与人的行动顺序
第二章 完全信息动态博弈
本章内容: 博弈的扩展式表述 子博弈精炼纳什均衡 子博弈精炼纳什均衡举例 重复博弈和无名氏定理
考虑下列问题:
一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟 哪个更合理?
纳什均衡假定每一个参与人在选择自己的最优战略时假 定所有其他参与人的战略是给定的,但是如果参与人的 行动有先有后,后行动者的选择空间依赖于前行动者的 选择,前行动者在选择时不可能不考虑自己的行动对后 行动者的影响。
博弈树:房地产开发博弈I
需求大,开发者利润8千万,不开发者利润0。
需求大,两者都开发利润各为4千万。
需求小,开发者利润1千万,不开发者利润0。
开发 不开发 A
需求小,两者都开发利润各为-3千万
N1
N2 小
两者都不开发利润各为 0。 大 大 小
B1 开发
(4,4)
B2 不开发 开
(8,0) (-3,-3)