博弈论第四讲动态博弈

合集下载

博弈论第四讲动态博弈60页PPT

博弈论第四讲动态博弈60页PPT
Thank you
博弈论第四讲动态博弈
36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素旅途 ,义无 反顾。 40、对时间的价值没有没有深切认识 的人, 决不会 坚韧勤 勉。
6、最大的骄傲于最大的自卑都表示心灵的最软弱无力。——斯宾诺莎 7、自知之明是最难得的知识。——西班牙 8、勇气通往天堂,怯懦通往地狱。——塞内加 9、有时候读书是一种巧妙地避开思考的方法。——赫尔普斯 10、阅读一切好书如同和过去最杰出的人谈话。——笛卡儿

第四讲 动态博弈

第四讲 动态博弈

R (0,0)
2
U
1
L (3,1) (2,2)
D
修改的市场进入博弈
试说明上述不可置信的威胁是什么? 现实生活中的例子:父亲坚决不同意女儿 的婚事,威胁说,如果女儿不与相爱的人 断绝关系,他就与女儿断绝父女关系。
逆向归纳法
逆向归纳法可以排除不可置信的威胁。之 所以可以如此,根本原因在于采用了一种 分析动态博弈的有效方法——逆向归纳法, 即从动态博弈的最后一个阶段博弈方的行 为开始分析,逐步倒推回前一个阶段相应 博弈方的行为选择,一直到第一个阶段的 分析方法。一般方法是:从最后一阶段开 始分析,每一次确定出所分析阶段博弈方 的选择和路径,然后再确定前一阶段的博 弈方选择和路径。
(L/L,L/S) (L/L,S/S) (S/L,L/S) (S/L,S/S)
(若史密斯选择大则选择大;若其选择小则选择大) (若史密斯选择大则选择大;若其选择小则选择小) (若史密斯选择大则选择小;若其选择小则选择大) (若史密斯选择大则选择小;若其选择小则选择小)
跟随领头羊Ⅰ表明只要添加一点复杂性,就 使得策略式表述变得晦涩难懂,几无用武之 地。策略式如下。
威胁是指一个参与人承诺一旦其他参与人 偏离均衡,他将采取的某种行动,威胁是 有 一定影响力的,尽管可能它从未被实施 过。
在位者
默许 斗争 进入 40,50 -10,0 进入者 不进入 0,300 0,300 市场进入博弈中,如若进入者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润,所以 斗争就是一种不可置信的威胁。但纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)就成为一个纳 什均衡。
例如,一个模型不能在一开始就说德国相信它打 赢一场与法国的战争的概率是0.8,而法国相信这 一概率只有0.4,因此它们急欲一战。恰恰相反, 它必须假定信念(先验概率)开始时是一致的, 随后因为私人信息而产生分歧。例如两个参与人 都认为德国获胜的概率是0.4,但若德国的将军是 个军事天才,则这一概率就是0.8,而且随后德国 人发现德国的将军确实是个天才。如果是法国抢 先宣战,那么法国的错误信念可能会导致一场战 争,而若德国能令人信服它对德国将军天才的私 人信息,则这场战争本可避免。

博弈课件第一章动态博弈4

博弈课件第一章动态博弈4

系,是不能分割的整体. 因此在动态博弈中,研究某 个博弈方某个阶段的行为, 或者将各个阶段的行为割 裂开来研究是没有意义的. 动态博弈中某博弈方的策略 是指轮到他选择时, 针对前面阶段的各种情况,以及后续阶段可能的选择 所作相应选择的完整计划. 动态博弈的结果 包括双方(或多方)采用的策略 组合、实现的博路径和各博弈方的收益. 四、动态博弈的非对称性 因为动态博弈中各个博弈方的行为选择有先后次 序的,且后行为者能观察到此前博弈方的行为选择, 因此动态博弈中各博弈方的地位是不对称的. 另外,在 动态博弈中各博弈方的阶段选择不一定是交替进行的.
a1A1
假定参与者1的这一最优化问题也有唯一解, 表示为 a1 ,我们称 (a1 , R(a1 ))是这一博弈的逆向归纳解. 逆向归纳解不含有不可置信的威胁:因为参与者1能够 预测到参与者2 对1的可能选择的最优反应, 这一预测
排除了参与者2不可置信的威胁. 逆向归纳法背后的理性假设. 看下例三阶段两个参与者的动态博弈. 三阶段两个参与者的动态博弈的博弈树表示.
三阶段的“打”并不需要真正实施,但它是保证第 二阶段甲会分的关键,乙的策略中必须包含这个选 择. 既然双方上述策略构成一个纳什均衡,它应该 是具有稳定性的,但事实上乙根本就不会选择 “借” . 为什么会出现这种矛盾呢?主要在于乙第三阶段 的“起诉”是不可信的. 纳什均衡在动态博弈可能缺乏稳定性的根源在于 它不能排除博弈方策略中所包含的不可信的行为设定 不能解决动态博弈的相机选择引起的可信性问题. 动态博弈的有效分析概念,除了要符合纳什均衡 的基本要求以外,还必须满足另一个关键的要求,那 就是它(或者它们)必须能够排除博弈方策略中不可
博弈的结果: (借,还)
案例:开金矿博弈 版本3:法律保障不足的开金矿博弈 P1 不 还 P1

动态博弈

动态博弈

“战术勾结”
寡头之间的“不回避竞争法则”,是指至 少有几个寡头厂商保证(通常以做广告的 方式)自己的索价不高于其他任何竞争者。 这样的许诺对于消费者来说似乎是件很好 的事,但事实上这样的做法会提高价格。
寡占的斯塔克博格(stackberg)模型—— 动态的寡头市场产量博弈模型
u1=q1P(Q)-c1q1 =q1[8-(q1+q2)]-2q1 =6q1- q1q2-q12
最后,实施上述策略组合的最终结果,即 路径终端处得益数组中的数字。
可信性和纳什均衡问题
相机选择和策略中的可信性问题 动态博弈中博弈方的策略并没有强制力,
而且实施起来有一个过程,只要符合博弈 方自己的利益,他们完全可以在博弈过程 中改变计划。我们称这种问题为动态博弈 中的“相机选择”(Contingent Play)。
逆推归纳法(backwards induction)
逻辑基础:动态博弈中先行动的理性的博弈方, 在前面阶段选择行为时必然会考虑后行为博弈 方在后面阶段中将会怎样选择行动,只有在博 弈的最后一个阶段不再有后续阶段牵制的博弈 方,才能做出明确的选择。而当后面阶段博弈 方的选择确定以后,前一阶段博弈方的行为也 就容易确定了。
q2应满足: 6-q1-2 q2 = 0 q2 =3-q1/2
厂商1 知道厂商2的这种决策思路,因此在选择产量水平 q直1时接就将知上道式厂代商入2自的己产的量得q2益*会函根数据,上这式样确厂定商,1的所得以益他函可数以 实际上转化成了他自己产量的一元函数:
u1(q1,q2*) = 6q1-q1q2*-q12 = 6q1-q1(3-q1/2)-q12 = 3q1-0.5q12
乙讨价还价的筹码就是可以跟甲托时间
(当然拖延对乙的收益也有影响),拖延

博弈论3-4经典动态博弈模型

博弈论3-4经典动态博弈模型

3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。

21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。

Q max 为不至于使价格降到亏本的最大限度的产量。

Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。

第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。

1 、第二阶段厂商2的选择目标:得益最大化。

求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。

第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。

2 、第一阶段厂商1的选择。

用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。

将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。

3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。

博弈论——完全信息动态博弈

博弈论——完全信息动态博弈

博弈论——完全信息动态博弈2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与⼈在不同的时间选择⾏动。

完全信息动态博弈指的是各博弈⽅先后⾏动,后⾏动者知道先⾏动者的具体⾏动是什么且各博弈⽅对博弈中各种策略组合下所有参与⼈相应的得益都完全了解的博弈静态博弈习惯⽤战略式(Strategic form representation)表述,动态博弈习惯⽤扩展式(Extensive form representation)表述。

战略式表述的三要素:参与⼈集合、每个参与⼈的战略集合、由战略组合决定的每个参与⼈的⽀付。

扩展式表述的要素包括:参与⼈集合、参与⼈的⾏动顺序、参与⼈的⾏动空间、参与⼈的信息集、参与⼈的⽀付函数、外⽣事件(⾃然的选择)的概率分布。

n⼈有限战略博弈的扩展式表述⽤博弈树来表⽰1(1,2) (0,3)①结:包括决策结和终点结。

决策结是参与⼈采取⾏动的时点,终点结是博弈⾏动路径的终点。

第⼀个⾏动选择对应的决策结为“初始结”,⽤空⼼圆表⽰,其它决策结⽤实⼼圆表⽰。

X表⽰结的集合,x X表⽰某个特定的结。

z表⽰终点结,Z表⽰终点结集合。

表⽰结之间的顺序关系,x x′表⽰x在x′之前。

x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。

以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。

在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。

②枝:博弈树上,枝是从⼀个决策结到其直接后续结的连线,每⼀个枝代表参与⼈的⼀个⾏动选择。

在每⼀个枝旁标注该具体⾏动的代号。

⼀般地,每个决策结下有多个枝,给出每次⾏动时参与⼈的⾏动空间,即此时有哪些⾏动可供选择。

③信息集(information sets):博弈树中某⼀决策者在某⼀⾏动阶段具有相同信息的所有决策结集合称为⼀个信息集。

博弈树上的所有决策结分割成不同的信息集。

每⼀个信息集是决策结集合的⼀个⼦集(信息集是由决策结构成的集合),该⼦集包括所有满⾜下列条件的决策结:(1)每⼀个决策结都是同⼀个参与⼈的决策结。

动态博弈

动态博弈

b 再来分析第19个市场,我们假设前面18个市场微硬都采取了斗争选择,而最后的第
c 以这样的方法一直推到第1个市场,微硬都会选择容纳。 此时就会収现在为企业的斗争选择无法构成完美子博弈,不能形成可信的威胁,唯一的
完美子博弈那是均衡只有一开始采取接纳战略。
而乊上的考虑是基于在为企业是“理性的”,如果在为企业支付一定成在一开始就采取
先行动者与后行动者
1数量竞争的斯塔克伯格模型 2 序列价格竞争
3 序列质量选择
4 动态博弈中的承诺及其可信性 5 连锁店悖论
序列博弈简介 序列博弈是指博弈双方有行动的先后顺序的博弈类型。我们将这种参与者行动选择具有
先后顺序类型的博弈称为动态博弈。行动的先后顺序会给其中一些参与者获得战略优势, 先行动者获得收益就称为先行动优势。本章研究的重点是动态博弈。 重复博弈。
成立,领导企业选择生产高质量产品,否则生产低质量产品。而在跟随者来说,不会选 择与领导者相同质量的产品,因为同质产品会导致伯川德竞争,企业的利润会下降到0.
在乊前的模型分析中,我们假设的是领导企业在产量、价格或者质量这三个选择变量中
选择一个并且选择乊后不会做出改变。等到领导企业作出决定后,追随企业乊后会做出 反应,这是典型的序贯博弈。在其纳什均衡中,产量是明显高于古诺模型的。但是对于 领导企业来说最优的产量水平还是低于当前的产量水平更接近与古诺模型下的最有水平 的。 量而不会减产。相反,如果他预期到领导者会增产,那么追随者自身也会增产。博弈结 果最终还是会倾向于古诺模型下的纳什均衡。
当产品存在质量的差别后,企业是生产高质量产品还是低质量产品成为企业面临的重要
决策问题。
假定有两家企业,企业1生产高质量的z1,企业2生产低质量的z2,生产高质量产品成本

博弈论第四章

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t,但知道t的概率分布。

博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。

推断q i: 观察到R后,参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。

参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

博弈论与信息经济学04PPT课件

博弈论与信息经济学04PPT课件
• 我们将通过这种方式得到的纳什均衡称为精 炼贝叶斯纳什均衡。
• 精炼贝叶斯均衡是贝叶斯均衡、子博弈精 炼纳什均衡和贝叶斯推断的结合。它要求:
1、在每个信息集上,决策者必须有一个定义在属 于该信息集的所有决策结上的一个概率分布(信 念);
2、给定该信息集上的概率分布和其他参与人的 后续战略,参与人的行动必须是最优的;
3、每一个参与人根据贝叶斯法则和均衡战略修 正后验概率。
贝叶斯法则
(6,0) (6,0) (7,0) (3,1) (7,0) (3,1)
(7,0) (6,0) (6,0) (9,0) (9,0) (8,0) (8,0) (7,0) (5,-1) (9,0) (5,-1) (9,Байду номын сангаас) (5,-1) (9,0)
• 在第二阶段, 企业的行动选择是一个简单的 静态博弈决策问题,但在第一阶段,情况 要复杂得多:
P=4
P=5
P=6
2
6
7
6
9
8
• 例如:低成本的在位者不会选择p=6,因 此,如果进入者观察到在位者选择了p=6, 就可以推断在位者一定是高成本,选择 进入是有利可图的。预测到p=6会招致进 入者进入,即使高成本的在位者也可能 不会选择p=6。
• 类似的,如果选择价格p=5会招致进入者 进入,低成本的在位者也不会选择p=5。
对于在位者:
价格 在位者高成本时的利润 在位者低成本时的利润
P=4 P=5
P=6
2
6
7
6
9
8
• 进入者只有一种类型:进入成本为2。如果进入, 生产成本函数与在位者高成本函数相同。在 T=2阶段,如果进入者已进入,在位者成本函 数为共同知识;

博弈论第四章 完全且完美信息动态博弈

博弈论第四章 完全且完美信息动态博弈

0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。

博弈论04 动态博弈4

博弈论04 动态博弈4

动,你打算采取怎样的行动作为 回应。
与此相反,威胁或者承诺一 旦到了真要实施的时刻,你很可 能不会按照你的回应规则来行 动,因为那时它不是最佳选择。 威胁或者承诺不是为了告知,而 是为了操纵。因为威胁或者承诺 表明的选择是与你自身利益冲 突的行动,所以等到别人出招 后,你就有动机打破自己的威胁 或者承诺。
开金矿博弈
本例中甲对乙有一个承诺, 乙对甲有一个威胁。如何判断一 个承诺或者一个威胁是否可信
呢?例如将开金矿博弈稍作修 改:
子博弈精炼纳什均衡
动态博弈中,局中人的最佳 策略必须在博弈的每一阶段都 符合局中人自身利益最大化的 原则。
逆推归纳法
逆推归纳法求子博弈精炼纳什 均衡的方法
逆推归纳法
逆推归纳法求子博弈精炼纳什 均衡的方法
美国: B ≻ A ≻ C

洲: C ≻ A ≻ B
再假设如果投票人最愿意的
候选人当选,投票人的收益为1;
如果是其第二赞成的人当选,收
益为0;如果是最不喜欢的人当
选,收益为−1。
选举联合国秘书长
美国先选择,其策略有三个, 即否决安南,或否决布鲁特莱 特,或否决加利。
非洲在美国行动后进行选 择,即在美国否决A、或B、或 C的情况下,应该选择否决谁?
逆推归纳法
逆推归纳法求子博弈精炼纳什 均衡的方法
逆推归纳法
逆推归纳法求子博弈精炼纳什 均衡的方法
剔除有瑕疵的纳什均

动态的情侣博弈存在三个纳 什均衡:
(拳击,[拳击,时装]) (拳击,[拳击,拳击]) (时装,[时装,时装])
剔除有瑕疵的纳什均

动态的情侣博弈存在三个纳 什均衡:
(拳击,[拳击,时装]) (拳击,[拳击,拳击]) (时装,[时装,时装])

第04讲 博弈的基本框架 - 学生

第04讲 博弈的基本框架 - 学生
博弈的基本框架
1
·明确一个博弈的四大构成要素(完美信息、不完美信息)。 ·精确理解信息集与策略(纯策略、混合策略、浓缩策略)这 两个重要概念。
·能够用博弈的扩展式与规范式来描述一个博弈问题。
·了解划分博弈类型的基本方法:完全信息静态、完全信息动 态、不完全信息静态、不完全信息动态。
2
博弈论的基本框架
而象棋则是一个完美信息博弈。
17
信息集
定义 4.2.1 一个信息集 H 是以决策点为元素的集合。
信息集需满足以下两个条件:
(1) 同一个信息集中的所有决策点必须紧接着完全相同的 可选行动。 (2) 同一个信息集中的决策点不能出现一个先于另一个出 现的情况。
18
信息集判断
信息集判断
19
信息集
信息集设臵是正确的。 它表示甲无法判断自己处于信息集四个决策点中的哪一个。 一个博弈者如果总能记住她所经历过的所有博弈路径,我们称她 具有完美回忆(Perfect Recall)。 在图中,我们可以断定甲已经忘记了她自己以前采取的行动以及 其对手的反应,否则她不可能完全分不清四个决策点。 所以我们说在图中,甲没有完美回忆。
22
信息集判断
信息集判断
23
信息集
图中的信息集设臵也是错误的。 它不符合定义4.2.1中的条件(2)。
(2) 同一个信息集中的决策点不能出现一个先于另一个出现的情
况。 信息集只对应一个博弈者,甲乙两人的决策点在同一个信息集内 造成概念上的混乱。
24
信息集判断
信息集判断
25
信息集
在图中的信息集虽然都对应着乙,但它也违反了定义4.2.1中的 条件(2)。 (2) 同一个信息集中的决策点不能出现一个先于另一个出现的情 况。

博弈论四种博弈类型

博弈论四种博弈类型

华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。

在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:1、完全信息情况下的静态博弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:原有垄断者潜在进入者 进入 不进入根据纳什均衡的定义:各个参与者所做的是在给定其他参与者的策略是所能够做出的最好的一组策略。

当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。

B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:原有垄断者 低价 高价潜在进入者低价 高价对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。

经典动态博弈模型

经典动态博弈模型
博弈策略
由于囚徒无法信任对方,最终都选择坦白,导致集体利益受损。
斗鸡博弈
描述
两只斗鸡在狭路相逢,每只斗鸡都有前 进和后退两种选择。如果一只斗鸡前进 ,另一只后退,则前进的斗鸡获胜;如 果两只都前进,则两败俱伤;如果两只 都后退,则均无损失。
VS
博弈策略
由于存在两败俱伤的风险,双方更倾向于 选择后退以避免损失。
予相应的奖励。
结论
智猪博弈表明,合理的激励 机制和任务分配可以激发员 工的积极性和创造力。
案例四:猎鹿博弈在国际政治中的影响
猎鹿博弈概述
猎鹿博弈描述了两个猎人合作与不合作对收益的影响,强 调了合作的重要性。
国际政治中的影响
在国际关系中,国家间的合作与竞争往往受到猎鹿博弈的影响。 合作可以带来共同利益,但也需要克服信任和利益冲突的问题。
02
03
公共品供给
在公共品供给中,政府可运用动态博 弈模型分析不同主体之间的互动关系, 提高公共品供给效率。
国际关系
贸易摩擦
在国际贸易中,国家之间可以通过动态博弈模型分析贸易摩擦的起 因和解决方案,促进国际贸易的稳定发展。
地缘政治
在国际政治中,国家可以利用动态博弈模型分析地缘政治格局的变 化趋势,制定合适的国际战略。
结论
斗鸡博弈表明,在竞争激烈的 市场环境中,适当的妥协和沟
通对于避免损失至关重要。
案例三:智猪博弈在企业管理中的运用
智猪博弈概述
智猪博弈描述了大猪和小猪 在同一个猪圈里抢食物的情 况,强调了策略选择的重要
性。
企业管理中的运用
在企业中,智猪博弈可以应 用于激励机制设计、项目管 理等方面。例如,让有能力 的人承担更多责任,同时给
经典动态博弈模型

博弈论第四讲动态博弈共60页

博弈论第四讲动态博弈共60页

谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
博弈论第四讲动态博弈
1、战鼓一响,法律无声。——英国 2、任何法律的根本;不,不成文法本 身就是 讲道理 ……法 律,也 ----即 明示道的头盔。——爱·科 克 4、一个国家如果纲纪不正,其国风一 定颓败 。—— 塞内加 5、法律不能使人人平等,但是在法律 面前人 人是平 等的。 ——波 洛克

lec4_完全信息动态博弈——博弈论课件

lec4_完全信息动态博弈——博弈论课件
❖ A开发我不开发,A不开
B
B
开发 不开发 开发
不开发

发我开发;
博 弈
❖ 不论A开发与否,我不开 (-3,-3) (1,0) (0,1) (0,0)
发。
图2-8 房地产开发博弈
动态博弈的策略式表述



❖若把B的信息集从左

到右排列,上述四个

纯战略可以简单记为
——
A
➢ {开发,开发}

开发
不开发
法,即可处理动态博弈问题。
息 动
近来研究表明,存在策略式表述相同,但却

有本质差别的,不同扩展式表述的动态博弈。

说明上述观点具有一定的局限性。因此,策

略式表述并不能取代扩展式表述。
行为战略


论 混合战略纳什均衡:在扩展式表述博弈中,
讲 义
一个重要概念是“行为战略” (behavior
strategies),用以区别战略式表述博弈的混



讲 ❖(不开发,{开发,

开发})决定了博弈
的路径为A不开发
A
开发
不开发
B
B
开发
不开发 开发 不开发
——

B开发(0, 1)
(-3,-3) (1,0) (0,1) (0,0)
全 信
❖(开发,{不开发,
图2-8 房地产开发博弈

开发})决定了博弈
表2-1 房地产开发博弈:战略式表述
动 态 博 弈

弈树上的一个路径。

图2-8 房地产开发博弈
息 ❖比如(开发,{不开发, 表2-1 房地产开发博弈:策略式表述

动态博弈分析

动态博弈分析

弱纳什均衡,它们不稳定。
基于动态博弈的控制系统
• 基于动态博弈的控制系统设计,关键就是要将控 制的目标状态设计成博弈的子博弈精炼纳什均衡 。系统达到了纳什均衡,也就实现了控制目标。
策略式表示

策略


策略

策略
三 1 ,0 0 ,1
策略
四 1,0 0,0
开发 不开发
-3,-3 -3,-3 0,1 0,0
• 策略一:无论A是否选择开发,B选择开发。
• 策略二:若A选择开发,B也选择开发;若A选择 不开发,B也选择不开发。
• 策略三:若A选择开发,B就选择不开发;若A选 择不开发,B就选择开发。 • 策略四:无论A是否选择开发,B都选择不开发。
1. 完美纳什均衡:一个策略组合要成为完美纳什均 衡,就必须在所有可能的路径上达到均衡,不仅 包括均衡路径,还要包括其它不同的分支路径; 2. 对于一个参与人,他的完美均衡策略不仅可以保 证其它参与人处于均衡路径上时他可以做出最佳 反应,而且其它参与人处于非均衡(或者均衡路 径之外)时,他依然可以做出最佳反应;
51 4 4 9 -1 0 0
2. 动态博弈的策略式表述
• 若博弈的阶段很多乃至无穷,或者参与人 在一个阶段有很多可选择的行为,采用博 弈树表述将变得困难或根本不行。如下棋 ,等。 • 此时,应选用策略式表示。
2. 动态博弈的策略式表述
• 一个例子:美中军事博弈
犯 中国 不犯
美 国

-2
-2
2 -4 2 2
完全按静态博弈分析,
• 静态博弈的收益矩阵 • 纳什均衡两个.
2.博弈的策略式表述
• B有两个决策节(信息集) 每个决策节上有两个可选行动,因而B有四 个纯策略,分别是:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

制止
(-2,5) 制止
仿冒
A 不仿冒
B
不制止 (0,10)
仿冒
A
B 不制止
不仿冒 (5,5)
(2,2)
(10,4)
节点: 边: 终节点:
引子
每一阶段节点数、每一个选择节点的可选行为 数量,都可以不同,比如
仿冒更多次数、仿冒的规模和程度、制止仿冒的力 度
也不是所有动态博弈都可以用扩展形
阶段很多,或在一个阶段有很多可以选择的行为, 如下棋
双寡头竞争:古诺(Cournot)博弈
设一市场有1,2两家厂商生产同样的产品。如果厂商1的产量为 q1,厂商2的产量为q2 ,则市场总产量为Q= q1+ q2 。设市场出 清价格P是市场总产量的函数P(Q)=a-(q1+q2)
两个企业同时选择产量,价格由市场决定; 假设每家公司的成本函数相同,并且每单位成本不随生产的数量
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
先分析第二个厂商的决策:?
因为其决策时,厂商1的选择q1实际上已经决定了, 并且厂商2知道q1,因此对厂商2来说,相当于在给 定q1的情况下求使II2实现最大的q2 ,
II2对q2求导,得到q2必须满足:a-c- q1 -2 q2 =0, 即q2 *=(a-c- q1)/2
法律保障 --单次 企业信用体系--全寿命,一旦有失信发生,它的信用记录
有一笔摸不去的黑,将来它做生意也好,向银行贷款也好, 都会受此影响。所以国外企业对信用问题看的非常严重-- 电子商务的信用记录
关键在于必须增加一些对甲行为的制约!
在上面,甲选择不分,乙完全无可奈何;只能采取消极办法 -不借,保护自己不被骗
变化。更正规一些,每家公司具有常数边际成本函数;C(qi ) cqi
那么,两生产方的利润函数为:
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
双寡头竞争(续)
企业q1 最 R大1(q化2 )利 a润2的c 一q22阶条件为
否定,纳什均衡在动态博弈中失效 原因--动态博弈方策略的选择中可能存在
“可信性”问题
相机选择和策略中的可信性问题
相机选择(Contingent Play):
动态博弈中博弈方的策略是它们自己预先设定的,在各 个博弈阶段,针对各种情况的相应行为选择的计划
但这些策略没有强制力,而且实施起来有一个过程,因 此只要符合博弈方自己的利益,他们完全可以在博弈过 程中改变计划。--相机选择
假设金矿的价值是经过权威部门探测确认的
画出其博弈的扩展形
开金矿博弈的表示

甲 分
(2,2)

乙 不借
不分
(0,1)
(4,0)
开金矿博弈
引子
分析:
博弈从乙的选择开始 他要决策的关键:要判断甲的许诺是否可信
假设甲、乙是理性人
以自身利益最大化为目标,即他们不考虑道德因素
按假设:在第二阶段,轮到甲行动时:必然选择是“不 分”,而不是他许诺的“对半分”,也就是他的事先的 许诺是“不可信”
中,两家公司比起它们象卡特尔那样经营来利
润较低(因为在纳什均衡里,它们过度地生
产)。
古诺寡头模型扩展--斯塔克博格模 型(Stackelberg)
两个厂商,与古诺模型一样,这两个厂商的决策内容也 是产量。
但在这两个厂商中,一方较强一方较弱,因此它们的产 量决策是由较强的一方先进行选择,较弱的一方则根据 前者的产量选择自己的产量。
动态博弈的表示法--扩展形
例子:有一家企业的产品被另一家企业仿冒,如果被 仿冒的企业采取措施制止,仿冒企业就会停止仿冒, 如果被仿冒企业不采取措施制止,仿冒企业就会继续 仿冒。
对被仿冒企业来说,被仿冒当然要造成经济损失,因 此采取措施制止仿冒是符合自身利益的,但问题是制 止仿冒是有代价的,因此在遭仿冒时是否应该制止, 如何制止?
发现两者唯一的区别:
古诺寡头模型两厂商同时决策;而后者却是行动有先后之分, 后行动的一方能看到先行动的选择内容
导致两个博弈的求解方法、博弈的结果完全的不同
事实上,行动有先后的博弈是很多的:商业活动的讨 价还价、拍卖活动的轮流竞价、资本市场的收购与反 收购、下棋、打牌的轮流出牌等
依次选择与一次性同时选择有很大的差异。
前提:法律要起到应该有的作用
对人们正当权益的保护力度足够大 对侵害他人利益者有足够的威慑作用 否则法律的作用有限或完全失效
但斯塔克博格模型的产量大于古诺模型,价格低于 古诺模型,总利润小于古诺模型
而厂商1的得益却大于古诺模型中的两个厂商的得 益,更大于本模型中厂商2 的得益。
##在信息不对称的博弈中,信息越多的博弈方 (2)不一定能得到较多的利益
第四讲:完全且完美信息动态博弈
引子
我们刚才讲了两个无限策略模型--古诺寡头模型及 其扩展模型斯塔克博格模型(Stackelberg)
产目标。预先指定生产“配额”为q1与q2;它们的选择
是使得总利润最大化:
Maxq1,q2 [a (q1 q2 ) c][q1 q2 ]
每家公司的 生产数量
ac
4
价格
ac 2
每家公司的 利润
(a c)2
8
##如果公司如卡特尔那样经营,它们比起在纳
什均衡里的产量生产得少一些;卡特尔的产量
是古诺特-纳什均衡产量水平的75%。在纳什均衡
在第三阶段,如果乙选择打官司,则能收回自己的1万元本 钱,否则不打官司,则甲独吞4万元,乙仍然血本无归,所 以作为理性人,乙的选择是“打官司”
在第二阶段,甲完全清楚乙的上述思路及选择,知道乙打 官司的威胁是可信的,知道如果自己不分,等着他的必然 是一场官司及失去所有的收入,作为理性人,他的选择就 是分
如果轮到一个局中人行动的时候,他对于这个博弈进行到这个时刻的所有历史完全 清楚,即他对他前面所有人的所有已经采取的行动都很清楚,这样的博弈叫做完美 信息博弈
如:是否具有完美信息对行动的选择有很大的影响--减少盲目性,否则仅仅依靠 判断,概率期望决策
完全且完美信息动态博弈的思路
行动有先后顺序,不同的参与人在不同时点行动,先 行动者的选择影响后行动者的选择空间,后行动者可 以观察到先行动者做了什么选择,因此,为了做出最 优的行动选择,每个参与人都必须这样思考问题:如 果我如此选择,对方将如何应对?如果我是他,我将 会如何行动?给定他的应对,什么是我的最优选择?
q2
R2 (q2 )
a
2
c
q1 2
纳什均衡产量:q1NE
q2NE
ac 3
纳什均衡利润为
1NE
NE 2
(a c)2 9
卡特尔解
作为对比,如果两个公司如卡特尔那样地运作,即,它 们能对生产决策进行协调,我们来计算它们将生产的产 量,如果公司经营为卡特尔,可以合理地假设它们以最 大化它们的联合利润——或总利润这样的方式来设置生
在第一阶段,乙也完全明白甲的思路和选择,知道甲的许 诺“分”是个可信的承诺,此时,乙选择借成为合理的行
有法律保障的开金矿博弈
策略:
乙:在第一阶段选择“借”,若第二阶段甲选择“不分”,在第三 阶段选择“打官司”
甲:第二阶段选择“分”
这个案例告诉我们:
在一个都有私心,都重视自身利益的成员组成的社会中,完善公正 的法律不但能保障社会的公平,而且还能提高社会经济活动的效率, 是实现最有效率的社会分工合作的重要保障
如果乙能够在甲违约时可以用法律武器--打官司,来保护 自己呢?
有法律保障的开金矿博弈


不借
甲 分
(2,2) 打
(0,1)
不分 乙
(0,1)
不打 (4,0)
有法律保障的开金矿博弈 ——分钱打官司都可信
分析:
加不加这个第三阶段,博弈的结果大不相同,现在,当博 弈进行到第三阶段时,即甲选择不分,乙可以选择打官司 来讨回公道。
产量、价格等连续变量均为无限种行为
可直接用文字描述和数学函数式表达
动态博弈的基本特点
策略是一个完备的行动计划--在博弈开始之前就规定 出每一个决策点上的选择,即使这个决策点实际上不会 出现。
不是博弈方在单个阶段的行为,而是各博弈方在整个博弈中轮到 选择的每个阶段,针对前面阶段的各种情况做相应的选择和行为 的完整的计划,以及由不同博弈方这种完整计划构成的组合,这 种计划就是动态博弈中博弈方的策略,如:
由于它们的选择有先后之分,且后选择的厂商在选择时 已知道前一个厂商的选择,因此是一个完全信息的动态 博弈
古诺寡头模型扩展--斯塔克博 格模型(Stackelberg)
假设同上:逆需求函数 P(Q) a (q1 q2 ) 成本函数: C(qi ) cqi 两生产方的利润函数为:
1 q1P(Q) cq1 q1(a q1 q2 c) 2 q2P(Q) cq2 q2 (a q1 q2 c)
这样,乙清楚甲的行为规则,因此它不会被甲的许诺所 迷惑。
如果乙事先料想到甲的不会信守诺言,他的最合理选择: “不借”而不是“借”
因为有了不可信的许诺,使得甲乙合作最终成为不可能, 导致开金矿的3万元社会福利的净损失。
如何避免?
有法律保障的开金矿博弈
有没有办法将甲的许诺变成可信呢?,从而使得乙愿 意借,然后,甲遵守诺言选择分,最终增加双方的利 益呢?
正因为相机选择的存在使得博弈方是真正按照自己设定 的方案行动,还是临时改变自己的行动方案?
通过一个例子来说明
开金矿博弈
甲在开采一价值4万元的金矿时缺1万元资金,而 乙正好由1万元资金可以投资。设甲想说服乙将这 1万元资金借给自己用于开矿,并许诺在采到金子 后与乙对半分成
问:乙是否应该将钱借给甲呢?
相关文档
最新文档