博弈论第四章

合集下载

博弈论课件 第四章

博弈论课件 第四章
共性:重复博弈本质上只不过是原博弈的简单重复, 重复博弈每个阶段采取的策略就是原博弈中所采取的 策略,在零和博弈的情况下是同样的混合策略NE,在 后一种情况下则是纯策略NE;
重复博弈并不能给博弈方带来比一次博弈更好的结果, 每阶段的平均得益与一次性博弈的得益相同。
例:如果T次重复齐威王田忌赛马,双方在该重
触发策略trigger strategy:首先试探合作,一 旦发觉对方不合作,则也用不合作相报复的策略。 冷酷策略grim strategy
例3:分析两次重复制式问题时双方的 均衡策略
彩电有不同的制式,采用相同的制式,则厂商 之间由于零部件的通用性,相关设备可相互匹 配等大家都能获得一定的好处。
设有两厂商都决定引进彩电生产线,可选择的 有A,B两种制式,则两厂商面临一个决定制式 的博弈。
A 厂商A
B
厂商B
A
B
1,3
0,0
0,0
2,2
定理 设原博弈G有惟一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有惟一的子博弈
一般结论:
(1)在有限次重复博弈中,如果原博弈存在唯一的纯策略纳什 均衡策略组合,则有限次重复博弈的唯一的均衡解即各博弈方在 每阶段中都采用原博弈的纳什均衡; (2)由于在这样的双方策略下,均衡路径中的每个阶段都不存 在任何不可信的威胁或许诺,因此这种均衡是子博弈完美纳什均 衡。 (3)在一个博弈中的每个博弈方的所有得益上各自加上相同的 数值不会改变博弈原来的均衡
有限次重复博弈的囚徒困境
两次

坦白

1
不坦白
囚徒2
坦白
不坦白
-Hale Waihona Puke , -50, -8-8, 0
-1, -1

博弈论基础讲义-第四章

博弈论基础讲义-第四章

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。

例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。

例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。

2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。

例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。

例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。

博弈论课件第四章

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略,追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念,指的是当参与者根据对手的选择来选 择自己的策略时,不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等 概率性决策中,以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零,一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作,每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科,第四章将介绍博弈论的基本概念、 应用领域、主要模型以及纳什均衡理论和混合策略的应用,同时提供实际应 用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多 次对局中,通过随机选择策略以 增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注 决策,以提高筹码的价值和战略 性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

博弈论(第四章)

博弈论(第四章)
谢富纪 2009年3月 11
2.有限次重复博弈
有唯一纯策略纳什均衡博弈的有限次重复博弈
有限次重复博弈的囚徒困境博弈,可以理解成警察 给两人两次交代的机会。
囚 徒2 坦白 不坦白
囚 徒 1
坦白
不坦白
-5, -5
-8, 0
0, -8
-1, -1
谢富纪 2009年3月
12
2.有限次重复博弈
因为重复博弈全过程是一种动态博弈过程,从第二 阶段开始。 此前的博弈已是既成的事实,而在此后又没有任何 的后继阶段,因此实现本阶段最大利益是两博弈 方在该阶段的唯一原则。结果是(坦白,坦白),
谢富纪 2009年3月
29
2.有限次重复博弈
本博弈中之所以不能或不能部分实现最佳结果
(A,A),是因为在两次重复博弈中博弈方没
有运用触发策略的条件或者说机会。后面的选择 并不取决于第一次博弈的结果。
谢富纪 2009年3月
30
2.有限次重复博弈
厂商2 得益
(1,4) (1.5,3) (3,3)
谢富纪 2009年3月
17
2.有限次重复博弈
削价竞争博弈
高价 寡 高价 头 1 低价
寡头2
低价
100,100 20,150 150,20 70,70
由于两个寡头在同一市场的竞争可以看作维持很 长时间,因此可以看作是重复博弈。然而结果是 令人遗憾的。
谢富纪 2009年3月 18
2.有限次重复博弈
两个悖论
谢富纪 2009年3月
27
2.有限次重复博弈
两市场博弈的重复博弈
厂商 2 A 厂A 商 1 B B
3,3
1,4
4,1
0,0

博弈论第四章

博弈论第四章

(1)起始结是一个单结的信息结;
(2)子博弈保留了原博弈的所有结构。 则称它为原博弈的一个子博弈(子博弈)。
按照博弈树的延伸的时序,或者按照博弈 树生长的时序,我们用一个扁椭圆形的虚 线的圈,把所论局中人在同一个时点的若
干决策节点罩起来,成为他的一个信息集。
(1)起始结是一个单结的信息结
x1
L L 1 2 S L 2 S (1,1) (2,2) 1 (-1,-1) (-1,-1) S 2 L L S (2,2)
镇上能卖6000元;但如果另一家商铺同时在小镇上卖
鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
如果甲先行动,但在博弈开始前商铺主乙有一次行动A 的机会,利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果: 何行动他都不会改变这个决定;
一颗大树表示一个博弈,一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树,并且
小树表示的博弈不破坏大树表示的博弈的结构,
那么小树表示的博弈,就叫做大树表示的博弈
的子博弈。
一、子博弈(sub-game)
子博弈定义:在一个扩展型博弈中,如果一 个博弈由它的一个决策结及其所有后续结 构成,并满足:
信息集的时候,面临决策的局中人对于博弈迄今的历史是
不清楚的,他不清楚博弈具体走到了他的这个信息集里面 的哪个决策节点。
在市场进入博弈中,包含3个子博弈(包括原博 弈)。而在囚徒博弈中,只有一个子博弈(?)
收益: A
B 容忍
进入 抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ,-1 -9 ,0 0 ,-9

王则柯博弈论4序贯决策博弈

王则柯博弈论4序贯决策博弈

• 试验表明,在分别判断的情况下(也就是人们不能把这两杯冰 淇淋放在一起比较),人们反而愿意为冰淇淋A多付钱。结果 显示,人们愿意花2.26美元买冰淇淋A,却只愿意用1.66美元 买冰淇淋B。 • 说明:人们在作决策的时候,不是象传统经济学那样判断一个 物品的真正价值,而是根据一些比较容易评价的线索来判断。 • 引申:在送礼物的时候,礼物在它所属的类别里面是不是昂贵 很重要。
n人序贯博弈的博弈树的主要特征
• 对于表达有n个局中人P1,P2,…,Pn参与 的一个序贯博弈的博弈树:
1. 在树的每一个非末端节点上,都只有一个局中人 进行决策; 2. 在树的每一个末端节点上,都指派了一个n维的 “支付”向量p(v)=(p1(v),p2(v),…,p3(v)),这 里v是这个末端节点的相应的策略表达.而1, 2,…n是博弈参与人首次决策的自然顺序。
• 博弈树必须说明在每一个决策节点上相应的局中人能够 采取的所有可能的选择。 • 一些博弈树可能包含“不做任何决策”的决策节点。每一个 决策节点都有至少一条棱从它那里出发往后延伸,但是 没有最大延伸数量的限制。 • 对于不是根的每个节点,只能有来自别的节点的唯一的 棱指向它这个节点。
• 博弈树并不要求每个局中人必须在至少一个非末 端节点上进行决策。即,可能会出现某些局中人 并不在任何一个非末端节点上进行决策的情形。
• 策略组合
• 策略组合星号简示法 : ( U ,{ U’ , * } )2 • 策略组合的节点表示法: ( { U / D }, { U’ / D’ , U’’ / D’’ })8
4-4 倒推法(逆向推导法)
• 在序贯博弈中,由于均衡与结果是两个不同的概 念,所以求解纳什均衡的虚线排除确定法,并不适 用于求解序贯博弈的结果。一般使用倒推法(逆向 推导法)求序贯博弈的结果。

经济博弈论课件4

经济博弈论课件4
第四章 重复博弈
本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t =1

4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
4.1.1 为何研究重复博弈
经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间
V = 4 + δV
因此当 δ > 1 / 4 时,此触发策略纳什均衡策略
-1,-1
ห้องสมุดไป่ตู้
(-5,-5) 囚徒2 囚徒 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
有限次重复削价竞争博弈
寡头2 寡头 高 价 寡 高价 头 1 低价 100,100 150,20 低 价 20,150 70,70

博弈论课件4重复博弈

博弈论课件4重复博弈

5 1 1 2 5
如果博弈方2采用H,总得益现值为:
1
V 4 V
因此当 1/ 4时,此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理(弗里德曼,1971)
设G是一个完全信息的静态博弈,用(e1, , en )记G的纳什均衡得益,
用(x , 1
重复囚徒困境悖论和连锁 店悖论
☻理论和实践的直觉矛盾,现实 中寡头之间的价格战问题并 不十分普遍,重复次数较大 的实验研究的结果(重复200 次的囚徒困境)
☻泽尔腾(1978),“连锁店悖论” (导论中的先来后到博弈), 实际中对开头几个市场的进 入者不计代价的打击
☻问题的症结与蜈蚣博弈类似, 在于在较多阶段的动态博弈 中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益:如果一常数作为重复博弈(有限次重复博弈或
无限次重复博弈)各个阶段的得益,能产生与得益序列
1, 2,相同的现在值,则称为1, 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5,5 6,0 2,0
厂商2
M 0,6 3,3 2,0
L
0,2 0,2 1,1
+3
厂H 商M 1L
H
8,8 7,1 3,1
厂商2 M
1,7 4,4 3,1
L
1,3 1,3 2,2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理

博弈论第四章

博弈论第四章

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t,但知道t的概率分布。

博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1(a1, a2, t), u2(a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人 2L'R'L2,10,0参与人 1 M0, 20,1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义: 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.要求3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i: 观察到L后,参与人1的类型是t i的概率。

推断q i: 观察到R后,参与人1的类型是t i的概率。

p1 + p2 + p3 + p4 = 1q1 + q2 + q3 + q4= 1N如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。

参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,例 3个参与人的博弈。

博弈论第四章 完全且完美信息动态博弈

博弈论第四章 完全且完美信息动态博弈

0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
精的扩展式表述包括四个要素:
✓ 参与人集合(Player) ✓ 每个参与人的战略集合(Strategy) ✓ 博弈的顺序(Order) ✓ 由战略组合决定的每个参与人的支付(Payoff)
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
( 1, 2 ) ( -1, -1 ) ( 0, 0 ) ( 2, 1 )
精选PPT
12
动态博弈的 战略
精选PPT
13
动态博弈的战略的表述
✓ 战略:参与人在给定信息集的情况下选择行动的规则,它规定参 与人在什么情况下选择什么行动,是参与人的“相机行动方案”。
si表示第i个参与人的特定战略
Si si代表第i个参与人所有可选战 择略 的集合
如果n个参与人每人选择战 一略 个, n维向量s (s1,s2, ,si, ,sn)称为一个战略组合 si表示第i个人选择的战略
精选PPT
6
扩展式表示的一个例子
精选PPT
7
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
到达 局中人2 的一个决策结点,这时,局中人2要
从L′和R′中作出选择。类似地,如果局中人1选择R, 则将到达局中人2的另一个决策结点。
这时局中人2从L′和R′中选择行动。无论局中人2 选择了哪一个,都将到达终结点 (即博弈结束)且两 局中人分别得到相应终点节下面的收益。

博弈论(第4章)

博弈论(第4章)

第4章
协调与谈判
商家 1
广告博弈规范式 商家 2 做广告 做广告 ( 4, 4) 不做广告 (2, 5)
2 广告博弈
( 5, 2) 不做广告 (0, 0) 有两个商家出售同一种商品。为了促进商品的销售,可以进
行广告宣传,但做广告需要成本。假设两个商家都做广告,
帕累托占优纳什均衡:
(和平,和平)
第4章
协调与谈判
价格竞争博弈规范式 1 商家 2 商家 1 高价 低价 高价 ( 9, 9) ( 8, 0) 低价 (0,8) (7, 7)
例4.1.2 价格竞争博弈:
• 纳什均衡点:(高价,高价)、(低价,低价)和一个混 合策略纳什均衡点 ((7 / 8,1/ 8), (7 / 8,1/ 8)) 。 • 经过比较,(高价,高价)是一个帕累托占优纳什均衡。 但是纳什均 衡(低价,低价)对商家更有吸引力。
• 库珀通过改变参数x和y的取值,实验局中人对这些参数的 理解和对均衡的影响。三个最典型的实验:
第4章
协调与谈判
CG-3 3 协 调 博 弈
B A
1 2 3
1 350, 350 250,350 0, x
2 350, 250 550, 550 0, y
3 x, 0 y, 0 600, 600
情形1: (x,y)=(1000,0) Cooper 实验的结果:
B A 1
1 ( 800, 800) ( 0, 800)
2 (800, 0) (1000, 1000)
3. 外部选择
调博弈,会增加协调成功的可能性。 •
2
假定在协调博弈之前增加一个对博弈之外的选择,再进行协 库珀对CG-2×2协调博弈(即例4.1.5)实验——

35博弈论-第四章

35博弈论-第四章

第四章完全信息动态博弈更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。

如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。

而这一章,我们将围绕这子博弈完美均衡来展开。

第一节完美信息与完全但不完美信息完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。

所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。

而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。

我们不妨用两个例子来加以说明。

例4.1 动态囚徒困境囚徒1图4-1 动态囚徒困境例4.2 取消管制政府图4-2 取消管制与图4-2完全等价的表示方法见图4-3。

政府图4-3 取消管制定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。

显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。

第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminal history),而用参与者函数来表示在每一个全历史上,在博弈进行到某个阶段时谁来行动。

因而要完整地描述一个动态博弈,必须具备四个要素:(1)参与者集合;(2)全历史集合;(3)参与者函数;(4)偏好。

如果我们把全历史表示成一个行动序列(a1, a2,…, a K)(K为自然数,当K→∞时,就表示无穷动态博弈),那么(a1, a2, …, a m),其中m K≤,就称为全历史(a1, a2, …, a K)的子历史(Subhistory)。

当m < K时,(a1,a2, …, a m)就是全历史(a1, a2, …, a K)的真子历史(Proper subhistory)。

博弈论第4章答案

博弈论第4章答案

R R M 4.1.a 标准式1↖2 L ’ R ’4,1 0,0 3,0 0,1 2,2 2,2纯战略纳什均衡:( L, L ’ ) ( R, R ’ )子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ )精炼贝叶斯纳什均衡:( L, L ’ )4.1.b 标准式1↖2 L ’ M ’ R ’1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4纯战略纳什均衡:( R, M ’ )子博弈精炼纳什均衡:( R, M ’ )精炼贝叶斯均衡: 没有4.2标准式1↖2 L ’ R ’2,2 2,2 3,0 0,1 0,1 3,0六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。

求混合战略精炼贝叶斯均衡:设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p −−参与者2选择L ’和R ’的概率分别为,(1)q q −在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212120*1*1*0*p p p p p p +=+⇒=给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则:12121212[3*0*(1)][0*3*(1)]2*(1)41:**,*112p q q p q q p p p p p p q +−=+−=−−====又 联立得 所以 L LML LM L RL4.3答案(见4.5)4.4表示方法第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号;第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a )[(,),(,),1/2][(,),(,),1/2][(,),((1),),1/2][(,),(,),1,0]R R u u p R R d u p R R d u u p L R u d p q αα><+−===(b )[(,),(,),1/2,2/3][(,),(,),1,0][(,),(,),0,1]L L u u p q L R d u p q R L u d p q =<====中文版习题4.5答案(a )[(,),(,),1/3,1/2]R R u d p q >=(b )12121212[(,,),(,),1/3,1/2][(,,),(,),1/2,0]L L L u u p p q q L L R u d p p q q ==+<==+=。

第四章博弈论

第四章博弈论

2、重复博弈类型:
有限次:如果一个博弈G,只重复进行和T次,则称该重复 博弈为有限T次重复博弈。 无限次:如果一个博弈无限次重复进行下去,则称该博弈为 无限次重复博弈。现实中是没有无限次博弈的,但可以将不知 道何时结束的博弈看作为无限次博弈。如雇用、婚姻、邻里关 系等。
3、策略、子博弈和均衡路径 策略:同动态博弈一样,博弈方的一个策略就是每次轮到 某博弈方行动阶段时,针对每种情况(以前阶段的结果),的
作,如果对方不合作,则永远不合作。
可以证明当贴现因子 很大时,也就是说,由于利率 很低,未来收益对博弈双方来说值得现在予以重视。从 而牺牲现在而追求未来。 因为博弈在某阶段前一直是(合作,合作),关键是后
继都者的选择。假如第一阶段厂商1为合作触发策略,厂 商2如何决策呢?
如果厂商2采用(不合作),则以后的代价是永不合作。
而不仅仅考虑某一阶段的博弈得益。
然而,重复博弈的每次重复是有先后顺序的,这意味着不 同阶段的得益有时间上的先后之分。因此,得益的时间价值 就不得不考虑。解决的方法是引入贴现。 贴现系数为:
1 1 r
其中r为利率。
T次重复博弈,某一均衡下各阶段的得益分别 为: 1 , 2 ... T ,贴现率为 ,则得益的现值 为: 1 2 3
0,6
3,3 2,0
0,2
0,2 1,1
该博弈两个纯策略纳什均衡(M,M)和(L,L)。 显然在一次博弈中均衡为(M,M)。当博弈重复时, 会出现高得益的(H,H)吗?
若博依下策略进行: 厂商1:第一次选H,若结果为(H,H),则第二次选M, 否则第二次选L,成为共同知识。 厂商2:同厂商1。 在这种策略下,两次重复博弈和均衡路径一定为第阶 段(H,H),第二阶段(M,M)。

博弈论第四章习题

博弈论第四章习题

第四章习题一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何?答:因为这是零和博弈,结论比较具体。

重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。

因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。

二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。

答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。

效率也比较低。

商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。

效率也比较高。

三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。

无限次重复博弈的效率往往高于有限次重复博弈。

当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。

启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。

四、判断下列表述是否正确,并作简单讨论:(1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

答:不一定。

对于有两个以上纯策略纳什均衡的条件下就不一定。

如“触发策略”就不是。

(2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。

答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。

(3)无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。

答:错。

如严格竞争的零和博弈就不优于。

(4)无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。

答:正确。

合谋生产垄断产量是有条件的,由贴现率来反映,当不满足条件时,就不能构成激励。

(5)如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率 充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4 非完全信息动态博弈4.1 精炼贝叶斯均衡概述例简单的非完全信息动态博弈参与人1的类型t为个人信息。

参与人2 不知道t,但知道t的概率分布。

博弈的时序:(1)参与人1选择行动a1∈A1;(2)参与人2观察a1,选择a2∈A2博弈的收益:u1 (a1, a2, t ), u2 (a1, a2, t )u1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2例:1 RL M 13p 2 1- pL'R'L'R'2 0 0 01 0 1 2标准式表示参与人2L'R'L2,10,0参与人1 M0, 20, 1R1, 31, 3纯战略纳什均衡: (L,L'), (R,R')均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡:要求1 参与人必须有一个推断(belief).要求2 参与者的战略必须满足序贯理性(sequentially rational).定义处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.处于均衡路径之外(off the equilibrium path)的信息集: 在均衡战略下,博弈不会到达此集.要求 3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明参与人1的类型空间:{ t1,t2,t3,t4 }行动空间:A= { L,R}推断p i : 观察到L 后,参与人1的类型是t i 的概率。

推断q i : 观察到R 后,参与人1的类型是t i 的概率。

p 1 + p 2 + p 3 + p 4 = 1q 1 + q 2 + q 3 + q 4= 1如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。

参与人2对p i 与 q i 的推断:p 1 = 3.02.02.0+= 0.4, p 2 = 3.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,要求 4 在处于均衡路径之外的信息集上, 可能情况下,推断由贝叶斯法则和参与人的均衡战略决定。

原文:At information sets off the equilibrium path, beliefs are determined by Bayes ’ rule and the players ’ equilibrium strategies where possible.精炼贝叶斯均衡(perfect Bayesian equilibrium):在一个非完全信息的动态博弈中,满足要求1 – 4 的战略与推断构成的均衡。

例不满足要求4的情形。

3个参与人的博弈。

1 A 2D 02L R[p] [1 –p]3L'R'L'R'1 3 0 02 3 1 11 32 1子博弈精炼纳什均衡: (D, L, R')另有战略(A, L, L')和推断p = 0:----纳什均衡----满足要求1-3.----不是精炼贝叶斯均衡: 不满足要求4: p= 0 与2的战略不相容.例要求4中“不可能”的情形。

1 AD2 A'L R1-q1-q2[q1] [q2]3L'R'L'R'如果(A, A', L') 是均衡,则参与人3的战略要针对参与人2的L 或R。

参与人3的推断必须是p = q1/(q1 + q2)但是参与人2选A',q1 + q2 =0, 因此无法计算p。

4.2 信号博弈4.2.A 信号博弈中的精炼贝叶斯均衡信号博弈的参与人:信号发送者S,接收者R。

信号博弈的时间顺序自然按照概率分布为S产生一个t i∈TS观察t,并选择m j∈MR观察m并选择a k∈A收益U S(t i,m j,a k)和U R(t i,m j,a k)信号博弈的例T = {t1, t2}, M = {m1, m2}, A = {a1, a2},Pr{t 1} = p , Pr{t 2} = 1 - p 。

发送者战略: 在类型为t 1时发出的信号与t 2时发出的信号:{m 1, m 1}, {m 1, m 2}, {m 2, m 1}, {m 2, m 2}混同(pooling)战略: 所有的类型发出相同的信号:{m 1, m 1}, {m 2, m 2}分离(separating)战略:不同的类型发出不同的信号:{m 1, m 2}, {m 2, m 1}接收者战略: 在收到信号m 1时与信号m 2时选择的行动: { a 1, a 1}, {a 1, a 2}, {a 2, a 1}, {a 2, a 2}1,3,12,2,03,1,01,2,2信号要求 1: 接收者在观察信号m j 后,必须对发送m j 的类型有一个推断∑∈T t i μ( t i ∣m j ) = 1信号要求 2R : 对每一 m j , 接收者的行动 a *(m j ) 必须在给定推断 μ( t i | m j ) 后,最大化他的期望效用,A a k ∈max ∑∈T t i μ( t i | m j ) U R (t i , m j , a k )信号要求 2S : 对每一t i , 在给定a *(m j ) 后,发送者的信号 m *(t i )必须最大化他的效用Mm j ∈max U S (t i , m j , a *(m j )) 信号要求 3: 对每一 m j , 如果存在 t i 使得 m *(t i ) = m j , 则接收者的推断:μ( t i | m j ) =∑)()(i i t p t p 精炼贝叶斯均衡: 战略 (m *(t i ), a *(m j ))和推断 μ(t i | m j ) 满足信号要求 (1), (2R), (2S),和 (3)。

为什么没有要求4?例 T = {t 1, t 2, t 3, t 4}, M = {m 1, m 2, m 3}如果在均衡中,发送者的战略:m *(t 1) = m 1,m *(t 2) = m 1,m *(t 3) = m 2,m *(t 4) = m 2则m 3处于均衡路径以外,若用贝叶斯公式,分母为0。

例 (Figure 4.2.2)1, 2,14, 0,02, 1,00, 1,2求精炼贝叶斯均衡:对4种情况逐一分析。

1. 混同于L ?发送者: (L, L).如果为均衡,p = 0.5接收者收益分别为: 3.5(u),或0.5(d)。

将选择u。

发送者收益分别为:1 (t1),2 (t2)如果发送者发送R, 当q + (1 –q)×0 ≤q×0 + (1 –q)×2q≤ 2/3接收者将选择d. 发送者收益为0(t1),和1(t2), 小于发送L时分别所得。

均衡: { (L, L), (u, d), p = 0.5, q≤ 2/3}2. 混同于R?发送者: (R, R)如果是均衡,q = 0.5.接收者的收益: 0.5 (u), 1 (d)。

他选择d发送者的收益分别为: 0 (t1), 1 (t2)如果发送者在t1时发送L, 收益至少为1。

不是均衡。

3. 分离(L, R)?发送者: (L, R).接收者推断:p = 1 , q = 0接收者战略: (u, d)。

发送者的收益分别为:1 (t1), 1 (t2)但是对t2, 如果发送者发送L, 接收者选择u, 发送者的收益将为2。

发送者在t2时,将发送L。

不是均衡。

4. 分离(R, L)?发送者: (R, L)。

接收者推断:p = 0, q = 1,战略:(u, u)发送者的收益分别为:2(t1), 2 (t2)如果发送者不这样, 收益将为1(t1发送L),和1(t2发送R)。

分离精炼贝叶斯均衡:[(R, L), (u, u), p = 0, q = 1]4.2.B就业市场的信号博弈。

1.自然决定工人的能力η,以概率q为高H,以概率1 –q为低L。

2.工人了解自己的能力,选择一个教育水平e≥ 0,教育的成本为c(H,e)或c( L,e)。

假设对于获得相同的教育,低能力工人的边际成本要高于高能力的工人的,即c e(L, e ) > c e ( H, e)c e c e(L, e )c e ( H, e)e3.企业观察e,决定工人的工资w。

工人的收益w–c( η,e)工人的无差异曲线I(e, w) = w–c( η,e)斜率 k = -//dI de dI dw= c e w I LI He企业的收益 y ( η,e ) – w假设企业是完全竞争的,即w = y ( η,e )wy (H , e )w H *y (L , e )w L *e L * e s e H *具有能力η 的工人选择教育水平e 使得emax w – c (η, e ) s . t . y (η, e ) = w最优解表示为e *(η),对应的工资w *(η) = y [η, e *(η)]低能力工人不冒充高能力工人的情形,即w *(L ) – c [L , e *(L )] > w *(H ) – c [L , e *(H )]ww H*w L*e L* e s e H*在有冒充的情形,即w*(H) –c[L, e*(H)] > w*(L) –c[L, e*(L)]wy(H, e s )w H*w L*e L* e H* e s e' e1.混同均衡只有存在冒充时,才可能有混同均衡。

两种工人选择同一种教育水平e p,公司观察到e p后的判断为p(H|e p) = q支付的工资为w p = qy (H, e p) + (1 –q) y(L, e p) (4.2.2)对于不在均衡路径上的判断,可以是p(H|e) = 0 e≠e p工资支付为w(e) = y(L,e) e≠e pwy(H, e s )w L*e L* e p e'e''e s e其他的混同均衡:e0: e p < e0 < e',类似给出公司的判断及工资的支付,也构成完备贝叶斯均衡。

另一种混同均衡:e p,但公司对不在均衡路径上的判断不同。

0 e≤e"e≠e pμ(H| e) = q e = e pq e > e"公司的工资支付为y(L, e) e≤e"e≠e pw(e) = w(e p ) e = e pw(e) e > e"2.分离均衡(1)不存在冒充的时候e(L) = e L*,e(H) = e H*,公司的判断:p(H| e) = 0,e < e H*p(H| e) = 1,e≥e H*公司支付工资w (e) = y(L,e H*),e < e H*w (e) = y(H,e L*),e≥e H*这是完备贝叶斯均衡。

相关文档
最新文档