完全信息动态博弈习题(一)
完全完美信息动态博弈
• 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因 此是真正稳定的。
• 子博弈是倒着看的,从最小的子博弈开始我们就找稳定策略组合, 直至最开始的节点,那么当然是稳定的了。大家会发展这正是逆推 归纳法。
• 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
• 战略空间是连续函数:产量。
(-2,5) 制止
仿冒
A 不仿冒
B 不制止 (5,5)
(2,2)
(10,4)
4.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划,不能分割。 • 结果是上述“计划型”策略的策略组合,构成一条路径. • 得益对应每条路径,而不是对应每步选择、行为.
• 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先 选择、行为的博弈方常常更有利,有“先行优势”。
动)开始。这里参与者1面临的选择是L’’。那么在第二阶段,参与者2预测 到一旦博弈进入到第三阶段,则参与者1会选择L’’ ,这会使2的收益为0, 从而参与者2在第二阶段的选择为:L‘可得收益1, R“可得收益0,于是 L‘是最优的。
• 这样在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’, 使参与者1的收益为1,从而参与者1在第一阶段的选择是:L收益为2, R收益 为1,于是L是最优的。
乙
借
不借
甲
分
(2,2) 打
(1,0) 不分
乙
不打
(-1,0)
(0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
• 第一个图中,通过法律手段使乙的利益得到保障,这样乙的完整策略: “第一阶段借,如果第二阶段甲不分,第三阶段打官司。”甲的完整策 略是:“第二阶段分。”这是这个3阶段动态博弈的解。
博弈论复习题(1)
1.设一四阶段两博弈方之间的动态博弈如图所示。
试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡策略组合和博弈的结果。
2.假设一个工会是一个寡头垄断市场中所有企业唯一的劳动力供给者,就像汽车工人联合会对于通用、福特、克莱斯勒等大的汽车厂家。
令博弈各方行动的时间顺序如下:(1)工会确定单一的工资要求w ,适用于所有的企业(2)每家企业i 了解到w ,然后同时分别选择各自的雇佣水平L i ;(3)工会的收益为(w-w α)L ,其中w α为工会成员到另外的行业谋职可取得的收入,L=L 1+…L n 为工会在本行业企业的总就业水平;企业i 的利润为π(w ,L i ),其中决定企业i 利润水ABB A h g (2,4)(8,5)(3,6)(4,3)b (5,3)a c d f e平的要素如下。
所有企业都有同样的生产函数:产出等于劳动力q i=L i。
市场总产出为Q=q1+…+q n时的市场出清价格为p(Q)=a-Q。
为使问题简化,假设企业除了工资支出外没有另外的资本。
求出此博弈的子博弈精炼解。
在子博弈精炼解中,企业的数量是如何影响工会的效应的?为什么?(吉本斯2.2节 2.7答案)3.下图所示的同时行动博弈重复进行两次,并且第二阶段开始前双方可观测到第一阶段的结果,不考虑贴现因素。
变量x大于4,因而(4,4)在一次性博弈中并不是一个均衡收益。
对什么样的x,(双方参与者同时采取)下述战略是一个子博弈完美纳什均衡?第一阶段选择Q i,如果第一阶段的结果为(Q1,Q2),在第二阶段选择P i;如果第一阶段的结果为(y,Q2),其中y≠Q1,第二阶段选择R i;如果第一阶段的结果为(Q1,z),其中z≠Q1,第二阶段选择S i;如果第一阶段结果为(y,z),其中y≠Q1,且z≠Q2,则在第二阶段选P iP2 Q2 R2 S2P1Q1R1S1(2.10吉本斯)思路:逐个分析上述的四种情形:第一种情形,第一阶段选择Qi,第二阶段选择Pi,即双方均采取合作的策略,得益均为6;第二种情形和第三种情形下,实际上有一方是采取了不合作,其得益为x,另一方即利益受损方得益为2;第四种情形实际上是双方都不采取合作的策略,而根据题目要求,对于x,下述战略是一个子博弈精炼纳什均衡,所以x必须小于双方均合作时的收益6,否则第一种情形不会出现,因为既然x>6了,双方均会选择不合作而使情形一不会出现。
《博弈论与信息经济学》习题库
上海师范大学商学院任课教师:刘江会2010-2011学年第一学期《博弈论与信息经济学》习题一.判断下列表述是否正确,并作简单讨论:1.有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳5.如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率 充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。
答:这就是无限次重复博弈的民间定理。
6.触发策略所构成的均衡都是子博弈完美纳什均衡。
答:错误。
触发策略本身并不能排除重复博弈中不可信的威胁和承诺,因此由触发策略构成的不一定是子博弈完美纳什均衡。
7.完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程,但清楚博弈的得益。
答:不一定,不是所有博弈方都不清楚博弈的进程,只要有一个博弈方都不答:不能从多节点信息集开始,因为多节点必然分割信息集。
11.不完美信息指至少某个博弈方在一个阶段完全没有博弈进程的信息。
答:不是完全没有博弈进程的信息,而是没有完美的信息,只有以概率判断形式给出的信息。
12.海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。
答:错误。
即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。
中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。
因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。
二.选择题1.利用扩展式表述一个博弈不需要阐述如下哪一项()A. 参与人B. 战略空间C. 支付组合D. 行动顺序2.一个博弈称之为完美信息博弈,如果A. 任意参与人的任意信息集都是单结的B. 该博弈是完全信息动态博弈C. 所有参与人都只有一个信息集D. 该博弈是一个静态博弈3.子博弈精炼纳什均衡的实质是A. 所有参与人都是理性的B. 参与人行动存在先后顺序C. 重复剔除的占优均衡D. 以上都不对4.关于战略式与扩展式,以下命题正确的是10.图1所表述的双人博弈是图1 双人博弈树A. 完美回忆博弈B. 不完全信息博弈C. 完美博弈D. 静态博弈11.在图1所示博弈中,参与人1、2的信息集个数分别是A. 5,2B. 3,2C. 3,1D. 2,212.在图1所示博弈中,参与人1、2的纯战略个数分别是A. 32,4B. 8,4C. 4,4D. 2,413.图1所示博弈的子博弈与后续博弈个数分别是A. 3,5B. 7,7C. 5,5D. 1,314.图1所示博弈的子博弈精炼纳什均衡结果是A. (A,F,C)B. (B,E,C)C. (B,F,C)D. (A,E,C)15.海萨尼公理是A. 某些参与人不知道自然的选择,但假设所有参与人都知道自然选择的概率B. 假设所有参与人都知道自然的选择C. 某些参与人不知道自然的选择,但假设部分参与人知道自然选择的概率10扩展型参考答案:(1)是完全且完美信息动态博弈。
第二节完全信息动态博弈(1)
一 博弈扩展式表述
只包含一个决策结的信息集称为单结信息集, 如果博弈树的所有信息都是单结的,该博弈称 为完美信息博弈。
完美信息博弈意味着博弈中没有任何两个参与 人同时行动,且后行动者知道所有前序行动 (任何两个决策结都无虚线相连)。
自然总是假定是单结的,因为自然在参与人决 策之后行动等价于自然在参与人之前行动但参 与人不能观测到自然的行动。
第二节 完全信息动态搏弈 -子博弈精炼纳什均衡
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例
一 博弈扩展式表述
战略式主要用于描述和分析静态博弈,给出的是 参与人有什么战略可供选择,用博弈支付矩阵表示; 扩展式主要用于描述和分析动态博弈,给出的是参与 人的相机行动规则(依据条件选择行动),用博弈树 表示。
如果市场上只有一栋楼需求大时可卖18亿需求小时可卖11亿博弈战略表述40004000800000800000不开发开发商a开发不开发开发30003000100000100000不开发开发商b开发商a开发不开发开发开发商b需求小的情况需求大的情况博弈的战略式表述一博弈扩展式表述由战略组合决定的每个参与人的支付进入者进入不进入0300在位者市场进入阻挠博弈树不可置信威胁合作4050斗争100开发不开发12121212开发不开发开发不开发开发不开发开发不开发4480331008000100参与人abn战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结决策结结终点结结初始结信息集一博弈扩展式表述博弈树的基本构造包括决策结和终点结两类
N
大
小
A
开发 不开发
1/2 1/2
A
开发
完全信息动态博弈练习题
1、空中客车与波音两家公司在研发新型商业客机方面展开激烈竞争。
波音公司在研发过程中已经处于领先地位,而空中客车正考虑是否参与这场竞争。
假如空中客车不参与竞争,那么它的收益为0,而波音公司将会获得垄断地位,获得10亿美元的收益。
假如空中客车决定参与竞争,则波音公司就不得不决定与空中客车进行和平竞争,还是打价格战。
如果和平竞争,双方各自获得3亿美元的收益;如果打价格战,则客机价格下滑,双方都无法收回研发成本,各损失1亿美元。
请画出博弈树,找出子博弈精炼纳什均衡。
2、考虑可乐行业,可口可乐与百事可乐是两家主要公司,市场规模为80亿美元。
每家公司可以选择是否做广告,广告成本为10亿美元;如果一家企业做广告而另一家不做,则前者强的所有市场;如果两家企业都做广告,则各占一半市场,并付出广告成本;如果两家公司都不做广告,也各占一般市场,但不支付广告成本。
(a)画出博弈支付表,并找出当两家公司同时行动时的纳什均衡;(b)假定博弈序贯进行,画出可口可乐公司率先行动时该博弈的博弈树。
(c)在(a)、(b)均衡中,从可口可乐与百事可乐的共同观点来看,哪一个是最佳的,这两家公司要怎样才会有更好的结果?3、假设巨人、太阳神、弗里达三大百货公司正考虑在波士顿两个新的大型购物中心中的一个开设分店。
其中,城市购物中心靠近人口密集的富人区,规模不大,最多只能以两家大百货商场为龙头。
而郊区购物中心地处较远的郊外,相对较穷,能以三家百货商场为龙头。
三家百货公司都不想在两个地方同时开店,因为顾客有相当部分重复,两处都开店无疑是同自己竞争。
每家百货公司都不愿意在一个地方独家经营,拥有多家商场的购物中心能够吸引更多的顾客,顾客总量的增加自然会使商场利润增加。
此外,它们都偏向争夺富人群体的城市购物中心,所以它们必须在城市购物中心(如果这个尝试失败了,它们将会尝试在郊区建立商场)和郊区购物中心(不争取城市市场而直接进入郊区市场)之间作出选择。
完全信息动态博弈习题(一)
完全信息动态博弈习题(一)1、在一个由三个寡头垄断者操纵的市场上,反需求函数由()Q a Q P -=给出,此处321q q q Q ++=,i q 表示企业i 生产的产量。
每一企业生产的边际成本函数为常数c ,并且没有固定成本。
企业按以下顺序进行产出决策:(1)企业1选择01≥q ;(2)企业2和3观测到1q ,并同时分别选择2q 和3q 。
试求出此博弈的子博弈精炼解。
解:采用逆向归纳法。
(1)在第二阶段企业2和企业3决策:()[]22321200222cq q q q q a Max Max q q ----≥≥=ππ()[]33321300333cq q q q q a Max Max q q ----≥≥=ππ 求出反应函数为:⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧--=--=331312q c a q q c a q(2)第一阶段企业1的决策:()[]113211cq q q q q a Max ----π 一阶条件:0232111=----=∂∂c q q q a q π, 将331312q c a q q c a q --=--=带入可求得:21ca q -=,632ca q q -==2、假设家长和孩子进行一个博弈:令收入为p I (家长的收入)和c I (孩子的收入)是外生给定的,第一,孩子决定收入c I 中的多少用于储蓄S 以备将来,并消费掉其余部分B I c -;第二,家长观测到孩子的选择S 并决定给予一个赠与额B 。
孩子的收益(支付)为当期和未来的效用之和:()()B S U S I U c ++-21;家长的收益(支付)为()()()[]B S U S I U k B I V c p ++-+-21(其中k>0反映出家长关心孩子的福利)。
假定效用函数1U 、2U 和V 递增并且严格凹,试证明:在逆向归纳解中,孩子的储蓄非常少,从而可诱使家长给予更高的赠与(即如果S 增加,并使B 相应减少,家长和孩子的福利都会提高)。
第五章 完全信息动态博弈在管理中的应用
第五章完全信息动态博弈在管理中的应用一.如何使自己的承诺变得可信——做一个非理性的人1.一个有趣且发人深思的案例:美苏冷战博弈冷战时期(1949——1989)美苏为争夺对欧洲的控制权发生冲突。
假设美国不在欧洲部署军队。
此时,如果苏联不发动进攻,则双方各得3。
如果苏联发动进攻,美国不反击,则苏联得5,美国得1;如果美国反击,则各得-2。
问题1:一旦苏联发动攻击,美国会选择反击吗?本博弈的结局是什么?问题2:如果美国总统在欧洲部署少量的部队(所谓“用来战斗,人数太少;如果死伤,人数又太多”),能够有效地阻止来自苏联的攻击吗?结论:看似高度非理性的选择实际上是高度理性的。
2.减少自己的选择(1)减少自己的选择又称“破釜沉舟”或称“自断退路”。
Cortez攻占Aztecs曾经使用此招,但比中国迟了一千多年。
色诺芬也许从另一个角度认识到了破釜沉舟。
(2)破釜沉舟能够成功,关键在于这种做法可以使博弈对手知道自己的承诺是可信的(如肯定不会后退,不会背弃盟友等)。
所以,必须让自己的对手知道你在破釜沉舟。
(3)破釜沉舟在商业领域有着非常广泛的应用:如,摧毁自己的生产设施;有能力的员工在与公司进行薪水谈判时,到处声称一旦不加薪就离职;在其他商业谈判中也可以使用不留后路这招。
3.交出你的实施控制权(1)案例:蜈蚣博弈甲乙二人前面各有一只碟子,里面会装有一定数量的钱。
甲先行动,如果甲选择把里面的钱抓走,则游戏结束,此时甲获得2元钱,乙获得1元钱;如果甲选择不抓,则游戏进入下一轮,由乙作决定,如果乙选择把里面的钱抓走,则游戏结束,此时甲获得0元钱,乙获得3.5元钱;如果乙选择不抓,则游戏进入下一轮,由甲作决定,如果甲选择把里面的钱抓走,则游戏结束,此时甲获得4元钱,乙获得1元钱;如果甲选择不抓,则游戏也结束,此时各得3元钱。
请问:这个博弈最后的结局是什么?蜈蚣博弈相当于静态博弈中的囚徒困境,这个例子在经济学与公共政策中有着极为广泛的应用。
第三章完全且完美信息动态博弈一
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略:各博弈方在整个博弈中轮到选择的每个阶段, 针对前面阶段的各种情况做作相应选择和行为的完 整计划。
➢ 例如:“仿冒企业A在第一阶段选择仿冒,如果第 二阶段B制止,第三阶段就不仿冒,否则第三阶段 继续仿冒” “被仿冒企业B,当第一阶段A仿冒时 第二阶段不制止,第三阶段A继续仿冒时第四阶段 制止”
3.1.2 动态博弈(DG)的特征
动态博弈的策略及结果
➢ 策略组合:由不同博弈方的这种计划组成的组合。 各博弈方的策略组合可能会形成一条联结各个阶 段的路径。
➢ 动态博弈的结果:各个博弈方的策略及策略组合、 实现的博弈路径和各博弈方的得益。
3.1.2 动态博弈(DG)的特征
动态博弈中博弈方地位的非对称性
乙
乙 借 不借
(0,4) (0,0)
(c)
乙
借 不借
甲 (0,0)
分
不分
(2,2) (-1,4)
(b)
借
不借
甲 (0,0)
分
不分
(2,2) 打
乙 不打
(-2,0)
(-1,4)
3.3 子博弈完美纳什均衡分析
一个值得关注的地方
➢ 开金矿博弈中,子博弈完美纳什均衡组合包含 第二、三阶段的选择,而实际上博弈不会进行 到第二、第三阶段,这称为“不在均衡路径上 的选择”
缺乏稳定性的根源在于不能排除“不可信”行为设 定,不能解决相机选择引起的可信性问题。所以需 要引入更强的均衡,除了满足纳什均衡,还要排除 不可信设定。
3.2.3逆推归纳法
逆推归纳法(Backwards Induction)
信息经济学部分习题解答
p
(3) 企业2先决策
根据逆推归纳法,先求企业1的反应函数
1 2 p a q c0 pa q c
p
代入企业2的利润函数,得
2 q b 2 p q b 2 a c q
再求企业2的反应函数,得
2 2 qba0 qab
解:根据问题的假设可知各企业的利润函数为
i piq ciqaqijn iqjqiciq
其中i=1,…,n。
将利润函数对qi求导并令其为0得:
i
qi
n
a
ji
qj c2qi 0
解得各企业对其他企业产量的反应函数为:
qi a n qj c/2
ji
根据n个企业之间的对称性,可知 q1*q2 *qn * 必然成立。代入上述反应函数可解得:
9
9
8.下表所示博弈重复两次,第二次开始之前第
一次的行动能被双方观察到。假定参与人对未 来收入不贴现。问题:支付向量(4,4)能否作为 子博弈精炼均衡结果在第一阶段出现(假定参与 人只选择纯战略)?如果能,请给出支持这一结 果的战略;如果不能,解释为什么。
L
C
R
T
3,1
0,0
5,0M2,1Fra bibliotek1,2
3,1
2 完全信息动态博弈
1.参与人1(丈夫)和参与人2(妻子)必须独立地决定出门时是否带 伞。他们知道下雨和不下雨的可能性相同(即50:50)。支付函数 如下:如果只有一人带伞,下雨时带伞者的效用为-2.5,不带 伞者(搭便车者)的效用为-3;不下雨时带伞者的效用为-1,不带 伞者的效用为0;如果两人都带伞,下雨时每人的效用为-2,不 下雨时每人的效用为1;如果两人都不带伞,下雨时每人的效 用为-5,不下雨时每人的效用为1。给出以下两种情况下的扩展 式表述(博弈树)和战略式表述:(1)两人出门前都不知道是否会 下雨,并且两人同时决定是否带伞(即每一方在决策时都不知道 对方的决策);(2)两人出门前都不知道是否会下雨,但丈夫先 决策,妻子在观察到丈夫是否带伞后才决定自己是否带伞;(3)
经典:博弈论-完全信息动态博弈
2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素: (1) 参与人集合:i=1,2,…,n。此外,用N代表虚拟
参与人——自然。 (2) 行动顺序:谁在什么时候行动。 (3) 参与人的行动空间: (4) 参与人的信息集: (5) 参与人的策略集: (6) 参与人的支付函数: (7)外生事件的概率分布。
博弈的收益矩阵
(1)高需求
开发 开发商A 不开发
(2)低需求
开发 开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
-1, -1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分: 静态博弈:两个开发商同时决策,或后决策者不
能观察到先行动者的行动。 动态博弈:博弈有先后顺序,且后决策者能观察
完全信息动态博弈图示:N A B
开发 (2,2)
高需求
○
A
N
低需求
开发 不开发 开发 不开发
不开发 (4,0)
开发 (0,4) B 不开发 (0,0)
开发 (-1,-1) 不开发 (1,0)
开发 (0,1) 不开发 (0,0)
(4)不完全信息动态情形:ANB
开发商A不清楚市场的需求状态,决定是否开发; 开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。 按开发商是否知道市场需求状态分:
完全信息博弈:若两个开发商都知道市场需求状 态(高需求或低需求)。
不完全信息博弈:由自然决定市场的需求状态, 两开发商不知道。 共同知识:在市场各种可能状态和各开发商不同策 略组合下的得益矩阵是双方的共同知识。
博弈论复习题及答案
可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位;(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35;画出两企业的损益矩阵求纳什均衡。
9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。
如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。
如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。
(1)将这一市场用囚徒困境的博弈加以表示。
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
;若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。
若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。
由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。
12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡(2)两厂商合作的结果是什么答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。
若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A 企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A 企业可获得30万元利润,B企业可获得6万元利润。
博弈论复习题及答案
博弈论2、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)如果双方都不涨价,各得利润10单位;(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;求纳什均衡。
博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解。
3、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字是大猪的得益,第二个数字是小猪的得益):小猪按等待大猪按 5,1 4,4等待 9,-1 0,0求纳什均衡。
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。
即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。
这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。
所以纳什均衡是(大猪按,小猪等待)。
4、根据两人博弈的支付矩阵回答问题:a bAB(1)写出两人各自的全部策略,并用等价的博弈树来重新表示这个博弈(6分)(2)找出该博弈的全部纯策略纳什均衡,并判断均衡的结果是否是Pareto有效。
(3)求出该博弈的混合策略纳什均衡。
(7分)(1)策略甲:AB乙:ab博弈树(草图如下:(2)Pure NE (A, a); (B, b)都是Pareto有效,仅(B, b)是K-H有效。
第3章 博弈论与信息经济学--完全信息动态博弈
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。
博弈论复习题及答案
是参与人从博弈中获得的效用水平,它是所有参与人策略或行动的 函数,是每个参与人很关心的东西; 结果(outcome) 是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来 表示; 均衡(equilibrium) 是所有参与人的最优策略或行动的组合。 静态博弈 指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采 取什么样的行动; 动态博弈 指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选 择的行动。 博弈 就是一些个人、队组或其他组织,面对一定的环境条件,在一定的 规则下,同时或先后,一次或多次,从各自允许选择的行为或策略 中进行选择并加以实施,各自取得相应结果的过程。 零和博弈: 也称“严格竞争博弈”。博弈方之间利益始终对立,偏好通常不同 变和博弈: 零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问 题的重要性。 完全信息静态博弈
l已知q1ac在前面我们分析同时行动的古诺博弈中得出的r2q1和上式完全一致两者的不同之处在于这里的r2q1是企业2对企业1已观测到的产量的真实反应而在古诺的分析中r2q1是企业2对假定的企业1的产量的最优反应且企业1的产量选择是和企业2同时作出的
博弈论
判断题(每小题1分,共15分)
囚徒困境说明个人的理性选择不一定是集体的理性选择。(√ ) 子博弈精炼纳什均衡不是一个纳什均衡。(× ) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博 弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。 (× ) 上策均衡一定是纳什均衡。 (√) 在一个博弈中只可能存在一个纳什均衡。 (×) 在一个博弈中博弈方可以有很多个。 (√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。 (× ) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。 (× ) 上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈 就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行
2.1_完全信息动态博弈
例如房地产开发博弈: a、假设B在决策时并不确切的 知道自然的选择。见图2.3 b、B知道自然的选择,但不知 道A的选择,见图2.4 完美信息博弈:指博弈树的所 有信息集都是单结的。它意味 着没有任何两个参与人同时行 动,并且所有后行动者能确切 的知道前行动者的行动,及大 家见到的自然行动。
图 2.3
“共同知识”( common knowledge)
指的是“所有参与人知道所有参与人知道,所有参与人知道所有参与人知道 所有参与人知道……”的知识。
在现实有许多博弈中,即使所有参与人“共同”享 有某种知识,每个参与人也许并不知道其他参与人 知道这些知识,或者并不知道其他人知道自己拥有 这些知识。这种情况被称为“一致信 念”(concordant beliefs)。
2、扩展式除包括以上三要素外,更重要的是其
“扩展”,主要指参与人的战略空间。战略对 应于参与人的相机行动规则。
具体来讲,博弈的扩展式表述包括以下因素: (1)参与人集合:i=1,…,n;此外,用N代表虚拟参 与人“自然”; (2)参与人的行动顺序:谁在什么时候行动; (3)参与人的行动空间:在每次行动时,参与人有些什 么选择; (4)参与人的信息集:每次行动时,参与人知道些什么; (5)参与人的支付函数:在行动结束之后,每个参与人 得到些什么(支付是所有行动的函数); (6)外生事件(即自然的选择)的概率分布。
琼 斯 (大,大) (大,小) (小,大) (小,小) -1 , -1 1,1 (E3)
史 密 斯
大 小
2 , 2(E1)
-1 , -1
2 , 2(E2)
1,1
-1 ,-1
-1 , -1
总的表述:
均衡 E1 E2 E3 策略
({L },{L , L})
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息动态博弈习题(一)
1、在一个由三个寡头垄断者操纵的市场上,反需求函数由()Q a Q P -=给出,此处321q q q Q ++=,i q 表示企业i 生产的产量。
每一企业生产的边际成本函数为常数c ,并且没有固定成本。
企业按以下顺序进行产出决策:(1)企业1选择01≥q ;(2)企业2和3观测到1q ,并同时分别选择2q 和3q 。
试求出此博弈的子博弈精炼解。
解:采用逆向归纳法。
(1)在第二阶段企业2和企业3决策:
()[]
2232120
0222cq q q q q a Max Max q q ----≥≥=ππ
()[]3332130
0333cq q q q q a Max Max q q ----≥≥=ππ 求出反应函数为:⎪⎪⎭
⎪
⎪
⎬⎫
⎪⎪⎩⎪⎪⎨⎧--=--=331312q c a q q c a
q
(2)第一阶段企业1的决策:
()[]113211cq q q q q a Max ----π 一阶条件:023211
1
=----=∂∂c q q q a q π, 将3
3
1
31
2q c a q q c a q --=--=
带入可求得:
21c
a q -=,632c
a q q -==
2、假设家长和孩子进行一个博弈:令收入为p I (家长的收入)和c I (孩子的收入)是外生给定的,第一,孩子决定收入c I 中的多少用于储蓄S 以备将来,并消费掉其余部分B I c -;第二,家长观测到孩子的选择S 并决定给予一个赠与额B 。
孩子的收益(支付)为当期和未来的效用之和:()()B S U S I U c ++-21;家长的收益(支付)为()()()[]B S U S I U k B I V c p ++-+-21(其中k>0反映出家长关心孩子的福利)。
假定效用函数1U 、2U 和V 递增并且严格凹,试证明:在逆向归纳解中,孩子的储蓄非常少,从而可诱使家长给予更高的赠与(即如果S 增加,并使B 相应减少,家长和孩子的福利都会提高)。
解:采用逆向归纳法,先最大化家长的收益(支付):给定的孩子的行动S ,来选择自己的行动B,
Max ()()()[]B S U S I U k B I V c p ++-+-21
一阶条件: ()()B S kU B I V p +'=-'2
反应函数满足: 0//122*<⎪⎭
⎫ ⎝⎛''-"-"=<-V kU kU dS dB , 即,孩子储蓄减少,家长给予更高的赠与。
接着最大化孩子的收益:给定反应函数B*,来选S :
Max ()()B S U S I U c ++-21
一阶条件:()()()
dS dB B S U S I U c /1**21++'=-' 由此可得:()()()
1/1/0**21<+=+'-'<dS dB B S U S I U c 因此当增加S 时, ()S I U c -'1 会减小。
因为()0/>+dS B S d ,所以(S+B )
会增加,从而()B S U +2也会增加;同时,因为()B S U +2增加的幅度比()S I U c -1减小的幅度大,所以孩子的收益(支付)效用增大了,同时家长的收益(支付)效用也增大了。
3、请将下列扩展式博弈转化为战略式博弈,并求出纳什均衡。
解:该博弈转化为战略式博弈为
1
L R
2 l 1,
3 0,0
r 0,0 3,1
其纳什均衡为(L,l),(R, r)。