求出下面策略式博弈的全部纯策略和混合策略纳什均衡
上海财经大学经济学院《高级微观经济学》题库10
作业五1、求出下面策略式博弈的全部纯策略和混合策略纳什均衡:(1)(2)(3)答:(1) 无纯策略纳什均衡,混合策略纳什均衡为:32113344((,),(,))。
(2) 纯策略纳什均衡为:(,)T R 和(,)B L ,混合策略纳什均衡为:34115544((,),(0,,))。
(3) 纯策略纳什均衡为:(,)D R ,无混合策略纳什均衡。
2、考虑如下N 个参与人的博弈:每一个参与人i 从集合{1,2,,}K …中选择一个数字i x ,令11ni ni x x ==∑为所有参与人选择的数字的平均值,所选数字最接近23x的参与人将会得到一笔价值1万元的奖金(如果两个或更多参与人的数字都同样离23x最近,那么他们平分奖金)。
证明每个参与人都有唯一的可理性化策略并找出这个策略。
答:首先,对任意的2K ≥,有2233(1)K K K K −−<−。
定义(0){1,2,,}i i R S K ==…,对任意0m ≥,定义{}(1)():(),i i i i i i i R m s R m s R m s s −−−+=∈∃∈使得是的最优反应,则参与人i 的可理性化策略为0()i im R R m ∞==∩。
注意参与人可以选择的最大的数字为K ,因此23x 不会大于23K,故可推得选择K 不是任何策略的最优反应:对于任意一个参与人i ,如果其他参与人都选择K ,那么他可以选择1K −并以1的概率赢得奖金,而如果他选K ,他只能以1/n 的概率赢得奖金;如果其他参与人都选择比K 小的数,那么他若选择K 将不可能赢得奖金,而通过选择其它某个更小的数的话会使他至少以正的概率赢得奖金。
因此,(1){1,2,,1}i R K =−…。
重复这个过程我们得到(1){1}i R K −=,故唯一的可理性化策略为选择1。
L R T 2,1 0,2 B 1,2 3,0L C R T 0,4 5,6 8,7 B 2,9 6,5 5,1L C R U 1,-2 -2,1 0,0 M -2,1 1,-2 0,0 D 0,0 0,0 1,13、说明下列扩展式博弈是否满足“完美回忆”的性质。
(完整word版)博弈论期末复习题
一、支付矩阵1、试给出下述战略式表述博弈的纳什均衡BAU D解:由划线解得知有一个纯战略均衡(R D ,)再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件:γγγ-=-+⋅=2)1(21)(U V A γγγ26)1(64)(-=-+⋅=D V A γγ262-=-得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。
2、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。
BAU D将博弈改成上述模型,则)1(64)1(25γγγγ-+=-+ γγ2632-=+得 54=γ同样,设A 的混合战略为)1,(θθ-,则)1(25)1(16θθθθ-+=-⋅+ θθ3251+=+21=θ于是混合战略均衡为⎭⎬⎫⎩⎨⎧⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛51,54,21,21.二、逆向归纳法1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P ,则1选L '的支付P P P 32)1(25+=-+=1选R '的支付P P P P 3233)1(36+>+=-+= 故1必选R '。
⇒ 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡为{}),(,,d a R L '四、两个厂商生产相同产品在市场上进行竞争性销售.第1个厂商的成本函数为11q c =,其中1q 为厂商1的产量。
第2个厂商的成本函数为22cq c =,其中2q 为厂商2的产量,c 为其常数边际成本.两个厂商的固定成本都为零.厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在⎥⎦⎤⎢⎣⎡23,21上呈均匀分布。
博弈论习题和参考答案与解析
博弈论》习题—、单项选择题1.博弈论中,局中人从一个博弈中得至啲结果常被称为()。
A•效用 B. 支付C.决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C策略D•支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白氏两个囚徒都没有坦白C•两个囚徒都会坦白 D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B•使另一个博弈者的利润最小C•使其市场份额最大D.使其利润最大5.—个博弈中,直接决定局中人支付的因素是()oA.策略组合B.策略C信息D.行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()0A.囚徒困境式的均衡B.—报还一报的均衡C.占优策略均衡D•激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.—报还一报的策略B.激发策略8.在囚徒困境的博弈中,合作策略会导致()oA博弈双方都获胜B博弈双方都失败C使得先米取行动者获胜D使得后米取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()oA.当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时10.—个企业采取的行为与另一个企业在前一阶段采取的行为一致”这种策略是一种()A.主导策略B.激发策略C.—报还一报策略D.主导策略11-关于策略式博弈,正确的说法是()OA.策略式博弈无法刻划动态博弈B.策略式博弈无法表明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A.策略是局中人选择的一套行动计划;B.参与博弈的每一个局中人都有若干个策略;C.—个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论复习题及答案
囚徒困境说明个人的理性选择不一定是集体的理性选择。
(√)子博弈精炼纳什均衡不是一个纳什均衡。
(×)若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。
()博弈中知道越多的一方越有利。
(×)纳什均衡一定是上策均衡。
(×)上策均衡一定是纳什均衡。
(√)在一个博弈中只可能存在一个纳什均衡。
(×)在一个博弈中博弈方可以有很多个。
(√)在一个博弈中如果存在多个纳什均衡则不存在上策均衡。
(√)在博弈中纳什均衡是博弈双方能获得的最好结果。
(×)在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。
(×)上策均衡是帕累托最优的均衡。
(×)因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
(×)在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。
(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。
囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。
(×)纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。
(√)多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。
(√)如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t<T,在t阶段的结局并不是G的Nash均衡。
博弈论习题及解答
※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。
两个相互竞争的企业考虑同时推出一种相似的产品。
如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。
企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。
例子:厂商之间的价格战,广告竞争等。
※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。
然后用划线法求出该矩阵博弈的纯策略Nash均衡。
乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。
乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。
由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。
解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。
策略博弈与纳什均衡
第三讲 策略博弈与纳什均衡
第一节 基本概念
博弈是对许多人一个策略相互依存的构架中相互作用这 种情况的正式表述。 一个博弈的基本要素:
ui (si , si ) ui (si, si )
即 si 是参与人 i 的严格占优策略,如果对于参与人 i 的竞争对手可能
选择的任何策略,它唯一使参与人 i 的支付最大化。
第三节 最优反应与纳什均衡
最优反应 1.所有别的游戏者的策略的表述
对于某一个策略组合s=(s1,s2…,si, …,sn), 我们记s-i=(s1,s2…,si-1, si+1 …,sn)
si* Bi (s*i ) for i I
第三,按照参与人之间是否合作分为合作博弈和非合作博弈。
合作博弈是指参与人之间有着一个对各方具有约束力的协议,参 与人在协议范围内进行的博弈。
反之,就是非合作博弈。
非合作博弈的类型可分为完全信息静态博弈,完全信息动态博弈, 不完全信息静态博弈,不完全信息动态博弈。
与上述四种博弈相对应的均衡概念:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium), 精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。
行动是你采取的某种行动方式,只要可能,你都 可以采取;策略是一种有条件的应对行动方案;
混合策略纳什均衡
博弈论 第三章 混合策略纳什均衡
r*=R(q)
反应对应曲线
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
再看乙的最优反应,记为q*=R(r): 观察π乙(p甲, p乙)= 2q(2r-1)-(2r-1)
若r 1 / 2 2r 1 0, q越大越好 1, q* R( r ) [0,1], 若r 1 / 2 2r 1 0,无论q选什么都无影响 0, 若r 1 / 2 2r 1 0, q越小越好
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、反应对应法
例:扑克牌对色游戏(p77)
先看甲的最优反应,记为r*=R(q): 观察π甲(p甲, p乙)= 2r(1-2q)+(2q-1)
若q 1 / 2 1 2q 0, r越小越好 0, r* R( q) [0,1], 若q 1 / 2 1 2q 0,无论r选什么都无影响 1, 若q 1 / 2 1 2q 0, r越大越好
解:Max π甲(p甲, p乙) r Max π乙(p甲, p乙) q
f.o.c. 2r-1=0
r*=1/2
混合策略纳什均衡是甲在策略空间{红,黑}上以概率分布 p甲*= (1/2,1/2)进行选择,乙也在策略空间{红,黑}上以概率p乙*= (1/2,1/2)进行选择
博弈论 第三章 混合策略纳什均衡
第二节 混合策略纳什均衡的求解方法
二、支付最大化法
例:扑克牌对色游戏(p77)
无纯策略NE 给定混合策略p甲=(r,1-r); p乙=(q,1-q) π甲(p甲, p乙)=r[q(-1)+(1-q) 1]+ (1-r)[q1+(1-q)(-1)] = 2r(1-2q)+(2q-1) π乙(p甲, p乙)=q [r1+(1-r)(-1)]+ (1-q)[r(-1)+(1-r)1] =2q(2r-1)-(2r-1) f.o.c. 1-2q=0 q*=1/2
经济学基础综合金融历年考研真题试卷汇编附答案
经济学基础综合金融历年考研真题试卷汇编一、简答题1.请分别设计一个具有占优策略均衡和单一纳什均衡的收益矩阵,并以此阐释这两种均衡的差异。
[浙江大学801经济学综合2011研]甲、乙两人合伙完成一项任务,两个人都有两种行为可以选择,即努力或者偷懒,两者同时行动,假设努力的成本为-4,偷懒的成本只有-1,如果双方都努力,那么可以得到总报酬为10,如果一方努力,一方偷懒,得到总报酬为6;如果都偷懒,得到总报酬为2。
无论双方选择如何行动,最终报酬是平均分配的。
2.请按下列格式给出博弈的支付矩阵:3.简述“个体理性”与“集体理性”的冲突。
4.讨论“以牙还牙”策略的有效性。
[东北财经大学801经济学2015研]甲、乙两个学生决定是否打扫宿舍。
无论对方是否参与,每个参与人的打扫成本都是8;而每个人从打扫中的获益则是5乘以参与人数。
5.请用一个博弈简单描述上述情景。
6.找出该博弈的所有纳什均衡。
[中山大学801微观经济学与宏观经济学2010研]某外资企业计划在北京和上海建立生产基地,如果两个地区的地方政府都不推出税收返还政策,那么,外资企业将选择在北京建立一个大型生产基地,在上海建立一个小型生产基地,这将分别为两个地区带来30和10的税收收入。
如果其中一个政府推出返还10的税收政策,而另一个政府没有推出相应的政策,那么企业将把大型生产基地设立在具有税收优惠的地区。
如果两个地方政府同时推出返还10的税收政策,那么企业的选择将与完全没有税收优惠时相同。
7.建立一个博弈描述上述地方政府的招商引资行为。
8.求出上述博弈的纳什均衡。
[中山大学801微观经济学与宏观经济学2012研]9.资本完全流动的含义是什么?在小国和大国模型中,资本完全流动带来的结果有什么不同?[东北财经大学801经济学2013研]10.在短期模型中,比较开放条件和封闭条件下扩张性货币政策对总需求及其组成部分影响传导机制的差异。
[中国人民大学802经济学综合2013研]11.假设某浮动汇率的小型开放经济处于衰退且贸易平衡。
博弈论各章节课后习题答案 (2)
1 π1 = (10 − 2q1 − 2q2 )q1 − 2 − 4q1
1 π2 = (10 − 2q1 − 2q2 )q2 − 2 − 4q2
求导得:
∂π1 ∂q1
= 10 − 4q1
−
2q 2
−
4
=
0
∂π2 ∂q 2
= 10 − 4q2
− 2q1 − 4 = 0
解得均衡时
q1=q2=1,则
p=8,利润为:π1=π2=
aijx*i y j 。由于 d 是
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
mn
∑∑ ∑∑ ∑∑ 常数,因此有
(aij + d)xi y j =
aijxi y j + d 。显然不等式
(aij + d)xi y*j ≤
i =1 j=1
i =1 j=1
i =1 j=1
mn
mn
∑ ∑ ∑ ∑ (aij + d)x*i y*j ≤
,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需
a>10。此时乙企
业的收益为 100+a。
11. 假设有一博弈 G=[N,S,P],其中 N={1,2},S1=[10,20],S2=[0,15], P1 (s) = 40s1 − 2s12 + 5s1s 2 ,
P2 (s)
= 50s 2
−
s
2 2
(aij + d)x*i y j 是成 立的 , 此即 为 XA2Y* ≤ X*A2Y* ≤ X*A2Y 。所以
i =1 j=1
i =1 j=1
(X*,Y*)是矩阵博弈 G2 的纳什均衡点,并且
最大最小法求纯策略纳什均衡例题
最大最小法求纯策略纳什均衡例题
纳什均衡和最大最小定理是博弈论的两大基石。
博弈不仅仅是对抗,也包括合作和迁就,纳什均衡能够解决这些问题,提供了在数学上一个完美的理论。
纳什均衡的中心思想是主动选择一个对大家都有利的战略,迫使其他玩家选择相同的战略组合。
对于n人战略式表述博弈
G={S1,⋯,Sn;u1,⋯,un}G={S1,⋯,Sn;u1,⋯,un},若战略组合
s∗=(s∗1,⋯,s∗n)s∗=(s1∗,⋯,sn∗)满足如下条件,则称s∗s∗是一个纳什均衡:
u1(s∗i,s∗−1)≥u1(si,s∗−1) ∀si∈
Si,i−1,⋯,nu1(si∗,s−1∗)≥u1(si,s−1∗) ∀si∈Si,i−1,⋯,n
或者用另一种表达方式:当且仅当s∗isi∗是下述最大化问题的解时,s∗s∗是一个纳什均衡
s∗i=argmaxsi ui(s∗1,⋯,s∗i−1,si,s∗i+1,⋯,s∗n), i=1,⋯,n;si∈Sisi∗=argmaxsi ui(s1∗,⋯,si−1∗,si,si+1∗,⋯,sn∗), i=1,⋯,n;si ∈Si
纳什均衡的含义是说:当局中人在某一选定的战略组合下都没有积极性偏离各自已选定的战略时,该战略组合就构成一个纳什均衡。
纳什均衡对应的战略组合是:战略组合的每个特定玩家策略都是(当其他玩家做出这个战略组合对应的选择时)其最优解。
博弈7混合策略及其纳什均衡
因为银行的价值是酒馆的两倍,所以用两
个签代表银行是合理的。比如,如果抽到1、
2号签去银行,抽到3号签去酒馆。这样警察
有2/3的机会去银行进行巡逻,1/3的机会
去酒馆。而小偷的最优选择是:以同样抽签
的办法决定去银行还是去酒馆偷盗,只是抽
到1、2号签去酒馆,抽到3号签去银行,那么,
小偷有l/3的机会去银行,2/3的机会去酒
2020/10/24
中南财经政法大学信息学院
7
✓ 策略:博弈方在给定信息集的情况下选择行 动的规则,它规定博弈方在什么情况下选择 什么行动,是博弈方的“相机行动方案”。
❖ 纯策略:如果一个策略规定博弈方在每一个 给定的信息情况下只选择一种特定的行动, 该策略为纯策略。
❖ 混合策略:如果一个策略规定博弈方在给定 信息情况下以某种概率分布随机地选择不同 的行动,则该策略为混合策略。
当双方采用该策略组合时,虽然不能确定 单独一次博弈的结果究竟会是四组得益中的哪 一组,但双方进行该博弈的期期得益,也就是 多次独立重复该博弈的平均结果,应该分别为:
2020/10/24
中南财经政法大学信息学院
16
u1 pA pCu1(A,C)pA pDu1(A,D) pB pCu1(B,C)pB pDu1(B,D) =0.80.82+0.80.25+0.20.83 +0.20.21=2.6
化简后可得
pA=4pB
由于
pA+pB=1
因此pA=0.8 ,pB =0.2,这就是博弈方Ⅰ应该选
择的混合策略。
2020/10/24
中南财经政法大学信息学院
14
同理,博弈方Ⅱ选择C和D的概率pC和pD也应 使博弈方Ⅰ选择A的期望得益和选择B的期望得
(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)
《博弈论》习题参考答案(Part.Ⅰ)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、(1)画出A、B两企业的损益矩阵。
B企业做广告不做广告做广告20,825,2 A企业不做广告10,1230,6(2)求纯策略纳什均衡。
(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。
(1)画出A、B两企业的损益矩阵百事可乐原价涨价原价10,10100,-30可口可乐涨价-20,30140,35(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价)3、假定某博弈的报酬矩阵如下:乙左右甲上a,b c,d下e,f g,h(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足?答:a>e, b>d4、答:(1)将这一市场用囚徒困境的博弈加以表示。
博弈论第三章混合策略纳什均衡.
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1,
4
1 vG 0,
0.2
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
vL 1, 1 3 vL 0, 0.5
游闲
(3,2) (-1,3)
(-1,1) (0,0)
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡? • ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗? • 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针 对性的策略,使自己的支付增加。
L 2 1 0
0.5
解二:支付等值法
• 政府选择救济策略 • 政府选择不救济策略
0 1 期望效用 期望效用 vG 1, 3 11 vG 0, 1 01 4 1
EUA p1 X 1 p 2 X 2 ... pnXn
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻 找工作,否则,不予帮助;而流浪汉若知道政 府采用救济策略的话,他就不会寻找工作。他 们只有在得不到政府救济时才会寻找工作。他 们获得的支付如图所示:
流浪汉
寻找工作
救济 政府 不救济
乙 红q 红p 甲 黑1-p -1, 1 1, -1 黑1-q 1, -1 -1, 1
§ 反应函数
• A的目标是期望支付越大越好。我们之所以把A的 期望支付整理成不含p的一项和含p的一项这个样 子,是因为A只能选择p而不能q,因此,A能通过 选择p来影响第一项,而不能直接影响第二项。 (1-2q)>0即q<1/2时,A把p选择等于1最好;当 (1-2q)<0即q>1/2时,A把p选择等于0最好;当 (1-2q)=0即q=1/2时,A可以在[0,1]之间随便 选择一个p。这样我们可以得到A的反应函数是, 同样道理我们可以得到B的反应函数。 • 0, 如果q>1/2 1, 如果p>1/2 • p [0,1], 如果q=1/2 q [0,1], 如果p=1/2 • 1, 如果q<1/2 0, 如果p<1/2
03 混合策略纳什均衡
相关均衡例子 三个纳什均衡: 三个纳什均衡 (U,L)、(D,R) 和混合策略均衡[(1/2,1/2), (1/2,1/2)] 结果都不理想,不如(D,L)。
5)防联盟均衡 ) 博弈中若有三个及三个以上的局中人,就有可能部分人结 成“联盟”,在极大化联盟成员利益的同时损害了其他局 中人的利益。
甲 乙
2
( p, q ) = ∑∑ pi q j bij
i =1 j =1
混合策略纳什均衡 设 P * = ( P * , L, Pi* , L, Pn* ) 是 n 人策略式博弈 G = {S1 ,LSn ; u1 ,Lun } 1 的一个混合策略组合,如果对于所有的
i = 1, L , n ,
π i ( Pi* , P−*i ) ≥ π i ( Pi , P−*i ) 对于每一个 Pi ∈ ∑i 都成立,则称
i i
随机在其m个可选策略中选择的“策略”,称为一个“混合 策略”,其中 p ij 0≤
≤1
j 对,L, m =1
p 1i 都成立,且 + L + p im = 1
混合策略扩展博弈:博弈方在混合策略的策略空 混合策略扩展博弈 间(概率分布空间)的选择看作一个博弈,就是原 博弈的“混合策略扩展博弈。
L 0,0,10 -5,-5,0 A
R -5,-5,0 1,1,-5
乙 甲
L -2,-2,0 -5,-5,0 B
R -5,-5,0 -1,-1,5
U D
U D 丙
)、(D, , ) (U,L,A)、( ,R,B)——纯策略纳什均衡 , , )、( 纯策略纳什均衡 优于( , , ) (U,L,A) Pareto优于(D,R,B) , , ) 优于
2)制式问题
博弈论习题参考答案(2)
《博弈论》习题参考答案(第2次作业)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。
8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、 (1)画出A 、B 两企业的损益矩阵。
(2)求纯策略纳什均衡。
(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。
(1)画出A 、B 两企业的损益矩阵(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:甲乙 左 右 上 下(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>? 答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足? 答:a>e, b>d 4、答:(1)将这一市场用囚徒困境的博弈加以表示。
混合策略纳什均衡
目录[隐藏]1 什么是混合策略纳什均衡2 解混合策略纳什均衡的方法3 混合策略纳什均衡的经典博弈——猜谜博弈[1]4 混合策略纳什均衡博弈与其他均衡的关系[1]5 参考文献[编辑][编辑][编辑]混合策略纳什均衡混合策略纳什均衡(Mixed Strategy Nash Equilibrium )什么是混合策略纳什均衡混合策略纳什均衡:在n 个参与人的博弈G={S 1 ,... S n ; u 1,...u n }中,混合策略组合构成一个纳什均衡,如果对于所有的i =1,2...,n 下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。
解混合策略纳什均衡的方法1、最大化支付法:即最大化各个参与人的效用函数。
2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。
混合策略纳什均衡的经典博弈——猜谜博弈[1]两个局中人A 、B 手里各拿一枚硬币,每人可以选择正面向上或反面向上,然后同时亮出,如果两枚硬币正反面相同,B 付给A1元钱,如果两枚硬币正反面不相同,A 付给B1元钱。
在这种情况下,局中人A 、B 如何选择呢?下图给出这个博弈的双变量收益矩阵。
这是一个两人零和博弈,在每一个结局中一方所得即为另一方所失,即两个局中人的收益之和恰好等于零。
在双变量收益矩阵中采用画线的方法,在这个博弈中找不到纯策略纳什均衡。
那么,猜谜博弈是否存在混合策略纳什均衡呢?1950年纳什证明了任何有限博弈都至少存在一个纳什均衡(包括纯策略纳什均衡和混合策略纳什均衡)。
《经济博弈论》复习题参考答案
《经济博弈论》复习题及参考答案一、名词解释1、混合战略纳什均衡如果在博弈的利益表中,无法找到任何一方都可以接受(不一定利益最大化)的方案,也就是没有哪一种组合是在给定对手策略下没有动机改变自己策略的情况。
这时博弈没有纯策略均衡,需要一个“概率表”指导博弈结果。
在博弈G={S1,S2……Sn;U1,U2……Un}中第i个博弈方策略空间为Si={Si1……Sik}则博弈方以概率分布Pi=(Pi……Pik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。
2、子博弈精炼纳什均衡对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。
子博弈精练纳什均衡所要求的是参与人应该是序惯理性的。
对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。
3、完全信息动态博弈完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
4、不完全信息动态博弈指在动态博弈中,行动有先后次序,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
5、完全信息静态博弈完全信息静态博弈指的是信息对于博弈双方来说是完全公开的情况下,双方在博弈中所决定的决策是同时的或者不同时但在对方做决策前不为对方所知的。
6、囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
经济博弈论-计算题
一、用反应函数法求出下列博弈的所有纯战略纳什均衡。
参与人2解答:纯策略纳什均衡为(B, a )与(A, c ) 分析过程:设两个参与人的行动分别为q 和"2,playerl 的反应函数R {(a 2) = <C 或者D,如果匕=〃 c,如果q = AC,如果G] = D交点为(B, a )与(A, c ),因此纯策略纳什均衡为(B, a )与(A, c )o二、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还長低价啤酒,相应的 利润(单位:万元)由下图的得益矩阵给出:(1) 有哪些结果是纳什均衡 (2) 两厂商合作的结果是什么答(1)(低价,髙价),(髙价,低价)(2)(低价,髙价)三、求出下面博弈的纳什均衡(含纯策略和混合策略)。
乙L R低价厂商A厂商B 低价高价参与人1player2的反应函数R 2(a }) = <°,如果q = Bc,如果q = CABDabdD2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。
可得如下不等式组Q二a+d-b-c=7,q二d-b二4,R二0+5-8-6二-9,r=-l可得混合策略Nash均衡((丄上),(1,2)9 9 7 7四、猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。
按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。
谁去按按纽则谁后到;都去按则同时到。
若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。
各种情况组合扣除成本后的支付矩阵可如下表示(每格第一个数字長大猪的得益,第二个数字是小猪的得益):小猪求纳什均衡。
在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按, 小猪还是最好选择等待。
即不管大猪选择按还是不按,小猪的最佳策略都是等待。
也就是说,无论如何,小猪都只会选择等待。