博弈论练习题part1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论练习题(一)
一、下面哪些问题适用博弈来模型化∶
1、石油输出国组织(OPEC)成员国选择其年产量;
2、通用汽车公司向USX购买钢材;
3、两厂商,一家制造螺钉,一家制造螺帽,是用公制还是英制;
4、公司董事会为其总经理(CEO)设立一项期股安排;
5、联合果品公司决定招募工人;
6、一电力公司估计了未来10年对电力的需求后,决定是否购置一套新的发电机组。
问题1和3可以用博弈来模型化
二、博弈论与经济学的关系是什么?经济学的变化趋势是什么?
答:
(1)博弈论与经济学的关系:
1、博弈论在经济学中的应用最广泛、最成功。
2、经济学家对博弈论的贡献越来越大。
3、经济学和博弈论研究的模式是一样的。
经济学和博弈论都强调个人理性,即在给定的约束条件下追求效用最大化。
(2)经济学发展的几个趋势
博弈论成为主流经济学的基石,反映了经济学发展的几个趋势∶
1、经济学研究的对象越来越转向个体。
2、经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响及作用,人们之间利益的一致与冲突,竞争与合作的研究。
3、经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。
三、博弈论的构成要素有哪些?
答:广义上讲博弈论则主要由以下五大要素构成:
一,决策主体(Player):又称局中人或博弈方,指的是博弈中能独立决策、独立行动并承担决策结果的个人或组织。
二,策略空间(Strategy space):又称策略集,是指供参与者选择的策略和行动空间。
三,效用(Utility):也就是博弈者之间相互争夺的利益。
博弈双方或多方都是围绕一定利益展开的,因此博弈胜负的评判结果主要是靠策略选择后的得失来衡量。
四,次序(Orders):即各博弈方在决策时有先后之分,因为博弈方在决策选择上要不时地调整改善,一定要十分注重次序轻重的问题。
如果决策的次序和实施时间不同,则博弈的结果必会有所差别。
五,博弈均衡:博弈虽然是为了利益和胜利,但并非是利益尽占,而是要遵循均衡理论。
四、二人博弈有何特点?
答:双人博弈(即有且只有两个参与人的博弈,称为双人博弈),有如下一些特点∶
1.两参与人之间的关系并不总是相互对抗的,有时会出现利益一致的情况;
2.信息多的一方不能保证得益也较多;
3.个人理性并不一定导致集体理性。
五、如何理解完全信息与不完全信息,完美信息与不完美信息?
答:(1)完全信息与不完全信息:
1、如果参与人完全了解所有参与人各种情况下的得益(支付函数),称此参与人具有完全信息。
2、如果参与人不完全了解其他参与人的得益,则该参与人具有不完全信息。
(2)完美信息与不完美信息
1、在动态博弈中,若参与人完全了解自己行动之前的整个博弈过程,称此参与人具有完美信息(完美回忆)。
2、若参与人不完全了解自己行动之前的整个博弈过程,则该参与人具有不完美信息。
六、如何理解静态博弈与动态博弈?
答:从行为的时间序列性,博弈论可分为两类:
静态博弈,是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;
动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
例如,"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
七、如何理解纳什均衡?占优均衡,反复剔除严格劣战略均衡与纳什均衡的关系。
答:(1)纳什均衡的直观意义
在n 人参与的博弈中,给定其他参与人战略的条件下,每个参与人选择自己的最优战略,所有参与人选择的战略构成一个战略组合。
所有参与人的最优战略构成的战略组合,称为纳什均衡。
纳什均衡是完全信息静态博弈的解。
(2)纳什均衡的数学表达:
有n 个参与人的战略表述博弈∶ G={S1,. . . ,Sn ;u1 ,. . . ,un } ,战略组合: , 是一个纳什均衡,如果对于每一个i , 是给定其他参与人选择 的情况下第i 个参与人的最优战略,即 (3)占优战略均衡、重复剔除占优均衡、纳什均衡的关系
1、每一个占优战略均衡、重复剔除占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除占优均衡。
因为构成纳什均衡的唯一条件是参与人对其他参与人均衡战略的最优选择。
而占优战略均衡则要求它是对所有其他参与人的任何战略组合的最优选择,则自然它也是对所有其他参与人的某个特定的战略组合的最优选择。
而重复剔除占优均衡则要求它是在重复剔除过程中剩下的唯一的战略组合。
2、纳什均衡一定是在重复剔除严格劣战略(不适合弱劣战略剔除)过程中没有被剔除掉的战略组合,但没有被剔除的战略组合不一定是纳什均衡,除非它是唯一的。
八、实际中如何分析预测博弈的结果。
答:实际中描述一个博弈至少必须包括:参与人,战略,支付。
而行动与信息则是建筑材料。
参与人,行动的结果合起来称为博弈规则,建模者目的在于运用博弈的规则来确定均衡
),,,(***1*n i S S S S =*i S ),,,,,(**1*1*1*n i i i S S S S S +--=i S s S S u S S u i i i i i i i i ∀∈∀≥--,),,(),(***
博弈论练习题(二)
一、 构造具有下述性质的2*2博弈的例子 1、 不存在纯战略纳什均衡;
2、 不存在弱帕累托优势战略组合;
3、 至少有两个纳什均衡,其中一个帕累托优于其它所有的战略组合;
4、 至少有三个纳什均衡。
二、不协调博弈
有一男一女,各自选择是看足球还是看时装表演。
男的愿意看足球,女的喜欢看时装。
男的想和女方在一起,女的却想躲开男方。
1、 构造一个博弈矩阵来表示这个博弈,选择相应的数值以符合男、女的偏好;
2、 若女方先采取行动,将发生什么?
3、 该博弈中存在先动优势吗?
4、 在完全信息的静态博弈中,存在纯战略纳什均衡吗? 答: 1、
女
如支付矩阵所示,该博弈模型存在一个占优均衡。
2、如果女方先采取行动,她将会为自己买一张时装票,为男友买一张足球票,以达到效用最大。
或者只买一张时装票给自己。
3、该博弈中不存在先动优势。
原因:即使男方存在先动优势,抢先购买两张足球票,女方也不会去看球,即策略(足球、
乙
乙
乙
乙
男
足球)不是纳什均衡。
同理,若女方存在先动优势,则她不会同时购买两张时装票,由于她想躲开男方,因此她会为自己买一张时装票,同时为男方买一张足球票,或者只买一张时装票给自己,即策略(时装、时装)不是纳什均衡。
4、由纳什均衡的存在性定理可知:每一个有限博弈至少存在一个纳什均衡(纯战略或混合战略的)。
因此,完全信息的静态博弈中,至少存在一个纯策略的纳什均衡。
三、变化的囚徒困境
在X 与Y 两囚徒博弈中,X 有前科,故无论谁坦白或抵赖,X 都至少要比Y 多判5年。
构造一个博弈矩阵,并找出该博弈的纳什均衡。
Y
构造博弈举矩阵如上图所示,该博弈有两个纳什均衡,即(坦白、坦白)、(抵赖、抵赖)
四、有两个厂商的古诺模型,q i 是厂商i 的产量,Q=q 1+q 2为市场总产量。
价格为产量的减函数,且p (Q )=a - Q ,没有固定成本,但边际成本不同,分别为c 1和c 2。
如果0<c i <a/2,问纳什均衡的产量各为多少?如果c 1<c 2<a ,但2c 2>a+c 1,则纳什均衡的产量又为多少? 解:两厂商均无固定成本,单位边际成本分别为C1,C2 。
则两厂商的利润函数分别为:
厂商1
厂商2
分别对u1 ,u2求偏导数并令其为零,则有∶
得到:q1=(a+c2-2c1) / 3 q2=(a+c1-2c2)/3 即为纳什均衡的产量,此时0<c i <a/2
如果如果c 1<c 2<a ,但2c 2>a+c 1,此时q1>0 厂商1的均衡产量仍然为q1=(a+c2-2c1) / 3,q2<0,此时厂商2选择不生产,即产量为0
五、有如下博弈矩阵
求解混合纳什均衡。
解:设X 选择策略X1 X2 X3的概率分别为P (1) P (2) P (3),则有:
Y 选择Y1获得支付的期望值为: 8P (1)+12 P (2)+ 4 P (3) ...... 1 Y 选择Y2获得支付的期望值为: 4P (1)+6 P (2)+ 12P (3) (2)
2)(*
1*21=---q q c a 02*
2*12=---q q c a )(X
2
121111
12111111)()]([)(q q q q c a q c q q a q q c Q p q u ---=-+-=-=22
2122222122222)()]([)(q q q q c a q c q q a q q c Q p q u ---=-+-=-=
Y 选择Y3获得支付的期望值为: 12P (1)+2 P (2)+ 8P (3) …… 3 由1 = 2 =3 ,P (1)+ P (2)+ P (3)= 1 得到 P (1)= 5/12 P (2)=1/4 P (3)= 1/3
同理,因为X 的得意与Y 的得意相等,则Y 选择Y1 Y2 Y3的概率也分别为 P (1)= 5/12 P (2)=1/4 P (3)= 1/3
博弈论练习题(三)
一、有一个两参与人的四阶段之间的动态博弈如下图所示。
试找出全部子博弈,讨论该博弈中的可信性问题,求子博弈完美纳什均衡战略组合和博弈的结果。
动态博弈采用逆向归纳法:
(1)从子博弈1(如图)开始:2会选择其可以获得的最大支付的策略(3、6) (2) 子博弈2(如图),1会选择策略(4 、3),以满足其收益最大化的意愿。
(3)子博弈3(如图),2会选择策略(2 、4) (4)最后,子博弈4(如图),1会选择策略(U ,(5 、3))
由以上分析知该博弈可信,子博弈完美纳什均衡战略组合为(U ,(5 、3))
二、三寡头市场需求函数P=100-Q ,Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2,无固定成本。
如果厂商1和2先同时决定产量,厂商3根据厂商1、2的产量决策,问三厂商各自的产量和利润是多少? 答:(1)首先考虑1 2厂商 由古诺模型,可知其产量
Q1=Q2=(a-c)/(n+1)=(100-0)/(2+1)=100/3 (推到过程同第2章习题4) (2)然后考虑厂商3:
利润U3=Q3*P=Q3*(100-Q1-Q2-Q3)=100/3*Q3-Q3*Q3
对U3求导,令U3'=0,解得:Q3=50/3,这样Q1,Q2,Q3都求出,然后是U1,U2,U3
U3=Q3*P=50/3 * 50/3=2500/9
U1=U2=Q1*P=100/3 * 50/3=500/3
三、两次重复下面这个得益矩阵表示的两人静态博弈。
问能否有一个精炼纳什均衡战略组合,实现第一阶段的得益是(4,4)?如能,给出双方的战略,如不能,证明为什么不
子博弈1
能。
如果战略组合(x 3,y 1)的得益改为(1,5),会发生什么变化,至少能在部分阶段实现(4,4)的条件是什么?
Y
1 2 3
X
答:(1) (3 ,1)和(1 ,2),但对双方均有利的战略组合(X3 , Y3)不是纳什均衡,因此在一次博弈中不可能出现。
(2)采用“触发战略”,即首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给予惩罚。
我们先假设这种触发策略可行,则第一阶段合作两方的策略为(X3 , Y3),支付为(4,4),第二阶段合作双方的策略为(X1, Y1)或(X2,Y2),此时支付分别为(3,1)和(1,2) 达到纳什均衡。
采用触发战略的两个参与人的战略是:
参与人X 的战略:第一次选X3,则参与人Y 为了收益最大必定会选择Y3,此时的策略为(X3 ,Y3)。
在种情况下,Y 的收益总和分别为4+2=6 或4+1=5 参与人Y 的战略:第一次选择Y3,如果第一次的结果是(X3, Y3),则第二次选择Y1,相当于参与人给X 第一次采取合作态度的奖励;如果参与人X 在第一次选择X1,则第二次选择Y2,相当于给参与人X 在第一次选择不合作态度给予惩罚。
这两种情况下X 的收益总和分别为:4+3=7 5+1=6 ,选择合作可以使得X 两次收益总和最大,所以X 会选择合作。
(3)综上所述,存在着精炼的纳什均衡使得第一个阶段的得意时(4,4) (4)若战略组合(x 3,y 1)的得益改为(1,5),即支付矩阵如下: Y
X
此时,采用触发战略的两个参与人的战略是: 参与人X 的战略:第一次选X3,若参与人为了收益最大会Y1,此时的策略为(X3 ,Y1),则X 在第二阶段选X1以报复Y ,在种情况下,Y 的收益总和分别为5+1=6;若Y 选择合作,则第一阶段策略组合为(X3, Y3),参与人X 第二将诶段选择X1以对Y 进行报复,此时参与人Y 两阶段的收益总和为4+1=5,小于不合作时的收益总和,因此参与人Y 不会选择合作,而会选择不合作。
参与人Y 的战略:第一次选择Y3,如果第一次的结果是(X3, Y3),则第二次选择Y1,相当于参与人给X 第一次采取合作态度的奖励;如果参与人X 在第一次选择X1,则第二次选择Y2,相当于给参与人X 在第一次选择不合作态度给予惩罚。
这两种情况下X 的收益总和分别为:4+3=7 5+1=6 ,选择合作可以使得X 两次收益总和最大,所以X 会选择合作。
(与未改变前情况相同)
因此,实现第一阶段得益(4,4)的精炼纳什均衡战略组合不存在。
(5)至少能在部分阶段实现(4,4)的条件是:设(x 3,y 1)的得益改为(1,a ),则有a+1<5,
即a<4。