博弈论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.计算下列得益矩阵的所有纳什均衡(包括混合策略均衡),并指出哪个是帕累托上策均衡,哪个是风险上策均衡,为什么?
乙
L R
甲U 8,8 0,7
D 7,0 6,6
①纳什均衡(1)纯策略:划线法(U,L)(D,R)
(2)混合策略:π甲=p(8q)+(1-p)[7q+6(1-q)] απ甲/αp=8q-7q-6(1-q)=7q-6
1 q>6/7
→P= [0.1] q=6/7
0 q<6/7 π乙=q(8p)+(1-q)(7p+6(1-p)) 同理q的反应函数
1 q>6/7
→q= [0.1] q=6/7 q 三点交分别(p*,q*)分别为(0.0) 0 q<6/7 p,q 反应图 6/7 (6/7,6/7)(1.0)
对应的均衡为(D,R)(6/7U,6/7L) 6/7 1 p (U.L)
②帕累托上策:某一纳什均衡,某个双方带来的收益,都大于其他均衡
π甲1=8 π甲2=6 π甲3=6/7(6/7*8+1/7*6)+1/7(6/7*7+1/7*6)≈7 得π甲1>π甲3>π甲3
同理:π乙1>π乙3>π乙2 所以(U,L)为帕累托上策均衡
③假设均等概率选择策略,对甲而言,乙以1/2概率选L和R;对乙而言亦如此
π甲1=8*1/2+0*1/2=4 π甲2=7*0.5+6*0.5=6.5 π甲3=6/7(8*0.5+0*0.5)+1/7(7*0.5+6*0.5)≈4.4
π甲2>π甲3>π甲1 同理π乙2>π乙3>π乙1 所以(P,R)为风险上策均衡
2.给定博弈矩阵
(1)该博弈有没有优势(或上策,或占优)策略均衡?
(2)找出该博弈的纯策略纳什均衡。
①对甲而言,乙选C时,甲选B时优于选A(2>0);当乙选D时,甲选B劣于选A(0<2)所以甲无占优策略,同样,乙也没有占优策略所以无占优策略均衡。
②划线法(B,C)(A,D)为纯策略纳什均衡
3.某行业有两个厂商,一个是产量的领导者,一个是产量的追随者。该行业的需求曲线为p=a -bq,q代表行业的总产出。设两个厂商的边际成本为0,领导者首先选择它的产量,并且知道追随者将观察领导者的选择并根据领导者的产量随之选择使自己利润最大化的产量。则领导者将选择的产量为多少?
设厂商1为产量领导者厂商2为产量追随者厂2利润函数π2=pq2-(rp2)=q2[a-b(q1+q2)]-cq2 απ2/αq2=a-bq2-2bq2=0 q2反应函数 q2*=(1/2b)(a-bq1)
厂1利润函数π1=pq1-cq1=q1[a-b(q1+q2)]-cq1απ1/αq1=aq1-bq12_a/2q1*n/2q12=0 q1*=a/2b q2*=a/4b 所以领导有产量a/2b
4.利用逆向归纳法求出下列扩展型博弈的子博弈完美纳什均衡(写出求解过程)
从第一阶段,博2在博1选L时,选择U;在博1选R时,选D。第一阶段,博1选择R(4>3)
所以博1选R,博2再选D,(R,D)为子博弈纳什均衡。
5.在某一范围内有两只雄蛙。如果它们都不鸣叫,则吸引来的雌蛙数量0,即它们都没有交配的机会;如果有一只雄蛙鸣叫,那么会吸引来1只雌蛙,而鸣叫的雄蛙获交配的机会为m,0.5<m <l,但鸣叫者有成本z;如果它们都鸣叫,則获得交配的机会为P,m<P<1,此时各有成本z。这样两只雄蛙之间构成下图得益矩阵代表的博弈。
设青蛙种群中的叫的比例为x
对某只青蛙而言 1.叫的期望期望收益Ux=x(p-z)+(1-x)(m-z)
2.不叫的期望收益为Un=x(1-m)
复制动态方程:F=dx/dt=x(Ux-U)=x(1-x)(Ux-Un)=x(1-x)[(m-z)-(1-p)x]
所以,三个x*=1,x*=1,x*=(m-z)/(1-p)
当0<(m-z)/(1-p)<1→ F'(0)>0 →x=(m-z)/(1-p)为复制动态
F'(1)>0
F'((m-z)/(1-p))<0
当(m-z)/(1-p)<0(m<z)→ F'(0)=m-z<0 →x=0为复制动态
F'(1)=1-p-m+z>0
两家电视台竞争周末黄金时段晚8点到10点的收视率,可选择把较好的节目放在前面还是后面,他们决策的不同组合导致收视率如下:
⑴如果两家是同时决策,有纳什均衡吗?
⑵如果电视台1先选择,结果有什么?若电视台2先选择呢?
⑶如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗?结果可能是什么?
纯策略(后,前),(前,后)混合策略,设电1选前为P,电2选前为q
π1=p[18q+24(1-q)]+(1-p)[19q+(1-q)]
απ1/αp=-10q+9 P的反应函数 P= 0 q>9/10
[0,1] q=9/10
1 q<9/10
π2=q[18p+24(1-p)]+(1-q)[20q+15(1-q)] απ2/αq=-11p+q q的反应函数 q=0 p>9/11
[0.1] p=9/11
1 p<9/11
三交点(p*,q*)为(0,1)(9/11,9/10)(1.0)对应的均衡(后,前)(9/11前,9/10前)(前,后)
②电1先选择(前,后)收益为(24,20)电2先选择(后,前)收益为(19,24)
③第二阶段,电1为前时,电2选后;电1为后时,电2选先。第一阶段,电1选前(24>19)
所以电1选前,电2选后为博弈纳什均衡。
7.双寡头古诺模型,反需求函数为P=a-Q,其中Q=q1+q2为市场总需求,但a有ah和al,厂商1知道a究竟是ah,还是al;而厂商2只知道a=ah的概率是θ,a=al的概率是1-θ,两个厂商的成本函数分别为C1=cq1,C2=cq2,其中,c是大于0的常数。如果同时选择产量的话,本博弈的贝叶斯纳什均衡是多少?
π1n=[a1n-(q1n+q2)]q1n-cq1n π1l=[al-(q1l+q2)]q1l-cq1l
π2={[a1n-(q1n+q2)]q2-cq2}+(1-v){[al-(q1l+q2)]q2-cq2}
απ1n/q1n=a1n-c-q2-2q1n =0 q1n = (a1n-q2-c)/2
απ1l/q1l=a1l-c-q2-2q1l =0 →
απ2/αq2=v[(a1n-c)-q1n -2q2]+(1+v)[a1l-c-q2-2q2]=0 q1l=(a1l-q2-c)/2
→ q1=[3a1n-(va1n+(1-v)a1l)-2c]/6 q2=[3a1l-(va1n+(1-v)a1l]/6-2c
8.假设参与人小张和小王分配10元钱。他们同意最多用3天的时间协商分配问题。第1天,小张给出一个报价;第2天,小王可以接受也可以拒绝这个报价,如果他拒绝,他要提出一个新报价;第3天,小张提出最终的报价。如果他们不能在3天之内达成协议,那么,双方都将一无所获。假定小张和小王的贴现因子分别为α和β,求子博弈完美纳什均衡。
①为小张,②小王,s为小张所得
①最后一天 max s s*t≤10→s*=10 ②第二天max s2 s*t s2≥αs*=10α→s2*=10α
①第三天 max s1 s*t*β 10-s1≥β(10-s2*)=10β(1-α)→s1*=10(1-β+α*β)
所以,小张在第一天出价s1*=10(1-β+α*β),小王接受,为10-s1*=10β(1-α)
所以,小张,小王得益[s1*=10(1-β+α*β),s1*=10(1-β+α*β)]为子博弈完美纳什均衡解。
9.利用顺向归纳法求出下列扩展型博弈的完美贝叶斯均衡(写出求解过程)
对于博1,M是相对于R的下策,也是相对于L的下策,因此不会选M。博2的“信念”是直接针对博1的上期选择的。如果博1选L,则博2在博1选L的概率P=1时,会选择U,得益为(2,1);如果博2选R,则得益为(1,3),因为符合要求2中序列理性,则博1选L,则博2自然会选U的策略的得益大于博1选R,所以最终均衡为(L,U)。
10.若你正在考虑收购一家公司的1万股股票,卖方的开价是2元/股。根据经营情况的好坏,该公司股票的价值对于你来说1元/股和5元/股两种可能,但只有卖方知道经营情况的真实情况,你所知的只是两种情况各占50%的可能性。如果在公司经营情况不好时,卖方做到使你无法识别真实情况的“包装”费用是5万元,问你是否会接受卖方价格买下这家公司?如果“包装”费用是5千元,你是否会接受卖方价格买下这家公司?
①包装费5万元,p2<c=5,若股价低,卖方即卖掉股票,所以卖方在股票高时卖,股价低时不卖,买方判断p(g/s)=1,p(b/s)=0,所以买方选买期望收益为1*3+0*(-1)=3,选不买收益为0.所以买方会接受卖价,买下公司。
②包装费为0.5万元,p=2>c=0.5且w=1<p=2 卖方:若股价低,选卖的得意为p-c大于选不卖的得益为0;若股价高,选卖得益p大于不卖得益为0.所以,卖方选择卖,无论股票高低。买方判断p(g/s)=0.5 买方选买期望收益0.5*3+0.5*(-1)=1大于选不买的收益为0,所以买方也会接受卖价,买下此公司