石头剪刀布博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

局中人2
石头 局中人1剪刀 布
显而易见,“石头剪刀布”这个博弈是对称的,因而猜测其混合战略纳什均衡必然包括一种对称型的均衡,其中1a (石头)=1a (剪刀)=1a (布)=1/3;
2a (石头)=2a (剪刀)=2a (布)=1/3.
通过支付等值法来验证最优混合战略(1/3,1/3,1/3):
局中人1选择纯战略石头的期望效用为:0*1/3+1*1/3-1*1/3=0 ①
选择纯战略剪刀的期望效用为:-1*1/3+0*1/3+1*1/3=0 ②
选择纯战略布的期望效用为:1*1/3-1*1/3+0*1/3=0 ③
因为①式=②式=③式=0,对于局中人2来说,同理,所以由支付等值法显而易见,(1/3,1/3,1/3)是局中人1和2的最优混合战略。

假设有另外的均衡(1a ,2a )存在,其中
1a (石头)=p 1 1a (剪刀)=p 2 1a (布)=1-p 1-p 2
2a (石头)=q 1 2a (剪刀)=q 2 2a (布)=1-q 1-q 2
p 1、p 2、q 1、q 2≥0,p 1+p 2≤1,q 1+q 2≤1.
支付最大化法
由上述假定得:局中人1的混合战略是:(p 1,p 2,1-p 1-p 2);
局中人2的混合战略是:(q 1,q 2,1-q 1-q 2).
局中人1的期望效用函数为:
v (1a ,2a )=p 1(q 1+2q 2-1)+p 2(1-2q 1-q 2) +(1-p 1-p 2)(q 1-q 2)
给上式求微分,得到局中人1最优化的一阶条件1/p v ∂∂=32q -1=0,解得:2q =1/3; 2/p v ∂∂=1-31q =0,解得:1q =1/3。

1-q 1-q 2=1/3。

故*1q =1/3,*2q =1/3,(1-q 1-q 2)*
=1/3.
即局中人2以1/3的概率选择出石头,以1/3的概率选择出剪刀,以1/3的概率选择出
布。

同样,可以根据局中人2的期望效用函数找到局中人1的最优混合战略。

除此均衡之外,是否还会有别的均衡存在呢?下面,我们通过推证来证明该博弈只有这一个均衡。

局中人1选择纯战略出石头的期望效用为:2q -(1-q 1-q 2)=1q +22q -1;
纯战略出剪刀的期望效用为:-1q +(1-q 1-q 2)=-21q -2q +1;
纯战略出布 的期望效用为:21q q -。

在均衡下,局中人1要么觉得三个行动一样好,要么觉得其中两个某两个行动一样好而第三个行动是严格下策(有唯一最优反应的情况是不存在的,因为我们已经知道该博弈没有纯战略纳什均衡)
情况一:局中人1觉得三个行动一样好,即三种行动带来的盈利一样多。

这种情况出现当且仅当21q q ==1/3.要让局中人2选择这三种行动,必有:局中人1在三种行动之间随机选择并且满足21p p ==1/3.其实这就是我们已经知道的对称均衡结果而已。

情况二:局中人1觉得其中某两个行动一样好,而第三个行动是严格下策。

假设这两个行动是“石头”和“剪刀”。

则:
1q +22q -1 = -21q -2q +1 〉21q q - 解得:1q 〈1/3, 2q 〉1/3 ,21q q +=2/3.
局中人2以正的概率随机选择后两个行动,而选择第一个行动的概率未必为正。

作为最优反应,局中人1以正的概率随机选择前两个行动,而选择第三个行动的概率未必为正。

局中人2选择三个行动的期望效用分别是2p -1/3,-1p +1/3和21p p -。

为了和1q 〈1/3, 2q 〉1/3 ,21q q +=2/3这三个条件一致,必有:
-1p +1/3 = 21p p -》2p -1/3 ④
该弱不等式在1q =0时是严格不等式,而在0〈1q 〈1/3时是等式。

前提假设“1p +2p =1”,计算④式得,1p =4/9,2p =5/9,而-1p +1/3=21p p -=-1/9 而2p -1/3=2/9,-1/9并不大于2/9,从而④式和假设1p +2p =1矛盾。

显然,这和之前的假设1p +2p =1矛盾。

从而,不存在一个让局中人1仅以正的概率选择其中的任意两个战略的混合战略纳什均衡。

综上所述,有且仅有唯一的混合战略纳什均衡最优战略,即局中人1和居中人2均以1/3的概率选择石头,1/3的概率选择剪刀,1/3的概率选择布。

相关文档
最新文档