简单二人零和博弈的一种图解法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简单二人零和博弈的一种图解法
马赞甫;刘妍珺
【摘要】利用等分量线及支付凸多边形这两个基本概念,以图解方式确定简单二人零和博弈(2×n或m×2)的纳什均衡.这一方法与通常的图解法是互补的,可率先确定持有多个纯策略的局中人的均衡策略.%By the introduction of iso-component line and convex polygon, a graphic method was presented to solve sim- ple zero-sum two-person games. This approach, which is complementary to the general graphic method, can determine the Nash equilibrium strategy of the player who holds more pure strategies.
【期刊名称】《海南师范大学学报(自然科学版)》
【年(卷),期】2012(025)003
【总页数】5页(P249-253)
【关键词】二人零和博弈;图解;凸组合;等分量线
【作者】马赞甫;刘妍珺
【作者单位】贵州财经大学经济研究所,贵州贵阳550004;贵州财经大学数学与统计学院,贵州贵阳550004
【正文语种】中文
【中图分类】F224.32
二人零和博弈是现实生活中常见的博弈形式,也是博弈论发展早期数学家特别感兴趣的一类博弈模型.事实上,与有限零和博弈相联系的最小最大值原理[1]在博弈论
中占有极为重要的地位.
对于有限二人零和博弈混合战略纳什均衡的确定,一般是借助最小最大值原理,将之转换为一个线性规划问题,然后利用单纯形方法确定最优策略.而对于某局中人
只有两个纯战略的简单的二人零和博弈,习惯上采用基于最小最大值原理的一般图解法.一般图解法简单直观,对于确定一个参与人的均衡战略极为便利,早期的博
弈论著作都对这一方法有所提及[2-3].
一般图解法只能确定一个局中人的最优策略,确切地说,只能确定纯战略个数为2的局中人的最优策略,在此基础上再以代数方法确定另一参与人的均衡策略.我们
提出另外一种基于凸组合的互补方法,可率先确定纯战略个数大于2的局中人的
最优策略.另外,这一方法也可直接确定博弈的值.
考虑一个二人有限零和博弈模型.假设局中人1的纯策略有m个,局中人2的纯策略有n个,分别记局中人1、2的混合策略为
其中x1,…,xm,y1,…,yn≥0,分别满足.当局中人1选择第i个纯战略而局中人2选
择第j个纯战略时,局中人1的支付为aij,局中人2的支付为(-aij),i=1,…,m,j=1,…,n.该博弈可由如下支付矩阵A给出:
称一个策略组合(X*,Y*)为纳什均衡(Nash Equilibrium,N.E.),当且仅当
X*∈argmXax{XTAY*}与Y*∈argmYax{X*TAY} 同时成立,此时称v*=X*TAY*为博弈的值.
对于由A所给出的二人零和博弈,当m与n皆大于2的时候,确定均衡比较棘手,但对于两者最小值为2的情形,有简单的处理方法,即利用图解法确定最优策略.
一般的对策论著作中都会介绍2×n或m×2型零和博弈的图解法,基本思路是利
用最小最大值原理,描绘最小(或最大)值曲线,然后再求最小(或最大)值曲线的最高(或最低)点.我们称这种方法为一般图解法.
一般图解法能直接确定双战略拥有者的最优战略,但两个以上纯战略持有者的均衡
战略是以间接方式给出的.我们提出另外一种互补方法,能直接确定多战略持有者
的均衡战略,该方法的理论基础是最大等收益法则.
一般而言,若(X*,Y*)是纯战略均衡,则可根据最小最大值原理直接予以确定,若纳什均衡(X*,Y*)不是纯战略均衡,则需满足最大等收益法则.所谓最大等收
益法则,即:如果
存在两个非零分量>0与>0,则当局中人2选择Y*时,局中人1的第i1、i2个
纯战略所对应的期望支付必须都等于v*,且均不小于其它任意纯战略所带来的期
望支付;类似地,若
存在非零分量>0与>0,则当局中人1选择X*时,局中人2的第j1、j2个纯战
略也对应等量的最大的期望支付(-v*).
利用最大等收益法则,可考虑一种凸组合图解方法:在支付凸组合的基础上,利用等分量线确定博弈的解与值.
考虑一个由2×n阶支付矩阵所定义的简单零和博弈.设该博弈的纳什均衡为(X*,Y*),所对应的博弈值为v*=X*TAY*.由于AY*是矩阵n个列向量的凸组合:
因此,当均衡战略X*=(x*,1-x*) 满足0<x*<1时,必有
则v*与向量AY*的任一分量值相等.这表明,均衡状态对应凸组合图形中的一个向量,该向量的两个分量必须相等.
视支付矩阵A的每一列为二维坐标平面上的一个点,对这n个点做凸组合,得到
一个凸多边形,另,定义等分量线v1=v2,则等分量线与凸多边形的位置关系无
外乎相离与相交两种情况.
1)凸多边形位于等分量线同侧.如图1所示.在这种情况下,参与人1存在一个(弱)占优策略,博弈有一个重复剔除占优均衡.
2)等分量线与凸多边形相交,在这种情况下存在混合战略均衡,且坐标最小的一个交点给出博弈值及均衡策略.不妨考虑一个2×3的零和博弈,其一般形式如表1
所示:
姑且设博弈的均衡为,若y∈(0 ,1) ,则对于局中人1的混合战略(x,1-x)T,局中人2选择纯战略L与C将带来等量期望支付:
可解得
另一方面,由于局中人2在均衡状态下以零概率选择纯战略R,因此有
就几何位置而言,若支付点(a13,a23)T位于点(a11,a21)T及点(a12,a22)T所连直线
的上方①该线段必须是下降的,否则其上侧端点必对应于参与人2的劣战略,不可能出现于其混合战略之中.因此,其它支付点当位于该线段所在直线上方.为防止出现意外情况,画图前最好先剔除劣战略.,则必有
可证明,式(4)是式(3)的充分条件,事实上,由于概率,从而
则局中人2选择纯战略R对应的负支付满足
或者说,给定局中人1的均衡战略(x,1-x)T,相较纯战略R而言,局中人2选择纯战略L或C将带来更高的期望收益.如图2所示,三角形的顶点L、C、R分别由支付矩阵的列向量1、2、3所确定,由于R点位于直线LC的上侧,这一几何位置关系使得均衡状态下的局中人2必须以零概率选择纯战略R.
进一步可证明,根据直线LC与等分量线交点N.E.的几何位置可确定博弈值及均衡战略组合.显然,N.E.点可表示为三角形顶点L、C、R的一个凸组合,或者说,N.E.点坐标(e11,e21)T满足如下条件:
由此可定义参与人2的一个混合战略(y,1-y,0)T,再根据式(2)定义参与人1的混合战略(x,1-x)T,则是一个混合战略纳什均衡,且博弈值为e11=e21.
这是因为,给定式(2)所定义的(x,1-x)T,参与人2选择纯战略L与C将带来无差异的期望支付,由式(4),参与人2在均衡状态下选择纯战略R不如选择纯战略L或C,因此(y,1-y,0)T是一个最优战略.反之,当参与人2选择由(4)式所定
义的混合战略(y,1-y,0)T时,参与人1选择任意战略皆带来相同的期望支付,则(x,1-x)T也是一个最优战略.对应于均衡的博弈值e11=e21,由N.E.点坐标给出,这是显然的.
无疑,均衡未必单一,甚至存在无穷多均衡的情况.比如,当支付列向量存在至少
三点共线时,可能出现无穷多均衡.如图3所示,支付点L、C、R共线,等分量线与直线LCR的交点N.E.存在无穷多的凸组合形式,此时有无穷多均衡.
以上考虑的是2×n型零和博弈的图解法,相仿佛的,对于m×2型零和博弈,可
先确定参与人1的均衡战略.方法是视支付矩阵A的每一行为二维坐标平面上的一
个点,对其进行凸组合得到一个凸多边形,考虑等分量线与该凸多边形坐标最大的一个交点,该交点确定了博弈的均衡.
考虑一个2×n型的零和博弈.设参与人1有两个纯战略:U、D,参与人2有三个
纯战略:L、C、R;给定纯战略组合,参与人1的支付见表2.
根据前方论述,先考虑参与人2的战略选择问题.将点对描于坐标平面上,并绘出
其凸组合多边形(见图4),其中直线CR方程为该直线与直线v2=v1的交点是,因此博弈的值为.另外,可表示为三角形三个顶点的凸组合:
可知参与人2的最优混合策略是.在此基础上,可确定局中人1的最优策略.对于参与人1的均衡策略(x,1-x)T,参与人2选择纯战略C与R应该能带来相同的期望
支付,即解得,则参与人1的均衡策略为,从而得到该博弈的一个混合战略均衡
对应的博弈的值为.
如果要利用一般图解法,必须首先确定局中人1的均衡策略.如图5所示,对于局
中人1的任意混合战略(x,1-x)T,当局中人2选择纯战略R时,局中人1的期望收益由直线AB的纵坐标给出,类似地,当局中人2选择纯战略L、C时,局中人1
的期望收益曲线分别是CD、BC.根据最小最大值原理,局中人1的最优战略是在
最小值折线ABCD上选择最大值点,即B点,由两个相似三角形的相似比容易得
出其最优战略是
再考虑一个m×2型的零和博弈.设参与人1有三个纯战略:U、M、D,参与人2有两个纯战略:L、R;给定纯战略组合,参与人1的支付如表3所示.
本例中需要先确定局中人1的均衡策略,如前所述,均衡由等分量线与凸多边形坐标最大的交点所决定.在图6中,UM所在直线方程为17,与等分量线的交点为N.E.,博弈均衡由N.E.点给出,由于
因此,局中人1的均衡策略是.另外,不难求得局中人2的均衡策略为,于是得到博弈的混合战略纳什均衡,值为
总之,与一般图解法一样,凸组合方法可以确定简单零和博弈的纳什均衡及均衡的值,不同点在于凸组合方法首先确定的是多个纯策略拥有者的混合策略,而一般图解法确定的是仅拥有2个纯策略的局中人的混合策略.因此,凸组合方法可说是一般图解法的互补方法.
【相关文献】
[1]John von Neumann.Zur Theorie der Gesellschaftsspiele[J].Mathematische
Annalen,1928(100):295-300.
[2]J·麦克金赛.博弈论导引[M].北京:人民教育出版社,1960.
[3]王建华.对策论[M].北京:清华大学出版社,1986.。