综合I类与II类理性人的博弈策略分析

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

综合I类与II类理性人的博弈策略

两人零和博弈作为较归整的形式，在博弈论的早期研究中已经得到的深入讨论。本文引入了Ｉ类理性与ＩＩ类理性的概念，认为现实博弈中的参与人往往既可能从Ｉ类理性的角度采取战略，也可能是从ＩＩ类理性人的角度出发，因此，构造了一个综合了Ｉ类和ＩＩ类理性特征的支付矩阵，通过对一些常见的非零和博弈实例进行讨论，认为这一模型可以解决战略选择的不确定性问题。但本文没有对此进行严格的数学证明。

在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益，选择能使个人利益最大化的策略。在计算收益的时候，使用的是个人所得。这是一个“绝对量”，而现实中，也存在着另外一种情况，也就是参与者之间除了考虑自己的所得之外，也很关心对方的所得，并比较相互间的差异，采取使“相对”所得最大化的策略。我们不妨把以追求相对所得最大化的行为人称为II类理性人，并从博弈论的角度对他们的行为模式进行研究。

具有II类理性特征的现象在很多方面都有存在。

比如，我们在人际交往中确实会碰到一些“损人利己”的人，也会见到“损人不利己”的人，从我们观点看来，他们是非理性的，但是进行换位思考就会发现，其实他们的行事原则是相对来说，总要让自己占便宜或者自己吃得亏比对方少，至于别人是否会吃亏，不是他们考虑的因素，这也是一种“理性”行为，也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度出发进行策略选择。在激烈的市场角逐中，竞争双方在短期有时会不计代价地采取大出血的策略而欲先致对手于死地，希望对手先被淘汰而自己会坚持到最后。如果做不到这点，也要最大程度地削弱对手力量，使其一蹶不振而不会对自己再构成威胁。这种商场竞争，并期望自己能笑到最后的思维，也是“理性”的。有研究表明，国际关系中这样的II类理性的例子更不少见。这些虽然是比较极端的例子，现实生活中，更多的可能是，每个人或组织都会考虑自己的所得，并期望自己的所得比别人的大。关键是对两种所得在考虑时的权数是随情况不同而变化的。如果否定在策略选择中的II 类理性因素，可能会对一些现象无法解释。尽管从道德角度讲不值得提倡，而且从价值评判上总是受到谴责, 但作为一种存在的现象,仍然有必要加以研究。但本文从II类理性个体的博弈战略开始，并过渡到一个综合了I类和II类理性行为的博弈模型，对例中设计的参与人的战略选择，只进

行经济学分析而不做道义上的衡量。

当博弈参与者是II类理性人时, 此时收益矩阵的取值有一定的规律。假设两个参与人甲和乙都是II类理性人时，对比在I类理性的得益矩阵(图１)

乙

S1 S2 甲 S1 (m1,n1) (m2,n2)

S2 (m3,n3) (m4,n4)

图１．Ｉ类理性参与人收益矩阵

ＩＩ类理性参与人的得益矩阵如下图所示：

乙

S1 S2

甲 S1 (m1-n1,n1-m1) (m2-n2,n2-m2)

S2 (m3-n3,n3-m3) (m4-n4,n4-m4)

图２．ＩＩ类理性参与人收益矩阵

很明显，在ＩＩ类理性参与人进行的博弈里，在每一个战略组合下，双方的得益之和必为零，此时的博弈具有零和的性质。这就是早期博弈论中重点研究的二人零和博弈的情形,在1910年~1930年间, 作为绝对竞争的形式,零和博弈被认为是博弈理论中的主要形态得到了深入的研究。而且对零和博弈的研究成果成为了现代博弈理论中很多新理论的基础概念。

作为一个练习，我们把常见博弈模型改为零和博弈情形，来看相应的结果会是怎样的。一般认为，零和博弈是一种常和博弈，而最普遍意义下的博弈情形是非常和的。

例1．囚犯困境

甲，乙涉嫌同谋犯罪，分别在两个房间被提审。提审官预先向两人交代政策：如果他们都承认犯罪事实，各判刑10年；如果两人都否认，双方都无罪释放；如果一方认罪一方抵赖，认罪方获500元奖励，抵赖方被判15年。在非零和博弈情形下的支付矩阵如下：

乙

承认抵赖甲承认 (-10,-10) (5,-15)

抵赖 (-15,5) (0,0)

图3

纳什均衡策略是（承认，承认），如果甲乙两人是II类理性人，他们的相应支付矩阵就变成了：

乙

承认抵赖

甲承认 (0,0) (20,-20)

抵赖 (-20,20) (0,0)

图4

可以看出，纳什均衡策略还是（承认，承认）。

例2．春节前夕，某小镇上两个商铺甲和乙同时看到一个赚钱机会：去城里贩一批鞭炮回来卖，购货款加上运输费共5000元，如果没有竞争对手，这批货在小镇上能卖6000元；但如果另一家商铺也同时在小镇上卖鞭炮，价格下跌使得这批鞭炮只能卖4000元。

对于甲乙都是I类理性人而言，有支付矩阵：

乙

进货不进货

甲进货 (-1000,-1000) (1000,0)

不进货 (0,1000) (0,0)

图5

（不进货，进货）和（进货，不进货）为纳什均衡策略。但是问题在于，甲乙双方同时行动，而互相不知道对方采取的行动。

如果甲乙都是II类理性人，那么情况会变成：

乙

进货不进货

甲进货 (0,0) (1000,-1000)

不进货 (-1000,1000) (0,0)

图6

此时的纳什均衡策略就是（进货，进货）。

例3．利己与利他

甲乙作为I类理性人，其支付矩阵为

乙

利己利他

甲利己 (1,1) (4,0)

利他 (0,4) (3,3)

图7

纳什均衡是（利己，利己）；

甲乙作为II类理性人，其支付矩阵转化为：

乙

利己利他

甲利己 (0,0) (4,-4)

利他 (-4,4) (0,0)

图8

纳什均衡仍然是（利己，利己）。

例4．智猪博弈

一头大猪和一头小猪被关在同一个猪圈里。猪圈的一头安装着一个特制的按键，另一头安装着一个食槽。但一头猪按下按键时，会有10单位的食物进入槽中，但按键的猪会付出2单位的成本；如果大猪先到食槽，则小猪只能吃到1单位的残羹剩饭；但若小猪先到的话，则它能吃到4单位的食物。