综合I类与II类理性人的博弈策略

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

综合I类与II类理性人的博弈策略

两人零和博弈作为较归整的形式,在博弈论的早期研究中差不多得到的深入讨论。本文引入了I类理性与II类理性的概念,认为现实博弈中的参与人往往既可能从I类理性的角度采取战略,也可能是从II类理性人的角度动身,因此,构造了一个综合了I类和II类理性特征的支付矩阵,通过对一些常见的非零和博弈实例进行讨论,认为这一模型能够解决战略选择的不确定性问题。但本文没有对此进行严格的数学证明。

在经济学的博弈理论中,一般假设参与人(PLAYERS)具有理性人的特征, 即总是寻求自身的最大化利益,选择能使个人利益最大化的策略。在计算收益的时候,使用的是个人所得。这是一个“绝对量”,而现实中,也存在着另外一种情况,也确实是参与者之间除了考虑自己的所得之外,也专门关怀对方的所得,并比较相互间的差异,采取使“相对”所得最大化的策略。我们不妨把以追求相对所得最大化的行为人称为II类理性人,并从博弈论的角度对他们的行为模式进行研究。

具有II类理性特征的现象在专门多方面都有存在。比如,我们在人际交往中确实会碰到一些“损人利己”的人,也会见到“损人不利己”的人,从我们观点看来,他们是非理性的,然而进行换位考虑就会发觉,事实上他们的行事原则是相对来讲,总要让自己占廉价或者自己吃得亏比对方少,至于不人是否会吃亏,不是他们考虑的因素,这也是一种“理性”行为,也有出于心理层面的考虑,认为自己所得相对较少或者自己损失较大是一种不公平,并从自己的角度动身进行策略选择。在激烈的市场角逐中,竞争双方在短期内有时会不计代价地采取大出血的策略而欲先致对手于死地,希望对手先被淘汰而自己会坚持到最后。假如做不到这点,也要最大程度地削弱对手力量,使其一蹶不振而可不能对自己再构成威胁。这种商场竞争,并期望自己能笑到最后的思维,也是“理性”的。有研究表明,国际关系中如此的II类理性的例子更许多见。这些尽管是比较极端的例子,现实生活中,更多的可能是,每个人或组织都会考虑自己的所得,并期望自己的所得比不人的大。关键是对两种所得在考虑时的权数是随情况不同而变化的。假如否定在策略选择中的II类理性因素,可能会对一些现象无法解释。尽管从道德角度讲不值得提

倡,而且从价值评判上总是受到责备, 但作为一种存在的现象,仍然有必要加以研究。但本文从II类理性个体的博弈战略开始,并过渡到一个综合了I类和II类理性行为的博弈模型,对例中设计的参与人的战略选择,只进行经济学分析而不做道义上的衡量。

当博弈参与者是II类理性人时, 现在收益矩阵的取值有一定的规律。假设两个参与人甲和乙差不多上II类理性人时,对比在I类理性的得益矩阵(图1)

S1 S2

甲 S1 (m1,n1) (m2,n2)

S2 (m3,n3) (m4,n4)

图1.I类理性参与人收益矩阵

II类理性参与人的得益矩阵如下图所示:

S1 S2

甲 S1 (m1-n1,n1-m1) (m2-n2,n2-m2)

S2 (m3-n3,n3-m3) (m4-n4,n4-m4)

图2.II类理性参与人收益矩阵

专门明显,在II类理性参与人进行的博弈里,在每一个战略组合下,双方的得益之和必为零,现在的博弈具有零和的性质。这确实是早期博弈论中重点研究的二人零和博弈的情形,在1910年~1930年间, 作为绝对竞争的形式,零和博弈被认为是博弈理论中的要紧形态得到了深入的研究。而且对零和博弈的研究成果成为了现代博弈理论中专门多新理论的基础概念。

作为一个练习,我们把常见博弈模型改为零和博弈情形,来看相应的结果会是如何样的。一般认为,零和博弈是一种常和博弈,而最普遍意义下的博弈情形是特不和的。

例1.囚犯困境

甲,乙涉嫌同谋犯罪,分不在两个房间被提审。提审官预先向两人交代政策:假如他们都承认犯罪事实,各判刑10年;假如两人都否认,双方都无罪释放;假如一方认罪一方抵赖,认罪方获500元奖励,抵赖方被判15年。在非零和博弈情形下的支付矩阵如下:

承认抵赖

甲承认 (-10,-10) (5,-15)

抵赖 (-15,5) (0,0)

图3

纳什均衡策略是(承认,承认),假如甲乙两人是II类理性人,他们的相应支付矩阵就变成了:

承认抵赖

甲承认 (0,0) (20,-20)

抵赖 (-20,20) (0,0)

图4

能够看出,纳什均衡策略依旧(承认,承认)。

例2.春节前夕,某小镇上两个商铺甲和乙同时看到一个赚钞票机会:去城里贩一批鞭炮回来卖,购货款加上运输费共5000元,假如没有竞争对手,这批货在小镇上能卖6000元;但假如另一家商铺也同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。

关于甲乙差不多上I类理性人而言,有支付矩阵:

进货不进货

甲进货 (-1000,-1000) (1000,0)

不进货 (0,1000) (0,0)

图5

相关文档
最新文档