经典的囚徒困境-博弈策略

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

清楚地分析囚徒困境。

实验经济学常用这种博弈的一般形式分析各种论题。

以下是实现一般形式的其中一例:
有两个参与者和一个庄家。

参与者每人有一式两张卡片,各印有“合作”和“背叛”。

参与者各把一张卡片文字面朝下,放在庄家面前。

文字面朝下排除了参与者知道对方选择的可能性1。

然后,庄家翻开两个参与者卡片,根据以下规则支付利益:
一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。

二人都合作:各得3分(合作报酬)。

二人都背叛:各得1分(背叛惩罚)。

用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者):
一般形式囚徒困境的支付矩阵
合作背叛
合作3, 3 0, 5
背叛5, 0 1, 1
以“T、R、P、S”符号表示
合作背叛
合作R, R S, T
背叛T, S P, P
以“胜-负”术语表示
合作背叛
合作胜, 胜大负, 大胜
背叛大胜, 大负负, 负
简单博弈获得的点数可以得出一些一般化的结论。

T、R、P、S符号表
符号分数解释
T 5 单独背叛成功所得。

R 3 共同合作所得
P 1 共同背叛所得
S 0 被单独背叛所获
若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。

T>R>P>S 解:从5>3>1>0获得以上不等式
若以整体获分而言,将得出以下不等式。

2R>T+S或2R>2P
解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。

合作在团体而言是支配性策略。

而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。

就是说将使参与者脱离困境。

以上理论是道格拉斯·霍夫施塔特创建的。

在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。

两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。

两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。

似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。

这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。

两个国家,在关税上可以有以两个选择:提高关税,以保护自己的商品。

(背叛);与对方达成关税协定,降低关税以利各自商品流通。

(合作)
当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。

然后二国又重新达成关税协定。

(重复博弈的结果是将发现共同合作利益最大。

)。

相关文档
最新文档