经典的囚徒困境-博弈策略

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

清楚地分析囚徒困境。

实验经济学常用这种博弈的一般形式分析各种论题。

以下是实现一般形式的其中一例：
有两个参与者和一个庄家。

参与者每人有一式两张卡片，各印有“合作”和“背叛”。

参与者各把一张卡片文字面朝下，放在庄家面前。

文字面朝下排除了参与者知道对方选择的可能性1。

然后，庄家翻开两个参与者卡片，根据以下规则支付利益：
一人背叛、一人合作：背叛者得5分（背叛诱惑），合作者0分（受骗支付）。

二人都合作：各得3分（合作报酬）。

二人都背叛：各得1分（背叛惩罚）。

用支付矩阵表格展示支付如下（以红和蓝分别表示二参与者）：
一般形式囚徒困境的支付矩阵
合作背叛
合作3, 3 0, 5
背叛5, 0 1, 1
以“T、R、P、S”符号表示
合作背叛
合作R, R S, T
背叛T, S P, P
以“胜－负”术语表示
合作背叛
合作胜, 胜大负, 大胜
背叛大胜, 大负负, 负
简单博弈获得的点数可以得出一些一般化的结论。

T、R、P、S符号表
符号分数解释
T 5 单独背叛成功所得。

R 3 共同合作所得
P 1 共同背叛所得
S 0 被单独背叛所获
若以T（Temptation）=背叛诱惑，R（Reward）=合作报酬，P（Punishment）=背叛惩罚，S（Suckers）=受骗支付，以个人选择得分而言，可得出以下不等式。

T>R>P>S 解：从5>3>1>0获得以上不等式
若以整体获分而言，将得出以下不等式。

2R>T+S或2R>2P
解：2×3>5+0或2×3>2x1；合作2人共得6分，比起互相背叛的共得2分及单独背叛的共得5分，显然合作获分比背叛高。

合作在团体而言是支配性策略。

而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。

就是说将使参与者脱离困境。

以上理论是道格拉斯·霍夫施塔特创建的。

在政治学中，两国之间的军备竞赛可以用囚徒困境来描述。

两国都可以声称有两种选择：增加军备（背叛）、或是达成削减武器协议（合作）。

两国都无法肯定对方会遵守协议，因此两国最终会倾向增加军备。

似乎自相矛盾的是，虽然增加军备会是两国的“理性”行为，但结果却显得“非理性”（例如会对经济造成都有损坏等）。

这可视作遏制理论的推论，就是以强大的军事力量来遏制对方的进攻，以达到和平。

两个国家，在关税上可以有以两个选择:提高关税，以保护自己的商品。

（背叛）;与对方达成关税协定，降低关税以利各自商品流通。

（合作）
当一国因某些因素不遵守关税协定，而独自提高关税（背叛）时，另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。

然后二国又重新达成关税协定。

（重复博弈的结果是将发现共同合作利益最大。

）。