经典的囚徒困境-博弈策略
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
清楚地分析囚徒困境。
实验经济学常用这种博弈的一般形式分析各种论题。
以下是实现一般形式的其中一例:
有两个参与者和一个庄家。
参与者每人有一式两张卡片,各印有“合作”和“背叛”。
参与者各把一张卡片文字面朝下,放在庄家面前。
文字面朝下排除了参与者知道对方选择的可能性1。
然后,庄家翻开两个参与者卡片,根据以下规则支付利益:
一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。
二人都合作:各得3分(合作报酬)。
二人都背叛:各得1分(背叛惩罚)。
用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者):
一般形式囚徒困境的支付矩阵
合作背叛
合作3, 3 0, 5
背叛5, 0 1, 1
以“T、R、P、S”符号表示
合作背叛
合作R, R S, T
背叛T, S P, P
以“胜-负”术语表示
合作背叛
合作胜, 胜大负, 大胜
背叛大胜, 大负负, 负
简单博弈获得的点数可以得出一些一般化的结论。
T、R、P、S符号表
符号分数解释
T 5 单独背叛成功所得。
R 3 共同合作所得
P 1 共同背叛所得
S 0 被单独背叛所获
若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。
T>R>P>S 解:从5>3>1>0获得以上不等式
若以整体获分而言,将得出以下不等式。
2R>T+S或2R>2P
解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。
合作在团体而言是支配性策略。
而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。
就是说将使参与者脱离困境。
以上理论是道格拉斯·霍夫施塔特创建的。
在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。
两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。
两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。
似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。
这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。
两个国家,在关税上可以有以两个选择:提高关税,以保护自己的商品。
(背叛);与对方达成关税协定,降低关税以利各自商品流通。
(合作)
当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。
然后二国又重新达成关税协定。
(重复博弈的结果是将发现共同合作利益最大。
)。