囚徒困境研究专题
囚徒困境专题综述53页PPT
56、极端的法规,就是极端的不公。 ——西 塞罗 57、法律一旦成为人们的需要,人们 就不再 配享受 自由了 。—— 毕达哥 拉斯 58、法律规定的惩罚不是为了私人的 利益, 而是为 了公共 的利益 ;一部 分靠有 害的强 制,一 部分靠 榜样的 效力。 ——格 老秀斯 59、假如没有 就会消 灭。— —洛克
60、人民的幸福是至高无个的法。— —西塞 罗
31、只有永远躺在泥坑里的人,才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭,生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍,就是一下子不要学很多。——洛克
囚徒困境专题
1
多种情景,一个思想
五一、商场
2
多种情景,一个思想
美国大选 民主党 共和党 中间策略
3
多种情景,一个思想
渔业 物种灭绝
4
囚徒困境
两个小偷甲和乙联手作案,私入民宅被警方逮 住但未获证据。警方将两人分别置于两间房间分 开审讯,政策是若一人招供但另一人未招,则招 者立即被释放,未招者判入狱10年;若二人都招 则两人各判刑8年;若两人都 不招则未获证据但因私入民宅 各拘留1年。
国家法律 梁启超:我国成文法之起源不可确指, 然以数千年之思想往往视法律与命令为 一物 国家法律措施是无效率还是高效率?
13
用法律解决“囚徒困境”
合作 合作 不合作 T,T R-X,S 不合作 S,R-X P,P
满足:X>R-T
14
公共产品(public goods)
提供 提供 不提供 4,4 5,-1 不提供 -1,5 0,0
—Newmark&Lewis公司终身低价保证
38
乍一看,这两家企业在玩命竞争, 根本不可能形成价格联盟,即使形成也 难以维持,因而它们之间似乎是在打价 格战。但是,一种潜在的侦察降低价格 行为的机制阻止了价格战的发生。 若每台录相机的批发价为150美元, 此时两家企业正以每台300美元的价格出 售。“疯狂艾迪”打算降为每台275美元, 从而将对手的顾客拉过来,如那些家住 在对手售货点附近或过去曾买过对手商 品的顾客。
19
例子 2 为什么政府要负责修建公共设施,因 为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为 4,每个农家从修好的好路上获得的好处 为 3。如果两户居民共同出资联合修路,并平 均分摊修路成本,则每户居民获得净的好处 (支付)为 3-4/2=1;当只有一户人家单独出 资修路时,修路的居民获得的支付为 3-4=-1 (亏损), “搭便车”不出资但仍然可以使 用修好的路的另一户人家获得支付3-0=3。
博弈论的囚徒困境模型
博弈论的囚徒困境模型引言博弈论是研究决策制定者在多方面利益冲突下进行选择的一门学科。
而囚徒困境模型是博弈论中最经典的模型之一,用于描述两个合作者之间存在利益冲突时可能出现的情况。
本文将详细介绍囚徒困境模型的基本概念、策略和解决方法,并探讨其在现实生活中的应用。
1. 囚徒困境模型的基本概念囚徒困境模型最早由美国数学家Melvin Dresher和Merrill Flood于1950年提出。
它是一个非零和博弈模型,意味着合作者之间的利益不完全一致,他们可以选择合作或背叛对方,从而获得不同的收益。
在囚徒困境模型中,通常有两名犯人被关押在不同的牢房里,无法相互沟通。
检察官给每个犯人提供了一个选择:如果两个人都保持沉默(即合作),那么他们将分别被判处较轻的刑期;如果其中一个人背叛(即不合作),而另一个人保持沉默,那么背叛者将被释放,而保持沉默者将被判处重刑;如果两个人都背叛,那么他们将各自被判处较重的刑期。
2. 囚徒困境模型的策略在囚徒困境模型中,每个犯人都有两种基本策略:合作和背叛。
根据对方的选择和自己的选择,可以得出四种不同的结果:互相合作、互相背叛、自己合作对方背叛、自己背叛对方合作。
这些结果对应着不同的收益。
为了量化这些收益,通常使用一个称为支付矩阵的工具。
支付矩阵是一个2x2的矩阵,其中每个元素表示在不同情况下每个合作者获得的收益。
在标准囚徒困境模型中,支付矩阵可以表示为:合作背叛合作R,R S,T背叛T,S P,P其中R表示互相合作时的收益,T表示自己背叛对方合作时的收益,S表示自己合作对方背叛时的收益,P表示互相背叛时的收益。
通常,R > T > P > S。
3. 囚徒困境模型的解决方法在囚徒困境模型中,每个犯人都希望获得最大的个人利益。
然而,如果两个犯人都追求个人利益,那么最终的结果将是两败俱伤。
如何选择合适的策略成为了一个关键问题。
在博弈论中,有许多不同的解决方法可以用于囚徒困境模型。
工程项目管理中的“囚徒困境”博弈研究
探 爨
■—广 c
磊嚣
的可能性 。其具体特征包括 : 产品的特性被普通使用者了解 的程 度比较高 ; 产品 的使用对环境的要求较低 ; 产品的质量风险对人
体健康与人身 、 财产安全产生的危害程度较轻 。 () 2 重点产品的界定及其特征 。重点产 品包括 电热毯 、 力 压 锅、 燃气热水器 、 低压 电器 、 开关 、 重要计量器 具 、 卫星电视广播 地面接收设备 、 无线广播 电视发射设备 、 安全网 、 安全帽 、 筑扣 建 件等劳动安全保障产品 、 电力铁塔 桥梁支座 、 工业产 品 、 铁路 水 工金 属结构 、 危险化学品及 其包装物 、 容器等 影响生产安 全 、 公 共安全的产品。 重点产品的安全性 能不太稳定 , 且存在对人体健
理组建项 目部 , 由项 目部组织人员进行施 工。这种情况下 , 目 项
经理在和公 司领 导博 弈时仍 有高价和低价两 种策略可供选择 。
f 5 】陈贵 松 、 秀娟 : 林 旅 游 产 品 的 分 类 、 征 及 开 发研 究 U. 黄 森 特 】 林
业 经济 问题 ( 月刊 ) 2 0 ( ) 双 ,0 3 6 .
【】 6 王艳平 : 温泉洗浴旅 游产品的分类及其 开发 方向U. ]中南林业
科 技 大 学学 报 ( 会 科 学版 ) 2 0 ( ) 社 ,07 9 .
的内部竞争机 制 ,也会大幅度地增强全体 员工的竞争意识 , 提 高企业 的业务技术水平 、 整体管理水平和竞争能力。
2 企业和项 目经理的博 弈分析 、
施 工企业在 市场上承接到工程任 务以后 , 可能会交给下设 的工程处 , 由工程 处组织人 员进行施 工 , 也可能 会指定项 目经
囚徒困境拓展实验报告
囚徒困境拓展实验报告1. 背景介绍囚徒困境是博弈论中的一个经典问题,讲述了两名罪犯被单独审问,被告诱供出对方的情况。
在此情景下,博弈的最优策略是什么?这个问题引发了学术界广泛的探讨,而囚徒困境拓展实验也是在此背景下展开的。
2. 实验设计为了更好地研究囚徒困境的策略选择,我们设计了一个拓展实验。
实验中参与者以角色扮演的方式,扮演囚徒和警察,通过决策和博弈来模拟真实的囚徒困境。
实验的主要内容如下:2.1 参与者分组我们招募了一百名参与者,将其以随机方式分为囚徒组和警察组。
每组各有五十名参与者。
2.2 游戏规则游戏分为五轮进行。
每个回合的游戏规则如下:- 每个囚徒对每个警察进行一次选择,可以选择合作或背叛。
- 合作表示不揭发对方,获得3分。
- 背叛表示揭发对方,获得1分。
- 如果两个囚徒都选择合作,则每个人获得2分。
- 如果一个囚徒选择背叛,而另一个选择合作,则背叛的囚徒获得5分,合作的囚徒获得0分。
2.3 统计数据在游戏进行的同时,我们记录了每一轮的参与者选择和获得分数情况。
通过统计数据,我们可以分析参与者的策略选择和博弈效果。
3. 实验结果经过五轮的游戏,我们得到了如下实验结果:3.1 囚徒组策略选择分析囚徒组中,参与者的策略选择大致分为两种:- 个体理性:有一部分囚徒参与者在前几轮中选择了背叛,以追求更高的个体收益,但在后续观察到其他囚徒普遍合作后,逐渐倾向于选择合作。
- 合作主义:另一部分囚徒参与者一直坚持选择合作,始终希望通过团队合作获得更高的总体收益。
3.2 警察组策略选择分析警察组中,参与者也有两种策略选择:- 鸽派:一部分警察参与者倾向于选择合作,希望通过与囚徒团结合作,减少犯罪行为,从而获得更好的社会效益。
- 鹰派:另一部分警察参与者更倾向于选择背叛,以对付囚徒的“欺骗”,以自身利益为出发点。
3.3 获得分数统计通过实验记录的数据,我们计算了每个参与者的平均得分。
囚徒组中,个体理性囚徒的平均得分为4.2分,合作主义者的平均得分为2.8分。
囚徒困境
合作协议:达成合作协议,明确双方的责任和义务
惩罚机制:设立惩罚机制,对背叛行为进行惩罚
01
纳什均衡:在博弈论中,纳什均衡是指一种稳定的策略组合,使得每个参与者都不会因为改变策略而获得更好的结果。
02
合作与竞争:博弈论研究如何在合作与竞争中实现最优策略,以达到最佳结果。
03
应用领域:博弈论在政治、经济、军事、管理等领域都有广泛的应用,可以帮助人们更好地理解和解决实际问题。
04
经济学
博弈论:囚徒困境是博弈论的经典案例,研究参与者在决策过程中如何达到最优解
04
囚徒困境在市场营销中的应用:分析企业在市场竞争中的策略选择和合作竞争关系
囚徒困境在博弈论中的应用:分析博弈双方在决策过程中的策略选择
囚徒困境的破解
合作策略
建立信任:通过沟通和交流,建立双方之间的信任关系
01
信息共享:共享信息,使双方都能了解对方的意图和策略
02
制定规则:制定合作规则,确保双方都能遵守并执行
演讲人
囚徒困境
囚徒困境概述
囚徒困境的破解
囚徒困境的应用
囚徒困境概述
概念解释
囚徒困境:一种博弈论模型,描述两个囚犯在无法沟通的情况下,如何进行决策以获得最佳结果。
01
囚徒困境的决策结果:如果两个囚犯都选择合作,则两人都获得较低的刑罚;如果两个囚犯都选择背叛,则两人都获得较高的刑罚;如果一个囚犯选择合作,另一个选择背叛,则选择合作的囚犯将受到最严重的惩罚,选择背叛的囚犯将获得最轻的惩罚。
市场机制:囚徒困境可以解释市场机制中的合作与竞争关系
企业战略:囚徒困境可以指导企业在市场竞争中制定战略
公共政策:囚徒困境可以应用于公共政策制定,如环境保护、税收政策等
囚徒困境的论文
走出“囚徒困境”囚徒困境作为博弈论中的一个经典范例,其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视,辩证的看待这一研究现象,是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。
一、囚徒困境经典案例分析囚徒困境的内容是这样的:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
若二人都互相检举(互相“背叛”),则二人同样判监2年。
用表格概述如下:们各自都有“不坦白”和“坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以把他们的决策看作是同时做出的。
博弈的结果是:由于这两个囚徒之间不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,双方又都不敢相信或者说指望对方有合作精神,因此只能实现对他们都不理想的结果(各判2年),并且这个结果具有必然性,很难摆脱,因此这个博弈被称为“囚徒困境”。
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
但是这样的分析是基于单次博弈的基础之上,而在重复的囚徒困境中,博弈会被反复的进行,因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
二、类似囚徒困境的经典案例分析在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
博弈论囚徒困境案例
博弈论囚徒困境案例博弈论囚徒困境案例引言博弈论是研究人类决策行为的一门学科,它探讨的是在多个参与者之间进行决策时,每个参与者的最优策略和最终结果。
其中,囚徒困境是博弈论中比较典型的案例之一。
一、什么是囚徒困境囚徒困境是博弈论中的一个经典问题,它描述了两个犯罪嫌疑人被捕后面临的选择问题。
如果两个嫌疑人都保持沉默,则他们都会获得轻判;如果一个人供出另一个人,则供出者将获得免罪或轻判,而另一个人则会被判重刑;如果两个人都供出对方,则他们都将被判重刑。
这种情况下,每个嫌疑人都会考虑自己的利益和对方可能做出的选择。
二、实际案例分析1. 美苏核武器竞赛美苏核武器竞赛可以看作是一个大规模的囚徒困境问题。
在20世纪50年代和60年代,美国和苏联都在积极研发核武器,这导致了一种军备竞赛的局面。
如果两个国家都不研发核武器,则两国都可以获得和平和安全;如果一个国家研发核武器而另一个国家不研发,则前者可以获得军事优势,后者则会处于劣势;如果两个国家都研发核武器,则两国都将处于危险之中。
这种情况下,每个国家都会考虑自己的利益和对方可能做出的选择。
2. 环保问题环保问题也可以看作是一个囚徒困境问题。
如果每个人都能够积极参与环保行动,那么整个社会将会受益;但是,如果有些人不愿意参与环保行动而其他人却积极参与,那么后者将付出更多的代价。
这种情况下,每个人都要考虑自己的利益和其他人可能做出的选择。
三、如何解决囚徒困境1. 合作合作是解决囚徒困境的最佳策略。
在合作的情况下,两个嫌疑人都会保持沉默,从而都能够获得轻判。
在其他的囚徒困境问题中,合作也可以带来更好的结果。
2. 威慑威慑是解决囚徒困境的另一种策略。
在威慑的情况下,一个嫌疑人会选择供出另一个人,以期望获得免罪或轻判。
这种策略需要有足够的信誉和实力来支持,否则可能会适得其反。
3. 协商协商是解决囚徒困境的另一种策略。
通过协商,两个嫌疑人可以达成共识并保持沉默,从而都能够获得轻判。
合作与囚徒困境理论的实证研究
合作与囚徒困境理论的实证研究引言:合作与囚徒困境理论是博弈论的一个重要分支,它描述了在合作与背叛的选择之间存在的困境。
在现实生活以及各个领域的研究中,囚徒困境理论都可以提供有效的解释和指导。
本文将通过对几个实证研究的探讨,深入理解合作与囚徒困境理论的应用和可能的解决方法。
一、囚徒困境理论的理论基础囚徒困境理论是由著名数学家冯·诺依曼和经济学家摩根斯特恩提出的。
在这个理论中,两个合作者面临着合作或背叛的选择。
如果两个人都合作,他们将得到较好的结果;如果一个人背叛而另一个人合作,背叛者将获益最大;如果两个人都背叛,他们将得到最差的结果。
这种矛盾的选择导致了困境的产生。
二、实验室实证研究实验室实证研究是合作与囚徒困境理论最常见的实证方法之一,通过设计实验情境,观察参与者的行为选择和结果。
例如,研究人员通常安排参与者进行多轮的合作与背叛选择,并记录他们的行为和收益。
通过分析这些数据,可以推导出参与者的合作倾向和囚徒困境的演化过程。
三、社会领域中的应用除了实验室实证研究,合作与囚徒困境理论在社会领域中也有广泛的应用。
例如,在商业合作中,双方经常面临着合作与背叛的选择。
根据囚徒困境理论,如果双方都合作,他们可以建立起长期的合作关系,共同获益。
但是,如果一方选择背叛,另一方的利益可能会受到损害,这导致了信任的问题和合作关系的不稳定性。
四、囚徒困境的解决方法囚徒困境理论提供了一些解决方案来克服合作困境。
其中最常见的是“进行合作的威胁策略”。
通过对合作者进行激励和威胁,可以迫使他们选择合作而不是背叛。
这种策略在实践中通常通过奖励和惩罚机制来实现,例如通过合同和奖励机制来确保合作的可行性和稳定性。
五、合作与囚徒困境理论的局限性尽管合作与囚徒困境理论在解释和指导实际问题中有一定的价值,但它也存在一些局限性。
首先,理论基于假设参与者都是理性的行为者,但实际中人们的行为往往受到情感和道德等因素的影响。
其次,理论的应用范围有限,不能涵盖所有的情境和研究领域。
囚徒困境PPTPPT课件
面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。
“囚徒困境”博弈的理论模型及现实思考
“囚徒困境”博弈的理论模型及现实思考(安徽大学经济学院,安徽合肥230601)从剖析“囚徒困境”博弈的4个基本理论模型入手,深入研究导致“囚徒”陷入困境的原因,再结合现实生活的实际,给出了解决“囚徒困境”问题的有效办法。
标签:“囚徒困境”博弈;理论模型;现实思考1 引言囚徒困境是博弈论中非零和博弈的经典范例,它最早是由Tucker于1950年提出。
它是建立在具有个人理性的理性人的基础上的,反映了个人最佳选择而非团体最佳选择。
虽然囚徒困境本身只具有模型性质,但是现实生活中类似囚徒困境的例子却屡见不鲜。
“人不为己,天诛地灭”这句古话虽然过于极端,但揭露了人性中的理性自利一面。
在很多时候,个体理性带来的却很可能是集体的不理性,如果每个人都仅按照自利的原则行事,其结果往往是所有人都遭受损失。
博弈论中的“囚徒困境”,正是对这一现象的真实写照。
可谓“你我谁不是囚徒,天下何处无困境”。
随着经济社会的不断发展,构建和谐社会成为我国社会发展的首要目标。
面对这些生活中普遍存在的“囚徒困境”问题,需要我们深入研究囚徒困境博弈的经典理论模型,结合我国现实,找到一条能够真正帮助我们走出困境的道路。
2 囚徒困境博弈的理论模型囚徒困境博弈模型随着博弈论的深入发展,具有很多不同的形式,通常分为:完全信息的静态博弈、完全信息的动态博弈、不完全信息的静态博弈和不完全信息的动态博弈。
在讨论囚徒困境博弈的各种理论模型之前,先让我们看看它的基本模型的内容:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。
为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”。
如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。
当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1年徒刑。
法律经济学案例囚徒困境(3篇)
第1篇一、引言囚徒困境是博弈论中一个著名的例子,它描述了两个理性个体在信息不完全的情况下,如何做出决策以最大化自己的利益。
在法律经济学领域,囚徒困境被广泛用来分析个体在法律规制下的行为选择。
本文将以一个具体的案例分析囚徒困境在法律经济学中的应用,探讨法律如何影响个体行为以及如何通过制度设计来优化社会资源配置。
二、案例分析1. 案例背景某市有两家相邻的工厂,分别生产有毒化学品。
由于环保法规的限制,两家工厂都必须采取措施减少污染物排放。
然而,由于信息不对称,两家工厂无法确切知道对方的具体排放情况。
在这种情况下,两家工厂面临着囚徒困境。
2. 个体决策(1)工厂A的决策工厂A考虑到如果工厂B遵守环保法规,而自己不遵守,将会面临高额的罚款。
因此,工厂A有动机选择不遵守法规。
但如果工厂B也不遵守法规,那么工厂A的罚款可能会降低。
在这种情况下,工厂A的理性选择是不遵守法规。
(2)工厂B的决策工厂B的决策过程与工厂A类似。
如果工厂A遵守环保法规,而工厂B不遵守,那么工厂B将面临高额罚款。
但如果工厂A也不遵守法规,那么工厂B的罚款可能会降低。
因此,工厂B的理性选择同样是不遵守法规。
3. 囚徒困境结果在囚徒困境中,两家工厂都选择了不遵守环保法规。
这种情况下,两家工厂都面临着罚款,但总体罚款金额比两家工厂都遵守法规时要低。
然而,这种结果并非最优,因为如果两家工厂都遵守法规,不仅罚款金额会降低,而且对环境的影响也会减少。
三、法律经济学分析1. 法律规制对囚徒困境的影响在法律经济学中,法律规制被视为一种外部干预,旨在影响个体的行为。
在本案例中,环保法规可以被视为一种法律规制。
通过分析囚徒困境,我们可以发现:(1)法律规制可以降低囚徒困境发生的概率。
在本案例中,如果环保法规更加严格,工厂A和工厂B选择遵守法规的可能性将增加。
(2)法律规制可以降低囚徒困境的结果。
在本案例中,如果环保法规对违反规定的罚款金额更高,那么两家工厂选择遵守法规的可能性将更大。
囚徒困境理论
囚徒困境理论囚徒困境是博弈论中一种经典问题,其理论对于研究合作与竞争的冲突具有重要意义。
本文将介绍囚徒困境理论的背景、问题描述以及可能的解决方案。
一、背景介绍囚徒困境理论最早由美国数学家A·W·塔克在1950年提出,后来由加拿大数学家梅尔文·邓纳姆发展完善。
它从博弈论的角度探讨了个体与整体之间的合作与竞争的问题。
囚徒困境是指在某些情况下,个体追求自身利益最大化会导致整体利益的减小,而合作对于整体利益的最大化是有利的。
二、囚徒困境的问题描述囚徒困境的典型情景是这样的:两名嫌疑犯被警方抓获,被控犯有一起抢劫案。
警察将两人分开审讯,没有足够的证据定罪,但如果两人都认罪,警方将对两人定罪,每人判5年监禁。
如果只有一个人认罪,而另一个人不认罪,认罪的人将被判10年监禁,不认罪的人将被判1年监禁。
两人都不认罪,警方只能以非法拘禁的罪名对两人各判刑3年。
这个问题给了每个嫌疑犯两个选择:合作或背叛。
合作即都不认罪,背叛即只有一个人认罪。
根据每个人的利益最大化原则,认罪是一个利于个体的选择,因为无论对方合作与否,认罪都能使自己的刑期缩短。
三、囚徒困境的解决方案囚徒困境的解决方案中,最为经典的是“互相背叛”的结果。
因为无论对方如何,背叛都能使个体的利益最大化。
在现实生活中,这种结果带来了相互不信任及合作无序的后果。
然而,有许多研究者在囚徒困境的研究中寻求寻找其他的解决方案。
其中最有名的是“互相合作”的策略。
这种策略的核心是建立信任,通过共同合作来达到整体利益的最大化。
如果嫌疑犯们能够相互合作,拒绝认罪,那么他们都可以只被判3年监禁,从而使得整体利益得到最大化。
这需要在囚徒困境中,个体放弃短期利益,选择合作,以求获得更大的长期回报。
四、囚徒困境理论的应用囚徒困境理论被广泛应用于多个领域,例如经济学、国际关系、生物学等。
在经济学中,囚徒困境理论被用来解释市场中的合作与竞争。
在国际关系中,它被应用于研究不同国家之间的合作与冲突。
关于囚徒困境的几个问题(有标注)
关于囚徒困境的几个问题摘要:囚徒困境是博奕论中的一个重要范例,对这个问题的研究涉及经济学、政治学、社会学、哲学、伦理学等广泛的领域。
本文简要地介绍和评述了中外学者在这个问题研究中取得的成果及进行解释时提出的多种见解。
囚徒困境提示的个人理性和集体理性、个人主义与道德主义的关系深化了对这些问题的认识。
本文最后介绍了用计算机比赛方法研究重复的囚徒困境和合作问题的成果,分析了“一报还一报”程序取得成功和合作得以出现的原因和条件。
关键词:囚徒困境理性道德合作一、什么是囚徒困境1994年10月12日,瑞典皇家科学院宣布把该年度的诺贝尔经济学奖授予约翰·纳什(J.Nash)、约翰·豪尔绍尼(J.Harsanyi)和莱因哈德·泽尔腾(Reinhard Selten)以表彰他们把博奕论(game theory,又译为对策论或游戏论)应用于现代经济分析所作的卓越贡献。
以此为契机,我国在1995年出现了一个小小的介绍博奕论的“热潮”。
许多读者大概已经注意到:在介绍博奕论的文章中几乎篇篇都会提到所谓的囚徒的困境。
囚徒困境的原文为the Prisoner's Dilemma,又译为囚犯的两难困难,囚犯难题等。
这个问题是大约在1950年首先由社会心理学家梅里尔·M.弗勒德(Merril M.Flood )和经济学家梅尔文·德雷希尔(Melvin Dresher)提出来的,后来由艾伯特·W.塔克(Albert W.Tucker)明确地叙述了这种“困境”[1,p.3]。
纳什有两篇关于非合作博奕的重要文章分别发表于1950年和1951年。
有人认为:塔克的这项工作同纳什的著作一起“基本上奠定了现代非合作博奕论的基石。
〔2 〕囚徒困境的重要地位和重要意义由此就不难想象了。
所谓囚徒困境可简要地叙述如下:两个涉嫌共谋犯罪的嫌疑犯被捕后被警察关在相互隔离的牢房中。
他们面临的选择是:或者坦白或者保持沉默(即不坦白)。
囚徒困境囚徒困境课件
提高信息透明度与沟通效率
总结词
信息透明度和沟通效率的提高有助于减少误解和猜疑,促进囚犯们选择合作策略。
详细描述
在囚徒困境中,信息的透明度和沟通效率决定了囚犯们是否能够做出正确的决策。通过提高信息透明 度,减少信息不对称的情况,以及提高沟通效率,能够让囚犯们更好地理解对方的立场和策略选择, 从而促进合作。
总结词
在社会学中,囚徒困境常被用来研究社会规范和群体行为。
详细描述
在社会学中,囚徒困境常被用来研究社会规范和群体行为。 它说明了在某些情况下,个体理性可能会导致集体非理性的 结果。囚徒困境在社会合作、公共品供给和社区规范等问题 中都有应用。
如何走出囚徒困境
建立信任与合作机制
总结词
信任是合作的基础,通过建立互信,囚犯们才可能选择合作策略。
公共品博弈与囚徒困境
将公共品博弈与囚徒困境进行比较, 探讨在公共资源利用中的合作与竞争。
囚徒困境与社会科学的交叉研究
经济学中的囚徒困境
研究囚徒困境在经济学中的应用,如市 场竞争、产业组织等领域。
VS
社会心理学中的囚徒困境
探讨囚徒困境在解释人类行为和社会互动 中的作用,以及如何促进合作与信任。
目录
• 囚徒困境简介 • 囚徒困境模型 • 囚徒困境的应用 • 如何走出囚徒困境 • 囚徒困境的未来研究
囚徒困境简介
定义与背景
定义
囚徒困境是一种博弈论模型,描述了两个囚犯在面对合 作与背叛的抉择时,尽管合作对双方都有利,但最终往 往导致双方都选择背叛的结果。
背景
该理论常用于解释在竞争激烈的环境中,个体理性可能 会导致集体非理性的现象。
政治学中的囚徒困境
总结词
在政治学中,囚徒困境常被用来分析国家间的外交政策和国际关系。
囚徒困境实验报告
囚徒困境实验报告囚徒困境实验报告引言囚徒困境是博弈论中一个经典的问题,它涉及到合作与背叛之间的权衡。
在这个实验中,我们将探讨囚徒困境的基本原理以及不同策略对结果的影响。
实验设计我们邀请了一组志愿者参与这个实验。
每个志愿者都被告知他们被指控犯有某种罪行,并且被关押在不同的房间里,无法相互沟通。
他们面临的选择是合作或背叛,而他们的选择将决定他们的下一步行动和最终的结果。
实验过程在实验开始时,每个志愿者被要求填写一个问卷,以了解他们对合作和背叛的态度。
然后,他们被告知他们将与另一个志愿者进行多轮的博弈,每轮博弈都有两个选择:合作或背叛。
结果与分析通过对实验数据的分析,我们得出了以下结论:1. 互相合作的策略是最有利的。
当两个囚徒都选择合作时,他们可以获得较好的结果。
然而,如果其中一个囚徒选择背叛,他将获得更好的结果,而另一个囚徒则会受到惩罚。
2. 短期利益与长期利益之间的冲突。
在囚徒困境中,背叛是一种短期利益最大化的策略。
一个囚徒可能会选择背叛,因为这样他可以获得更好的结果。
然而,如果两个囚徒都选择背叛,他们最终会陷入困境,导致双方都无法获得最好的结果。
3. 信任与合作的重要性。
在囚徒困境中,信任和合作是取得最佳结果的关键。
如果两个囚徒都能够建立信任并选择合作,他们可以共同获得最好的结果。
然而,如果一个囚徒选择背叛,这种信任将被破坏,导致双方都无法达到最佳结果。
结论囚徒困境实验揭示了人类行为中的一种普遍情况:在面对合作与背叛之间的选择时,短期利益和个人动机往往会导致困境的出现。
然而,通过建立信任、合作和长期利益的考量,我们可以找到解决困境的方法。
这个实验不仅仅是一个理论问题,它也反映了我们在现实生活中面临的许多决策。
我们需要认识到,合作和信任是推动社会进步和个人成功的关键因素。
通过理解囚徒困境的原理,并在日常生活中运用合作的策略,我们可以更好地处理人际关系,并取得更好的结果。
尽管囚徒困境实验在理论上有一定的局限性,但它仍然为我们提供了一个思考和理解人类行为的框架。
囚徒困境研究专题
第五章囚徒困境研究专题一、囚徒困境为什么被关注?囚徒困境是指如下的博弈如它可以解释企业竞争,应试教育困境,集体劳动悲剧等等,更重要的在于人们从中看到一个深刻的问题:个体理性与集体理性的冲突。
哈丁的公共地悲剧(1968)如何破解?重复进行!什么是重复博弈?重复博弈指的是参与人之间进行多次相同的博弈,每个人所得收益为每次博弈的收益之和。
注意:(1)这里的收益之和应该考虑贴现率。
(2)重复博弈分为有限次重复和无限次重复有限次重复囚徒困境博弈的特征:(1)完全但不完美信息,(2)重复。
有限次重复囚徒困境的解,每步都“不合作”为纳什均衡。
二、无限次重复囚徒困境中的策略两个参与人无限次地重复囚徒困境,每个人的收益为每次博弈所获收益之和。
在这样的博弈中因无最后一步,我们无法通过逆向归纳法来求解它。
无限次重复囚徒困境博弈及其各种策略分析:触发策略:参与人开始采取合作行动,若发现对方在某步采取“背叛”行动,参与人以后都采取背叛行动。
“永远合作”:在每个囚徒困境博弈中均采取“合作”策略二无论对方采取什么策略。
一旦采取这个策略,对方的最优策略是每步均采取“背叛”策略。
在重复囚徒困境博弈中人们通过策略的变化或偏离进行学习的。
一旦人们的合作行动的偏离——无论这样的偏离是有意还是无意的——得到额外的好处、对方遭受损失,同时这样的偏移没有被“惩罚”,人们将尝试性的进一步偏移。
我们看到,若某个参与人在重复囚徒困境中采取永远“合作”,其结果是对方将通过一步步偏移,直至永远偏离。
因此,理性人应该知道上述这个分析的结论,他不会采取这个永远合作策略。
“永远背叛”策略:在对方第一步采取合作并假定对方以后采取“一报还一报”的情况下,第一步或者某一步主动采取“背叛”的收益为:U=4+2δ+2δ2+……=4+2δ/(1-δ)U’= 3+3δ+3δ2+……=3+3δ/(1-δ)U≥U’δ≤1/2.这里,δ反映的是未来的现实价值,或者说长期利益与短期利益。
博弈论囚徒困境
博弈论囚徒困境博弈论经典案例“囚徒困境”及其实证分析最近三四十年,经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。
诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。
博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。
博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。
一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(,和,)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则判,,年;如果各判,年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的都不坦白则因证据不足各判,年。
在这个例子里,博弈的参加者就是两个嫌疑犯,和,,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:,和,均坦白或均不坦白、,坦白,不坦白或者,坦白,不坦白,是博弈的结果。
,和,均坦白是这个博弈的纳什均衡。
这是因为,假定,选择坦白的话,,最好是选择坦白,因为,坦白判,年而抵赖却要判十年;假定,选择抵赖的话,,最好还是选择坦白,因为,坦白判不被判刑而抵赖确要被判刑,年。
即是说,不管,坦白或抵赖,,的最佳选择都是坦白。
反过来,同样地,不管,是坦白还是抵赖,,的最佳选择也是坦白。
有关“囚徒困境”的研究【经济学经典】
研究性学习结题报告:有关“囚徒困境”的研究组长:组员:指导老师:主导科目:政治研究目的:通过研究“囚徒困境”,了解形成囚徒困境的原因、走出囚徒困境的方法和利用囚徒困境解决生活问题。
研究目标:了解囚徒困境,囚徒效应。
研究意义:利用囚徒困境解决各个领域的问题。
研究内容:囚徒困境、囚徒效应、博弈、社会心理学。
研究方法:1、从网上图书馆查找有关资料2、把收集到的资料、故事等加以综合分析,并加以整理3、听有关专家报告4、走访有关心理专家5、参加社会调查(教育、市场经济、军事、刑侦等)研究思路:1、研究《博弈学习理论》(【美】朱·弗登伯格、戴维·K·莱文著)《社会心理学》(沙莲香著)2、进行调查研究3、综合分析并整理研究时间:2009年7月13日~8月25日活动计划:7月13日至15日讨论研究内容、拟定实施方案、人员分工 7月16日至31日学习研究《博弈学习理论》及《社会心理学》8月1日至3日从网上图书馆查找有关资料8月4日至6日听有关专家报告8月7日至9日走访有关心理专家8月10日至18日参加社会调查8月19日至25日综合分析整理资料、完结报告囚徒困境的理论研究第一部分:什么是囚徒困境(prisoner's dilemma )一、囚徒困境(prisoner's dilemma )是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中,博弈被反复地进行。
因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。
这时,合作可能会作为均衡的结果出现。
欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。
作为反复接近无限的数量,纳什均衡趋向于帕累托最优。
囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章囚徒困境研究专题一、囚徒困境为什么被关注?之所以囚徒困境被广泛的关注,不仅仅在于它由强大的解释力,如它可以解释企业竞争,应试教育困境,集体劳动悲剧等等,更重要的在于人们从中看到一个深刻的问题:个体理性与集体理性的冲突。
哈丁的公共地悲剧(1968)如何破解?重复进行!什么是重复博弈?重复博弈指的是参与人之间进行多次相同的博弈,每个人所得收益为每次博弈的收益之和。
注意:(1)这里的收益之和应该考虑贴现率。
(2)重复博弈分为有限次重复和无限次重复有限次重复囚徒困境博弈的特征:(1)完全但不完美信息,(2)重复。
有限次重复囚徒困境的解,每步都“不合作”为纳什均衡。
二、无限次重复囚徒困境中的策略两个参与人无限次地重复囚徒困境,每个人的收益为每次博弈所获收益之和。
在这样的博弈中因无最后一步,我们无法通过逆向归纳法来求解它。
无限次重复囚徒困境博弈及其各种策略分析:触发策略:参与人开始采取合作行动,若发现对方在某步采取“背叛”行动,参与人以后都采取背叛行动。
“永远合作”:在每个囚徒困境博弈中均采取“合作”策略二无论对方采取什么策略。
一旦采取这个策略,对方的最优策略是每步均采取“背叛”策略。
在重复囚徒困境博弈中人们通过策略的变化或偏离进行学习的。
一旦人们的合作行动的偏离——无论这样的偏离是有意还是无意的——得到额外的好处、对方遭受损失,同时这样的偏移没有被“惩罚”,人们将尝试性的进一步偏移。
我们看到,若某个参与人在重复囚徒困境中采取永远“合作”,其结果是对方将通过一步步偏移,直至永远偏离。
因此,理性人应该知道上述这个分析的结论,他不会采取这个永远合作策略。
“永远背叛”策略:在对方第一步采取合作并假定对方以后采取“一报还一报”的情况下,第一步或者某一步主动采取“背叛”的收益为:U=4+2δ+2δ2+……=4+2δ/(1-δ)U’= 3+3δ+3δ2+……=3+3δ/(1-δ)U≥U’δ≤1/2.这里,δ反映的是未来的现实价值,或者说长期利益与短期利益。
人们在教学这样的博弈以及其他博弈中都会在短期利益与长期利益之间进行权衡。
“一报还一报”策略:第一步合作,之后紧跟对方上一步策略。
一个统一的策略模型:“n报还m报”,这里n与m取值为0到无穷大。
一个成功的策略含有:“友善”:第一步“合作”。
“报复”:面对他人的“背叛”要有惩罚。
“宽容”:若他人认识到错误、从“背叛”到“合作”,参与人要给他人机会。
这里的“报复”与“宽容”反映的是对他人的策略变化要有相应的变化,不同的人“报复”与“宽容”的程度能够不同。
能否通过先“背叛”而获得高分?一旦背叛会面临对方的惩罚,因此能否得高分取决于他人的策略。
需要实验研究。
计算机模拟。
这里的策略分析针对的是固定的两个人之间进行固定重复囚徒困境博弈。
第一,如果两个人进行多个囚徒困境博弈,如何进行这样的博弈?第二,如果参与人可更换?如何进行?三、两个参与人之间进行多个囚徒困境博弈。
我们考虑两个人甲和乙进行两个重复性的囚徒困境博弈,这两个囚徒困境博弈的进行存在先后。
怎样的策略才能获得最大的收益?假定甲乙进行两个“不同的”重复的囚徒困境博弈A和B。
要说明的是,囚徒困境是一类博弈的模型,这里甲乙所进行的所谓不同的囚徒困境博弈,指的是两个这样的博弈。
此时存在很多策略,这里列出四种:第一,“极度冷酷策略”。
在A囚徒困境博弈的某个阶段,甲采取“合作”策略,而乙采取了“不合作”策略,甲的收益降低,而乙的收益增加。
甲观察到了乙的不合作策略,甲如何行动呢?甲可采取“冷酷策略”,即在与乙的该博弈中甲永远采取“不合作”策略。
甲也可采取“一报还一报”策略,即在下一步甲也将采取“不合作”,在以后的博弈阶段中,甲采取何种行动,取决于乙是否改正……然而,对于甲,这是可能的,当乙采取了“不合作”策略,甲在该博弈的余下的阶段中,将永远采取“不合作”行动,并且在与乙的“其他的囚徒困境重复博弈”中也将采取“不合作”行动。
甲此时的这种策略是极端的“冷酷”,他对乙的态度是极度的不宽容。
某个参与人与他人进行多个重复囚徒困境博弈中,因对方在某个博弈的某个阶段采取了“不合作”,他在与对方的该博弈中将永远采取“不合作”,并且在与该对方的其他囚徒困境博弈中也毫无例外地采取“不合作”。
我们将这样的策略称为“极度冷酷策略”。
极度冷酷策略是极度不宽容的。
极度冷酷策略,是冷酷策略的拓展。
第二,“一码归一码策略”。
在某个博弈的某个阶段中,乙采取“不合作”,或者由上一阶段的“不合作”转变为“合作”,此时,甲或者采取“一报还一报策略”或者“冷酷策略”,但无论是那种策略,此时乙的行动,不影响甲在与乙的其他的重复的囚徒困境博弈中的策略选择。
也就是说,在与乙的其他的重复性的囚徒困境博弈中,甲的行动,依赖于乙在该博弈中的行动以及自己的策略(“一报还一报策略”或“冷酷策略”)。
此时,甲的策略可称为“一码归一码策略”。
一码归一码策略是宽容中性的。
第三,“主博弈策略”。
博弈参与人在所有的博弈中的行动选择都根据与对方的某一特定的博弈中的策略选择而进行。
如,A博弈是主博弈,甲在A囚徒困境博弈中采取的是“冷酷策略”,一旦乙采取了“不合作”,那么甲在与乙的其他所有博弈中都将采取“不合作”,这个策略的冷酷度比极度冷酷策略要低,因为乙在其他博弈中的“不合作”不必然触发甲在主博弈A中的不合作策略;若甲在A博弈中采取的是“一报还一报策略”,甲在其他博弈中的行动依赖于乙在A博弈中的行动。
主博弈策略是一个比较差的策略,因为若你一旦采取该策略,对方在除了主博弈之外的博弈中均会采取“不合作”,主博弈之外的博弈中你的收益都将很低。
主博弈策略不如一码归一码策略,但是尽管如此,该策略简单,而一码归一码策略相对复杂,现实中的人们往往使用主博弈策略。
主博弈策略也是宽容中性的。
第四,统计策略。
若在所有博弈中对方过去“合作”次数低于某个比例,某个参与人在以后的博弈中一律采取“不合作”策略;或者若在所有博弈中对方过去采取的总的“合作”次数高于某个比例,他将一律采取“合作”策略。
这样的策略可称为“统计策略”。
统计策略是否宽容依赖于参与人对对方的“合作”或“不合作”的比例要求。
这四种策略中除了一码归一码策略外,参与人均因对方在某个博弈中的“不合作”或“合作”行动而影响另外博弈中的行动选择。
结论1:重复的囚徒困境博弈中,最优策略是一码归一码策略。
证明:某个参与人甲若不使用一码归一码策略,那么必定存在某个博弈的某个阶段,甲的行动选择依赖于其他博弈,而不依赖于对方即乙在该博弈中的行动选择。
理性的乙知道这些,他在该博弈中的该阶段将采取“不合作”,此时,乙的收益增加,而甲的收益降低。
因此,甲的策略应当是根据该博弈而不是其他博弈。
在所有的博弈中甲均应采取不依赖于其他博弈的行动而行动。
因此,最优策略是一码归一码策略在每个博弈中分别采取一报还一报策略是一码归一码策略的特例。
结论2:在重复的囚徒困境博弈中,若一报还一报策略是最优的策略安排,那么在多个重复的囚徒困境博弈中,每个博弈均采取一报还一报策略是最优的。
证明:在确定的有n个囚徒困境博弈中,参与人的收益为这n个博弈中的收益之和,若在每个重复性的囚徒困境博弈中一报还一报策略收益最大,那么在总的博弈中该参与人的总收益最大。
这个结论不是说,在与固定的博弈参与人进行多个重复性的囚徒困境博弈中,参与人在每个博弈中均采取一报还一报策略是最优的,而是说,若在每个博弈中一报还一报策略是最优策略,所有博弈中该策略之采取也是最优策略。
因为,博弈论专家只是用计算机进行比赛,一报还一报策略是胜出策略,然而它是否是最优策略并没有得到证明。
是否存在其他的比一报还一报策略还好的策略,人们不得而知。
这是本人分析出的理论上的结论。
在现实中人们并不一定能够做到这一点。
现实中人们往往是如何进行这样的博弈呢?在现实中的博弈参与人,无论是个人,还是组织(如国家),因某种原因而交恶,即在某个博弈中(不一定是囚徒困境博弈)双方永远处于斗争或不合作的状态,这种状态影响到其他领域里的博弈策略。
在其他领域里他们也采取不合作策略。
例如,两国政治上的不合作致使经济上两国也采取不合作,或者经济上的不合作导致政治上的不合作。
这其实不是一个最优选择。
四、可更换参与人的囚徒困境博弈分析进行囚徒困境的两个参与人是确定的:参与人不可选择对手进行囚徒困境博弈,更不可中途中止该博弈而与其他人重新进行该博弈若参与人能够更换与之博弈的参与人,即存在多个备选的囚徒困境博弈参与人,情况将如何?这是可能的:你与他人的博弈中突然主动使用“不合作”即背叛,你的收益将得到提高,并且你终止了与对手的博弈,而选择新的博弈参与人与其博弈,对方的“报复行动”将无法使用,即他人无法对你的不合作行为进行惩罚。
此时我们说,你使用了“永久性背叛”策略。
在与新的博弈参与人的博弈中,你如法炮制。
因你的这种策略是新的对手所不知道的,与新的对手进行博弈时,你的每次收益都会很高……在一个规模较大的群体中,并且这个群体中的绝对多数人都会采取合作策略,或在第一步都会采取合作策略,你采取这样的策略能够获得高收益,因为你能够从背叛中收益并不被惩罚。
在多个备选参与人进行博弈中,某个参与人何时选择“永久性背叛”为“耐心程度”:耐心程度最低的人,在与他人进行重复的博弈中第一次就采取“不合作”;具有一定耐心程度的人会在一定步骤之后采取“不合作”;具有最大耐心程度的人永远不采取“不合作”。
在多个备选参与人进行博弈时,某个参与人何时选择“永久性背叛”策略即他的耐心程度高低取决于:与他进行这样博弈的备选人群数量与信息沟通程度。
若备选人群数量大,并且之间的信息沟通少,他的耐心度低;其中极端情况是,人群数量无限大,或者人群数量尽管不是无限大,但足够大,并且这些人群之间没有信息沟通。
此时,即使他每次均采取不合作,都存在下一个与之博弈并采取合作的“傻瓜”。
若备选人群的人数少,或者备选人群之间的信息沟通程度高,他的耐心度将是高的。
一个极端情况,与之博弈的只有一个博弈参与人,他要顾及到若他采取“不合作”,他将面临对方的不合作行动的惩罚;若他采取“永久性背叛”,对方也将采取永久性背叛。
这便是阿克斯罗德所研究的情况,阿克斯罗德的结论是适用的。
若与之博弈的参与人即使数量比较大,若他们之间的信息沟通充分,该博弈参与人也不敢采取永久性背叛策略,因为此时若他采取永久性背叛策略,并与新的参与人进行博弈,新的参与人知道他国去的“不光彩”行为,该新的对手在第一回合的博弈中会以“不合作”而对之,即新的博弈参与人将延续原来的参与人与之进行博弈。
因此,在信息充分扩散的情况下,博弈参与人不会随意更换博弈参与人的。
4.囚徒困境与文明作为人类群体是如何走出囚徒困境的?文明体现在群体理性。
文明新理解:文明是对不断产生的集体行动悲剧与克服。