囚徒困境专题综述53页PPT
博弈论的经典案例-囚徒困境
![博弈论的经典案例-囚徒困境](https://img.taocdn.com/s3/m/e7dcbc37a32d7375a41780fb.png)
博弈论的经典案例:囚徒困境学习管理学或经济学的人一定都了解一些博弈论方面的知识。
在博弈论中有一个经典案例--囚徒困境,非常耐人回味。
----"囚徒困境"说的是两个囚犯的故事。
这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。
在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。
但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。
而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。
----那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。
但他们不得不仔细考虑对方可能采取什么选择。
A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。
这种想法的诱惑力实在太大了。
但他也意识到,他的同伙也不是傻子,也会这样来设想他。
所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。
----当然,在现实世界里,信任与合作很少达到如此两难的境地。
谈判、人际关系、强制性的合同和其他许多因素左右了当事人的决定。
03囚徒困境专题
![03囚徒困境专题](https://img.taocdn.com/s3/m/9c04c9335a8102d276a22f67.png)
第三讲纳什均衡应用---囚徒困境两个嫌犯受到指控,但除非至少一个招囚徒困境说明了什么在(坦白、坦白)这个组合中,A和B囚徒困境说明了什么囚徒困境反映了囚徒困境的意义“囚徒的两难选择对经典经济学的冲击《国富论》中,斯密认为,在利己心的驱动“———从“研究囚徒困境问题的目的生活中的例子1 商家价格战大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。
例子为私人没有积极性出资修建公共设施修路博弈这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建务的积极性和能力。
例子源经常被过度利用的原因。
由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧类似的例子还有:渤海中的鱼愈来愈少了,工业化中的大公共资源悲哀公共资源悲哀 例子车鸣喇叭?但当对方缓行时,自己抢行会占便宜,获得支付9。
例子WTO是一个自愿性申请加入的自由贸易“囚徒困境”的一般表示用法律解决“囚徒困境”公共产品与税收制度因为私人没有积极性出资修建公共设施如果恰当进行机制设计,前述囚徒困境还是可以避免的,下面是一个商战中的真实例子。
机制设计:如何走出囚徒困境冻结价格战的博弈机制有人卖得比我们更低,我们的价格最低廉,我们保证价格最低,而且是超级疯你一生中于任何本地的销售商(本行销区内)那里发现相同的广告款式而价格争,根本不可能形成价格联盟,即使形成也难以维持,因而它们之间似乎是在但是,对手的战略锁定了“疯狂艾迪”的行为,因为“疯狂艾迪”的这一计划如果对手不想以250美元一台出售录相机,他也可以将价格降到275美元一这样,“疯狂艾迪”就没有进行价格战的意愿了,自然形成价格联盟。
在福州国美电器从谁价比我低,差价两倍还42智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。
囚徒困境PPT1精编版
![囚徒困境PPT1精编版](https://img.taocdn.com/s3/m/ec56ba7d0740be1e650e9ad2.png)
如果每人都付7元,而你不付钱,你可以不冒风险就 白白赚10元
如果别人没有付足够的钱,你也没付,最坏的 情况只是赚不到钱,你并没有损失什么。
因此你的优势策略 就是:根本不要放 进去半毛钱。
每个人都基于这样想法的话,最后的结果总是令 人失望的。造成这种结果同样是因为每个人都预 期别人会拿出他们的本该奉献的部分,而自己又 想尽可能地多“捞”一点,因此才会产生每个人 都那不回钱的结果。
Q q1 q2
P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2)] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
请问,你会出多少钱呢?
每个人应该要放入的数目:250/43=5.81。
如果每人放进去7元钱,应该就可以超过目标250 元了。等到最后退还10元钱时,每人都还可以净赚3元 呢。
不过,这游戏特别要求大家不准讨论,也不能偷看别人 把多少钱放进信封里。
最后,等到大信封传回来的时候,两位主持人打开 一数,里面的钱总共是245.59元,离目标250元就差 那么一点点。
他们面临的选择和带来的后果组合,可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
坦白不坦白。
1.1.2 博弈的非技术性定义
S-囚徒困境与社会的基本问题PPT课件
![S-囚徒困境与社会的基本问题PPT课件](https://img.taocdn.com/s3/m/dcb61b8a9b6648d7c0c74651.png)
2021/7/22
14
(二)奥尔森的“集体行动的逻辑”
✓ 由具有自利倾向的理性“经济人 ”组成的集体中,因“搭便车” 行为而难以实现合作:人人都想 分享集体行动的成果,但不愿分 担集体行动的成本。集体越大, 越难克服“搭便车”行为。
2021/7/22
15
(二)奥尔森的“集体行动的逻辑”
✓ “除非一个集团中人数很少, 或者除非存在强制或其他某些 特殊手段以使个人按照他们的 共同利益行事,有理性的,寻 求自我利益的个人不会采取行 动以实现他们共同的集团的利 益。”(Olson,1980)
• 1. 过程
D(背叛) T=5,S=0 P=1,P=1
✓ 14个策略程序+1个随机程序(随机选择“合作”或“背叛 ”);
✓ 225场比赛,每个比赛200回合;
✓ 最大收益:15场×200回合×5分=15000分((D,C) 或(C,D));
✓ 最小收益:15场×200回合×0分=0分((D,C)或(C ,D));
能实现团体的最大利益,同时也揭示了个体
理性本身的内在矛盾——从个体利益出发的
行为最终也不一定能真正实现个体的最大利
益,甚至会得到相当差的结果。
2021/7/22
7
二、社会的基本问题
2021/7/22
• 人类社会与其他动物群体的一个重要区别是, 人与人之间可以通过运用个人理性而达致某种 形式的合作。合作能产生“合作剩余”。
✓ “一报还一报”策略的平均分为504.5,即600基准分的
84%,其他8个好的策略中,得基准分的28.4%和83.4%
2021之/7/2间2 。
21
(二)第一届竞赛
• 3. 结论
策略j
囚徒困境PPTPPT课件
![囚徒困境PPTPPT课件](https://img.taocdn.com/s3/m/ad10042d1fd9ad51f01dc281e53a580216fc5020.png)
面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。
囚徒困境.完美版PPT
![囚徒困境.完美版PPT](https://img.taocdn.com/s3/m/59389dca647d27284a735193.png)
1.1.2 博弈的非技术性定义
博弈——就是一些个人、对组或其它组织,面对一定的环 境条件、在一定的规则下,同时或先后,一次或多次,从 各自允许选择的行为或策略中进行选择并加以实施,各自 取得相应结果的过程。
1.1.2 博弈的非技术性定义
博弈论就是系统研究可以用上述方法定义的各种博弈 问题,寻求在各博弈方具有充分或者有限理性能力的 条件下,合理的策略选择和合理策略选择时博弈的结 果,并分析这些结果的经济意义、效率意义的理论和 方法。
博弈就是决策行为
“石头-剪子-布” 游戏
游戏特点
有一定的规则,规定游戏的参加者,游戏者可以做什么,不 可以做什么。
都有结果,如一方赢、一方输、平局等
策略至关重要,每一个 游戏者所得结果的好坏, 不仅取决于自身的策略 选择,也取决于其他参 加者的策略选择。
游戏特点
在游戏中,也规定了游戏参加者出招的顺序,是同时做出选 择还是先后做出选择等。
每个人从自己收益 最大化出发来考虑 问题,最终往往落 得两败俱伤的结果。 个人的理性算计, 往往导致集体的非 理性结局。
(坦白,坦白)是囚徒困境的纳什均衡。 纳什均衡是什么呢?
假设有n人参与博弈,每个人选择自己的最 优战略,所有参与人选择的战略构成一个战 略组合。
纳什均衡是这样一个战略组合,这种战略 组合由所有参与人的最优战略组成,也就
他们面临的选择和带来的后果组合,可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
囚徒困境囚徒困境课件
![囚徒困境囚徒困境课件](https://img.taocdn.com/s3/m/fa545b4777c66137ee06eff9aef8941ea76e4bbe.png)
提高信息透明度与沟通效率
总结词
信息透明度和沟通效率的提高有助于减少误解和猜疑,促进囚犯们选择合作策略。
详细描述
在囚徒困境中,信息的透明度和沟通效率决定了囚犯们是否能够做出正确的决策。通过提高信息透明 度,减少信息不对称的情况,以及提高沟通效率,能够让囚犯们更好地理解对方的立场和策略选择, 从而促进合作。
总结词
在社会学中,囚徒困境常被用来研究社会规范和群体行为。
详细描述
在社会学中,囚徒困境常被用来研究社会规范和群体行为。 它说明了在某些情况下,个体理性可能会导致集体非理性的 结果。囚徒困境在社会合作、公共品供给和社区规范等问题 中都有应用。
如何走出囚徒困境
建立信任与合作机制
总结词
信任是合作的基础,通过建立互信,囚犯们才可能选择合作策略。
公共品博弈与囚徒困境
将公共品博弈与囚徒困境进行比较, 探讨在公共资源利用中的合作与竞争。
囚徒困境与社会科学的交叉研究
经济学中的囚徒困境
研究囚徒困境在经济学中的应用,如市 场竞争、产业组织等领域。
VS
社会心理学中的囚徒困境
探讨囚徒困境在解释人类行为和社会互动 中的作用,以及如何促进合作与信任。
目录
• 囚徒困境简介 • 囚徒困境模型 • 囚徒困境的应用 • 如何走出囚徒困境 • 囚徒困境的未来研究
囚徒困境简介
定义与背景
定义
囚徒困境是一种博弈论模型,描述了两个囚犯在面对合 作与背叛的抉择时,尽管合作对双方都有利,但最终往 往导致双方都选择背叛的结果。
背景
该理论常用于解释在竞争激烈的环境中,个体理性可能 会导致集体非理性的现象。
政治学中的囚徒困境
总结词
在政治学中,囚徒困境常被用来分析国家间的外交政策和国际关系。
囚徒困境课件
![囚徒困境课件](https://img.taocdn.com/s3/m/7b0811e4f705cc17552709f1.png)
13
囚徒困境的启示
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利 己行为而导致的最终结局是一个“纳什均 衡”,也是对所有人都不利的结局。他们 两人都是在坦白与抵赖策略上首先想到自 己,这样他们必然要服长的刑期。只有当 他们都首先替对方着想时,或者相互合谋 ( 串供 ) 时,才可以得到最短时间的监禁的 结果。
22
经济如局 人生如棋 博弈之道 生活之常 运用之妙 存乎一心
23
结束语:学点博弈论 心灵更美丽
博弈——无处不在的策略游戏; 博弈——大千世界的生存法则; 博弈——竞争社会的现代意识。
24
25
14
经济学中的理性人成立吗?
• 传统经济学的鼻祖亚当· 斯密在其传世经典《国民财富的 性质和原因的研究》中这样描述市场机制:“当个人在追 求他自己的私利时,市场的看不见的手会导致最佳经济后 果。” 这就是说,每个人的自利行为在“看不见的手” 的指引下,追求自身利益最大化的同时也促进了社会公共 利益的增长。即自利会带来互利。 • 传统经济学秉承了亚当· 斯密的思想。传统经济学认为: 人的经济行为的根本动机是自利,自私是个好东西,每个 人都有权追求自己的利益,没有自私社会就不会进步,现 代社会的财富是建立在对每个人自利权利的保护上的。因 此经济学不必担心人们参与竞争的动力,只需关注如何让 每个求利者能够自由参与尽可能展开公平竞争的市场机制。 只要市场机制公正,自然会增进社会福利。
19
如何走出囚徒困境
“人质”方案
• 在囚徒困境中,两个囚徒当然也清楚自利 行为的后果是集体失利,每个人的状况都 将更糟糕。因此,如果每个人都相信对方 不会招供,那么合作拒供的结果也将可以 出现。也就是说,如果可以克服信任问题, 那么合作达成也是可能的。顺理成章,促 进信任的“人质”方案,常常也会促进合 作,走出囚徒困境。
囚徒困境的根源与启示PPT教案
![囚徒困境的根源与启示PPT教案](https://img.taocdn.com/s3/m/5a011456fd0a79563d1e72b5.png)
从这个意义上说,“纳什均衡” 提出的悖论实际上动摇了西方 经济学的基石。因此,从“纳 什均衡”中我们还可以悟出一 条真理:合作是有利的“利己 策略”。但它必须符合以下黄 金定律:按照你愿意别人对你 的方式来对别人,但只有他们 也按同样方式行 第7页/共27页 事才行。也就 是中国人说的“己所不欲勿施
…… 第21页/共27页
如何走出囚徒困境
报复与惩罚(株连制) “人质”方案
长期关系和重复博弈
第22页/共27页
判断分析题
➢ 1.单人博弈就是个人最优 化决策,
•正确。因为单人博弈只有一个博弈
方与,因典此型不的可能博存弈在问博弈题方有之本间行质为 和区利益别的。交互作用和制约,因此实际
上就是个人最优化决策,与存在博弈 方之间行为和利益交互作用和制约的 典型博弈问题有本质的区别。
➢ 所以,要破解囚徒困境,就 要跳出这个模型本身,从更
第10页/共27页
高的层面上给以制度性的约
囚徒困境的实际运用
举例来是说,我是供应商,你 是大超市,你可以选择拖欠货款, 我也可以选择延迟发货或较低的 质量,套用上面的模型:
超市
不合作 合
作
不合作 -5 -
5
2 -8第11页/共27页
供应商
囚徒困境的实际运用
第3页/共27页
囚徒困境的内在根源
➢ 在个体之间存在行为和利益 相互制约的博弈结构中,以 个体理性和个体选择为基础 的分散决策方式,无法有效 地协调各方面的利益,并实 现整体、个体利益共同的最 优。简单地说,“囚徒的困
第4页/共27页
境”问题都是个体理性和集
囚徒困境的启示
“囚徒的两难选择”有着广泛 而深刻的意义。个人理性与集 体理性的冲突,各人追求利己 行为而导致的最终结局是一个 “纳什均衡”,也是对所有人 都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的 刑期。只有当他 第5页/共27页 们都首先替对 方着想时,或者相互合谋(串供)
第一章囚徒困境与纳什均衡ppt课件
![第一章囚徒困境与纳什均衡ppt课件](https://img.taocdn.com/s3/m/5b4ddc2380eb6294dc886c4a.png)
yes.
精选课件ppt
1
一、经典案例——囚徒困境
精选课件ppt
2
经典案例——囚徒困境
1950年,斯担福大学客座教授、数学家图克(Tucker)为形 象地说明博弈过程,构造了著名的“囚徒困境”模型。
两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警 方的政策是“坦白从宽,抗拒从严”: 如果两人都坦白则各判8年; 如果一人坦白另一人不坦白,坦白的放出去,不坦白的 判15年; 如果都不坦白则各判1年。 这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?
甲会这样推理:假如乙不招,我只要一招供,马上可 以获得自由,而不招却要坐牢1年,显然招比不招好; 假如乙招了,我若不招,则要坐牢15年,招了只坐8年, 显然还是以招认为好。无论乙招与不招,我的最佳选 择都是招认。还是招了吧。
自然,乙也同样精明,也会如此推理。
精选课件ppt
5
经典案例——囚徒困境
如果一方采取不合作的策略另一方随即也采取不合作 策略并且永远采取不合作策略,在博弈论里面称之为 触发策略(Trigger strategy),或称冷酷策略。
如果对方知道你的策略是触发策略,那么对方将不敢 采取不合作策略,因为一旦他采取了不合作策略,双 方便永远进入不合作的困境。因此,只要有人采取触 发策略,那么双方均愿意采取合作策略。
素不相识一对男女的一夜情是一次性囚徒困境博弈。
精选课件ppt
20
增大未来的影响——走出“囚徒困境”
决定合作与否其实取决于一次博弈还是多次博弈.
生活中多人博弈的现象比两人博弈更为普遍。
在多人博弈中,只有其它所有参与者在第k-1次博弈中 都是合作的,某个参与者才会在第k次博弈中采取合作 策略。
囚徒困境1课件
![囚徒困境1课件](https://img.taocdn.com/s3/m/e726391f2a160b4e767f5acfa1c7aa00b52a9d9d.png)
囚徒困境
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
坦白不坦白。
如果A选择抵赖,那么就可能会出现两种情况,如 果B选择坦白,那么A将被加重惩罚,判刑8年,而B则 无罪释放;如果B也同样选择抵赖,那么他们将判刑1年。
2.1.3 划线法 ——求纳什均衡
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
囚 徒
-5, -5
不动的情况下,没有人有兴趣动
这个故事最早是1950年,数学家塔克任斯坦福大 学客座教授给心理学家作讲演时提出的。时至今 日,这个故事广为流传,在哲学、伦理学、政治 学、经济学等学科中获得了极为广泛的应用。
rtgrQ
囚徒困境的应用
在荷兰召开了一次“合作及社会两难困境研讨会”,
与会者都是博弈论的专家。当大会结束后,有两个学者, 麦息克和路特提议大家玩一个游戏。
他们将一个大信封拿出来,请在场的43位学者专家拿 出金钱装到这个信封里。如果到最后这个信封里的钱超过 250元,麦息克和路特将自己掏腰包,退还每人10元。不 过,如果信封内的钱不足250元,就统统没收,大家拿不 到半毛钱。
请问,你会出多少钱呢?
每个人应该要放入的数目:250/43=5.81。
如果每人放进去7元钱,应该就可以超过目标250 元了。等到最后退还10元钱时其它组织,面对一定的环 境条件、在一定的规则下,同时或先后,一次或多次,从 各自允许选择的行为或策略中进行选择并加以实施,各自 取得相应结果的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
56、极端的法规,就是极端的不公。 ——西 塞罗 57、法律一旦成为人们的需要,人们 就不再 配享受 自由了 。—— 毕达哥 拉斯 58、法律规定的惩罚不是为了私人的 利益, 而是为 了公共 的利益 ;一部 分靠有 害的强 制,一 部分靠 榜样的 效力。 ——格 老秀斯 59、假如没有 就会消 灭。— —洛克
60、人民的幸福是至高无个的法。— —西塞 罗
31、只有永远躺在泥坑里的人,才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭,生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍,就是一下子不要学很多。——洛克