囚徒困境及其启示PPT课件

合集下载

清华大学博弈论讲义ppt课件

完美信息perfect information:指一个参与人对其他参与人的行动选择有准确的理解，即每个信息集只包含一个值。
清华诚志
10
共同知识common knowledge
所有参与人知道每一步的信息集。
清华诚志
11
战略strategies
参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。
ｐｅｒａｔｉｖｅ合作博弈强调的是集体主义，团体理性
Ｒａｔｉｏｎ
清华诚志
16
非合作博弈
而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果是有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益最大化，最后达到力量均衡。
清华诚志
1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。
的均衡有直接的影响。
清华诚志
19
分类
博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了４种博弈：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈
清华诚志
20
博弈的分类及对应的均衡
为了分析方便，自然nature被当作虚拟参与人。

囚徒困境专题综述53页PPT

囚徒困境专题综述
56、极端的法规，就是极端的不公。 ——西塞罗 57、法律一旦成为人们的需要，人们就不再配享受自由了。—— 毕达哥拉斯 58、法律规定的惩罚不是为了私人的利益，而是为了公共的利益；一部分靠有害的强制，一部分靠榜样的效力。 ——格老秀斯 59、假如没有就会消灭。— —洛克
60、人民的幸福是至高无个的法。— —西塞罗
31、只有永远躺在泥坑里的人，才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭，生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍，就是一下子不要学很多。——洛克

囚徒困境专题优秀PPT

27
公共资源悲哀
思考1 思考2
为什么人们在消费各种公共资源时，如果各取所需，留给下一代的越来越少？而在社会优化分配中，消耗一半，留下一半给后代。也就是说，当一种资源成了公共资源的时候，还能够实行各取所需吗？
全球转暖的温室效应是否属于公共资源悲剧？
28
公共资源悲哀
思考3 在我国，利用电话线的网络快车（ADSL），包月租或者包年租的时候，每个人都想把网络打开挂在网络上（在线游戏的激励），这样是不是公共悲剧？你家里的网络快车是否真的快？
39
但是，对手的战略锁定了“疯狂艾迪”的行为，因为“疯狂艾迪”的这一计划会有相反的效果。因为顾客会到对手那里先以300美元买下录相机，然后再获退款50美元。这样，对手自然将价格降到更低的价格250美元一台，顾客反而是从“疯狂艾迪”那里流向对手而不是相反。
40
如果对手不想以250美元一台出售录相机，他也可以将价格降到275美元一台，只要它发现有顾客来要求退款，就会发现对手的背叛行为，从而将价格降到了250美元一台。既不以太低价出售，又快速发现对手的背叛从而以降价予以报复，使对手降价也不能增大顾客量，从而蒙受损失。
20
修甲
不修
修路博弈
乙修
不修
1,1
-1,3
3,-1
0,0
21
我们看到，对甲和乙两家居民来说， “修路”都是劣战略，因而他们都不会出资修路。
22
这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。
同样的道理，国防、教育、社会保障，环境卫生等都由政府承担资金投入，私人一般没有积极性承担这方面服务的积极性和能力。
31

博弈论中的经典分析及启示囚徒困境74页PPT

快乐增加并使享受加强。 ——德谟克利特 67、今天应做的事没有做，明天再早也是耽误了。——裴斯泰洛齐 68、决定一个人的一生，以及整个命运的，只是一瞬之间。 ——歌德 69、懒人无法享受休息之乐。——拉布克 70、浪费时间是一桩大罪过。——卢梭
博弈论中的经典分析及启示囚徒困境
26、机遇对于有准备的头脑有特别的亲和力。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力量泉源之一，也是成功的利器之一。没有它，天才也会在矛盾无定的迷径中，徒劳无功。- -查士德斐尔爵士。 29、困难就是机遇。--温斯顿．丘吉尔。 30、我奋斗，所以我快乐。--格林斯潘。

囚徒困境PPT1精编版

如果每人都付7元，而你不付钱，你可以不冒风险就白白赚10元
如果别人没有付足够的钱，你也没付，最坏的情况只是赚不到钱，你并没有损失什么。
因此你的优势策略就是：根本不要放进去半毛钱。
每个人都基于这样想法的话，最后的结果总是令人失望的。造成这种结果同样是因为每个人都预期别人会拿出他们的本该奉献的部分，而自己又想尽可能地多“捞”一点，因此才会产生每个人都那不回钱的结果。
Q q1 q2
P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2)] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
请问，你会出多少钱呢？
每个人应该要放入的数目：250/43=5.81。
如果每人放进去7元钱，应该就可以超过目标250 元了。等到最后退还10元钱时，每人都还可以净赚3元呢。
不过，这游戏特别要求大家不准讨论，也不能偷看别人把多少钱放进信封里。
最后，等到大信封传回来的时候，两位主持人打开一数，里面的钱总共是245.59元，离目标250元就差那么一点点。
他们面临的选择和带来的后果组合，可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A：判刑1年 B：判刑1年
A：判刑8年 B：无罪释放
A：无罪释放 B：判刑8年
A：判刑5年 B：判刑5年
请问，他们会选择什么呢？坦白or 不坦白
从上面的表中我们可以知道：每个嫌疑人都有两种可供选择的策略：
坦白不坦白。
1.1.2 博弈的非技术性定义

囚徒困境的根源与启示PPT教案

从这个意义上说，“纳什均衡” 提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金定律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行第7页/共27页事才行。也就是中国人说的“己所不欲勿施
…… 第21页/共27页
如何走出囚徒困境
报复与惩罚（株连制） “人质”方案
长期关系和重复博弈
第22页/共27页
判断分析题
➢ １.单人博弈就是个人最优化决策，
•正确。因为单人博弈只有一个博弈
方与，因典此型不的可能博存弈在问博弈题方有之本间行质为和区利益别的。交互作用和制约，因此实际
上就是个人最优化决策，与存在博弈方之间行为和利益交互作用和制约的典型博弈问题有本质的区别。
➢ 所以，要破解囚徒困境，就要跳出这个模型本身，从更
第10页/共27页
高的层面上给以制度性的约
囚徒困境的实际运用
举例来是说，我是供应商，你是大超市，你可以选择拖欠货款，我也可以选择延迟发货或较低的质量，套用上面的模型：
超市
不合作合
作
不合作 -5 -
5
2 -8第11页/共27页
供应商
囚徒困境的实际运用
第3页/共27页
囚徒困境的内在根源
➢ 在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单地说，“囚徒的困
第4页/共27页
境”问题都是个体理性和集
囚徒困境的启示
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个 “纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他第5页/共27页们都首先替对方着想时，或者相互合谋(串供)

S-囚徒困境与社会的基本问题PPT课件

2021/7/22
14
（二）奥尔森的“集体行动的逻辑”
✓ 由具有自利倾向的理性“经济人 ”组成的集体中，因“搭便车” 行为而难以实现合作：人人都想分享集体行动的成果，但不愿分担集体行动的成本。集体越大，越难克服“搭便车”行为。
2021/7/22
15
（二）奥尔森的“集体行动的逻辑”
✓ “除非一个集团中人数很少，或者除非存在强制或其他某些特殊手段以使个人按照他们的共同利益行事，有理性的，寻求自我利益的个人不会采取行动以实现他们共同的集团的利益。”（Olson，1980）
• 1. 过程
D（背叛） T=5，S=0 P=1，P=1
✓ 14个策略程序+1个随机程序（随机选择“合作”或“背叛 ”）；
✓ 225场比赛，每个比赛200回合；
✓ 最大收益：15场×200回合×5分=15000分（（D，C）或（C，D））；
✓ 最小收益：15场×200回合×0分=0分（（D，C）或（C ，D））；
能实现团体的最大利益，同时也揭示了个体
理性本身的内在矛盾——从个体利益出发的
行为最终也不一定能真正实现个体的最大利
益，甚至会得到相当差的结果。
2021/7/22
7
二、社会的基本问题
2021/7/22
• 人类社会与其他动物群体的一个重要区别是，人与人之间可以通过运用个人理性而达致某种形式的合作。合作能产生“合作剩余”。
✓ “一报还一报”策略的平均分为504.5，即600基准分的
84%，其他8个好的策略中，得基准分的28.4%和83.4%
2021之/7/2间2 。
21
（二）第一届竞赛
• 3. 结论
策略j

囚徒困境PPTPPT课件

创新与变革
面对囚徒困境，我们需要勇于创新和变革，打破固有的思维模式和制度限制，寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作，减少囚徒困境的发生。例如，可以通过制定合理的法律法规、加强监管等手段，来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展，各国之间的相互依存度越来越高，囚徒困境的启示有助于推动国际间的合作与交流，共同应对全球性的挑战。
囚徒困境
囚徒困境简介囚徒困境的基本模型囚徒困境的解决方案囚徒困境的实际案例囚徒困境的启示与思考
contents
目录
01
囚徒困境简介
囚徒困境是一种博弈论模型，描述了两个犯罪嫌疑人被捕后，在不能互相沟通的情况下，各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题，即两个同谋的囚犯在接受审判时，如果他们都保持沉默，则可能获得较轻的判决；但如果他们互相背叛，则可能获得较重的判决。
合作
在囚徒困境中，参与者可以通过选择合作的方式，共同达成更好的结果。合作可以避免被对方背叛的风险，同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题，认识到合作带来的长期利益，而不仅仅关注眼前的短期利益。通过建立长期关系和互信，可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制，可以对囚徒困境中的参与者进行监督和约束，防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚，维护游戏的公平性和规则的执行。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

台湾要买美国的F16,中国希望欧洲对华军售，两个地区的政府都在为武器画着大价钱从而损失了国家的经济发展力，这也是囚徒困境的模式，都会担心如果一旦开战会对自己不利，如果我没有先进武器，你有先进武器，那么开战的话我就会吃亏。如果我有先进武器你没有的话，我就会得利。所以我一定要有先进武器。殊不知如果两岸达成和平条约，双方都不购买先进武器，把资金都放在经济发展人民收入上，那才是真的双赢。
有2个涉嫌共同作案偷窃的嫌疑人 A和B被带进警察局。假定警方对 2名犯罪嫌疑人实行隔离关押，隔离审讯，每个犯罪嫌疑人都无法观察到对方的选择。
警方怀疑他们作案，但并没有掌握他们作案的确凿证据，于是明确地分别告诉2名嫌疑人：对他们犯罪事实的认定及相应的量刑，完全取决于他们自己供认与否。
如果一方与警方合作，坦白所做违法之事，而另一方抵赖，招认方将无罪释放，另一方则会被判重刑8年；
之政治博弈
SUCCESS
THANK YOU
2019/8/2
50年后军事解密，朝鲜战争的起因，因为中国和美国都有考虑，我国是怕韩国如果统一朝鲜后美军会侵略中国，而美军是怕如果朝鲜统一韩国后，中国军队会侵略日本，在占领日本后威胁美国本土。所以双方都是以出兵和不出兵考虑，如果出兵，会有经济损失，如果不出兵会威胁自己的领土，所以双方在”囚徒困境 “模式下都选择了出兵，最后两败俱伤。
囚徒困境
小组成员：王嘉瑶王洁霞王孟佳王晓斌
什么是博弈论？
博弈论又被称为对策论（Game Theory）既是现代数学的一个新分支，也是运筹学的一个重要学科。
博弈论主要研究公式化的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。
5)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。
“囚徒困境”是1950年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年；若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。
非零和博弈是一种合作下的博弈，博弈中各方的收益或损失的总和不是零值，它区别于零和博弈。在经济学研究中比较有用。在这种状况时，自己的所得并不与他人的损失的大小相等，连自己的幸福也未必建立在他人的痛苦之上，即使伤害他人也可能“损人不利己”，所以博弈双方存在 “双赢”的可能，进而达成合作。
现实中的囚徒困境
如果双方都与警方合作共同招认，各被判刑5年；
如果双方均不认罪，因为警察找不到其他证明他们违法的证据，则判刑 1年。
ห้องสมุดไป่ตู้
A B
不坦白
坦白
不坦白坦白
A：判刑1年 B：判刑1年 A：判刑8年 B：无罪释放
A：无罪释放 B：判刑8年 A：判刑5年 B：判刑5年
现实中，基于人是理性的这一前提，无论同伙是否坦白，自己坦白总是比不坦白好。两个人这样一算计，最好的结果都是选择坦白，各判刑5年。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。
类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。
(3)完全信息/不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息；反之，则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。
动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。
然而实际上，如果两人都抵赖，那么都会无罪释放，显然这个结果是最好的。但人在理性算计排除了这一结果。
这个故事讲得就是囚徒困境，是在1950年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。
政治博弈也是一种非零和博弈。
零和效应：实力相当的双方在谈判时做出大体相等的让步，方可取得结果，亦即每一方所得与所失的代数和大致为零，谈判便可成功。然而，人类社会发展的历程越来越走向“非零和”也就是我们现在所说的双赢。
3)得失：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。
4)对于博弈参与者来说，存在着一博弈结果。
要素
1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。
2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。
囚徒困境的核心理念是：博弈全输，合作双赢，怀疑或不信任导致失败。
要诀：注重合作，力求双赢；注重策略选择，善于换位思考。
囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但在现实中政治、经济、军事、企业经营、社会生活、组织管理等方面，也会频繁出现类似情况。