囚徒困境及其启示PPT课件
合集下载
清华大学博弈论讲义ppt课件
完美信息perfect information:指一个参与 人对其他参与人的行动选择有准确的理 解,即每个信息集只包含一个值。
清华诚志
10
共同知识common knowledge
所有参与人知道每一步的信息集。
清华诚志
11
战略strategies
参与人在给定信息集的情况下的行动规 则,它规定参与人在什么时候选择什么 行动。
perative 合作博弈强调的是集体主义,团体理性
Ration
清华诚志
16
非合作博弈
而非合作博弈则主要研究人们在利益相 互影响的局势中如何选择策略使得自己 的收益最大,强调个人理性、个人最优 决策,其结果是有时有效率,有时则不 然。目前经济学家谈到博弈论主要指的 是非合作博弈,也就是各方在给定的约 束条件下如何追求各自利益最大化,最 后达到力量均衡。
清华诚志
1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的 意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
的均衡有直接的影响。
清华诚志
19
分类
博弈的划分可以从参与人行动的次序和 参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈
清华诚志
20
博弈的分类及对应的均衡
为了分析方便,自然nature被当作虚拟参 与人。
清华诚志
10
共同知识common knowledge
所有参与人知道每一步的信息集。
清华诚志
11
战略strategies
参与人在给定信息集的情况下的行动规 则,它规定参与人在什么时候选择什么 行动。
perative 合作博弈强调的是集体主义,团体理性
Ration
清华诚志
16
非合作博弈
而非合作博弈则主要研究人们在利益相 互影响的局势中如何选择策略使得自己 的收益最大,强调个人理性、个人最优 决策,其结果是有时有效率,有时则不 然。目前经济学家谈到博弈论主要指的 是非合作博弈,也就是各方在给定的约 束条件下如何追求各自利益最大化,最 后达到力量均衡。
清华诚志
1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的 意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
的均衡有直接的影响。
清华诚志
19
分类
博弈的划分可以从参与人行动的次序和 参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈
清华诚志
20
博弈的分类及对应的均衡
为了分析方便,自然nature被当作虚拟参 与人。
囚徒困境专题综述53页PPT
囚徒困境专题综述
56、极端的法规,就是极端的不公。 ——西 塞罗 57、法律一旦成为人们的需要,人们 就不再 配享受 自由了 。—— 毕达哥 拉斯 58、法律规定的惩罚不是为了私人的 利益, 而是为 了公共 的利益 ;一部 分靠有 害的强 制,一 部分靠 榜样的 效力。 ——格 老秀斯 59、假如没有 就会消 灭。— —洛克
60、人民的幸福是至高无个的法。— —西塞 罗
31、只有永远躺在泥坑里的人,才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭,生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍,就是一下子不要学很多。——洛克
56、极端的法规,就是极端的不公。 ——西 塞罗 57、法律一旦成为人们的需要,人们 就不再 配享受 自由了 。—— 毕达哥 拉斯 58、法律规定的惩罚不是为了私人的 利益, 而是为 了公共 的利益 ;一部 分靠有 害的强 制,一 部分靠 榜样的 效力。 ——格 老秀斯 59、假如没有 就会消 灭。— —洛克
60、人民的幸福是至高无个的法。— —西塞 罗
31、只有永远躺在泥坑里的人,才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭,生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍,就是一下子不要学很多。——洛克
囚徒困境专题优秀PPT
27
公共资源悲哀
思考1 思考2
为什么人们在消费各种公共资源时, 如果各取所需,留给下一代的越来越 少?而在社会优化分配中,消耗一半, 留下一半给后代。也就是说,当一种 资源成了公共资源的时候,还能够实 行各取所需吗?
全球转暖的温室效应是否属于公共资 源悲剧?
28
公共资源悲哀
思考3 在我国,利用电话线的网络快车 (ADSL),包月租或者包年租的时候, 每个人都想把网络打开挂在网络上 (在线游戏的激励),这样是不是公 共悲剧?你家里的网络快车是否真的 快?
39
但是,对手的战略锁定了“疯狂 艾迪”的行为,因为“疯狂艾迪”的这 一计划会有相反的效果。因为顾客会到 对手那里先以300美元买下录相机,然后 再获退款50美元。这样,对手自然将价 格降到更低的价格250美元一台,顾客反 而是从“疯狂艾迪”那里流向对手而不 是相反。
40
如果对手不想以250美元一台出售 录相机,他也可以将价格降到275美元一 台,只要它发现有顾客来要求退款,就 会发现对手的背叛行为,从而将价格降 到了250美元一台。既不以太低价出售, 又快速发现对手的背叛从而以降价予以 报复,使对手降价也不能增大顾客量, 从而蒙受损失。
20
修 甲
不修
修路博弈
乙 修
不修
1,1
-1,3
3,-1
0,0
21
我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。
22
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
31
公共资源悲哀
思考1 思考2
为什么人们在消费各种公共资源时, 如果各取所需,留给下一代的越来越 少?而在社会优化分配中,消耗一半, 留下一半给后代。也就是说,当一种 资源成了公共资源的时候,还能够实 行各取所需吗?
全球转暖的温室效应是否属于公共资 源悲剧?
28
公共资源悲哀
思考3 在我国,利用电话线的网络快车 (ADSL),包月租或者包年租的时候, 每个人都想把网络打开挂在网络上 (在线游戏的激励),这样是不是公 共悲剧?你家里的网络快车是否真的 快?
39
但是,对手的战略锁定了“疯狂 艾迪”的行为,因为“疯狂艾迪”的这 一计划会有相反的效果。因为顾客会到 对手那里先以300美元买下录相机,然后 再获退款50美元。这样,对手自然将价 格降到更低的价格250美元一台,顾客反 而是从“疯狂艾迪”那里流向对手而不 是相反。
40
如果对手不想以250美元一台出售 录相机,他也可以将价格降到275美元一 台,只要它发现有顾客来要求退款,就 会发现对手的背叛行为,从而将价格降 到了250美元一台。既不以太低价出售, 又快速发现对手的背叛从而以降价予以 报复,使对手降价也不能增大顾客量, 从而蒙受损失。
20
修 甲
不修
修路博弈
乙 修
不修
1,1
-1,3
3,-1
0,0
21
我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。
22
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
31
博弈论中的经典分析及启示囚徒困境74页PPT
快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过。——卢梭
博弈论中的经典分析及启示 囚徒困境
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
博弈论中的经典分析及启示 囚徒困境
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
囚徒困境PPT1精编版
如果每人都付7元,而你不付钱,你可以不冒风险就 白白赚10元
如果别人没有付足够的钱,你也没付,最坏的 情况只是赚不到钱,你并没有损失什么。
因此你的优势策略 就是:根本不要放 进去半毛钱。
每个人都基于这样想法的话,最后的结果总是令 人失望的。造成这种结果同样是因为每个人都预 期别人会拿出他们的本该奉献的部分,而自己又 想尽可能地多“捞”一点,因此才会产生每个人 都那不回钱的结果。
Q q1 q2
P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2)] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
请问,你会出多少钱呢?
每个人应该要放入的数目:250/43=5.81。
如果每人放进去7元钱,应该就可以超过目标250 元了。等到最后退还10元钱时,每人都还可以净赚3元 呢。
不过,这游戏特别要求大家不准讨论,也不能偷看别人 把多少钱放进信封里。
最后,等到大信封传回来的时候,两位主持人打开 一数,里面的钱总共是245.59元,离目标250元就差 那么一点点。
他们面临的选择和带来的后果组合,可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
坦白不坦白。
1.1.2 博弈的非技术性定义
囚徒困境的根源与启示PPT教案
从这个意义上说,“纳什均衡” 提出的悖论实际上动摇了西方 经济学的基石。因此,从“纳 什均衡”中我们还可以悟出一 条真理:合作是有利的“利己 策略”。但它必须符合以下黄 金定律:按照你愿意别人对你 的方式来对别人,但只有他们 也按同样方式行 第7页/共27页 事才行。也就 是中国人说的“己所不欲勿施
…… 第21页/共27页
如何走出囚徒困境
报复与惩罚(株连制) “人质”方案
长期关系和重复博弈
第22页/共27页
判断分析题
➢ 1.单人博弈就是个人最优 化决策,
•正确。因为单人博弈只有一个博弈
方与,因典此型不的可能博存弈在问博弈题方有之本间行质为 和区利益别的。交互作用和制约,因此实际
上就是个人最优化决策,与存在博弈 方之间行为和利益交互作用和制约的 典型博弈问题有本质的区别。
➢ 所以,要破解囚徒困境,就 要跳出这个模型本身,从更
第10页/共27页
高的层面上给以制度性的约
囚徒困境的实际运用
举例来是说,我是供应商,你 是大超市,你可以选择拖欠货款, 我也可以选择延迟发货或较低的 质量,套用上面的模型:
超市
不合作 合
作
不合作 -5 -
5
2 -8第11页/共27页
供应商
囚徒困境的实际运用
第3页/共27页
囚徒困境的内在根源
➢ 在个体之间存在行为和利益 相互制约的博弈结构中,以 个体理性和个体选择为基础 的分散决策方式,无法有效 地协调各方面的利益,并实 现整体、个体利益共同的最 优。简单地说,“囚徒的困
第4页/共27页
境”问题都是个体理性和集
囚徒困境的启示
“囚徒的两难选择”有着广泛 而深刻的意义。个人理性与集 体理性的冲突,各人追求利己 行为而导致的最终结局是一个 “纳什均衡”,也是对所有人 都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的 刑期。只有当他 第5页/共27页 们都首先替对 方着想时,或者相互合谋(串供)
S-囚徒困境与社会的基本问题PPT课件
2021/7/22
14
(二)奥尔森的“集体行动的逻辑”
✓ 由具有自利倾向的理性“经济人 ”组成的集体中,因“搭便车” 行为而难以实现合作:人人都想 分享集体行动的成果,但不愿分 担集体行动的成本。集体越大, 越难克服“搭便车”行为。
2021/7/22
15
(二)奥尔森的“集体行动的逻辑”
✓ “除非一个集团中人数很少, 或者除非存在强制或其他某些 特殊手段以使个人按照他们的 共同利益行事,有理性的,寻 求自我利益的个人不会采取行 动以实现他们共同的集团的利 益。”(Olson,1980)
• 1. 过程
D(背叛) T=5,S=0 P=1,P=1
✓ 14个策略程序+1个随机程序(随机选择“合作”或“背叛 ”);
✓ 225场比赛,每个比赛200回合;
✓ 最大收益:15场×200回合×5分=15000分((D,C) 或(C,D));
✓ 最小收益:15场×200回合×0分=0分((D,C)或(C ,D));
能实现团体的最大利益,同时也揭示了个体
理性本身的内在矛盾——从个体利益出发的
行为最终也不一定能真正实现个体的最大利
益,甚至会得到相当差的结果。
2021/7/22
7
二、社会的基本问题
2021/7/22
• 人类社会与其他动物群体的一个重要区别是, 人与人之间可以通过运用个人理性而达致某种 形式的合作。合作能产生“合作剩余”。
✓ “一报还一报”策略的平均分为504.5,即600基准分的
84%,其他8个好的策略中,得基准分的28.4%和83.4%
2021之/7/2间2 。
21
(二)第一届竞赛
• 3. 结论
策略j
囚徒困境PPTPPT课件
创新与变革
面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。
面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。
囚徒困境1课件
囚徒困境
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
坦白不坦白。
如果A选择抵赖,那么就可能会出现两种情况,如 果B选择坦白,那么A将被加重惩罚,判刑8年,而B则 无罪释放;如果B也同样选择抵赖,那么他们将判刑1年。
2.1.3 划线法 ——求纳什均衡
1, 0 0, 4
1, 3 0, 2
0, 1 2, 0
囚 徒
-5, -5
不动的情况下,没有人有兴趣动
这个故事最早是1950年,数学家塔克任斯坦福大 学客座教授给心理学家作讲演时提出的。时至今 日,这个故事广为流传,在哲学、伦理学、政治 学、经济学等学科中获得了极为广泛的应用。
rtgrQ
囚徒困境的应用
在荷兰召开了一次“合作及社会两难困境研讨会”,
与会者都是博弈论的专家。当大会结束后,有两个学者, 麦息克和路特提议大家玩一个游戏。
他们将一个大信封拿出来,请在场的43位学者专家拿 出金钱装到这个信封里。如果到最后这个信封里的钱超过 250元,麦息克和路特将自己掏腰包,退还每人10元。不 过,如果信封内的钱不足250元,就统统没收,大家拿不 到半毛钱。
请问,你会出多少钱呢?
每个人应该要放入的数目:250/43=5.81。
如果每人放进去7元钱,应该就可以超过目标250 元了。等到最后退还10元钱时其它组织,面对一定的环 境条件、在一定的规则下,同时或先后,一次或多次,从 各自允许选择的行为或策略中进行选择并加以实施,各自 取得相应结果的过程。
囚徒困境.完美版PPT
1.1.2 博弈的非技术性定义
博弈——就是一些个人、对组或其它组织,面对一定的环 境条件、在一定的规则下,同时或先后,一次或多次,从 各自允许选择的行为或策略中进行选择并加以实施,各自 取得相应结果的过程。
1.1.2 博弈的非技术性定义
博弈论就是系统研究可以用上述方法定义的各种博弈 问题,寻求在各博弈方具有充分或者有限理性能力的 条件下,合理的策略选择和合理策略选择时博弈的结 果,并分析这些结果的经济意义、效率意义的理论和 方法。
博弈就是决策行为
“石头-剪子-布” 游戏
游戏特点
有一定的规则,规定游戏的参加者,游戏者可以做什么,不 可以做什么。
都有结果,如一方赢、一方输、平局等
策略至关重要,每一个 游戏者所得结果的好坏, 不仅取决于自身的策略 选择,也取决于其他参 加者的策略选择。
游戏特点
在游戏中,也规定了游戏参加者出招的顺序,是同时做出选 择还是先后做出选择等。
每个人从自己收益 最大化出发来考虑 问题,最终往往落 得两败俱伤的结果。 个人的理性算计, 往往导致集体的非 理性结局。
(坦白,坦白)是囚徒困境的纳什均衡。 纳什均衡是什么呢?
假设有n人参与博弈,每个人选择自己的最 优战略,所有参与人选择的战略构成一个战 略组合。
纳什均衡是这样一个战略组合,这种战略 组合由所有参与人的最优战略组成,也就
他们面临的选择和带来的后果组合,可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
请问,他们会选择什么呢? 坦白or 不坦白
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略:
囚徒困境囚徒困境课件
提高信息透明度与沟通效率
总结词
信息透明度和沟通效率的提高有助于减少误解和猜疑,促进囚犯们选择合作策略。
详细描述
在囚徒困境中,信息的透明度和沟通效率决定了囚犯们是否能够做出正确的决策。通过提高信息透明 度,减少信息不对称的情况,以及提高沟通效率,能够让囚犯们更好地理解对方的立场和策略选择, 从而促进合作。
总结词
在社会学中,囚徒困境常被用来研究社会规范和群体行为。
详细描述
在社会学中,囚徒困境常被用来研究社会规范和群体行为。 它说明了在某些情况下,个体理性可能会导致集体非理性的 结果。囚徒困境在社会合作、公共品供给和社区规范等问题 中都有应用。
如何走出囚徒困境
建立信任与合作机制
总结词
信任是合作的基础,通过建立互信,囚犯们才可能选择合作策略。
公共品博弈与囚徒困境
将公共品博弈与囚徒困境进行比较, 探讨在公共资源利用中的合作与竞争。
囚徒困境与社会科学的交叉研究
经济学中的囚徒困境
研究囚徒困境在经济学中的应用,如市 场竞争、产业组织等领域。
VS
社会心理学中的囚徒困境
探讨囚徒困境在解释人类行为和社会互动 中的作用,以及如何促进合作与信任。
目录
• 囚徒困境简介 • 囚徒困境模型 • 囚徒困境的应用 • 如何走出囚徒困境 • 囚徒困境的未来研究
囚徒困境简介
定义与背景
定义
囚徒困境是一种博弈论模型,描述了两个囚犯在面对合 作与背叛的抉择时,尽管合作对双方都有利,但最终往 往导致双方都选择背叛的结果。
背景
该理论常用于解释在竞争激烈的环境中,个体理性可能 会导致集体非理性的现象。
政治学中的囚徒困境
总结词
在政治学中,囚徒困境常被用来分析国家间的外交政策和国际关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
台湾要买美国的F16,中国希望欧洲对华军售,两个地区的政府都在 为武器画着大价钱从而损失了国家的经济发展力,这也是囚徒困 境的模式,都会担心如果一旦开战会对自己不利,如果我没有先 进武器,你有先进武器,那么开战的话我就会吃亏。如果我有先 进武器你没有的话,我就会得利。所以我一定要有先进武器。殊 不知如果两岸达成和平条约,双方都不购买先进武器,把资金都 放在经济发展人民收入上,那才是真的双赢。
有2个涉嫌共同作案偷窃的嫌疑人 A和B被带进警察局。假定警方对 2名犯罪嫌疑人实行隔离关押,隔 离审讯,每个犯罪嫌疑人都无法 观察到对方的选择。
警方怀疑他们作案,但并没有掌 握他们作案的确凿证据,于是明 确地分别告诉2名嫌疑人:对他们 犯罪事实的认定及相应的量刑, 完全取决于他们自己供认与否。
如果一方与警方合作,坦白所做违 法之事,而另一方抵赖,招认方将无 罪释放,另一方则会被判重刑8年;
之政治博弈
SUCCESS
THANK YOU
2019/8/2
50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑, 我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果 朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国 本土。所以双方都是以出兵和不出兵考虑,如果出兵,会有经济 损失,如果不出兵会威胁自己的领土,所以双方在”囚徒困境 “模式下都选择了出兵,最后两败俱伤。
囚徒困境
小组成员:王嘉瑶 王洁霞 王孟佳 王晓斌
什么是博弈论?
博弈论又被称为对策论(Game Theory)既是现代数学的一个新分 支,也是运筹学的一个重要学科。
博弈论主要研究公式化的激励结构间的相互作用。是研究具有斗 争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体 的预测行为和实际行为,并研究它们的优化策略。生物学家使用 博弈理论来理解和预测进化论的某些结果。
5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即 相关量处于稳定值。在供求关系中,某一商品市场如果在某一价 格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是 一稳定的博弈结果。
“囚徒困境”是1950年美国兰德公司提出的博弈论模 型。两个共谋犯罪的人被关入监狱,不能互相沟通情 况。如果两个人都不揭发对方,则由于证据不确定, 每个人都坐牢一年;若一人揭发,而另一人沉默,则 揭发者因为立功而立即获释,沉默者因不合作而入狱 十年;若互相揭发,则因证据确实,二者都判刑八年。 由于囚徒无法信任对方,因此倾向于互相揭发,而不 是同守沉默。
非零和博弈是一种合作下的博弈,博弈中各方 的收益或损失的总和不是零值,它区别于零和 博弈。在经济学研究中比较有用。 在这种状况 时,自己的所得并不与他人的损失的大小相等, 连自己的幸福也未必建立在他人的痛苦之上, 即使伤害他人也可能“损人不利己”,所以博 弈双方存在 “双赢”的可能,进而达成合作。
现实中的囚徒困境
如果双方都与警方合作共同招认, 各被判刑5年;
如果双方均不认罪,因为警察找不 到其他证明他们违法的证据,则判刑 1年。
ห้องสมุดไป่ตู้
A B
不坦白
坦白
不坦白 坦白
A:判刑1年 B:判刑1年 A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年 A:判刑5年 B:判刑5年
现实中,基于人是理性的这一前提,无论同伙是否坦白,自 己坦白总是比不坦白好。两个人这样一算计,最好的结果都 是选择坦白,各判刑5年。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果 等。其中局中人、策略和收益是最基本要素。局中人、行动和结 果被统称为博弈规则。
类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收 益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自 己的收益最大,即策略选择问题。
(3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策 略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动 者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动 者的策略。
然而实际上,如果两人都抵赖,那么都会无罪释放,显然这 个结果是最好的。但人在理性算计排除了这一结果。
这个故事讲得就是囚徒困境,是在1950年,由就职于兰德公 司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔 (Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔 伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒 困境”。
政治博弈也是一种非零和博弈。
零和效应:实力相当的双方在谈判时做出大体相等的让 步,方可取得结果,亦即每一方所得与所失的代数和大 致为零,谈判便可成功。然而,人类社会发展的历程越 来越走向“非零和”也就是我们现在所说的双赢。
3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博 弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且 与全局中人所取定的一组策略有关。所以,一局博弈结束时每个 局中人的“得失”是全体局中人所取定的一组策略的函数,通常 称为支付(payoff)函数。
4)对于博弈参与者来说,存在着一博弈结果 。
要素
1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为 一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多 于两个局中人的博弈称为 “多人博弈”。
2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行 动方案,即方案不是某阶段的行动方案,而是指导整个行动的一 个方案,一个局中人的一个可行的自始至终全局筹划的一个行动 方案,称为这个局中人的一个策略。
囚徒困境的核心理念是:博弈全输,合作双赢,怀疑或不信 任导致失败。
要诀:注重合作,力求双赢;注重策略选择,善于换位思考。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个 人最佳选择并非团体最佳选择。虽然困境本身只属模型性质, 但在现实中政治、经济、军事、企业经营、社会生活、组织 管理等方面,也会频繁出现类似情况。
有2个涉嫌共同作案偷窃的嫌疑人 A和B被带进警察局。假定警方对 2名犯罪嫌疑人实行隔离关押,隔 离审讯,每个犯罪嫌疑人都无法 观察到对方的选择。
警方怀疑他们作案,但并没有掌 握他们作案的确凿证据,于是明 确地分别告诉2名嫌疑人:对他们 犯罪事实的认定及相应的量刑, 完全取决于他们自己供认与否。
如果一方与警方合作,坦白所做违 法之事,而另一方抵赖,招认方将无 罪释放,另一方则会被判重刑8年;
之政治博弈
SUCCESS
THANK YOU
2019/8/2
50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑, 我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果 朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国 本土。所以双方都是以出兵和不出兵考虑,如果出兵,会有经济 损失,如果不出兵会威胁自己的领土,所以双方在”囚徒困境 “模式下都选择了出兵,最后两败俱伤。
囚徒困境
小组成员:王嘉瑶 王洁霞 王孟佳 王晓斌
什么是博弈论?
博弈论又被称为对策论(Game Theory)既是现代数学的一个新分 支,也是运筹学的一个重要学科。
博弈论主要研究公式化的激励结构间的相互作用。是研究具有斗 争或竞争性质现象的数学理论和方法。 博弈论考虑游戏中的个体 的预测行为和实际行为,并研究它们的优化策略。生物学家使用 博弈理论来理解和预测进化论的某些结果。
5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即 相关量处于稳定值。在供求关系中,某一商品市场如果在某一价 格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出, 此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是 一稳定的博弈结果。
“囚徒困境”是1950年美国兰德公司提出的博弈论模 型。两个共谋犯罪的人被关入监狱,不能互相沟通情 况。如果两个人都不揭发对方,则由于证据不确定, 每个人都坐牢一年;若一人揭发,而另一人沉默,则 揭发者因为立功而立即获释,沉默者因不合作而入狱 十年;若互相揭发,则因证据确实,二者都判刑八年。 由于囚徒无法信任对方,因此倾向于互相揭发,而不 是同守沉默。
非零和博弈是一种合作下的博弈,博弈中各方 的收益或损失的总和不是零值,它区别于零和 博弈。在经济学研究中比较有用。 在这种状况 时,自己的所得并不与他人的损失的大小相等, 连自己的幸福也未必建立在他人的痛苦之上, 即使伤害他人也可能“损人不利己”,所以博 弈双方存在 “双赢”的可能,进而达成合作。
现实中的囚徒困境
如果双方都与警方合作共同招认, 各被判刑5年;
如果双方均不认罪,因为警察找不 到其他证明他们违法的证据,则判刑 1年。
ห้องสมุดไป่ตู้
A B
不坦白
坦白
不坦白 坦白
A:判刑1年 B:判刑1年 A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年 A:判刑5年 B:判刑5年
现实中,基于人是理性的这一前提,无论同伙是否坦白,自 己坦白总是比不坦白好。两个人这样一算计,最好的结果都 是选择坦白,各判刑5年。
基本概念中包括局中人、行动、信息、策略、收益、均衡和结果 等。其中局中人、策略和收益是最基本要素。局中人、行动和结 果被统称为博弈规则。
类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收 益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自 己的收益最大,即策略选择问题。
(3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策 略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动 者不知道先行动者的策略。
动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动 者的策略。
然而实际上,如果两人都抵赖,那么都会无罪释放,显然这 个结果是最好的。但人在理性算计排除了这一结果。
这个故事讲得就是囚徒困境,是在1950年,由就职于兰德公 司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔 (Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔 伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒 困境”。
政治博弈也是一种非零和博弈。
零和效应:实力相当的双方在谈判时做出大体相等的让 步,方可取得结果,亦即每一方所得与所失的代数和大 致为零,谈判便可成功。然而,人类社会发展的历程越 来越走向“非零和”也就是我们现在所说的双赢。
3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博 弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且 与全局中人所取定的一组策略有关。所以,一局博弈结束时每个 局中人的“得失”是全体局中人所取定的一组策略的函数,通常 称为支付(payoff)函数。
4)对于博弈参与者来说,存在着一博弈结果 。
要素
1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为 一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多 于两个局中人的博弈称为 “多人博弈”。
2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行 动方案,即方案不是某阶段的行动方案,而是指导整个行动的一 个方案,一个局中人的一个可行的自始至终全局筹划的一个行动 方案,称为这个局中人的一个策略。
囚徒困境的核心理念是:博弈全输,合作双赢,怀疑或不信 任导致失败。
要诀:注重合作,力求双赢;注重策略选择,善于换位思考。
囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个 人最佳选择并非团体最佳选择。虽然困境本身只属模型性质, 但在现实中政治、经济、军事、企业经营、社会生活、组织 管理等方面,也会频繁出现类似情况。