博弈论中的经典分析及启示囚徒困境74页PPT

合集下载

博弈论论文囚徒困境的启示和思考

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考二、囚徒困境的解释如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。

参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。

另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。

以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。

但根据以上假设,二人均为理性的个人,且只追求自己个人利益。

均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。

这就是“困境”所在。

实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明三、经济学例子:关税战两个国家,在关税上可以有以两个选择:提高关税,以保护自己的商品。

(背叛)与对方达成关税协定,降低关税以利各自商品流通。

(合作)当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。

然后二国又重新达成关税协定。

第九章 博弈论 《微观经济学》PPT课件

第九章 博弈论 《微观经济学》PPT课件




1,-1
3,-3
A
图9-3 写字博弈的收益矩阵
9.2 占优策略
• 在一个有n个人参与的博弈G={S1,…,Sn;u1,…,un}中,令 si′和si″是第i个参与人可选择的两个策略,如果对其他所有参与 人任意的策略组合s-i,总有 Ui(si′, s-i)<ui(si″, s-i)s-i(9-4)
• 式中:t-i表示除参与人i以外的其他参与人的类型。
9.4* 贝叶斯纳什均衡
9.4.3 不完全信息古诺模型
• 现在我们假定市场反需求函数为P=a-q1-q2,ci为每个厂商不变的 单位成本,那么厂商的利润函数为:
πi=qi(a-q1-q2-ci)=qi(ti-q1-q2) (i=1, 2) • 式中:ti=a-ci。更进一步假定a=2,c1=1,=3/4,=5/4,μ=1/2,
ቤተ መጻሕፍቲ ባይዱ囚徒B
坦白
不坦白

坦白
-3,-3
0,-6

A
不坦白
-6,0
-1,-1
9.1 基本描述
9.1.2 基本概念 • 博弈是指任何一种由一人、两人或多人参与竞争的情形。 • 任何一个博弈都必须至少具备以下3个基本要素:参与人、策
略和支付。除此之外,行动、信息等也都是博弈的要素。
9.1 基本描述
• 参与人是指博弈中每个策略的决策者,他的目的是通过自己个 人的理性决策来最大化自己的支付水平。
9.3 纳什均衡
2.伯特兰模型 • 伯特兰模型是寡头厂商联合定价博弈。与古诺模型不同,伯特
兰模型中厂商同时选择的不是产量,而是产品价格。 • 因此,该伯特兰模型的纳什均衡为((a+c)/(2-b),

清华大学博弈论讲义ppt课件

清华大学博弈论讲义ppt课件
完美信息perfect information:指一个参与 人对其他参与人的行动选择有准确的理 解,即每个信息集只包含一个值。
清华诚志
10
共同知识common knowledge
所有参与人知道每一步的信息集。
清华诚志
11
战略strategies
参与人在给定信息集的情况下的行动规 则,它规定参与人在什么时候选择什么 行动。
perative 合作博弈强调的是集体主义,团体理性
Ration
清华诚志
16
非合作博弈
而非合作博弈则主要研究人们在利益相 互影响的局势中如何选择策略使得自己 的收益最大,强调个人理性、个人最优 决策,其结果是有时有效率,有时则不 然。目前经济学家谈到博弈论主要指的 是非合作博弈,也就是各方在给定的约 束条件下如何追求各自利益最大化,最 后达到力量均衡。
清华诚志
1
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的 意义。个人理性与集体理性的冲突,各 人追求利己行为而导致的最终结局是一 个“纳什均衡”,也是对所有人都不利 的结局。他们两人都是在坦白与抵赖策 略上首先想到自己,这样他们必然要服 长的刑期。只有当他们都首先替对方着 想时,或者相互合谋(串供)时,才可以得 到最短时间的监禁的结果。
的均衡有直接的影响。
清华诚志
19
分类
博弈的划分可以从参与人行动的次序和 参与人对其它参与人的特征、战略空间 和支付的知识、信息,是否了解两个角 度进行。把两个角度结合就得到了4种 博弈:完全信息静态博弈,完全信息动 态博弈,不完全信息静态博弈,不完全 信息动态博弈
清华诚志
20
博弈的分类及对应的均衡
为了分析方便,自然nature被当作虚拟参 与人。

囚徒困境专题优秀PPT

囚徒困境专题优秀PPT
27
公共资源悲哀
思考1 思考2
为什么人们在消费各种公共资源时, 如果各取所需,留给下一代的越来越 少?而在社会优化分配中,消耗一半, 留下一半给后代。也就是说,当一种 资源成了公共资源的时候,还能够实 行各取所需吗?
全球转暖的温室效应是否属于公共资 源悲剧?
28
公共资源悲哀
思考3 在我国,利用电话线的网络快车 (ADSL),包月租或者包年租的时候, 每个人都想把网络打开挂在网络上 (在线游戏的激励),这样是不是公 共悲剧?你家里的网络快车是否真的 快?
39
但是,对手的战略锁定了“疯狂 艾迪”的行为,因为“疯狂艾迪”的这 一计划会有相反的效果。因为顾客会到 对手那里先以300美元买下录相机,然后 再获退款50美元。这样,对手自然将价 格降到更低的价格250美元一台,顾客反 而是从“疯狂艾迪”那里流向对手而不 是相反。
40
如果对手不想以250美元一台出售 录相机,他也可以将价格降到275美元一 台,只要它发现有顾客来要求退款,就 会发现对手的背叛行为,从而将价格降 到了250美元一台。既不以太低价出售, 又快速发现对手的背叛从而以降价予以 报复,使对手降价也不能增大顾客量, 从而蒙受损失。
20
修 甲
不修
修路博弈
乙 修
不修
1,1
-1,3
3,-1
0,0
21
我们看到,对甲和乙两家居民来说, “修路”都是劣战略,因而他们都不会 出资修路。
22
这就是我们看到的为什么大多数 路、桥等公共设施都是由政府出资修建 的原因。
同样的道理,国防、教育、社会 保障,环境卫生等都由政府承担资金投 入,私人一般没有积极性承担这方面服 务的积极性和能力。
31

囚徒困境PPTPPT课件

囚徒困境PPTPPT课件
第10页/共27页
警方怀疑他们作案,但并没有掌握他们作案的确凿证据,于是明 确地分别告诉2名嫌疑人:对他们犯罪事实的认定及相应的量刑, 完全取决于他们自己供认与否。如果一方与警方合作,坦白所做 违法之事,而另一方抵赖,招认方将无罪释放,另一方则会被判 重刑8年;如果双方都与警方合作共同招认,各被判刑5年;而如 果双方均不认罪,因为警察找不到其他证明他们违法的证据,则 判刑1年。
1.1.1 什么是“博弈”?
博弈 Game(游戏)
围棋等棋类比赛、桥牌拱猪等扑克游戏,以及田径、球 类等各种体育比赛
人们在一定规则下进行竞赛 在竞赛中,策略,或者说
计谋,有举足轻重的作用。
第1页/共27页
博弈起源于游戏中的策略对抗
博弈是策略起关 键作用的游戏
第2页/共27页
博弈,根据《辞海》的解释,就是在多决策主体之 间行为具有相互作用时,各主体根据所掌握信息及 对自身能力的认知,做出有利于自己的决策的一种 行为。
他们面临的选择和带来的后果组合,可以用下面的表格来表示。
A B
不坦白
坦白
不坦白
坦白
A:判刑1年 B:判刑1年
A:判刑8年 B:无罪释放
A:无罪释放 B:判刑8年
A:判刑5年 B:判刑5年
第11页/共27页
请问,他们会选择什么呢? 坦白or 不坦白
第12页/共27页
从上面的表中我们可以知道:每个嫌疑人都有两种可供 选择的策略: 坦白不坦白。
博弈就是决策行为
第3页/共27页
“石头-剪子-布” 游戏
第4页/共27页
第5页/共27页
游戏特点
有一定的规则,规定游戏的参加者,游戏者可以做什么,不 可以做什么。 都有结果,如一方赢、一方输、平局等

博弈论经典案例——囚徒困境ppt课件

博弈论经典案例——囚徒困境ppt课件
博弈论经典案例之
囚徒困境
1
博弈无处不在
2
至少有一人招供
缺乏足够的证据
3
坦白从宽,抗拒从严
4
坦白从宽,抗拒从严
认罪
重判10年 5
同时坦白,各判8年
6
同时抵赖,各判1年
7
思考
选择有几种、结局有几种? 如果你,如何选择? 为什么这么选择;如何考虑的?
8
坦白? 抵赖?
9
囚徒困境博弈表格
囚徒1 囚徒2
坦白
抵赖
坦白
—8,—8
0,—10
抵赖
—10,0
—1,—1
10
• 关于这个假设案例,显然最好的对策是双方都抵 赖,其结果是各被判1年,但隔离的审讯办法却杜 绝了犯罪嫌疑人事先有协商的机会。
• 从心理学的角度来分析,两人在受审时首先必会 怀疑对方会主动交代罪行以求自保,所以他们必 定会选择对自身最大利益的选项,那就是坦白认 罪。
11
反映了一个很深刻的问 题??
12
个人理性与集体理性的矛盾
13
囚徒困境可以用来解释为什么在一个群体 中没有人采取行动,来使该群体中每个人 的境况都得到改善。
——如公共产品的供给
14
小 区 路 灯 坏 了

我更换,得不偿失啊 你更换,我就会占便宜
更换,大家都不 摸黑
16
李四 更换
更换
1,1
张三
不更换 2,-1
不更换 -1,2 0,0
囚徒困境的收益矩阵
1717

囚徒困境的根源与启示PPT教案

囚徒困境的根源与启示PPT教案

从这个意义上说,“纳什均衡” 提出的悖论实际上动摇了西方 经济学的基石。因此,从“纳 什均衡”中我们还可以悟出一 条真理:合作是有利的“利己 策略”。但它必须符合以下黄 金定律:按照你愿意别人对你 的方式来对别人,但只有他们 也按同样方式行 第7页/共27页 事才行。也就 是中国人说的“己所不欲勿施
…… 第21页/共27页
如何走出囚徒困境
报复与惩罚(株连制) “人质”方案
长期关系和重复博弈
第22页/共27页
判断分析题
➢ 1.单人博弈就是个人最优 化决策,
•正确。因为单人博弈只有一个博弈
方与,因典此型不的可能博存弈在问博弈题方有之本间行质为 和区利益别的。交互作用和制约,因此实际
上就是个人最优化决策,与存在博弈 方之间行为和利益交互作用和制约的 典型博弈问题有本质的区别。
➢ 所以,要破解囚徒困境,就 要跳出这个模型本身,从更
第10页/共27页
高的层面上给以制度性的约
囚徒困境的实际运用
举例来是说,我是供应商,你 是大超市,你可以选择拖欠货款, 我也可以选择延迟发货或较低的 质量,套用上面的模型:
超市
不合作 合

不合作 -5 -
5
2 -8第11页/共27页
供应商
囚徒困境的实际运用
第3页/共27页
囚徒困境的内在根源
➢ 在个体之间存在行为和利益 相互制约的博弈结构中,以 个体理性和个体选择为基础 的分散决策方式,无法有效 地协调各方面的利益,并实 现整体、个体利益共同的最 优。简单地说,“囚徒的困
第4页/共27页
境”问题都是个体理性和集
囚徒困境的启示
“囚徒的两难选择”有着广泛 而深刻的意义。个人理性与集 体理性的冲突,各人追求利己 行为而导致的最终结局是一个 “纳什均衡”,也是对所有人 都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到 自己,这样他们必然要服长的 刑期。只有当他 第5页/共27页 们都首先替对 方着想时,或者相互合谋(串供)

S-囚徒困境与社会的基本问题PPT课件

S-囚徒困境与社会的基本问题PPT课件

2021/7/22
14
(二)奥尔森的“集体行动的逻辑”
✓ 由具有自利倾向的理性“经济人 ”组成的集体中,因“搭便车” 行为而难以实现合作:人人都想 分享集体行动的成果,但不愿分 担集体行动的成本。集体越大, 越难克服“搭便车”行为。
2021/7/22
15
(二)奥尔森的“集体行动的逻辑”
✓ “除非一个集团中人数很少, 或者除非存在强制或其他某些 特殊手段以使个人按照他们的 共同利益行事,有理性的,寻 求自我利益的个人不会采取行 动以实现他们共同的集团的利 益。”(Olson,1980)
• 1. 过程
D(背叛) T=5,S=0 P=1,P=1
✓ 14个策略程序+1个随机程序(随机选择“合作”或“背叛 ”);
✓ 225场比赛,每个比赛200回合;
✓ 最大收益:15场×200回合×5分=15000分((D,C) 或(C,D));
✓ 最小收益:15场×200回合×0分=0分((D,C)或(C ,D));
能实现团体的最大利益,同时也揭示了个体
理性本身的内在矛盾——从个体利益出发的
行为最终也不一定能真正实现个体的最大利
益,甚至会得到相当差的结果。
2021/7/22
7
二、社会的基本问题
2021/7/22
• 人类社会与其他动物群体的一个重要区别是, 人与人之间可以通过运用个人理性而达致某种 形式的合作。合作能产生“合作剩余”。
✓ “一报还一报”策略的平均分为504.5,即600基准分的
84%,其他8个好的策略中,得基准分的28.4%和83.4%
2021之/7/2间2 。
21
(二)第一届竞赛
• 3. 结论
策略j

囚徒困境囚徒困境PPT课件

囚徒困境囚徒困境PPT课件

价格
$120 110 100 90 80 70 60 50 40 30 20 10
0
第14页/共35页
总收益
$0 1,100 2,000 2,700 3,200 3,500 3,600 3,500 3,200 2,700 2,000 1,100
0
寡头数量如何影响市场结果
卖者数量增加如何影响价格和产量: 产量效应: 由于价格高于边际成本,在现行价格下多销售将增加利 润。 价格效益: 提高生产将增加总销售量,这就会降低价格并减少销售 的每个单位产品带来的利润。
格和垄断利润的合ห้องสมุดไป่ตู้结果。
第23页/共35页
杰克和吉尔的寡头博弈
卖40加仑
杰克的决策
卖40加仑
卖30加仑
杰克得到1600 美元利润
杰克得到1500 美元利润
吉尔的决策
吉尔得到 1600美元利润
吉尔得到 2000美元利润
卖30加仑
杰克得到2000 美元利润
吉尔得到 1500美元利润
杰克得到1800 美元利润
博弈论 研究人们在各种战略情况 下如何行事。 战略决策 是指每个人在决定采取 什么行动时,必须如何考虑其他人 对这种行动会作出什么反应的决策。
第17页/共35页
博弈论与合作经济学
➢ 因为寡头市场上企业数量很少,每家企业都必须按战略行事。 ➢ 每个企业都知道,它的利润不仅取决于它生产多少,还取决于其它企业
0
双头例子: 价格和供给量
在竞争市场上,每个企业的生产决策使 得价格等于边际成本。在水的市场上, 边际成本是零。因此在竞争之下,水的 均衡价格是零,均衡数量是120加仑。
P = MC = 0 仑
Q = 120 加

囚徒困境PPTPPT课件

囚徒困境PPTPPT课件
创新与变革
面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。

博弈论与囚徒困境-展示PPT

博弈论与囚徒困境-展示PPT
《n人博弈的均衡点》(1950) 《非合作博弈》(1951)
《美丽心灵》本片荣获8项奥斯卡提名, 最终夺得第74届奥斯卡最佳影片、最佳 导演、最佳改编剧本和最佳女配角4项大 奖。
囚徒困境 The Prisoners’ Dilemma
模型的提出
1950年由就职于兰德公司的梅里尔·弗勒德(Merrill M. Flood)和梅尔文·德雷希尔(Melvin Dresher)提出 ,后由阿尔伯特·塔克(Albert W. Tucker)以囚徒方式阐 述,并命名为“囚徒困境”。
“囚徒困境”的思考??
“囚徒困境”模型说明一个道理:从个人利 益出发选择的最优策略,从整体看却不一定 是个好的结果,个人利益和集体利益之间存 在冲突。
❖ “各个人都不断地努力为自己所能支配的资本寻找到最有 利的用途。固然,他所考虑的不是社会的利益,而是他自 身的利益,但他对自身的利益的研究自然会或者毋宁说必 然会引导他选定最有利于社会的用途。” -----《国富论》 (Adam Smith,1776)(摘自:亚当.斯密:《国民财富的性质和
❖ 在一次严重纵火案发生后,警察抓到两名嫌疑人。事实 上正是他们为了报复而一起放火的,但警察没有掌握足 够的证据。于是,将他们隔离审问,两个人都明白警方 的政策:
如果两人都坦白,入狱5年;
如果两人都不坦白,由于证据不充分,他们只会被认定 为妨碍公务罪而入狱1年;
如果一人抵赖,而另一人坦白,则抵赖者入狱8年,坦白 者无罪释放。
原因的研究》下卷,商务印书馆,1972年版,第25页)
❖ “……在这场合,像在其他许多场合一样,他受着一只看 不见的手的指导,去尽力达到一个并非他本意想要达到的 目的。也并不因为事非出于本意,就对社会有害。他追求 自己的利益,往往使他能比在真正出于本意的情况更有效 地促进社会的利益。” -----《国富论》(Adam Smith, 1776)(摘自:亚当.斯密:《国民财富的性质和原因的研究》上卷,商务
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过。——卢梭
博弈论中的经典分析及启示 囚徒困境
26、机遇对于有准备的头脑有特别的 亲和力 。 27、自信是人格的核心。
28、目标的坚定是性格中最必要的力 量泉源 之一, 也是成 功的利 器之一 。没有 它,天 才也会 在矛盾 无定的 迷径中 ,徒劳 无功。- -查士 德斐尔 爵士。 29、困难就是机遇。--温斯顿.丘吉 尔。 30、我奋斗,所以我快乐。--格林斯 潘。
相关文档
最新文档