博弈论课件
合集下载
博弈论PPT课件
第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
博弈论ppt课件
15
➢ 扩展术语:
信息:信息集; 完全信息(complete); 完美信息(perfect)。
共同知识:双方可能获取的相同信息; 彼此都能算清楚。
博弈结果:均衡策略组合;均衡行动组合。 均衡:所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型(标准型、正则型)表述:
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大 学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症,九 十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则,不开发。(?)
博弈论2009
精选ppt课件
22
关键问题: 对自然状态的概率估计; 不同时间决策(决策顺序); 对对方先验信息的估计(即估计对方对信
息的掌握程度)。
现实困难: 对市场了解程度不同; 对对方了解程度不同; 如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市 (海滩占位模型)
*********************
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
《博弈论初步》课件
THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡 ,其中每个参与者都认为当前策 略是最好的,不会受到其他参与 者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略,逐步逼近纳什均衡。这 种方法适用于较简单的博弈模型,但对于复杂的博弈模型 可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题,通过求解线性规划 来找到纳什均衡。这种方法适用于具有线性特征的博弈模 型,但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊,为企业制定营销策略提供 博弈论可以用来分析选民的投票行为和政治立场,预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法,帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法 适用于具有矩阵特征的博弈模型,但需要一定的数学基础 。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中,企业之间通过价格策略进行竞争 ,最终形成价格均衡,即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求,最终 达成工资协议,这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议,强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。
博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式
博弈论教学课件(全)
二、博弈论的经济学渊源
经济学的一些思想为博弈论提供了基础,其中最 重要的就是所谓的“理性人”。
描述理性人的工具就是所谓的理性偏好。为了方便, 我们又用效用函数(在博弈论中称为收益函数)来 表示偏好。
构成博弈论基础的一个重要的经济定理就是所谓的 理性选择原理:如果决策主体的偏好是理性的,那 么(有限)选择集中就一定存在最优选择,这个选 择可能是唯一的,也可能是多个。
定义2.1 博弈表达的基本式(或策略式)由博弈的参 与者N,策略空间S和收益函数u三个要素组成,即G = {N, S, u}。
这里需要注意的是,完全信息静态博弈在多数情况 下,策略就等同于行动,所以G={ A,u}。但严格来 讲,策略并不是行动。
我们可以通过一个例子来加以说明。
[例1] 进攻与防守
对称博弈和对称均衡能够大大节省工作量,这也是博弈论中所举例子通常为对 称博弈的原因。
对称博弈通俗说就是代表参与者身份的下标,在分析中可以省略掉而没有关系。
四、混合策略
博弈论里面最根本的问题是什么?就是均衡 的存在性。如果均衡不存在,所有的工作都 成了无用功,之所以引入混合策略,意义就 在这里,因为如果仅仅限制在纯策略的范围 内讨论博弈的话,均衡有可能是不存在的。
双方争夺一个据点,有两条进攻路线X和Y,攻方有 两个军,而防守方也有两个军,只有当守方的兵力 不少于攻方时,才能击退进攻,否则据点将会失守。
首先可知守方的防守方案(即策略)为(0,2),(1,1),(2,0),即在X线路和Y线路驻扎 军队数,同样可以到的攻方的进攻方案(0,2),(1,1)和(2,0)。容易看出,行动并非策 略,策略是行动方案。
需要注意的几个问题:
(1)表达同一个偏好的收益函数不唯一,但在 单调变换下却是唯一的。
博弈论课件
扩展一:不完全信息博弈
不完全信息博弈的定义
01
在博弈中,参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度,可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略,研究候选人如何 制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调,分析政策 制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作,分析国家如何通过 外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡 。
特点
纳什均衡是一种稳定的状态,任何参 与者单方面改变自己的策略都不会获 得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略, 该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略,该 策略都能为参与者带来更低的收益 。
特点
在优势策略下,参与者没有理由改 变自己的策略;在劣势策略下,参 与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降,还可能引发市场恶性竞争,破坏市场秩序。此外,价格战还可能导致产品质量 下降,损害消费者利益。
案例二:国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中,各国之间往往存在着复杂的博弈关系。为了维护自身利益,各 国会采取不同的博弈策略,如通过外交手段、经济制裁、军事威胁等方式来达 到自己的目的。
博弈论全套课件
三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
《博弈论教程》课件
博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
《博弈论的经典案例》课件
• 原理:囚徒之间的合作或背叛关系直接影响他们的判罚。 • 应用:虚拟囚徒困境可以帮助解释社会合作的动机和策略。
报童问题
报童问题是博弈论中的一个常见案例,涉及一个报童需要决定采购报纸的数量。 • 原理:报童必须在满足需求和最小化成本之间做出权衡。 • 应用:报童问题可应用于库存管理、供应链优化和市场需求预测。
博弈论提供了计算机科学领域中优化、决策 和人工智能算法的基础。
政治学
博弈论研究了政治家、政党和国家之间的互 动关系,探讨了选择、协商和合作的策略。
生物学
博弈论用于研究动物行为、进化和生态系统 中的竞争和合作策略。
虚拟囚徒困境
虚拟囚徒困境是博弈论的一个经典案例之一。它描述了两一个有趣而重要的领域,它研究人与人之间的互动以及决策制定的 艺术。
《博弈论的经典案例》PPT课 件
博弈论是一个研究人们在决策过程中如何选择的分支学科。
什么是博弈论
博弈论是通过数学模型和分析来研究人们在决策过程中如何选择的学科。它从战略的角度提供了准确的 分析和预测。
博弈论的应用
经济学
博弈论在经济学中被广泛应用,帮助解释市 场行为、竞争策略和合作行为等现象。
计算机科学
拍卖
拍卖是博弈论的一个重要领域,涉及多个竞标者在有限资源上的竞争。 • 原理:拍卖涉及竞标策略、价格设定和资源配置等问题。 • 应用:拍卖可见于艺术品、土地和网络广告等领域。
集体行动难题
集体行动难题是博弈论中探讨社会合作和公共利益的案例。 • 原理:集体行动需要协调个体的利益,以达到共同的目标。 • 应用:集体行动问题可应用于环境保护、公共资源管理和社会合作。
报童问题
报童问题是博弈论中的一个常见案例,涉及一个报童需要决定采购报纸的数量。 • 原理:报童必须在满足需求和最小化成本之间做出权衡。 • 应用:报童问题可应用于库存管理、供应链优化和市场需求预测。
博弈论提供了计算机科学领域中优化、决策 和人工智能算法的基础。
政治学
博弈论研究了政治家、政党和国家之间的互 动关系,探讨了选择、协商和合作的策略。
生物学
博弈论用于研究动物行为、进化和生态系统 中的竞争和合作策略。
虚拟囚徒困境
虚拟囚徒困境是博弈论的一个经典案例之一。它描述了两一个有趣而重要的领域,它研究人与人之间的互动以及决策制定的 艺术。
《博弈论的经典案例》PPT课 件
博弈论是一个研究人们在决策过程中如何选择的分支学科。
什么是博弈论
博弈论是通过数学模型和分析来研究人们在决策过程中如何选择的学科。它从战略的角度提供了准确的 分析和预测。
博弈论的应用
经济学
博弈论在经济学中被广泛应用,帮助解释市 场行为、竞争策略和合作行为等现象。
计算机科学
拍卖
拍卖是博弈论的一个重要领域,涉及多个竞标者在有限资源上的竞争。 • 原理:拍卖涉及竞标策略、价格设定和资源配置等问题。 • 应用:拍卖可见于艺术品、土地和网络广告等领域。
集体行动难题
集体行动难题是博弈论中探讨社会合作和公共利益的案例。 • 原理:集体行动需要协调个体的利益,以达到共同的目标。 • 应用:集体行动问题可应用于环境保护、公共资源管理和社会合作。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011-7-29
博弈论(陈艳)
囚徒困境
假设警察局抓住了两个合伙犯罪的嫌疑犯, 假设警察局抓住了两个合伙犯罪的嫌疑犯,但获 得的证据并不十分确切, 得的证据并不十分确切,对于两者的量刑就可能 取决于两者对于犯罪事实的供认。 取决于两者对于犯罪事实的供认。警察局将这两 名嫌疑犯分别关押以防他们串供。两名囚徒明白, 名嫌疑犯分别关押以防他们串供。两名囚徒明白, 如果他们都交代犯罪事实,则可能将各被判刑5 如果他们都交代犯罪事实,则可能将各被判刑5 如果他们都不交代, 年;如果他们都不交代,则有可能只会被以较轻 的妨碍公务罪各判1 如果一人交代, 的妨碍公务罪各判1年;如果一人交代,另一人 不交代,交代者有可能会被立即释放, 不交代,交代者有可能会被立即释放,不交代者 则将可能被重判8 则将可能被重判8年。
2011-7-29 博弈论(陈艳)
智猪博弈
小猪 按 大猪 按 等待 5,1 9,-1 等待 4,4 0,0
2011-7-29
博弈论(陈艳)
在这种情况下,不论大猪采取何种策略, 在这种情况下,不论大猪采取何种策略,小猪的 最佳策略是等待,即在食槽边等待大猪去揿按钮, 最佳策略是等待,即在食槽边等待大猪去揿按钮, 然后坐享其成。而由于小猪总是会选择等待, 然后坐享其成。而由于小猪总是会选择等待,大 猪无奈之下只好去揿按钮。 猪无奈之下只好去揿按钮。这种策略组合就是名 闻遐迩的“纳什均衡” 它指的是, 闻遐迩的“纳什均衡”。它指的是,在给定一方 采取某种策略的条件下, 采取某种策略的条件下,另一方所采取的最佳策 此处为大猪揿按钮) 多劳者不多得。 略(此处为大猪揿按钮), 多劳者不多得。
2011-7-29 博弈论(陈艳)
斗鸡博弈(胆小鬼博弈) (胆小鬼博弈)
B 进 A 进 退 -3,-3 0,2 退 2,0 0,0
2011-7-29
博弈论(陈艳)
性别战
谈恋爱中的男女通常是共渡周末而不愿意分开活动 但对于周末干什么, 的。但对于周末干什么,男女双方各自有着自己的 偏好。男方喜欢看足球比赛,女方喜欢看电影。 偏好。男方喜欢看足球比赛,女方喜欢看电影。 在这个博弈中,存在着两个纳什均衡。 在这个博弈中,存在着两个纳什均衡。男女双方或 者一起去看足球,或者一起去看电影。 者一起去看足球,或者一起去看电影。如果没有进 一步的信息, 一步的信息,我们无法确定男女双方在上述博弈中 会作出什么选择。 会作出什么选择。 实际生活中,也许是这次看足球,下次看电影, 实际生活中,也许是这次看足球,下次看电影,如 此循环,形成一种默契。这里还有一个先动优势, 此循环,形成一种默契。这里还有一个先动优势, 若男的买票,两人就出现在足球场,若女的买票, 若男的买票,两人就出现在足球场,若女的买票, 两人就会在电影院。 两人就会在电影院。
2011-7-29 博弈论(陈艳)
它总是以合作开局, 它总是以合作开局,但从此以后就采取以其人之道还治其 人之身的策略。也就是说, 人之身的策略。也就是说,一报还一报的策略实行了胡萝 卜加大棒的原则。它永远不先背叛对方, 卜加大棒的原则。它永远不先背叛对方,从这个意义上来 说它是善意的。 说它是善意的。它会在下一轮中对对手的前一次合作给予 回报(哪怕以前这个对手曾经背叛过它), ),从这个意义上 回报(哪怕以前这个对手曾经背叛过它),从这个意义上 来说它是宽容的。 来说它是宽容的。但它会采取背叛的行动来惩罚对手前一 次的背叛,从这个意义上来说它又是强硬的。而且, 次的背叛,从这个意义上来说它又是强硬的。而且,它的 策略极为简单,对程序一望便知其用意何在, 策略极为简单,对程序一望便知其用意何在,从这个意义 来说它又是简单明了的。 来说它又是简单明了的。 具备以下特点的人,将总会是赢家: 具备以下特点的人,将总会是赢家:1.善意的 ; 2.宽 容的; 强硬的; 简单明了的。 容的; 3.强硬的; 4.简单明了的。
博 弈 论
陈 艳 中国地质大学(武汉) 中国地质大学(武汉)经管学院 2010年秋 2010年秋
2011-7-29
博弈论(陈艳)
参考书目
张维迎《博弈论与信息经济学》 上海: 张维迎《博弈论与信息经济学》,上海:上海三联书 上海人民出版社,2001; 店、上海人民出版社,2001; 张守一,信息经济学,辽宁人民出版社,1992年 张守一,信息经济学,辽宁人民出版社,1992年 王则柯,博弈论平话,中国经济出版社,1999年 王则柯,博弈论平话,中国经济出版社,1999年 施锡铨,博弈论,上海财经大学出版社,2000年 施锡铨,博弈论,上海财经大学出版社,2000年 谢识予,经济博弈论,复旦大学出版社,2002年 谢识予,经济博弈论,复旦大学出版社,2002年 罗伯特·吉本斯 吉本斯, 博弈论基础》 北京: 罗伯特 吉本斯,《博弈论基础》,北京:中国社会科 学出版社, 学出版社,2000 杰克·赫什莱弗 约翰·G 赖利 赫什莱弗、 赖利( ),《 杰克 赫什莱弗、约翰 G·赖利(著),《不确定性与信 息分析》 北京:中国社会科学出版社, 息分析》,北京:中国社会科学出版社,2000
2011-7-29 博弈论(陈艳)
囚徒困境
• 个人理性最终导致集体理性的缺失
2011-7-29 博弈论(陈艳)
对于两个囚徒总体而言, 对于两个囚徒总体而言,他们设想的最好的策略 可能是都不交代。 可能是都不交代。但任何一个囚徒在选择不交代 的策略时,都要冒很大的风险, 的策略时,都要冒很大的风险,一旦自己不交代 而另一囚徒交代了, 而另一囚徒交代了,自己就将可能处于非常不利 的境地。对于囚徒A而言,不管囚徒B 的境地。对于囚徒A而言,不管囚徒B采取何种策 他的最佳策略都是交代。对于囚徒B 略,他的最佳策略都是交代。对于囚徒B而言也 是如此。最后两人都会选择交代。 是如此。最后两人都会选择交代。
2011-7-29 博弈论(陈艳)
“海盗分金”其实是一个高度简化和抽象的模型,体 海盗分金”其实是一个高度简化和抽象的模型, 海盗分金 现了博弈的思想。 现了博弈的思想。 模型任意改变一个假设条件,最终结果都不一样。 模型任意改变一个假设条件,最终结果都不一样。 而现实世界远比模型复杂。 而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性” 首先,现实中肯定不会是人人都“绝对理性”。 如果某人偏好看同伙被扔进海里喂鲨鱼。 如果某人偏好看同伙被扔进海里喂鲨鱼。 再就是俗话所说的“人心隔肚皮” 再就是俗话所说的“人心隔肚皮”。由于信息不对 谎言和虚假承诺就大有用武之地, 称,谎言和虚假承诺就大有用武之地,而阴谋也会 像杂草般疯长,并借机获益。 像杂草般疯长,并借机获益。
2011-7-29
博弈论(陈艳)
斗鸡博弈
两只公鸡面对面争斗,继续斗下去,两败俱伤, 两只公鸡面对面争斗,继续斗下去,两败俱伤,一 方退却便意味着认输。在这样的博弈中,要想取胜, 方退却便意味着认输。在这样的博弈中,要想取胜, 就要在气势上压倒对方,至少要显示出破釜沉舟、 就要在气势上压倒对方,至少要显示出破釜沉舟、 背水一战的决心来,以迫使对方退却。 背水一战的决心来,以迫使对方退却。但到最后的 关键时刻,必有一方要退下来, 关键时刻,必有一方要退下来,除非真正抱定鱼死 网破的决心。 网破的决心。 如两人反向过同一独木桥,一般来说, 如两人反向过同一独木桥,一般来说,必有一人选 择后退。在该种博弈中,非理性、 择后退。在该种博弈中,非理性、非理智的形象塑 造往往是一种可选择的策略运用。 造往往是一种可选择的策略运用。如那种看上去不 把自己的生命当回事的人,或者看上去有点醉醺醺、 把自己的生命当回事的人,或者看上去有点醉醺醺、 傻乎乎的人,往往能逼退独木桥上的另一人。 傻乎乎的人,往往能逼退独木桥上的另一人。
2011-7-29
博弈论(陈艳)
一报还一报
这里与囚徒困境案例中有个不同之处: 这里与囚徒困境案例中有个不同之处:他们不只玩一遍 这个游戏,而是一遍一遍地玩上200 200次 这个游戏,而是一遍一遍地玩上200次。这就是博弈论专 家所谓的重复的囚徒困境, 家所谓的重复的囚徒困境,它更逼真地反映了具有经常 而长期性的人际关系。而且, 而长期性的人际关系。而且,这种重复的游戏允许程序 在做出合作或背叛的抉择时参考对手程序前几次的选择。 在做出合作或背叛的抉择时参考对手程序前几次的选择。 一个程序总是不管对手作何种举动都采取合作的态度吗? 一个程序总是不管对手作何种举动都采取合作的态度吗? 或者,它能总是采取背叛行动吗? 或者,它能总是采取背叛行动吗?它是否应该对对手的 举动回之以更为复杂的举措?如果是, 举动回之以更为复杂的举措?如果是,那会是怎么样的 举措呢? 举措呢? 竞赛的桂冠属于其中最简单的策略:一报还一报( 竞赛的桂冠属于其中最简单的策略:一报还一报(TIT TAT)。 FOR TAT)。
2011-7-29 博弈论(陈艳)
导论:博弈论与经济学
2011-7-29
博弈论(陈艳)
本章主要内容
博弈论的经典案例 博弈论与主流经济学 博弈论与诺贝尔经济学奖 博弈论的基本类型
2011-7-29
Hale Waihona Puke 博弈论(陈艳)0.1博弈论经典案例
海盗分金
经济学上有个“海盗分金”模型,是说5 经济学上有个“海盗分金”模型,是说5个海盗抢得 100枚金币 他们按抽签的顺序依次提方案: 枚金币, 100枚金币,他们按抽签的顺序依次提方案:首先由 号提出分配方案,然后5人表决, 1号提出分配方案,然后5人表决,超过半数同意方 案才被通过,否则他将被扔入大海喂鲨鱼, 案才被通过,否则他将被扔入大海喂鲨鱼,依此类 推。 假定“每个海盗都是绝顶聪明且很理智” 假定“每个海盗都是绝顶聪明且很理智”,那么 “第一个海盗提出怎样的分配方案才能够使自己的 收益最大化? 收益最大化?”
2011-7-29 博弈论(陈艳)
推理过程是这样的:从后向前推,如果1 号海盗都喂了鲨鱼,只剩4 推理过程是这样的:从后向前推,如果1-3号海盗都喂了鲨鱼,只剩4 号和5号的话, 号一定投反对票让4号喂鲨鱼,以独吞全部金币。 号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所 号惟有支持3号才能保命。 号知道这一点,就会提(100, 以,4号惟有支持3号才能保命。3号知道这一点,就会提(100,0,0) 的分配方案, 号一毛不拔而将全部金币归为已有, 的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知 号一无所获但还是会投赞成票, 道4号一无所获但还是会投赞成票,再加上自己一票他的方案即可通 不过, 号推知到3号的方案,就会提出(98, 的方案, 过。不过,2号推知到3号的方案,就会提出(98,0,1,1)的方案, 即放弃3 而给予4号和5号各一枚金币。由于该方案对于4号和5 即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号 来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3 来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号 来分配。这样, 号将拿走98枚金币。不过, 号的方案会被1 98枚金币 来分配。这样,2号将拿走98枚金币。不过, 2号的方案会被1号所洞 号并将提出( 97, 的方案, 悉,1号并将提出(97 ,0,1,2,0)或(97,0,1,0,2)的方案, 即放弃2 而给3号一枚金币,同时给4 枚金币。由于1 即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1 号的这一方案对于3号和4 来说,相比2号分配时更优, 号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他 们将投1号的赞成票,再加上1号自己的票, 号的方案可获通过, 们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97 枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了! 枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!