博弈论与政治第四讲_755106771

合集下载

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略，追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念，指的是当参与者根据对手的选择来选择自己的策略时，不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等概率性决策中，以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零，一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作，每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科，第四章将介绍博弈论的基本概念、应用领域、主要模型以及纳什均衡理论和混合策略的应用，同时提供实际应用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多次对局中，通过随机选择策略以增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注决策，以提高筹码的价值和战略性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

博弈论讲义完整PPT课件

• 两个寡头企业选择产量的博弈：
如果两个企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润。给定对方遵守协议的情况下，每个企业都想增加产量，结果是，每个企业都只得到纳什均衡产量的利润，它严格小于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章导论-囚徒困境
知识：完全信息博弈和不完全信息博弈。 ❖完全信息：每一个参与人对所有其他参与人的（对手）的特征、
战略空间及支付函数有准确的知识，否则为不完全信息。
第33页/共293页
第一章导论-基本概念
• 博弈的划分：
行动顺序信息
完全信息
静态
完全信息静态博弈纳什均衡
纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
0，300 0，300
纳什均衡：进入，默许；不进入，斗争
第29页/共293页
第一章导论
• 人生是永不停歇的博弈过程，博弈意略达到合意的结果。 • 作为博弈者，最佳策略是最大限度地利用游戏规则，最
大化自己的利益； • 作为社会最佳策略，是通过规则使社会整体福利增加。
第30页/共293页
第一章导论-基本概念
一只河蚌正张开壳晒太阳，不料，飞来了一只鸟，张嘴去啄他的肉，河蚌连忙合起两张壳，紧紧钳住鸟的嘴巴，鸟说：“今天不下雨，明天不下雨，就会有死蚌肉。” 河蚌说：“今天不放你，明天不放你，就会有死鸟。”谁也不肯松口，有一个渔夫看见了，便过来把他们一起捉走了。
第17页/共293页
第一章导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”？
第20页/共293页

博弈论课件

博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初，当时数学家和经济学家开始研究游戏中的策略和均衡。
1944年，冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》标志着博弈论的诞生。
随后，纳什、泽尔腾和哈萨尼等学者进一步发展了博弈论，形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为，例如价格战、广告战等。通过博弈论，企业可以更好地理解竞争对手的策略，制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为，例如供应链管理、合资企业等。通过博弈论，企业可以更好地理解合作伙伴的需求和期望，制定出更有效的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中，如果所有参与者都根据自己掌握的信息选择最优策略，则所有参与者都能获得最大收益。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序，后选择的参与者可以观察到先选择的参与者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法，用于找到在满足一组约束条件下最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方法，用于找到一组变量的最优值，使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解为相互重叠的子问题来解决问题的方法，每个子问题的解被保存
博弈论课件
汇报人：
汇报时间：202X-01-04

博弈论PPT资料整理

博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理，并宣告了博弈论的诞生。

1994年，纳什，海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。

2005年，谢林和奥曼因把博弈论引入国家管理，获得诺贝尔经济学奖。

博弈论也称对策论，原来是数学的一个分支，但由于它比较好的解决了对竞争等问题的可操作性分析，从而发展成为经济学中的一个研究领域，并以其鲜明的特征改变了经济学的传统研究其实，博弈论就是一种关于决策和对策的博弈的理论，更多的用于人与人之间，但是，因为人的思维是随环境、心情等不断变化的。

于是对于每个人每个时间应对的策略都是变化，这就增加了博弈分析的深度和难度。

中国古代的《孙子兵法》就不仅是一部军事著作，也算是世界上最早的一部博弈论专著。

博弈是个人、团队或其他组织、面对一定的环境条件，在一定的约束条件下依靠自身掌握的信息，同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施，从中取得相应的结果或收益的过程。

生活中的博弈：购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。

而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结，并帮助你完成优化效果的过程。

特别是在现代，可以说人们在日常生活中的一切行为均可以通过博弈论来解释，因为博弈的本质就是在进行一场生存的游戏。

由此可见，博弈论是适合所有人的科学。

在人际交往的过程中，博弈就是运用你的智慧和理性思维，在纷繁的事件中选择能够使你的利益最大达到最大化的科学。

博弈论能够起到重要的作用，由此，你可以看到博弈论在生活当中的广泛应用。

可以说作为一门关系学，它是人与人之间的行动互相影响的科学，是伴随你一生的科学。

从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击，则可能占到便宜，如遇反击则可能亏损如果势均力敌，则应考虑到对手的反击手段。

《博弈论》

博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问题，如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题，如基于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问题，如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争，研究竞争对手的反应和策略，以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性，分析不同寡头企业的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化，以提高拍卖的效率和公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中，支付通常被假设为随机变量，其分布可以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈论中常用的概念，它们可以用来衡量支付的不确定性。
弈。
特点
混合博弈既强调参与者的合作与协商，又强调参与者的竞争与对抗，通过综合运用两种策略实现自身利益最大化。
应用领域
混合博弈在经济学、政治学、社会学等领域都有广泛的应用，尤其是在现实世界中，很多博弈都可以被视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

第四篇博弈论PPT课件

• 此情况下由于博弈没有可预测的明确的博弈结果，所以就不能确定博弈方的策略。但是是否在这样的博弈中，各博弈方选择任何策略都是一样的，因此可以随意选择吗？
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) （严格竞争博弈）
（麻将、赌博、猜硬币）
• 常和博弈 (Constant-sum Games)
博弈）
（固定数量利润、财产分配的讨价还价
• 变和博弈（Variable-sum Games) (囚徒困境博弈、古诺模型）
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果： -5）
（坦白，坦白）——（-5，
• 集体理性决策的结果： -1）
（抵赖，抵赖）——（-1，
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型：价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈
出
硬正面币反面方
猜硬币方
正面
反面
-1，1
• 博弈论是系统研究各种博弈问题，寻求博弈方合理的策略选择和合理选择策略时的博弈结果，并分析结果的经济、效率意义的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型（Cournot) （1838）（两寡头通过产量决策进行竞争的模型;
• 伯特兰德模型（Bertrand) （1883）（价格竞争） • 《博弈论与经济行为》（1944）
六、博弈的表示方法
• 标准型（normal form ）收益矩阵
对简单的博弈适用（二人有限博弈）
• 扩展型（extensive form ）
博弈树
适用于动态博弈
• 特征式

博弈论课件

脚的看牌人、看棋人，企业的顾问等。
对参与人的决策来说，最重要的是
必须有可供选择的行动集（策略集）和
一个很好定义的支付函数。
自然被当作虚拟参与人。
清华诚志
10
（2）策略（strategies ）:博弈中有两种策略
概念，一种为纯策略（pure strategy ）, 简称策略，指参与人在博弈中可以选择采用的行动（actions or moves）方案，是参与人在给定信息结构的情况下的行动规则，它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式。

用博弈论分析大国间的政治博弈

大国间的政治博弈二十年前，世界由美苏主导，对于其他国家而言，只有唯唯诺诺的份儿，因为美苏无论在军事还是经济，对别国都有绝对优势。

苏联解体后，超级大国美国也难独霸天下。

事实也已证明，不会再有哪一个国家有能力让全世界都对其言听计从（至少今天没有，明天不会）。

分析二十年前，世界几乎是处在一种零和状态中，尤其是大国对小国。

小国不听话了，大国可以随便经济制裁你，武力威胁你，甚至揍你，小国基本上只能处于被动状态。

虽然，苏联解体后，美国凭其遥遥领先的经济实力，绝对强大的军事实力，仍然可以成为超级大国，但还可以号令天下吗？那只是美国人的一厢情愿罢了！从1991年，美国人的确打了几次漂亮的仗，但打出了美国人一统天下的局面吗？没有。

美国人想再次以武力恫吓世界，已经不大可能。

眼下的世界，需要的是共赢。

没有国家能代表全世界，却又各自想着如何让自己的利益最大化，自然而然的，世界将进入一种非零和博弈状态。

（博弈论简介：The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind”in Bible of Game Theory。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的；或者指动物利用大自然移动的瘾魂，在决策人期待的空间里，形成相对均衡的语文学理论。

其应用有著名的纳什均衡、囚徒困境、以牙还牙、人质困境、枪手博弈、猎鹿博弈、智猪博弈、警察与小偷、斗鸡博弈、协和谬误、蜈蚣博弈、脏脸博弈、零和博弈、非零和博弈等。

）下面将着重介绍非零和博弈是如何体现在当前国与国之间的政治博弈中的。

博弈论第四讲

4.2 电视频道的性别战---例铁腕上司与鹰派下属
LOGO
当然，我们也可能会说，铁腕上司是常见的，鹰派下属似乎不大常见。其实不然，组织中上司被架空权利的现象并不鲜见，在一些政治组织中尤其如此。有些政治组织的领袖以残暴的铁腕著称；有些政治组织的领袖只是一个傀儡而已。
4.3 懦夫博弈—故事模型
LOGO
卖表丈夫不卖
0
0
2
1
1
2
0
0
4.1 最优反应与纳什均衡-- 4.1.2纳什均衡
LOGO
4.1.2 纳什均衡纳什均衡是这样一种状态，在该状态下每个参与人所采取的策略都是对于其他参与人的策略的最优反应。以二人博弈为例，纳什均衡就是一个策略组合（甲的策略，乙的策略），甲的策略是对乙的策略的最优反应，而乙的策略也是对甲的策略的最优反应。譬如，在囚徒困境博弈中，我们说（甲供认，乙供认）是一个纳什均衡，就因为它满足纳什均衡定义所要求的特性—甲供认是对乙供认的最优反应，而乙供认是对甲供认的最优反应。
LOGO
在20世纪50年代，美国有一部风靡一时的电影《无故的反叛》。片中迪恩与他的中学同学玩了一场博弈：大家把车开向悬崖，获胜的一方是在他的车越过悬崖之前最后从车里面跳出来。在一些香港片中，也有这种比谁胆大的博弈。我们这里要介绍的懦夫博弈与此有一点不同，那就是两个司机的车不是开向悬崖，而是在一个可能彼此相撞的过程中开车向前。每个人可以在相撞前转向一边而避免相撞，但这将使他被视为“懦夫”；他也可以选择继续向前—如果两个人都向前，那么就会出现车毁人伤的局面；但若一人转向而另一人向前，那么向前的司机将成为“勇士”。
4.2 电视频道的性别战
LOGO
性别战博弈具有与麦琪的礼物相同的博弈结构。该博弈结构的显著特点是，博弈有两个均衡，博弈双方各自会偏爱一个均衡，比如丈夫偏爱（足球赛，足球赛）均衡，而妻子偏爱（肥皂剧，肥皂剧）均衡；不过他们还是有一些共同利益的，因为任何一个均衡中，他们都可以得到比非均衡状态更多的赢利。在性别战中，究竟哪一个均衡会出现呢？也许这取决于夫妻俩在家庭中的地位，如果什么都是丈夫说了算，那么很可能出现丈夫偏爱的均衡；或者可能出现轮流做主的情况。但更多的时候，在性别战博弈中建立一个强硬的形象也许是有好处的。

博弈论第四讲

Prisoner 2 can be rational (selfish) or altruistic, depending on
whether he is happy or not. If he is altruistic then he prefers to mum and he thinks that “confess” is equivalent to additional “four months in jail”. Prisoner 1 can not know exactly whether prisoner 2 is rational or altruistic, but he believes that prisoner 2 is rational with probability 0.8, and altruistic with probability 0.2.
(Confess, (Confess if rational, Mum if altruistic))
Confess is prisoner 1’s best response to prisoner 2’s
choice (Confess if rational, Mum if altruistic). (Confess if rational, Mum if altruistic) is prisoner 2’s best response to prisoner 1’s Confess A Nash equilibrium called Bayesian Nash equilibrium
Max s .t . q 2 [ a ( q1 q 2 ) c H ] q2 0
q 2 (c H ) 1 2 ( a q1 c H )

博弈论课件

扩展一：不完全信息博弈
不完全信息博弈的定义
01
在博弈中，参与人对于其他参与人的类型、偏好、战略空间等
信息不完全了解。
不完全信息博弈的分类
02
根据信息不完全的程度，可以分为完全信息不完全博弈和完全
非完美信息博弈。
不完全信息博弈的求解方法
03
包括贝叶斯纳什均衡、精炼贝叶斯纳什均衡、完美贝叶斯纳什
均衡等。
选举策略
博弈论可以用来分析选举中的投票行为和策略，研究候选人如何制定竞选策略以最大化胜选机会。
政策制定
博弈论可以用来研究政策制定过程中的利益冲突和协调，分析政策制定者如何平衡不同利益群体的需求。
国际关系
博弈论可以用来研究国际关系中的冲突和合作，分析国家如何通过外交政策和军事手段来维护自身利益。
纯策略纳什均衡和混合策略纳什均衡。
特点
纳什均衡是一种稳定的状态，任何参与者单方面改变自己的策略都不会获得更好的收益。
优势策略与劣势策略
优势策略
无论其他参与者如何选择策略，该策略都能为参与者带来更高的
收益。
劣势策略
无论其他参与者如何选择策略，该策略都能为参与者带来更低的收益。
特点
在优势策略下，参与者没有理由改变自己的策略；在劣势策略下，参与者应该尽快改变自己的策略。
价格战的负面影响
价格战不仅会导致企业利润下降，还可能引发市场恶性竞争，破坏市场秩序。此外，价格战还可能导致产品质量下降，损害消费者利益。
案例二：国际政治中的博弈策略
国际政治中的博弈策略
在国际政治中，各国之间往往存在着复杂的博弈关系。为了维护自身利益，各国会采取不同的博弈策略，如通过外交手段、经济制裁、军事威胁等方式来达到自己的目的。

博弈论课件第四章

第四讲重复博弈
1
精选PPT
何为“重复博弈”？
重复博弈是指基本博弈重复进行构成的博弈过程。 – 重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的----是特殊的动态博弈；
– 形式上是基本博弈的重复进行，但博弈方的行为和博弈结果不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发送变化，从而使他们在重复博弈过程不同阶段的行为选择受到影响。
– 重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的
每种结果，下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m
7
种策略组合，那么重复两次就有m2条博弈路径，重复次就有mt条博弈路径。
精选PPT
重复博弈的得益
任何博弈博弈方策略选择依据都是得益的大小。计算重复博弈的“总得益”。计算各阶段的“平均得益”。时间有先后，引入贴现系数
推广：非零和或多个博弈方，博弈方的利益严格对立，
没有纯策略纳什均衡的其他严格竞争博弈中。在以这
些博弈作为原博弈构成的有限次重复博弈中，惟一的
子博弈完美纳什均衡就是所有博弈方都始终采用原博
12
弈的混合策略纳什均衡策略。
精选PPT
有限次重复猜硬币博弈
各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。
精选PPT
4.2.1 两人零和博弈的有限次重复博弈
重复零和博弈不会创造出新的利益。
合作的可能性根本不存在。即使双方都知道还要重复进行许多次基本博弈，也不会改变它们在当前阶段博弈中的行动方式，不可能变得（哪怕是暂时的）合作和顾及对方的利益。
所有以零和博弈为原博弈的有限次重复博弈，博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。

博弈论专题PPT课件

流浪汉找工作游荡
B 正面反面
政救济 3，2 -1，3 A 正面 -1，1 1，-1 府1，-1 -1，1
（一）完全信息静态博弈：纳什均衡
----混合战略纳什均衡
• 纯战略： • 参与人在每一个给定信息的情况下只选择一个特定的行动 • 混合战略： • 参与人在每一个给定信息的情况下以某种概率分布随机地选
博弈信息：影响最后博弈结局的所有参与人的情报 “完美信息”-确定的结果 “不完美信息”-概率期望
依据支付结果分为零和博弈、常和博弈以及变和博弈
非合作博弈理论
完全信息
静态完全信息静态博弈
纳什均衡纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡海萨尼（1967－1968）
such that no player has incentive to unilaterally change her action. Players are in
equilibrium if a change in strategies by any one of them would lead that player to earn
动态
完全信息动态博弈子博弈精炼纳什均衡
泽尔腾（1965）不完全信息动态博弈精炼贝叶斯纳什均衡
泽尔腾（1975） Kreps和Wilson（1982）
Fudenberg和Tirole （1991）
（一）完全信息静态博弈：纳什均衡 Nash Equilibrium
A Nash equilibrium, named after John Nash, is a set of strategies, one for each player,

博弈论第四章PPT课件

• 完全承诺，如破釜沉舟、军事博弈
不完全承诺，增加行动成本
承诺行动与博弈结果
• 春节前夕，某小镇上两个商铺主甲和乙同时看到一个
赚钱机会：去城里贩一批鞭炮回来零售，购货款加上运输费用共5000元，如果没有竞争对手，这批货在小镇上能卖6000元；但如果另一家商铺同时在小镇上卖鞭炮，价格下跌使得这批鞭炮只能卖4000元。纳什均衡是什么？
• 假设甲先行动，商铺乙看到对方的选择后再决定是否
进货，子博弈精炼纳什均衡是什么？
承诺行动与博弈结果
如果甲先行动，但在博弈开始前商铺主乙有一次行动A的机会，利用子博弈精炼均衡概念分析下述两种情况下的博弈结果：（1）A：商铺主乙逢人便说自己一定要进货，无论对方如何行动他都不会改变这个决定；（2）A：商铺主乙与某个嘲笑他说大话的第三者丙打赌：如果自己到时不进货，向丙支付1500元；如果自己到时候进货，丙向他支付100元。并且，乙将这个赌局通知甲。
分配给不同的局中人，并赋予行动时可选的策略；（4）局中人行动时的信息集合I；（5）对应局中人可能选择策略，各局中人在终结环节所得到
的报酬U。
战略式与扩展式
战略式表述 (strategic form representation) 多用矩阵
2
L
L
2,2
S -1,-1
1
-1,-1
1,1
S
（2，2） L
-10，0 0，300
不进入（0，300）
进入者进入
默许（40，50）在位者
斗争（-10，0）
四、承诺行动（commitment）与子博弈精炼纳什均衡
• 纳什均衡之所以不是精炼均衡，是因为不可置信的
威胁存在，如父母与子女之间的博弈。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

高达美乐中
低
60, 60 70, 36
35, 36
44
最优反应分析规则: 在均衡点的情况, 每个参与人的行动一定是对于其他参与人最优反应的最优反应。最优反应曲线: 某个参与人所有相对于其他参与人所有策略的最优反应。

45
TALIA 贡献 NINA 贡献贡献 EMILY 不贡献 5, 5, 5 不贡献 3, 6, 3 EMILY 贡献贡献 3, 3, 6 不贡献 NINA 不贡献 1, 4, 4
◦ 参与人不能后悔。
在其他参与人已经选择的行动情况下，参与人必须偏好现有选择的策略。
最直觉检查是否为纳许均衡方法，就是问参与人是否还有比现在更好的行动可选。如果答案为“否”，那就是纳许均衡—这也是纳许解法(Nash Solution)。
13
纯策略: 行动中没有随机的部分 ◦ 也就是说，任意时间点上的行动都是确定的。混合策略: 从纯策略中随机地以概率的方式决定行动。
20
俾斯麦海战争赛局：俾斯麦海（Bismarck Sea）在太平洋西南部，为巴布亚新几内亚西北岸和俾斯麦群岛所围绕。总面积24万平方公里。北接太平洋，东南经维蒂亚兹海峡(Vitiaz)、丹皮尔海峡(Dampier)和圣乔治海峡通所罗门(Solomon)海。四周岛屿多山地。

21

7

同时行动博弈：
◦ 参与人在不清楚对手所做选择的情况下采取行动。 ◦ 即使这些行动选择不是同时进行的。 ◦ 又称不完美信息博弈。 ◦ 所以你的行动不可以按照对方行动后才决择。

使用博弈矩阵(game matrix) 或称为报酬表(payoff table)
◦ 规范式(normal form)或策略式(strategic form) ◦ 矩阵的维度等于参与人的数目 (所以参与人越多，越难以矩阵表示). ◦ 在两人游戏中，行、列、玩家策略都是两个。
6, 3, 3
4, 4, 1
不贡献
4, 1, 4
2, 2, 2
FIGURE 4.8 Street-Garden Game
Copyright © 2000 by W.W. Norton & Company 46
TALIA 贡献 NINA 贡献贡献 EMILY 5, 5, 5 不贡献 3, 6, 3 EMILY 贡献不贡献不贡献 NINA 贡献 3, 3, 6 不贡献 1, 4, 4
9
零和游戏与非零和游戏在零和(等和)游戏中，我们只需要知道n-1 人的报酬，因为他们的报酬总和为零。 ◦ 在零和(非等和)游戏中，我们就需要知道所有参与人的报酬。

10
建立赛局表剪刀-石头-布游戏每个参与人有三个纯策略：

◦ 剪刀 ◦ 石头 ◦布
在同时行动赛局，参与人不能以他人反应作出行动决定每个参与人的策略在任何一点的决策都是相同的。

37
守方跑位跑位攻防短传中传长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
38
守方跑位跑位攻防短传中传长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
L 8, 2
a
L c
H
11, 0
L
9, 0.5
GRAY GREEN，
GRAY
H
1, 1
H
GREEN
b
L 0, 2
a
L c
H
2, 0
L
0.5,0.5
2 A 1 B 2
C
3,3
D E 1
5,4
G
6,2
H F 2,2
2,6

图示同时行动赛局纳许平衡(Nash Equilibrium) 占优策略(Dominant Strategies) 当两个玩家都有占优策略的情况当只有一个玩家有占优策略的情况连续删除劣策略(Dominated Strategies) 零和游戏的最大最小值方法(Minimax Strategies 逐个单位各检查法(Cell-By-Cell Inspection) 纯策略是连续型变量的情形(Continuous Variables) 三个参与人赛局纯策略中的多重均衡点纯策略中没有均衡点的情形
32
必胜客高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高达美乐中
低
60, 60 70, 36
35, 36
33
必胜客高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高达美乐中
低
60, 60 70, 36
35, 36
抵赖 (合作)
1 , 25
3, 3
19
任何一个有占优策略的参与人都会在均衡中选择该策略。如果所有的参与人都有占优策略，那纳许解法就容易多了。

◦ 如果只有一个参与人有占优策略会发生什么事？ ◦ 没有占优策略的参与人会依有占优策略的参与人的占优策略来反应—最佳反应(best response)
1942年3月，日军海上运输船队从新不列颠的拉包尔浩浩荡荡出发，经过俾斯麦海，抵达新几内亚，沿途几乎没有什么美军舰机的拦截，因此损失很少。这个时候的美军，正全力阻止日军向澳大利亚推进，无暇它顾。
22

1943年1月，美军西南太平洋战区司令麦克阿瑟上将开始实施“蛙跳战略”——逐个夺取日占岛屿，最后打进日本本土。美军经过一番琢磨，攻击新几内亚沿海的日军集结地。那儿有三大目标：

11
(a) 报酬全视图
玩家 2 石头石头玩家 1 布剪刀布剪刀赢,输输,赢
(b) 零和游戏简图
玩家 2 石头石头玩家 1 布剪刀和赢输布输和赢剪刀赢输和
和,和输,赢赢, 输和, 和
输, 赢赢, 输和,和
12

若每个参与者根据对其他参与者策略的信念，采用最大自身化收益的策略，则这样的一个策略组合就是纳什均衡。
不贡献
6, 3, 3
4, 4, 1
4, 1, 4
2, 2, 2
47
有一个以上的纳许均衡点安全赛局(Game of Assurance) 懦夫赛局(Chicken) 性别战赛局(Battle of Sex) 弱优势(Weak Dominance)
39
守方跑位跑位攻防短传中传长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
40

If all else fails…
◦ Cell-by-cell inspection can be used to find Nash equilibria in any game
ቤተ መጻሕፍቲ ባይዱ
28
日本海军北南 2, 2
北
美国空军
2, 2 1, 3
南
3, 1
29
日本海军北南
北
美国空军
2 1
2 3
南
30
日本海军北南
北
美国空军
2 1
2 3
南
31
即是对参与人删除所有可能劣策略。如果删除后只有一个独特结果，这就是纳
许解法。占优可解(Dominance Solvable)赛局。

◦ 参与人都可以获得更好的报酬，如果两人合作。 ◦ 但是如果只是某位参与人一厢情愿，他们只会得到更少。 ◦ 单方面背叛会是总报酬减少。
17
妻子
认罪 (背叛) 认罪 (背叛)
丈夫抵赖 (合作) 25, 1 10, 10
抵赖 (合作)
1 , 25
3, 3
18
妻子
认罪 (背叛) 认罪 (背叛)
丈夫抵赖 (合作) 25, 1 10, 10
◦ 莱城——大型基地和大型机场； ◦ 萨拉莫阿——重要的港口和机场； ◦ 芬斯彻哈芬——运输中心和水上飞机及供应舰锚泊地。

为了孤立这些地方的日军，美军决定，一旦日军船队通过俾斯麦海支援，就予以摧毁性打击。
23

日本海军官员于2月21日拟订了“81号作战计划”，决定从拉包尔向莱城运送6900多名官兵，250吨的弹药、车辆等作战物资。 2月28日，日军船队从拉包尔启航，沿着新不列颠岛北海岸西进。 3月1日，日军船队被美军发现。美军太平洋战区陆军航空兵的克耐将军认为，这是显示陆基航空兵威力的大好时机。
高达美乐中
低
60, 60 70, 36
35, 36
42
必胜客高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高达美乐中
低
60, 60 70, 36
35, 36
43
必胜客高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
24

3月2日，美机发现，这支船队开始从俾斯麦海向维蒂埃兹海峡行驶。持续3天的俾斯麦之战结束了。作战中，美军只战死13人，受伤12人，4架飞机被击落，2架负伤落在美军机场附近。而日军13－14艘商船被击沉，7艘驱逐舰被击沉，死亡人数达3000多人，损失战机59架。这是美军陆基飞机首次攻击大规模日军船队之战，没有任何盟军水面战舰参战，但却取得巨大胜利的一次海战。

博弈论与政治第四讲_755106771

博弈论课件第四章

博弈论讲义完整PPT课件

博弈论课件

博弈论PPT资料整理

《博弈论》

博弈论最全完整-讲解课件

第四篇博弈论PPT课件

博弈论课件

用博弈论分析大国间的政治博弈

博弈论第四讲

博弈论第四讲

博弈论课件

博弈论课件 第四章

博弈论专题PPT课件

博弈论第四章PPT课件

博弈论课件第四章