博弈论的几个经典模型81页PPT

博弈论及经典案例简介PPT课件

⑶ 上策均衡是纳什均衡的一种特殊情况，但纳什均衡却不一定是上策均衡。
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下，各自对局者所选择的策略都是最好的。合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略（给自己带来最大收益的策略）。
论和经济行为”，推动了博弈论在经济管理中的应用；（5）近年来，由于纳什、泽尔腾、海萨尼获诺贝尔经济学奖（1994），进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》（《孟子•告子》）：弈秋，通国之善弈也。使弈秋侮二人弈，其一人专心致志，惟弈秋之为听；一人虽听之，一心以为有鸿鹄将至，思援弓缴而射之。虽与之俱学，弗若之矣。为是其智弗若与？吾曰：非然也。
其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗，每人有2颗子弹，每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射，两轮后对决结束。
13
博弈又称博戏，是一门古老的游戏。《世本》说，“乌曹作博”，乌曹乃是夏代著名之能工巧匠。千百年来，博弈更是与人们的生活紧紧相连，从博棋到牌戏，从斗戏到彩票，中华民族的历史长河中就这样形成了别具风情的博弈文化

博弈论PPT课件

第1个数字表示企业1 的收入，第2个数字表示企业2的收入。
13
7.2.2合作博弈：建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈：怎样对付欺骗者 • 重复性博弈：反复进行多次博弈 • 重复性博弈的最优策略——针锋相对：模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单，不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为，但要给欺骗行为以处罚 ☞针锋相对是宽大的，允许对方恢复合作
可以采取降价策略，使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策：投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损失
29
7.3.4先发制人：使市场饱和
• 在各地布点，使新的进入者无法利用高运输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策略。
的违约问题 • 先合作，第N次违约的收入：
30+30+30+30+······+40
• 现实：不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工？ • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入：30+30+30+30+······
• 不合作收入：40+20+20+20 +······

博弈论课件

博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初，当时数学家和经济学家开始研究游戏中的策略和均衡。
1944年，冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》标志着博弈论的诞生。
随后，纳什、泽尔腾和哈萨尼等学者进一步发展了博弈论，形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为，例如价格战、广告战等。通过博弈论，企业可以更好地理解竞争对手的策略，制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为，例如供应链管理、合资企业等。通过博弈论，企业可以更好地理解合作伙伴的需求和期望，制定出更有效的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中，如果所有参与者都根据自己掌握的信息选择最优策略，则所有参与者都能获得最大收益。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序，后选择的参与者可以观察到先选择的参与者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法，用于找到在满足一组约束条件下最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方法，用于找到一组变量的最优值，使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解为相互重叠的子问题来解决问题的方法，每个子问题的解被保存
博弈论课件
汇报人：
汇报时间：202X-01-04

博弈论究竟讲什么？一文读懂11种经典博弈论模型

博弈论究竟讲什么？一文读懂11种经典博弈论模型先说一个小故事：美国第34任总统艾森豪威尔，在他年轻的时候，有一次吃过晚饭后他跟家人一起玩纸牌，一连六盘，他拿到的都是最坏的牌。

于是他变得不高兴起来，嘴里开始不停地埋怨。

他的母亲停了下来，对他说道：“如果你要继续玩下去，就不要埋怨手中的牌怎么样。

不管怎样的牌发到手中，你都得拿着。

你唯一能做的就是尽你所能，打好手里的每一张牌，求得最好的结果。

”在城主的上一篇文章中，谈到了德鲁克在《创新与企业家精神》中提到的几种竞争战略，制定战略的过程是决策的过程，推进战略落地则是执行的过程。

无论是决策还是执行，其本质都是一次次博弈的组合。

那么，究竟什么是博弈？大到国与国之间的制衡，小到一个人的一生，博弈都是无处不在，无论是商业竞争中，还是日常工作中，生活中，甚至子女教育，两性爱情。

因为每个人都在时时刻刻想着与他人竞争，每时每刻都把自己放在局中人的位置上。

这就是俗话说的“人生如戏，戏如人生”，充分运用游戏规则，做好自己人生的演员，就是博弈思维能力的体现。

专门研究相互依赖、相互影响的人群，其理性决策行为及这些决策的均衡结果的理论，就是博弈论。

博弈是有技巧的，博弈论的主体则是规定的若干博弈模型，通俗的说就是人们常说的“套路”。

但博弈论是严肃的科学，如果有人非要像剥洋葱一样地剥开博弈思维，看看各种博弈技巧的核心是什么，那么他将会看到两个字——理性。

从博弈论衍生出来的博弈思维，体现了人的理性思维，也就是说我们的任何结果均是采取某种决策和行动的结果。

这体现了博弈思维奉行的“因果论”，正所谓“种瓜得瓜，种豆得豆”。

想要得到理想的结果，除了依靠我们的理性分析，采取正确的决策，并付诸行动外，别无他法。

正因为博弈思维是一种理性思维，所以冲动是魔鬼，更是博弈思维的大敌。

这里，我们要认清“理性”的几个误区。

1.理性的人一定是自利的，但世界上又有多少纯粹的“大公无私”呢？2.理性和道德不是一回事，在追求的自利的同时，产生出来的利他才有可能持久。

博弈论最全完整ppt 讲解

完全信息
纳什均衡（NE）
子博弈完美纳什均衡（SPNE）
不完全信息
贝氏纳什均衡（BNE）
完美贝氏纳什均衡（PBNE）及序贯均衡（SE）
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态博弈；先后或序贯决策或者行动的博弈，属于动态博弈
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数，这个博弈就叫常和博弈；
相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数，这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜？
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞， 1914-1996，生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由：在“对充满不对称信息市场进行分析”领域做出了重要贡献。
即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

博弈论最全完整ppt-讲解

迈克尔·斯彭斯 1948年生于美国的新泽西，1972年获美国哈佛大学博士头衔，现兼任美国哈佛和斯坦福两所大学的教授。
乔治·阿克尔洛夫 1940年生于美国的纽黑文，1966年获美国麻省理工学院博士头衔，现为美国加利福尼亚州大学经济学教授。
约瑟夫·斯蒂格利茨， 1943年生于美国的印第安纳州，1967年获美国麻省理工学院博士头衔，曾担任世界银行的首席经济学家，现任美国哥伦比亚大学经济学教授
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。但真正起作用的是你的朋友是否使用同样的逻辑，或者
认为这一选择同样显然。并且是否你认为这一选择是否对他同样显然；反之，是否她认为这一选择对你同样显然。……以此类推。也就是说，需要的是对这样的情况下该选什么的预期的收敛。这一使得参与者能够成功合作的共同预期的策略被称为焦点。心有灵犀一点通。
何最好地利用身体（物质）的技巧的一种算计。
什么是策略博弈？
What is a Game of Strategy?
• 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、对同一情形也在进行类似的思考。
• 博弈论就是用来分析这样交互式的决策的。 • 理性的行为指的是：明白自己的目的和偏好，同时了解自己行
如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数，这个博弈就叫常和博弈；
相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数，这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。
导论
四、主要参考文献
没有某个这样的暗示，默契的合作就完全不可能。

博弈论的几个经典模型ppt课件

博弈论的几个经典模型
11
基本术语
• 博弈涉及哪些内容呢？
博弈涉及至少两个独立的博弈参与者(player)。博弈涉及行动者存在着策略（strategy）选择的可能，博弈论用策略空间来表示参与者可以选择的策略。参与者在不同策略组合下会得到一定的支付（ payoff）。对于博弈参与者来说，存在着一博弈结果。博弈涉及均衡。重要的均衡——纳什均衡。
博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题： • 冲突情形下，参与人的目标是什么？是采用(作为个人 ) 他自己的最好策略，还是采用 ( 作为集体的一员)他们共同的最好策略？前者导致均衡策略 ( 坦白，坦白 ) ，支付为 (-8 ， -8) ；后者的最好策略是 ( 抵赖，抵赖 ) ，支付为 (-1 ， -1) 。这里反映了个体理性行为与集体理性行为之间的矛盾、冲突。 • 此博弈只进行一次还是重复进行？如果博弈只进行一次，参与人似乎只有坦白才是最好的策略，因为没有理由相信对手会对你有信心，他总认为你自己会坦白；因此，双方都采取坦白策略。然而，若博弈进行多次，则结论将会发生变化。
失火了，你往哪个门跑——这就是博弈论
一天晚上，你参加一个派对，屋里有很多人，你玩得很开心。这时候，屋里突然失火，火势很大，无法扑灭。此时你想逃生。你的面前有两个门，左门和右门，你必须在它们之间选择。但问题是，其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的，那么你将因人多拥挤、冲不出去而烧死；相反，如果你选择的是较少人选择的，那么你将逃生。这里我们不考虑道德因素，你将如何选择？
不按(等待)
(9，-1)
(0，0)
大猪和小猪分别该如何选择。

博弈论课件

博弈理论（Game Theory ）现在广泛应用于军事、经济等领域。

博弈论的主要分类大致如下：联合Game 合作Game 结盟Game 零和非零和2人Game零和非零和多人Game有限Game 零和非零和2人Game零和非零和多人Game无限Game不结盟Game 静态Game 微分Game 重复Game动态GameGame例1 齐王与田忌赛马（孙膑对策）传说齐威王与大臣田忌赛马，每人都以上等马、中等马、下等马比赛，三局两胜制，胜者得1千金。

齐王的同等马优于田忌的同等马，田忌总输。

后来军事家孙膑为田忌出主意：田忌用上等马赢齐王的中等马、用中等马赢齐王的下等马，最后以下等马输给齐王一局，这样田忌就以总分3：2获胜。

对局图如下：齐王的马田忌的马上等马上等马中等马中等马下等马下等马在这个对策中，双方对于对方的情况十分熟悉，事先也知道比赛规则，这在对策论中叫做双方全信息的对策。

另外，在这个对策中，一方用计谋和策略，另一方不用，这不是现代意义下的对策。

现代意义下的对策，对局双方都用计谋和策略，并且双方都选择对自己有利的策略，这在对策论中叫理智的局中人（经济对策中叫理性的消费者）。

例2 1943年2月，由于战争的失败，日本舰队打算从新不列颠岛撤退到伊里安岛（如图）。

美国西南太平洋空军奉命轰炸这支日本舰队。

北新几亚（新不列颠岛新几内亚（伊里安岛）南日本舰队的可能撤退航线有两条：南线与北线，航程都是3天。

气象预报：未来3天，北线阴雨、南线晴天。

日本人应该选择哪一条撤退航线呢？美军的选择是重点搜索的方向：（1）非重点搜索：派少量搜索飞机，发现目标后派大量飞机轰炸；（2）重点搜索：派大量搜索飞机，发现目标后再派大量飞机轰炸。

根据气象预报，未来3天，北线阴雨，能见度很差，不利于侦察飞机巡航侦察（二战时，主要依靠飞行员目测侦察）；南线晴天，能见度好，有利于侦察机巡航侦察。

美军应该把搜索重点放在北边还是南边呢？美军重点搜索方向北南日本撤退航线北 -2/3 -1/3 南 -2/3 -3/3表中第一行第一列的-2/3表示：日方若选择北线撤退，美军的重点搜索方向也在北线，日本舰队在3天中大约能安全行走一天，然后被美军侦察机发现，招来大批轰炸机，在未来2天被轰炸。

博弈论的几个经典模型课件

02
在这个模型中，如果双方都抵赖，则各自获得2年的监禁；如果双方都坦白，则各自获得3年的监禁；如果一方坦白而另一方抵赖，则坦白的一方获得1年的监禁，抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中，每个参与者都有两种策略：坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展，博弈论在人工智能、机器学习等领域的应用逐渐增多。同时，博弈论也在生物学、环境科学、社会学等多个学科中得到广泛应用和发展。未来，博弈论将继续探索更为复杂和现实的模型，以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应用前景。例如，博弈论可以帮助理解国际贸易中的策略行为、国际政治中的权力均衡以及军事战略中的最优攻击策略等。此外，博弈论也在社交网络分析、市场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下，多数投票的结果可能导致无法达成一致意见或产生不合理的结果。在政治学中，投票悖论被用于探讨民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型，它描述了政治权力在多个参与者之间的分配和转移。在政治学中，权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象，如犯罪、婚姻、教育等