博弈论

合集下载

博弈论是什么

博弈论是什么博弈论是一门研究决策和策略的数学理论，它研究决策者在互动中作出最佳选择的数学模型。

博弈论的研究对象是决策者之间的相互作用，无论是个体、组织还是国家之间的相互作用。

在博弈论中，个体决策者通常被称为“球员”(players)，决策者们的决策被称为“策略”(strategies)。

博弈论分析的目标是找到在各种不同策略组合中，球员可以通过分析其他球员的行动，作出最佳决策的方法。

博弈论通过建模和分析不同策略的结果，以及不同决策者之间的冲突和合作，来解决决策问题。

博弈论的起源可以追溯至20世纪的数学家、经济学家和游戏理论家。

它被广泛应用于经济学、政治学、社会科学和计算机科学等领域，以解决各种决策和策略问题。

博弈论有两个重要的分支，一是非合作博弈论，二是合作博弈论。

非合作博弈论研究的是在决策者之间缺乏合作的情况下的决策问题。

非合作博弈论分析的是每个决策者如何在互动中作出最佳决策，而不考虑其他决策者的影响。

其中最著名的非合作博弈论模型是“囚徒困境”。

囚徒困境是一种经典的非合作博弈论问题，描述了两个同时被捕的囚犯面临的决策问题。

如果两个囚犯都保持沉默，则他们将因不够证据而被判轻刑；如果一个人选择坦白，而另一个保持沉默，则坦白的囚犯将获得从刑期的豁免，而另一个将被判重刑；如果两个人都选择坦白，则他们将受到较重的刑期。

在这个例子中，每个囚犯的最佳策略是选择坦白，然而，当两个囚犯都选择坦白时，他们都会陷入囚徒困境，因为他们的总体利益会受到损害。

合作博弈论研究的是在决策者之间存在合作的情况下的决策问题。

合作博弈论分析的是决策者通过协商和合作来达成一致，并在互动中作出最佳决策。

其中最著名的合作博弈论模型是“合作对策”(cooperative games)。

合作对策是一种多人博弈论问题，在这种情况下，参与者通过协调策略，共同提高整体收益。

合作对策的目标是通过合作和协商，找到一种合理的分配方式，使得每个参与者都能获得相对公平和最大化的收益。

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。

在《博弈圣经》中写到：博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。

所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外，它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法，标准的博弈论分析出发点是理性的，而不是心理的或社会的角度。

不过，近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

博弈论名词解释

博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。

在博弈论中，玩家通过制定决策来实现自己的利益，同时也要考虑其他玩家的决策对自己利益的影响。

博弈论的研究对象是在有限的资源和信息条件下，决策制定者之间的相互作用。

以下是一些常见的博弈论名词解释：1. 纳什均衡（Nash equilibrium）：是指在博弈过程中，每个玩家依据其他玩家的行为选择自己的最佳策略，而没有动机单方面改变策略。

纳什均衡是一种稳定状态，即每个玩家的策略都是最优的。

2. 零和博弈（zero-sum game）：是指一个玩家的收益与另一个玩家的损失完全相等，总收益为零。

在零和博弈中，一个玩家的利益的增加必然导致另一个玩家的利益的减少，双方利益存在完全的对立关系。

3. 非零和博弈（non-zero-sum game）：是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。

在非零和博弈中，玩家之间的利益可以相互协调、互利互惠。

4. 博弈树（game tree）：是博弈论中常用的一种图形表示方式，用于展示博弈过程中的决策步骤和可能的结果。

博弈树由顶点和边组成，顶点表示玩家的决策点，边表示不同的行动选择。

5. 最优策略（optimal strategy）：在博弈论中，最优策略是指玩家的最佳选择，使得在对手的任何策略下，自身获得最大利益。

最优策略可能根据玩家的目标和信息不同而变化。

6. 合作与背叛（cooperation and defection）：博弈论中常涉及到的两个关键概念。

合作指玩家之间通过协调行动来获得共同利益，背叛指玩家为了自身利益而选择对方不合作。

7. 博弈矩阵（game matrix）：是一种表示博弈参与者和策略选择关系的表格。

博弈矩阵以参与者为行，以策略选择为列，用数字表示参与者在不同策略下的收益情况。

8. 支配策略（dominant strategy）：在博弈论中，一种策略如果在所有可能的对手策略下都能带来最佳结果，则被称为支配策略。

博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i，对于所有的 σi∈Mi，都有ui﹙σ*﹚≥ui﹙σi，σ-i*﹚，则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中解：设猜方猜正方的概率为p，猜反方的概率则为1－
无名氏（大众）定理
无名氏定理：在无穷次重复的由n个游戏者参与的博弈里，如果在每一次重复中博弈的行动集是有限的，则在满足下列三个条件时，在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果：
条件1：贴现因子接近于1；条件2：在每一次重复中，博弈结束的概率或等于0，或为非常小的一个正值；条件3：严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可
游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用
游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊朗、以色列和巴勒斯坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) （或称支付，或得益）

博弈论

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点，那就是博弈论在经济学中越来越受到重视。

博弈论，又称为对策论，它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说，就是研究决策主体的行为在发生直接相互作用时，他们如何进行决策，以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩（Morgenstern）合作出版了《博弈论与经济行为》（The Theory of Games and Economic Behavior），开始将博弈论引入经济学，成为现代经济博弈论研究的开端。

20 世纪50 年代纳什（John F. Nash）、塔克（Tucker）等人的研究，奠定了现代博弈论的基石。

在其后的几十年里，许多经济学家致力于博弈论的研究，1965 年泽尔腾（Reinhard Selten）将纳什均衡的概念引入了动态分析；1967－1968 年，海萨尼（John C. Harsanyi）把不完全信息分析引入博弈论的研究；1982 年克瑞普斯（David M. Kreps）和威尔逊（RobertWilson）分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家，此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论，它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点，博弈论的产生和发展引发了一场深刻的经济学革命，使得现代经济学从方法论，到概念和分析的方法体系，都发生了很大的变化。

正如克瑞普斯（Kreps）在《博弈论与经济模型》一书中指出“在过去一二十年中，经济学在方法论，以及语言、概念等等方面，经历了一场温和的革命，非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

博弈论百度百科

博弈论百度百科博弈论是一门研究决策制定和决策结果的学科，它是应用数学的一个分支，通过运用数学和逻辑工具，探讨参与者在互动决策中的最佳策略选择。

在博弈论中，参与者被称为玩家，他们根据自身利益和目标来做出决策。

博弈论适用于各种不同领域的情境，包括经济学、政治学、生物学等。

一、概述博弈论的研究对象是策略性互动。

在一个博弈中，每个玩家都会依据一定的策略选择进行行动，而这个选择可能会受到其他玩家的影响。

博弈论试图理解和分析在这种互动中，参与者如何做出决策，并找到最优的解决方案。

博弈论的核心概念是博弈，一个博弈可以用一个四元组表示：(N, A, U, F)，其中：- N表示参与博弈的玩家集合；- A表示每个玩家可选的行动集合；- U表示每个玩家的效用函数，用于衡量不同结果对该玩家的好坏程度；- F表示每个玩家的信息集合。

信息集合是指每个玩家在博弈过程中所了解的信息。

二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一，指的是在一个博弈中，所有玩家选择的策略组合，使得任何玩家都没有动机单方面改变自己的策略。

纳什均衡是一个稳定状态，玩家之间不再有改变策略的动机。

2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。

零和博弈是指参与博弈的玩家的收益之和为零，即一方获利必然导致另一方的损失。

非零和博弈是指参与博弈的玩家的收益之和不为零，即可以存在多方共同受益的情况。

3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动，关注的是个体决策的结果。

宏观博弈是指研究整体群体之间的策略性互动，关注的是全局结果。

三、应用领域博弈论的研究在众多领域中都具有广泛的应用。

以下是博弈论在一些领域的应用举例：1. 经济学博弈论在经济学领域中有着广泛的应用。

它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。

例如，博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。

2. 政治学博弈论在政治学领域中也有着重要的应用。

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

什么是博弈论？

什么是博弈论？博弈论是一门研究策略决策的学科，它涉及到两个或多个参与者的博弈过程。

博弈论的研究对象可以是经济、政治、社会等领域，也可以是日常生活中的人际交往。

下面，我们来详细了解一下这门学科。

一、博弈论的起源博弈论起源于20世纪40年代，当时美国数学家冯·诺依曼（John von Neumann）和经济学家奥斯卡·莫根斯特恩（Oskar Morgenstern）合著了《博弈论与经济行为》一书。

这是一本奠定博弈论基础的重要著作，它将博弈论应用于经济学领域，从而成为博弈论的奠基之作。

二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织，例如一个独立的个人、两个公司或国家之间的竞争。

2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。

不同的策略可能导致不同的博弈结果，因此博弈过程中策略的选择非常重要。

3.收益收益是博弈过程中参与者所能获取的利益，包括经济利益、社会地位、权力等。

收益对参与者而言是决策的目的和结果，因此其大小和分布会影响博弈的结果。

4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系，是博弈过程的精神核心。

博弈形式一般分为合作博弈和非合作博弈两种，而在这两种博弈形式下，又分别有多种复杂的形式。

三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。

经济学研究的主题之一是市场竞争，而博弈论可以帮助我们透彻理解市场竞争的规律。

例如，博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。

2.政治学领域博弈论在政治学领域的应用也非常重要。

政治学研究的主题之一是国家之间的竞争和协作，而博弈论可以帮助我们研究国际关系、外交政策等问题。

例如，博弈论可以用来研究国际贸易谈判、军备竞赛等问题。

3.人际交往领域博弈论在人际交往领域的应用也相当重要。

通过博弈论，我们可以学习如何有效地沟通和合作，避免双方的冲突和误解。

例如，博弈论可以用来研究双方的协调、合作等问题。

博弈论

博弈论是一种处理竞争与合作问题的数学决策方法；研究竞争中参加者为争取最大利益应当如何做出决策的数学方法；根据信息分析及能力判断，研究多决策主体之间行为相互作用及其相互平衡，以使收益或效用最大化的一种对策理论；研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

近代对于博弈论的研究，开始于策墨洛（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。

1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。

此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为，博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。

博弈论总结(精选13篇)

博弈论总结第1篇最大化自己最坏情况下的收益。

着眼于自己的收益，保证自己收益，防止风险使得自己的收益变小。

以性别之战为例子：首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设：妻子策略：P概率看韩剧、（1-P）概率看体育丈夫策略：Q概率看韩剧、（1-Q）概率看体育 xxx子期望收益（着眼于自己的期望收益）： Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表（妻子收益）3.妻子的最小收益可能为Q=0或Q=1（当丈夫选择Q=0时，意味着丈夫100%想看体育，妻子的收益可能为0；当Q=1时，丈夫100%想看韩剧，如果这时妻子想看体育，收益同样最小）这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为：minUw(p,q) = min(1-P,2P)5.最大化最坏收益： max(min(1-P,2P)）解的：P=1/3则妻子的maxmin策略为：1/3概率选择韩剧，2/3概率选择体育。

同理得丈夫的maxmin策略为：1/3概率选择体育，2/3概率选择韩剧。

minmax策略 1.最小化对手最好情况下的收益。

是着眼于对手的收益。

还是这样的一个收益表 1.进行假设：妻子策略：P概率看韩剧、（1-P）概率看体育丈夫策略：Q概率看韩剧、（1-Q）概率看体育2.丈夫期望收益（着眼于对方的期望收益）：（与maxmin不同要注意！！）Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表（丈夫收益）3.妻子的最小收益可能为Q=0或Q=1（当丈夫选择Q=0时，意味着丈夫100%想看体育，如果这时妻子也想看体育，丈夫收益到2；当Q=1时，丈夫100%想看韩剧，如果这时妻子想看韩剧，收益同最大1）这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为：maxUw(p,q) = max(2-2P,P) 5.最小化最好收益： min(max(1-P,2P)）妻子的minmax策略：2/3概率选择韩剧，1/3概率选择体育同里丈夫为的minmax为…在零和博弈中，maxmin策略和minmax策略是等价的。

博弈论最经典十句话

博弈论最经典十句话
1. “在博弈中，有时候退一步反而能前进两步呢！”就像下象棋，你看似放弃了一个小兵，却可能因此打开局面，赢得最终的胜利。

2. “别只盯着眼前的利益，要想想后面的路啊！”好比玩扑克牌，你不能光想着这一把怎么赢，得为后面的牌局做打算呀。

3. “知道对手的想法，那可太重要啦！”就如同拳击比赛，了解对方的出拳套路，你才能更好地防守和反击呀。

4. “合作有时候比竞争更能带来好处呢，想不到吧！”想想那些商业伙伴，携手合作才能创造更大的财富呀。

5. “在博弈里，每一步都可能改变整个局势哟！”就像下棋，一步错可能满盘皆输，可不能马虎呀。

6. “别小瞧了小细节，那可能是决定胜负的关键呢！”好比打篮球，一个小小的传球失误都可能导致比赛失败呀。

7. “有时候等待也是一种策略，懂不懂呀！”就像狩猎，耐心等待最佳时机，才能一举成功呀。

8. “不要总是一成不变，要灵活应变才行啊！”如同战场上，局势瞬息万变，不灵活怎么能行呢。

9. “博弈可不只是看实力，运气也很重要呢！”就像抽奖，实力强不一定就能中，运气来了挡都挡不住呀。

10. “懂得取舍，才能在博弈中走得更远呀！”好比旅行中带行李，太多了走不动，该舍弃的就得舍弃呀。

博弈论的理解

博弈论的理解
嘿，大家好啊！今天咱来聊聊博弈论。

博弈论是啥呢？简单说就是研究人们在各种情况下怎么做出选择，以达到自己最好的结果。

就好比咱平时下棋，你走一步，我走一步，都在琢磨着怎么能赢对方。

这就是一种博弈。

给你讲个我自己的事儿吧。

有一次我和朋友去买水果，在一个小摊前，摊主说苹果十块钱三斤。

我朋友觉得有点贵，就开始跟摊主砍价。

这时候我俩就进入了一种博弈状态。

朋友想以更低的价格买到苹果，摊主呢，想多赚点钱。

朋友就说在别的地方看到更便宜的，摊主就说他的苹果品质好。

最后经过一番讨价还价，以八块钱三斤成交了。

这其实就是一种简单的博弈，双方都在权衡利弊，做出对自己最有利的选择。

在生活中，博弈论无处不在。

比如买东西砍价、职场上的竞争、甚至是和家人商量去哪儿玩，都有博弈的成分。

我们都在不知不觉中运用着博弈论，只是可能自己都没意识到。

所以啊，博弈论并不是什么高深莫测的东西，它就在我们的日常生活中。

下次当你遇到需要做选择的时候，不妨想想博弈论，说不定能帮你做出更好的决策呢。

博弈论基本概念

博弈论，又称为对策论（Game Theory）、赛局理论等，既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用，是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

在博弈论中，通常包括以下基本概念：
局中人：在一场竞赛或博弈中，具有决策权的参与者被称为“局中人”。

在一个博弈中，每个局中人都要做出选择。

行动：局中人在博弈中的每一个决策或选择被称为“行动”。

信息：局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。

策略：局中人基于可获得的信息，制定的决策方案或规则称为“策略”。

收益：局中人在博弈中的得失或输赢称为“收益”。

均衡：当所有局中人都认为自己的策略选择最优，并且其他局中人也认为该策略选择是最优时，这种状态被称为“均衡”。

结果：在一场博弈结束后，所有局中人的收益总和被称为“结果”。

博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。

其中，局中人、策略和收益是最基本要素。

发展过程方面，博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

目前，博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

《博弈论》

博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问题，如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题，如基于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问题，如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争，研究竞争对手的反应和策略，以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性，分析不同寡头企业的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化，以提高拍卖的效率和公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中，支付通常被假设为随机变量，其分布可以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈论中常用的概念，它们可以用来衡量支付的不确定性。
弈。
特点
混合博弈既强调参与者的合作与协商，又强调参与者的竞争与对抗，通过综合运用两种策略实现自身利益最大化。
应用领域
混合博弈在经济学、政治学、社会学等领域都有广泛的应用，尤其是在现实世界中，很多博弈都可以被视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。

经济学中的博弈论是什么

经济学中的博弈论是什么在经济学的广袤领域中，博弈论宛如一颗璀璨的明珠，为我们理解和解析经济现象提供了独特而有力的工具。

那么，究竟什么是博弈论呢？简单来说，博弈论是研究决策主体在相互作用时的决策以及这种决策的均衡问题的理论。

它探讨的是当多个参与者在某种情境中做出决策时，他们如何考虑彼此的行动和反应，以达到自己的最优结果。

想象这样一个场景：有两家企业 A 和 B，它们都在考虑是否要降价来争夺市场份额。

如果 A 降价而 B 不降价，那么 A 可能会获得更多的客户和利润；但如果 B 也降价，那么双方的利润可能都会受到影响。

在这种情况下，A 和 B 的决策就构成了一个博弈。

博弈论的核心要素包括参与者、策略和收益。

参与者就是在博弈中做出决策的个体或团体，比如上述例子中的企业 A 和 B。

策略则是参与者可以选择的行动方案，像企业可以选择降价或者不降价。

而收益就是参与者根据所选择的策略最终获得的结果，通常用数字来表示，比如利润的多少。

博弈论中有多种类型的博弈。

其中，最常见的是“零和博弈”和“非零和博弈”。

在零和博弈中，一方的收益必然等于另一方的损失，比如下棋，一方赢了另一方就输了，总的收益为零。

而非零和博弈则不同，参与者的收益总和不一定为零，可能双方都赢，也可能双方都输，或者一方赢的多一方赢的少。

让我们再通过一个例子来深入理解博弈论。

假设市场上有两家企业竞争，每家企业都有两种策略：大量投资研发新产品或者维持现状。

如果两家企业都选择大量投资研发，那么市场竞争会加剧，但长期来看都有可能获得更大的市场份额和利润；如果一家投资研发而另一家维持现状，那么投资研发的企业可能会在短期内占据优势，但长期来看市场的不确定性增加；如果两家企业都维持现状，那么短期内利润稳定，但可能逐渐被市场淘汰。

在这个博弈中，企业需要权衡各种策略的风险和收益，做出对自己最有利的选择。

博弈论在经济学中的应用十分广泛。

在寡头垄断市场中，企业之间的竞争策略往往可以用博弈论来分析。

博弈论简介

பைடு நூலகம்
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略，以实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力市场上的博弈行为，以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动，以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系，以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏，如棋类游戏、策略游戏等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计，如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输，如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论（Game Theory）是一门应用数学
1
分支，主要研究在特定情境下个体或团队如何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
，常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中，参与者可能会放弃部分利益，以换取整

博弈论

博弈论的基本概念1.博弈论：博弈论，又称对策论，是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论的定义可以这样理解：博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自可选择的行为或策略中进行选择并加以实施，并从中取得相应收益的过程。

2.参与人：参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。

3、行动：行动是参与人在博弈的某个时点的决策变量。

一般来讲，把第i个参与人的一个行动为ai，其可供i选择的行动集合表示为Action set: Ai ={ai}。

在一个n人博弈中，n个参与人的行动的有序集为a={a1，…，an}，称为行动组合。

根据行动顺序，可以把博弈分为静态博弈、动态博弈。

静态博弈：一般来讲，如果行动时同时发生的或相当于同时发生的，则称之为静态博弈。

动态博弈：如果行动的发生有先后顺序，则称之为动态博弈。

4.信息：信息指的是参与人有关博弈的知识，特别是有关“自然”的选择、其他参与人的特征和行动的知识。

信息集是指参与人在特定时刻所拥有的有关变量的值的知识。

例如：囚徒困境甲不知乙的选择，则甲的信息集为{坦白或者抵赖}乙已经行动，甲观察到乙的选择，则甲的信息集为{坦白}或者是{抵赖}。

5.战略：战略是参与人在给定信息集的情况下的行动规则，是参与人完整的一套行动计划，它规定参与人在什么时候选择什么行动。

战略不同于行动，它是行动的规则，对于战略的表述应该是完备的。

例如：人不犯我，我不犯人；人若犯我，我必犯人”例如：田忌赛马，田忌所选的赛马计划就是一套完整的行动计划，也就是一个战略。

6.战略空间：参与者可以选择的战略的全体组成了战略空间。

田忌赛马，六种行动方案可供选择：上中下，上下中，中上下，中下上，下上中，下中上。

这些可选择的战略的全体组成了战略空间。

任何一人战略的改变都将使结果也随之改变。

7、收益：支付、报酬，指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。

博弈论

1.什么是博弈论？“博弈论”译自英文“Game Theory”，直译就是“游戏理论”。

博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。

是系统研究各种博弈问题，寻求在各博弈方具有充分或者有限理性、能力的条件下，合理的策略选择和合理选择策略时博弈的结果，并分析这些结果的经济意义、效率意义的理论和方法。

博弈：一些个人、组织，面对一定的环境条件，在一定的规律下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

包括：博弈的参加者，各博弈方的全部策略或行为集合，进行博弈的次序，博弈方的得益四方面。

纳什均衡：设存在一个策略组合Bx’和By’，且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时，y的最优策略选择是By’,同时，当y选择By’时，x的最优选择是Bx’,因此，x和y选择了Bx’和By’时，谁都不会再改变策略。

这种局面称为Nash均衡，是Nash最早提出并证明了它的存在。

1951年Nash提出了Nash均衡的概念，并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。

之前,虽然有很多人致力于研究博弈对策的规律，但总没有得出有意义的成果，直到Nash。

n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*}，其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立，则{a1*, a2*,……,aN*}为Nash均衡。

囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈，双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。

经济学中的博弈论

经济学中的博弈论经济学中的博弈论是一门研究个体决策行为及其互动的学科，通过建立数学模型和理论框架来分析人们在不同情境下做出的选择，并推导出各种可能的结果。

博弈论广泛应用于经济学、政治学、管理学等领域，以解释人们在决策过程中存在的合作、冲突、竞争等行为。

1. 博弈论的基本概念博弈论的基本概念包括参与者、策略、支付和效用。

参与者是指在博弈中作出决策的个体或集体，策略是参与者可选择的行动，支付是参与者根据不同策略和结果所得到的收益或成本，效用是参与者对不同结果的主观评价。

2. Nash均衡Nash均衡是博弈论中的一个重要概念，指的是参与者在互动中无法通过单独改变策略来获得更多收益的情况。

Nash均衡的存在可能有多个，并且可能存在不稳定的均衡点。

通过寻找Nash均衡，我们可以预测和解释人们在特定情境下的决策行为。

3. 合作与冲突博弈论分析了合作与冲突的两种情况。

在合作博弈中，参与者会通过协商和合作来实现互利的结果，而在冲突博弈中，参与者通过竞争和对抗来追求自身的利益。

通过研究这两种情况，我们可以更好地理解人们如何在不同的情境下做出决策。

4. 广义博弈论广义博弈论是博弈论的一个扩展领域，它考虑了参与者对其他参与者行动的预期和判断。

在广义博弈论中，参与者的决策不仅仅取决于自身利益，还要考虑到其他参与者可能做出的决策，并基于对其他参与者的预期行动做出相应的选择。

5. 应用举例博弈论在实际经济中有着广泛的应用。

举例来说，在寡头垄断市场中，各大企业之间的价格竞争就可以通过博弈论的方法来分析。

博弈论还可以应用于拍卖市场、市场竞争中的定价策略、国际关系中的战略决策等领域。

6. 博弈论的局限性尽管博弈论在经济学中有着广泛的应用，但它也存在一些局限性。

首先，博弈论在分析中假设参与者都是理性的、全面的决策者，但实际情况下人们的决策行为不一定都是理性的。

其次，博弈论在分析中通常假设参与者具有相同的信息和评判准则，但实际情况下参与者之间的信息差异很大。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

教授就此提到美国总统选举（这个问题本身就是通过政治家选举提出的嘛），尼克松，肯尼迪以及克林顿成功当选总统时演讲的政治立场，都是那种比较中立的，既不保守也不激进（可以把极端保守看作1，把极端激进看作10），从而拉拢中间选民。
经济学领域，这称之为“产品植入”。 /*手有点疼，今天暂时到这，这是注释*/。表现为商家分布普遍集中以争取附近的客源。
好了，来点正经的。
博弈的要素：参与者（player，i，j），策略（strategy，si），策略集（strategy set），策略组合（strategy profile），获益（payoff）
提到了侵略者与防守者之间的关系，这个《博弈游戏》上也有讲过，比如汉尼拔将军翻过阿尔卑斯山，两条路走哪一条。引入部分优势策略：某一策略的获益至少大于等于其他策略，并且至少在一种策略中的获益大于其他策略。
以政治家选举的形式给出了“中位数选民定理”，课堂上的描述很繁琐，我用自己的语言描述一下，其实就是一个数字问题：博弈的两个人各自选择从1到10之间的一个数A和B，用数字相差的单位来表示距离。距离离A近的属于A范围，离B近的属于B范围，与A和B距离相等的数字属于中立，将被平分给A和B。最后谁的范围更大谁获胜。比如A为1，B为2，那么A的范围就是从1到1.5，B的范围是从1.5到10.所以B获胜，也就是选择2的人为数不少的人选择了32，33，34.理由是大家都在1-100之间随机选的话，平均数应该是50，所以平均数的三分之二就是33.但是这种想法的错误之处大家不是随机选择，并且显然不会有人选择比100的三分之二，也就是比66还大的数。所以67到100之间的选择可以直接被剔除。那么既然67不会有人选，大于44，45的数也可以完全被剔除.（平均数不可能超过67，所以其三分之二也不可能超过45，45到67之间的数在原博弈中并不是劣势策略的数，但是去掉67以上这些数之后就是劣势策略了）。所以综上所述，如果大家都是理性的话，不会有人选择超过45的数。那45的三分之二是30，所以30到45之间的数，它们在原博弈里不是劣势策略，即使去掉一次劣势策略也不是劣势策略，但是去掉2次的话就是了。再同理，30的三分之二是20，所以20到30之间的数也。。就这样一直下去，最后会一直到1，这样可能么？
实际上，选每个区间的人数都不为0（即使是在耶鲁，也有选择67以上的人，虽然不知道他们怎么想的。也许他们是未来的总统～），这实际上是一个分布。所以，理性对博弈的影响。。。
上述过程，去掉67以上的数，是因为“不要选择劣势策略”，做到这一步只需要自己是理性的就可以，最基本的想法
20-30 in shoes 3 times。。。
所以可以做如下归类
1.选择67以上的人，“愚蠢的”
2.选择45-67的人，自己不愚蠢，但认为其他人都是愚蠢的
3.选择30-45的人，自己不愚蠢，自己认为别人也不愚蠢，但别人会认为别人愚蠢。。。
。。。
n.选择1的人，陷入到我知道你知道我知道你知道我知道你知道。。。这样的无限序列里了。。。（这个在哲学上被称为common knowledge，共同知识）。所以说选择1的人，会认为选择1是共同知识。耶鲁课堂上有不少人选择1，教授也提到这个游戏选择1是很常见的选择，并赞扬了他们。但是教授最后说这次的游戏，平均数是13.67，它的三分之二也就是9.记得Bob说大连理工的那次考试，平均数是24，其三分之二也就是16.
上述的“中位数选民定理”，几个欠缺的地方：
1.选民不一定服从1（可能他极端保守）到10（极端激进）的均匀分布，且各个党派所拥有的选民名额也不同
2.这个模型不适用于超过2名的博弈者
3.博弈者可能作弊（我是极端保守的，但我说自己是中立的）
提到“best response”(最佳回应，即根据对手作出的某一选择，我作出此时对我最有利的选择)。那么有些时候，我能分析出对手的优势策略，从而做出我的最佳回应。有些时候我完全无法预测出对手会做出怎样的选择，那么这时可能通过计算对手选各个策略概率时，来计算我的获益的数学期望或者标准差，从而做出选择（这个选择可能不同于任何一个相对于对手某个选择的最佳回应）
1.一名惯用右脚的球员，他向左踢和向右踢的准确率是不同的（踢过球的童鞋们都有这种体会，右脚球员从左侧进攻射门的舒适度比从右侧射门要好很多）。
2.门将可以选择在中路(TO BE CONTINUED)
耶鲁博弈论公开课笔记用一个月时间更新完
LionHeart LionHeart 2012-07-01 01:28:04
一直对博弈论很感兴趣，从前断断续续看的《博弈游戏》那本书，虽然很有趣写的很不错，但是毕竟充其量只是枕边读物或者厕所读物。刚刚看完耶鲁的《博弈论》课程第一集，希望能在此记录下一些心得，将课程讲的内容用自己的理解写出来，仅是作为一种锻炼方式，～
写到这里想起了一个小故事：有个小孩子很傻。当别人给他5毛钱和1块钱让他选择一个的时候，他每次都会选择5毛钱。于是大家都觉得他傻，总喜欢这样一次次逗他。直到有一天，有一个人问这个小孩子：“你难道不知道1块钱比5毛钱多吗？“ ”当然知道。可是如果我拿1块钱的话，以后就没有人再给我钱了“
有调查表明，对于囚徒困境，70%的人会选择A，而其余30%的人会选择B。（内心高尚，乐观态度，相信别人会合作。。。）。而在耶鲁进行的同样的调查，选择A和B的人数比238：36（远远高于7：3）
去掉45-67的数，是因为换位思考（in shoes）。做到这一步，不仅自己是理性，同时也要假定别人也是理性的（相信别人不会选择67以上的数字）
去掉30-45之间的数，是因为站在别人的角度上考虑别人的别人会怎么思考，也就是深一层的换位思考。（in shoes twice）。做到这一步，自己是理性，自己相信自己的对手们是理性，并且自己相信自己的对手们也相信他们的对手们也是理性（比较绕了，所以我用了复数他们）
先列出几个解释：
囚徒困境（Prisoner‘s dilemma）：Nash讲的一个小故事。两个囚犯被隔离审问。他们有两个选择：A招供 B死不承认。如果两人都不承认将因为证据不足而被判1年囚禁，如果两人都承认，将被各判2年的囚禁。如果一个承认另一个不承认，则承认的人可以被释放，而死不承认的人将被囚禁5年作为惩罚。
第四集
罚点球：
一个经过模型简化的点球模型：罚球者可以选择左路，中路，右路3种路线去踢点球，门将可以选择向左扑救或者向右扑救（门将没有傻站着不动的option）。罚球者的收益很容易理解出来，其结论是，无论什么时候，罚球者向中路踢都不是一个最优的选择。（当门将向左扑的概率大于50%时，球员向右踢比较好；反正同理）。将其推广：
这里，2相对于1，9相对于10，都是绝对优势策略。（无论对手选择什么数字，我选2时获胜的机会都比选择1大），因此本着剔除劣势策略的原则，1和10这种边缘数在一开始就会被剔除。而此时，2和9就变成了边缘数，虽然它们一开始的时候不是劣势策略，但是它们是剔除劣势策略之后的劣势策略，所以等待它们的命运也是一样的，，这个过程继续下去，最后会得到5和6，也就是中位数。
几个结论：
1.永远不要选择劣势策略。（不解释）
2.每个人都理性思考，不一定会得到整体最优的结果。（囚徒困境的两人显然是理性的）
3.一定要设身处地的从别人的角度想想，再做出自己的选择。（清楚自己的收益是很容易的，判定自己的优势策略也是较容易的，难的是站在别人的角度考虑别人的选择，尤其是当你不知道别人是”饭桶恶魔“还是”愤怒天使“的情况下）（这是博弈的核心）
P.S. 关于共同知识，必须是我知道别人知道我知道别人知道这样无限的循环，就像两面相对摆放的镜子，这个是严格定义。相互知识不是共同知识。
第三集。坚持每天都看一篇的确很难，不过时刻把握住自己的大方向就好。
上次的数字游戏，是一个不断剔除劣势策略的过程：先把初始的劣势策略剔除，再看是否有新的劣势策略，不断循环，换句话说就是不断的换位思考。写道这里突然想起三国演义里，曹操走华容道的情况。诸葛在小路放火，曹操认为虚则实之，实则虚之，没火的路一定没有敌人，所以走有火的路，结果撞上关某人。曹操与诸葛博弈间，如果双方任何一人多想一层或者少想一层（比如曹操单纯点认为火必然是敌人放的，所以有火就有敌人；或者复杂些再想深一层，）就会是不同的结果。。所以我个人更愿意把诸葛这次的博弈成功看成是随机性的。。
现实里，类似囚徒困境的情况有很多。比如大学里寝室卫生归谁打扫（深有体会），企业之间的价格战，广告等等。对于没有约束或者缺乏沟通乃至强制的情况下，基本都会陷入“囚徒困境”
囚徒困境中，两人所作的选择都是针对当前情况，并且都视为这是唯一一次的可能，没有考虑将来以及长远收益的情况。一次背叛可能会在一次的事件里面获取最大的效益，但也失去了信用，从而失去了合作的机会，也就不可能获得长期的收益。
也就是说，如果每个参与者都绝对绝对绝对绝对理性，最后的结果应该是1.但是这个条件如此苛刻以至于几乎不可能达成，所以就出现了上面的结果。有趣的是，在分析完了上述的东西之后，教授再做了一次同样的实验。，这次几乎90%的人选择的数字都在5以下。所以，如果是一个公司在和它的竞争对手博弈，他肯定会假定他的对手是很老练或者说很理性，并站在这个立场考虑问题。如果一个公司是在和它的客户们博弈，就不一定做这样的假定，反而可能认为对方“愚蠢”。所以，把博弈的理论结合到实际上是很重要的～～～
不要选择一个在任何“信念”(belief)下都不是最优策略的策略。
这里的信念(原文是belief)并不是指门将会向左扑或者向右扑，而是指概率。我的理解是对中庸之道的批判。所以本例中，虽然罚球者的3种策略里没有劣势策略，不过还是可以用以上原则剔除掉一个策略。上述模型忽略的2个地方，
另一个囚徒困境的例子：清新的空气，或者一片公共的鱼群。你想对鱼进行过量捕捞，因为如果你不捕捞，别的国家就会捕捞，到头来你什么都得不到。全球变暖同理/。这种囚徒困境并不仅仅是缺乏沟通引起的，也就是说，沟通不能解决囚徒困境问题。你可以对全球变暖和低碳生活高谈阔论，然后每天洗20个热水澡。铁道部的那群猪不就是这样的么。所以针对囚徒困境，可行的一种做法是制定规章，契约，而这些方法之所以有效的根本原因在于它们改变了利益的计算方式，（如果违约，就要承担违约的成本），从而改变了动机。或者把单次博弈变成多次博弈。另外一种，通过教育来改变获益。耶鲁的教授特别提到，比如毛泽东思想，把一大群人关起来然后教育他们要做能吃苦能挨饿的好人。