博弈论
博弈论定义与主要思想
Selten and Harsanyi
泽尔腾(1965)将纳 而海萨尼则发展了刻
什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概念; 以及进一步刻画不完 全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博 弈的“贝叶斯纳什均 衡”(1967-1968)。 总之,他俩进一步将 纳什均衡动态化,加 入了接近实际的不完 全信息条件。他们的
著名经济学家保罗.萨缪尔森说:“要想在现代 社会做一个有文化的人,您必须对博弈论有一 个大致了解。”
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
2005年诺奖授予有以色列和美国双重国籍的罗 伯特·奥曼和美国人托马斯·谢林,以表彰他们 在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支,它只是一种 方法,这也是为什么许多人将其看成数学的一 个分支的缘故。
在对参与者行为研究这一点上,博弈论和经济 学家的研究模式是完全一样的。经济学越来越 转向人与人关系的研究,特别是人与人之间行 为的相互影响和相互作用,人与人之间利益和 冲突、竞争与合作,而这正是博弈论的研究对 象。
4、信息指的是参与人在博弈中所知道的 关于自己以及其他参与人的行动、策略 及其得益函数等知识;
5、得益是参与人在博弈结束后从博弈中 获得的效用,一般是所有参与人的策略 或行动的函数,这是每个参与人最关心 的东西;
博弈论百度百科
博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。
在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。
按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。
所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。
博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。
此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。
按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。
不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。
博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
博弈论名词解释
博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。
在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。
博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。
以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。
纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。
2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。
在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。
3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。
在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。
4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。
博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。
5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。
最优策略可能根据玩家的目标和信息不同而变化。
6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。
合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。
7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。
博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。
8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。
博弈论
2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点,那就是博弈论在经济学中越来越受到重视。
博弈论,又称为对策论,它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。
简单地说,就是研究决策主体的行为在发生直接相互作用时,他们如何进行决策,以及这种决策的均衡问题。
1944 年冯·诺依曼和摩根斯特恩(Morgenstern)合作出版了《博弈论与经济行为》(The Theory of Games and Economic Behavior),开始将博弈论引入经济学,成为现代经济博弈论研究的开端。
20 世纪50 年代纳什(John F. Nash)、塔克(Tucker)等人的研究,奠定了现代博弈论的基石。
在其后的几十年里,许多经济学家致力于博弈论的研究,1965 年泽尔腾(Reinhard Selten)将纳什均衡的概念引入了动态分析;1967-1968 年,海萨尼(John C. Harsanyi)把不完全信息分析引入博弈论的研究;1982 年克瑞普斯(David M. Kreps)和威尔逊(RobertWilson)分析了动态不完全信息条件下的博弈问题。
1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家,此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。
博弈论是一种关于行为主体策略相互作用的理论,它已形成了一套完整的理论体系和方法论体系。
它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。
正是因为这些特点,博弈论的产生和发展引发了一场深刻的经济学革命,使得现代经济学从方法论,到概念和分析的方法体系,都发生了很大的变化。
正如克瑞普斯(Kreps)在《博弈论与经济模型》一书中指出“在过去一二十年中,经济学在方法论,以及语言、概念等等方面,经历了一场温和的革命,非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。
博弈论百度百科
博弈论百度百科博弈论是一门研究决策制定和决策结果的学科,它是应用数学的一个分支,通过运用数学和逻辑工具,探讨参与者在互动决策中的最佳策略选择。
在博弈论中,参与者被称为玩家,他们根据自身利益和目标来做出决策。
博弈论适用于各种不同领域的情境,包括经济学、政治学、生物学等。
一、概述博弈论的研究对象是策略性互动。
在一个博弈中,每个玩家都会依据一定的策略选择进行行动,而这个选择可能会受到其他玩家的影响。
博弈论试图理解和分析在这种互动中,参与者如何做出决策,并找到最优的解决方案。
博弈论的核心概念是博弈,一个博弈可以用一个四元组表示:(N, A, U, F),其中:- N表示参与博弈的玩家集合;- A表示每个玩家可选的行动集合;- U表示每个玩家的效用函数,用于衡量不同结果对该玩家的好坏程度;- F表示每个玩家的信息集合。
信息集合是指每个玩家在博弈过程中所了解的信息。
二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一,指的是在一个博弈中,所有玩家选择的策略组合,使得任何玩家都没有动机单方面改变自己的策略。
纳什均衡是一个稳定状态,玩家之间不再有改变策略的动机。
2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。
零和博弈是指参与博弈的玩家的收益之和为零,即一方获利必然导致另一方的损失。
非零和博弈是指参与博弈的玩家的收益之和不为零,即可以存在多方共同受益的情况。
3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动,关注的是个体决策的结果。
宏观博弈是指研究整体群体之间的策略性互动,关注的是全局结果。
三、应用领域博弈论的研究在众多领域中都具有广泛的应用。
以下是博弈论在一些领域的应用举例:1. 经济学博弈论在经济学领域中有着广泛的应用。
它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。
例如,博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。
2. 政治学博弈论在政治学领域中也有着重要的应用。
博弈论完整版PPT课件
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
什么是博弈论?
什么是博弈论?博弈论是一门研究策略决策的学科,它涉及到两个或多个参与者的博弈过程。
博弈论的研究对象可以是经济、政治、社会等领域,也可以是日常生活中的人际交往。
下面,我们来详细了解一下这门学科。
一、博弈论的起源博弈论起源于20世纪40年代,当时美国数学家冯·诺依曼(John von Neumann)和经济学家奥斯卡·莫根斯特恩(Oskar Morgenstern)合著了《博弈论与经济行为》一书。
这是一本奠定博弈论基础的重要著作,它将博弈论应用于经济学领域,从而成为博弈论的奠基之作。
二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织,例如一个独立的个人、两个公司或国家之间的竞争。
2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。
不同的策略可能导致不同的博弈结果,因此博弈过程中策略的选择非常重要。
3.收益收益是博弈过程中参与者所能获取的利益,包括经济利益、社会地位、权力等。
收益对参与者而言是决策的目的和结果,因此其大小和分布会影响博弈的结果。
4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系,是博弈过程的精神核心。
博弈形式一般分为合作博弈和非合作博弈两种,而在这两种博弈形式下,又分别有多种复杂的形式。
三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。
经济学研究的主题之一是市场竞争,而博弈论可以帮助我们透彻理解市场竞争的规律。
例如,博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。
2.政治学领域博弈论在政治学领域的应用也非常重要。
政治学研究的主题之一是国家之间的竞争和协作,而博弈论可以帮助我们研究国际关系、外交政策等问题。
例如,博弈论可以用来研究国际贸易谈判、军备竞赛等问题。
3.人际交往领域博弈论在人际交往领域的应用也相当重要。
通过博弈论,我们可以学习如何有效地沟通和合作,避免双方的冲突和误解。
例如,博弈论可以用来研究双方的协调、合作等问题。
博弈论
博弈论是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的学科。
博弈的分类根据不同的基准也有所不同。
一般认为,博弈主要可以分为合作博弈和非合作博弈。
它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。
从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈论总结(精选13篇)
博弈论总结第1篇最大化自己最坏情况下的收益。
着眼于自己的收益,保证自己收益,防止风险使得自己的收益变小。
以性别之战为例子:首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育 xxx子期望收益(着眼于自己的期望收益): Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表(妻子收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,妻子的收益可能为0;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看体育,收益同样最小)这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为:minUw(p,q) = min(1-P,2P)5.最大化最坏收益: max(min(1-P,2P))解的:P=1/3则妻子的maxmin策略为:1/3概率选择韩剧,2/3概率选择体育。
同理得丈夫的maxmin策略为:1/3概率选择体育,2/3概率选择韩剧。
minmax策略 1.最小化对手最好情况下的收益。
是着眼于对手的收益。
还是这样的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育2.丈夫期望收益(着眼于对方的期望收益):(与maxmin不同要注意!!)Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表(丈夫收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,如果这时妻子也想看体育,丈夫收益到2;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看韩剧,收益同最大1)这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为:maxUw(p,q) = max(2-2P,P) 5.最小化最好收益: min(max(1-P,2P))妻子的minmax策略:2/3概率选择韩剧,1/3概率选择体育同里丈夫为的minmax为…在零和博弈中,maxmin策略和minmax策略是等价的。
博弈论介绍
博弈论介绍博弈论是一门研究决策者如何在不确定环境中做出决策的数学理论。
它是经济学、政治学、社会学以及其它社会科学中重要的工具之一,也被广泛应用于计算机科学、生物学等领域。
博弈论通过分析不同参与者的策略选择和结果预测,揭示了人类行为背后的数学原理和心理动机。
在博弈论中,参与者被称为玩家,他们的目标是最大化自己的效用。
博弈论的研究对象是博弈,即一种决策过程,其中多个决策者在有限资源环境中选择不同策略,以达到自己的目标。
博弈分为合作博弈和非合作博弈。
在合作博弈中,玩家可以通过合作来实现最优结果;而在非合作博弈中,玩家没有合作的选择,只能依靠自己的策略来最大化效用。
博弈论的基本元素包括玩家、策略和支付。
玩家是参与博弈的个体或组织,他们在决策过程中根据自己的目标和信息选择策略。
策略是指玩家在博弈中可选的行动,可以是单一的动作,也可以是一系列行动的组合。
支付是玩家在博弈结束时得到的结果,通常用于衡量玩家在博弈中的成功程度。
在博弈论中,最常用的分析工具是博弈矩阵。
博弈矩阵是一个二维表格,其中每个单元格表示不同玩家在不同策略组合下的支付。
通过分析博弈矩阵,我们可以推断玩家的最佳策略选择以及最终结果。
博弈论的核心概念之一是纳什均衡。
纳什均衡是指在一个博弈中,每个玩家的策略选择都是最佳的,给定其他玩家的策略选择不变。
换句话说,不存在玩家可以通过改变自己的策略来获得更好的结果。
纳什均衡并不一定是最优策略,只是所有玩家选择的最稳定状态。
除了纳什均衡,博弈论还涉及许多其他的解概念,如部分均衡、极大极小解等。
这些解概念提供了不同的策略选择和结果预测方法,使得博弈论在实际应用中更加有价值。
博弈论的应用范围非常广泛。
在经济学中,博弈论被用于分析市场竞争、价格战略以及拍卖等问题。
在政治学中,博弈论可以帮助我们理解选举、国际关系以及公共政策制定等方面的决策过程。
在社会学中,博弈论可以揭示社会规范、合作问题以及社会团体之间的关系。
在计算机科学中,博弈论被广泛应用于人工智能、机器学习和多智能体系统等领域。
博弈论最经典十句话
博弈论最经典十句话
1. “在博弈中,有时候退一步反而能前进两步呢!”就像下象棋,你看似放弃了一个小兵,却可能因此打开局面,赢得最终的胜利。
2. “别只盯着眼前的利益,要想想后面的路啊!”好比玩扑克牌,你不能光想着这一把怎么赢,得为后面的牌局做打算呀。
3. “知道对手的想法,那可太重要啦!”就如同拳击比赛,了解对方的出拳套路,你才能更好地防守和反击呀。
4. “合作有时候比竞争更能带来好处呢,想不到吧!”想想那些商业伙伴,携手合作才能创造更大的财富呀。
5. “在博弈里,每一步都可能改变整个局势哟!”就像下棋,一步错可能满盘皆输,可不能马虎呀。
6. “别小瞧了小细节,那可能是决定胜负的关键呢!”好比打篮球,一个小小的传球失误都可能导致比赛失败呀。
7. “有时候等待也是一种策略,懂不懂呀!”就像狩猎,耐心等待最佳时机,才能一举成功呀。
8. “不要总是一成不变,要灵活应变才行啊!”如同战场上,局势瞬息万变,不灵活怎么能行呢。
9. “博弈可不只是看实力,运气也很重要呢!”就像抽奖,实力强不一定就能中,运气来了挡都挡不住呀。
10. “懂得取舍,才能在博弈中走得更远呀!”好比旅行中带行李,太多了走不动,该舍弃的就得舍弃呀。
博弈论的定义和主要思想
清华诚志
9
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的 思想,每个个体都是理性的,所以必须了解竞 争对手的思想。商业关系被认为是一种相互作 用。但博弈论并不是疗法,并不是处方,它并 不告诉你该付多少钱买东西,这是计算机或者 字典的任务。博弈论只是提供一些关系的例证, 一些有用的解决问题的方法。这种思维方法也 许是企业家应该学习的。对于经济学家,也许 需要学习它的理论模型,它的实验方式 。
清华诚志
12
两种均衡
占优策略是无论其他局中人采取什么策 略对于自己来说都是最好的策略。
占优均衡所有局中人都有占优策略而形 成的均衡。
纳什均衡是指某一局中人在其他局 中人的策略给定时选择最好策略而 形成的均衡。
清华诚志
13
占优均衡一定是纳什均衡,但 纳什均衡不一定是占优均衡。
占优均衡
– “不管你做什么,我所做的都是最佳选择。” – “不管我做什么,你所做的都是最佳选择。”
纳什均衡
– “给定你的行为,我所做的是最佳选择。” – “给定我做什么,你所做的是最佳选择。”
清华诚志
14
博弈的分类
1)根据参与人的多少,可将博弈分为两人 博弈和多人博弈;
2)根据博弈结果的不同,又可分为零和博 弈、常和博弈和变和博弈;
3)根据博弈方策略的数量,可分为有限博 弈和无限博弈;
清华诚志
清华诚志
5
Selten and Harsanyi
泽尔腾(1965)将纳 什均衡的概念引入了 动态分析,提出了 “精炼纳什均衡”概 念;以及进一步刻画 不完全信息动态博弈 的“完备贝叶斯纳什 均衡”
博弈论基本概念
博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。
在一个博弈中,每个局中人都要做出选择。
行动:局中人在博弈中的每一个决策或选择被称为“行动”。
信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。
策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。
收益:局中人在博弈中的得失或输赢称为“收益”。
均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。
结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。
博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。
其中,局中人、策略和收益是最基本要素。
发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论简介
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍 卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略,以 实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力 市场上的博弈行为,以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动,以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系,以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏,如棋类游戏、策略游戏 等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计,如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输,如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论(Game Theory)是一门应用数学
1
分支,主要研究在特定情境下个体或团队如 何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
,常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中,参与者可能会放弃部分利益,以换取整
博弈论简介
但并不是所有重复博弈都有事先确定的重复次数,也就是停止重复时间的, 有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重 复博弈”(Infinitely Repeated Games)
14
(六)博弈的信息结构
所谓信息,是指关于事物运动的状态和规律的表征,也是关
于事物运动的知识。 信息就是用符号、信号或消息所包含的内容,来消除对客观 事物认识的不确定性。它普遍存在于自然界、人类社会和人 的思维之中。 信息的概念是人类社会实践的深刻概括,并随着科学技术的 发展而不断发展。 这里,我们博弈中的信息,是指在博弈中博弈方对其他博弈
方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息,即每个博弈方 在每种结果(策略组合)下的得益情况。在许多博弈问题中,各 个博弈方不仅对自己的得益情况完全清楚,而且对其他博弈方 的得益也都很清楚。如在囚徒的困境博弈中,因为两囚徒所处 的地位是相同的,而且警察把他们双方的处境给他们都交代清 楚了,因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外,也有大量现实决
策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,
而且后选择、后行动的博弈方在自己选择、行动之前,可以看 到其他博弈方的选择、行动,甚至还包括自己的选择和行动。
博弈论简介
双方都没有占优策略 存在两个稳定的状态(纳什均衡):(-1,1);(1,-1) 纳什均衡):( ,1);(1,):(- ;(1,
双方都避免两败俱伤,斗鸡博弈有两个纳什均衡, 双方都避免两败俱伤,斗鸡博弈有两个纳什均衡,一方 前进,另一方后退。由于有两个均衡点,结果无法预知。 前进,另一方后退。由于有两个均衡点,结果无法预知。 20世纪 年代苏美间的古巴导弹危机就是一个斗鸡博弈的 世纪60年代苏美间的古巴导弹危机就是一个斗鸡博弈的 世纪 很好例子 。 古巴导弹危机是冷战时期苏美之间最严重的一次危机, 古巴导弹危机是冷战时期苏美之间最严重的一次危机, 赫鲁晓夫1962年偷偷将导弹运到古巴对付美国,被美国 年偷偷将导弹运到古巴对付美国, 赫鲁晓夫 年偷偷将导弹运到古巴对付美国 U2飞机侦察到,美国派出携带核武器的战机、航母,威 飞机侦察到, 飞机侦察到 美国派出携带核武器的战机、航母, 胁苏联限期从古巴撤出导弹。苏美这两只大公鸡均在考虑 胁苏联限期从古巴撤出导弹。 进还是退? 进还是退? 战争的结果当然是两败俱伤, 战争的结果当然是两败俱伤,但任何一方退下来则是很 不光彩的事。博弈结果是苏联从古巴撤回了导弹, 不光彩的事。博弈结果是苏联从古巴撤回了导弹,做了丢 面子的“撤退的鸡” 而美国坚持了自己的策略, 面子的“撤退的鸡”,而美国坚持了自己的策略,做了 不退的鸡” 当然为了给苏联面子,同时也担心战争, “不退的鸡”。当然为了给苏联面子,同时也担心战争, 美国也从土耳其撤了一些导弹。 美国也从土耳其撤了一些导弹。
☺中国人研究博弈论是有优势的☺
三国演义》 孙子兵法》 三十六计》 《三国演义》、《孙子兵法》、《三十六计》、 厚黑学》都是博弈论教材, 《厚黑学》都是博弈论教材,如何在人与人的博 弈中取得成功。 弈中取得成功。
博弈论
博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。
2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。
3、行动:行动是参与人在博弈的某个时点的决策变量。
一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。
在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。
根据行动顺序,可以把博弈分为静态博弈、动态博弈。
静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。
动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。
4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。
信息集是指参与人在特定时刻所拥有的有关变量的值的知识。
例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。
5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。
战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。
例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。
6.战略空间:参与者可以选择的战略的全体组成了战略空间。
田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。
这些可选择的战略的全体组成了战略空间。
任何一人战略的改变都将使结果也随之改变。
7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。
第八章 博弈论
做广告
可口可乐的决策 做广告 不做广告
百 事 可 乐 的 决 策
做 每家 亿美元的利润 可口可乐得到 亿美元利润 每家30亿美元的利润 可口可乐得到20亿美元利润 广 百事可乐得到50亿美元利润 百事可乐得到 亿美元利润 告
可口可乐得到50亿美 可口可乐得到 亿美 不 元利润 每家都得到40亿美元利润 做 百事可乐得到 亿美 每家都得到 亿美元利润 百事可乐得到20亿美 广 元利润
告
(二)动态博弈
博弈方的决策有先后顺序, 博弈方的决策有先后顺序,后行动的博弈方 在看到其他博弈方的决策选择后采取相应的、 在看到其他博弈方的决策选择后采取相应的、 有针对性的行动。 有针对性的行动。 动态博弈存在一定的不对称性, 动态博弈存在一定的不对称性,先行动者需 深思熟虑
动态博弈扩展形
B 打进 A 打击 (-2,3) 不进 (0,10) 和平相处 (5,5)
一个著名的例子:囚徒困境 一个著名的例子:
张三和李四两人偷车时被捕, 张三和李四两人偷车时被捕,警察怀疑他俩是 本市一系列偷车案的惯犯,但没有充分证据, 本市一系列偷车案的惯犯,但没有充分证据,为 防止两人串供,关在两间牢房分别审问: 防止两人串供,关在两间牢房分别审问: 如某人坦白,另一人抵赖,并把主要罪名推给对 如某人坦白,另一人抵赖, 轻判2 对方判15 15年 方,轻判2年,对方判15年 如两人均坦白,各判10年 如两人均坦白,各判10年 10 如两人拒不坦白,证据不足,罪名较轻,各判5 如两人拒不坦白,证据不足,罪名较轻,各判5年
重复博弈:
o
动态博弈是一种反复进行的博弈。 动态博弈是一种反复进行的博弈。 重复博弈是动态博弈的一种特殊情况, 重复博弈是动态博弈的一种特殊情况,在重 是动态博弈的一种特殊情况 复博弈中,同一个博弈被重复多次。 复博弈中,同一个博弈被重复多次。
博弈论
1.什么是博弈论?“博弈论”译自英文“Game Theory”,直译就是“游戏理论”。
博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。
是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。
博弈:一些个人、组织,面对一定的环境条件,在一定的规律下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
包括:博弈的参加者,各博弈方的全部策略或行为集合,进行博弈的次序,博弈方的得益四方面。
纳什均衡:设存在一个策略组合Bx’和By’,且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时,y的最优策略选择是By’,同时,当y选择By’时,x的最优选择是Bx’,因此,x和y选择了Bx’和By’时,谁都不会再改变策略。
这种局面称为Nash均衡,是Nash最早提出并证明了它的存在。
1951年Nash提出了Nash均衡的概念,并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。
之前,虽然有很多人致力于研究博弈对策的规律,但总没有得出有意义的成果,直到Nash。
n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*},其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立,则{a1*, a2*,……,aN*}为Nash均衡。
囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈,双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、完全信息静态博弈 、 2、完全信息动态博弈 、 3、不完全信息静态博弈 、 4、不完全信息动态博弈 、
寡头垄断企业的竞争行为与博弈论的关于竞 争主体的行为假定是一致的, 争主体的行为假定是一致的,由此决定了寡 头垄断企业的竞争行为成为博弈论原理的重 要应用领域。 要应用领域。 “博弈论是行为人之间最优依存行为问题的 高效率的分析工具,因此, 高效率的分析工具,因此,博弈论这一基本 方法与产业组织理论的研究对象存在着紧密 的联系。博弈论诞生的几十年时间里, 的联系。博弈论诞生的几十年时间里,其应 王则柯, 用得最多的就是产业组织领域 ”。(王则柯,
(五)博弈的表述方式: 博弈的表述方式:
有两种:策略式(标准式)表达和扩展式表达。 有两种:策略式 标准式)表达和扩展式表达。 标准式 在策略式表述中可用矩阵表来直观的表示。 在策略式表述中可用矩阵表来直观的表示。 对于有限个参与人有限行动选择的博弈, 对于有限个参与人有限行动选择的博弈,在扩展式表达 中可用博弈树来表示
五、帕累托最优和纳什均衡的比较: 帕累托最优和纳什均衡的比较: 在囚徒的困境里,只有一个纳什均衡( 在囚徒的困境里,只有一个纳什均衡(坦白 坦白), ),但它又是这个博弈中唯一一个不 ,坦白),但它又是这个博弈中唯一一个不 是帕累托最优的局面。 是帕累托最优的局面。 在两性博弈中, 在两性博弈中,两个均衡既是纳什均衡又是 帕累托最优(采取同样的行动, 帕累托最优(采取同样的行动,效用大于独 立行动)。 立行动)。 但应该指出, 但应该指出,这并不是一条定律
(二)博弈的分类: 博弈的分类:
1、根据参与的人数划分:可将博弈分为两人博弈和多人博 、根据参与的人数划分 可将博弈分为两人博弈和多人博 弈。 2、根据行动时间的先后顺序划分 可将博弈分为静态博弈 、根据行动时间的先后顺序划分:可将博弈分为静态博弈 (static games)和动态博弈(dynamic games)。 )和动态博弈( )。
“囚徒困境”实质上对完全竞争市场 “看不 囚徒困境” 见的手”的法则提出了质疑。 见的手”的法则提出了质疑。
囚徒困境反映了个人理性与集体理性的矛盾。 囚徒困境反映了个人理性与集体理性的矛盾。 如何解决? 如何解决? 卡特尔的瓦解非常类似囚徒困境问题。因此, 卡特尔的瓦解非常类似囚徒困境问题。因此, 一个卡特尔要成功维持下去, 一个卡特尔要成功维持下去,就需要一个强制 机制。 机制。 现实中存在很多“囚徒困境”的的例子; 现实中存在很多“囚徒困境”的的例子; 启示:应重视制度的设计, 启示:应重视制度的设计,在满足个人理性的 同时,去争取达到集体理性。 同时,去争取达到集体理性。
常用博弈树来表述有限参与人参与的有限策略动态 一次行动称为一个“阶段” 博弈 (一次行动称为一个“阶段”)。
如图1-4所示, 如图 所示,博弈树由 所示 一系列的结点(nodes) 一系列的结点 和枝(branches) 组成, 组成, 和枝 一个有限动态博弈可以 非常清楚而简单地由博 弈树来表示。 弈树来表示。
不完全信息博弈。 不完全信息博弈。
完全信息博弈指每一个参与人对所有其他参与人的特征, 完全信息博弈指每一个参与人对所有其他参与人的特征,如策 略集合和支付函数有完全的、准确的知识;否则, 略集合和支付函数有完全的、准确的知识;否则,就是不完全 信息博弈。 信息博弈。
4、根据对博弈过程了解的程度划分。可分为 、根据对博弈过程了解的程度划分。 完美信息博弈和不完美信息博弈。 完美信息博弈和不完美信息博弈。
行动指参与人在博弈轮到自己选择时所做的某个具体 决策;策略是参与人选择行动的规则; 决策;策略是参与人选择行动的规则;即在博弈进程 什么情况下选择什么行动的预先安排。 中,什么情况下选择什么行动的预先安排。如“以牙 还牙”是一种策略。 还牙”是一种策略。
3、信息(information):指参与人在博弈中所知 、信息( ):指参与人在博弈中所知 ): 道的关于自己以及其他参与人的行动、 道的关于自己以及其他参与人的行动、策略及其 得益函数等知识; 得益函数等知识; 4、支付 (Pay Off) 函数:支付也可以称之为得益 函数: 、 是所有参与人策略或行动的函数。 。是所有参与人策略或行动的函数。
5、博弈结果(outcome)与均衡(equilibrium) 、博弈结果( )与均衡( )
博弈结果--每个可能策略相应的报酬。是指博弈分析者感 博弈结果 每个可能策略相应的报酬。 每个可能策略相应的报酬 兴趣的要素的集合,常用支付矩阵来表示; 兴趣的要素的集合,常用支付矩阵来表示; 均衡--是指所有参与人最优策略的组合 是指所有参与人最优策略的组合。 均衡 是指所有参与人最优策略的组合。是所追求的博弈 问题的最优解。 问题的最优解。博弈分析目的就是使用一定的博弈规则 预测博弈均衡。 预测博弈均衡。
多重纳什均衡和不存在纳什均衡的情形 例:性别战博弈(battle of the sexes)与斗鸡博弈 性别战博弈 与斗鸡博弈 (chicken game)。 。
混合策略( 混合策略(mixed strategy)纳什均衡 ) 有些博弈,没有纯策略,只有混合策略。 有些博弈,没有纯策略,只有混合策略。 一个著名的例子:零和博弈--“猜硬币 博弈。 猜硬币” 一个著名的例子:零和博弈 猜硬币”博弈。
1、博弈的标准式(策略式)表达(normal form 、博弈的标准式(策略式)表达( representation) )
包括三种基本要素, 包括三种基本要素,即:参与人集合、每个参 参与人集合、 与人的行动集合、每个参与者的支付函数。 与人的行动集合n、每个参与者的支付函数。
G = {S 1 , L , S n ; u i , L , u n }
完全信息静态博弈、完全信息动态博弈、 完全信息静态博弈、完全信息动态博弈、不完全信息静态 博弈和不完全信息动态博弈四种类型。 博弈和不完全信息动态博弈四种类型。与这四种类型博弈 相对应的就有四个基本的均衡概念。称为: 相对应的就有四个基本的均衡概念。称为:
纳什均衡( 纳什均衡(Nash Equilibrium;纳什 ;纳什1950、1951)、 、 )、 子博弈精练纳什均衡( 子博弈精练纳什均衡(Subgame Perfect Nash Equilibrium;泽尔腾 ;泽尔腾1965)、 )、 贝叶斯(纳什)均衡( 贝叶斯(纳什)均衡(Bayesian Nash Equilibrium;海 ; 萨尼1967-1968)、 萨尼 )、 精炼贝叶斯(纳什)均衡( 精炼贝叶斯(纳什)均衡(Perfect Bayesian Nash Equilibrium;泽尔腾 ;泽尔腾1975;Kreps和Wilson ; 和 1982,Fudenberg和Tirole 1991 )。(可见苏东水,第 和 )。(可见苏东水, 可见苏东水 170页) 页
2003) )
一、博弈及其分类 含义: (一)含义:
1、博弈(Game): 、博弈( ):
是指一些相互依赖、 是指一些相互依赖、相互影响的决策行为及其结果的 苏东水, 组合 [苏东水,2000,p169]。 苏东水 , 。
Hale Waihona Puke 2、博弈论(Game Theory): 、博弈论( ):
即研究博弈的解和规律的理论。 即研究博弈的解和规律的理论。 也就是一个人或一个企业的选择受到其他人、 也就是一个人或一个企业的选择受到其他人、其他企业选 择的影响,而且反过来影响到其他人、 择的影响,而且反过来影响到其他人、其他企业的选择 时的决策问题和均衡问题。因此,博弈论又称“对策论 时的决策问题和均衡问题。因此,博弈论又称“ ”。
5、根据能否达成协议来划分。可将博弈分为合作博弈 、根据能否达成协议来划分。 (cooperative game)和非合作博弈(uncooperative 和非合作博弈( 和非合作博弈 game)。 )。
6、根据参与人的理性状况划分。可将博弈分为完 、根据参与人的理性状况划分。 全理性博弈和有限理性博弈。 全理性博弈和有限理性博弈。 7、根据得益的特征划分。可将博弈分为零和博弈 、根据得益的特征划分。 )、常和博弈 (zero-sum games)、常和博弈(constant-sum )、常和博弈( games)变和博弈(variable-sum games)。 )变和博弈( )。
8、根据博弈进行的次数划分。可将博弈分为一次 性博弈(one-shot games)和重复博弈( repeated games) 9、根据策略的概率分类:可分为纯策略(pure 、根据策略的概率分类:可分为纯策略( strategies)和混合策略(mixed strategies) )和混合策略( ) 。 这些类别基本上都有交叉, 这些类别基本上都有交叉,每一种划分都有很重要 的意义。一般只讨论完全理性博弈和非合作博弈。 的意义。一般只讨论完全理性博弈和非合作博弈。
静态博弈是指各参与人同时选择行动,没有先后顺序, 静态博弈是指各参与人同时选择行动,没有先后顺序,或者虽非 同时, 同时,但后行动者并不知道先行动者采取什么样具体行动的博 弈。 动态博弈则是指各参与人的行动有先后顺序, 动态博弈则是指各参与人的行动有先后顺序,并且后行动者能够 观测到先行者所选择的行动的博弈。 观测到先行者所选择的行动的博弈。 3、根据掌握信息的程度划分。可分为完全信息博弈和 、根据掌握信息的程度划分。
表示一个n人参与的标准式博弈 表示一个 人参与的标准式博弈
有限双人博弈的策略式表达通常用支付矩阵 表来表示( 表来表示(图1-1) )
2、博弈的扩展式表达(extensive form 、博弈的扩展式表达 representation) 。
一个扩展式表述包括以下六个基本要素: 一个扩展式表述包括以下六个基本要素: 1)、参与人的集合; 、参与人的集合; 2)、参与人的行动顺序; 、参与人的行动顺序; 3)、参与人的行动空间(action set); 、参与人的行动空间( ); 4)、参与人的信息集(information set); 、参与人的信息集( ); 5)、参与人的支付; 、参与人的支付; 6)、自然选择的概率分布; 、自然选择的概率分布;