博弈论

合集下载

博弈论定义与主要思想

Selten and Harsanyi
泽尔腾（1965）将纳而海萨尼则发展了刻
什均衡的概念引入了动态分析，提出了 “精炼纳什均衡”概念；以及进一步刻画不完全信息动态博弈的 “完备贝叶斯纳什均
画不完全信息静态博弈的“贝叶斯纳什均衡”（1967－1968）。总之，他俩进一步将纳什均衡动态化，加入了接近实际的不完全信息条件。他们的
著名经济学家保罗.萨缪尔森说：“要想在现代社会做一个有文化的人，您必须对博弈论有一个大致了解。”
我们从博弈中学习什么
博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式。
2005年诺奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林，以表彰他们在博弈论领域作出的贡献。
主要思想
博弈论并不是经济学的一个分支，它只是一种方法，这也是为什么许多人将其看成数学的一个分支的缘故。
在对参与者行为研究这一点上，博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究，特别是人与人之间行为的相互影响和相互作用，人与人之间利益和冲突、竞争与合作，而这正是博弈论的研究对象。
4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识；
5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西；

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。

在《博弈圣经》中写到：博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。

所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外，它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法，标准的博弈论分析出发点是理性的，而不是心理的或社会的角度。

不过，近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

博弈论

2.2.1 博弈论的定义现代经济学的最新发展有一个特别引人注目的特点，那就是博弈论在经济学中越来越受到重视。

博弈论，又称为对策论，它是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题①。

简单地说，就是研究决策主体的行为在发生直接相互作用时，他们如何进行决策，以及这种决策的均衡问题。

1944 年冯·诺依曼和摩根斯特恩（Morgenstern）合作出版了《博弈论与经济行为》（The Theory of Games and Economic Behavior），开始将博弈论引入经济学，成为现代经济博弈论研究的开端。

20 世纪50 年代纳什（John F. Nash）、塔克（Tucker）等人的研究，奠定了现代博弈论的基石。

在其后的几十年里，许多经济学家致力于博弈论的研究，1965 年泽尔腾（Reinhard Selten）将纳什均衡的概念引入了动态分析；1967－1968 年，海萨尼（John C. Harsanyi）把不完全信息分析引入博弈论的研究；1982 年克瑞普斯（David M. Kreps）和威尔逊（RobertWilson）分析了动态不完全信息条件下的博弈问题。

1994 年诺贝尔经济学奖授予了纳什、泽尔腾和海萨尼三位博弈论专家，此后在2001 年诺贝尔经济学奖同样授予了三位博弈论的专家②。

博弈论是一种关于行为主体策略相互作用的理论，它已形成了一套完整的理论体系和方法论体系。

它具有基本假设的合理性、研究对象的普遍性、研究结论的真实性、方法论的实证性等特点。

正是因为这些特点，博弈论的产生和发展引发了一场深刻的经济学革命，使得现代经济学从方法论，到概念和分析的方法体系，都发生了很大的变化。

正如克瑞普斯（Kreps）在《博弈论与经济模型》一书中指出“在过去一二十年中，经济学在方法论，以及语言、概念等等方面，经历了一场温和的革命，非合作博弈已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不①懂纳什均衡能够‘消化’近代文献的领域。

博弈论百度百科

博弈论百度百科博弈论是一门研究决策制定和决策结果的学科，它是应用数学的一个分支，通过运用数学和逻辑工具，探讨参与者在互动决策中的最佳策略选择。

在博弈论中，参与者被称为玩家，他们根据自身利益和目标来做出决策。

博弈论适用于各种不同领域的情境，包括经济学、政治学、生物学等。

一、概述博弈论的研究对象是策略性互动。

在一个博弈中，每个玩家都会依据一定的策略选择进行行动，而这个选择可能会受到其他玩家的影响。

博弈论试图理解和分析在这种互动中，参与者如何做出决策，并找到最优的解决方案。

博弈论的核心概念是博弈，一个博弈可以用一个四元组表示：(N, A, U, F)，其中：- N表示参与博弈的玩家集合；- A表示每个玩家可选的行动集合；- U表示每个玩家的效用函数，用于衡量不同结果对该玩家的好坏程度；- F表示每个玩家的信息集合。

信息集合是指每个玩家在博弈过程中所了解的信息。

二、博弈论的重要概念1. 纳什均衡纳什均衡是博弈论中最重要的概念之一，指的是在一个博弈中，所有玩家选择的策略组合，使得任何玩家都没有动机单方面改变自己的策略。

纳什均衡是一个稳定状态，玩家之间不再有改变策略的动机。

2. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。

零和博弈是指参与博弈的玩家的收益之和为零，即一方获利必然导致另一方的损失。

非零和博弈是指参与博弈的玩家的收益之和不为零，即可以存在多方共同受益的情况。

3. 微观博弈与宏观博弈微观博弈是指研究个体玩家之间的策略性互动，关注的是个体决策的结果。

宏观博弈是指研究整体群体之间的策略性互动，关注的是全局结果。

三、应用领域博弈论的研究在众多领域中都具有广泛的应用。

以下是博弈论在一些领域的应用举例：1. 经济学博弈论在经济学领域中有着广泛的应用。

它可以用来研究市场竞争、合作与冲突、价格形成等经济问题。

例如，博弈论可以用来分析竞争市场中的价格战和垄断市场中的价格定价策略。

2. 政治学博弈论在政治学领域中也有着重要的应用。

什么是博弈论？

什么是博弈论？博弈论是一门研究策略决策的学科，它涉及到两个或多个参与者的博弈过程。

博弈论的研究对象可以是经济、政治、社会等领域，也可以是日常生活中的人际交往。

下面，我们来详细了解一下这门学科。

一、博弈论的起源博弈论起源于20世纪40年代，当时美国数学家冯·诺依曼（John von Neumann）和经济学家奥斯卡·莫根斯特恩（Oskar Morgenstern）合著了《博弈论与经济行为》一书。

这是一本奠定博弈论基础的重要著作，它将博弈论应用于经济学领域，从而成为博弈论的奠基之作。

二、博弈论的基本概念1.参与者博弈论的参与者指的是博弈过程中参与决策的个体或组织，例如一个独立的个人、两个公司或国家之间的竞争。

2.策略策略是指参与者在博弈中所采用的行为方式或决策方法。

不同的策略可能导致不同的博弈结果，因此博弈过程中策略的选择非常重要。

3.收益收益是博弈过程中参与者所能获取的利益，包括经济利益、社会地位、权力等。

收益对参与者而言是决策的目的和结果，因此其大小和分布会影响博弈的结果。

4.博弈形式博弈形式指的是博弈参与者、策略和收益之间的关系，是博弈过程的精神核心。

博弈形式一般分为合作博弈和非合作博弈两种，而在这两种博弈形式下，又分别有多种复杂的形式。

三、博弈论的应用1.经济学领域博弈论在经济学领域的应用最为广泛。

经济学研究的主题之一是市场竞争，而博弈论可以帮助我们透彻理解市场竞争的规律。

例如，博弈论可以用来研究企业之间的价格战、垄断行为、拍卖等问题。

2.政治学领域博弈论在政治学领域的应用也非常重要。

政治学研究的主题之一是国家之间的竞争和协作，而博弈论可以帮助我们研究国际关系、外交政策等问题。

例如，博弈论可以用来研究国际贸易谈判、军备竞赛等问题。

3.人际交往领域博弈论在人际交往领域的应用也相当重要。

通过博弈论，我们可以学习如何有效地沟通和合作，避免双方的冲突和误解。

例如，博弈论可以用来研究双方的协调、合作等问题。

博弈论概述

“坦白”是A的占优策略。同样，“坦白”也是B的占优策略。
一般地，称 si*为局中人i的(严格)占优策略，若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地，所有的 si' si* 被称为“劣策略”。注意：这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1，则甲选3；乙选2，则甲选1；乙选3，则甲选1。乙在行动时会估计到甲的行动，它估计三种选择中的最高代价为策略1（损失900万），其次为策略2（损失 600万），最低为策略3（损失为500万）。因此，乙必选代价最低的策略3。——最大最小原理。结论：乙选择3，甲选 1作为回应，乙损失500万，甲获益500万。
在博弈论里，一个博弈可以有两种表述方式：一种是策略式（strategic form representation）表述，另一种是扩展式（ extensive form representation ）表述。前者适合于讨论静态博弈，后者适合于讨论动态博弈。在策略式表述中，所有参与人同时选择各自的策略，所有参与人选择的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.

博弈论的定义和主要思想

著名经济学家保罗.萨缪尔森说：“要想在现代社会做一个有文化的人，您必须对博弈论有一个大致了解。”
清华诚志
9
我们从博弈中学习什么
博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式。
清华诚志
12
两种均衡
占优策略是无论其他局中人采取什么策略对于自己来说都是最好的策略。
占优均衡所有局中人都有占优策略而形成的均衡。
纳什均衡是指某一局中人在其他局中人的策略给定时选择最好策略而形成的均衡。
清华诚志
13
占优均衡一定是纳什均衡，但纳什均衡不一定是占优均衡。
占优均衡
– “不管你做什么，我所做的都是最佳选择。” – “不管我做什么，你所做的都是最佳选择。”
纳什均衡
– “给定你的行为，我所做的是最佳选择。” – “给定我做什么，你所做的是最佳选择。”
清华诚志
14
博弈的分类
1）根据参与人的多少，可将博弈分为两人博弈和多人博弈；
2）根据博弈结果的不同，又可分为零和博弈、常和博弈和变和博弈；
3）根据博弈方策略的数量，可分为有限博弈和无限博弈；
清华诚志
清华诚志
5
Selten and Harsanyi
泽尔腾（1965）将纳什均衡的概念引入了动态分析，提出了 “精炼纳什均衡”概念；以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”

什么是博弈论？它对我们的生活起到了什么作用？

什么是博弈论？它对我们的生活起到了什么作用？
一、什么是博弈论？
博弈论是研究决策者在不确定信息下作出决策的一种数学理论。

基本
模型是博弈，意思是一个包含一组演员、一组策略和一些收益的场景，演员根据选定的策略得到一定的收益。

博弈论的研究对象是决策者行
为和决策制度的理性分析，以及对他们行为的合理比较。

二、博弈论在社会生活中的应用
1.经济领域
博弈论在经济学中有着广泛的应用，它主要研究市场竞争、战略合作、激励机制等问题。

在竞争的市场中，企业之间需要采取合适的策略来
保持竞争优势，而博弈论可以帮助企业进行理性的决策。

例如在定价
问题上，企业可以采用策略博弈理论来制定最优策略，达到利润最大化。

2.政治领域
在政治中，博弈论主要研究的是多个政治力量之间的互动，以及政治
决策的成本和效果。

例如，在某些政治制度下，不同的政治力量会进
行策略博弈，来实现自己的目的。

3.社会学领域
博弈论在社会学领域主要研究集体行为，例如合作行为、冲突行为等。

例如，在家庭中，夫妻之间可能会面临各种策略博弈，例如互相表达
感情、处理矛盾问题等。

4.生物学领域
博弈论在生物学中也有着广泛的应用，例如在两个激素反馈环路中，
光线激活素可以促使二者同时发生变化。

这样的相互作用在生物学上
是基于博弈论的思想。

三、结语
博弈论已经广泛应用到各个领域。

它不仅有助于我们理解现实世界中
所发生的复杂现象，而且可以帮助我们制定最优策略，实现我们的目标。

它对我们的社会生活起到了重要的作用。

博弈论知识点总结完整版

博弈论一：基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈：a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式：策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足：uisi;s-i>uisi';s-is-i; si' sib、占优均衡：一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡：a、“严劣”和“弱劣”的含义：设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义：重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二：纳什均衡Nash Equilibrium2.1纳什均衡定义：对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即：u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义：纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择；没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理：Nash在1950年证明：任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立；定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三：混合策略Mixed Strategies 纳什均衡3.1定义：混合策略的定义：在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是： UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义：基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义：对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法：a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四：多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是：在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是：多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如：参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点：人们通常会协调彼此的行为..你弱他就强；先例产生的影响远大于逻辑或者法律效力；人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义：如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五：动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合：i=1; … ;N..用N表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动；参与人的行动空间actionset：在每次行动时;参与人可选择的行动集合；参与人的信息集information set：每次行动时参与人知道什么；参与人的收益函数：在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是：各阶段各参与人的行动数目有限；博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点；终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注：每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义：当A选择开发时;B选择大括号中前面的策略；当A选择不开发时;B选择大括号中后面的策略..B的纯策略为：{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为：SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法：a逆向归纳法求解策略：从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较：如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件：x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法：前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是：参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理：令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..（七）不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。

博弈论简介

பைடு நூலகம்
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略，以实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力市场上的博弈行为，以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动，以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系，以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏，如棋类游戏、策略游戏等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计，如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输，如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论（Game Theory）是一门应用数学
1
分支，主要研究在特定情境下个体或团队如何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
，常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中，参与者可能会放弃部分利益，以换取整

博弈论简介

但是，并不是所有博弈的博弈方都像上面这些博弈问题中的那样，有关于各博弈方得益或了解各博弈方得益所需要的全部信息的。典型的例子是在投标、拍卖活动构成的博弈中，由于各博弈方(竞投、竞拍者)对其他博弈方关于标的的估价很难了解，因此即使最后的成交价是大家都能看到的，各个博弈方仍然无法知道其他博弈方中标、拍得标的物的真正得益究竟是多少。

但并不是所有重复博弈都有事先确定的重复次数，也就是停止重复时间的，有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重复博弈”(Infinitely Repeated Games)

14
(六)博弈的信息结构

所谓信息，是指关于事物运动的状态和规律的表征，也是关
于事物运动的知识。信息就是用符号、信号或消息所包含的内容，来消除对客观事物认识的不确定性。它普遍存在于自然界、人类社会和人的思维之中。信息的概念是人类社会实践的深刻概括，并随着科学技术的发展而不断发展。这里，我们博弈中的信息，是指在博弈中博弈方对其他博弈

方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息，即每个博弈方在每种结果(策略组合)下的得益情况。在许多博弈问题中，各个博弈方不仅对自己的得益情况完全清楚，而且对其他博弈方的得益也都很清楚。如在囚徒的困境博弈中，因为两囚徒所处的地位是相同的，而且警察把他们双方的处境给他们都交代清楚了，因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外，也有大量现实决
策活动构成的博弈中，各博弈方的选择和行动不仅有先后次序，
而且后选择、后行动的博弈方在自己选择、行动之前，可以看到其他博弈方的选择、行动，甚至还包括自己的选择和行动。

博弈论

• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。 • （1）一般用si 表示第i个参与人的一个特定战略，Si = {si}代表第i 个参与人的所有可选择的战略集合。如果n个参与人每人选择一个战略， n维向量s=（s1,…,si,…,sn ）称为一个战略组合(strategy profile)，其中si是第i个参与人选择的战略。
•
囚徒困境引出重要结论：一种制度（体制）安排，要发生效力，必须是一种纳什均衡。否则，这种制度安排便不能成立。现实中囚徒困境问题：军备竞赛、公共产品私人提供、寡头竞争等。
领域
纳什均衡（增产，增产）
制度安排
寡头竞争公共产品私人提供
• （2）战略与行动是两个不同的概念，战略是行动的规则而不是行动本身。 • 例如：“人不犯我，我不犯人；人若犯我，我必犯人”是一种战略，“犯”与“不犯”是两种行动，战略规定了什么时候“犯”，什么时候 “不犯”。 • （3）作为一种行动规则，战略必须是完备的，它要给出参与人在每一种可想象到的情况下的行动选择，即使参与人并不预期这种情况会实际发生。
博弈论
西北大学经济管理学院
课程主体结构
一、博弈论概述二、博弈论的基本概念三、完全信息静态博弈四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念（game theory） • （1）博弈：又称为对策或游戏，是指一些人或组织在“策略相互依存”情形下相互影响、互相作用的状态。 • （2）博弈论：研究决策主体的行为发生直接相互作用时的决策，以及这种决策的均衡问题，即当一个主体的选择受到其他主体选择的影响，而且反过来影响到其他主体选择时的决策问题和均衡问题。

经典博弈论概述

经典博弈论概述1 什么是博弈论博弈论是一种独特的处于各学科之间的研究人类行为的方法。

与博弈论有关的学科包括数学，经济学和其他社会科学和行为科学。

博弈论是由约翰•冯•诺依曼创立的，该领域第一本重要著作是诺依曼和另一个伟大的数理经济学家奥斯卡•摩根斯坦所著的。

博弈论是关于包含相互依存情况中理性行为的研究。

所谓相互依存，通常是指博弈中的任何一个参与者受到其他参与者行为的影响，反过来，他的行为也影响到其他参与者。

由于这种相互依存性，游戏或博弈的结果依赖于每一个参与者的决策，没有一个人能完全地控制所要发生的事情，也没有一个参与者处于孤独的状态。

相互依存常使博弈中的参与者之间产生竞争。

譬如两个人分蛋糕、每个参与者都希望自己的那块可以分得大一些。

然而，竞争仅仅是博弈论中相互依存的一个方面。

应该指出，通常地博弈并非纯粹是参与者之间的竞争，相互依存的另一个方面是参与者可以有某些共同的兴趣或利益所在。

仍以分蛋糕为例，作为参与者策略行动的结果，蛋糕的大小可以增加或者减少。

参与者的共同兴趣在于增加蛋糕的总量，他们互相“倾轧”之处在于如何分配。

从博弈论研究的角度，增大蛋糕应是博弈的第一步，而分配蛋糕则是博弈的第二步。

在博弈论中还需要对一个词“理性行为” 作一些说明。

博弈论中的所谓理性，一般不是指道德标准。

从参加博弈的参与者的眼光来看，他们试图去实施自己认为可能最好的行为，尽管这样的行为有可能损害了其他参与者。

由于参与者的相互依存性，博弈中一个理性的决策必定建立在预测其他参与者的反应之上。

一个参与者将自己置身于其他参与者的位置并为他着想从而预测其他参与者将选择的行动，在这个基础上该参与者决定自己最理想的行动，这就是博弈论方法的本质与精髓。

博弈论中每一个参与者做出理性决策的重要依据之一是他的可能收益有多少，这就是一个参与者需要认真计算的收益函数(payoff function) 。

对于每一个参与者、如果他们在可供自己选择的策略空间中任取一个策略作为自己的行动，既不会给自己带来盈利，又不会使他们必须付出，这种失去了激励机制的游戏本身也就失去了“博” 的意义，在社会经济领域中尤其不太可能出现这类现象。

博弈论

博弈论的基本概念1.博弈论：博弈论，又称对策论，是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论的定义可以这样理解：博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自可选择的行为或策略中进行选择并加以实施，并从中取得相应收益的过程。

2.参与人：参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。

3、行动：行动是参与人在博弈的某个时点的决策变量。

一般来讲，把第i个参与人的一个行动为ai，其可供i选择的行动集合表示为Action set: Ai ={ai}。

在一个n人博弈中，n个参与人的行动的有序集为a={a1，…，an}，称为行动组合。

根据行动顺序，可以把博弈分为静态博弈、动态博弈。

静态博弈：一般来讲，如果行动时同时发生的或相当于同时发生的，则称之为静态博弈。

动态博弈：如果行动的发生有先后顺序，则称之为动态博弈。

4.信息：信息指的是参与人有关博弈的知识，特别是有关“自然”的选择、其他参与人的特征和行动的知识。

信息集是指参与人在特定时刻所拥有的有关变量的值的知识。

例如：囚徒困境甲不知乙的选择，则甲的信息集为{坦白或者抵赖}乙已经行动，甲观察到乙的选择，则甲的信息集为{坦白}或者是{抵赖}。

5.战略：战略是参与人在给定信息集的情况下的行动规则，是参与人完整的一套行动计划，它规定参与人在什么时候选择什么行动。

战略不同于行动，它是行动的规则，对于战略的表述应该是完备的。

例如：人不犯我，我不犯人；人若犯我，我必犯人”例如：田忌赛马，田忌所选的赛马计划就是一套完整的行动计划，也就是一个战略。

6.战略空间：参与者可以选择的战略的全体组成了战略空间。

田忌赛马，六种行动方案可供选择：上中下，上下中，中上下，中下上，下上中，下中上。

这些可选择的战略的全体组成了战略空间。

任何一人战略的改变都将使结果也随之改变。

7、收益：支付、报酬，指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。

博弈论介绍

博弈论介绍
博弈论是一门研究决策人在不确定条件下如何做出最优决策的数学理论。

它主要关注如何分析和解决决策问题，例如社会团体、国家、个人等
在多个选项中做出选择的情况。

博弈论的研究范围很广，主要包括博弈模型的建立，博弈存在性、均
衡和稳定性等问题的研究，以及博弈策略的设计和实施。

在现实中，博弈
论被广泛应用于经济、管理、政治、战略等领域，可用来解决竞争、合作、谈判和风险决策等问题。

博弈论的基本概念包括博弈双方、策略、收益矩阵、纳什均衡等。

其中，纳什均衡是指在博弈中，每个参与者选择的策略与其他参与者的策略
相互配合，使得任何一方单方面改变策略都无法获得更好的收益的状态。

纳什均衡是博弈论中最基本的均衡概念，也被广泛应用于实际生活中。

总之，博弈论不仅是一门基础的理论学科，也是一种有效的决策分析
工具，它的研究和应用将会为我们的生活和工作带来更多的实际价值。

第八章博弈论

做广告
可口可乐的决策做广告不做广告
百事可乐的决策
做每家亿美元的利润可口可乐得到亿美元利润每家30亿美元的利润可口可乐得到20亿美元利润广百事可乐得到50亿美元利润百事可乐得到亿美元利润告
可口可乐得到50亿美可口可乐得到亿美不元利润每家都得到40亿美元利润做百事可乐得到亿美每家都得到亿美元利润百事可乐得到20亿美广元利润
告
（二）动态博弈
博弈方的决策有先后顺序，博弈方的决策有先后顺序，后行动的博弈方在看到其他博弈方的决策选择后采取相应的、在看到其他博弈方的决策选择后采取相应的、有针对性的行动。有针对性的行动。动态博弈存在一定的不对称性，动态博弈存在一定的不对称性，先行动者需深思熟虑
动态博弈扩展形
B 打进 A 打击（-2，3）不进（0，10）和平相处（5，5）
一个著名的例子：囚徒困境一个著名的例子：
张三和李四两人偷车时被捕，张三和李四两人偷车时被捕，警察怀疑他俩是本市一系列偷车案的惯犯，但没有充分证据，本市一系列偷车案的惯犯，但没有充分证据，为防止两人串供，关在两间牢房分别审问：防止两人串供，关在两间牢房分别审问：如某人坦白，另一人抵赖，并把主要罪名推给对如某人坦白，另一人抵赖，轻判2 对方判15 15年方，轻判2年，对方判15年如两人均坦白，各判10年如两人均坦白，各判10年 10 如两人拒不坦白，证据不足，罪名较轻，各判5 如两人拒不坦白，证据不足，罪名较轻，各判5年
重复博弈：
o
动态博弈是一种反复进行的博弈。动态博弈是一种反复进行的博弈。重复博弈是动态博弈的一种特殊情况，重复博弈是动态博弈的一种特殊情况，在重是动态博弈的一种特殊情况复博弈中，同一个博弈被重复多次。复博弈中，同一个博弈被重复多次。

博弈论(整理过名词解释和简答)

一、名词解释：1、博弈：一些个人、团体或其他组织，在一定的规则约束下，依据所掌握的信息，同时或者先后，一次或者多次从允许选择的行为或战略进行选择并加以实施，并从中各自取得相应结果或收益的过程。

2、囚徒困境：从博弈中的两个利益主体出发选择行为，结果是既没有实现两人总体的最大利益，也没有真正实现自身的个体最大利益，比如经济领域的寡头竞争、公共产品的供给。

3、非合作博弈与合作博弈：人们行为相互作用时，当事人能达成一个具有约束力的协议，也就是合作博弈，反之，就是非合作博弈。

4、常和博弈：是指博弈双方的得益总和为非零的常数变和博弈：是指在不同的策略组合或者结果下，所有博弈方的得益总和一般是不相同的零和博弈：是指在博弈中，一方的得益就是另一方的损失，所有博弈方的得益总和为零5、博弈论：研究决策主体的行为及其相互决策和均衡问题的学科。

在经济学中，博弈论是研究经济主体的决策相互影响6、战略：参与人在给定信息集的情况下的行为规则的完备描述。

7、均衡：所有参与人的最优战略组合。

8、均衡路径：如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，或者说是一个纳什均衡结果在博弈树中所形成的路径。

9、占优均衡：无论其他参与人选择什么战略，参与人的某一种战略均是最优的。

10、重复剔除劣战略的占优均衡：首先找到某个参与人的劣战略（假定存在），把这个劣战略删除掉，重新构造一个不包含已删除的劣战略的新的博弈，然后再删除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。

11、纳什均衡：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是最好的策略，即双方在给定的战略上不愿意改变自己的策略。

12、混合战略：如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为，我们称该战略为混合战略。

13、子博弈：从单结信息集开始至博弈结束的过程，由一个决策结x和所有的后续决策结T(x)构成，满足条件：(1)决策结x是单结信息集；(2)在一个信息集的决策结必须是同一个决策结的后续结。

博弈论

1.什么是博弈论？“博弈论”译自英文“Game Theory”，直译就是“游戏理论”。

博弈论是研究行为人在矛盾和对抗性关系中的行为决策中一般性规律规律的学科。

是系统研究各种博弈问题，寻求在各博弈方具有充分或者有限理性、能力的条件下，合理的策略选择和合理选择策略时博弈的结果，并分析这些结果的经济意义、效率意义的理论和方法。

博弈：一些个人、组织，面对一定的环境条件，在一定的规律下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。

包括：博弈的参加者，各博弈方的全部策略或行为集合，进行博弈的次序，博弈方的得益四方面。

纳什均衡：设存在一个策略组合Bx’和By’，且Bx’∈Bx(Bx1,Bx2,……,BxN),By’∈By(By1,By2,……,ByN) ,当x选择Bx’时，y的最优策略选择是By’,同时，当y选择By’时，x的最优选择是Bx’,因此，x和y选择了Bx’和By’时，谁都不会再改变策略。

这种局面称为Nash均衡，是Nash最早提出并证明了它的存在。

1951年Nash提出了Nash均衡的概念，并证明了Nash均衡的存在——真正奠定了博弈论作为一门学科的基础。

之前,虽然有很多人致力于研究博弈对策的规律，但总没有得出有意义的成果，直到Nash。

n人博弈纳什均衡定⏹设:G={A1,A2,A3,…….,AN;U1,U2, U3,…………,UN}⏹如果存在一个策略组合{a1*, a2*,……,aN*}，其中a1*∈A1,a2*∈A2,…….,aN*∈AN,使Ui*=Ui{a1*, a2*,…,aN*} ≥Ui{a1*,…,ai-1*,aij*,ai+1*…,aN*}⏹对任意i ∈N都成立，则{a1*, a2*,……,aN*}为Nash均衡。

囚徒困境坦白B不坦白A 坦白A 不坦白两个被捕的囚徒之间的一种特殊博弈，双方的利益不仅取决于他们自己的策略选择也取决于对方的策略选择。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论是一种处理竞争与合作问题的数学决策方法；研究竞争中参加者为争取最大利益应当如何做出决策的数学方法；根据信息分析及能力判断，研究多决策主体之间行为相互作用及其相互平衡，以使收益或效用最大化的一种对策理论；研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

近代对于博弈论的研究，开始于策墨洛（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。

1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。

纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。

此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

博弈的分类根据不同的基准也有所不同。

一般认为，博弈主要可以分为合作博弈和非合作博弈。

它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。

从行为的时间序列性，博弈论进一步分为两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。

通俗的理解："囚徒困境"就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈。

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息，在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们现在所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。

非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。

博弈要素: (1)决策人：在博弈中率先作出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。

(2) 对抗者：在博弈二人对局中行动滞后的那个人，与决策人要作出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。

他的策略可能依赖于决策人劣势的策略选择，占去空间特性，因此对抗是唯一占优的方式，实为领导人的阶段性终结行为。

(3)局中人（players）：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

(4)策略(strategies)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

(5)得失(payoffs)：一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。

所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

(6)次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。

(7)博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。

在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。

所谓纳什均衡，它是一稳定的博弈结果。

纳什均衡(Nash Equilibrium)：1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。

他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。

从而揭示了博弈均衡与经济均衡的内在联系。

纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。

纳什均衡的提出和不断完善为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

纳什均衡的主要内容是：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对（a, b*）≤偶对(a*,b*)≥偶对（a*，b）。

对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略b（属于策略集B），总有对局中人A的偶对（a, b*）≤偶对(a*,b*);对局中人B的偶对（a*，b）≤偶对(a*,b*)。

有了上述定义，就立即得到纳什定理：任何具有有限纯策略的二人博弈至少有一个均衡偶。

这一均衡偶就称为纳什均衡点。

纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。

通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。

纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。

智猪博弈：猪圈里有两头猪，一头大猪，一头小猪。

猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。

如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。

当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。

那么，两只猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。

对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。

反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。

规则的核心指标是：每次落下的食物数量和踏板与投食口之间的距离。

如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？试试看。

改变方案一：减量方案。

投食仅原来的一半分量。

结果是小猪大猪都不去踩踏板了。

小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。

谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。

改变方案二：增量方案。

投食为原来的一倍分量。

结果是小猪、大猪都会去踩踏板。

谁想吃，谁就会去踩踏板。

反正对方不会一次把食物吃完。

小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。

对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。

改变方案三：减量加移位方案。

投食仅原来的一半分量，但同时将投食口移到踏板附近。

结果呢，小猪和大猪都在拼命地抢着踩踏板。

等待者不得食，而多劳者多得。

每次的收获刚好消费完。

对于游戏设计者，这是一个最好的方案。

成本不高收获最大。

原版的“智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。

但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。

为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。

而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。

比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。

这相当于“智猪博弈”增量方案一所描述的情形。

但是如果奖励力度不大，而且见者有份（不劳动的“小猪”也有），一度十分努力的大猪也不会有动力了（就象“智猪博弈”减量方案所描述的情形）。

最好的激励机制设计就象改变方案三减量加移位的办法，奖励并非人人有份，而是直接针对个人绩效，既节约了成本（对公司而言），又消除了“搭便车”现象，能实现有效的激励。

许多人并未读过“智猪博弈”的故事，但是却在自觉地使用小猪的策略。

股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，等等。

因此，对于制订各种经济管理的游戏规则的人，必须深谙“智猪博弈”指标改变的个中道理。

博弈论的研究方法和其他许多利用数学工具研究社会经济现象的学科一样，都是从复杂的现象中抽象出基本的元素，对这些元素构成的数学模型进行分析，而后逐步引入对其形势产影响的其他因素，从而分析其结果。

博弈论

博弈论定义与主要思想

博弈论百度百科

博弈论

博弈论百度百科

什么是博弈论？

博弈论概述

博弈论的定义和主要思想

什么是博弈论？它对我们的生活起到了什么作用？

博弈论知识点总结完整版

博弈论简介

博弈论简介

博弈论

经典博弈论概述

博弈论

博弈论介绍

第八章 博弈论

博弈论(整理过名词解释和简答)

博弈论

第八章博弈论