博弈论的基本概念

合集下载

博弈论的定义

博弈论的定义1. 博弈论的基本概念博弈论，是现代数学的一个分支学科，研究在多人决策环境中人们的策略选择以及可能产生的结果。

从经济学、管理学、政治学、心理学等方面来分析和解决问题时，博弈论可以为人们提供决策的基础。

因此，博弈论不仅在学术上很有价值，在实践中也具有很高的应用价值。

2. 博弈论的应用范围博弈论的应用范围广泛，如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。

另外，也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。

3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。

“参与者”是指在某一决策环境中的所有相关人员，如消费者、企业、政府或其他组织和个人等。

“策略”是参与者在决策过程中选择的行动方案，也是促进参与者在决策中优化收益的关键。

“收益”或“效用”是参与者最终得到的结果，通常在博弈论中用数字来表示，这些数字可以是财务收入、数字权益等。

“信息”也是参与者在决策中极为重要的因素。

它可以分为完全信息和不完全信息两种，完全信息是指参与者对决策过程中的所有信息都有充分了解，而不完全信息是指参与者对决策过程中的某些信息存在不确定性。

因此，在不完全信息博弈中，有时决策者需要采取一些策略来“模糊化”自己的策略，以避免让其他人知道他们实际上所做的决策。

4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一，是指参与者的利益总和为零。

在这种情况下，一个人赢得的收益等于另一个人失去的收益，如象棋、扑克等所有参与者的输赢情况总是相互抵消的。

- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。

在这种情况下，一方的收益可以与另一方的收益同时增加，如合作博弈中的合作关系。

- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。

在此类博弈中，参与者通常需要通过协商和合作达成共识。

- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论（Game Theory)，它是现代数学的一个新分支，也是运筹学的一个重要组成内容。

在《博弈圣经》中写到：博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。

所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛，在经济学、政治科学（国内的以及国际的）、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外，它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法，标准的博弈论分析出发点是理性的，而不是心理的或社会的角度。

不过，近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

《西方经济学》第七章博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼精炼贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡这个概念是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态均衡的贝叶斯纳什均衡的结合.具体来说,精炼贝叶斯均衡是所有参与人战略和信念的一种结合.它满足如下条件:第一,在给定每个参与人有关其他参与人类型的信念的条件下,该参与人的战略选择是最优的.第二,每个参与人关于其他参与人所属类型的信念,都是使用贝叶斯法则从所观察到的行为中获得的.
22
贝叶斯法则贝叶斯法则是概率统计中的应用所观察到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23
习
题
1. 什么是占优策略均衡?什么是重复剔除的占优策略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产多少产量?各获得多少利润?
25
�
第七章
第一节第三节第四节第五节
博弈论
完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈
第一节博弈问题概述
一,博弈的基本概念二,博弈的分类
2
一,博弈的基本概念
博弈论博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的. 博弈论的基本概念包括:参与人行动参与人,行动参与人行动, 战略,信息支付函数,结果均衡. 信息,支付函数结果,均衡战略信息支付函数结果均衡

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要：博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳，以帮助读者更好地理解和应用博弈论的相关知识。

关键词：博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具，源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括：参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者，可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后，没有动力再改变策略，从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择，使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对，没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择，使得至少有一个参与者的收益达到最大，而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择，使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式，即参与者的利益总和为零。

博弈论模型简介

博弈论的基本概念
(二)博弈的组成要素
• • •
•
一个博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体； 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策； 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排；
案例模型构建
要素
4）效用函数：参与人i的效用函数不但受其自身的行动影响, 还取决于对方的行动选择,U=（U1，U2，U3）为参与人的效用函数组合。参与人1，即地方政府的效用U1主要取决于集体建设用地交易过程中取得的收益.参与人2和3的效用U2和U3也主要取决于三方面因素：一是集体建设用地交易过程中取得的收益R；二是集体建设用地地下交易的风险成本CR，即违反法律受到惩罚的风险；三是交易成本CT。
案例-地方政府的战略选择
其二，建立集体建设用地公开流转市场，地方政府获得级差地租Ⅱ 和部分级差地租Ⅰ。（略）
博弈论在旅游学的应用
1.旅游企业之间博弈
张亚明、陈亮(2008) 以博弈论为视角分析网络经济下旅游企业间的“竞—合”模式,通过运用博弈论对旅游企业间的合作竞争策略进行了分析,进而确定对合作和竞争策略的选择以及实施次序的活动运作战略。
案例-地下市场交易下的三方博弈分析
集体建设用地地下市场交易的动力来源
1
2
由于现行征地制度不健全，造成农村集体组织的权益受到侵害，农民集体组织为了获取比征地补偿更高的收益或者说规避土地征收带收的“产权侵害”问题,就私下进行了集体建设用地的各种流转
由于现行的征地上市交易模式手续多、周期长、成本高，往往出现用地企业拿到土地时已经错失投资良机的情况，而通过地下市场交易获得土地的成本低，周期短，成为用地企业获取土地的一个捷径。

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中，每个囚徒都有两种可选择的策略：坦白或抵赖。显然不论同伙选择什么策略，每个囚徒的最优策略是 “坦白”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人选择劣策略。所以在“囚徒困境”博弈里，“坦白、坦白”是占优策略均衡。
第五章博弈
第一节博弈论的基本概念与应用
一、博弈论的定义博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈。博弈论研究的是存在相互外部效应条件下的主体的决策问题。
在寡头垄断的市场上，只有少数几家厂商在相互竞争，寡头们面对的市场环境或者说竞争对手的行为将随着他们本身的决策行为而变动，即寡头们的决策是相互作用的，每个企业的得益和利润不仅取决于自身的决策，也取决于其他厂商的决策。寡头厂商之间可能有激烈的竞争，这些竞争涉及价格、产量、广告、投资等许多方面的决策，在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。
1．从行动的先后次序来划分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
2．从参与人对其他参与人的各种特征信息的获得差异来划分，博弈可分为完全信息博弈和不完全信息博弈。完全信息博弈指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息博弈。

博弈论的基本概念

博弈论的基本概念•博弈论是研究两人或多人谋略和决策的理论。

•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著.博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系.纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》(1951）等等，给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的的学科.•参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。

参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。

参与者可以是自然人，也可以是团体。

•信息：信息是指参与者在博弈过程中能了解和观察到的知识。

信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。

完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

•策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。

通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。

如果n个参与者没人选择一个策略,那么s=（s1,s2，…，s n）称为一个策略组合。

•收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。

通常用u i表示参与者i的收益，它是策略组合的函数。

•均衡：均衡是所有参与者的最优策略组合，记为s*。

博弈论的定义和主要思想

著名经济学家保罗.萨缪尔森说：“要想在现代社会做一个有文化的人，您必须对博弈论有一个大致了解。”
清华诚志
9
我们从博弈中学习什么
博弈论告诉人们，要学会理解他人都有自己的思想，每个个体都是理性的，所以必须了解竞争对手的思想。商业关系被认为是一种相互作用。但博弈论并不是疗法，并不是处方，它并不告诉你该付多少钱买东西，这是计算机或者字典的任务。博弈论只是提供一些关系的例证，一些有用的解决问题的方法。这种思维方法也许是企业家应该学习的。对于经济学家，也许需要学习它的理论模型，它的实验方式。
清华诚志
12
两种均衡
占优策略是无论其他局中人采取什么策略对于自己来说都是最好的策略。
占优均衡所有局中人都有占优策略而形成的均衡。
纳什均衡是指某一局中人在其他局中人的策略给定时选择最好策略而形成的均衡。
清华诚志
13
占优均衡一定是纳什均衡，但纳什均衡不一定是占优均衡。
占优均衡
– “不管你做什么，我所做的都是最佳选择。” – “不管我做什么，你所做的都是最佳选择。”
纳什均衡
– “给定你的行为，我所做的是最佳选择。” – “给定我做什么，你所做的是最佳选择。”
清华诚志
14
博弈的分类
1）根据参与人的多少，可将博弈分为两人博弈和多人博弈；
2）根据博弈结果的不同，又可分为零和博弈、常和博弈和变和博弈；
3）根据博弈方策略的数量，可分为有限博弈和无限博弈；
清华诚志
清华诚志
5
Selten and Harsanyi
泽尔腾（1965）将纳什均衡的概念引入了动态分析，提出了 “精炼纳什均衡”概念；以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”

博弈论基础—囚徒困境

15
经典范例表述
两个合伙犯罪的嫌疑犯作案后被警察抓住，由于缺乏
足够的证据指证他们的罪行，所以希望这两个人中至少有一个人供认犯罪，就能确认罪名成立。为此警察将这两个罪犯分别关押以防止他们串供，并告诉他们警方的政策是“坦白从宽，抗拒从严”：如果两人中只有一人坦白认罪，则坦白者立即释放，而另一人则被重判10年如果两个人同时坦白认罪，则他们将各判8年如果两个人都拒不认罪，则警方只能以较轻的罪名判他们各1年。
27
三、重复囚徒困境
28
由于在现实中，双方的博弈可能进行不止一次，如在
囚徒困境中，即使两个囚犯都坦白了，判刑也不是很严重，那么两个囚犯在刑满释放之后再作案，作案之后再判刑，释放之后再作案，如此周而复始的进行。
两个囚犯会在每次被审问时做何选择？是一直相互背
叛，还是寻找合作的机会？
29
重复博弈
博弈论的概念还包括行动、信息、结果和均衡
5
博弈的基本类型
6
合作博弈与非合作博弈 cooperative game and non-cooperative game
合作博弈
当事人之间达成有约束力的协议，强调团体理性，强调效率、公正、公平，例如两个寡头企业之间达成一个协议，联合获得最大化垄断利润，并且各自按照这个协议生产，这就是合作博弈。非合作博弈强调个人理性、个人最优决策，其结果可能是有效率的，也可能是无效率的。
12
纳什均衡的定义

13
二、囚徒困境
14
1950年，由就职于兰德公司的
梅里尔· 弗勒德（Merrill Flood）和梅尔文· 德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特· 塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。

博弈论基本概念

博弈论，又称为对策论（Game Theory）、赛局理论等，既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用，是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。

在博弈论中，通常包括以下基本概念：
局中人：在一场竞赛或博弈中，具有决策权的参与者被称为“局中人”。

在一个博弈中，每个局中人都要做出选择。

行动：局中人在博弈中的每一个决策或选择被称为“行动”。

信息：局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。

策略：局中人基于可获得的信息，制定的决策方案或规则称为“策略”。

收益：局中人在博弈中的得失或输赢称为“收益”。

均衡：当所有局中人都认为自己的策略选择最优，并且其他局中人也认为该策略选择是最优时，这种状态被称为“均衡”。

结果：在一场博弈结束后，所有局中人的收益总和被称为“结果”。

博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。

其中，局中人、策略和收益是最基本要素。

发展过程方面，博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。

目前，博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论

完全信息静态博弈
完全信息：每个参与人对所有其他参与人的特征（包括战略空间、支付函数等）有完全的了解。静态：指所有参与人同时选择行动且只选择一次。
完全信息静态博弈
占优战略均衡重复剔除劣战略纳什均衡占优战略均衡、重复剔除的占优均衡及纳什均衡的关系纳什均衡举例混合战略纳什均衡
占优战略均衡
战略表达式
战略表达式（标准式表达）：所有参与人同时选择各自的战略，所有参与人选择的战略一起决定每个参与人的支付。战略式表达给出：
博弈的参与人集合：i∈Γ,Γ=(1,2,…,n)
每个参与人的战略空间：Si，i=1,2,…,n 每个参与人的支付函数：ui(s1,…,si,…,sn),i=1,2,…,n G={S1,…,Sn;u1,…,un}— 战略式表达博弈有限博弈：1.参与人的个数是有限的； 2.每个参与人可选择的战略是有限的。
博弈论的基本概念
5.支付：指在一个特定的战略组合下参与人得到的确定效用水平；或指参与人得到的期望效用水平。 ui— 第i个参与人的支付（效用水平） u=（u1,…,ui,…,un）为n个参与人的支付组合博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择，而且取决于所有其他参与人的战略选择。 ui是所有参与人的战略选择的函数：ui=ui（s1,…,si,…,sn） 6.结果
博弈论的基本概念
2.行动：参与人在博弈的某个时点的决策变量。 ai— 第i个参与人的一个特定行动 Ai={ai}— 可供i选择的所有行动的集合 a=（a1,…,ai,…,an）— 行动组合
3.信息：参与人有关博弈的知识，特别是有关“自然”的选择，其他参与人的特征和行动的知识。完美信息：指一个参与人对其他参与人（包括虚拟参与人 “自然”）的行动选择有准确了解的情况，即每一个信息集只包含一个值。完全信息：指自然不首先行动或自然地初始行动被所有参与人准确观察到的情况，即没有事前的不确定性。

博弈论简介

但是，并不是所有博弈的博弈方都像上面这些博弈问题中的那样，有关于各博弈方得益或了解各博弈方得益所需要的全部信息的。典型的例子是在投标、拍卖活动构成的博弈中，由于各博弈方(竞投、竞拍者)对其他博弈方关于标的的估价很难了解，因此即使最后的成交价是大家都能看到的，各个博弈方仍然无法知道其他博弈方中标、拍得标的物的真正得益究竟是多少。

但并不是所有重复博弈都有事先确定的重复次数，也就是停止重复时间的，有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重复博弈”(Infinitely Repeated Games)

14
(六)博弈的信息结构

所谓信息，是指关于事物运动的状态和规律的表征，也是关
于事物运动的知识。信息就是用符号、信号或消息所包含的内容，来消除对客观事物认识的不确定性。它普遍存在于自然界、人类社会和人的思维之中。信息的概念是人类社会实践的深刻概括，并随着科学技术的发展而不断发展。这里，我们博弈中的信息，是指在博弈中博弈方对其他博弈

方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息，即每个博弈方在每种结果(策略组合)下的得益情况。在许多博弈问题中，各个博弈方不仅对自己的得益情况完全清楚，而且对其他博弈方的得益也都很清楚。如在囚徒的困境博弈中，因为两囚徒所处的地位是相同的，而且警察把他们双方的处境给他们都交代清楚了，因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外，也有大量现实决
策活动构成的博弈中，各博弈方的选择和行动不仅有先后次序，
而且后选择、后行动的博弈方在自己选择、行动之前，可以看到其他博弈方的选择、行动，甚至还包括自己的选择和行动。

博弈论

• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。 • （1）一般用si 表示第i个参与人的一个特定战略，Si = {si}代表第i 个参与人的所有可选择的战略集合。如果n个参与人每人选择一个战略， n维向量s=（s1,…,si,…,sn ）称为一个战略组合(strategy profile)，其中si是第i个参与人选择的战略。
•
囚徒困境引出重要结论：一种制度（体制）安排，要发生效力，必须是一种纳什均衡。否则，这种制度安排便不能成立。现实中囚徒困境问题：军备竞赛、公共产品私人提供、寡头竞争等。
领域
纳什均衡（增产，增产）
制度安排
寡头竞争公共产品私人提供
• （2）战略与行动是两个不同的概念，战略是行动的规则而不是行动本身。 • 例如：“人不犯我，我不犯人；人若犯我，我必犯人”是一种战略，“犯”与“不犯”是两种行动，战略规定了什么时候“犯”，什么时候 “不犯”。 • （3）作为一种行动规则，战略必须是完备的，它要给出参与人在每一种可想象到的情况下的行动选择，即使参与人并不预期这种情况会实际发生。
博弈论
西北大学经济管理学院
课程主体结构
一、博弈论概述二、博弈论的基本概念三、完全信息静态博弈四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念（game theory） • （1）博弈：又称为对策或游戏，是指一些人或组织在“策略相互依存”情形下相互影响、互相作用的状态。 • （2）博弈论：研究决策主体的行为发生直接相互作用时的决策，以及这种决策的均衡问题，即当一个主体的选择受到其他主体选择的影响，而且反过来影响到其他主体选择时的决策问题和均衡问题。

博弈论

博弈论的基本概念1.博弈论：博弈论，又称对策论，是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论的定义可以这样理解：博弈论是指某个个人或是组织，面对一定的环境条件，在一定的规则约束下，依靠所掌握的信息，从各自可选择的行为或策略中进行选择并加以实施，并从中取得相应收益的过程。

2.参与人：参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。

3、行动：行动是参与人在博弈的某个时点的决策变量。

一般来讲，把第i个参与人的一个行动为ai，其可供i选择的行动集合表示为Action set: Ai ={ai}。

在一个n人博弈中，n个参与人的行动的有序集为a={a1，…，an}，称为行动组合。

根据行动顺序，可以把博弈分为静态博弈、动态博弈。

静态博弈：一般来讲，如果行动时同时发生的或相当于同时发生的，则称之为静态博弈。

动态博弈：如果行动的发生有先后顺序，则称之为动态博弈。

4.信息：信息指的是参与人有关博弈的知识，特别是有关“自然”的选择、其他参与人的特征和行动的知识。

信息集是指参与人在特定时刻所拥有的有关变量的值的知识。

例如：囚徒困境甲不知乙的选择，则甲的信息集为{坦白或者抵赖}乙已经行动，甲观察到乙的选择，则甲的信息集为{坦白}或者是{抵赖}。

5.战略：战略是参与人在给定信息集的情况下的行动规则，是参与人完整的一套行动计划，它规定参与人在什么时候选择什么行动。

战略不同于行动，它是行动的规则，对于战略的表述应该是完备的。

例如：人不犯我，我不犯人；人若犯我，我必犯人”例如：田忌赛马，田忌所选的赛马计划就是一套完整的行动计划，也就是一个战略。

6.战略空间：参与者可以选择的战略的全体组成了战略空间。

田忌赛马，六种行动方案可供选择：上中下，上下中，中上下，中下上，下上中，下中上。

这些可选择的战略的全体组成了战略空间。

任何一人战略的改变都将使结果也随之改变。

7、收益：支付、报酬，指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。

经济博弈大赛知识点总结

经济博弈大赛知识点总结一、博弈论基本概念1.博弈论的定义博弈论是研究决策者之间相互影响的一种数学分析方法。

在该理论中，参与者的每一种决策都会影响到其他参与者的收益，因此需要在多方利益中进行权衡和选择。

2.博弈论的基本概念（1）参与者：指参与决策的一方或多方。

（2）策略：指参与者的行动选择。

（3）效用：指参与者从某种行动选择中得到的收益。

（4）收益矩阵：指博弈过程中不同参与者在不同策略组合下得到的收益组合。

3.博弈论的基本分类（1）合作与非合作博弈：合作博弈是指参与者之间可以进行合作协商，共同选择最优策略；非合作博弈是指参与者之间没有合作协商，各自选择最优策略。

（2）零和博弈与非零和博弈：零和博弈是指参与者的利益总和为零，一方得利即另一方受损；非零和博弈是指参与者的利益总和不为零，可以互惠互利或共同受益。

二、博弈论的基本模型1.纳什均衡纳什均衡是指在博弈论中，参与者的策略选择达到一种平衡状态，任何一个参与者都没有动机改变自己的策略。

纳什均衡是博弈理论的核心概念，对于非合作博弈中的理性参与者来说，最终会达到纳什均衡状态。

2.囚徒困境囚徒困境是博弈论中的一个经典模型，描述了两名囚犯被捕后面临的选择。

在这种情况下，即使两名囚犯都采取自己最佳的策略，他们最终都会面临到一种不利的结果。

这个模型的实质是说明了在自利最大化的前提下，最终可能导致共同损失的结果。

3.拍卖博弈拍卖博弈是指卖家和买家之间进行的策略与竞争。

在这种场景下，卖家需要选择出售物品的方式，而买家需要决定出价的高低。

这种博弈的结构包括英国拍卖、封闭式拍卖、荷兰拍卖等不同的竞争方式。

4.博弈树博弈树是一种博弈模型的图形表示方式，以树状的形式展现参与者的策略选择和结果。

博弈树有助于分析博弈的决策过程和可能的结果，帮助参与者制定最优策略。

5.拉力博弈拉力博弈是指在博弈中的一种竞争形式，即参与者面对的是关于资源的竞争和纷争。

这种博弈模型常见于市场竞争和企业之间的竞争，对于提高市场份额和竞争力有重要意义。

博弈基本概念

由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6
所以a,b,c应分别获得100万的2/3,1/6,1/6。
但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。
塞尔顿（R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。
博弈的类型
(1)合作博弈——研究人们达成合作时如何分配合作得到的收益，即收益分配问题。
(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大，即策略选择问题。
(3)完全信息不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；反之，则称为不完全信息。
(4)静态博弈和动态博弈
静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。
动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。
财产分配问题和夏普里值（Shapley value）
考虑这样一个合作博弈：a、b、c、投票决定如何分配100万，他们分别拥有50％、40％、10％的权力，规则规定，当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配，a50万、b40万、c10万c向a提出：a70万、b0、c30万b向a提出：a80万、b20万、c0……
有了上述定义，就立即得到纳什定理：
任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。
纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。

博弈论

✧16日培训内容：《博弈论》✧主讲：夏大慰，博士生导师，上海国家会计学院首任院长。

✧听课总结一、博弈论基本概念及其精髓1.博弈：是一种策略的相互依存状况，你的选择将会得到什么结果，取决于另一个或者另一群有目的的行动者的选择。

2.零和博弈：博弈当中参与者的利益严格对立，一个人所得永远等于另一个所失。

如麻将、扑克、橄榄球。

3.混合策略博弈：参与人通过模糊自己的策略动机迷惑对手的博弈。

4.优势策略：一个使参与者领先其对手的策略，无论这些对手采用什么策略，结局都是一样。

针对的是你的其他策略，而不是你的对手的策略。

5.博弈论的精髓在于基于系统思维基础上的理性换位思考，即在选择你的行动时考虑你的得益，但是你应当用他人的得益去推测他人的行动，从而选择最有利于自己的行动。

二、游戏中洞察博弈1.三个火枪手。

甲命中率30%，乙80%，丙100%，每人一次开枪机会，若甲乙丙分别轮流开枪，每人应首先向谁开枪。

2.100元纸币拍卖。

规则：除最终报价者对价获得纸币外，次高价者判定为输家。

3.在1-100之间选择数据。

一个团队成员在1-100之间任意选择一个数，规则：以每个人所选择数的三分之二汇总计算平均数，谁最接近团队平均数就获胜。

三、纳什均衡1.在给定其他参与者策略情况下，没有一个参与者能通过单方面改变自己的策略而使自己的得益提高，从而没有人有积极性打破这种均衡。

2.我所做的是：给定你所做的，我所做的是最好的；你所做的是：给定我所做的，你所做的是最好的。

3.智猪博弈。

猪圈中有一头大猪一头小猪，猪圈一端有个按钮，每按一下猪圈另一端食槽中会有10个单位猪食进槽，但按一下会耗去相当于2单位猪食的成本。

如果大猪先到食槽，大猪吃到9单位食物，小猪只能吃到1单位；如小猪先到，小猪吃4单位而大猪吃6单位；如果同时按并同时到食槽，则大猪吃7单位而小猪吃3单位食物。

4.结果：大猪按，小猪等待。

5.结论：处于强势的参与者为维护自己利益采取某种决策时，为其他弱势参与者提供了搭便车的机会。

博弈论基础 mobi

博弈论基础 mobi博弈论是数学中的一个重要分支，它研究的是在冲突和合作的情况下，利益相关的个体做出的决策及其结果。

在现实生活中，博弈论也被广泛应用于经济学、管理学、政治学等领域。

本文将从随机选择的8个方面出发，对博弈论的基础内容进行详细阐述。

1. 博弈论的起源与发展博弈论最早可以追溯到19世纪中叶，由数学家纳什引入并发展起来。

随着时间的推移，越来越多的研究者开始关注博弈论，并提出了许多重要的理论和方法。

例如，米尔格拉姆和奥斯特罗姆提出了博弈论的博弈形式和博弈策略的概念，深刻影响了博弈论的研究方向。

2. 博弈论的基本概念博弈论的基本概念包括参与者、策略和收益。

参与者指的是参与博弈的各方，策略是参与者在决策中选择的行动方式，收益则指的是各方根据博弈的结果所获得的利益。

3. 博弈论的解决方法为了解决博弈论中的问题，研究者提出了许多解决方法，其中最著名的是纳什均衡。

纳什均衡指的是在一个博弈中，各个参与者选择的策略组合下，不存在任何参与者想要改变策略的动机。

4. 不完全信息博弈不完全信息博弈是博弈论中的一个重要概念，指的是参与者无法完全了解其他参与者的策略和偏好。

在不完全信息博弈中，参与者需要根据对方的行为和其他信息进行决策，这给博弈的结果带来了不确定性。

5. 合作博弈和非合作博弈根据参与者之间的互动方式，博弈论可以分为合作博弈和非合作博弈。

合作博弈中，参与者通过合作来达成共同的目标；非合作博弈中，参与者通过竞争和冲突来追求自己的利益。

6. 零和博弈和非零和博弈零和博弈和非零和博弈是博弈论中的两个重要概念。

零和博弈指的是各方的收益总和为零，一方的收益增加必然导致其他方的收益减少；非零和博弈指的是各方的收益总和不一定为零。

7. 博弈论在经济学中的应用博弈论在经济学中有着广泛的应用，例如市场竞争、拍卖、博弈论模型对经济政策的制定等方面。

博弈论的应用帮助经济学家更好地理解和预测市场行为，提供了决策支持和政策建议。

第十章博弈论

第十章博弈论
第一节基本概念
（三）联合式博弈策略式表述就无法全面地估价参与者之间的合作所得。这正是合作博弈的“联合式”的目的所在。在可转换效用的合作博弈里，一个联合S的合作概率可通过赋予函数b（特征函数）一个实数值V(S) 来描述。V(S)代表了联合S给它的成员所能带来的全部可转换效用；根据博弈中具体的效用含义，它被称为联合S的“财富”或者“价值”或者“力量
10000，0
5000，5000
第十章博弈论
第三节重复博弈
先假定这场博弈是无限重复的，这时，两位店主会采取什么样的策略呢?
1.触发策略 2.针锋相对策略
3.合作均衡
第十章博弈论
第四节序列博弈
一、序列博弈
博弈的每个博弈的每个参与者依次行动的博弈，就叫做序列行动博弈（sequential-move game）。一般来说，序列行动博弈比同时行动博弈更容易分析。在序列博弈中，关键是要通过各参与者可能的行为和理性的反应来考虑。
第十章博弈论
【学习目标】通过对本章的学习，重点掌握博弈论的一些基本概念；掌握
纳什均衡、重复博弈、序列博弈和讨价还价策略的主要内容。
第一节基本概念第二节纳什均衡第三节重复博弈第四节序列博弈第五节讨价还价策略
第十章博弈论
第一节基本概念
一、博弈的含义
（一）含义博弈就是指两个及两个以上的个人或组织都在追求各自的利益，却没有人能够支配结果的一种竞争态势。
第十章博弈论
第一节基本概念
三、博弈论的定义
博弈论(game theory)又称对策论、游戏理论或策略运筹论，是指一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行动或策略中进行选择并加以实施，从中各自取得相应的结果的过程。

博弈论贝叶斯纳什均衡

博弈论贝叶斯纳什均衡一、引言博弈论是研究决策者在相互影响中做出决策的科学。

贝叶斯纳什均衡是博弈论中的一种解法，它考虑了不完全信息下的决策问题，被广泛应用于经济学、政治学、计算机科学等领域。

本文将从博弈论和贝叶斯纳什均衡两个方面进行详细介绍。

二、博弈论1.基本概念博弈论中有三个基本概念：玩家、策略和收益。

玩家是参与游戏的实体，可以是个人、组织或国家等。

每个玩家都有自己的目标和利益。

策略是指玩家在游戏中做出的选择。

每个玩家都有多种可选的策略，每种策略都对应着不同的收益。

收益是指每个玩家在游戏结束后获得的利益或损失。

收益可以用数字表示，也可以用其他方式来描述。

2.分类根据游戏参与者数量和信息情况，博弈论可以分为以下几类：（1）单人博弈：只有一个玩家参与游戏，如囚徒困境。

（2）双人博弈：有两个玩家参与游戏，如零和博弈、非零和博弈等。

（3）多人博弈：有多个玩家参与游戏，如合作博弈、竞争博弈等。

（4）完全信息博弈：每个玩家都知道其他玩家的策略和收益情况，如国际象棋。

（5）不完全信息博弈：每个玩家只知道自己的策略和收益情况，不知道其他玩家的策略和收益情况，如扑克牌。

3.解法解决一个博弈问题需要找到一种最优的策略组合，使得每个玩家都能够获得最大化的收益。

常见的解法有纳什均衡、帕累托最优解等。

三、贝叶斯纳什均衡1.基本概念贝叶斯纳什均衡是指在不完全信息下的多人博弈中，每个玩家根据已知信息做出最优选择所形成的策略组合。

它包含两个部分：先验概率和后验概率。

先验概率是指每个玩家在游戏开始前对其他玩家的策略和收益情况所做的预测。

后验概率是指每个玩家在游戏进行过程中，根据已知信息对其他玩家的策略和收益情况所做的修正。

2.求解方法贝叶斯纳什均衡的求解方法可以分为两种：直接求解和迭代求解。

直接求解是指通过计算每个玩家在不同信息情况下的期望收益，找到满足条件的最优策略组合。

这种方法适用于信息量较少、博弈参与者较少的情况。

迭代求解是指通过反复修正先验概率和后验概率，最终找到满足条件的最优策略组合。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论的基本概念
•博弈论是研究两人或多人谋略和决策的理论。

•博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。

纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。

此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的的学科。

•参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。

参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。

参与者可以是自然人，也可以是团体。

•信息：信息是指参与者在博弈过程中能了解和观察到的知识。

信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。

完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

•策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。

通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。

如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。

•收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。

通常用u i表示参与者i的收益，它是策略组合的函数。

•均衡：均衡是所有参与者的最优策略组合，记为s*。

几个经典的博弈实例
•例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。

除非至少一人认罪，否则警方无充分证据将他们按最论刑。

警方把他们隔离审讯，并对他们说明不同行动所带来的后果。

如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

• 例二海滩占位甲、乙两个冷饮摊贩，他们在一个直线状的海滩上，以同样的价格，相同的质量向均匀散布在海滩上的众多游客销售冷饮。

既然是做生意，目的总是多赚钱，甲乙两人有时在同一地点做同样的生意，竞争是难免的，这两个摊贩应该怎样安排自己的摊位，才能相安无事的做自己的生意？（假定游客总是到据自己最近的摊位购买冷饮）。

• 例三智猪争食猪圈里有一头打猪和一头小猪。

里面有一个猪食槽，槽的对面装有控制开关。

只要去拱开关，就会有一次6个单位的饲料流进槽里。

如果它们都不去拱开关，那么它们都吃不到饲料；如果小猪去拱，那么等到它跑回来时，大猪已把饲料吃光了；如果大猪去拱，等它回来时可以吃到1个单位的饲料；如果他们一起去拱，在一起跑回来，那么大猪可以抢到4个单位的饲料，小猪也能吃到2个单位的饲料。

假定每拱一次开-1，-1 -9，0 0，-9 -6，-6 坦白沉默坦白沉默囚徒一
关需要消耗0.5个单位的饲料能量。

它们长期一起进食，上面所说的情况两只猪都知道。

它们应该如何选择？
完全信息静态博弈
• 静态博弈：静态博弈指的是博弈的参与者同时选择各自的行动，即便是选择行动有先后的话，后行动者也不知道先行动者所采取的行动。

• 博弈的标准表述（策略表述）含有三个要素（1）博弈参与者集合i ∈ N ；
（2）每个参与者的策略空间S i ；（3）每个参与者的收益函数ui 。

• 定义：在一个有n 个参与者的博弈中，参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,u 2,…,u n ,称G={S 1,S 2,…,S n ；u 1,u 2,…,u n }为此博弈的一个标准表述。

• 定义：如果对任一s i ’ ∈ S i ,s i ’ ≠ s i *, 不等式u i (s 1,…,s i-1, s i *, s i+1,…,s n )> u i (s 1,…,s i-1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立，那么 si*称为参与者i 的严格占优策略。

• 定义：在博弈的标准表述中，如果对所有的参与者i ∈N ， s i * 是i 的严格0，0
6，-0.5 0.5，5 3.5，1.5 拱不拱拱不拱大猪小猪
占优策略，那么策略组合s*=(s 1*, …,s n *)称为严格占优策略均衡。

• 定义：在标准表述的博弈中，设s i ’和s i ’’是参与者i 的两个可选策略，若u i (s 1,…,s i-1, s i ’,s i+1,…,s n )<u i (s 1,…,s i-1, s i ’’,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立，那么称s i ’是相对于s i ’’的严格劣策略。

• 定义：如果s*=(s 1*, …,s n *)是逐步剔除严格劣策略剩下的唯一策略组合，则该策略称为逐步剔除严格劣策略均衡。

2，0 0，1 0，3 0，1 1，2 1，0 上下左中右参与者1 参与者2 0，1 0，3 1，2 1，0 上下左中参与者1 1，2 1，0 上下左中参与者1
• 定义：在博弈G={S 1,S 2,…,S n ；u 1,u 2,…,u n }，策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,s n *)满足条件：对每一个参与者i ，都有对所有的s i ∈ S i ， u i (s 1*,…,s i-1*, s i ,s i+1*,…,s n *) ≤ u i (s 1*,…,s i-1*,
s i *,s i+1*,…,s n *) 成立，则称s*为该博弈的一个纳什均衡。

• 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系：严格占优策略均衡是纳什均衡；逐步剔除严格劣策略均衡是纳什均衡；反之不然。

完全信息动态博弈
• 动态博弈：各参与者的行动有先后顺序，而且后行动者在自己行动之前能观测到先行动者的行动。

• 定义：完全信息扩展式博弈形式是一个三元组F=（N,H,P ）：其中N 是参与者的集合。

H 是A （行动的集合）中元素组成的序列的集合并且满足：
（1）空序列（）∈H ；（2）如果一个h ∈H ，则h|k ∈H ， h|k 表示h 的长度为k 的子序列；（3）如果一个无穷序列的所有有穷子序列都属于H ，那么h 也属于H 。

P ：H/Z ➞ N ，其中Z ⊆H 且h ∈Z 当且仅当任给h ’ ∈H ，若h ’|k =h 则h ’ =h 。

• 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法，就是博弈2，4 2，3 1，4 1，1 0，2 4，0 1，2 4，1 3，3 上中左中右参与者1 下
在上面的这个博弈中既不存在严格占优策略均衡，也不存在逐步剔除严格劣策略均衡，对这样的博弈引入纳什均衡的概念。

树。

•设ui：Z ➞R，F=（N,H,P）扩展式博弈形式，我们称G=（F,（u i）i N）为一个扩展式博弈。

1
2 （0，0）（2，1）（1，2）
l L
r R。

博弈论的基本概念

博弈论的定义

博弈论百度百科

《西方经济学》第七章 博弈论

《博弈论》知识点总结归纳

博弈论模型简介

《产业经济学》第五章--(博弈1)讲解

博弈论的基本概念

博弈论的定义和主要思想

博弈论基础—囚徒困境

博弈论基本概念

博弈论

博弈论简介

博弈论

博弈论

经济博弈大赛知识点总结

博弈基本概念

博弈论

博弈论基础 mobi

第十章 博弈论

博弈论贝叶斯纳什均衡

《西方经济学》第七章博弈论

第十章博弈论