博弈论的基本概念

合集下载

博弈论的定义

博弈论的定义

博弈论的定义1. 博弈论的基本概念博弈论,是现代数学的一个分支学科,研究在多人决策环境中人们的策略选择以及可能产生的结果。

从经济学、管理学、政治学、心理学等方面来分析和解决问题时,博弈论可以为人们提供决策的基础。

因此,博弈论不仅在学术上很有价值,在实践中也具有很高的应用价值。

2. 博弈论的应用范围博弈论的应用范围广泛,如军事策略、商业竞争、政治谈判、社会决策、环境决策等领域。

另外,也被广泛应用于运输、公共建设、医学治疗等社会实践活动中。

3. 博弈论的基本元素博弈论的基本元素是“参与者”、“策略”、“收益”和“信息”。

“参与者”是指在某一决策环境中的所有相关人员,如消费者、企业、政府或其他组织和个人等。

“策略”是参与者在决策过程中选择的行动方案,也是促进参与者在决策中优化收益的关键。

“收益”或“效用”是参与者最终得到的结果,通常在博弈论中用数字来表示,这些数字可以是财务收入、数字权益等。

“信息”也是参与者在决策中极为重要的因素。

它可以分为完全信息和不完全信息两种,完全信息是指参与者对决策过程中的所有信息都有充分了解,而不完全信息是指参与者对决策过程中的某些信息存在不确定性。

因此,在不完全信息博弈中,有时决策者需要采取一些策略来“模糊化”自己的策略,以避免让其他人知道他们实际上所做的决策。

4. 博弈论的经典模型- 零和博弈零和博弈是博弈论的基本模型之一,是指参与者的利益总和为零。

在这种情况下,一个人赢得的收益等于另一个人失去的收益,如象棋、扑克等所有参与者的输赢情况总是相互抵消的。

- 非零和博弈非零和博弈是一种参与者的利益总和不为零的博弈。

在这种情况下,一方的收益可以与另一方的收益同时增加,如合作博弈中的合作关系。

- 合作博弈合作博弈是指参与者可以在决策中合作以实现双方或多方的利益最大化。

在此类博弈中,参与者通常需要通过协商和合作达成共识。

- 非合作博弈非合作博弈是指参与者在决策中只考虑自己的利益。

博弈论百度百科

博弈论百度百科

博弈论约翰·冯·诺依曼博弈论的概念博弈论又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。

按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法,博弈论就是研究互动决策的理论。

所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析工具。

此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦理学等哲学分支有重要联系。

按照Aumann所撰写的《新帕尔格雷夫经济学大辞典》“博弈论”辞条的看法,标准的博弈论分析出发点是理性的,而不是心理的或社会的角度。

不过,近20年来结合心理学和行为科学、实验经济学的研究成就而对博弈论进行一定改造的行为博弈论(behavoiral game theory )也日益兴起。

博弈论的发展博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

博弈论无名氏定理

博弈论无名氏定理

博弈论无名氏定理引言:博弈论是研究决策制定和行为选择的数学模型,并在许多领域发挥重要作用。

在博弈论中,无名氏定理是一项非常重要的结论,它对于理解玩家之间的互动和找到最佳策略提供了指导。

本文将就博弈论无名氏定理展开详细阐述。

一、博弈论基本概念博弈论研究决策者在决策制定中的相互影响,主要分为以下几个基本概念:1.玩家:参与博弈的个体或群体,每位玩家需根据自身利益作出决策。

2.策略:玩家在博弈中可采取的行动方案。

每位玩家需从多个策略中选择一个。

3.收益:玩家基于自己的策略和其他玩家的策略,所获得的结果。

4.纳什均衡:指在博弈中各个玩家选择了最佳策略,无法通过单方面改变策略来获得更好结果。

二、无名氏定理的内容无名氏定理由约翰·纳什于1950年提出,它在博弈论中具有重要意义。

该定理的内容可以概括为:在任意有限次博弈中,至少存在一个纳什均衡。

也就是说,在博弈中,无论玩家有多少,无论策略有多复杂,至少会有一个纳什均衡点。

这意味着无论其他玩家选择什么策略,玩家都无法通过单方面改变自己的策略来获得更好的结果。

三、无名氏定理的证明无名氏定理的证明过程比较复杂,需要运用到博弈论中的一些数学理论和方法。

在证明过程中,通常会利用到反证法、最优响应函数、偏微分方程等工具。

具体证明过程如下:1.反证法:首先假设不存在纳什均衡点,即每个玩家都能通过改变自己的策略来获得更好结果。

2.最优响应函数:然后,分别对每个玩家的每种策略进行最优响应函数的计算,即找到玩家最好的策略选项。

3.偏微分方程:最后,通过偏微分方程等工具推导,得出存在纳什均衡的结论,从而证明无名氏定理。

四、无名氏定理的应用无名氏定理在经济学、政治学、生物学等多个领域有广泛的应用。

它可以帮助人们理解玩家之间的互动关系,揭示各种冲突与合作的策略选择。

无名氏定理的应用举例:1.在市场竞争中,企业可以利用无名氏定理来确定最佳的定价策略,以获取最大利润。

2.在国际关系中,国家之间的冲突和合作可以通过博弈论无名氏定理来研究和解析。

博弈论讲的是什么

博弈论讲的是什么

博弈论讲的是什么
博弈论是研究决策制定者之间相互关系的一门数学分支,主要关注在冲突和合作的情境下,个体或群体的最佳决策和策略选择问题。

博弈论的研究对象可以包括个体、团体、国家、公司等各种决策制定者。

以下是博弈论的一些核心概念和主要内容:
1.博弈的定义:博弈是指多方参与者在特定环境下做出决策,彼此之间的决策会相互影响。

每个参与者的目标是通过制定最佳策略来最大化其利益。

2.参与者:博弈论中的参与者被称为“玩家”,可以是个体、群体、国家等。

每个玩家都有自己的目标和利益,但他们的决策会影响其他玩家的结果。

3.策略:策略是玩家在博弈中可选的行动或决策。

博弈论研究玩家如何选择最优策略以最大化他们的利益。

4.支付:支付是指每个玩家根据博弈的结果获得的收益或损失。

博弈论分析玩家如何在不同策略下分配支付,以及如何最大化其期望收益。

5.博弈的分类:博弈可以分为零和博弈和非零和博弈。

零和博弈中,一个玩家的利益损失就是其他玩家的利益增益,总和为零。

非零和博弈中,各玩家的利益不一定互相抵消,可以共赢或共输。

6.博弈的解:博弈论研究如何找到博弈中的均衡点或解决方案。

最著名的解决概念之一是纳什均衡,它描述了一种情况,在该情况下,每个玩家的策略是对方玩家策略的最佳响应。

7.博弈的应用:博弈论在经济学、政治学、生物学、计算机科学
等领域有广泛的应用。

例如,在商业谈判、拍卖、国际关系、网络安全等方面,博弈论都可以提供洞察和指导。

总体而言,博弈论通过数学建模和分析,帮助我们理解在决策制定者之间互动的情境中,各方如何做出最佳的决策以达到其个体或集体的目标。

《西方经济学》第七章 博弈论

《西方经济学》第七章 博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23


1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25

第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。

关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括:参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

博弈论基础—囚徒困境

博弈论基础—囚徒困境

15
经典范例表述
两个合伙犯罪的嫌疑犯作案后被警察抓住,由于缺乏
足够的证据指证他们的罪行,所以希望这两个人中至 少有一个人供认犯罪,就能确认罪名成立。为此警察 将这两个罪犯分别关押以防止他们串供,并告诉他们 警方的政策是“坦白从宽,抗拒从严”: 如果两人中只有一人坦白认罪,则坦白者立即释放, 而另一人则被重判10年 如果两个人同时坦白认罪,则他们将各判8年 如果两个人都拒不认罪,则警方只能以较轻的罪名判 他们各1年。
27
三、重复囚徒困境
28
由于在现实中,双方的博弈可能进行不止一次,如在
囚徒困境中,即使两个囚犯都坦白了,判刑也不是很 严重,那么两个囚犯在刑满释放之后再作案,作案之 后再判刑,释放之后再作案,如此周而复始的进行。
两个囚犯会在每次被审问时做何选择?是一直相互背
叛,还是寻找合作的机会?
29
重复博弈
博弈论的概念还包括行动、信息、结果和均衡
5
博弈的基本类型
6
合作博弈与非合作博弈 cooperative game and non-cooperative game
合作博弈
当事人之间达成有约束力的协议,强调团体理性,强 调效率、公正、公平,例如两个寡头企业之间达成一个 协议,联合获得最大化垄断利润,并且各自按照这个协 议生产,这就是合作博弈。 非合作博弈 强调个人理性、个人最优决策,其结果可能是有效 率的,也可能是无效率的。
12
纳什均衡的定义

13
二、囚徒困境
14
1950年,由就职于兰德公司的
梅里尔· 弗勒德(Merrill Flood) 和梅尔文· 德雷希尔(Melvin Dresher)拟定出相关困境的理 论,后来由顾问艾伯特· 塔克 (Albert Tucker)以囚徒方式 阐述,并命名为“囚徒困境”。

博弈论基本概念

博弈论基本概念

博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

在博弈论中,通常包括以下基本概念:
局中人:在一场竞赛或博弈中,具有决策权的参与者被称为“局中人”。

在一个博弈中,每个局中人都要做出选择。

行动:局中人在博弈中的每一个决策或选择被称为“行动”。

信息:局中人在博弈中所知道的关于其他局中人的选择和条件被称为“信息”。

策略:局中人基于可获得的信息,制定的决策方案或规则称为“策略”。

收益:局中人在博弈中的得失或输赢称为“收益”。

均衡:当所有局中人都认为自己的策略选择最优,并且其他局中人也认为该策略选择是最优时,这种状态被称为“均衡”。

结果:在一场博弈结束后,所有局中人的收益总和被称为“结果”。

博弈论的基本要素包括局中人、策略、信息、收益、均衡和结果等。

其中,局中人、策略和收益是最基本要素。

发展过程方面,博弈论是在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论

博弈论

完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特征 (包括战略空间、支付函数等)有完全的了解。 静态:指所有参与人同时选择行动且只选择一次。
完全信息静态博弈
占优战略均衡 重复剔除劣战略 纳什均衡 占优战略均衡、重复剔除的占优均 衡及纳什均衡的关系 纳什均衡举例 混合战略纳什均衡
占优战略均衡
战略表达式
战略表达式(标准式表达):所有参与人同时选择各自的 战略,所有参与人选择的战略一起决定每个参与人的支付。 战略式表达给出:
博弈的参与人集合:i∈Γ,Γ=(1,2,…,n)
每个参与人的战略空间:Si,i=1,2,…,n 每个参与人的支付函数:ui(s1,…,si,…,sn),i=1,2,…,n G={S1,…,Sn;u1,…,un}— 战略式表达博弈 有限博弈:1.参与人的个数是有限的; 2.每个参与人可选择的战略是有限的。
博弈论的基本概念
5.支付:指在一个特定的战略组合下参与人得到的确定效用 水平;或指参与人得到的期望效用水平。 ui— 第i个参与人的支付(效用水平) u=(u1,…,ui,…,un)为n个参与人的支付组合 博弈的一个基本特征是一个参与人的支付不仅取决于自己 的战略选择,而且取决于所有其他参与人的战略选择。 ui是所有参与人的战略选择的函数:ui=ui(s1,…,si,…,sn) 6.结果
博弈论的基本概念
2.行动:参与人在博弈的某个时点的决策变量。 ai— 第i个参与人的一个特定行动 Ai={ai}— 可供i选择的所有行动的集合 a=(a1,…,ai,…,an)— 行动组合
3.信息:参与人有关博弈的知识,特别是有关“自然”的选 择,其他参与人的特征和行动的知识。 完美信息:指一个参与人对其他参与人(包括虚拟参与人 “自然”)的行动选择有准确了解的情况,即每一个信息 集只包含一个值。 完全信息:指自然不首先行动或自然地初始行动被所有参与 人准确观察到的情况,即没有事前的不确定性。

博弈论简介

博弈论简介
பைடு நூலகம்
经济学
拍卖理论
1
• 博弈论可以用来解释不同拍卖机制下的拍 卖策略和价格形成。
寡头垄断竞争
2
• 研究寡头垄断企业如何制定竞争策略,以 实现自身利益最大化。
劳动力市场与产品市场
3
• 博弈论被用于分析劳动者和雇主在劳动力 市场上的博弈行为,以及企业在产品市场上
的竞争策略。
政治学
选举行为
01
• 研究选民、政党、候选人之间的策略互动,以及投票行
生态学
• 研究生态系统中的食物链、竞争、共生等关系,以及物种之间的博弈策略。
游戏与计算机科学
01
游戏设计
• 博弈论被用于设计具有挑战性和趣味性的游戏,如棋类游戏、策略游戏 等。
02
计算机科学
• 研究计算机在处理问题时的决策过程和算法设计,如人工智能、机器学
习等领域。
03
信息论
• 研究信息传递过程中的策略选择和最优信息传输,如密码学、信息编码
博弈论简介
contents
目录
• 博弈论的基本概念 • 博弈论的基本理论 • 博弈论的应用 • 博弈论的未来发展 • 结论
01
博弈论的基本概念
定义与特点
• 博弈论(Game Theory)是一门应用数学
1
分支,主要研究在特定情境下个体或团队如 何做出决策以及这些决策之间的相互作用。
• 博弈论的特点在于强调决策的互动性和策
3
,常用于研究长期竞争和合作关系。
合作博弈
• 合作博弈是指参与者可以通过达成协议或联盟来优化整
01
体利益的博弈。
02
• 在合作博弈中,参与者可能会放弃部分利益,以换取整

博弈论知识点总结

博弈论知识点总结

博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。

下面是博弈论的一些基本概念和重要知识点的总结。

1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。

标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。

2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。

纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。

3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。

在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。

4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。

混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。

5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。

博弈树可以用来推导纳什均衡策略和分析博弈过程。

6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。

在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。

7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。

在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。

8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。

博弈论简介

博弈论简介
但是,并不是所有博弈的博弈方都像上面这些博弈问题中的那样,有关于 各博弈方得益或了解各博弈方得益所需要的全部信息的。典型的例子是在投标、 拍卖活动构成的博弈中,由于各博弈方(竞投、竞拍者)对其他博弈方关于标的 的估价很难了解,因此即使最后的成交价是大家都能看到的,各个博弈方仍然 无法知道其他博弈方中标、拍得标的物的真正得益究竟是多少。

但并不是所有重复博弈都有事先确定的重复次数,也就是停止重复时间的, 有些重复博弈似乎是会不断重复下去的。我们称这样的重复博弈为“无限次重 复博弈”(Infinitely Repeated Games)

14
(六)博弈的信息结构

所谓信息,是指关于事物运动的状态和规律的表征,也是关
于事物运动的知识。 信息就是用符号、信号或消息所包含的内容,来消除对客观 事物认识的不确定性。它普遍存在于自然界、人类社会和人 的思维之中。 信息的概念是人类社会实践的深刻概括,并随着科学技术的 发展而不断发展。 这里,我们博弈中的信息,是指在博弈中博弈方对其他博弈



方的特征、战略空间及得益函数等的知识。
15
1.关于得益的信息
博弈中最重要的信息之一是关于得益的信息,即每个博弈方 在每种结果(策略组合)下的得益情况。在许多博弈问题中,各 个博弈方不仅对自己的得益情况完全清楚,而且对其他博弈方 的得益也都很清楚。如在囚徒的困境博弈中,因为两囚徒所处 的地位是相同的,而且警察把他们双方的处境给他们都交代清 楚了,因此两个博弈方都对双方在每种情况下的得益非常清楚。
11
2.动态博弈
除了各博弈方同时决策的静态博弈以外,也有大量现实决
策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,
而且后选择、后行动的博弈方在自己选择、行动之前,可以看 到其他博弈方的选择、行动,甚至还包括自己的选择和行动。

博弈论

博弈论

• 4. 战略(strategy)
• 指参与人在给定信息集的情况下的行动规则, 它规定参与人在什么时候选择什么行动。 • (1)一般用si 表示第i个参与人的一个特定战 略,Si = {si}代表第i 个参与人的所有可选择 的战略集合。如果n个参与人每人选择一个战略, n维向量s=(s1,…,si,…,sn )称为一个战略组 合(strategy profile),其中si是第i个参与人 选择的战略。

囚徒困境引出重要结 论: 一种制度(体制)安 排,要发生效力,必须是 一种纳什均衡。否则,这 种制度安排便不能成立。 现实中囚徒困境问题: 军备竞赛、公共产品私 人提供、寡头竞争等。
领域
纳什均衡 (增产,增 产)
制度安排
寡头竞争 公共产品 私人 提供
• (2)战略与行动是两个不同的概念,战略是行动 的规则而不是行动本身。 • 例如:“人不犯我,我不犯人;人若犯我,我 必犯人”是一种战略,“犯”与“不犯”是两种 行动,战略规定了什么时候“犯”,什么时候 “不犯”。 • (3)作为一种行动规则,战略必须是完备的,它 要给出参与人在每一种可想象到的情况下的行动 选择,即使参与人并不预期这种情况会实际发生。
博 弈 论
西 北 大 学 经济管理学院
课程主体结构
一、博弈论概述 二、博弈论的基本概念 三、完全信息静态博弈 四、完全信息动态博弈
课程主体结构
五、不完全信息静态博弈
六、不完全信息动态博弈
一、博弈论概述
• 1.博弈论概念(game theory) • (1)博弈:又称为对策或游戏,是指一些人或组 织在“策略相互依存”情形下相互影响、互相作 用的状态。 • (2)博弈论:研究决策主体的行为发生直接相互 作用时的决策,以及这种决策的均衡问题,即当 一个主体的选择受到其他主体选择的影响,而且 反过来影响到其他主体选择时的决策问题和均衡 问题。

博弈论

博弈论

博弈论的基本概念1.博弈论:博弈论,又称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈论的定义可以这样理解:博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自可选择的行为或策略中进行选择并加以实施,并从中取得相应收益的过程。

2.参与人:参与人指的是博弈中选择行动以最大化自己效用的决策主体(个人、团体)。

3、行动:行动是参与人在博弈的某个时点的决策变量。

一般来讲,把第i个参与人的一个行动为ai,其可供i选择的行动集合表示为Action set: Ai ={ai}。

在一个n人博弈中,n个参与人的行动的有序集为a={a1,…,an},称为行动组合。

根据行动顺序,可以把博弈分为静态博弈、动态博弈。

静态博弈:一般来讲,如果行动时同时发生的或相当于同时发生的,则称之为静态博弈。

动态博弈:如果行动的发生有先后顺序,则称之为动态博弈。

4.信息:信息指的是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。

信息集是指参与人在特定时刻所拥有的有关变量的值的知识。

例如:囚徒困境甲不知乙的选择,则甲的信息集为{坦白或者抵赖}乙已经行动,甲观察到乙的选择,则甲的信息集为{坦白}或者是{抵赖}。

5.战略:战略是参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。

战略不同于行动,它是行动的规则,对于战略的表述应该是完备的。

例如:人不犯我,我不犯人;人若犯我,我必犯人”例如:田忌赛马,田忌所选的赛马计划就是一套完整的行动计划,也就是一个战略。

6.战略空间:参与者可以选择的战略的全体组成了战略空间。

田忌赛马,六种行动方案可供选择:上中下,上下中,中上下,中下上,下上中,下中上。

这些可选择的战略的全体组成了战略空间。

任何一人战略的改变都将使结果也随之改变。

7、收益:支付、报酬,指在一个特定的战略组合下参与人得到的效用水平或期望效用水平。

经济博弈大赛知识点总结

经济博弈大赛知识点总结

经济博弈大赛知识点总结一、博弈论基本概念1.博弈论的定义博弈论是研究决策者之间相互影响的一种数学分析方法。

在该理论中,参与者的每一种决策都会影响到其他参与者的收益,因此需要在多方利益中进行权衡和选择。

2.博弈论的基本概念(1)参与者:指参与决策的一方或多方。

(2)策略:指参与者的行动选择。

(3)效用:指参与者从某种行动选择中得到的收益。

(4)收益矩阵:指博弈过程中不同参与者在不同策略组合下得到的收益组合。

3.博弈论的基本分类(1)合作与非合作博弈:合作博弈是指参与者之间可以进行合作协商,共同选择最优策略;非合作博弈是指参与者之间没有合作协商,各自选择最优策略。

(2)零和博弈与非零和博弈:零和博弈是指参与者的利益总和为零,一方得利即另一方受损;非零和博弈是指参与者的利益总和不为零,可以互惠互利或共同受益。

二、博弈论的基本模型1.纳什均衡纳什均衡是指在博弈论中,参与者的策略选择达到一种平衡状态,任何一个参与者都没有动机改变自己的策略。

纳什均衡是博弈理论的核心概念,对于非合作博弈中的理性参与者来说,最终会达到纳什均衡状态。

2.囚徒困境囚徒困境是博弈论中的一个经典模型,描述了两名囚犯被捕后面临的选择。

在这种情况下,即使两名囚犯都采取自己最佳的策略,他们最终都会面临到一种不利的结果。

这个模型的实质是说明了在自利最大化的前提下,最终可能导致共同损失的结果。

3.拍卖博弈拍卖博弈是指卖家和买家之间进行的策略与竞争。

在这种场景下,卖家需要选择出售物品的方式,而买家需要决定出价的高低。

这种博弈的结构包括英国拍卖、封闭式拍卖、荷兰拍卖等不同的竞争方式。

4.博弈树博弈树是一种博弈模型的图形表示方式,以树状的形式展现参与者的策略选择和结果。

博弈树有助于分析博弈的决策过程和可能的结果,帮助参与者制定最优策略。

5.拉力博弈拉力博弈是指在博弈中的一种竞争形式,即参与者面对的是关于资源的竞争和纷争。

这种博弈模型常见于市场竞争和企业之间的竞争,对于提高市场份额和竞争力有重要意义。

博弈论

博弈论

✧16日培训内容:《博弈论》✧主讲:夏大慰,博士生导师,上海国家会计学院首任院长。

✧听课总结一、博弈论基本概念及其精髓1.博弈:是一种策略的相互依存状况,你的选择将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。

2.零和博弈:博弈当中参与者的利益严格对立,一个人所得永远等于另一个所失。

如麻将、扑克、橄榄球。

3.混合策略博弈:参与人通过模糊自己的策略动机迷惑对手的博弈。

4.优势策略:一个使参与者领先其对手的策略,无论这些对手采用什么策略,结局都是一样。

针对的是你的其他策略,而不是你的对手的策略。

5.博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。

二、游戏中洞察博弈1.三个火枪手。

甲命中率30%,乙80%,丙100%,每人一次开枪机会,若甲乙丙分别轮流开枪,每人应首先向谁开枪。

2.100元纸币拍卖。

规则:除最终报价者对价获得纸币外,次高价者判定为输家。

3.在1-100之间选择数据。

一个团队成员在1-100之间任意选择一个数,规则:以每个人所选择数的三分之二汇总计算平均数,谁最接近团队平均数就获胜。

三、纳什均衡1.在给定其他参与者策略情况下,没有一个参与者能通过单方面改变自己的策略而使自己的得益提高,从而没有人有积极性打破这种均衡。

2.我所做的是:给定你所做的,我所做的是最好的;你所做的是:给定我所做的,你所做的是最好的。

3.智猪博弈。

猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。

如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。

4.结果:大猪按,小猪等待。

5.结论:处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论的基本概念
•博弈论是研究两人或多人谋略和决策的理论。

•博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著.博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系.纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的的学科.
•参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。

参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。

参与者可以是自然人,也可以是团体。

•信息:信息是指参与者在博弈过程中能了解和观察到的知识。

信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。

完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

•策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。

通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。

如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。

•收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。

通常用u i表示参与
者i的收益,它是策略组合的函数。

•均衡:均衡是所有参与者的最优策略组合,记为s*。

几个经典的博弈实例
•例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。

除非至少一人认罪,否则警方无充分证据将他们按最论刑。

警方把他们隔离审讯,并对他们说明不同行动所带来的后果.如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月.
• 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相
同的质量向均匀散布在海滩上的众多游客销售冷饮.既然是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。

• 例三 智猪争食 猪圈里有一头打猪和一头小猪。

里面有一个猪食槽,槽的对面装有控制
开关。

只要去拱开关,就会有一次6个单位的饲料流进槽里。

如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料.假定每拱一次开关需要消耗0.5个单位的饲料能量。

它们长期一起进食,上面所说的情况两只猪都知道.它们应该如何选择?
-1,-1
-9,0 0,-9 -6,
-6
坦白 沉默
坦白 沉默
囚徒一
拱 不拱


完全信息静态博弈
• 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的
话,后行动者也不知道先行动者所采取的行动。

• 博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合i Î N ;(2)每个参与者
的策略空间S i ;(3)每个参与者的收益函数ui 。

• 定义:在一个有n 个参与者的博弈中,参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,
u 2,…,u n ,称G={S 1,S 2,…,S n ;u 1,u 2,…,u n }为此博弈的一个标准表述。

• 定义:如果对任一s i ’ Î S i ,s i ' ¹ s i *, 不等式u i (s 1,…,s i —1, s i *, s i+1,…,s n )>
u i (s 1,…,s i —1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i —1, s i+1,…,s n )都成立,那么 si*称为参与者i 的严格占优策略。

• 定义:在博弈的标准表述中,如果对所有的参与者i ÎN, s i * 是i 的严格占优策略,那
么策略组合s *=(s 1*, …,s n *)称为严格占优策略均衡.
• 定义:在标准表述的博弈中,设s i ’和s i ’'是参与者i 的两个可选策略,若u i (s 1,…,
s i —1, s i ’,s i+1,…,s n )<u i (s 1,…,s i —1, s i ’’,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立,那么称s i ’是相对于s i ’’的严格劣策略.
• 定义:如果s*=(s 1*, …,s n *)是逐步剔除严格劣策略剩下的唯一策略组合,则该策
略称为逐步剔除严格劣策略均衡。

左 中 右
参与者
2
• 定义:在博弈G={S 1,S 2,…,S n ;u 1,u 2,…,u n },策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,
s n *)满足条件:对每一个参与者i,都有对所有的s i Î S i , u i (s 1*,…,s i —1*,
s i ,s i+1*,…,s n *) £ u i (s 1*,…,s i-1*, s i *,s i+1*,…,s n *) 成立, 则称s *为该博弈的一个纳什均衡.
• 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系:严格占优策略均衡是纳
什均衡;逐步剔除严格劣策略均衡是纳什均衡;反之不然.
完全信息动态博弈
• 动态博弈:各参与者的行动有先后顺序,而且后行动者在自己行动之前能观测到先行动者
的行动。

• 定义:完全信息扩展式博弈形式是一个三元组F=(N,H ,P ):其中N 是参与者的集合。

H 是
A (行动的集合)中元素组成的序列的集合并且满足:(1)空序列()ÎH ;(2)如果一个h ÎH ,则h|k ÎH , h|k 表示h 的长度为k 的子序列;(3)如果一个无穷序列的所有有穷子序列都属于H ,那么h 也属于H 。

P :H/Z ➞ N ,其中Z ÍH 且h ÎZ 当且仅当任给h ’ ÎH ,若h'|k =h 则h ’ =h 。

• 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法,就是博弈树.
• 设ui :Z ➞R , F=(N ,H ,P )扩展式博弈形式,我们称G=(F ,( u i )i
Î N
)为一个扩展式博弈.
2,4
2,3
1,4
1,1 0,2 4,0 1,2 4,1 3,3 上 中 左


参与者1
下 在上面的这个博弈中既不存在严格占优策略均衡,也不存在逐步剔除严。

相关文档
最新文档