博弈论四种类型
博弈论名词解释
博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。
在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。
博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。
以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。
纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。
2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。
在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。
3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。
在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。
4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。
博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。
5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。
最优策略可能根据玩家的目标和信息不同而变化。
6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。
合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。
7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。
博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。
8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。
博弈论四种类型
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。
在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。
子博弈精炼纳什均衡
子博弈精炼纳什均衡
有限次重复博弈均衡
与纳什均衡的唯一性有关
连锁店悖论
1、均衡结果是原博弈的Nash均衡;
2、同时在每一个子博弈上构成Nash均衡
无限次重复博弈均衡(无名氏定理)
与贴现因子有关
囚徒困境(冷酷战略)
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
贝叶斯纳什均衡
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
ห้องสมุดไป่ตู้不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
聊聊四种经典的博弈论模型
聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。
但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。
为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。
官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。
但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。
这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。
如此考虑,最终,两名犯人都会选择坦白交代。
上面的案例就是博弈论所说的“囚徒困境”。
犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。
囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。
为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。
于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。
如果二猪同时到食槽边,则吃食比是7:3。
这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。
上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。
《产业经济学》第五章--(博弈1)讲解
在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
博弈论四种博弈类型
华为在阿根廷电信设备市场上的竞争博弈华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。
在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:1、完全信息情况下的静态博弈A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:原有垄断者潜在进入者 进入 不进入根据纳什均衡的定义:好的一组策略。
当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。
B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:原有垄断者潜在进入者低价 高价 对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。
博弈论知识点总结
博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。
下面是博弈论的一些基本概念和重要知识点的总结。
1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。
标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。
2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。
纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。
3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。
在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。
4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。
混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。
5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。
博弈树可以用来推导纳什均衡策略和分析博弈过程。
6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。
在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。
7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。
在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。
8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。
博弈论四种类型之完全信息静态博弈
博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。
完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。
⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。
在完全信息静态博弈中的均衡是纳什均衡。
最典型的例⼦是囚徒困境与智猪博弈。
下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。
【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。
⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。
离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。
对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。
【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。
所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。
但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。
个⼈的最优选择从社会⾓度看并不是最优的。
社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。
【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。
【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。
【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。
博弈论(名词解释和简答)
博弈论名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
经济学 博弈论
经济学博弈论
经济学中的博弈论是一个重要的分支领域,它研究的是在多个参与者之间互动决策的情境下,他们可能采取的不同策略以及相应的结果。
博弈论在经济学中有广泛的应用。
下面是一些博弈论的基本概念和常见的博弈类型:
1. 策略(Strategies):参与者在博弈中可选择的行动或决策。
2. 支配策略(Dominant Strategies):一种策略在所有情况下都会产生更好的结果,无论其他参与者选择什么策略。
3. 纳什均衡(Nash Equilibrium):在博弈中,当每个参与者都选择了对自己最有利的策略,并且没有动机单独改变策略时,达到的状态就是纳什均衡。
4. 合作与背叛(Cooperation and Betrayal):博弈中参与者可以选择合作或背叛其他参与者,涉及到合作博弈和非合作博弈的概念。
5. 零和博弈(Zero-sum Game):参与者的利益总和为零,一个人的收益增加意味着其他人的收益减少。
6. 非零和博弈(Non-zero-sum Game):参与者的利益总和不一定为零,可以存在合作使得所有参与者都获益的可能性。
7. 重复博弈(Repeated Games):博弈过程会重复进行多次,参与者的策略可能受到之前行动的影响。
这些只是博弈论的基本概念,实际应用中还有更多复杂的情况和模型。
博弈论在经济学中可以用来分析市场竞争、企业战略、拍卖、资源分配等众多领域。
它对于理解和预测人类行为决策的影响具有重要意义。
博弈论名词解释(修改)
博弈论名词解释(修改)1.有限博弈:一个博弈中每个博弈方的策略数都是有限的。
常见的是数种策略。
无限博弈:一个博弈中至少有某些博弈方的策略有无限多个。
零和博弈:一方的得益必定是另一方的损失,博弈方之间利益始终对立,偏好通常不同。
两人零和博弈也称为“严格竞争博弈”。
2.常和博弈:博弈方之间利益的总和为常数。
博弈方之间的利益是对立的且是竞争关系。
3.变和博弈:零和博弈和常和博弈以外的所有博弈。
合作利益存在,博弈效率问题的重要性。
可以站在社会利益的立场对其效率进行评价。
4.静态博弈:所有博弈方同时或可看作同时选择策略的博弈。
5.动态博弈:各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动。
6.重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能。
7.完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益8.不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称“不对称信息博弈”9.完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈10.不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈11.完全理性:有完美的分析判断能力和不会犯选择行为的错误12.有限理性:博弈方的判断选择能力有缺陷13.个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化14.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果,上策均衡不是普遍存在的。
15.严格下策反复消去法:反复寻找策略之间两两比较意义上的“严格下策”,并将它们消去的方法。
16.反应函数:对于厂商2的每一个可能的产量,厂商1的最佳对策产量的计算公式,它是厂商2产量的一个连续函数,我们称这个连续函数为厂商1对厂商2产量的一个“反应函数”。
17.帕累托上策均衡:博弈中存在多个纳什均衡,如这些纳什均衡存在明显的优劣差异,所有博弈方都偏好其中同一个纳什均衡,该纳什均衡给所有博弈方带来的得益都大于其他纳什均衡。
博弈论
3、纳什均衡:假设N个参与博弈,给定其他人战略的条件 下,每个人选择自己的最优战略,所有参与人选择的战略 一起构成一个战略组合,所有参与人的最优战略组合,则 是纳什均衡。
例三:性别战
足球
女
逛街
男
足球
2,1
0,0
0,0
1,2
逛街
即:我所做的是给定你所做的我所能做最好的 你所做的是给定我所做的你所能做最好的
5、非合作博弈可以得到四种不同的类型
2、产生与发展: 一般认为,1944年冯· 诺依曼(Von Neumann)和摩根斯坦(Oskar Morgenstern)合 作出版的《博弈论和经济行为》(The theory of games and Economic behaviour),标志 着系统的博弈理论的形成。
例四:市场进入阻止 在位者
默许
进入 40,50 0,300 不进入
斗争
-10,0 0,300
进入者
例五:斗鸡博弈
B
进 进 -3,-3 0 ,2 退 2,0 0,0
A
退
现实中的应用:游行队伍与警察之间的关系;夫妻吵架等。
三、完全信息动态博弈:子博弈精练纳 什均衡
纳什均衡有三个问题未解决(1)一个博弈中有几 个纳什均衡,到底哪一个均衡会出现?(2)在纳 什均衡中,参与人在选择自己的战略时,把其他参 与人的战略当作是给定的,不考虑自己选择影响对 手的战略;(3)允许了不可置信威胁的存在。 这就引出了泽尔藤的贡献,他(1965)通过对动态 博弈的分析,完善了纳什均衡的概念,定义了“子 博弈精炼纳什均衡”:中心意义是将纳什均衡中包 含的不可置信威胁战略剔除掉。
4、博弈的分类 博弈的分类可以从三个角度进行。
经济博弈论
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。
博弈论知识点归纳
博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P,I),其中P为市场价格,I为消费者可支配收入。
2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
博弈的分类名词解释
博弈的分类名词解释博弈论是一门研究决策制定者如何在相互竞争和合作的环境中进行决策的学科。
在博弈论中,博弈被定义为一种涉及多个参与者之间互相影响和干预的决策过程。
根据参与者之间的关系和决策策略的性质,博弈可以被分为不同的类型和分类。
1. 零和博弈零和博弈是一种基于完全对立的博弈形式。
它基于一个假设,即参与者之间的利益是互为相反的。
在零和博弈中,参与者的利益是固定的,一个参与者的收益等于另一个参与者的损失。
经典的零和博弈是“囚徒困境”,其中两个犯罪嫌疑人总是选择背叛对方。
2. 非零和博弈非零和博弈是一种关注参与者利益可以共同增长的博弈形式。
在非零和博弈中,参与者之间的利益可以是互补的,即一个参与者的收益不一定会导致另一个参与者的损失。
这种类型的博弈通常涉及合作和协调,以实现共同的利益。
例如,多家公司在一个市场上进行价格竞争,同时也可以通过合作和协商来提高整个市场的利益。
3. 合作博弈合作博弈是一种参与者通过合作和协商来共同获取利益的博弈形式。
在这种博弈中,参与者可以一起讨论并达成共识,以实现最优的决策结果。
合作博弈通常需要建立持久的关系和互信,并强调参与者之间的联合行动。
合作博弈最常见的应用是在商业合作和联盟中,例如公司合并和合作项目。
4. 非合作博弈非合作博弈是一种参与者在缺乏合作和协商的情况下进行决策的博弈形式。
在非合作博弈中,参与者之间的利益是独立和自私的,他们追求个人最优化的决策。
这种博弈通常涉及竞争和对抗,参与者之间缺乏互信和合作。
经典的非合作博弈是“囚徒困境”,其中两名囚犯在没有沟通的情况下做出决策。
5. 完全信息博弈完全信息博弈是一种参与者在决策过程中拥有全面信息的博弈形式。
在这种博弈中,每个参与者都了解其他参与者的策略和利益,并能够进行理性的决策。
完全信息博弈在理论上较容易分析和求解,因为所有决策因素都是已知的。
然而,在实际情况中,完全信息博弈很少存在。
6. 不完全信息博弈不完全信息博弈是一种参与者在决策过程中不拥有全面信息的博弈形式。
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
博弈论 类型
博弈论(Game Theory)是一种研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略,而实施对应策略的学科。
它也被称为对策论或赛局理论,是研究具有斗争或竞争性质现象的理论和方法。
它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用。
根据决策行为的时间序列,博弈可以分为静态博弈和动态博弈。
静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
博弈论有很多类型,其中一些常见的类型包括:1. 合作博弈和非合作博弈:合作博弈是指参与者之间可以通过协商和合作来达到共同的目标和利益,而非合作博弈则是指参与者之间无法进行协商和合作,各自追求自己的利益最大化。
2. 静态博弈和动态博弈:静态博弈是指在同一时间点上,所有参与者都做出自己的决策,而动态博弈则是指在不同时间点上,参与者依次做出自己的决策。
3. 完全信息博弈和不完全信息博弈:完全信息博弈是指所有参与者都拥有完全相同的信息,而不完全信息博弈则是指某些参与者拥有比其他参与者更多的信息。
4. 零和博弈和非零和博弈:零和博弈是指所有参与者的收益总和为零,即一方得益必然导致另一方受损,而非零和博弈则是指所有参与者的收益总和不为零,即各方得益可以相互抵消。
此外,根据纳什定理,任何具有有限纯策略的二人博弈至少有一个均衡偶。
在经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科中,博弈论都有广泛的应用。
博弈论的应用范围非常广泛,它可以帮助人们理解各种复杂的经济现象,例如市场交易、企业竞争、金融投资等。
同时,它也可以用于研究政治、军事、社会等领域中的各种问题,例如国家之间的战争、企业之间的竞争、社会问题的解决等。
在经济学中,博弈论被广泛应用于市场机制设计、公共品分配、税收制度等领域。
博弈
博弈博弈论是二人或多人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜目标的理论。
博弈论是研究互动决策的理论。
博弈可以分析自己与对手的利弊关系,从而确立自己在博弈中的优势,因此有不少博弈理论,可以帮助对弈者分析局势,从而采取相应策略,最终达到取胜的目的。
博弈的类型分为:合作博弈、非合作博弈、完全信息博弈、非完全信息博弈、静态博弈、动态博弈,等等。
现代博弈论的发展数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。
现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
从而揭示了博弈均衡与经济均衡的内在联系。
纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。
早在20世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯·诺伊曼已经开始研究博弈的准确的数学表达,直到1939年,冯·诺依曼遇到经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern),并与其合作才使博弈论进入经济学的广阔领域。
1944年他与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。
尽冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。
纳什是继冯·诺依曼之后最伟大的博弈论大师之一。
他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。
编辑本段博弈分类博弈分为静态博弈和动态博弈。
博弈论
第一章1、1944年,诺依曼和摩根斯坦合著的《博弈论与经济行为》标志着现代博弈论的正式诞生。
2、博弈四要素:.参与人或局中人(player)、行动(action)或者策略(strategy)、次序(order)、得益或者支付(payoff)。
3、博弈分类:按局中人数量分类可以分为单人博弈、两人博弈、多人博弈。
按局中人行动顺序分类可以分为静态博弈、动态博弈、重复博弈。
按局中人对得益的了解情况分类可以分为完全信息博弈、不完全信息博弈。
四大类博弈类型:静态动态完全信息完全信息的静态博弈完全信息的动态博弈不完全信息不完全信息的静态博弈不完全信的动态博弈按信息完美性分类:完美信息博弈、不完美信息博弈。
完美性信息:指动态博弈过程中面临决策的局中人对博弈进行迄今的所有信息完全了解。
按得益种类分类:零和博弈、非零和博弈、常和博弈、非常和博弈或变和博弈按局中人相互关系分类:合作博弈、非合作博弈。
第二章1、纳什均衡:设s* (s1* , s2* ,..., sn* )是n人博弈G={S1, …, Sn;u1, …, un}的一个策略组合。
如果对于每个局中人i,ui (s1*,, si*1, si*, si*1,, sn* ) ui (s1*,, si*1, si , si*1,, sn* )即对于所有si∈Si都成立,则我们称策略组合s*是该博弈的一个纳什均衡。
纳什定理:在一个有n个博弈方的博弈G={S1,…,Sn; u1,…,un}中,如果n是有限的,且Si都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
奇数定理:几乎所有有限同时博弈的纳什均衡的数目有限,并且是奇数。
2、上策策略:在一个博弈中,如果不管其他局中人选择什么策略,一局中人的某个策略给他带来的得益始终高于其他策略,至少不低于其他策略。
如果该策略始终高于其他策略,称严格上策策略,否则称弱上策策略。
如果一个博弈中的某个策略中的所有策略都是各个博弈方的上策,那么我们称这样的策略组合为该博弈的一个“上策均衡”。
博弈论基本概念
(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。
(2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。
他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。
(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(5)得失(payoffs):一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。
(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。
在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
所谓纳什均衡,它是一稳定的博弈结果。
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息和行动特点
均衡
均衡类型
特别均衡
求解方法
学过的例子
性质
完全信息静态博弈
每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。
纳什均衡
纯战略纳什均衡(PNE)
占优战略纳什均衡(DSE)
无限次重复困境(冷酷战略)
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
贝叶斯纳什均衡
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。
在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。
子博弈精炼纳什均衡
子博弈精炼纳什均衡
有限次重复博弈均衡
与纳什均衡的唯一性有关
连锁店悖论
1、均衡结果是原博弈的Nash均衡;
2、同时在每一个子博弈上构成Nash均衡
箭头法
划线法
Hotelling价格竞争
库诺特价格竞争
多重性和存在性
重复剔除的占有均衡(IFDE)
不断剔除劣战略(弱劣战略的剔除顺序会影响均衡结果
一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈
混合战略纳什均衡(MNE)
聚点均衡
支付最大化法
支付等值法
社会福利博弈
小偷-守卫博弈
完全信息动态博弈