博弈论四种博弈类型

合集下载

(完整版)博弈论知识点总结

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述:1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、 决策主体是理性的,最大化自己的收益。

2、 完全理性是共同知识3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。

信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

支付:决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别:1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。

可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。

2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

聊聊四种经典的博弈论模型

聊聊四种经典的博弈论模型

聊聊四种经典的博弈论模型展开全文1、囚徒困境:为什么两个犯人都选择坐牢官差破获了一宗盗窃案,抓住了两名犯罪嫌疑人。

但在审讯过程中,被关在一处的二人始终矢口否认盗窃罪名,说东西不是我们偷的。

为了避免两人达成默契,结成攻守同盟,官差决定对他们进行单独审讯。

官差表示,如果两人中有一人坦白认罪,则可立即释放,另一个不认罪的人判5年徒刑;如果两人都坦白罪刑,则他们将各判2年徒刑。

但还有一种情况,那就是两个人都拒绝坦白,由于缺乏证据,他们只会以扰乱公共场合为名判处3个月拘役。

这就是两名罪犯面临的困境中,他们会做出怎样的选择呢?首先,他们互相之间都不清楚对方是否会坦白,其次,二人都希望将自己的刑期缩至最短。

如此考虑,最终,两名犯人都会选择坦白交代。

上面的案例就是博弈论所说的“囚徒困境”。

犯人们如果彼此合作,可为集体带来最佳利益(刑期最短);但当二人面对同样的情况且不知道对方如何选择时,在理性思考后,双方都会得出相同的结论(坦白交代),以便达到个人利益的最大化。

囚徒困境是博弈论的“非零和博弈”中具代表性的例子,反映的是个人的最佳选择并非是团体的最佳选择。

虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

2、智猪博弈:赢的总是小猪猪圈里有大小两头猪,它们在同一个食槽里进食。

为了保持饲料的新鲜,在远离猪食槽的另一边有一个踏板,大猪或小猪跑过去,每按动一次踏板,投食口就会掉落10个单位的食物。

于是,在大猪和小猪每次进食前,就会形成这样一种局面:如果小猪跑去按踏板,大猪守在食槽边,则大猪小猪吃到的食物比是9:1;反之,如果大猪去按而小猪守在食槽边,则吃食比例是6:4。

如果二猪同时到食槽边,则吃食比是7:3。

这样一来,从纯收益的角度考虑,小猪就更愿意选择在食槽边等待食物落出,因为“等待优于行动”,而大猪只能被迫奔忙在踏板和食槽之间。

上述“智猪博弈”的案例是经济学家的假设论证模型,这个博弈的结果,用经济学视角看待,可以解释为:谁占有更多资源,谁就必须承担更多义务。

《产业经济学》第五章--(博弈1)讲解

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。

博弈论读书笔记

博弈论读书笔记

博弈论-读书笔记
期望越高,失落的机会也就越大。

如果某件事情存在变坏或者导致灾难的可能,那么无论这种可能性多小,最终都会发生。

博弈类型:零和博弈、正和博弈、负和博弈。

零和博弈:一方得到收益的同时,另外一方遭受损失,博弈双方收益和损失总和为零。

正和博弈:一方利益增加,另外一方至少不受损害,整体上得到了增加。

利人利己的双赢局面。

负和博弈:双方存在不可协调的矛盾,互不相让,损失带来的比收益多,两败俱伤,损人不利己。

破窗效应:窗户不是我打破的,别人能打,那我也能打。

麦穗理论:定好标准,什么样算大,什么样算中,什么样算小,理性分析,选择相对算大的目标,才是最优解。

一切决策都是折中,当时的最佳可选方案。

最优策略:尽量选择优势策略。

劣势策略:排除劣势策略。

马太效应:资源越多的人得到越多,资源少的人会失去仅有的。

红白脸策略:唱白脸的人表现咄咄逼人,态度强硬。

唱红脸的人表现态度温和,谦逊有度。

小要求开始,逐步提高要求。

贝勃定律:一种社会心理学效应,简单来说,就是人经历了某种刺激之后,情感情绪会受到很大的影响,第二次施予刺激的时候,反应就没有那么大了。

利用权威提升影响力
不对称竞争优势,田忌赛马。

多劳多得,不劳不得。

国之利器不可以示人;不到万不得已,不亮底牌。

征服大多数人中的重要几个,才会有话语权。

倾听、总结归纳。

博弈论知识点总结

博弈论知识点总结

博弈论知识点总结博弈论是一门研究决策与策略的数学理论,主要涉及博弈参与者之间的冲突、竞争和合作,并通过数学模型和方法来分析博弈参与者的最佳决策和最优策略。

下面是博弈论的一些基本概念和重要知识点的总结。

1. 标准形博弈(Normal Form Game):标准形博弈是博弈论中最常见的形式,参与者同时选择策略,并根据选择产生相应的收益或损失。

标准形博弈由参与者的策略集合、收益函数和参与者的收益组成。

2. 纳什均衡(Nash Equilibrium):纳什均衡是指在一个博弈中,参与者选择的策略组合使得没有任何一个参与者单方面改变自己的策略能够获得更高的收益。

纳什均衡是博弈论的核心概念,用来描述博弈中的稳定状态。

3. 零和博弈(Zero-sum Game):零和博弈是指当其中一个参与者获得了收益,另一个参与者就会产生相应的损失,总收益为零。

在零和博弈中,参与者之间的利益完全相反,他们的决策是对立的。

4. 混合策略(Mixed Strategy):混合策略是指在博弈中,参与者以一定概率选择不同的纯策略。

混合策略在博弈论中用来描述参与者的随机决策,可以通过计算期望收益来确定最优混合策略。

5. 博弈树(Game Tree):博弈树是用来表示博弈过程的树状结构,每个节点代表一个博弈的状态,边代表参与者的策略选择。

博弈树可以用来推导纳什均衡策略和分析博弈过程。

6. 合作博弈(Cooperative Game):合作博弈是指参与者之间可以合作达到更好的结果的博弈形式。

在合作博弈中,参与者通过互相合作,在利益最大化和成本最小化之间进行协商和决策。

7. 非合作博弈(Non-cooperative Game):非合作博弈是指参与者之间独立地做决策,不进行合作和协商的博弈形式。

在非合作博弈中,参与者根据自身利益进行策略选择,涉及策略选择和对手的预测。

8. 进化博弈(Evolutionary Game):进化博弈是将生物进化的概念引入博弈论中的一种模型。

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈

博弈论四种类型之完全信息静态博弈决策需要信息,⼏乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。

完全信息在这⾥指的是每个参与⼈对其他参与⼈的⽀付函数有着完全的了解。

⽽静态指的是同时⾏动的博弈,或者不同时但后⾏动者不知道之前⾏动者的决策。

在完全信息静态博弈中的均衡是纳什均衡。

最典型的例⼦是囚徒困境与智猪博弈。

下⾯就由这两个例⼦展开,并将在博弈论中的⼀些知识点做出介绍。

【囚徒困境】中基于收益矩阵的模型描述如下:【注】博弈中参与⼈只拥有有限个离散性的纯战略供其选择称为离散型策略。

⽽在另外⼀些博弈中,每个参与者的纯策略可以是来⾃连续范围的⼀个数,如⼚商定价,称为连续型策略。

离散型策略静态博弈可以⽤⽀付表来表⽰,如上图。

对于囚徒A与B来说,⽆论对⽅采取什么策略,⾃⼰的策略是“坦⽩”时总是⽐“抵赖”要好些,在两⼈⽆法通信的情况下,两⼈都会选择“坦⽩”。

【优势战略均衡】在这⾥,⽆论对⽅选择什么,“坦⽩”的收益是严格⼤于“抵赖”,所以“坦⽩”是⼀个严格优势策略,对应的“抵赖”则是⼀个劣势策略。

所有⼈都有⾃⼰的优势策略,由此产⽣的优势策略组合是⼀个优势战略均衡。

但是这⾥需要注意的是,双⽅各⾃的优势策略却导致了集体的利益最差,如果两⼈都选择“抵赖”收益将是各⾃-1,但是优势策略下的收益却是-8.囚徒困境反映了个⼈理性与集体理性的冲突。

个⼈的最优选择从社会⾓度看并不是最优的。

社会⽣活中有很多例⼦:公共品的给予,商家的价格战,团队⽣产中的偷懒(三个和尚没⽔喝),⼩学⽣减负越减越重,各国军备竞赛等。

【如何⾛出囚徒困境】如果有可信的承诺或者是惩罚(第三⽅实施),会使两⼈合作,促进集体利益最⾼。

【智猪博弈】智猪博弈的收益矩阵模型如下:在此处,⼩猪有优势与劣势策略,但⼤猪没有,只能根据⼩猪的策略做出最佳应对,⽽⼩猪不会选择劣势策略,因此剔除⼩猪“按”的策略,此时,⼤猪的策略只能为“等”。

【重复剔除劣势战略均衡】严格劣势策略为不管其他参与⼈怎样选择呢策略,参与⼈选择策略A时的收益严格⼩于策略B时的收益。

经济学 博弈论

经济学 博弈论

经济学博弈论
经济学中的博弈论是一个重要的分支领域,它研究的是在多个参与者之间互动决策的情境下,他们可能采取的不同策略以及相应的结果。

博弈论在经济学中有广泛的应用。

下面是一些博弈论的基本概念和常见的博弈类型:
1. 策略(Strategies):参与者在博弈中可选择的行动或决策。

2. 支配策略(Dominant Strategies):一种策略在所有情况下都会产生更好的结果,无论其他参与者选择什么策略。

3. 纳什均衡(Nash Equilibrium):在博弈中,当每个参与者都选择了对自己最有利的策略,并且没有动机单独改变策略时,达到的状态就是纳什均衡。

4. 合作与背叛(Cooperation and Betrayal):博弈中参与者可以选择合作或背叛其他参与者,涉及到合作博弈和非合作博弈的概念。

5. 零和博弈(Zero-sum Game):参与者的利益总和为零,一个人的收益增加意味着其他人的收益减少。

6. 非零和博弈(Non-zero-sum Game):参与者的利益总和不一定为零,可以存在合作使得所有参与者都获益的可能性。

7. 重复博弈(Repeated Games):博弈过程会重复进行多次,参与者的策略可能受到之前行动的影响。

这些只是博弈论的基本概念,实际应用中还有更多复杂的情况和模型。

博弈论在经济学中可以用来分析市场竞争、企业战略、拍卖、资源分配等众多领域。

它对于理解和预测人类行为决策的影响具有重要意义。

博弈论简述

博弈论简述

该条目对应的页面分类是博弈论。

博弈论(Game Theory),也称对策论或竞赛论目录[隐藏]∙ 1 博弈论简介∙ 2 博弈论的发展∙ 3 博弈论的基本概念∙ 4 博弈的类型∙ 5 博弈论的意义∙ 6 博弈论分析∙7 博弈论与纳什平衡o7.1 博弈中最优策略的产生o7.2 合作的进行过程及规律o7.3 艾克斯罗德的贡献与局限性∙8 博弈论与非对称信息博弈论、管理博弈论的比较[1]∙9 博弈论案例分析o9.1 案例一:博弈论在企业人力资本投资中的应用[2]o9.2 案例二:博弈论在企业经营活动的应用策略[3]o9.3 案例三:博弈论在企业管理中的应用[4]∙10 参考文献[编辑]博弈论(Game Theory),博弈论是指研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略,而实施对应策略的学科。

有时也称为对策论,或者赛局理论,是研究具有斗争或竞争性质现象的理论和方法,它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。

目前在生物学、经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。

博弈论图(点击放大)博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

表面上不同的相互作用可能表现出相似的激励结构(incentive structure),所以他们是同一个游戏的特例。

其中一个有名有趣的应用例子是囚徒困境悖论(Prisoner's dilemma)。

具有竞争或对抗性质的行为成为博弈行为。

在这类行为中,参加斗争或竞争的各方各自具有不同的目标或利益。

为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。

比如日常生活中的下棋,打牌等。

博弈论基础知识汇总

博弈论基础知识汇总

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设:参与人追求利润最大化。

博弈的分类名词解释

博弈的分类名词解释

博弈的分类名词解释博弈论是一门研究决策制定者如何在相互竞争和合作的环境中进行决策的学科。

在博弈论中,博弈被定义为一种涉及多个参与者之间互相影响和干预的决策过程。

根据参与者之间的关系和决策策略的性质,博弈可以被分为不同的类型和分类。

1. 零和博弈零和博弈是一种基于完全对立的博弈形式。

它基于一个假设,即参与者之间的利益是互为相反的。

在零和博弈中,参与者的利益是固定的,一个参与者的收益等于另一个参与者的损失。

经典的零和博弈是“囚徒困境”,其中两个犯罪嫌疑人总是选择背叛对方。

2. 非零和博弈非零和博弈是一种关注参与者利益可以共同增长的博弈形式。

在非零和博弈中,参与者之间的利益可以是互补的,即一个参与者的收益不一定会导致另一个参与者的损失。

这种类型的博弈通常涉及合作和协调,以实现共同的利益。

例如,多家公司在一个市场上进行价格竞争,同时也可以通过合作和协商来提高整个市场的利益。

3. 合作博弈合作博弈是一种参与者通过合作和协商来共同获取利益的博弈形式。

在这种博弈中,参与者可以一起讨论并达成共识,以实现最优的决策结果。

合作博弈通常需要建立持久的关系和互信,并强调参与者之间的联合行动。

合作博弈最常见的应用是在商业合作和联盟中,例如公司合并和合作项目。

4. 非合作博弈非合作博弈是一种参与者在缺乏合作和协商的情况下进行决策的博弈形式。

在非合作博弈中,参与者之间的利益是独立和自私的,他们追求个人最优化的决策。

这种博弈通常涉及竞争和对抗,参与者之间缺乏互信和合作。

经典的非合作博弈是“囚徒困境”,其中两名囚犯在没有沟通的情况下做出决策。

5. 完全信息博弈完全信息博弈是一种参与者在决策过程中拥有全面信息的博弈形式。

在这种博弈中,每个参与者都了解其他参与者的策略和利益,并能够进行理性的决策。

完全信息博弈在理论上较容易分析和求解,因为所有决策因素都是已知的。

然而,在实际情况中,完全信息博弈很少存在。

6. 不完全信息博弈不完全信息博弈是一种参与者在决策过程中不拥有全面信息的博弈形式。

博弈论

博弈论

博弈类型及其表述形式1 博弈的分类博弈模型一般分为合作博弈(cooperative game )和非合作博弈(non- cooperative game ),如图1.1。

合作博弈是以单个参与者的可能行动集合为基本元素,而非合作博弈是以参与人群的可能联合行动集合为基本元素(Martin J.Osborne and Ariel Rubinstein ,2000,P2),也就是说,在合作博弈中,博弈中所有参与者都独立行动,不存在有约束力的合作、联合或联盟的关系,而在非合作博弈中,在一些参与者之间存在着有约束力的合作、联合或联盟的关系,并因为这种关系影响到博弈的结局。

合作博弈强调的是团体理性(collective rationality )、效率、公正和公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是低效率或无效率的(张维迎,1996,P5)。

20世纪50年代,合作博弈的研究达到鼎盛期,同时开始出现对非合作博弈的研究,此后,博弈论的研究主流逐步转向在非合作博弈领域。

有些人认为非合作博弈模型比合作博弈更“基本”,但有些人认为两者不相上下(Martin J.Osborne and Ariel Rubinstein ,2000,P2)。

合作博弈,有时也叫做联盟博弈(coalitional game ),一般根据有无转移支付而分为两类:可转移支付联盟博弈(coalitional game with transferable payoff )和不可转移支付联盟博弈(coalitional game with non-transferable payoff )。

可转移支付也叫有旁支付(side payment ),可转移支付联盟博弈假设博弈中各参与者都用相同的尺度来衡量他们的赢得,且各联盟的赢得可以按任意方式在联盟成员中分摊;否则,就是不可转移支付联盟博弈。

图1.1 博弈的分类非合作博弈的分类主要从两个角度进行划分。

博弈论

博弈论

非合作博弈可以得到四种不同的类型: 非合作博弈可以得到四种不同的类型: 完全信息静态博弈------------纳什均衡 完全信息静态博弈------------纳什均衡 完全信息动态博弈论---------子博弈精炼纳什均衡 完全信息动态博弈论---------子博弈精炼纳什均衡 不完全信息静态博弈---------贝叶斯纳什均衡 不完全信息静态博弈---------贝叶斯纳什均衡 不完全信息动态博弈---------精炼贝叶斯纳什均衡 不完全信息动态博弈---------精炼贝叶斯纳什均衡
3、严格劣势策略逐次消除法 --重复剔除的占优策略均衡
首先,找出某参与人的严格劣策略,将它剔除,重 首先,找出某参与人的严格劣策略,将它剔除, 新构造一个不包括已剔除策略的新博弈;然后, 新构造一个不包括已剔除策略的新博弈;然后,继续剔 除这个新的博弈中某一参与人的严格劣策略; 除这个新的博弈中某一参与人的严格劣策略;重复进行 这一过程,直到剩下唯一的参与人策略组合为止。 这一过程,直到剩下唯一的参与人策略组合为止。剩下 的这个唯一的参与人组合,就是这个博弈的均衡解, 的这个唯一的参与人组合,就是这个博弈的均衡解,称 重复剔除的占有策略均衡” 为“重复剔除的占有策略均衡”。 所谓“严格劣策略”是指:在博弈中, 所谓“严格劣策略”是指:在博弈中,不论其他参 与 人采取什么策略,某一参与人可能采取的策略中, 人采取什么策略,某一参与人可能采取的策略中,对自 己严格不利的策略。 己严格不利的策略。 与占有策略相比, 与占有策略相比,重复剔除的占优博弈均衡不仅要 求博弈的所有参与人都是理性的, 求博弈的所有参与人都是理性的,而且要求每个参与人 必须了解所有其他参与人都是理性的。 必须了解所有其他参与人都是理性的。
二、完全信息动态博弈:子博弈精炼纳什均衡 完全信息动态博弈: 1、子博弈精炼纳什均衡 1、子博弈精炼纳什均衡

博弈论

博弈论

ui ( si , s i ) ui ( si , s i ), s i,si si where s i ( s1 , , si 1 , si 1 , , sn ) 即s i S1 Si 1 Si 1 S n
称si*为局中人i的(严格)占优策略
各局中人先后、依次进行选择、行动 后出手者通常能观察到先出手者的选择 策略≠行动
按信息
信息是局中人关于博弈的知识,是实施决策的重要依据 完全信息(Complete Information):没有私人信息
局中人的策略集和支付函数均为共同知识
□ 策略集蕴含了行动集和出手时间
完全信息静态博弈是最简单的一种博弈类型。
中国科学技术大学管理学院 @ 2010
9
矩阵博弈与Maximin解(续)
矩阵博弈的Maximin解:
考虑到对方可能取使己方支付最小的策略(比如:对方通过各种渠道事先窥探 到己方策略),为稳健起见,选择纯策略的原则是:
让最小支付值尽可能大(取最差情况中最好的) ——悲观逻辑、最大最小原则 □ 考虑己方每个纯策略可能带来的最小支付(每行中的最小值) □ 比较这些最小支付,对应于最大的纯策略即为己方所选
对于矩阵博弈A=(aij)m×n,根据稳健的“最大最小原则”
己方Maximin策略: 对方Maximin策略:
i arg max

i{1,, m} j{1,, n}
min aij
1、逐行行内取小 2、小中取大 1、逐列列内取大 2、大中取小
j arg max
j{1,, n} i{1,, m}
合作博弈(Cooperative Game)
部分或全部局中人能够联合,达成一个具有约束力且可强制执行的协议的博弈 类型。 合作博弈强调的是集体理性,强调效率、公正、公平。 通过合作能带来“合作剩余” 合作博弈最重要的两个概念是联盟和分配。

博弈的四种基本类型

博弈的四种基本类型

博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。

例如,囚徒困境。

2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争。

3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈。

4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。

例如,信号传递博弈。

每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。

例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。

完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。

例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。

不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。

例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。

不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。

例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。

博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。

举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。

你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。

二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。

举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。

博弈论 类型

博弈论 类型

博弈论(Game Theory)是一种研究多个个体或团队之间在特定条件制约下的对局中利用相关方的策略,而实施对应策略的学科。

它也被称为对策论或赛局理论,是研究具有斗争或竞争性质现象的理论和方法。

它是应用数学的一个分支,既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构(游戏或者博弈(Game))间的相互作用。

根据决策行为的时间序列,博弈可以分为静态博弈和动态博弈。

静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

博弈论有很多类型,其中一些常见的类型包括:1. 合作博弈和非合作博弈:合作博弈是指参与者之间可以通过协商和合作来达到共同的目标和利益,而非合作博弈则是指参与者之间无法进行协商和合作,各自追求自己的利益最大化。

2. 静态博弈和动态博弈:静态博弈是指在同一时间点上,所有参与者都做出自己的决策,而动态博弈则是指在不同时间点上,参与者依次做出自己的决策。

3. 完全信息博弈和不完全信息博弈:完全信息博弈是指所有参与者都拥有完全相同的信息,而不完全信息博弈则是指某些参与者拥有比其他参与者更多的信息。

4. 零和博弈和非零和博弈:零和博弈是指所有参与者的收益总和为零,即一方得益必然导致另一方受损,而非零和博弈则是指所有参与者的收益总和不为零,即各方得益可以相互抵消。

此外,根据纳什定理,任何具有有限纯策略的二人博弈至少有一个均衡偶。

在经济学、国际关系学、计算机科学、政治学、军事战略和其他很多学科中,博弈论都有广泛的应用。

博弈论的应用范围非常广泛,它可以帮助人们理解各种复杂的经济现象,例如市场交易、企业竞争、金融投资等。

同时,它也可以用于研究政治、军事、社会等领域中的各种问题,例如国家之间的战争、企业之间的竞争、社会问题的解决等。

在经济学中,博弈论被广泛应用于市场机制设计、公共品分配、税收制度等领域。

博弈论-博弈类型

博弈论-博弈类型

3.1:两人博弈和多人博弈多人博弈中合作和对抗此起彼伏,存在着不可避免的矛盾。

如果能够巧妙地运用各方关系,或强强联合,或联弱抗强,或弱弱联合,那么在错综复杂的关系中就能求得生存,甚至能够荣登霸主,这些都需要审时度势。

3.2:零和博弈零和博弈是指博弈一方得到的正是另一方失去的。

在零和博弈中,其实是一场你死我活的争斗,这种博弈是残酷的。

但是,社会越发展,零和博弈存在越少,追求合作和双赢的局面将更多的是我们博弈的追求目标。

凡是零和博弈,博弈的参与者都在竭尽所能地争夺最后的胜利,至于道德等一些无关紧要的东西就已经不再放在心上了。

这种博弈的激烈性和残酷性取决于争夺的资源的稀缺性。

3.3:智猪博弈在这个博弈中,只有小猪有最优策略,而大猪没有。

这个博弈的纳什均衡是大猪选择按按钮,小猪选择等待。

智猪博弈是一个“多劳不多得,少劳不少得”的均衡。

因此在实际博弈中,如果是小猪,实力不够,不要冒险去做事,成功的概率很低,最优策略是等待,等待一头大猪去实践,去按按钮。

在生活中也因此出现了搭载强者得到利益的“搭便车”现象。

这就是弱者小猪的聪明。

3.4:不对称信息动态博弈有时博弈一方为了使其他参与者按照自己的要求行事,会将一些信息泄露出去,如向对方做出什么承诺或提出威胁,这都是在显示信息。

同时,为了误导他人,博弈一方也可能隐藏信息,甚至传递错误信息。

这是这种不对称的信息动态博弈才有了间谍的存在。

不对称信息动态博弈中,先动者本来是不占据多少优势的,因为他的行动已经向后行动者传递了一种信息,这样后行动者的信息会更多,那样他更容易做出选择。

然而,如果先动者能够很好地利用信息的不对称,那么他的不利处境也会因此而扭转。

3.5:斗鸡博弈斗鸡博弈可以解释僵局情况下一方的妥协。

面对僵局,对峙下去可能损失更为惨重,主动退让妥协,虽然有所损失,但总比问题激化的结局要好些。

所谓“好汉不吃眼前亏”,有时“但能容忍且容忍”未必不可取。

3.6:多次博弈多次博弈遏制人们的绝对理性,每一个参与人的行动都是小心翼翼的,因为他们知道不是一次博弈,需要为将来考虑。

博弈论四种类型

博弈论四种类型
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。
在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。
子博弈精炼纳什均衡
子博弈精炼纳什均衡
有限次重复博弈均衡
与纳什均衡的唯一性有关
连锁店悖论
1、均衡结果是原博弈的Nash均衡;
2、同时在每一个子博弈上构成Nash均衡
无限次重复博弈均衡(无名氏定理)
与贴现因子有关
囚徒困境(冷酷战略)
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
贝叶斯纳什均衡
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
ห้องสมุดไป่ตู้不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

华为在阿根廷电信设备市场上的竞争博弈
华为技术有限公司是一家总部位于中国广东省深圳市的生产销售电信设备的员工持股的民营科技公司,经过数十年的发展,成为全球最大的电信网络解决方案提供商,全球第二大电信基站设备供应商,同时也是全球第六大手机厂商,其海外市场的利润占到其总利润的75%。

在华为进入阿根廷电信设备市场之前,阿根廷的电信设备市场由爱立信、阿尔卡特-朗讯以及阿根廷本土设备供应商三家共同分享市场份额,接下来,我们将分析其不同条件下的博弈结果:
1、完全信息情况下的静态博弈
A 、纳什均衡:我们将上述三家公司统称为原有垄断者,华为称为虎视眈眈的潜在进入者,原有垄断者想要保住自己现有的垄断地位,就会想要阻止潜在进入者进入,在这个博弈中,原有垄断者有两种选择:一是进行斗争,打价格战;二是不斗争,默许其进入从而共同竞争,具体的支付矩阵结果表示如下:
原有垄断者
潜在进入
者 进入 不进入根据纳什均衡的定义:好的一组策略。

当潜在进入者选择进入时,原有垄断者的最优选择是不斗争,获得70单位的利润;同样的,原有垄断者选择不斗争的情况下,潜在进入者的最优选择是进入,获得20单位的利润,从而获得一个要求纳什均衡的均衡(进入,不斗争),同理可以得出另一个纳什均衡(不进入,斗争)。

B 、占优策略:现假设华为公司已经获得了阿根廷电信集团的经营许可证,在严格管制情况下二者都不能以低于成本的价格进行价格战,同时禁止出现单一寡头垄断的情形,(各自均有正的利润)在这两种情况下考虑两者是否进行价格战的情况,具体支付矩阵如下所示:
原有垄断者
潜在进入

低价 高价 对于潜在进入者而言,不论原有垄断者是否进行价格战,潜在进入者的占优策略都是进行价格战,因为在原有垄断者定低价时,潜在进入者定低价可以获得额外的20单位利润,在原有垄断者定高价时,潜在进入者定低价可以获得额外的10单位利润,从而确定华为必将进行价格战,在完全信息情况下,原有垄断者会将自己置于潜在进入者的位置进行决策,从而决定自己也要进行价格战,否则会失去更多的利润。

A 情况与实际情况相同,因为根据相关资料显示,华为的研发费用、人力成本等对电信设备价格影响重大的成本仅约为其他竞争者的八分之一,其他竞争者没有能力进行价格战从而阻止华为进入阿根廷电信市场。

B 情况与实际不相符,按照华为在发展中国家的竞争策略,其战略重心并不在于短期的利润,而在于抢夺市场份额,排挤竞争对手,而其竞争对手往往无力在削价竞争中与华为竞争,价格仍然较高。

2、完全信息情况下动态博弈
A 、威胁与承诺:动态博弈指的是参与者的行动有先后,且后行动者可以观测到先行动者的行为,那么完全信息静态博弈A 中支付矩阵需要表示为博弈树形式:
原有垄断者
不斗争 20,70
进入 潜在进入者
斗争 —20,10
不进入 0,200
在潜在进入者做出是否进入电信设备市场时,原有垄断者可以做出威胁,表明他将进行斗争,从而阻止潜在进入者的进入,以维持其市场份额。

但是,从潜在进入者角度看,这一威胁是空头威胁,因为在完全信息情况下,当其决定进入市场时,会判断理性的垄断者不应该进行斗争,否则垄断者会因此少获得60单位的利润;但是这一空头威胁在潜在进入者进入市场前,通过垄断者某些承诺行动情况下会转变成真实可信的威胁,例如发表联合声明,施压政府令其采取不利于潜在进入者的政策等。

现实的情况是垄断者的CEO 多次在公开场合表明自己斗争的决心,并且试图令阿根廷政府拒绝华为更为优惠的投标条件,与此同时,华为进一步降低自身的价格,并通过雇佣更多的本地员工、加大本地采购、积极公关等手段最终在阿根廷电信设备竞标中分得一杯羹。

此博弈为一次博弈,与实际多次博弈的情况不符。

B 、有限次重复博弈
由于电信设备的更新换代需要一段较长的时间,并且其更换和安装都是成批次进行,因此只能把该博弈看成有限次博弈,次数为N ,将完全信息静态博弈B 例子做修改:
原有垄断者
潜在进入
者 低价 高价 对于博弈的双方而言,因为一旦对手定低价就意味着自身的亏损。

当这个博弈有限次重复进行时,我们先站在垄断者角度进行思考:如果竞争对手和我都是理性的,由于我们双方都可以采取以牙还牙策略,因此应该在第N 年才进行低价竞争才是理性的,这样我可以获得最大的利润,并且不用担心对手采取低价进行报复,从而决定除了最后一月定低价,其他时候定高价。

而同样的,进入者也会做同样的考虑,认识到这一点,也会打算在第N 年定低价,同时认为垄断者会准确判断这一结果,采取相同的措施,从而决定从第N -1年就定低价,基于这样的逆序推理到第1次博弈的情况,将得出最终的均衡:两者进行价格战,均定低价。

现实情况是华为拥有其他公司所不具有的优势:是世界500强中唯一一个没有上市的公司,没有短期盈利的压力,可以在某一市场中忍受长达5~6年的每年高达数亿元的亏损,其理性程度十分令人怀疑。

3、不完全信息静态博弈
不完全信息指的是参与者对其对手方的特征、战略空间以及支付函数等情况没有百分百
垄断者低成本的情况
对于垄断者而言,在高成本情况下其最优策略是不斗争,在低成本情况下最优策略是斗争。

与此同时,潜在进入者不具有完全信息,无法准确确定垄断者的成本情况,但是其可以根据相关信息进行推测。

如果进入者认为垄断者是高成本情况的可能性是X,则认为垄断者是低成本可能性为(1-X),选择不进入的期望利润为0,选择进入的期望收益=30*X+(-20)*(1-X),只要进入者认定1>X>0.4,那么他将选择进入,无论原有垄断者做出何种反应。

而垄断者仅仅会严格按照低成本进行斗争,高成本不进行不斗争的原则,从而得出两个贝叶斯均衡。

4、不完全信息动态博弈
假设在此博弈中原有垄断者先采取行动,其在t1(低成本)和t2(高成本)的情况下都可以发出L(较低的价格)和H(较高的价格)两种信号,接收者(潜在进入者)会根据所接受的信号进行判断,从而决定采取U(进入)还是采取D(不进入),具体的信号博弈如下图所示:
对于低成本t1信号而言,其选择L的最低收益200大等于选择H的最高收益200,那么理性的垄断者必将发送信号L而不是信号H,从而使得q=0,也就意味着(H,H)和(H,L)这两种情况不满足精炼贝叶斯均衡的条件;接下来考虑:1、混同于L的情况:在此情况下,为了达到精炼贝叶斯均衡,必须有当t2发送信号H时,接收者一定会选择D,即不进入,转换为数学公式为30*q+50*(1-q)≤100*q+0*(1-q),从而算出该混同精炼贝叶斯均衡为
];2、t1选择L,t2选择H:此时对于发送者而言,其效用[(L,L ),(U,D),p=0.5,q≥5
12
为220,接收者的反应为U,使其效用为50,如果发送者想偏离H而选择L,那么接收者将会选择D,从而使发送者的效用减少120个单位,于是发送者没有动机偏离H,由此又得出一个分离精炼贝叶斯均衡[(L,H ),(U,U),p=1,q=0]。

但是实际的情况更为复杂:1、电信设备的研发需要长期大量的费用支出,其研究成果具有很大的不确定性,风险极高;即使其顺利研发成功,将其市场化也需要面临巨额的前期投入、运营商的认可、下游设备的供应等困难;2、华为虽然在许多领域取得了突破性进展,
甚至遥遥领先于其他竞争对手,但是其最为人所熟知的仅仅是其低廉的价格,在国际上的信誉还有待提高;3、一个国家的电信通讯业的发展,对其自身的安全起到了至关重要的作用,华为企业文化中“狼性”的特点以及不时报道出来的侵犯知识产权,剽窃他人成果,长期低价恶性竞争等负面新闻使得不少国家和市场参与者对华为褒贬不一;4、各国的电信设备领域基本上都是寡头垄断的局面,他们对市场需求的理解,对执政党政策的制定、舆论风向的影响都是巨大的,使得很多问题并不能简单用经济的观点来解释。

因此,我们需要在更多条件的情况下,对华为的市场竞争进行深入的研究。

相关文档
最新文档