十大经典博弈论模型
博弈论模型解析决策者理性选择与策略
博弈论模型解析决策者理性选择与策略博弈论是一种研究决策者在相互依赖环境下进行决策的数学模型。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
本文将介绍博弈论的基本概念,并解析决策者的理性选择和策略。
首先,我们来了解博弈论中的一些重要概念。
博弈论主要研究的是决策者的互动关系,其中包括决策者、策略和支付。
决策者是参与博弈的个体,可以是个人、组织或国家等。
策略是决策者进行决策的行动或方案。
支付是决策者从策略中获得的效益或成本。
决策者在博弈过程中会根据自己的利益和对其他决策者行为的预测来选择最优策略。
决策者在选择策略时通常会考虑以下几个因素:自己的利益、对手的选择、对手的动机以及对手有关信息的了解程度。
理性决策者会选择能够最大化自己效益的策略。
决策者的理性选择基于博弈论中的均衡概念。
博弈论中的均衡是指决策者在相互依赖环境下做出的稳定决策。
常见的均衡概念包括纳什均衡、次序均衡和完全均衡等。
纳什均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者无法通过改变自己的策略来获得更大的效益。
次序均衡是指在博弈中,决策者的行动顺序是合理的,每个决策者的策略是对先前决策者行动的响应。
完全均衡是指在博弈中,每个决策者都已经做出了最优选择,并且其他决策者对这些最优选择的预期与实际情况相符。
博弈论的最经典模型是囚徒困境。
囚徒困境是指两个犯罪嫌疑人之间的博弈,他们可以选择合作或背叛。
如果两人都选择合作,则会得到较轻的刑期;如果两人都选择背叛,则会得到较重的刑期;如果其中一人选择合作而另一人选择背叛,则背叛者会得到零刑期,而合作者会得到较重的刑期。
在囚徒困境中,每个囚徒都会选择背叛,因为他们认为对方也会选择背叛,这样才能避免得到较重的刑期。
然而,如果两人能够相互合作,他们将会得到较轻的刑期。
除了囚徒困境,博弈论还可以应用于许多其他领域。
例如,企业之间的价格竞争、国家之间的军备竞赛以及拍卖等都可以通过博弈论模型进行分析。
博弈论究竟讲什么?一文读懂11种经典博弈论模型
博弈论究竟讲什么?一文读懂11种经典博弈论模型先说一个小故事:美国第34任总统艾森豪威尔,在他年轻的时候,有一次吃过晚饭后他跟家人一起玩纸牌,一连六盘,他拿到的都是最坏的牌。
于是他变得不高兴起来,嘴里开始不停地埋怨。
他的母亲停了下来,对他说道:“如果你要继续玩下去,就不要埋怨手中的牌怎么样。
不管怎样的牌发到手中,你都得拿着。
你唯一能做的就是尽你所能,打好手里的每一张牌,求得最好的结果。
”在城主的上一篇文章中,谈到了德鲁克在《创新与企业家精神》中提到的几种竞争战略,制定战略的过程是决策的过程,推进战略落地则是执行的过程。
无论是决策还是执行,其本质都是一次次博弈的组合。
那么,究竟什么是博弈?大到国与国之间的制衡,小到一个人的一生,博弈都是无处不在,无论是商业竞争中,还是日常工作中,生活中,甚至子女教育,两性爱情。
因为每个人都在时时刻刻想着与他人竞争,每时每刻都把自己放在局中人的位置上。
这就是俗话说的“人生如戏,戏如人生”,充分运用游戏规则,做好自己人生的演员,就是博弈思维能力的体现。
专门研究相互依赖、相互影响的人群,其理性决策行为及这些决策的均衡结果的理论,就是博弈论。
博弈是有技巧的,博弈论的主体则是规定的若干博弈模型,通俗的说就是人们常说的“套路”。
但博弈论是严肃的科学,如果有人非要像剥洋葱一样地剥开博弈思维,看看各种博弈技巧的核心是什么,那么他将会看到两个字——理性。
从博弈论衍生出来的博弈思维,体现了人的理性思维,也就是说我们的任何结果均是采取某种决策和行动的结果。
这体现了博弈思维奉行的“因果论”,正所谓“种瓜得瓜,种豆得豆”。
想要得到理想的结果,除了依靠我们的理性分析,采取正确的决策,并付诸行动外,别无他法。
正因为博弈思维是一种理性思维,所以冲动是魔鬼,更是博弈思维的大敌。
这里,我们要认清“理性”的几个误区。
1.理性的人一定是自利的,但世界上又有多少纯粹的“大公无私”呢?2.理性和道德不是一回事,在追求的自利的同时,产生出来的利他才有可能持久。
经典博弈论模型
经典博弈论模型
博弈论是一门研究决策策略的学科,也是一种数学方法,涉及到多个参与者之间的相互作用。
在博弈论中,每个参与者都会根据自己的利益来做出决策,同时必须考虑其他参与者的决策。
经典博弈论模型包括一些常见的策略和规则,其中最基本的是零和博弈。
在零和博弈中,每个参与者的互动关系类似于赢家通吃的形式,即一个人的利润等于另一个人的损失。
零和博弈的典型例子是两个人玩扑克牌,他们的利益总和为零。
除了零和博弈,还存在非零和博弈。
在非零和博弈中,参与者可以通过合作而获得共同的利益,因此不是每个人都赢或每个人都输。
一个非零和博弈的例子是两个公司进行竞争,虽然他们都想赢得市场份额,但他们可能会达成某些协议来共同获得更大的市场份额。
最著名的博弈论策略是纳什均衡,它是一种理论概念,指出在博弈中参与者的所有决策产生的结果都是最优的。
在纳什均衡中,每个参与者都会假设其他参与者采取的是最优策略,并基于此做出自己的决策。
除了纳什均衡,还有其他一些重要的决策规则。
例如,最小最大原则,参与者会选择一种策略,使得他们的最小利润等于其他参与者的最大利润。
这种情况通常发生在两个竞争对手面临一项业务或项目时。
此时,两个对手可能会选择不退出,而是尝试尽可能给对方带来最小的收益。
博弈论在许多领域都有广泛的应用,包括经济学、政治学、心理学和计算机科学等等。
它可以帮助人们更好地理解人类决策过程,以及如何在许多不同的情况下做出最优的决策。
掌握博弈论的基础知识将使我们更好地理解并解决日常生活和工作中的问题。
博弈论3-4经典动态博弈模型
3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。
21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。
Q max 为不至于使价格降到亏本的最大限度的产量。
Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
1 、第二阶段厂商2的选择目标:得益最大化。
求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
2 、第一阶段厂商1的选择。
用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。
将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。
3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。
博弈论模型
非零和博弈
非零和博弈是一种非合作下的博弈,博弈中各方 的收益或损失的总和不是零值,它区别于零和博弈。 在这种状况时,自己的所得并不与他人的所失 的大小相等,连自己的幸福也未必建立在他人的痛 苦之上,即使伤害他人也可能“损人不利己”,所 以博弈双方存在“双赢”的可能,进而合作。 譬如,在恋爱中一方受伤的时候,对方并不是 一定得到满足。也有可能双方一起能得精神的满足。 也有可能双方一起受伤。通常,彼此精神的损益不 是零和的。 智猪博弈就是非零和的矩阵博弈。
智猪博弈模型
“智猪博弈”故事给了竞争中的弱 者(小猪)以等待为最佳策略的启发。如 股市上等待庄家抬轿的散户;等待产 业市场中出现具有赢利能力新产品、 继而大举仿制牟取暴利的游资。。。
思考:如何认识小猪“搭便车”现象?
零和博弈
零和博弈又称“零和游戏”,与非零和博 弈相对,是博弈论的一个概念,属非合作博 弈,指参与博弈的各方,在严格竞争下,一 方的收益必然意味着另一方的损失,博弈各 方的收益和损失相加总和永远为“零”。双 方不存在合作的可能。
“零和游戏”的基本内容:游戏者有输 有赢,一方所赢正是另一方所输,游戏的总 成绩永远是零。
纳什均衡——非合作博弈均衡
图中红点为鞍点,或者称为一个Nash均衡
纳什均衡—— 非合作博弈均衡 Diagram
甲
纳什均衡
乙
在一个博弈过程中,无论对方的策略选 择如何,当事人一方都会选择某个确定 的策略,则该策略被称作支配性策略。 如果两个博弈的当事人的策略组合分别 构成各自的支配性策略,那么这个组合 就被定义为纳什均衡。
大猪 小猪
智猪博弈模型
食物 出口
智猪博弈模型
博弈论经典案例
博弈论经典案例1. 恶魔的游戏 (Devil's game)这是一种博弈论的思想实验,假设有两个玩家 A 和 B 同时选择一个数字,如果两个数字相等,则 A 赢;如果两个数字不相等,则 B 赢。
问题在于,无论 A 和B 怎样选择,是否存在一种策略,使得 A 有必胜的把握?答案是不存在这样的必胜策略。
因为无论 A 和 B 怎样选择,都有 50% 的概率两个数字相等,这个概率不受选择策略的影响。
所以,这个游戏是一个“随机游戏”,任何一方都没有必胜策略。
2. 囚徒困境 (Prisoner's dilemma)囚徒困境是最著名的博弈论案例之一。
在这个游戏里,有两个人被抓住了,被判处各自坐牢20 年。
检察官给他们一个选择:如果两个人都认罪,那么各坐8 年;如果其中一个人认罪,而另一个人不认罪,那么认罪的人不用坐牢,而不认罪的人要坐 30 年;如果两个人都不认罪,那么各坐 20 年。
问题在于,两个人应该做什么选择才能最大化自己的利益?这个游戏的特殊之处在于,两个人之间的合作可以带来更大的利益,但是他们又互相不信任。
如果两个人都认罪,那么他们的利益是最小的,但是这么做可以避免另一个人的背叛,因此是一种安全策略。
如果两个人都不认罪,那么他们的利益也不是最大的,因为他们错失了合作的机会。
最终,由于信任问题,两个人可能会都选择认罪,而得到不太理想的结果。
3. 鸽子和猫 (Pigeon and Cat)这是一个有趣的案例。
假设有一个狭长的走廊,有一只鸽子和一只猫在两端等待。
如果鸽子朝左走,那么猫就会朝右走;如果鸽子朝右走,那么猫就会朝左走。
如果两只动物在同一个地方相遇,那么鸽子就会被吃掉。
问题在于,这个走廊有多长时,鸽子才有足够的概率逃脱?答案是 2/3。
如果走廊长度小于等于 2/3,那么猫可以直接守在鸽子的对面,而鸽子无法逃脱。
如果走廊长度大于 2/3,那么猫不得不冒着追错方向的风险前进,这就给了鸽子逃脱的机会。
3.4经典动态博弈模型
3.4.3委托人—代理人理论
考虑最简单的一类委托代理问题——不存在 不存在 考虑最简单的一类委托代理问题 监督的委托代理模型 即代理人的产出是努力程度的确定性函数, 即代理人的产出是努力程度的确定性函数, 委托人可以根据成果掌握代理人的工作情况 博弈过程如下: 博弈过程如下:第一阶段委托人选择委托或 不委托,如果委托, 不委托,如果委托,第二阶段代理人选择是 否接受,如果接受则进入第三阶段, 否接受,如果接受则进入第三阶段,选择是 否努力工作。 否努力工作。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价(Bargaining)博弈 3.4.4 委托人—代理人理论
3.4.2 劳资博弈
里昂惕夫(Leontief)1946年提出了一个分别 年提出了一个分别 里昂惕夫 代表劳资双方的工会和厂商之间的博弈 模型假设工人工资完全由工会决定, 模型假设工人工资完全由工会决定,而厂 商则根据工会要求的工资高低决定雇佣工 人的数量 工会所代表的劳动力方效用是工资率和雇 佣人数的函数, 佣人数的函数,即 u = u( W, L)
3.4.3 讨价还价(Bargaining)博弈
该模型有许多原型:利润分割、债务纠纷, 该模型有许多原型:利润分割、债务纠纷, 或财产继承权的争执。第一、 或财产继承权的争执。第一、第二回合相当 于纠纷的各方以不同形式调解的过程, 于纠纷的各方以不同形式调解的过程,而第 三回合则相当于最后提交各司法或仲裁机构 进行裁决。而消耗系数则相当于经济纠纷中, 进行裁决。而消耗系数则相当于经济纠纷中, 相关各方花费在谈判和诉讼等方面的时间和 金钱代价。 金钱代价。
3.4.3委托人—代理人理论
根据松散程度、委托内容、监督难易等不同, 根据松散程度、委托内容、监督难易等不同, 委托人—代理人关系有多个不同的情况 代理人关系有多个不同的情况, 委托人 代理人关系有多个不同的情况,其 中最为关键的差异是监督的难易。 中最为关键的差异是监督的难易。有些可以 直接从工作成果来监督, 直接从工作成果来监督,比如流水线上的工 人的工作,而有些难以监督,比如:律师、 人的工作,而有些难以监督,比如:律师、 教练等 委托人如何促使代理人的行为符合委托人的 利益,是委托—代理理论的重要课题 代理理论的重要课题。 利益,是委托 代理理论的重要课题。
十大博弈论经典案例
十大博弈论经典案例博弈论是研究冲突和合作行为的数学理论,主要研究各方在一定规则下作出决策的过程。
在现实生活中,博弈论可以帮助我们分析各种决策情境,揭示行为背后的逻辑。
下面介绍十大博弈论经典案例,展示不同情境下的决策策略及其结果。
1. 囚徒困境囚徒困境是博弈论中最著名的案例之一。
两名囚徒被单独关押,检察官给每人下达选择“合作”或“背叛”的指令。
如果两人都合作,各自判刑较轻;如果其中一人背叛而另一人合作,则背叛者判刑为0,而合作者将被重判;如果两人都背叛,两者皆受重刑。
在这种情况下,每名囚徒都会选择背叛,因为无论另一人选择什么,背叛都是最优选择。
2. 霍巴和鲍勃游戏霍巴和鲍勃游戏是研究博弈过程中的信任和合作的实例。
霍巴拥有100美元,可以选择分享给鲍勃一部分;鲍勃可以选择保留所有款项或回馈一部分给霍巴。
如果鲍勃选择合作并分享款项,那么霍巴会获得更多回报;反之,如果鲍勃保留所有款项,霍巴就会损失。
通过这一博弈,可以观察到信任和合作如何影响双方的回报。
3. 石头剪刀布石头剪刀布是一种简单的博弈,展示了不完全信息博弈的情形。
两名玩家同时出示石头、剪刀或布中的一种手势,胜利者根据规则确定。
在这个博弈中,玩家需要考虑对手可能的策略,选择最佳的手势进行应对。
4. 抢手织物抢手织物是关于资源分配的博弈。
多位玩家竞相争夺一种有限资源,但资源数量不足以满足所有玩家的需求。
玩家需要权衡合作和竞争的策略,以最大化自己的利益。
这个案例揭示了在资源有限的情况下,合作和竞争之间的平衡。
5. 拍卖博弈拍卖博弈是在资源分配中常见的情景。
卖家将物品提供给潜在买家,买家通过出价来竞争物品,最高出价者将得到物品。
在这种情况下,买家需要权衡自己对物品的价值以及出价策略,以获得最大的利益。
6. 鸿门宴鸿门宴是中国古代著名的博弈案例之一。
项羽与刘邦在鸿门相会,项羽有机会消灭刘邦,但最终刘邦却逆袭成功。
这个案例揭示了在战略选择上的巧妙和胜负的关键。
人生一定要知道的十大“博弈”!
人生一定要知道的十大“博弈”!“博弈”诞生于20世纪初的美国,目前应用极其广泛。
如果将博弈与生活结合起来,那么生活中每个人如同棋手,其每一种行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。
而“博弈”正是研究棋手们“出棋” 的招数与技巧:如果在形形色色的博弈中,博弈策略运用得正确,你就会“运筹帷幄之中,决胜千里之外便会达到四两拔千斤的效果;”如果;而策略运用得失误不妥,你便会“一招不慎,满盘皆输”。
理性的博弈可以让人面对困难更冷静,面对逆境更自信,面对挫折更清醒。
即使你没有强健的体魄、持久的耐力,但只要运用自己的智慧与生活博弈,那么你一定会战胜困难,走出险境。
下面这十大“博弈”,人生不可不知。
1、囚徒困境:进退两难的抉择人的一生总要面对很多选择,而且在很多时候你都会面临那种让你进退两难的的抉择。
到底何去何从,囚徒困境的博弈虽这里不可能会带给你带来一个明确的答复,但是却能够使你通过这种两难的抉择,引发一种种深深的思考。
因为,背叛与合作并不只是道德与良知的核心,更是利益的化身。
带给你一些博弈论的思维模式以及案例模型,下面就请进入把全世界都带入困境的“囚徒困境”。
2、重复博弈:不是一锤子买卖在博弈论中,按照博弈的次数多少,博弈行为可分为有限次数博弈和无限次数博弈两大类。
所谓无限次数博弈,就是博弈双方会把一个博弈行为重复无限多次。
由于博弈双方都将顾及长远利益,所以双方在博弈中往往会采取尽量与对方合作的态度。
在现实生活中,人与人之间可能会被某种纽带联系在一起,继而使得彼此的关系变得更加长远复杂。
人们经常会说:“低头不见抬头见。
”所说的也正是此种情况。
这样一来,当你与对方进行博弈的同时,又要考虑到事后的情况。
基于这种长期性与复杂性,人们即使是面对“囚徒困境”也很少去选择背叛,因为人们都知道,重复博弈,不是一锤子买卖。
3、斗鸡博弈:狭路相遇的困局曾经的话说某一天,在斗鸡场上有两只好战的公鸡发生遭遇战。
博弈论的经典模型
博弈论的经典模型在自然界和人类社会中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论。
它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。
令人惊奇的是,有三次诺贝尔奖获得者是博弈论研究方面的杰出科学家,他们是1985年获得诺贝尔经济学奖的公共选择学派的领导者布坎南,1994年获奖的美国普林斯顿大学的纳什、塞尔屯、哈桑尼3位博弈论专家以及1995年获奖的理性主义学派的领袖卢卡斯。
博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。
进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维、竞争与合作的模式。
博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。
博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。
博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。
为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和发展了许多博弈模型,比较著名的有三个模型:囚徒困境、"雪堆"博弈和"少数者"博弈模型,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家来了解博弈论及其应用概况。
斗鸡模型斗鸡博弈(Chicken Game).在西方,鸡是胆小的象征,斗鸡博弈指在竞争关系中,谁的胆小,谁先失败。
现在假设,有两个人要过一条独木桥,这条桥一次只能过一个人,两个人同时相向而进,在河中间碰上了。
这个博弈的结果第一种就是如果两个人继续前进,双方都会掉水里,双方丢面子,这是一种组合。
博弈论(第一章)
博弈的表述方法的例题
例:囚徒困境博弈的集合表示:G=((坦白,不坦白), (坦 白,不坦白);(-5,-5),(0,-8),(-8, 0),(-1,-1)) 例:在两个公司竞争出售同一产品的博弈中,两个公司是两 个博弈方,两个公司的各自销售量q1,q2是策略空间,
两个公司的所获利润u1(q1,q2),u2(q1,q2)是得
①用损益矩阵表示 例1:故事齐威王与大将田忌赛马,赛马的规则是这样的,每次 双方各出三匹马,一对一比赛三场,每一场的输方要赔1000斤 铜给赢方,齐威王的三匹马和田忌的三匹马按实力都可以分为 上,中,下三等,但齐威王的上,中,下三匹马分别比田忌的 上,中,下三匹马略胜一筹,由于总是同等次的马进行比赛, 因此田忌都是连输三场。实际上,田忌的上马尽管不如齐威王 的上马,却比齐威王的中马和下马要好,而田忌的中马比齐威 王的下马要好一些。因此,田忌的谋士孙膑为田忌出了个主意, 用自己的下马对齐威王的上马,上马对齐威王的中马,中马对 齐威王的下马。这样,二胜一负,田忌反而能赢齐威王1000斤 铜,试写出其标准式表述。
你能否写出上述问题的矩阵形式?
(3)囚徒困境的应用
③ 假定你是一个公司的采购人员,考虑向两家供应商采 购100万只零件,每只零件的成本为6元。如果你分别 向两家供应商各订购50万只,则每个供应商就会把价 格定在10元。你可以设计一个采购策略,以便在两家 供应商之间制造出囚徒困境的情形,从而给自己带来 好处。如何取定这样的采购政策,并写出其矩阵的表 达形式。同时,考虑你的采购策略的使用条件是什么?
低价
80, 80 100, 20
20, 100 50, 50
(3)囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题,如 果大家都出钱兴办公用事业,所有的人福利都会增加。 问题是,如果我出钱你不出钱,我得不偿失,而如果 你出钱我不出钱,我可以占你的便宜。所以每个人的 最优选择都是“不出钱”,但是这种状态使得所有人 的福利得不到提高。
博弈论的几个经典模型PPT课件
模型三、独立私人价值下的一级密 封拍卖/不完全信息静态博弈
N
高成本
低成本
A
默许
阻挠
A
默许
阻挠
B
B
B
B
进入 不进入 进入 不进入 进入 不进入 进入 不进入
(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)
*贝叶斯纳什均衡
模型二、囚徒困境/非合作博弈
有两个小偷A和B联合犯事、私入民宅被 警察抓住。警方将两人分别置于不同的两个 房间内进行审讯,对每一个犯罪嫌疑人,警 方给出的政策是:如果一个犯罪嫌疑人坦白 了罪行,交出了赃物,于是证据确凿,两人 都被判有罪。如果另一个犯罪嫌疑人也作了 坦白,则两人各被判刑8年;如果另一个犯罪 嫌人没有坦白而是抵赖,则以妨碍公务罪(因 已有证据表明其有罪)再加刑2年,而坦白者 有功被减刑8年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但 可以私入民宅的罪名将两人各判入狱1年。
为个人)他自己的最好策略,还是采用(作为集 体的一员)他们共同的最好策略?前者导致均衡 策略(坦白,坦白),支付为(-8,-8);后者的最 好策略是(抵赖,抵赖),支付为(-1,-1)。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
四,杀鸡给猴看。其实猴子是没有思维的,它们 有一定的群体意识,但没有社会意识,人们关 于它们的故事其实是说人自己的。我们这里也 讲一个猴子的故事……。
博弈论的几个经典模型课件
02
在这个模型中,如果双方都抵赖,则各自获得2年的监禁;如果双方都坦白,则 各自获得3年的监禁;如果一方坦白而另一方抵赖,则坦白的一方获得1年的监 禁,抵赖的一方获得10年的监禁。
03
囚徒困境反映了人类在有限理性和不完全信息下的决策问题。
囚徒困境的策略和最优解
01
02
03
在囚徒困境中,每个参 与者都有两种策略:坦
博弈论的发展趋势和应用前景
发展趋势
随着计算机科学的发展,博弈论在人工智能、机器学 习等领域的应用逐渐增多。同时,博弈论也在生物学 、环境科学、社会学等多个学科中得到广泛应用和发 展。未来,博弈论将继续探索更为复杂和现实的模型 ,以解释和预测更为复杂的行为和现象。
应用前景
博弈论在经济学、政治学、军事等领域有着广泛的应 用前景。例如,博弈论可以帮助理解国际贸易中的策 略行为、国际政治中的权力均衡以及军事战略中的最 优攻击策略等。此外,博弈论也在社交网络分析、市 场机制设计等领域展现出强大的应用潜力。
政治学中的应用
投票悖论
投票悖论是指在某些情况下,多数投票的结 果可能导致无法达成一致意见或产生不合理 的结果。在政治学中,投票悖论被用于探讨 民主制度的缺陷和改进方法。
权力均衡
权力均衡是一种政治博弈模型,它描述了政 治权力在多个参与者之间的分配和转移。在 政治学中,权力均衡被用于分析权力斗争、
政治制度稳定性和政策制定等问题。
纳什均衡模型被广泛应用于市场均衡、产业组织、公共经济学
等领域。
生物学
02
纳什均衡模型也被用于解释生物种群竞争、生态系统平衡等问
题。
社会学
03
纳什均衡模型可以用来分析社会现象,如犯罪、婚姻、教育等
博弈论的几个经典模型
博弈论的几个经典模型
a
2
引言
博弈论的应用领域十分广泛,在经济学、 政治科学(国内的以及国际的)、军事战略问 题、进化生物学以及当代的计算机科学等领域 都已成为重要的研究和分析工具。此外,它还与 会计学、统计学、数学基础、社会心理学以及 诸如认识论与伦理学等哲学分支有重要联系。
博弈论的几个经典模型
a
博弈论的几个经典模型
a
12
博弈的类型
根据参与者能否形成约束性的协议,以便 集体行动,博弈可分为合作性博弈和非合作 性博弈。纳什等博弈论专家研究得更多的是 非合作性博弈。
• 合作性博弈:是指参与者从自己的利益出发 与其他参与者谈判达成协议或形成联盟,其 结果对联盟方均有利;
• 非合作性博弈:是指参与者在行动选择时无 法达成约束性的协议。人们分工与交换的经 济活动就是合作性的博弈,而囚徒困境则是 非合作性的博弈。
博弈论的几个经典模型
a
7
引言
博弈论的出现只有60多年的历史。博弈 论的开创者为诺意曼与摩根斯坦,他们1944 年出版了《博弈论与经济行为》。博弈论天 才纳什(Nash)的开创性论文《n人博弈 的均衡点》(1950)、《非合作博弈》(1951)等 等,给出了纳什均衡的概念和均衡存在定理。 今天博弈论已发展成一个较完善的学科。
第四章 博弈论的几个经典模型
讲授人 谭建国
a
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
博弈论模型——精选推荐
博弈论模型1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,⾮常耐⼈寻味。
“囚徒困境”说的是两个囚犯的故事。
这两个囚徒⼀起做坏事,结果被警察发现抓了起来,分别关在两个独⽴的不能互通信息的牢房⾥进⾏审讯。
在这种情形下,两个囚犯都可以做出⾃⼰的选择:或者供出他的同伙(即与警察合作,从⽽背叛他的同伙),或者保持沉默(也就是与他的同伙合作,⽽不是与警察合作)。
这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警⽅⽆法给他们定罪。
但警⽅也明⽩这⼀点,所以他们就给了这两个囚犯⼀点⼉刺激:如果他们中的⼀个⼈背叛,即告发他的同伙,那么他就可以被⽆罪释放,同时还可以得到⼀笔奖⾦。
⽽他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。
当然,如果这两个囚犯互相背叛的话,两个⼈都会被按照最重的罪来判决,谁也不会得到奖赏。
那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表⾯上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:⾃由。
但他们不得不仔细考虑对⽅可能采取什么选择。
A犯不是个傻⼦,他马上意识到,他根本⽆法相信他的同伙不会向警⽅提供对他不利的证据,然后带着⼀笔丰厚的奖赏出狱⽽去,让他独⾃坐牢。
这种想法的诱惑⼒实在太⼤了。
但他也意识到,他的同伙也不是傻⼦,也会这样来设想他。
所以A犯的结论是,唯⼀理性的选择就是背叛同伙,把⼀切都告诉警⽅,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。
⽽如果他的同伙也根据这个逻辑向警⽅交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。
所以其结果就是,这两个囚犯按照不顾⼀切的逻辑得到了最糟糕的报应:坐牢。
企业在信息化过程中需要与咨询企业、软件供应商打交道的。
在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有⾜够的了解与信任,没有起码的信任做基础,切不可贸然合作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
十大经典博弈论模型
博弈论是一门研究决策者之间互动的学科,其应用范围广泛,涉及到经济、政治、生物学等领域。
在博弈论中,经典博弈论模型是基础和核心,以下是介绍十大经典博弈论模型:
1. 囚徒困境博弈模型
囚徒困境博弈模型是博弈论中最为著名的模型之一,也是最为典型的非合作博弈模型。
该模型主要讲述的是两个囚犯被抓后面临的选择问题,如果两个人都招供,那么都将受到较重的惩罚;如果两个人都不招供,那么都将受到轻微的惩罚;如果一个人招供而另一个人不招供,那么招供的人将受到宽大处理,而另一个人将受到较重的惩罚。
2. 零和博弈模型
零和博弈模型是博弈论中最为简单的模型之一,其特点是参与者之间的利益完全相反,即一方获得利益就意味着另一方的利益受到损失。
在这种情况下,参与者之间的互动往往是竞争和对抗的。
3. 博弈树模型
博弈树模型是一种用于描述博弈过程的图形模型,它可以清晰地展示出参与者在不同阶段的选择和决策,以及每个选择所带来的收益和风险。
4. 纳什均衡模型
纳什均衡模型是博弈论中最为重要的概念之一,它指的是一个博弈中所有参与者都采取了最优策略的状态。
换句话说,如果所有参与者都遵循纳什均衡,那么任何一个人单方面改变策略都将无法获得更多的利益。
5. 最小最大化模型
最小最大化模型是一种解决零和博弈问题的方法,其思想是在所有可能的情况中,选择让对手收益最小的情况,从而实现自己的最大化收益。
6. 帕累托最优解模型
帕累托最优解模型是一种解决多人博弈问题的方法,其核心思想是通过合作和协商,使得所有参与者都能获得最大的收益,而不是只有某个人获得了最大的收益。
7. 博弈矩阵模型
博弈矩阵模型是一种常用的博弈论分析工具,它可以清晰地展示出参与者在不同策略下的收益和风险,从而帮助参与者做出最优决策。
8. 拍卖模型
拍卖模型是博弈论中的一个重要应用领域,其目的是通过竞价的方式,让参与者以最低的价格获得所需的商品或服务。
9. 逆向选择模型
逆向选择模型是一种解决信息不对称问题的方法,其核心思想是通过知道对方的信息,来预测对方的行为和决策,从而做出最优策略。
10. 博弈的演化模型
博弈的演化模型是一种描述博弈过程中参与者策略变化的模型,其主要思想是通过不断的演化和适应,使得参与者的策略越来越接近于纳什均衡。
以上十大经典博弈论模型涉及到了博弈论中的许多基本概念和方法,这些模型在实际应用中有着广泛的应用。
例如,在经济学中,博弈论被广泛用于描述市场竞争和价格博弈;在政治学中,博弈论则被用于描述不同政治实体之间的互动
和影响。
除了以上的十大经典博弈论模型,还有其他一些博弈论模型也具有重要的应用价值。
例如,合作博弈模型、演化博弈理论、重复博弈模型等等。
这些模型的出现和发展,不仅推动了博弈论理论的发展,也为实际问题的解决提供了有效的方法和工具。
总之,博弈论的应用领域非常广泛,其研究成果对于我们理解人类行为和社会现象有着重要的意义。
对于我们个人而言,了解博弈论的基本概念和方法,可以帮助我们做出更加明智的决策,并在复杂的社会环境中更好地适应和生存。