09 10静态博弈及纳什均衡的相关案例
好的纳什均衡例子(一)
好的纳什均衡例子(一)好的纳什均衡什么是纳什均衡?纳什均衡是博弈论中的一个重要概念,指的是在博弈参与者之间形成的一种稳定和平衡的策略选择状态。
在纳什均衡下,任何一个参与者都无法通过改变自己的策略来获得更大的利益。
好的纳什均衡指的是存在多个纳什均衡时,其中某些纳什均衡比其他纳什均衡更为理想。
例子一:囚徒困境囚徒困境是博弈论中最经典的例子之一。
假设有两个犯人,他们因为涉嫌合谋犯罪被捕,警察只有有限的证据。
警察与每个犯人分别进行单独审讯,并给他们提供了合作和背叛两个选项,这两个选项对应于认罪和抵赖。
如果两个人都选择合作,即认罪,则每个人都会被判刑2年;如果两个人都选择背叛,即抵赖,则每个人都会被判刑5年;如果一个人选择合作而另一个选择背叛,则合作的人会被判刑6年,而背叛的人会被判刑1年。
在这个案例中,存在两个纳什均衡:互相背叛和互相合作。
然而,互相合作是更为理想的纳什均衡,因为如果两个人都选择合作,他们的总刑期将会最短,只有2年。
例子二:拍卖拍卖是另一个常见的博弈场景。
假设有两个竞拍者A和B,他们在一个拍卖会上竞价购买一件物品。
物品的最低价格为100元。
竞拍者A知道他的估值是200元,而竞拍者B知道他的估值是150元。
他们每次可以按照一定幅度加价,但不能超过自己的估值。
在这个案例中,存在两个纳什均衡:A出价200元,B不出价;B 出价150元,A不出价。
然而,对于卖家来说,A出价200元,B不出价是更好的纳什均衡,因为这样卖家可以以更高的价格售出物品。
例子三:价格战价格战是市场竞争中常见的博弈情景。
假设有两家公司A和B,它们在同一个市场上销售类似的产品。
它们可以根据自己的利润目标制定价格。
如果两家公司的价格相等,则它们将平分市场份额;如果一家公司的价格比另一家低,则它将获得更大的市场份额。
在这个案例中,存在两个纳什均衡:价格相等和一家公司的价格低于另一家。
然而,价格相等是更好的纳什均衡,因为这样两家公司可以共享更多的市场份额,并且避免因为价格战而导致的利润下降。
完全信息静态博弈及其纳什均衡解
第三章完全信息静态博弈及其纳什均衡解1.完全信息静态博弈定义 3.1.完全信息静态博弈。
完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。
两个特点:(1)静态;(2)完全信息。
完全信息静态博弈例子。
例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。
2.纳什均衡及其判定定义3.2 纳什均衡。
在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,一个策略组合{s1*,s2*,…,s n*},若满足u i(s1*,…,s i*,…s n*)≥u i(s1*,…s i,…,s n*)(i=1…n),则称这个策略组合为{s1*,s2*,…,s n*}为该博弈G的一个纳什均衡。
某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。
特点:(1)每个人没有单独改变策略的动机;(2)局部最优。
纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。
求解纳什均衡的方法:(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。
3.纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,如果n是有限的,且对每个i, S i是有限的,则博弈至少存在一个纳什均衡。
这里的均衡可能包含混合策略均衡。
证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4.混合策略与混合策略的均衡纯策略与混合策略概念。
定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略;而一个混合策略是参与人策略空间上的一个概率分布,一般地,某个人i的策略空间为{s i1,s i2,…,s ik},则参与人i在策略空间上的一个概率分布p i=(p i1,p i2,…,p ik)构成他的一个混合策略,其中p i1+p i2+…+p ik=1。
静态博弈的例子
静态博弈的例子静态博弈是博弈论中的一种重要概念,指的是参与者在做出决策时,没有考虑其他参与者的反应。
本文将以静态博弈的例子为题,列举十个经典的静态博弈,并进行详细分析。
1. 哈密顿与拿破仑的决策假设哈密顿和拿破仑是两个将军,在战场上需要决定是进攻还是撤退。
如果两人都选择进攻,将会导致战争爆发,双方都会受到损失;如果两人都选择撤退,将会保持和平,双方都不会受到损失;如果一个人选择进攻而另一个人选择撤退,进攻的一方将会获得胜利,而撤退的一方将会受到损失。
在这个例子中,每个将军都有两个策略,进攻和撤退,他们的决策会直接影响对方的利益。
2. 罗密欧与朱丽叶的爱情假设罗密欧和朱丽叶是两个相爱的人,他们需要决定是逃离家庭束缚,私奔在一起,还是顺从家庭的安排,与其他人结婚。
如果两人都选择逃离家庭束缚,他们可以在一起,但会面临家庭的反对;如果两人都选择顺从家庭的安排,他们会各自与其他人结婚,但可以维持家庭和睦;如果一个人选择逃离家庭束缚而另一个人选择顺从家庭的安排,他们的关系将会破裂。
在这个例子中,每个人都有两个选择,逃离或顺从,他们的选择会直接影响对方的选择和后果。
3. 竞争对手的广告策略假设有两家竞争对手的公司,它们需要决定在广告上投入多少资金。
如果两家公司都投入大量的资金进行广告,将会导致广告市场的竞争激烈,双方都会获得较少的利润;如果两家公司都不投入资金进行广告,市场将会相对平静,双方都能获得一定的利润;如果一家公司投入大量的资金进行广告,而另一家公司不投入资金进行广告,前者将会获得更多的市场份额和利润。
在这个例子中,每家公司都有两个选择,投入或不投入,它们的决策会直接影响对方的市场份额和利润。
4. 购买农产品的决策假设有两个农民,他们需要决定是将农产品出售给市场还是出售给食品加工厂。
如果两个农民都将农产品出售给市场,市场供应量将会增加,导致产品价格下降;如果两个农民都将农产品出售给食品加工厂,市场供应量将会减少,导致产品价格上升;如果一个农民将农产品出售给市场而另一个农民将农产品出售给食品加工厂,前者将会受到市场竞争的影响,而后者将会获得较高的价格。
通过几个例子理解博弈论与纳什均衡
通过⼏个例⼦理解博弈论与纳什均衡2019/12/18更新,重新叙述⼀下智猪博弈2019/10/28更新,这⾥再举⼀个博弈论的经典例⼦,海盗分⾦问题。
喜欢玩德州扑克的⼈应该都听说过“GTO”这个词。
GTO,即 GameTheory Optimal,翻译成中⽂应该叫做“游戏理论最优化”。
直接翻译过来有点拗⼝,通俗⼀点的解释可以是:在游戏中,你可以采取⼀种最优策略,使得⾃⼰的损失最⼩,同时游戏中的对⼿也必须采取相对应的策略,否则只会扩⼤你的受益。
讲到GTO,就不得不提到博弈论中⾮常著名的⼀个理论:纳什均衡(Nash Equilibrium)。
该理论是由著名的经济学家,博弈论创始⼈,诺贝尔奖获得者约翰·纳什提出的,也就是电影《美丽⼼灵》的男主⾓原型。
该理论是说:在⾮合作类博弈中,存在⼀种策略组合,使得每个参与⼈的策略是对其他参与⼈策略的最优反应。
如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何⼀位参与者来说,单⽅更改⾃⼰的策略不会带来任何好处。
约翰·纳什证明了在每个参与者都只有有限种策略选择,并允许混合策略的前提下,纳什均衡⼀定存在。
上边的解释还是有点拗⼝,这⾥通过⼏个例⼦,更直观的理解⼀下这个理论。
囚犯的困境假设有两个⼩偷A和B联⼿闯⼊民宅盗窃被抓,警⽅将两⼈置于不同的房间进⾏审讯,并给出如下政策:如果⼀个犯罪嫌疑⼈坦⽩并交出了赃物,两⼈都会被判有罪。
如果另⼀个犯罪嫌疑⼈也坦⽩,则两⼈各被判刑8年;如果另⼀个犯罪嫌⼈抵赖,再加刑2年,⽽坦⽩者有功,会被⽴即释放。
如果两⼈都抵赖,偷窃罪证据不⾜,但会因私⼊民宅⽽各判⼊狱1年。
即:表中的数字表⽰A,B各⾃的判刑结果。
博弈论分析中⼀般都⽤这样的表来表⽰。
此时有⼈会觉得双⽅都抵赖就好了,但问题是双⽅被隔离,都会怀疑对⽅会出卖⾃⼰以求⾃保。
两个⼈都会这么想:假如对⽅坦⽩,此时如果我抵赖得坐10年监狱,如果我坦⽩才坐8年监狱;假如对⽅抵赖,此时如果我也抵赖会被判1年,如果我坦⽩可以被释放。
静态博弈的例子
静态博弈的例子静态博弈是博弈论中的一种博弈形式,参与者在制定决策时可以同时获得对手的决策信息。
静态博弈通常用于分析一次性决策的情况,参与者在做出决策之前不了解对手的行动选择。
下面将列举10个静态博弈的例子,以便更好地理解这个概念。
1. 囚徒困境(Prisoner's Dilemma):两名囚犯面临是否坦白的选择。
如果两人都坦白,将获得较轻的判刑;如果两人都保持沉默,将获得较轻的判刑;而如果其中一人坦白而另一人保持沉默,坦白的人将获得减刑而保持沉默的人将受重刑。
2. 博弈论中的“鸽子”和“鹰”问题:两只鸽子同时抢夺食物,如果两只鸽子都不退缩,则会发生激烈的争斗,两只鸽子都会受伤。
如果其中一只鸽子退缩,另一只鸽子将独占食物。
3. 拍卖:多个竞拍者参与一个物品的拍卖,每个竞拍者根据自己的估计价值和对其他竞拍者行为的判断来决定自己的出价。
最高出价者获得物品,但必须支付自己的出价。
4. 价格战:两家公司面临销售产品的价格决策。
如果两家公司都降低价格,将导致价格战,最终可能导致亏损。
如果一家公司降低价格而另一家公司保持不变,前者可能损失市场份额。
5. 考试作弊:两名学生在考试中面临是否作弊的决策。
如果两人都作弊,可能都会被发现并受到处罚;如果两人都不作弊,可能无法取得理想的分数;如果其中一人作弊而另一人不作弊,前者可能会获得更好的分数。
6. 投资决策:两个公司独立地决定是否投资新的项目。
如果两家公司都投资,可能导致市场过度竞争和资源浪费;如果两家公司都不投资,将失去新机会。
如果一家公司投资而另一家公司不投资,前者可能会获得市场份额和更高的利润。
7. 石头、剪刀、布:两个人同时选择石头、剪刀或布。
石头胜过剪刀,剪刀胜过布,布胜过石头。
如果两人出相同的手势,则平局,否则胜者获得奖励。
8. 资源分配:多个参与者竞争有限的资源。
每个参与者都可以提出分配方案。
如果所有参与者都同意一个方案,则该方案被接受并执行。
不完全信息静态博弈的现实例子
不完全信息静态博弈在现实生活中有许多例子。
以下是其中几个:
房地产市场:在房地产市场中,买家和卖家可能对房屋的实际价值有不同的了解。
由于信息不完全,买家和卖家可能会在价格上产生分歧,导致交易的困难。
就业市场:在就业市场中,雇主和应聘者之间可能存在信息不完全的情况。
雇主可能不了解应聘者的全部技能和经验,而应聘者可能不了解雇主的具体需求和工作要求。
这可能导致雇主开出过高的薪资或对应聘者产生误判,影响双方的利益。
保险市场:在保险市场中,保险公司和投保人之间可能存在信息不完全的情况。
投保人可能不了解保险产品的全部条款和细节,而保险公司可能不了解投保人的真实风险状况。
这可能导致保险产品的定价不合理或投保人得不到足够的保障,影响双方的利益。
商业谈判:在商业谈判中,双方可能对对方的底牌和利益诉求不完全了解。
这可能导致谈判陷入僵局或达成不公平的协议,影响双方的利益。
生活中纳什均衡例子
生活中纳什均衡例子
纳什均衡是博弈论中的一个概念,指在双方或多方进行博弈时,
当每个参与者都选择了最优策略后,游戏的结果已经达到了一个稳定
状态。
生活中,我们可以看到很多纳什均衡的例子。
1.超市降价促销:当超市降价促销时,消费者可以选择是抢购或
等待。
如果大多数人都抢购,那么超市就会获得更多的销售额;如果
消费者等待,那么超市可以考虑再次降价吸引消费者购买。
2.交通拥堵:在道路狭窄且车流量大的情况下,司机们可以选择
是慢行还是超车。
如果每个司机都选择了超车,那么道路的拥堵就会
更加严重;如果司机们都选择慢行,那么车流量就会更加平缓。
3.竞拍:在竞拍中,每个竞拍者都会选择自己认为是最高的出价。
如果竞拍者们都认为这个物品的价值很高,那么竞拍的价格就会越来
越高。
如果有人放弃竞拍,价格就会下降,直到达到平衡。
4.恋爱:在恋爱中,每个人都希望自己的感情得到回报。
如果两
个人都对对方很有感情,那么他们就会在一起;如果只有一个人喜欢
对方,那么他们就不会在一起。
这是一个常见的纳什均衡例子。
总之,纳什均衡是在人与人之间相互影响,相互制约下的一种结果。
只有当每个人都选择自己认为最优的策略,才能形成稳定的状态。
纳什均衡例题
纳什均衡的经典案例是“囚徒困境”。
在这个例子里,有两个小偷A和B联合犯事,被警方抓住并分别关在不同的房间里进行审讯。
警方对每个犯罪嫌疑人给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,那么证据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也坦白了罪行,那么两人各被判刑8年。
这个案例中,无论A还是B,最优策略都是坦白。
因为如果A选择坦白,B的最优策略也是坦白;如果A选择不坦白,B的最优策略也是坦白。
反之亦然。
因此,两人的最优策略是一致的——坦白。
这就是纳什均衡的一个体现。
在更复杂的情况下,例如狮群博弈中,总数是奇数和偶数时,狮子的策略会发生变化。
这同样可以通过纳什均衡来解释。
当狮子总数为奇数时,每只狮子都有可能成为狩猎者,因此它们会选择大胆去吃睡着的狮子;而当狮子总数为偶数时,没有狮子会成为狩猎者,因此它们会选择谨慎地不去吃睡着的狮子。
这也是纳什均衡的一个应用。
希望这个例子能够帮助你理解纳什均衡的概念和实际应用。
纳什均衡案例
纳什均衡案例纳什均衡是博弈论中的一个重要概念,由约翰·纳什提出,用于描述博弈参与者之间的一种策略选择状态。
在这种状态下,每个参与者都知道其他参与者的策略选择,并且没有动机单方面改变自己的策略。
纳什均衡是一种稳定状态,当所有参与者都采取最优策略时,任何一方都没有动机改变自己的策略。
下面我们通过一个案例来具体了解纳什均衡的概念。
假设有两家冰淇淋店A和B,它们位于同一条街上,销售的冰淇淋口味和质量都是一样的。
每天下午4点,顾客会同时到两家店购买冰淇淋。
店家可以选择提高或降低价格,而顾客会选择到价格更便宜的店购买冰淇淋。
在这种情况下,我们来分析一下店家的最优策略选择。
首先,我们假设店家A提高了价格,而店家B保持不变,那么顾客肯定会选择到店家B购买冰淇淋,因为价格更便宜。
同理,如果店家B提高了价格,而店家A保持不变,顾客也会选择到店家A购买冰淇淋。
这说明在任何一家店提高价格的情况下,另一家店都会获得更多的顾客。
接着,我们假设店家A降低了价格,而店家B保持不变,那么顾客肯定会选择到店家A购买冰淇淋。
同理,如果店家B降低了价格,而店家A保持不变,顾客也会选择到店家B购买冰淇淋。
这说明在任何一家店降低价格的情况下,另一家店都会失去更多的顾客。
因此,我们可以得出结论,在这种情况下,店家A和店家B都会选择保持自己的价格不变,因为任何一家店单方面改变价格都无法获得更多的顾客,反而会失去顾客。
这种状态就是纳什均衡,即当每个参与者都知道其他参与者的策略选择,并且没有动机单方面改变自己的策略。
通过这个案例,我们可以更好地理解纳什均衡的概念。
在博弈论中,纳什均衡是一种重要的策略选择状态,它描述了参与者之间的稳定状态,当所有参与者都采取最优策略时,任何一方都没有动机改变自己的策略。
纳什均衡的概念不仅在经济学领域有着重要的应用,也在其他领域有着广泛的影响,如政治、生物学等领域都可以看到纳什均衡的身影。
总之,纳什均衡是博弈论中的一个重要概念,通过案例分析可以更好地理解其内涵和应用。
纳什均衡的例子
纳什均衡的例子
纳什均衡是博弈论中一种重要的概念,最早由约翰·福纳什提出。
它描述了在多方参与的竞争中,每个参与者根据其他人的策略选择了一种最优策略,使得再改变个体策略时,其他人已经无法获得更好的结果。
一个经典的例子是“囚徒困境”。
在这个例子中,有两个嫌疑犯被警方逮捕,并被关在不同的监狱。
检察官只有足够的证据起诉他们合谋犯罪,而不能成功起诉单独一个人。
如果两人都保持沉默,不揭发彼此,那么他们只会因为小罪名被判入狱一年。
如果其中一个人选择供出另一个人,而另一个人保持沉默,那么供出者将被免于刑罚,而另一个人将被判处十年监禁。
如果两人都选择供出对方,那么他们将被判处三年入狱。
在这个案例中,每个嫌疑犯面临着两个策略选择:合作(保持沉默)或者背叛(供出对方)。
无论对方选择什么策略,每个嫌疑犯都可以通过背叛来获得更轻的刑罚。
然而,当两人都背叛时,他们的总刑期最长。
这导致了一个纳什均衡:在这个案例中,两人都会背叛,因为无论对方选择什么策略,自己背叛都会获得更轻的刑罚。
这个例子揭示了纳什均衡的重要思想,即每个参与者都在预期其他人的行为的基础上做出最优的决策,以达到自己的最大利益。
纳什均衡在经济学、生物学、国际关系等领域都有广泛的应用,对于分析人类行为和决策提供了有力的理论基础。
十大博弈论经典案例
十大博弈论经典案例1. 约翰·冯·诺伊曼的合作博弈。
约翰·冯·诺伊曼提出了合作博弈的概念,这是一种让参与者通过合作来达成共同利益的博弈形式。
最经典的案例就是囚徒困境,两名犯人被捕,如果他们都保持沉默,那么警察就没有足够的证据定罪,但如果其中一个人选择交待另一个人,那么他可以减轻自己的刑罚,而另一个人将面临更严重的处罚。
这个案例展示了合作博弈中的困境和冲突。
2. 纳什均衡。
约翰·纳什提出了纳什均衡的概念,这是一种在博弈中参与者通过最优化自己的策略来达到一种平衡状态。
经典案例是《美丽心灵》中的情景,两个人面对同一个女孩的选择,他们的最优策略是不知道对方的选择的情况下做出自己的选择,这样才能达到最优的结果。
3. 最优反应原则。
最优反应原则是博弈论中的一个重要概念,它指的是在博弈中参与者根据对手的策略选择自己的最优反应。
一个经典案例是企业之间的价格竞争,如果一家企业降低价格,另一家企业的最优反应可能是跟随降价,但如果两家企业都降价,最终可能会导致双方利润下降。
4. 博弈中的信息不对称。
信息不对称是博弈论中一个重要的概念,它指的是在博弈中参与者拥有不同的信息,这可能会导致不公平的结果。
一个经典案例是二手车市场,卖家通常比买家更了解车辆的情况,这就造成了信息不对称,导致买家很难做出理性的决策。
5. 博弈中的策略与信任。
在博弈中,策略和信任是非常重要的因素。
一个经典案例是国际贸易谈判,各国之间需要通过博弈来确定最优的贸易政策,同时也需要建立信任关系,否则很难达成协议。
6. 零和博弈与非零和博弈。
零和博弈是指参与者的利益完全对立,一方的利益损失就是另一方的利益增加,而非零和博弈则是指参与者的利益可以同时增加。
经典案例是资源的分配,如果资源有限,那么参与者之间的博弈就是零和博弈,但如果资源可以通过合作来增加,那么就可以转变为非零和博弈。
7. 演化博弈论。
演化博弈论是一种研究博弈中策略演化和稳定状态的理论,经典案例是动物群体中的合作行为,通过博弈来解释为什么动物会选择合作而不是竞争,以及合作行为是如何在群体中传播和演化的。
纳什均衡案例
纳什均衡案例纳什均衡是博弈论中的一个重要概念,由美国数学家约翰·纳什提出。
它指的是在博弈过程中,每个参与者都假设其他参与者的策略保持不变的情况下,选择自己的最佳策略。
在这种情况下,每个参与者的策略都是最优的,没有人会因改变自己的策略而获得更好的结果。
纳什均衡的概念在经济学、政治学、生物学等领域都有广泛的应用。
一个经典的纳什均衡案例是《囚徒困境》。
在这个案例中,两个囚犯被捕,但警察缺乏直接证据定罪他们。
如果两人都保持沉默,他们都只会被判刑1年;如果其中一个人供出另一个人,供出的人将免于刑罚,而另一个人将被判刑3年;如果两人都供出对方,他们将被判刑2年。
在这个案例中,每个囚犯都要考虑另一个囚犯的选择来决定自己的最佳策略。
如果对方保持沉默,供出对方将是最优选择;如果对方供出自己,供出对方也是最优选择。
因此,最终的结果是两人都供出对方,导致最坏的结果出现。
另一个经典的纳什均衡案例是《合作博弈》。
在这个案例中,两个玩家可以选择合作或者背叛对方。
如果两个玩家都选择合作,他们将获得较好的回报;如果一个玩家选择背叛而另一个选择合作,背叛的玩家将获得最大的回报,而合作的玩家将获得最小的回报;如果两个玩家都选择背叛,他们将获得较差的回报。
在这个案例中,每个玩家都需要考虑对方的选择来决定自己的最佳策略。
最终的结果是两个玩家都选择背叛,导致最坏的结果出现。
纳什均衡在现实生活中也有许多应用。
比如在市场竞争中,每家企业都需要考虑其他企业的策略来决定自己的最佳策略;在国际关系中,每个国家都需要考虑其他国家的行为来决定自己的最佳行动。
在这些情况下,纳什均衡可以帮助人们理解和预测各种复杂的博弈情况。
总之,纳什均衡是博弈论中的重要概念,它可以帮助人们理解各种博弈情况下参与者的最佳策略。
通过分析每个参与者的选择和利益,可以找到博弈的最优解。
然而,纳什均衡并不一定是最好的结果,有时候参与者可以通过合作和协商来达到更好的结果。
纳什均衡案例
纳什均衡案例
纳什均衡是指博弈论中的一种平衡状态,它是指在博弈中每个参与者都选择了最佳的策略并且没有人愿意改变自己的策略。
下面是几个纳什均衡的案例:
1. 餐馆竞争:假设有两家在同一地区经营相同类型餐馆的商家,他们都可以选择提供更好的餐饮服务或者降低价格来吸引更多的顾客。
如果两家商家都选择提供更好的餐饮服务,那么他们就会处于纳什均衡状态,因为如果其中一家降低价格,顾客可能会前往该店,但是该店会失去利润。
2. 囚徒困境:在这个案例中,两个囚犯被逮捕并被分开审讯。
如果他们都选择拒绝认罪,那么他们将面临较轻的刑罚,但如果其中一个人认罪并作证控告另一个人,那么被控告的人将面临更严重的刑罚。
在这种情况下,如果每个囚犯都选择认罪,那么他们就处于纳什均衡状态,因为即使其中一个人拒绝认罪,他也可能面临更严重的刑罚。
3. 投标竞争:在这个案例中,几个公司竞标一个项目,他们必须决定如何投标以获得合同。
如果所有公司都选择报一个高价,那么他们将失去竞标的机会,但如果所有公司都选择报一个较低的价格,那么获得合同的公司将无法盈利。
在这种情况下,如果每个公司都选择中等价格的投标,那么他们就处于纳什均衡状态,因为这样可以最大限度地获得合同并保持盈利。
- 1 -。
完全信息静态博弈例子(作业)
例1:完全信息静态博弈在银行监管中的应用一、完全信息静态博弈模型的建立(一)博弈的参与人商业银行(监管对象)作为理性经济人,其行为动机是部门、个人利益最大化。
但由于在管理体制、经营方式、技术手段、人员素质、资产质量与外资银行之间存在差距,其经营难度和盈利能力都会受到不利的冲击。
在遵循一定条件下的预期效用最大化的原则下,商业银行有足够的动力进行违规操作,例如私自变动利率或进行不符合政策的违规金融创新,借以获得竞争优势,实现最大化效用。
银监会作为监管者,通过行使行政管理、现场检查、非现场检查以及违规处罚等监管权力,对商业银行的市场准入和退出,日常业务营运等进行指导、监督、管理。
而在目前市场经济没有完善的条件下,无论是现场检查还是非现场检查,都存在监管工作量大,连续性强的特点。
因此,实行严格监管策略有着较高的成本:监管费用增加,监管机构“暗箱”操作增长,创造经济租金使商业银行寻租行为增多,商业银行内部创新能力削弱等等。
监管成本的增加可能会超过市场交易成本。
(二)博弈的假设前提(1)银监会的策略空间为严格监管和宽松监管;(2)银监会在进行严格监管工作时,有成本支出。
当商业银行违规经营时,可采用罚款、取消高级人员资格等措施。
但在商业银行合规经营时,银监会宽松监管会带来收益;(3)商业银行的策略空间是违规经营和合规经营;(4)商业银行合规经营时,无论监管者监管与否,商业银行都将得到自己的正常收益;(5)商业银行违规经营的期望收益是违规所得,其在违规经营中将获得超额利润,但在银监会严格监管的条件下也将付出成本。
注:R1、R2分别是银监会宽松监管,商业银行合规经营的正常收益。
A为银监会采取监管措施所花费的成本;B为银监会在商业银行违规经营情况下,采取宽松监管所遭受的损失;C 为商业银行在违规经营条件下受到严格监管所造成的损失;M为银监会采取宽松监管,商业银行违规经营所获得的超额收益。
其中A,B,C都与M成正相关。
纳什均衡及应用举例-博弈论
n 信息集:参与人在特定时刻有关变量的值的 信息
n Common Knowledge 即共同知识(所有参与 人知道,所有参与人知道所有参与人知道,)
Complete and Perfect ——完全信息与完美信息
0 n 需求大, A不开发, B开发, B为8000万元,A
为0 n 需求大, A不开发, B不开发,都为0 n 需求小, A开发, B开发,AB各为-3000万元 n 需求小, A开发, B不开发。A为1000万元B为0 n 需求小, A不开发, B开发A为0,B为1000万元 n 需求小, A不开发, B不开发,都为0
用水平 n 自然人或团体,如企业、国家、OPEC、EU n 重要的是每个决策主体必须有可供选择的行动或策略
和一个很好定义的偏好 n 而不做决策的被动主体只当作环境参数 n 虚拟参与人:“自然”(nature)作为“虚拟参与人”
(pseudo-player)来处理。这里的自然指决定外生 随机变量的概率分布的机制
n 它是指在一个特定的策略组合下player得到 的确定的效用水平,或者指参与人得到的期 望效用水平。
n 这是player真正关心的东西,是player博弈 后所得利益。
n 他的目标就是在自己可以选择的战略集合里, 选择某个战略以最大化自己的期望效用函数 (v-N-M预期效用函数)。
支付
n 如果有n人博弈,令ui为Player i 的支付(效用 水平),u=(u1,…ui…un)为支付组合payoff profile,
n 两者主要区别是在对博弈结果与博弈进程知识的掌 握情况有差别:
几个博弈案例
⼏个博弈案例⼏个博弈案例1.囚徒困境警察抓住了两个罪犯,但是警察局却缺乏⾜够的证据指证他们所犯的罪⾏。
如果罪犯中⾄少有⼀⼈供认犯罪,就能确认罪名成⽴。
为了得到所需的⼝供,警察将这两名罪犯分别关押防⽌他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和⾯临的选择:如果他们两⼈都拒不认罪,则他们会被以较轻的妨碍公务罪各判⼀年徒刑;如果两⼈中有⼀⼈坦⽩认罪,则坦⽩者⽴即释放⽽另⼀⼈将重判10年徒刑;果两⼈都坦⽩认罪,则他们将被各判8年监禁。
问:两个罪犯会如何选择(坦⽩还是抵赖)?2.智猪博弈(占优战略均衡)猪圈⾥有⼀头⼤猪,⼀头⼩猪。
猪圈的边缘有个踏板,每踩⼀下,远离踏板的投⾷⼝就会落下少量⾷物。
如果是⼩猪踩踏板,⼤猪会在⼩猪跑到⾷槽之前吃光所有⾷物;若是⼤猪踩踏板,则⼩猪还有机会吃到⼀点残羹冷炙,因为⼩猪⾷量⼩嘛。
那么,两头猪会采取什么策略呢?答案是:⼩猪将安安⼼⼼地等在⾷槽边,⽽⼤猪则不知疲倦地奔忙于踏板和⾷槽之间。
办公室⾥也会出现这样的场景:有⼈做“⼩猪”,舒舒服服地躲起来偷懒;有⼈做“⼤猪”,疲于奔命,吃⼒不讨好。
但不管怎么样,“⼩猪”笃定⼀件事:⼤家是⼀个团队,就是有责罚,也是落在团队⾝上,所以总会有“⼤猪”悲壮地跳出来完成任务。
想⼀想,你在办公室⾥扮演的⾓⾊,是“⼤猪”,还是“⼩猪”?(其实⼩猪的决策是明智的,想想同⼀个公司,⼩股东和⼤股东的⾏为。
)3.性别之争(多重纳什均衡)“有⼀对夫妻,丈夫喜欢看⾜球赛节⽬,妻⼦喜欢看肥皂剧节⽬,但是家⾥只有⼀台电视,于是就产⽣了争夺频道的⽭盾。
假设双⽅都同意看⾜球赛,则丈夫可得到2单位效⽤,妻⼦得到⼀单位效⽤;如果都同意看肥皂剧,则丈夫可得到1单位效⽤,妻⼦得到2单位效⽤;如果双⽅意见不⼀致,结果只好⼤家都不看,各⾃只能得到0单位效⽤。
这个博弈的策略式表达如下:丈夫\妻⼦⾜球赛肥皂剧⾜球赛(2,1 ) (0,0)肥皂剧(0,0) (1,2)可以⽤画线法求解该博弈的纳什均衡,均衡结果是(⾜球赛,⾜球赛)和(肥皂剧,肥皂剧)。
静态博弈及纳什均衡的相关案例ppt课件
1 2 q3
20
公地悲剧—— N人囚徒困境
•
对于所有牧民:
q1
R1 (q2
,
q3
)
48
1 2
q2
1 2
q3
q2
R2 (q1,
q3 )
48
1 2
q1
1 2
q3
11 q3 R1(q1, q2 ) 48 2 q1 2 q2
• 均衡解: q1* q2* q3* 24
略空间为Si ={ A,B,C }。
得票最多的项目将被选中,如果没有任何项目得 到多数票,项目A被选中。
36
三人投票博弈
不同项目当选时参与人的支付函数如下:
u1(A)=u2(B)=u3(C)= 2 u1(B)=u2(C)=u3(A)= 1 u1(C)=u2(A)=u3(B)= 0
请找出该博弈的纳什均衡。
3 q3[100 (q1 q2 q3)] 4q3
19
公地悲剧—— N人囚徒困境
• 对于牧民1:
• 目标函数: max 1 q1[100 (q1 q2 q3)] 4q1
1
q1
100
(2q1
q2
q3 )
4
0
•
反应函数:
q1
1 48 2 q2
* 1
* 2
* 3
576
Q* 72 * 1728
21
公地悲剧—— N人囚徒困境
情形2:私人牧场上 支付: private Q(100 Q) 4Q
纳什均衡简单例子
可编辑ppt
8
猜谜游戏等博弈
扑克对色游戏
两人博弈,每人从自己的扑克牌(已抽出大鬼 、小鬼)中抽一张出来,一起翻开。如果颜色一样 ,甲输给乙一根火柴;如果颜色不一样,甲赢得乙 一根火柴。
同理,若储户乙选择提前取款,此时甲的相对 优势策略是选择提前取款;若储户乙选择到期取 款,此时储户甲的相对优势策略也是选择到期取 款。
当一个储户有提前取款的动向,另一个为了自 己的利益不受损失,一定马上跟进,这就导致了 银行挤兑现象的发生。
可编辑ppt
6
三 婆媳关系
婆媳关系一直是家庭中普遍存在的问题,婆媳关系看似 是两个女人之间的游戏,却是现实生活中最常见的一种人际 关系博弈。而婆媳博弈,就是基于直接相互作用的环境条件, 参与者(婆婆和媳妇)依靠他们所掌握的信息,选择各自的 策略(行动),以实现利益最大化和风险成本最小化的过程。 见如下模型:
,荣荣的相对优势策略也会是芭蕾。
即有(羽毛球,羽毛球),(芭蕾,芭蕾)都 分别为一个纳什均衡。这种博弈与欧亨利的小说
《麦琪的礼物》的结果类似。
可编辑ppt
4
二 银行挤兑现象
假定有一个银行,银行的全部资金就是甲、乙这两个 储户的存款。每个储户存了100万元的定期存款,银行拿总 数为200万元的这笔钱去做投资,项目完成投资收回,银行 可以拿出240万元偿还给储户,每个储户都可得到120万元。
可编辑ppt
7
若婆婆选择斗争,根据博弈矩阵,媳妇此时的相对优势 策略也会是斗争,因为婆婆选择斗争之后,媳妇对应的斗 争支付是-3,忍让支付是-4;若婆婆选择的是忍让,根据 相对优势策略媳妇的同样会选择忍让。
好的纳什均衡例子
好的纳什均衡例子纳什均衡是博弈论中的概念,描述了一种博弈参与者在给定其他参与者策略的情况下,无法通过单方面改变自己策略来获得更好结果的状态。
下面我将介绍一个好的纳什均衡的例子。
假设有两个企业A和B,在同一个市场上销售某种商品。
他们可以选择定价高或者定价低两种策略。
下面是他们的收益矩阵:定价高定价低定价高 (5, 5) (0, 6)定价低 (6, 0) (3, 3)在这个例子中,每个元组(a, b)表示企业A选择定价策略a,企业B选择定价策略b时的收益情况。
例如,如果企业A选择定价高(a=定价高),企业B选择定价高(b=定价高),则企业A和企业B的收益分别为5。
我们可以通过分析这个收益矩阵来找到纳什均衡。
纳什均衡是指在给定其他参与者策略的情况下,每个参与者无法通过改变自己的策略来获得更好结果的状态。
首先,我们看到当企业A选择定价高时,企业B的最佳策略是选择定价高,因为收益为5,而选择定价低只能获得3的收益。
同样地,当企业A选择定价低时,企业B的最佳策略也是选择定价低,因为收益为6,而选择定价高只能获得0的收益。
因此,无论企业A选择定价高还是定价低,企业B都会选择定价低。
同样地,企业B的最佳策略也是选择定价低。
如果企业B选择定价高,企业A的最佳策略是选择定价高,因为收益为5,而选择定价低只能获得0的收益。
因此,无论企业B选择定价高还是定价低,企业A都会选择定价高。
综上所述,(定价高,定价低)是这个博弈的纳什均衡。
在这个均衡状态下,两家企业都无法通过改变自己的策略来获得更好的收益。
这个例子展示了纳什均衡的概念和应用。
在博弈论中,纳什均衡是一种重要的分析工具,可以帮助我们理解和预测各种博弈情景下不同参与者的策略选择和结果。
在实际应用中,纳什均衡可以用于分析市场竞争、决策制定、资源分配等各种博弈情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
危险的协调
支付: 支付:
大 大 史密斯 小 -1,-1000 1, 1 2, 2 琼斯 小 -1, -1
单纯战略的NE均衡 单纯战略的NE均衡:(大,大)&(小,小) 均衡: 局中人选择( 局中人选择(小,小)的可能性极大
斗鸡博弈
斗鸡博弈
斗鸡2 斗鸡2 进 进 斗鸡1 斗鸡1 退 -1, 1 0, 0 -3, -3 退 1, -1
结果说明:谁先去踩这个踏板,就会造福全 结果说明:谁先去踩这个踏板, 但多劳却并不一定多得。 体,但多劳却并不一定多得。
智猪博弈 —— 06级学生案例 06级学生案例
有两个同学同住一宿舍 假如甲同学非常爱整洁, 假如甲同学非常爱整洁,看到脏乱不堪的环境就 甲同学非常爱整洁 受不了,必定要动手打扫, 乙同学是个很邋遢 受不了,必定要动手打扫,而乙同学是个很邋遢 的人,对于脏乱的环境没有任何感觉, 的人,对于脏乱的环境没有任何感觉,也从来不 愿打扫。 愿打扫。 这时候,就出现了智猪博弈现象:乙同学的最优 这时候,就出现了智猪博弈现象:乙同学的最优 选择就是等待, 甲同学的最优选择就是打扫 的最优选择就是打扫。 选择就是等待,而甲同学的最优选择就是打扫。
智猪博弈——不对称的 智猪博弈——不对称的N人博弈 不对称的N
参与者:大猪,小猪 参与者:大猪, 战略: 战略: 按,等待
智猪博弈——不对称的 智猪博弈——不对称的N人博弈 不对称的N
小猪
支付: 支付:
按 按 3, 1 7 , -1 等待 2, 4 0, 0
大猪
等待
பைடு நூலகம்
NE均衡:(按 等待) NE均衡:(按,等待) 均衡:(
公共物品供给—— 公共物品供给—— N人囚徒困境
私人物品 private goods
排他性 excludable
可以阻止一个人使用一 种物品 竞争性 rival
一个人使用一种物品会 减少其他人对该物品的使用
公共物品供给—— 公共物品供给—— N人囚徒困境
Club goods
公共物品供给—— 公共物品供给—— N人囚徒困境
三人投票博弈
不同项目当选时参与人的支付函数如下: 不同项目当选时参与人的支付函数如下:
u1(A)=u2(B)=u3(C)= 2 u1(B)=u2(C)=u3(A)= 1 u1(C)=u2(A)=u3(B)= 0
§2.5
纳什均衡案例分析
Case Study
你打算怎么玩这个游戏? 你打算怎么玩这个游戏?
现将100元钱拍卖给大家, 现将100元钱拍卖给大家,各 100元钱拍卖给大家 位互相竞价, 元为加价单位, 位互相竞价,以5元为加价单位, 直到没有人再加价为止。 直到没有人再加价为止。出价最 高者将获得这100元钱。但出价最 高者将获得这100元钱。但出价最 100元钱 者和次高 次高者都要向我支付相当 高者和次高者都要向我支付相当 于出价数目的费用。 于出价数目的费用。
2 2
公地悲剧—— 公地悲剧—— N人囚徒困境
1 1 • 对于所有牧民: q1 = R1 (q2 , q3 ) = 48 − 2 q2 − 2 q3 对于所有牧民: 1 1 q2 = R2 (q1 , q3 ) = 48 − q1 − q3 2 2 1 1 q3 = R1 (q1 , q2 ) = 48 − q1 − q2 2 2
FOC :
96− 2Q== 0 − Q = 48 < Q* public
*
π * = 2304 > π *
public
公地悲剧—— 公地悲剧—— N人囚徒困境
公地悲剧
Tragedy of Commons
private land
common land
结论:公有产权制度下,公共资源被过渡使用。 结论:公有产权制度下,公共资源被过渡使用。
行车的默契
B
left
A
right -1 , -1 1, 1
left right
1, 1 -1 , -1
单纯战略NE 均衡战略: 单纯战略NE 均衡战略:
(左,左)&(右,右)
协调博弈
支付: 支付:
大 大 史密斯 小 -1, -1 1, 1 2, 2 琼斯 小 -1, -1
单纯战略的NE均衡 单纯战略的NE均衡:(大,大)&(小,小) 均衡: 帕累托最优的结果:(大,大)即(2,2) 帕累托最优的结果: 局中人需要在几个纳什均衡结果中选取一个
搭便车 free rider
导致公共物品供给不足。 导致公共物品供给不足。
因此,只能由政府来生产公共产品。 因此,只能由政府来生产公共产品。
06级学生案例 06级学生案例
我国五六十年代人民公社时期农村大集体中存在 磨羊工”现象就是一个囚徒困境的典型例子。 的“磨羊工”现象就是一个囚徒困境的典型例子。 出工时每个人都认为,假如自己认真卖力的干活 出工时每个人都认为, 而别人不卖力,则不划算;因为每个人都这么想, 而别人不卖力,则不划算;因为每个人都这么想, 所以每个人都觉得偷懒是最优的选择。 所以每个人都觉得偷懒是最优的选择。 最终的结果就是大家都“磨羊工”,生产效率相 最终的结果就是大家都“磨羊工” 当低下。 当低下。
• 情形1:公共牧场上 (假设有3个牧民) 情形1 假设有3个牧民) • 支付: π 1 = q1[100 − (q1 + q2 + q3 )] − 4q1 支付:
π 2 = q2 [100 − (q1 + q2 + q3 )] − 4q2
π 3 = q3 [100 − (q1 + q2 + q3 )] − 4q3
猎鹿模型
StagStag-hunting
卢梭( 卢梭(1755),《关于人间不平等的根源及基础 ),《 ), 的讨论》 的讨论》
一群猎人共同猎鹿, 一群猎人共同猎鹿, 如果有一个人分心, 如果有一个人分心,猎 鹿就会失败,因而猎鹿 鹿就会失败, 的成功依赖于每一个人 的共同努力。 的共同努力。
猎鹿模型
StagStag-hunting
N={1,2,……,n }
参与者: 个猎人, 参与者:n个猎人, 战略: 战略:
Si = { 鹿,兔 }, i∈N
OR
猎鹿模型
支付: 支付:
StagStag-hunting
其他猎人 鹿 兔 0, 1 1, 1
鹿 猎人i 猎人i 兔
3, 3 1, 0
单纯战略的NE均衡 单纯战略的NE均衡:(鹿,鹿)&(兔,兔) 均衡: 帕累托最优的结果: 帕累托最优的结果:(鹿,鹿)即(3,3) 现实状况: 现实状况: 往往出现 (兔,兔)
NE均衡: NE均衡:(闯,闯)—— DSE 均衡
价格战 —— 现实中的“囚徒困境” 现实中的“囚徒困境”
商场B 商场B 降价 降价 商场A 商场A 不降价 -5 , 5 3, 3 -3 , -3 不降价 5, -5
NE均衡: 降价,降价) NE均衡:(降价,降价)—— DSE 均衡
囚徒困境案例 —— 06级学生案例 06级学生案例
• 私人牧场上:max (V Q – c Q) 私人牧场上: • 公有牧场上:max (Vqi - c qi ) 公有牧场上:
• 结果: 结果: Q * common > Q * private Q=∑qi
公地悲剧—— 公地悲剧—— N人囚徒困境
• 假设: 假设:
一只羊的价值 一只羊的成本 V=100V=100-Q c=4 Q=∑qi
NE均衡:(不出资,不出资) 均衡:(不出资,不出资) :(不出资
“凡是属于最多数人的公共财产常常是最少受 人照顾的事物。 人照顾的事物。”
公共物品供给—— 公共物品供给—— N人囚徒困境
公共物品的供给: 公共物品的供给:
市场机制条件下,私人不会生产公共物品。 市场机制条件下,私人不会生产公共物品。
斗鸡博弈案例 —— 06级学生案例 06级学生案例
乙同 学
追求
不追求
追求 甲 同 学 不追求
-3,-3
2,-1
-1,2
0,0
排队 —— 现实中的“囚徒困境” 现实中的“囚徒困境”
NE均衡: 插队,插队) NE均衡:(插队,插队)—— DSE 均衡
闯红灯 —— 现实中的“囚徒困境” 现实中的“囚徒困境”
单纯战略的NE均衡 单纯战略的NE均衡:(进,退)&(退,进) 均衡:
斗鸡博弈案例 —— 06级学生案例 06级学生案例
同一宿舍的两个男同学关系相当不错, 同一宿舍的两个男同学关系相当不错,在他们的生活 中出现一位女生,他们两人都对这个女生很有好感。 中出现一位女生,他们两人都对这个女生很有好感。 现在假如两个人同时公开宣布喜欢这个女生并准备去 追求,则他们都觉得很尴尬, 追求,则他们都觉得很尴尬,而且他们的关系也会出 现僵化,这是他们不愿意得到的结果。 现僵化,这是他们不愿意得到的结果。 在这里假定没有哪个同学特别喜欢这个女生, 在这里假定没有哪个同学特别喜欢这个女生,可以不 顾一切,也假定这个女生不是特别偏向哪个男生。 顾一切,也假定这个女生不是特别偏向哪个男生。
NE均衡:(巡逻,不巡逻) NE均衡:(巡逻,不巡逻) 均衡:(巡逻
三人投票博弈
假定有三个参与人(1,2,3)要在三个项目(A、 B,C)中投票选择一个。 中投票选择一个。 三个参与人同时投票,不允许弃权。每个人的战 三个参与人同时投票,不允许弃权。 略空间为S 略空间为 i ={ A,B,C }。 。 得票最多的项目将被选中, 得票最多的项目将被选中,如果没有任何项目得 到多数票,项目A被选中 被选中。 到多数票,项目 被选中。
智猪博弈——不对称的 智猪博弈——不对称的N人博弈 不对称的N
猪圈里有两头猪,一头大猪, 猪圈里有两头猪,一头大猪, 一头小猪。 一头小猪。 猪圈的一边有个踏板,每踩一 猪圈的一边有个踏板, 下踏板, 下踏板,另一边的投食口就会 落下一些食物。 落下一些食物。 如果一只猪去踩踏板,另一只 如果一只猪去踩踏板, 猪就有机会抢先吃到食物。 猪就有机会抢先吃到食物。