(完整word版)博弈论中的几个经典问题

合集下载

博弈论中常见的一些例子

博弈论中常见的一些例子

杨义群经济管理网、杨义群投资理财网博弈论中常见的一些例子1、(夫妻争执问题)一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I 方)要看足球比赛节目,而妻子(记为Ⅱ方)要看戏曲节目.他们新婚燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的.因此,这对夫妻间的争执是一次非零和对策。

2、(entry deterrence市场威慑)设某市场已被Ⅱ方(场内者)占据,现I方(场外者)正在考虑是进去争夺(记为策略I1)还是不进去争夺(记为策略I2),而Ⅱ方相应应考虑的是采取合作共享的态度(记为策略Ⅱ1)还是采取坚决斗争的态度(记为策略Ⅱ2)。

3、(prisoner’s dilemma囚犯困境)设有两个囚犯曾犯过大罪,现因犯小罪而被捕,正分别受警方审讯.这两个囚犯都明白:如果两人都拒不坦白犯过大罪,那么当局只能以当前的小罪而判处1年徒刑;要是两人都坦白犯过大罪,那么当局将判处9年徒刑;如果一人坦白,而另一人拒不坦白,那么坦白者将会立即获得释放,另一个将会被判处10年徒刑。

(北京大学1999年研究生入学考试微观试题) 举出一个你在现实生活中遇到的囚犯两难困境的例子。

4、(两寡头降价竞争)这一模型,在数学结构上,与上例完全相同。

设某一市场上仅有两个寡头,他们分别都可以选择降价与不降价两种策略。

5、(打假)设当局对商品采取查假行动的费用为a万元,查出假货后,罚款为b万元,且销毁的假货成本为c万元;若商人出售假货,而当局不采取查假行动,则商人可额外获利d万元,且社会的进一步损失为e万元。

6、(监督博弈)设税务局查税的费用为a万元,查出逃税后,罚款为b(b>a)万元,纳税人应纳的税金为c万元。

则税务局与纳税人的该两人非零和对策模型的赢得表具体如下。

7、(boxed pigs智猪博弈)设猪圈里有一个按钮与两只猪,大猪与小猪,按一次按钮,就会有10份食品进入,大猪与小猪同时吃的话,将分别能吃到7份与3份,但去按一次按钮,必须耗费a份食品,而且按按钮者,由于耽误了时间,还将少吃到2份食品。

博弈论66个经典例子

博弈论66个经典例子

博弈论66个经典例子博弈论66个经典例子XXX:《博弈论三大经典案例》经典的囚徒困境是博弈论中最为著名的例子之一。

它由XXX和XXX在1950年提出,后来由顾问XXX以囚徒方式阐述,并命名为“囚徒困境”。

在这个困境中,警方逮捕了甲、乙两名嫌疑犯,但是没有足够的证据来指控他们。

警方将他们分开囚禁,并向他们提供以下相同的选择:如果一个人认罪并检举对方,而对方保持沉默,那么这个人将被立即释放,而对方将被判监10年。

如果两个人都保持沉默,那么他们都将被判监半年。

如果两个人都检举对方,那么他们都将被判监2年。

在这个博弈中,每个参与者都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。

参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。

另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

那么,囚徒应该选择哪种策略才能将自己的刑期缩短到最短呢?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

因此,两个理性的囚徒都会选择背叛,这是两种策略中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方都背叛对方,结果二人同样服刑2年。

在博弈论中,智猪博弈是一个著名的例子。

猪圈里有一头大猪和一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮。

按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本。

若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4.在两头猪都有智慧的前提下,最终结果是小猪选择等待。

实际上,小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”或搭便车的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益,而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

博弈论习题答案

博弈论习题答案

博弈论习题答案博弈论习题答案博弈论是一门研究决策和策略的数学分支,它通过分析参与者之间的互动,揭示他们的利益和行为模式。

在博弈论中,常常会遇到各种各样的习题,这些习题旨在让我们思考和解决实际生活中的决策问题。

本文将给出一些常见的博弈论习题的答案,帮助读者更好地理解和应用博弈论的概念。

1. 零和博弈问题零和博弈是指参与者的利益完全相反,一方的收益等于另一方的损失。

考虑以下情景:两个商人A和B在市场上销售相同的产品,他们的利润取决于他们的定价策略。

如果A的定价高于B,那么B将失去一部分市场份额,反之亦然。

假设A和B的收益函数分别为R_A(p_A, p_B)和R_B(p_A, p_B),其中p_A和p_B分别是A和B的定价。

问题是,A和B应该如何定价以最大化自己的利润?答案:由于这是一个零和博弈问题,A和B的利益完全相反。

因此,他们的最佳策略是采取纳什均衡策略。

纳什均衡是指在互动中,没有参与者能够通过改变自己的策略来提高自己的收益。

在这个例子中,纳什均衡定价是使得A和B的利润最大化的定价组合。

通过求解收益函数的偏导数,我们可以找到纳什均衡定价。

2. 合作与背叛在博弈论中,合作与背叛是一个经典的主题。

考虑以下情景:两个犯罪团伙A和B同时被捕,他们面临着与检察官合作还是背叛的选择。

如果两个团伙都选择合作,那么他们将面临较轻的刑罚;如果一个团伙选择合作而另一个团伙选择背叛,那么合作的团伙将面临较重的刑罚,而背叛的团伙将面临较轻的刑罚;如果两个团伙都选择背叛,那么他们将面临较重的刑罚。

问题是,A和B应该如何决策以最大化自己的利益?答案:这是一个经典的囚徒困境问题,合作是最佳策略。

在囚徒困境中,纳什均衡是使得参与者无法通过改变自己的策略来提高自己的收益。

在这个例子中,如果A和B都选择合作,他们将获得较轻的刑罚。

然而,如果一个团伙选择背叛而另一个团伙选择合作,背叛的团伙将获得更轻的刑罚,而合作的团伙将获得更重的刑罚。

博弈论智力题

博弈论智力题

A.逻辑推理2、请把一盒蛋糕切成8 份,分给8个人,但蛋糕盒里还必须留有一份。

3、小明一家过一座桥,过桥时是黑夜,所以必须有灯。

现在小明过桥要 1 秒,小明的弟弟要3 秒,小明的爸爸要6 秒,小明的妈妈要8 秒,小明的爷爷要12 秒。

每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30 秒就会熄灭。

问:小明一家如何过桥?4、一群人开舞会,每人头上都戴着一顶帽子。

帽子只有黑白两种,黑的至少有一顶。

每个人都能看到其他人帽子的颜色,却看不到自己的。

主持人先让大家看看别人头上戴的是什么帽子,然后关灯,如果有人认为自己戴的是黑帽子,就打自己一个耳光。

第一次关灯,没有声音。

于是再开灯,大家再看一遍,关灯时仍然鸦雀无声。

一直到第三次关灯,才有劈劈啪啪打耳光的声音响起。

问有多少人戴着黑帽子?5、请估算一下CN TOWER电视塔的质量。

7、U2 合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。

次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。

手电筒是不能用丢的方式来传递的。

四个人的步行速度各不同,若两人同行则以较慢者的速度为准。

Bono需花1分钟过桥,Edge需花2 分钟过桥,Adam 需花5 分钟过桥,Larry 需花10 分钟过桥。

他们要如何在17 分钟内过桥呢?11、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90 克各一份?13、你有两个罐子,50个红色弹球,50 个蓝色弹球,随机选出一个罐子,随机选取出一个弹球放入罐子,怎么给红色弹球最大的选中机会?在你的计划中,得到红球的准确几率是多少?14、想象你在镜子前,请问,为什么镜子中的影像可以颠倒左右,却不能颠倒上下?16、如果你有无穷多的水,一个3 夸脱的和一个5 夸脱的提桶,你如何准确称出4 夸脱的水?21、假设一张圆盘像唱机上的唱盘那样转动。

博弈论十五道题以及答案

博弈论十五道题以及答案

博弈论十五道题以及答案1.博弈理论在哪些方面扩展了传统的新古典经济学?2.法律和信誉是维持市场有序运行的两个基本机制。

请结合重复博弈理论谈谈信誉机制发生作用的几个条件。

3.经济发展史表明,在本来不认识的人之间建立相互之间的信任关系是经济发展的关键。

为什么?4.在传统社会中,即使没有法律,村民之间也可以建立起高度的信任。

请结合博弈理论解释其原因。

5.在旅游地很容易出现假货,而在居民小区的便利店则很少出现假货,请结合博弈论的相关理论进行解释。

6.你如何理解“Credible threats or promises about future behavior can influence current behavior”这句话的?7.有效的法律制度对经济发展具有什么作用?请结合博弈理论谈谈你的理解。

8.试用博弈理论解释家族企业为什么难以实行制度化管理?9.固定资产投资为什么可以作为一种可置信的承诺?10.以汽车保险为例谈谈因为信息不对称所可能产生的道德风险问题,并提出一种解决道德风险的方案。

11.以公司为例,谈谈所有者与经营者的分离可能产生的道德风险问题。

12.在波纳佩岛上,谁能种出特别大的山药,谁的社会地位就高,谁就能赢得人们的尊敬并可担任公共职务。

请结合信号传递模型谈谈波纳佩岛上的这种奇异风俗。

13.一位男生在女朋友过生日时送给女朋友三百元人民币,他的女朋友往往感觉受到了侮辱。

而他女朋友可能会欣然接受父母亲的现金礼物。

请解释其中可能的原因。

14.<圣经>(旧约)中记载了两个母亲争夺一个孩子的故事。

一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。

所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。

这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。

听罢这位妇人的求诉,所罗门王立即作出最终裁决——婴儿是这位请求不杀婴儿的妇人的,应归于她。

(完整word版)经典的博弈论分析案例——“海盗分金”问题

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。

“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。

在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

假设前提假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?”推理过程从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。

所以,4号惟有支持3号才能保命。

3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。

不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。

由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。

这样,2号将拿走98枚金币。

同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。

由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。

这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。

分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。

分析1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。

博弈论复习题及答案DOC

博弈论复习题及答案DOC

可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位;(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35;画出两企业的损益矩阵求纳什均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

答:(1)用囚徒困境的博弈表示如下表:(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。

若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。

由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡?(2)两厂商合作的结果是什么?答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。

若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。

博弈论03 典型问题2

博弈论03 典型问题2

博弈论智猪博弈智猪博弈智猪博弈说明在市场竞争中,一个占主导地位的大公司和一个较小的竞争对手之间,可能出现同生共存的均衡结局。

能否出现这种均衡,取决于竞争双方对自己在竞争中的地位和做法是否有一个清醒的认识,能否认清自己的真正利益所在,最终避免发生残酷的价格战,两个地位相去甚远的对手达成和平共处的生存模式。

智猪博弈智猪博弈说明在市场竞争中,一个占主导地位的大公司和一个较小的竞争对手之间,可能出现同生共存的均衡结局。

能否出现这种均衡,取决于竞争双方对自己在竞争中的地位和做法是否有一个清醒的认识,能否认清自己的真正利益所在,最终避免发生残酷的价格战,两个地位相去甚远的对手达成和平共处的生存模式。

游戏规则的重要性智猪博弈模型在应用中也不断被改进。

例如有学者认为“小猪躺着大猪跑”的现象是由于智猪博弈的游戏规则所导致的。

规则的核心指标是每次落下的食物量和踏板与食槽之间的距离。

游戏规则的重要性智猪博弈模型在应用中也不断被改进。

例如有学者认为“小猪躺着大猪跑”的现象是由于智猪博弈的游戏规则所导致的。

规则的核心指标是每次落下的食物量和踏板与食槽之间的距离。

游戏规则的重要性智猪博弈模型在应用中也不断被改进。

例如有学者认为“小猪躺着大猪跑”的现象是由于智猪博弈的游戏规则所导致的。

规则的核心指标是每次落下的食物量和踏板与食槽之间的距离。

反用智猪博弈智猪博弈的结论是从小猪立场考虑的最佳选择,认为小猪应耐心等待大猪去踩踏板,才能获得生存发展的机会。

而站在大猪立场上,均衡结果不是理想结果。

如果大猪能运用策略诱使小猪作出有利于大猪自己的决策,学界称为“新智猪博弈”。

反用智猪博弈智猪博弈的结论是从小猪立场考虑的最佳选择,认为小猪应耐心等待大猪去踩踏板,才能获得生存发展的机会。

而站在大猪立场上,均衡结果不是理想结果。

如果大猪能运用策略诱使小猪作出有利于大猪自己的决策,学界称为“新智猪博弈”。

反用智猪博弈智猪博弈的结论是从小猪立场考虑的最佳选择,认为小猪应耐心等待大猪去踩踏板,才能获得生存发展的机会。

《博弈论》知识点总结高中

《博弈论》知识点总结高中

《博弈论》知识点总结高中一、引言博弈论是数学的一个分支,探究的是在多个参与者决策的状况下,参与者之间的最优策略选择。

博弈论不仅在经济学、管理学等社会科学领域有重要应用,而且在生物学、计算机科学、战略决策等领域也有广泛应用。

在高中阶段,我们将进一步了解博弈论的相关知识,精通其基本原理和应用方法。

二、博弈论的基本观点1. 博弈形式博弈形式是博弈双方的策略选择和支付函数的描述。

通常用一个数学模型表示,包括博弈参与者、参与者可实行的策略、以及参与者之间的支付函数。

2. 纳什均衡纳什均衡是博弈论中的核心观点,指的是在一个博弈形式中,全部参与者选择的策略互相一致,没有改变策略的动机。

纳什均衡可以是单一的,也可以是多个同时存在的。

三、经典的博弈论问题1. 帕累托改进帕累托改进是对博弈形式进行改进,使得至少有一个参与者的支付得到提高,而其他参与者的支付不受损。

帕累托改进是为了创设更好的博弈结果,改进策略的选择。

2. 环保囚徒逆境环保囚徒逆境是博弈论中经典的问题之一。

逆境的情境是两名罪犯(囚徒)被抓获,警方没有足够的证据定罪,只能以较轻的罪名裁定,但若果两人都选择供出对方,那么都会得到较重的刑罚。

囚徒之间需要合作做出决策,以达到双方利益的最大化。

3. 博弈矩阵博弈矩阵是一种常见的博弈形式描述方式,用来表示参与者的策略选择和相应的支付函数。

矩阵中的每个元素表示参与者所得到的支付。

通过博弈矩阵可以便利地分析博弈中各个参与者的最优策略。

四、博弈论的应用1. 经济学博弈论在经济学中有广泛的应用,特殊是在市场竞争和战略决策中。

通过分析参与者之间的博弈干系,可以猜测市场行为和做出最优决策。

例如,博弈论可以诠释价格竞争、拍卖机制以及操纵市场策略等经济现象。

2. 生物学生物学中的适者生存和进化问题,也可以用博弈论进行建模和分析。

通过博弈论的方法,可以探究动物群体中的合作与竞争干系,以及基因在群体中的演化。

3. 计算机科学在人工智能和计算机科学领域,博弈论被广泛应用于智能决策和机器进修。

博弈论复习题及答案完整版

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。

2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。

用策略性思维来分析问题,从中找出合理策略,实现目标最优。

3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。

4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。

5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。

每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。

二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。

博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。

2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。

4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。

博弈论题目和参考答案

博弈论题目和参考答案

博弈论题目(参考答案)
题目:
一、两个人分蛋糕,怎么样才可以分得公平?
答案:一个先切,另一个先拿。

二、合伙人在一起做生意,为什么生意做的越好,利润越高,公司做得越大,越容易闹矛盾,甚至分家?
答案:人们对于利益分配的敏感性(收益的期待和对于损失的恐惧)会随着数额的增大而增大。

三、为什么说谈恋爱,陷入的越深,分手的代价越大?
答案:合作的收益和机会成本都会随着时间的推移而不断加大。

合作持续越长彼此投入的时间和机会成本就会越多。

博弈论考试题及答案

博弈论考试题及答案

博弈论考试题及答案一、单项选择题(每题2分,共20分)1. 博弈论中,非合作博弈与合作博弈的主要区别在于()。

A. 参与者是否能够达成具有约束力的协议B. 参与者是否能够沟通C. 参与者是否能够观察到对方的行为D. 参与者是否能够改变规则答案:A2. 在博弈论中,纳什均衡是指()。

A. 所有参与者都采取最优策略,且无法通过单方面改变策略来获得更好的结果B. 至少有一个参与者能够通过改变策略来获得更好的结果C. 所有参与者都采取最差策略D. 至少有一个参与者采取最优策略答案:A3. 囚徒困境中,如果两个参与者都选择合作,那么他们将获得()。

A. 最高收益B. 最低收益C. 次优收益D. 不确定的收益答案:C4. 零和博弈是指()。

A. 所有参与者的收益总和为零B. 所有参与者的损失总和为零C. 参与者之间存在合作的可能性D. 参与者之间不存在合作的可能性答案:A5. 在博弈论中,混合策略是指()。

A. 参与者随机选择策略B. 参与者总是选择最优策略C. 参与者总是选择最差策略D. 参与者总是选择固定策略答案:A6. 博弈论中的“威胁”是指()。

A. 参与者对其他参与者的警告B. 参与者对其他参与者的承诺C. 参与者对其他参与者的请求D. 参与者对其他参与者的命令答案:A7. 在博弈论中,动态博弈与静态博弈的主要区别在于()。

A. 参与者是否能够观察到对方的行为B. 参与者是否能够沟通C. 参与者是否能够改变策略D. 参与者是否能够采取行动的顺序答案:D8. 在博弈论中,完全信息博弈与不完全信息博弈的主要区别在于()。

A. 参与者是否能够观察到对方的行为B. 参与者是否能够沟通C. 参与者是否能够改变策略D. 参与者是否知道所有可能的结果答案:D9. 在博弈论中,公共知识是指()。

A. 所有参与者都知道的信息B. 只有部分参与者知道的信息C. 参与者之间的秘密D. 参与者之间的共识答案:A10. 在博弈论中,帕累托最优是指()。

博弈论习题及解答

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。

例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。

微软面试题经典测试(博弈论经典案例)

微软面试题经典测试(博弈论经典案例)

微软⾯试题经典测试(博弈论经典案例)相信下⾯这个问题很多⼈都见过,博弈论中经典案例--“强盗分⾦”,测试⼀下⾃⼰的逻辑是否正确
五个海盗抢到了100颗宝⽯,每⼀颗都⼀样⼤⼩和价值连城。

他们决定这么分:
抽签决定⾃⼰的号码(1、2、3、4、5)
⾸先,由1号提出分配⽅案,然后⼤家表决,当且仅当超过半数的⼈同意时,按照他的⽅案
进⾏分配,否则将被扔进⼤海喂鲨鱼
如果1号死后,再由2号提出分配⽅案,然后剩下的4⼈进⾏表决,当且仅当超过半数的⼈同
意时,按照他的⽅案进⾏分配,否则将被扔⼊⼤海喂鲨鱼
依此类推
条件:每个海盗都是很聪明的⼈,都能很理智地做出判断,从⽽做出选择。

问题:第⼀个海盗提出怎样的分配⽅案才能使⾃⼰的收益最⼤化?
提⽰:很多⼈认为第⼀个⼈最危险,其实不然,当然这⾥是个理想模型,即所有⼈都为理性⼈。

先思考,参考答案 97 0 1 2 0 或 97 0 1 0 2 详细分析见后⽂。

博弈论复习题及答案

博弈论复习题及答案

博弈论判断题(每小题1分,共15分)1、囚徒困境说明个人的理性选择不一定是集体的理性选择。

(√)2、子博弈精炼纳什均衡不是一个纳什均衡。

(×)3、若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。

()4、博弈中知道越多的一方越有利。

(×)5、纳什均衡一定是上策均衡。

(×)6、上策均衡一定是纳什均衡。

(√)7、在一个博弈中只可能存在一个纳什均衡。

(×)8、在一个博弈中博弈方可以有很多个。

(√)9、在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

(√)10、在博弈中纳什均衡是博弈双方能获得的最好结果。

(×)11、在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

(×)12、上策均衡是帕累托最优的均衡。

(×)13、因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

(×)14、在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。

15、囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

(×)16、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

(√)17、不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

(√)18、多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。

博弈论经典例子(7)欧佩克的合作问题

博弈论经典例子(7)欧佩克的合作问题

欧佩克的合作问题博弈的一方必须主动通过可信的承诺向另一方表示合作的善意,如此才有可能使合作成为多次博弈的均衡解。

一次性的囚徒困境在现实生活中很少达到如此两难的境地,无论是在自然界还是人类社会,“合作”都是一种随处可见的现象。

比如欧佩克石油输出国组织,简称OPEC的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。

OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性的博弈的话,基于个人利益最大化,只会有相互背叛的可能性,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。

但合作的可能性不是必然性,博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去,如果该困境同时涉及多个对手,则要在博弈对手中形成声誉。

并用心地维护这个声誉。

这里可信的承诺并不是什么空口诺言,而是实实在在的付出,所以合作是非常困难的,所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油的产量,每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没有什么影响。

结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失,当然,一些产量增加较少的国家损失更多,于是也大量增产,造成价格进一步下降,结果,陷入一个困境,大家都增加产量,价格下跌,大家再增加产量,价格再下跌。

理论上,几乎所有的基于利益合作的同盟都会遭到失败,原因就在于其协定(类似囚犯的攻守同盟),没有成员有兴趣遵守,那么是不是不可能有合作成功了?理论上,如果是无期限的合作,双方考虑长远利益,他们的合作是会成功的,但是只要是有限次数的合作,合作就不会成功,比如合作10此,那么在第九次博弈人就会采取不合作的态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。

“博弈论”习题参考附标准答案

“博弈论”习题参考附标准答案

“博弈论”习题参考附标准答案博弈论博弈论是研究人类决策制定和行为选择的一门学科,它涉及到多个参与者之间的冲突和利益博弈。

通过分析和建模参与者的决策过程,博弈论可以帮助我们理解和预测各种决策情况,并提供策略和解决方案。

本文将介绍几个典型的博弈论习题,并附上标准答案作为参考。

1. 囚徒困境囚徒困境是博弈论中最著名的问题之一。

假设两名囚徒被捕,检察官分别问他们是否承认自己犯罪。

如果只有一个人承认犯罪,他会得到从轻判决;如果两人都承认,他们将得到较重的判决;如果两人都否认,那么他们将得到较轻的判决。

但是,由于彼此的不信任和利益冲突,囚徒往往会选择自私的策略,即承认犯罪。

这个问题可以用一个博弈矩阵来表示:囚徒B承认囚徒B否认囚徒A承认 -5,-5 -10,0囚徒A否认 0,-10 -1,-1其中左上角的数字表示囚徒A和B都承认犯罪时的判决结果,右下角的数字表示囚徒A和B都否认犯罪时的判决结果。

通过分析博弈矩阵,可以发现最优策略是双方都选择否认犯罪。

2. 纳什均衡纳什均衡是博弈论的一个重要概念,它指的是参与者在给定其他参与者策略的情况下,无法通过单方面改变自己策略来获得更好结果的状态。

以两个司机选择路线为例,假设他们可以选择两条路线,每个司机希望自己的路线时间最短。

若两个司机都选择第一条路线,他们的到达时间相同,这是一个纳什均衡;若一个司机选择第一条路线,另一个司机选择第二条路线,他们的到达时间将不同,这不是一个纳什均衡状态。

3. 合作与背叛合作与背叛是博弈论中经常出现的主题,也是人们日常生活和商业交易中的重要决策。

例如,两个公司可以选择合作开展某项业务,也可以选择相互竞争。

合作可以带来双方共同的利益,但也需要相互信任;而背叛则是一种自私的策略,可以追求个体利益,但可能破坏双方的合作关系。

4. 平衡策略在博弈论中,平衡策略指的是使得参与者无法通过改变自己的策略来达到更好结果的策略选择。

在一些特殊的情况下,博弈存在多个平衡策略。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

几个博弈论中的经典问题博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

几个重要的概念1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

2、得失(payoffs):一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。

所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。

5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他改变策略他的支付将会降低。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

经典的博弈问题1、“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。

可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。

A和B均坦白是这个博弈的纳什均衡。

这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说,不管A坦白或抵赖,B的最佳选择都是坦白。

反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。

结果,两个人都选择了坦白,各判刑8年。

在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

囚徒困境反映了个人理性和集体理性的矛盾。

如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。

当然,A和B可以在被警察抓到之前订立一个"攻守同盟",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

2、海盗分金币问题在一座座荒岛上,有5个强盗掘出了100块非常珍贵的金币。

他们商定了一个分配金币的规则:首先抽签决定每个人的次序,排列成强盗一至五。

然后由强盗一先提出分配方案,经5人表决,如多数人同意,方案就被通过,否则强盗一将被扔入大海喂鲨鱼。

如果强盗一被扔入大海,就由强盗二接着提出分配方案,如多数人同意方案就被通过,否则强盗二也要被扔入大海。

以下依次类推。

假定每个强盗都足够聪明,都能做出理性的选择,那么,强盗一提出什么样的分配方案,能够使自己得到最大的收益?对于这个问题要采用方向推导方法:如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。

所以,4号惟有支持3号才能保命。

3号知道这一点,就会提出“100,0,0”的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。

不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放弃3号,而给予4号和5号各一枚金币。

由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。

这样,2号将拿走98枚金币。

同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。

由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。

这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。

分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。

1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。

而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。

在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

3、旅行者困境两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。

提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。

航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。

于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。

如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。

为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。

可是不,甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元。

何乐而不为?所以他准备写99元。

可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。

想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。

你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。

在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。

事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡。

4、枪手博弈彼此痛恨的甲、乙、丙三个枪手准备决斗。

甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。

如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。

但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。

我们来分析一下各个枪手的策略。

枪手甲一定要对枪手乙先开枪。

因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。

同样的道理,枪手乙的最佳策略是第一枪瞄准甲。

乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。

枪手丙的最佳策略也是先对甲开枪。

乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。

我们计算一下三个枪手在上述情况下第一轮枪战中的存活几率:甲:24%(被乙丙合射40% X 60% = 24%)乙:20%(被甲射100% - 80% = 20%)丙:100%(无人射丙)第二轮枪战中甲乙丙存活的几率粗算如下:(1) 假设甲丙对决:甲的存活率为60%,丙的存活率为20%。

(2) 假设乙丙对决:乙的存活率为60%,丙的存活率为40%。

第一轮:甲射乙,乙射甲,丙射甲。

甲的活率为24%(40% X 60%),乙的活率为20%(100% - 80%),丙的活率为100%(无人射丙)。

第二轮:情况1:甲活乙死(24% X 80% = 19.2%)甲射丙,丙射甲──甲的活率为60%,丙的活率为20%。

情况2:乙活甲死(20% X 76% = 15.2%)乙射丙,丙射乙──乙的活率为60%,丙的活率为40%。

情况3:甲乙皆活(24% X 20% = 4.8%)重复第一轮。

情况4:甲乙皆死(76% X 80% = 60.8%)枪战结束。

甲的活率为12.672%(19.2% X 60%) + (4.8% X 24%) = 12.672%乙的活率为10.08%(15.2% X 60%) + (4.8% X 20%) = 10.08%丙的活率为75.52%(19.2% X 20%) + (15.2% X 40%) + (4.8% X 100%) + (60.8% X 100%) = 75.52%通过对两轮枪战的详细概率计算,我们仍然发现枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。

对于这样的例子,有人会发出“英雄创造历史,庸人繁衍子孙”的感叹。

相关文档
最新文档