博弈论的实例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论的实例分析
一.“囚徒困境”
“囚徒困境”是博弈论里最经典的例子之一。
讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。
可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。
A和B均坦白是这个博弈的纳什均衡。
这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。
即是说,不管A坦白或抵赖,B的最佳选择都是坦白。
反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。
结果,两个人都选择了坦白,各判刑8年。
在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
二.电信价格竞争
根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。
假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。
A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。
正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。
这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。
在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。
这时候,A该怎么做?不妨假定:
A降价而B维持,则A获利15,B损失5,整体获利10;
A维持且B也维持,则A获利5,B获利10,整体获利15;
A维持而B降价,则A损失10,B获利15,整体获利5;
A降价且B也降价,则A损失5,B损失5,整体损失10。
从A角度看,显然降价要比维持好,降价至少可以保证比B好,在概率均等的情况下,A降价的收益为15×50%-5×50%=5,维持的收益为5×50%-10×50%=-2.5,为了自身利益的最大化,A就不可避免地选择了降价。
从B角度看,效果也一样,降价同样比维持好,其降价收益为5,维持收益为2.5,它也同样会选择降价。
在这轮博弈中,A、B都将降价作为策略,因此各损失5,整体损失10,整体收益是最差的。
这就是此博弈最终所出现的纳什均衡。
我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。
许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。
三.OPEC组织成员国之间的合作与背叛
“囚徒困境”告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
上述我们在对电信价格竞争的博弈分析中,只是一次性的“囚徒困境”博弈,因此得到了互相降价的纳什均衡。
而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,“合作”都是一种随处可见的现象。
比如中东石油输出国组织(OrganizationofPetroleumExportingCountries
简称OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。
OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。
连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的“大众定理”(Folk Theorem)的含义。
但合作的可能性不是必然性。
博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺(Credible commitment) ,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。
如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。
这里“可信的承诺”是一个很牵强的翻译,“Credible commitment”并不是什么空口诺言,而是实实在在的付出。
所以合作是非常困难的。
所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油产量。
每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。
当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降--结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌……。
理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。
那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。
但只要是有限次的合作,合作就不会成功。
比如合作10次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。
但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。
第八次不合作会使大家在第七次就不合作……一直到,从第一次开始大家都不会采取合作态度。
所以,博弈论在核心指标一定的前提下会出现不同的情形,其原因便在于合作的次数。
如果合作的次数是有限的话,而且合作者都是理性的,只追求自身利益的最大化时,就会陷入“囚徒效应”,最后导致的结果便是自己利益的最大化,但非整体利益的最大化。
如果合作次数是无限的话,即使有合作者做出背叛的决定以后,但由于双方都是理性的,会考虑到长远利益,所以二者会进行串谋,最终实现一个动态的平衡状态,但最终的趋势还是整体利益的最大化。
有两位乘客分别带着相同的古董坐飞机去度假,但行李在途中丢失了。
航空公司的代表要求他们分别申请补偿,并告知他们:“我公司知道两位行李中的物品是一模一样的,而且价值在5,000 到20,000 元之间。
请两位在不互相沟通的情况下,分别报出你希望获赔的金额(必须在5,000-20,000 元之间)。
我公司的赔偿政策是:按照两位申报的金额中较小的那个进行赔偿;另外,如果两位申报的金额不同,那么申报金额较低的乘客会在赔偿金的基础上再得到500 元奖励,而申报金额较高的那位则会在赔偿金中被扣掉500 元。
申报的金额必须以‘元’为单位。
”1. 写出这个博弈的参与人、参与人可选的策略、以及不同情况下参与人的收益。
2. 对于每个参与人而言,有没有劣战略?如果有的话,这个博弈的结果应该是什么?请写出具体的分析过程。
3. 现在把航空公司的赔偿政策改变一下:“如果两位申报的金额不同,那么申报金额较低的乘客会在赔偿金的基础上再得到5,000 元奖励,而申报金额较高的那位则会在赔偿金中被扣掉5,000 元。
”重新分析上面的第2 问,答案会有所不同吗?
4. 如果你是其中一位乘客,在额外奖励/惩罚为500 元时你会怎么做?把额外奖励/惩罚提高到5,000 元时,你的行动会有所改变吗?请解释原因。
1、博弈的参与人是两位乘客,我们以A、B来表示,第一种策略组合:A、5000,B、5000,在这种情况下,A和B的收益都是5000。
第二种策略组合:A、5000-20000,B、5000,在这种情况下,A的收益是4500,B的收益是5500第三种策略组合:A、5000,B、5000-20000 在这种情况下,A的收益是5500,B的收益是4500第四种策略组合:A、B、都是5000-20000,其中A大于B B的收益比A多1000,且大于5500第五种策略组合:A、B、都是5000-20000,其中B大于A A的收益比B多1000,且大于5500
2、两个人的劣势策略都一样,即报价为20000。
这个博弈的结果应该是第一种策略组合,因为双方都要比对方的开价少,才会使自己的收益最大化。
3、答案还是一样的。
4、如果是我的话,就选择5000。
(1)案例来源:网易新闻:《虚高房价这样与百姓博弈100天,开发商仍在力挺》,2005年7月13日
[案例内容]:
现在离3月26日国务院调控楼市的“国八条”出台已逾百天,房地产市场交易凋零至冰点,但开发商们仍在力挺虚高房价,博弈市场。
博弈之一:联手造势
5、6月间,上海的开发商们不只开了一次“碰头会”,达成的“共识”都是不降价,“坚决挺到市场回暖的那天”。
6月底,上海市房地产行业协会一负责人甚至鼓吹“目前房价不具备回探、回弹和大跌的可能,回涨将众望所归”;本月初,上海某地产集团董事长竟公然宣称,中央房地产调控政策“造成了消费恐慌”。
博弈之二:集体捂盘
按常规,五、六月份是楼市销售旺季,而今年长三角等楼市敏感地区,许多具备销售条件的楼盘纷纷延迟开盘。
以宁波为例,去年前5个月的新开楼盘达22个,而今年同期只开了5个。
上海、南京、杭州5月以来新盘推出的节奏明显放缓。
开发商们声称只要能坚决“捂住”,最快到九、十月份行情就可能恢复。
更有甚者,反正房子卖不出去,一部分开发商干脆挂高房价,试探市场。
博弈之三:死守高价。
即便是面对连续几个月一套没卖的局面,大的开发商也不轻言降价。
一些中小开发商迫于生计,调价也采取了小幅迂回战术,一百元一百元地下调。
优惠后的房价依旧远高于去年10月新一轮疯长之前的价格。
位于上海闸北区的一个分批销售的项目,去年10月,一期开盘合同均价为7817元/平方米,而今年3月推出的第三批房源均价已升至1.1万元/平方米。
尽管五、六两月连续“零成交”,其第四批房源合同均价还是高达10386元/平方米。
问题:为什么开发商能联手推高房价?你有什么建议让开发商降价?
答:开发商能联手推高房价是因为如今民用房和商品房都比较紧缺,买家都是希望自己能够买到中意的房子,开发商正是利用了他们这一选择,同行之间联手推高房价还提高自己的收益。
要想让开发商降价,首先,可把房地产开发商之间的价格同盟看作是重复博弈。
如果博弈只有一次,则每个局中人只关心一次性支付,降价也许是有利的。
但若博弈重复多次,则局中人可能会为长远利益而牺牲眼前利益。
因而合作——守住高价是最优选择。
其次,房地产是地方政府的重要财源。
地方政府普遍担心楼市盘整时间过长。
开发商们正是利用了地方政府的此番心理,不停地给政府部门“吹风”:调控的目的已经达到,该“鸣金收兵”了。
最后,开发商最大的“心结”是市场观望时间过长。
市场长期以来没有人气来改变,房价的定价权会回到购房人手中。
也就是说,按照市场规律,房价高企能够持续多久就值得怀疑了。
如果市场需求下降,价格下降是迟早的事。
如果厂商也预期到了这一点,就会选择先下手为强,如此以来,价格同盟可能就很难实现了。
(1)皇帝与功臣
以下是皇帝与功臣博弈的战略表达式,分析三种不同情况的均衡结果,结合有关历史事实对其中的区别进行讨论。
如果功臣的类型(实力强弱)是私人信息,那么作为功臣如何通过传递自己是弱的信号避免杀身之祸?
因为皇帝的不同类型(如正统与非正统,实力强与实力弱)也会对博弈的均衡结果产生影响,那么皇帝如何通过传递自己是强的信号降低功臣造反的概率?
进一步看,只要是家天下就难以避免通过暴力手段进行改朝换代的历史命运,因为皇帝(包括后续的皇帝)总有变弱的那一天,当皇帝的收益又是如此巨大。
因此,您认为应该采取哪些有效的机制才能跳出中国几千年的历史周期律。
功臣(实力强)
造反不造反
皇帝杀
不杀
功臣(实力中)
造反不造反
皇帝杀
不杀
功臣(实力弱)
造反不造反
皇帝杀
不杀
答:由上述表格可知:当功臣实力强时,功臣造反时的收益是0,皇帝的杀死功臣收益也是0,说明功臣造反皇帝杀死他时结果是二者的收益都为0都得不到好处。
功臣不造反他的收益是-1,而皇帝处决他收益为-2,表示皇帝为了稳定自己的江山而解决后顾之忧,但是皇帝也得不到益处。
因为功臣对国家的贡献是巨大的,这对皇帝的统治带来很大的阻碍。
而当功臣造反皇帝却没有处死他时,这时候功臣就成了叛贼,他也将一无所有,而皇帝没有杀他这给世人留下了好形象。
皇帝的收益将得到最大。
当实力强的功臣没有造反时皇帝和功臣的收益都是1,这是最理想的现实,国家稳定皇帝功臣和睦相处。
比如宋朝的时候实行良好的政策。
当功臣的实力一般时,功臣造反的结果肯定没收益,而皇帝为了稳固自己的地位把他杀死这对皇帝来说收益是-1,如果皇帝不杀他这时候功臣造反落的什么都没有,他的收益为-2,皇帝也没有收益。
功臣不造反而皇帝为了稳固自己及子孙后代杀死功臣,这时功臣损失了,皇帝也损失,皇帝得不到世人的拥护损失更大。
只有在实力中等的功臣不造反,皇帝也不起疑心不杀功臣是最好的结果。
当功臣的实力弱时,功臣对皇帝的影响不大,功臣造反皇帝把他处死,功臣没有得逞造反,而皇帝的损失更大,因为功臣根本不会对他造成阻碍,而皇帝因为杀了功臣却得不到老百姓的爱戴,如果皇帝不杀功臣,这时候功臣一无所有收益为-2,而皇帝没杀他,皇帝没什么影响。
当功臣不造反皇帝却把他杀死了,这时是两败俱伤,功臣的收益是-1,而皇帝的收益是-2,只有功臣不造反,皇帝不杀功臣时是最理想的,因为功臣没实力根本不会造成什么影响。
经分析,皇帝想做永远的皇帝是不可能的,因为功臣的实力总有变强的一天,而皇帝的实力也总有一天会变弱,只有通过民主的选举,轮流选出百姓心目中的真正的能力强的人当领袖。
民主领导大众,人民当家作主。
没有剥削没有等级,人人平等,国家繁荣发展,即走向现实我们的共产主义社会,国家政府有一个正确的方向去领导广大人民,只有这样,才能在现实中获得双赢。
上网查阅当前朝鲜半岛局势的情况,运用博弈论相关知识分析评论各方的行动,并预测走势。
答:当前朝鲜半岛和韩国之间的争端,实际上就是美国为了自己的利益支持韩国,为美国在东亚地区的军事和外交行动找借口。
美国需要朝鲜半岛保持紧张状态,为此,朝鲜一再被推到风口浪尖。
而朝鲜面临这种紧张形势毫不示弱,结果到底有利于谁,关键在这场博弈中,看谁的智力水平更高超,谁的意志品质更优秀,谁的做法更符合国际形势发展的客观趋势。
从近期的形势发展看,美国利用“天安”号事件拉近了美韩关系,扩大了在东亚海域的军事存在,加强了对朝鲜乃至中国的军事压力,看上去美国实现了意图并占据了优势。
但无论是“天安”号事件还是延坪岛炮战,客观上都证明了这样一个结论,即美国保护不了韩国,追随美国必将付出惨痛代价。
朝鲜掌握核武器无疑增加了美国对朝动武的顾虑。
另外,中朝关系已发展到非同一般的战略水平,对朝鲜可能受到的来自美国的军事打击,中国不会允许,俄罗斯不愿看到,甚至韩国也未必同意。
一旦美朝开战,塔利班、基地组织、伊朗以及众多潜在的反美势力必将趁势而起,导致局面更不可收拾。
朝鲜试图用大炮告诉韩国,追随美国敌视朝鲜的政策没有出路;告诉美国,解决半岛问题的出路是和平谈判而不是施加压力和炫耀武力。
综合各方面考虑:韩国正确的政策是走到和平轨道上来,排除外部干扰,实现自主和平统一;朝鲜则是要坚持以自强来自保,同时与有利于自己国家的势力联合,在友好相处中获得共同收益。
6、第六题(所有同学都做):(10分)信号传递
案例名称:大股东与美国公司变革-----占优均衡
案例来源:人民网新闻:《改进上市公司管理——美国证交会拟交还股东监督权》,2004年4月5日
案例内容:
2004年3月初,美国娱乐业巨头——迪斯尼公司上演了一出股东“逼官”的大戏,身兼公司董事长和首席执行官的迈克尔•艾斯纳被剥夺了董事长一职。
3月下旬,万年能金融公司董事会被迫接受4家机构投资者联合提出的董事人选;迫于股东的压力,微波—世界通信公司出台了一项新规定:公司董事会在任命新董事时必须向持股数量超过15%的大股东征询意见。
自从迪斯尼股东炒了老板的“鱿鱼”之后,美国一些公司股东要求变革的呼声日益强烈,就连美国证券交易委员会也变得积极起来。
美国证交会计划推出新的政策,其核心内容是,允许拥有5%变通股的公司股东直接推选董事人选。
按照证交会的说法,此举的目的是使股东更充分地行使对公司事务的监督权,同时也可以减少由于监督不力导致的公司管理层的各种违规行为。
案例分析:
从该案例可知,上述三公司的行动表明:股东对公司的监督功能在日益增强。
在这一形势推动转变的过程中,大股东及机构投资者的作用至关重要。
在现代企业制度中,大股东与小股东之间存在着角色和行为差异。
根据公司监督成本与收益的对比关系,大股东有更大的积极性去监督经理们的工作,而小股东则容易选择坐享其成。
结合课堂所学知识,我认为这种情况可以用博弈论中的“猪智博弈”进行分析。
在“猪智博弈”中,“等待”是小猪的占优策略,跑去“按按钮”是小猪的劣策略。
最终的博弈均衡是:小猪等待,大猪按按钮。
在上例中,大股东相当于“猪智博弈”中的大猪,小股东相当于小猪。
在大小股东是否密切监督经理工作的博弈中,大股东因为利益攸关会担当起搜集信息监督经理的责任,而小股东则坐享其成也可因大股东密切监督经理的工作而获得收益,即选择所谓的“占优策略”。
举一个你所经历的斗鸡博弈的实例,在实际博弈中你采取什么行动让你是成为“勇士”的;答:1996年长虹集团与海尔集团价格战。
在实际的博弈中,我或者虚张声势给别人以心理上的打击从而击溃别人的心理防线,迫使对手做出让步。
从而成为勇士.
判断分析“知道的越多越好”
答:
达尔文的生物进化论说明,人生活在世界上实际上就是和别人竞争。
物竞天择适者生存。
在竞争激烈的社会中,机会只垂青有准备的人,知道得越多,以后遇见问题解决问题的能力也就越强,机会也就越多,收益也越大。
在以下构造的博弈论模型中可以反映出来。
乙
甲
对于甲而言,知道的少收益为零,因此甲选择知道多,对于乙也同样。
根据占优策略均衡,甲乙将同时选择知道得多从而(5,5)达到纳什平衡。
因此对于甲乙而言,知道得多的,将收益越大,“知道得越多越好”。