完全信息博弈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全信息博弈
完全信息博弈——囚徒困境
囚徒困境是博弈论中占优战略均衡代表性的例子,反映个人最佳选择并非团体最佳选择。本文通过分析博弈论中最开始接触的囚徒困境开始,来阐述博弈论中一些博弈的思考与分析。
首先,先了解一下囚徒困境的基本定义:两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的。这是最基本的解释。在实验中,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。
由于每一个人都是理性的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交
谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
若对方沉默、背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方。
许多的博弈论理论都是从这个“囚徒困境”这个实验当中产生的,而生活中也充满了许多关于“囚徒困境”的例子。
在军事和政治领域中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济都造成损坏等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。
“囚徒困境”不仅带来了博弈论,更多的是对如何解决“囚徒困
境”的思考。
解决“囚徒困境”的方法有如下:
一、附加的可置信威胁可以让囚徒摆脱困境。
二、由外部环境决定的依存关系有可能使双方摆脱囚徒的困境
有时候,由于来自外部环境的威胁,进行“囚徒困境”博弈的
两个囚徒之间的合作(抵赖、抵赖)可能作为一种受迫性反应而出现。
三、在重复博弈中,囚徒们只是有时会走出困境
已经证明,在每个囚徒贴现值充分大时,以下两种情况可能使
最开始的例子中的两个囚徒走出困境。其一是博弈重复无限次;其
二是引入非对称信息,博弈重复的次数充分大。这两种情况中,前
者合作(即(抵赖,抵赖))有可能出现在一个子博弈精练均衡中,后
者合作有可能出现在一个精练贝时斯均衡中。注意这里多次强调了“可能”,是因为博弈均衡的多重性问题。
四、走出囚徒的困境——政府干预途径
上文已经指出,靠“囚徒们”的自律,并不总是能够走出困境。一个鲜活的例子是中国彩电企业首次“价格联盟”的失败。当不合
作有很高的“利润”诱惑时,没有哪家企业愿意合作。人们已经充
分认识到,彩电企业首次“价格联盟”的失败是因为缺乏奖罚规则
与措施,各方没有签订一个具有法律约束力的合同。为了防止过度
竞争,国家应采取必要的行政干预措施,比如对某产品采取最低限价,并以法规的形式确立下来,惩罚那些为了私利而单方面降价的不合作企业。惩罚必须有足够的威胁力度,比如为防止过度的价格竞争时,对单方面降价的不合作企业的罚款应不低于该企业由降价所带来的利润与合作时所带来利润的差额,否则,政府的干预就会“失灵”。