博弈理论
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈理论
目录0.为何要学习博弈论
别人的信封诱人吗
一元面钞的价格悖论
肯德鸡和麦当劳的恶性竞争
陆贾分金享天年
模仿还是创新
法不责众的尴尬
1.博弈论的基本知识
一些基本概念
博弈的类型
2.完全信息静态博弈
占优策略均衡
纳什均衡和严格均衡
标准对策式的纳什解求法
混合策略的纳什均衡
纳什均衡的存在性
多重纳什均衡的确定
3.完全且完美信息动态博弈
完全且完美信息动态博弈的一般概述
博弈的展开型表述
扩展式表述的纳什均衡
子博弈精炼纳什均衡
后向归纳法
后向归纳法的缺陷
4.重复博弈
多阶段博弈的信息结构
有限次重复博弈
无限次重复博弈
重复博弈的变异结构
5.完全但不完美信息动态博弈
不完美信息博弈的一般概述
完美贝叶斯均衡
6.不完全信息静态博弈
静态贝叶斯博弈的一般表述
贝叶斯均衡
不完全信息与混合战略
7.不完全信息动态博弈
动态贝叶斯博弈的一般概述
精炼贝叶斯纳什均衡
精炼贝叶斯均衡的发展
策略不确定性和均衡的演化
8.合作均衡
纳什谈判解:二人合作
n人合作对策
9.博弈结构与均衡礼仪分配
先占优势和后发优势
耐心与纳什均衡
多数和少数的互动
实力、成本、信息和地位
新古典经济学认为,经济学是研究稀缺资源如何有效配置的;而张维迎(1996,2)1认为经济学是研究理性的人如何行为的。实际上,两种理解都存在很大的偏颇,它们的根本缺陷都是将研究的手段当成了目的。我们认为,经济学研究的目的是探讨经济运行的规律以及如何提高人们的生活水平,或者如黄有光所说,是为了增进人们的快乐。因此,一般来说,经济学研究的主要内容就包括两个方面,一是人与人之间的社会关系方面,其中主要的就是生产方式以及与之相适应的生产关系;另一个是人与自然的关系方面,即技术关系方面,主要是研究稀缺性资源的配置问题。由于人与人之间的快乐存在冲突,因此人们往往希望最大限度的增进自己的快乐和福利,因此,就必然存在种种的互动行为,博弈论就是探讨人们之间的这种行为的。究其实质,博弈论是一种分析工具,用来探讨人们的互动行为,是人们为增进快乐或福利的手段;研究的视角不同,如合作的与非合作的,为他利己的和为己利他的,揭示的博弈机制也必然不同。可见,博弈论实际上是提供了一种博弈思维。
0.为什么要学博弈论
博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题,是关于包含相互依存情况中理性行为的研究。这有两个要点:一是相互依存,即博弈中的任何局中人都受到其他局中人行为的影响,他的行为也将影响到其他局中人。二是理性行为,这种理性也是指局中人试图实施自己的最大化行为,而并不考虑是否会损害其他局中人;而且,我们假设,理性的局中人不会持续地犯相同的错误。考虑到这样两点,博弈中的局中人的决策必定建立在预测其他局中人的反应之上,并把自己置身于其他局中人的位置预测其他局中人的行动,在决定自己的最佳行动;因此,在博弈论里,个人效用函数不仅依赖于他自己的选择,而且依赖于他人的选择,个人的最优选择是其他人选择的函数。
尽管博弈论是一门新的学科,但事实上,博弈思维早已成为经济学乃至政界、商界以及日常生活的基本思维方式;而且,目前在美国的绝大多数大学,博弈论都成为了热门课程,中国也有越来越多的高校开设这门课程。事实上,我们微观经济学中已经广泛涉及这一问题了,如寡头模型;而且,博弈工具正成为经济学的两个主要分析工具之一。但什么是博弈思维呢?
凯恩斯曾经有一段话对当时的股市与选美进行比较:“专业投资大约可以比作报纸举办的比赛,这些比赛由参加者从100 张照片当中挑选出6张最漂亮的面孔,谁的答案最接近全体参加者作为一个整体得出的平均答案,谁就最能获奖;因此,每个参加者必须挑选并非他自己认为最漂亮的面孔,而是他认为最能吸引其他参加者注意力的面孔,这些其他参加者也正以同样的方式考虑这个问题。现在要选的不是根据个人最佳判断确定的真正最漂亮的面孔,甚至也不是一般人的意见认为真正最漂亮的面孔。我们必须作出第三种选择,即运用我们的智慧预计一般人的意见认为一般人的意见应该是什么”。凯恩斯所讲的就是博弈思维。实际上,博弈也往往带来很多非理性的后果,如金融泡沫、各种经济风潮都是这种预期效应强化的结果。
为了让大家对博弈论和博弈思维有个形象的认识,我们举几个例子:
0.1别人的信封诱人吗
我们的生活中总存在这样一些谚语:这山望那山高,别人碗里的粥料更多,别人的妻子总是更漂亮。问题是,在大家都这么想的时候,是否应该交换呢?或者说,交换后是否能够真正增大自身的收益呢?
我们现在假设,年末奖金分配,老板秘密地给两个职员各一个信封,里面随机地装着一定数目奖金,其中一个信封内的钱是另一个信封钱的2倍,具体数目可能是:10元、20元、40元、80元、160元和320元;两个职员A和B都知道这一信息,但各自只知道自己信封的具体数目;如果两人都想交换,就让他们
1张维迎:《博弈论与信息经济学》,上海三联书店、上海人民出版社1996。
交换。现在假设,A打开信封后发现,里面是40元,那么他是否应该交换呢?
根据一般的推理,A想到B得到20元和80元的概率是一样的,如果交换,那么期望收益是25元;在如此小数目的赌博下,风险是无关紧要的,因而交换符合他的利益。同样的分析也可说明,无论B得到的是20元还是80元,也希望交换。但问题是:因为用来分配的钱是固定的,因而双方交换信封并不可以都得到改善;那么,推理的问题出在那里呢?
实际上,上面分析的最大问题是没有从对方角度进行推理,这就是博弈的实质;如果他们都充分认识到对方也是理性的,并估计对方产生自己一样的推理,那就不会发生交换信封的事了。我们首先从A的角度思考B的思维,再从B的角度想象A如何看待他;最后回到A的角度,考察他如何看待B如何看待A对B的看法。
假设A打开自己的信封,发现里面有320元,显然就不愿意交换;既然,A在得到320元时不愿意交换,那么B在得到160元时也拒绝交换,因为A惟一愿意交换的前提是他得到80元;进一步的,B在得到160元时不愿意交换,那么,A在得到80元时也不愿意交换,因为交换发生的前提是B得到40元;既然A 在得到得到80元时不愿意交换,那么,B在得到40元时也不愿意交换,因为交换发生的前提是A得到20元;在这种情况下,显然A得到40元也是不愿意交换的。
这个策略思维在日常生活中的忠告就是“别和笨蛋对等打赌”。我们在现时生活中常常发现一些非常诱人的赌博,似乎提出打赌的人是个大笨蛋,而自己一定会赢,但最终的结果确实自己输个精光。譬如,有人跟你打赌,他每次都可以将飞镖射入轮盘的正中心;那么,他一定可以做到;如果他做不到,就一定不愿意打这个赌,也就不会输。
0.2一元面钞的价格悖论
耶鲁大学教授马丁.舒比克设计了一个陷阱游戏:在课堂上,老师拍卖一张1元钞票,请大家给这张开价,每次叫价以10分为单位;出价最高者将获得这种1元钞票,但出价最高和出价次高者都要向拍卖人支付相当于出价数目的费用。结果,这1元钞票的价格一路飙生,直到终于有人认识到此博弈的无上限性发出惊呼,大家才意识到这一点,从而拍卖最终落槌。
实际上,我们假设目前的最高价格是A出60分,而B出50分,如果就此停止,那么A将获得盈利40分,而B将损失50分;显然,B继续出价70分,如果拍卖落槌,B将获得30分,而A将损失60分;这样的过程可以一直持续下去,远远超过1元的面额。因为,假如A出价10元,而B出价10.1元,此时如果A不继续出价10.2元,那么,A将损失10元;而如果出价10.2元获胜,损失将减少为9.2元。这样的循环会无穷下去,直到掏光除最后胜者外其他人口袋里所有的钱财。
为什么会如此循环下去呢?关键是上面参与人的拍卖行为没有充分认识到双方的理性。如果认识到这一点,采取某种策略就可以使拍卖在掏光口袋里的之钱前停止。我们假设,现有A、B两人的口袋的钱都是2.5元;现在我们运用后向归纳法,如果A喊价2.5元,从而赢得1元钞票,但他却亏了1.5元;而如果他喊价2.4元,B只有喊价2.5元才可以取胜。由于多花1元来获得1元是不合算的,因此当B地喊价在1.5元及以下时,A只要喊价2.4元就可以取得胜利。同样,A如果喊价2.3元也行得通,因为B还是不可能在2.4元处取胜,A一定会继续叫价2.5元进行反击;因此,要击败A的2.3元喊价,B也一定要出价2.5元;也就是说,2.3元的喊价将足以击败1.5元及以下的喊价。同样的推理,2.2元、2.1元一直到1.6元的叫价都可以取胜。也就是说,如果A喊价1.6元,理性的B将遇见到A不会放弃,非要等到价位升到2.5元不可;因为,既然已经损失了1.6元,再花90分获得1元是合算的。上面的分析表明,第一个叫价1.6元的人将胜出,因为这一叫价建立了一个承诺或威胁。
上面的分析也表明,1.5元可以击败60分及以下的叫价;而且,进一步的分析,只要出价70分就可以做到这一点,因为一旦叫价70分,那么他一路坚持到1.6元就是合算的;在这种情况下,60分及以下的对手就会觉得跟进是不合算的。
可见,在这个博弈中,只要预算是共同知识,即使预算是不同的,只要有人叫价到70分,这场拍卖就会结束。
一元面钞的悖论也广为普及,如超级大国之间为微小的利益不断进行战略升级,如美国的星空大战体系等。
0.3肯德鸡和麦当劳的恶性竞争