博弈论——换一种方式思考问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论——换一种方式思考问题
花了一个月的时间研究了下博弈论,收获很多,于是又花了一个礼拜写了这篇算是读后感的日志,希望能激起大家对博弈论的兴趣,尤其是几个经典博弈,真的很有意思。
Ø 博弈论的内涵
什么是博弈论?简单的说,就是“互动的决策论”,指在充分考虑对方的决策后做出的决策。“博弈论”的英文是“Game Theory”,所以博弈论最贴切的直译是“游戏理论”。
现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,对于冯·诺伊曼我们更为熟知的头衔是“计算机之父”,其实,他还有另一个身份,就是“博弈论之父”。1944年,他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。诺伊曼与摩根斯特恩认为,博弈论就是运用数学的方法研究有利益冲突的双方在竞争性活动中制定最优化策略的理论。
但是诺伊曼所解决的只有二人零和博弈,1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。这是整个现代博弈论中最重要的思想之一。相信很多人都知道纳什,因为那部经典的奥斯卡最佳影片《美丽心灵》,他传奇的人生,坚强的毅力,深深的打动了我。他在普林斯顿大学深造时,冯·诺伊曼正好在普林斯顿任教,那个时候的普林斯顿还聚集了众多著名的科学大师,包括罗伯特?奥本海默、诺曼·斯蒂恩罗德以及爱因斯坦,据说纳什曾经造访过爱因斯坦,向他讲述自己对于重力的看法。在一个小时的讨论之后,爱因斯坦对纳什说:“年轻人,你应该来学一点物理。”
1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
表面上看,博弈论似乎是数学家玩的游戏,而事实上,博弈论首先是我们思考现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式,博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈论的分析过程,而在于赢得更好的结局。说到底,博弈论只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了就够了。
Ø 博弈论的基本概念
首先我们需要了解的是纳什均衡。在某个房地产开发中,假定市场需求有限,只能满足某种规模的开发量,A、B两个开发商都想开发这一规模的房地产,如果A选择开发,则B 的最优策略是不开发,同样,如果B选择开发,则A的最优策略是不开发。这时无论对A 还是B,都不存在一种策略优于另一种策略,也不存在严格劣策略(不论其它人采取的策略,某人采取对自己不利的策略)。研究这类问题的均衡解,需要引入纳什均衡。
在纳什均衡中,每个参与人都确信,在给定其它参与人的策略情况下,己方选择了最优策略。所以在纳什均衡点上,每个参与者的策略都是最好的,此时没人愿意先改变或主动改变自己的策略。
在博弈论中,博弈行为都可以分为两类,即零和博弈与非零和博弈。零和博弈是一种完全对抗,强烈竞争的对局。参与者的总收益为零,因此一个参与者的所得必然是另一个参与者的损失。而非零和博弈,是各参与者的目标不完全对立,参与者只按本身的厉害关系单方面做出决策,有时为了共同利益而合作,有时为了个人利益而对立,收益的总和是可变的,参与者可以同时有所得和有所失。
在博弈论中,最基本的假设之一就是:人是理性的。所谓理性人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。而现实生活中,人们在做决策时往往是有限理性的。每个人都不是绝对聪明的人,而且绝对聪明的人也未必会用绝对聪明的方式去做决策,因此博弈论是有局限性的。
尽管如此,人类至今还没有找到一种比博弈更好的思考工具,可以对现实的客观世界进行如此近似的描述。就像力学是自然科学的哲学和数学一样,博弈论是社会科学的哲学与数学。没有牛顿力学我们连最简单的物理现象都无法理解;同样的道路,没有博弈论我们也无法解释分析很多的社会现象。
Ø 囚徒困境:博弈论的经典模型
有这样一个案例:两个共同偷窃的犯罪嫌疑人甲和乙被带到警察局。警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到同伴的选择。
警方虽然怀疑他们作案,但手中没有掌握确凿的证据,于是分别告知两名犯罪嫌疑人:对犯罪事实的认定及相应的量刑完全取决于他们自己的招供。如果你们一方供认,而另一方抵赖,那么供认方将作为证人无罪释放,而另一方将被判10年徒刑;如果双方都与警方合作,共同招认,则都将被判5年有期徒刑;如果双方均不认罪,则各判2年。
我们先不管这样的量刑方式是否合理,假设规则就是这个样子,从常理来看,双方都不认罪是最好的选择,但从博弈论角度出发,对于A来说,如果B招供,则A如果不招供的话,将会受到重罚,因此A的最佳策略是招供,如果B不招供,A的最佳策略仍然是招供,所以理性的A一定会选择招供,对于B来说,也是一样的道理。这样双方都招供就是一个纳什均衡。
从逻辑上分析确实没问题,但生活中我们可以这样来分析问题吗?有这样一则故事:两位交往甚密的大学生修化学课。两人在小考、实验和中期考中都表现都很优秀。在期末考试前的周末,他们非常自信,于是去参加了一场聚会。聚会太尽兴了,结果周日这天睡过了头,来不及准备周一的考试,要知道,大学里的考试全都要看考前一两天的复习。他们没有参加考试,而是向老师撒了个谎,说在回来的路上轮胎爆了,由于没有备用胎,只好整夜在路边整夜等待救援。现在他们太累了,请求老师容许他们隔天再考。老师想了想,同意了。他们便好好准备了一个晚上,周二来考试了。老师安排他们在两间教室做答。第一个题目在考卷第一页,占了十分,非常简单,两人都写出了正确答案,心情舒畅的翻到了第二页,第二页只有一个问题,占了九十分,题目是:“请问是哪只轮胎爆了?”结果不言而喻,两位学生只有乖乖向老师认错。
所以利用囚徒困境,我们至少可以学到一点,在生活中,如果能善于建立囚徒困境,往往能将看似很棘手的问题用很简单的方法解决。
也许你现在跟我一样有一个疑问,按照上面的分析,对每个参与者来说选择背叛永远比选择合作获得更多的利益,在现实生活中,这显然不合理。原因在于博弈的次数问题,在任何博弈中,表现最好的策略直接取决于对方采用的策略,总的来说,如果你认为今后将难以与对方相遇,或者你不关心自己未来的利益,那现在就选择背叛。而事实上,现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。因此,我们在博弈过程中,必然要考虑是否还有重复博弈的可能,如果将来的重复博弈带来的利益要更多的话,那当前博弈就会选择合作。
有了重复博弈还是不够的,当我们在确定合作时必须要制定相应的规则,规定背叛后的惩罚,只有带剑的契约才是游戏合作的保证。当参与者在博弈过程中选择背叛后为此要付出更大的代价后,就自然降低了他的背叛动机。
从囚徒困境中我们获得以下几点启发:第一,善于建立囚徒困境,如上面警察与教授就