生活中的博弈论论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生活中的博弈论
这学期我在人文课的选择上,我选了“生活中的博弈论”这门课。本来以为会很枯燥乏味,现在课要结束了,回想起来觉得还是挺有趣的。其中含有很浓的智慧气息,趣味横生。下面就是我关于这门课的小论文。
我们首先就会问,什么是博弈论?其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。生活中每个人,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…
博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,博弈论经过了这么多年的发展已经完善成为一门十分重要的经济学分支学科,不管是在结构分析还是决策预测等方面都发挥着越来越重要的作用,尤其对于理性人来说懂得如何博弈就显得越发重要。
下面我说一下我个人的想法。博弈其实就是一种游戏,是如何做出对自己有利选择的游戏,但又区别于传统的如体育运动、下棋、打牌等游戏,同时又和这些有些有本质的共同特征,如都有一定的规则,都有一个结果,策略至关重要,同时策略和得益有相互依存性,游戏者不同的策略会带来不同的结果。这样看来博弈好像和我们身边普通的游戏是一样的,其实这并不奇怪,其实博弈本身的含义就是博弈参与者在一定的规则条件下选择相应的策略以期获得足够的利益的过程,这和传统的游戏是相通的,如最常见的斗地主,就是在一定的规则下(如连牌至少5张一连等等),选择如何出牌(出牌的组合以及出牌的顺序等等)而获胜(当然也可能输)的过程,这本身就是一个三方博弈的过程。
为了能够了解博弈的含义,那么下面我们来看一下经典的博弈模型。
需要提到的当然是任何与博弈有关的书籍中都会讲到的“囚徒困境”。
囚徒困境的博弈的基本模型是这样的:警察抓了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们所犯的罪行。如果其中至少有一个供认犯罪就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并给他们同样的选择机会:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判一年徒刑;如果两人中有一人坦白认罪,则坦白者从轻处理,立即释放,而另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁。
如果分别用-1,-5和-8表示判刑1年、5年、8年的得益,用0表示被立即释放的得益,则我们可以用一个特殊的矩阵将这个博弈表示出来,这种矩阵是表示博弈问题的一种常用方法,我们称这种矩阵为一个博弈的:得益矩阵:
囚徒1、囚徒2代表两个博弈方,他们各自都有“坦白”和“不坦白”两种可选择的策略;因为这两个囚徒被隔离开,其中任何一个人在选择策略时都不可能知道另外一个选择什么,因此可能两人做出选择时间不同,但是在选择时不知道对方的决定,因此我们在理论上可以看做他们同时做出选择,那么下面我们就来分析一下,他们会如何选择呢,如果是其中一个是你,你又会如何选择呢?
在分析之前我必须要说明一下,我们这里的博弈方是理性的,即他总是考虑自身是否能得到最大的利益,而不是集体得到最大的利益。
例如对于囚徒1来说,囚徒2有坦白和不坦白两种可能的选择,假设囚徒2选择的是“不坦白”,则对囚徒1来说,“不坦白”的得益为-1,坦白的得益为0,那么他肯定会选择坦白,假设囚徒2选择的是“坦白”,那么囚徒1坦白的得益为-5,不坦白的得益为-8,他肯定也会选择坦白。因此在本博弈中,无论囚徒2采用何种策略,只考虑自身利益的囚徒1的选择是唯一的,那就是“坦白”,因为在另一方的两种可能选择的情况下,“坦白”给他自己带来的得益都是最大的。同样的,因为囚徒2与囚徒1的情况完全相同,因此囚徒2与囚徒1的决策思路和选择也会和囚徒1完全一样,囚徒2在这个博弈中唯一合理的选择也是“坦白”。所以该博弈的最终结果必然是两博弈方同时选择“坦白”策略,同时被判5年。也许你会感到和奇怪,他们怎么都不选择“不坦白”呢,如果这样的话他们不是都只判1年刑了吗?事实上通过上述分析我们知道那是不可能的。除非在两人串供的基础上,但我们的前提是他们被分别关押,根本没有串供的可能。这个结果或许你会感到不能理解,但通过我上述运用博弈知识的分析,你应该清楚了吧,而这也正是博弈论的魅力所在。
下面这个案例是老师在上课时讲过的了,我觉得比较有意义的。
有5个海盗,他们要分100个金币,假设他们分别为1、2、3、4、5,这5个人都非常聪明,都想获得最多可能的钱,并且绝对理性。就在给出以下分配方案:由1开始说自己的分配方案,如果有超过一半的人同意,那么该分配方案得以实行,如果没有超过一半的人同意。那么他就被推到海里,由2号说自己的分配方案,同理如果有超过一
半的人同意,那么该分配方案得以实行,如果没有超过一半的人同意,那么他就被推到海里,接着由3、4说自己的方案直到只剩下5号一个人,那么现在问:1号应该怎么分配金币,才能得到最多的金币,且不被推到海里,我相信现在没有一个人能够说出正确答案,即使你知道正确答案,你也不知道为什么会是这样吧,下面我来告诉正确答案:97、0、1、2、0,想不到吧,想知道为什么吗,那么就去学一下博弈论吧。
博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。我在上面讲过了一个“囚徒困境”的例子,我们可以看到,个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们