博弈论发展简述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论发展简述
博弈论,又称为对策论,英文名称为Game Theory,是研究主体行为发生直接相互作用时的决策以及这种决策的均衡问题的理论。

Game一词在英文中的基本意思时游戏、比赛,故而在博弈论刚被介绍到中国时,有的学者根据其英文名称,直译其为游戏理论。

博弈的“博”字是竞争的意思,“弈”是对弈,是一种关于在竞争中选择策略,争取最好结果的技艺。

其实,博弈论是用严谨的数学模型来研究现实世界中冲突对抗条件下最优决策问题的理论,最初发源于数学。

自20世纪40年代,博弈论从数学家之手产生之后,就很快被借用到经济学领域,并在几代经济学大师的研究和推动之下,广泛应用于经济学、社会科学、管理科学、国际政治、生态学工商业活动以及人们的日常的生活之中。

博弈论的创始者是匈牙利的天才数学家冯·诺依曼(1903~1957),他不仅是经济博弈论的创立者,同时也是计算机的发明者。

20世纪初,冯·诺依曼、塞梅鲁(Zemelo)、鲍罗(Borel)就开始研究博弈的准确的数学表达。

1939年,冯·诺依曼和经济学家奥斯卡·摩根斯坦(Oskar Morgenstem)合作,从而使博弈论进入经济学的广阔领域。

1944年,二人共同出版了著作《博弈论与经济行为》,书中介绍了博弈的理论和方法,提出了标准型、扩展性和合作型博弈模型解的概念和分析方法,从而奠定了博弈学科的利率基础,标志着现代系统的博弈理论初步形成,也象征着博弈学科的正式建立。

20世纪50年代,合作型博弈的研究和应用达到顶峰。

但是,诺依曼的博弈论的局限性在于,由于过于抽象,大大限制了它的应用范围,在相当一段时间里,人们对博弈论的研究很少,只是少数数学家的专利,影响力有限。

正在此时,另一位博弈论大师纳什(Nash)博士于1950年11月在美国全国科学院的每月公报上刊登了两篇论文,将冯·诺依曼的“最小最大原理”推广到非合作博弈领域,找到了普遍化的方法和均衡点,其理论比冯·诺依曼的合作博弈论更能反映现实的情况。

非合作博弈思想,即“纳什均衡”理论的提出,标志这博弈理论新时代的开始。

作为一位天才人物,纳什从上大学开始就从事纯数学的博弈论研究。

后来,他在经济博弈论领域做出了划时代的贡献。

他提出的纳什均衡的概念在非合作博弈理论中起着核心的作用,其后续的研究者对博弈论的贡献,几乎都是建立在这一概念之上的。

由于纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

自20世纪50年代以来,由于纳什、泽尔腾(Selten)、海萨尼(Harsanyi)等人的努力,使博弈理论逐渐成熟并进入实用。

尤其在经济学领域,博弈论引发了经济学的“博弈论革命”。

博弈论的概念和方法改造了经济学的思维,也从而推进了经济学的研究。

1994年诺贝尔经济学奖授予纳什、泽尔腾和海萨尼3位博弈论专家,有力地证明了博弈论在现代经济学研究中的地位,也进一步激发了人们了解博弈论的热情。

博弈论作为现代经济学的前沿领域,已经成为占据主流地位的基本分析工具。

博弈论在20世纪40年代产生时,最初是运筹学的一个分支,是较纯粹的数学方法,但是由于其理论的普遍性,被逐步推广应用到许多研究领域,尤其是在经济学领域,博弈论改变了经济学家的思维方式,至今引领着该领域的前沿。

同时,对博弈论的研究也就方兴未艾,各种博弈理论分支更是层出不穷,演化博弈论就是一个时期以来在原有的理论基础上发展起来的博弈论家族中的热门和新兴分支。

博弈论的组成要素
博弈论由3个基本要素组成:一是决策主体(player),又可译为参与人、局中人或博弈方。

指的是博
弈中能独立决策、独立行动并承担决策结果的个人或组织。

小到一个人,大到一个跨国公司乃至一个国家,只要能独立决策和行动,都可以成为一个博弈方,形成决策主体;二是给定的策略空间(strategy space),就是信息结构,又叫策略集,指参与人可选择的策略和行动空间,是可选择策略的集合。

每一个策略都对应一个相应的结果,因此每个博弈方可选择的策略数量越多,博弈就越复杂;三是效用(Utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。

上述参与人、策略空间和效用3个要素就构成了一个基本的博弈。

博弈理论认为,一个完整的博弈应当包括一下五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后顺序;第五,博弈方的收益,即博弈方做出决策选择后的所得所失。

常见的博弈类型
通过博弈论学者们的研究归纳,通俗地讲,常见的博弈类型有以下几种:第一种是合作博弈和非合作博弈。

二者的主要区别在于参与者之间的博弈行为相互作用时,他们能否达成一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

合作博弈强调的是团体理性、效率、公正和诚信,非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的;第二种是重复博弈和非重复博弈。

非重复博弈就是博弈的双方博弈之后各自走人,从此不会再来博弈。

重复博弈则具有连续性的特点,同一博弈可以重复下去。

非重复博弈由于是一次性的,所以容易出现欺诈等道德问题,而重复博弈由于是连续性的,所以道德和规则的约束力较强,参与者不仅要追求一次博弈的目标最大化,而且要追求多次博弈平均目标的最大化,这就会迫使参与者高度重视信誉,并由对抗走向合作;第三种是零和博弈和非零和博弈。

零和博弈的特点是博弈双方的成本和所得会相互换位,也即:你的所失正是我的所得,反之一样。

不具有这样特征的博弈就是非零和博弈。

第四种是静态博弈和动态博弈。

参与双方同时决策或同时行动的,叫静态博弈,决策或行动有先后顺序的叫动态博弈。

显然,有没有先后顺序,博弈结果和采取的策略是不同的;第五种是完全信息博弈和不完全信息博弈。

信息就是知识,但不是一般的知识,是指与决策目标和决策对象有关的特定信息,是参与人有关博弈的知识。

按博弈双方拥有的程度分为:①完全信息:博弈双发对产生博弈的事情的知识都是共同知识;②对称信息:博弈双方有关信息的掌握程度是相等的;③不对称信息:博弈双方对实现某一个目标所掌握的信息及采取的策略掌握程度不同,信息在双方之间的分布是不均匀、不对称的。

博弈论的经典模型:囚徒困境
囚徒困境(Prisoner’s Dilemma )。

“囚徒困境”至今仍然是博弈研究的重要课题。

这个故事是说,两个罪犯犯罪后被抓,分别关押,不能见面,警察审问时分别对他们说,坦白吧,坦白你会被放走,你不坦白另一个人坦白了,你将被判10年。

实际上两个囚徒面临的情况是:一个坦白,另一个不坦白,坦白的将被释放,不坦白的会判10年;如果两个人都坦白,各判5年;两个人都不坦白,都放。

根据理性人的假设,甲乙两个罪犯都会寻找自己最优目标,那就是自己被释放。

如果两个人都不坦白,都会被释放,但甲会想:如果我不坦白,乙坦白了,他会被释放,我要判10年。

我坦白了,不管乙是否坦白,我最多判5年,也有可能乙不坦白,我被释放。

罪犯乙其实也是这么想。

结果他们都坦白了,分别判了5年。

在坦白这一
点上形成策略均衡,实现了目标最大化。

实际上囚徒困境这个模型揭示了合作与竞争(或叫对抗)的关系道理。

囚徒困境的情况在生活中最常见的就是挤公共汽车。

从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤。

其中的纳什均衡就是大家都挤,结果上车更慢了,每个人采取的都是最优战略,但是结果却是最劣,原因在于个人理性和集体理性之间存在着冲突。

博弈论的经典模型:智猪博弈
智猪博弈(Boxed Pigs)。

有两头猪生活在同一猪舍里,一头大猪,一头小猪,共用一个长食槽。

食槽的一头有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。

假定按一下会掉下10个包子,而跑去按开关的猪会耗费两个包子的能量。

如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪会吃掉9各包子,小猪只能吃到1个;如果大猪先按开关,按完后跑过来,小猪会吃掉4个包子,大猪可以吃到6个。

如果不去按开关,就会被一起饿死。

这个模型的最优策略组合只有一个答案:在任何情况下,都要大猪按开关,小猪等待。

因为这样,大猪会吃到6个包子,减掉耗费掉的2个,剩4个,与小猪一样。

但让小猪按开关,它只能吃到1个包子,减掉耗费的2个,亏1个。

智慧型的猪不会干赔本的买卖。

但如果大猪也不动,只能双双饿死。

这个模型也解释了在博弈过程中,多劳者不一定多得。

博弈论的经典模型:情侣博弈
情侣博弈。

假定一对热恋中的情侣,每周末见一次,必须见,否则活不下去。

男的喜欢看足球,女的喜欢看电影。

见面后,面临选择,看足球还是看电影?热恋中的情侣因为爱,会牺牲自己的爱好去满足对方。

如果去看足球,男的满足程度为四个单位,女的满足程度是两个单位;去看电影,女的满足程度是四个单位,男的满足程度是两个单位。

在这个博弈中,有三个变量非常重要。

一个变量是顺序,就是谁先提出来,比如男的先提出来,女方尽管更愿意看电影,但是男方已经提出来了,她不愿意违背他,只好同意,结果他们就去看足球。

相反的情况也是一样。

第二个是一次博弈还是多次博弈。

如果是多次博弈,双方就会大体上形成一种默契,这一周看电影,下一周看足球。

第三个取决于感情的深度。

处于依赖程度比较高的一方,对对方更加顺从照顾一些。

一般而言,情侣之间的博弈是一个动态过程,因为恋爱就是双方之间较长时期的磨合、了解过程。

如果我们假定情侣博弈是一个动态博弈,而且总是男的先决策,女的后决策,那么就会出现一种非常有趣的决策情景。

就女方来说,无论男的是选择足球,还是选择电影,她的决策均为四个:一个是追随决策,就是男的选择什么,她就选择什么;二是对抗策略,就是男的选择什么,她偏不选什么;三是偏好策略,就是无论男的选什么,她都选电影,因为这是她的偏好;四是成全策略,就是无论男的选什么,她都选足球,因为足球是男的偏好,她宁可牺牲自己的偏好,而成全男方。

情侣博弈在现实生活中到处存在,它让人们思考如何人去关心别人、理解别人,处理好人际关系。

博弈论的经典模型:斗鸡模型
斗鸡博弈(Chicken Game).在西方,鸡是胆小的象征,斗鸡博弈指在竞争关系中,谁的胆小,谁先失败。

现在假设,有两个人要过一条独木桥,这条桥一次只能过一个人,两个人同时相向而进,在河中间碰上了。

这个博弈的结果第一种就是如果两个人继续前进,双方都会掉水里,双方丢面子,这是一种组合。

第二种是,双方都退下来,双方也都是丢面子,但是都掉不到水里去。

第三种结果,甲方退下来,丢面子,乙过去。

第四种结果,乙退下来,丢面子,甲顺利通过。

在这四种结果中,第一种是两败俱伤;三、四两种是一胜一败,第二种是两败不伤,这就是斗鸡博弈。

在这个模型中,最优策略有两个,就是第三、第四
两种选择,即甲退下来乙先过去,或者乙退下来甲先过去。

因为两种选择对整个社会来说效益最大,损失最小。

两虎相争勇者胜,如何处理竞争中的两虎关系呢?一般有四种办法:第一种是谈判,双方约定一个条件,其中一个先退下来;第二种是制度,建立一种制度,规定从南到北的先退,或者从北到南的先退,或者后上桥者先退;第三种是时间,双方僵持一段时间,谁先吃不住劲谁先退;第四种是妥协,妥协不一定是最优策略,但是至少可以保证取得次优结果。

在工作生活中乃至处理国际关系时,得饶人处且饶人,退一步还扩天空,都是从斗鸡博弈可以总结出的道理。

博弈论的经典模型:威慑模型
威慑博弈的完整名称是进入威慑博弈,是研究参与者想进入某领域,而与该领域已有竞争者的博弈模型。

假定有两个参与人,一个想进入某行业,称之为进入者,另一个已在同一行业占有一席之地,称之为先入者。

对进入者来说,不管先入者是否设置壁垒,其最优目标都是进入。

而对先入者来说,要设置壁垒,必须付出巨大成本,否则不如默许。

进入威慑博弈模型的启示是:要做一件事情,必须确定一个可行的目标,不怕困难,全力以赴向目标努力,目标就会实现。

另外,不是所有的威慑都没有用处,付出巨大成本的威慑是起作用的,而要想使威慑起作用的,必须付出巨大成本。

同时,进入威慑博弈也提出了一个问题,就是威胁和承诺的可信度问题,威胁实际上也是一种承诺。

威胁和承诺是否可行,取决于其成本的大小,取决于其成本和收益的比较。

一般而言,成本巨大的,或者成本高于收益的威胁和承诺,可信度就比较高,反之则低。

实际生活中有些制度见效甚微,就是因为惩罚力度太小,使得违规者的违规收益高于违规成本。

相关文档
最新文档