博弈论的发展历史和基本内容

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论经过半个多世纪的短暂发展 ,正逐渐成为现代经济理 性与集体理性的矛盾 ,在现实生活中具有相当的普遍性 。
论的一个重要组成部分 。1994年著名博弈论专家纳什 、泽尔藤 、豪
2 博弈论的发展历史
尔绍尼因在非合作博弈均衡领域的开创性贡献获得当年的诺贝尔
经济学奖 。2005年奥曼和谢林因“以博弈论分析方式增进了对冲
③如果两者都不坦白 ,因为证据不足 ,警察只能以较轻的妨碍公务
罪判处他们各 1年 。具体模型如图一所示 :
(图 1) 乙
甲 坦白
不坦白
坦白 ( - 5, - 5) ( - 10, 0)
不坦白 (0, - 10) ( - 1, - 1)
博弈论研究的就是 ,甲 、乙为了实现各自的利益最大化 ,双方
要求参加者具有很强的计算 ,推理能力 。但是在现实中个人并不 是完全理性的 ,并且对信息的掌握并不是完全充分的 ,这就使这一 理论受到质疑 。
对纳什均衡博弈理论完全理性假定的质疑推动了进化博弈论 的出现 ,进化博弈理论以达尔文的生物进化论和拉马克的遗传基 因理论为基本思想 。该理论的基本概念是演进稳定战略 ESS,它的 典型模型包括参与人群体集合 ,各群体个人之间进行重复匿名博 弈 。进化博弈理论用系统论的观点看待群体行为的调整过程 ,主 要研究群体行为演化系统的变化即描述动态系统的状态变化 。该 理论对参加者的理性要求较少 ,因而对人类的群体行为可以做出 更好的预测 。
参考文献 [ 1 ] 张良桥 ,冯从文. 理性与有限理性 :论经典博弈理论与进化博弈理论
之关系 [ J ]. 世界经济 , 2001 (8). [ 2 ] 郭磊. 博弈论简论 [ J ]. 山东经济 , 1999 (6). [ 3 ] 张建英. 博弈论的发展及其在现实中的应用 [ J ]. 理论探索 , 2005 (2).
选择策略时都以自己的利益最大化为目标 ,但结果是无法实现最
一个完整的博弈应当包括以下几个要素 :
大利益 ,即他们的最佳选择和最优结局并不相同 ,这反映了个人理
3. 1 博弈方或局中人
·1·
Econom ic & T rade U pda te V ol. 5 Sum. N o. 70 June. 2007
3. 2 策略 又称战略 ,是指局中人在博弈中相应的可供选择的办法 ,它支 配参加者在什么时候选择什么行动 。每一种策略都对应一个相应 的结果 。按策略集合划分 ,博弈可以分为有限策略博弈和无限策 略博弈 。策略数量越多 ,博弈就越复杂 ,因此无限策略博弈比有限 策略博弈要复杂得多 。 3. 3 支付函数 又称得益 ,是参加者选择策略并加以实施后的结果 ,是参与人 从博弈中获得的效用水平高低的体现 。按各方得益情况划分 ,博 弈可以分为零和博弈 、常和博弈和变和博弈 。 3. 4 博弈的次序 即参加者策略选择并行动的先后次序 。依据是否考虑决策的 次序问题 ,博弈可以分为静态博弈和动态博弈 。静态博弈指参加 者可同时决策并行动的博弈 ,并不考虑决策的次序问题 。动态博 弈指参加者先后 、依次决策并且后行动者能够观察到先动者所选 择的策略和行动 。 3. 5 信息 即博弈方的信息结构 ,尤其对有关对手的策略和各博弈方得 益的了解程度 。从参加者的信息结构划分 ,博弈可以分为完全信 息博弈和不完全信息博弈 。完全信息博弈是指参加者对其他局中 人的策略空间 、行动特征及支付函数有完全的了解 ,否则就是不完 全信息博弈 。 其中一般的博弈至少要由前三个因素组成 。另外博弈论还有 其它一些基本概念 ,如行动 ,即参加者的在博弈的某个时点的决策 变量 ;结果 ,即参加者最感兴趣的要素的集合 ;均衡 ,指所有参加者 的最优战略组合 。 按照博弈的决策和信息综合起来进行划分 ,博弈可以分为 :完 全信息静态博弈 、完全信息动态博弈 、不完全信息静态博弈 、不完 全信息动态博弈 。其相应的均衡分别为纳什均衡 、子博弈完美纳 什均衡 、贝叶斯纳什匀衡 、完美贝叶斯纳什均衡 。其中前面论述的 “囚徒困境 ”属于完全信息静态博弈 ,相应的均衡为纳什均衡 。 4 纳什均衡博弈理论和进化博弈理论 纳什均衡博弈理论的基本概念是纳什均衡及其精练 。纳什均 衡可以描述为 :如果一个博弈存在一个战略组合 ,任何参与人要改 变这一战略组合都可能导致降低自身的效用水平 (或只能保持原 有的效用水平 ) ,因而任何参与人都没有积极去改变这一战略组 合 ,这一战略组合称为该博弈的纳什均衡 。 纳什均衡假设参加者是完全理性的 ,并且博弈信息是完全的 , 并且要求参加者正确地知道其他局中人将会如何选择 ,即预期要 满足一致性原则 。参加者在处理不完全信息时要假定参加者知道 世界的各种可能状态 ,知道在随机抽取状态上的客观概率分布 ,并
突与合作的理解 ”而获得诺贝尔经济学奖 ,这说明博弈论已得到了
世界的普遍认可 。到底什么是博弈论 ,它的主要内容是什么 ,它与
现实生活有什么联系 。本文将简要地论述一下博弈论 。
1 “囚徒困境 ”模型
“囚徒困境 ”模型是博弈论中的经典范例 ,它是 1950年 Tucker
提出的 。它的基本内容为 :警察抓住了两个合伙犯罪的罪犯甲和
将采取何种策略 。在这个模型中 ,甲 、乙两个博弈方对对方的可能
得益完全知晓 ,并பைடு நூலகம்根据双方两种可能的选择分别考虑自己的最
后策略 ,并独立作出策略选择 。对于甲而言 ,当乙坦白时 ,甲会选
择坦白 ,被判 5年 ,当乙不坦白时 ,甲会选择坦白 ,被释放 。因此不
管乙选择何种策略 ,甲都会选择坦白 ,这是他的最佳策略 。同理对
时代经贸 2007 年 6月 第 5卷 总第 70期
理论探索
博弈论的发展历史和基本内容
王金炳 (四川大学公共管理学院 四川 成都 )
【摘要 】 博弈论凭着强大的理论优势 ,经过半个多世纪的短暂发展 ,已经发展成为经济学领域中一门重要的学 科 。经过由纳什均衡理论向进化博弈理论的发展 ,博弈论的理论体系日益成熟 ,地位不断提高 ,并对个人 、企业 、 国家之间的关系发展有巨大的指导作用 。 【关键词 】 博弈论 纳什均衡 进化博弈理论
从纳什均衡博弈理论到进化博弈论是一个逐渐递进的过程 , 体现了从完全理性向有限理性转变 ,从完全信息向不完全信息转 变 ,从行为分析向制度分析转变 ,从简单博弈向重复博弈转变 ,从 静态博弈向动态博弈转变 ,从个体研究向群体研究转变 。
5 博弈论与其它学科及现实的关系 博弈论是研究理性的决策者之间冲突及合作的理论 ,可以对 实际决策提供理论基础和方向指导 。博弈论的最终追求结果是博 弈方达到利益最大化的均衡 ,已经在经济学 、政治学 、管理学 、国际 关系学 、人际关系学 、外交 、犯罪学等方面有着广泛的应用 。特别 是博弈论作为经济学的分析工具和重要分支 ,极大地改变了经济 学的面貌 :拓宽了经济学的研究领域 ,极大地推动了国际贸易理论 和产业组织理论的极大发展 ;改变了传统经济学的对个人孤立决 策和完全竞争条件下的均衡行为的研究 ,侧重于对多个利益主体 的行为特征及之间相互作用的分析 ,使经济分析更能反映人为因 素这一本质特征 。 博弈论与现实生活也有着密切的联系 。博弈论对现代企业管 理观念和方式的改变有重要的指导意义 ,我们生活中经常会遇到 各种价格大战和价格联盟 ,但这不一定会促进企业的良性发展 ,而 强化企业之间的合作和正和博弈将是企业获得双赢的一条捷径 。 在日常生活中 ,关系到我们个人的排队与不排队 ,让座与不让座 , 拾金不昧与据为之有等也体现了博弈的知识 。国家关系的发展尤 其是经济领域中的恶性贸易战是经常发生的 ,贸易战是不利于名 方利益实现的 ,只有合作博弈才能实现各国共赢 。 博弈论凭借自身的理论优势 ,已经发展为经济学的前沿知识 。 虽然它已经被普遍认可 ,但还存在一些问题 :有关博弈规则 、博弈 信息的理论基础薄弱 ;许多博弈理论还处在提出假设阶段 ,还需要 接受实践的的检验 ;理论范围有待扩展 ,理论体系有待严密 、统一 ; 合作博弈理论发展地不充分等等 。正是具有这些问题 ,博弈论才 有巨大的发展动力和广阔的发展前途 。我们相信在不久的将来 , 博弈论的发展会迈上一个新的台阶 ,对社会做出更大的贡献 。
·2·
于乙而言 ,不管甲选择何种策略 ,坦白是他的最佳策略 。因此 (坦
白 ,坦白 )构成了此博弈的最佳策略均衡 。
另外 ,我们从模型中可以看出 ,当甲和乙都不坦白时 ,将被各
判刑 1年 ,这要比他们的最后策略均衡的结局要好地多 。甲 、乙在
博弈论的正式提出是在 20世纪四十年代 ,但博弈的思想有着 悠久的历史 ,例如 2000多年前的“齐威王与田忌赛马 ”出色地运用 了这一思想 。1944年冯 ·诺伊曼和摩根斯特思合作出版了《博弈 论与经济行为 》一书标志着博弈理论的正式提出 。
到 20世纪 50年代 ,博弈论得到了巨大的发展 , Tucker于 1950 年提出了“囚徒困境 ”。纳什在 1950年和 1951年发表了两篇关于 非合作博弈的重要文章 ,提出了“纳什均衡 ”的概念 ,以及证明纳什 均衡存在的纳什定理 ,奠定了现代博弈论学科体系的基础 ,这个时 期的博弈论研究主要集中在对静态博弈模型的研究 。
乙 ,但警察缺乏足够的相关证据指证他们的罪行 ,但是只要甲和乙
中至少一人承认犯罪 ,就能确认其罪名成立 。
为了得到口供 ,警察将二者关押并进行审讯 ,同时为了防止他
们串供 ,将他们分别关押 。警察告诉了他们面临的选择及可能的
结局 : ①如果两人都坦自认罪 ,他们将被各判型 5年 。 ②如果两人
中只有一个坦白 ,则坦白者立即释放 ,另一个会重判 10 年徒刑 。
50年代中后期到 70年代是博弈论产生重要成果的阶段 。泽 尔腾将纳什均衡的概念引入了动态分析 ,提出了“多步对策 ”,“子 博弈完美纳什均衡 ”和“颤抖均衡 ”的概念 ,并发展了倒推归纳法等 分析方法 。豪尔绍尼开创了不完全信息对策研究的新领地 ,提出 了“贝叶斯纳什均衡 ”的概念和分析不完全信息博弈问题的标准方 法 ,初步运用随机分析方法解决信息不完全和不对称问题 。
是指博弈中能独立决策 ,选择最大化效用并承担结果的参加 者 。博弈方可以是个人 、团队 、组织 ,乃至国家 。按参加者的数量 的多少 ,博弈可以分为单人博弈和多人博弈 。多人博弈又可以分 为合作博弈与非合作博弈 ,其中非合作博弈在经济学领域中应用 更为广泛 ,是目前博弈论的研究重点 ,而合作博弈在政治 、社会等 公共领域中表现地较为突出 。
80年代以后 ,博弈论开始走向成熟 ,理论框架逐渐完整和清 晰 ,和其他学科之间的关系也逐渐深入 ,并开始受到经济学家真正 的重视 ,特别是 90年代以来博弈论领域的经济学家已经三次获得 经济学诺贝尔奖 ,该理论已经对经济学产生重大的影响 。
3 博弈论的定义 、要素和分类 博弈论又称对策论 ,英文名称是 Game Theory,是研究一些个 人 ,一些团队或组织面对特定的环境条件 ,在一定的规则制约下 , 依靠所拥有的信息 ,同时或先后 ,一次或多次 ,从各自允许选择的 策略进行选择并加以行动 ,并从中各自取得相应结果或支付的过 程的理论 。 博弈论研究的主要目的是研究博弈方的行为特征 ,即各决策 立体的行为发生直接的相互作用时的决策特征 ;以及何种情况下 采取哪种策略 ,会达到什么样的结果即决策主体决策后的均衡问 题。
相关文档
最新文档