博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论简史
(4)博弈论在经济学中得到了广泛应用。 1972年,摩根斯特恩创立了《国际博弈论杂 志》,为博弈论的推广和应用做出了不可磨 灭的贡献。 ★特别是1994年12月,诺贝尔经济学奖授予 了纳什、海萨尼和泽尔滕;1995年授予了卢 卡斯;1996年授予了莫里斯和维克里,而他 们都是著名的博弈论专家和经济学家。
博弈论的基本概念
组成一局博弈至少应具备的三大基本要素:局 中人、策略(集)、支付(得益)。 支付须满足冯•诺依曼-摩根斯特恩(Von Neumann-Morgenstern)效用理论,反映出个 人偏好或序数效用。 博弈论的唯一前提假设:个体有限理性。 博弈论是研究决策主体的行为发生直接相互作 用的时候如何决策以及这种决策的均衡问题, 是策略变量的行为函数。 均衡是所有局中人最优策略的组合。
博弈论简史
(3)1966年,海萨尼对合作博弈与非合作博弈的不 同,给出了现在使用最普遍的意义。海萨尼(19671968)在《管理科学》杂志上分三部分发表了气著 名论文“由贝叶斯对弈者进行的不完全信息博弈”, 从而建立了不完全信息博弈论,为信息经济学的发展 打下了理论基础。 (4)1965年,R•泽尔滕引入了博弈论中另一个极为 重要的概念——具有子博弈完美均衡概念的精炼纳什 均衡。 然而,尽管博弈论在这段时间有了长足的发展,但仍 然是纯理论意义上的,实际应用却很少。特别是 1967年,卢卡斯发现了一个十人对策没有冯——摩 解,使博弈论陷入了低潮。
1.3 博弈论基本分类
经济学中的分类及对应均衡
行动 顺序 信 息 静态 动态
完全信息
完全信息静态博弈; 完全信息动态博弈; 纳什均衡; 子博弈精炼纳什均衡; 纳什(1950,1951) 泽尔腾(1965) 不完全信息动态博弈; 精炼贝叶斯纳什均衡; 不完全信息静态博弈; 泽尔腾(1975), 贝叶斯纳什均衡; Kreps和Wilson 海萨尼(1967-1968) (1982), Fudenburg和Tirolt (1991)
博弈论简史
从以上的发展简史可以看出,博弈论真正研 究的历史尚不到80年,真正形成到现在也不 过近60年。然而其 概念层出不穷,理论也颇 为丰富,应用更是日益渗透到社会、生活的 各个领域,且正在不断扩大。因此我们有理 由来享受这门学科带给我们的无穷乐趣,尽 情的从中嬉戏并受益。 然而,限于笔者水平有限,只能汇总他人之 言,采撷他人书丛,尽可能用通俗的语言和 简明的计算方法对其作以“浅讲”。
博弈论简史
第四阶段:1970年至今,博弈论的理论体系完全形 成及广泛应用。自1970年开始,博弈论理论本身在 几乎所有的领域都取得了重大突破,如重复博弈、随 机博弈、策略均衡、谈判理论、信誉模型、多人博弈 等。同时,博弈论也广泛应用到了经济学、生物学、 计算机科学、道德哲学等若干学科中。 (1)在策略均衡概念的研究方面进一步深化和改进。 海萨尼(1973)第一个否认了对弈者利用随机化装 置来决定其行动的传统观点。奥曼(1974)提出了 相互关联的均衡的概念。泽尔滕(1975)引入了 “颤抖的手完美均衡”概念,此概念是对精炼的纳什 均衡的真正的改进。
博弈论简史
(2)在不完全信息博弈和重复博弈方面的研究。奥曼 (1981)发表了“重复博弈的一个考察”的论文, 首次提出了应用自动学的概念来描述一个重复博弈中 的对弈者,他研究了有约束的对弈者的相互作用行为。 D•M •克瑞普斯和R •威尔逊(1982)把子博弈完美 均衡的思想扩展到扩展形式子博弈中,称为“序列均 衡”,他们还研究了不完全信息博弈中的信誉问题。 尼曼(1985)和鲁宾斯特恩(1986)则系统阐述了 重复博弈中的有限理性的思想,研究讨论了重复的囚 徒困境问题。朱•弗登伯格和克瑞普斯(1988)最早 研究了对弈者如何利用学习过程了解均衡的问题。 (3)在生物进化论的研究方面取得重要突破,如J•M •斯密(1972)提出了稳定的进化策略,出版了《进 化与博弈论》。
2.1 囚徒困境——占优均衡
坦白 坦白 乙 拒不坦白 (0,-10) (-1,-1)
(-8,-8) (-10,0)
甲
拒不坦白
这两个囚犯会作什么样的选择呢?
囚徒困境——占优均衡
方法1:划线法 乙 坦白 拒不坦白 (-8,-8) (0,-10) (-1,-1)
坦白 甲 拒不坦白
(-10,0)
如果甲坦白,乙的最佳选择是坦白。
1.1 博弈论简史
博弈论思想由来已久。 2000多年前,齐威王与田忌赛马堪称博弈论的经 典案例,划归于完全信息条件下的二人零和博弈。 《孙子兵法》和《三十六计》两部兵书包含了若干 对战争胜负的认识,胜负之间诸因素的相互作用, 以及各种情形下采取如何的军事策略与谋略等,都 蕴含着博弈论的思想精髓,目前成为国内外企业家 学习的必需案例。 巴比伦王国的犹太法典,记载了公元1-5世纪的法 律和传统,其中讨论了一个所谓的“婚姻合同问 题”,被人们认为是最早使用了现代合作博弈。 1713年11月,詹姆斯•瓦尔德格雷夫在给朋友蒙特 茅特关于两人玩扑克牌的方法的信中,对两人博弈 提出了第一个著名的最小最大混合策略解。
1.2 博弈论的基本概念
经典案例(囚徒难题)甲、乙两个嫌疑犯作 案后被警察抓住,分别被关在不同的屋子里 审讯。警察告诉他们:如果两人都坦白,各 判刑8年;如果两个都抵赖,因证据不足各判 1年;如果其中1人坦白另一人抵赖,坦白的 放出去,不坦白的判刑10年。
囚徒难题支付矩阵
乙 坦白 拒不坦白
坦白 (-8,-8)(0,-10) 甲 拒不坦白 (-10,0)(-1,-1)
博弈论简史
第二阶段:1944年~1959年,现代博弈论的建立与 理论体系的基本形成。 (1)1944年,美国普林斯顿大学的著名数学家冯•诺 依曼和经济学家摩根斯特恩合著的《博弈论与经济行 为》一书出版。书中在详述二人零和博弈理论的同时, 在博弈论诸多方面做出了开创性研究,如合作博弈、 可转移效用、联盟形式以及冯•诺依曼——摩根斯特 恩稳定集(又称冯——摩解)等,该书还说明了导致 后来在经济学中广泛应用的公理化效用理论。该书的 出版意味着博弈论作为一种系统理论的开始,奠定了 现代经济博弈论的基础,构建了博弈论这一学科的理 论框架。特别是1947年又出版了这部著作的第二版, 至此,博弈论便真正形成了。
博弈论浅讲
——世事纷争一棋局
宋杰鲲
石油大学经济管理学院@2003.11
参考书目
张维迎.博弈论与信息经济学 谢识予.经济博弈论 平新乔.微观经济学十八讲 Drew Fudenberg&Jean Tirole.博弈论 施锡铨.博弈论 姚海鑫.经济政策的博弈论分析 高山晟.经济学中的分析方法 钱康平.高级微观经济学 哈尔•瓦里安.微观经济学(高级教程)
不完全信息பைடு நூலகம்
2 完全信息静态博弈
完全信息静态博弈指的是每个局中人对所有其他局中 人的策略集、支付函数等有完全的了解,且所有局中 人同时行动并只选择一次。 静态博弈可用策略型博弈表述(也可描述动态博弈, 但动态博弈有更有效的表述方式——扩展型表述)。 策略型表述:G={各局中人的策略集;各局中人的支 付函数} 有限博弈的策略型表述可直接用支付矩阵表示。 对应均衡:占优均衡、重复剔除占优均衡、纯策略纳 什均衡、混合策略纳什均衡 ★纳什均衡广泛而明确的含义:在给定对方 某一策略 时,自己选择相应的优策略;同时,在自己选择这一 策略时,对方选择的优策略恰是其起初的策略。
1 博弈论(Game Theory)简介
博弈论,又称对策论,是数学研究的一个分 支。1913年,博弈论有了它的第一个定理— —泽梅罗定理。该定理断言:国际象棋是严 格确定的,即在国际象棋中,要么白方获胜, 要么黑方获胜,要么双方和棋。正因为此, 取这一分支命名为Game Theory。 博弈论的研究对象远不至于国际象棋,实际 上它可以说是研究世间所有矛盾现象的一种 数学方法和理论。所谓“世事纷争一棋局”, 正是蕴含了这一哲理。
博弈论简史
第三阶段:1960~1969年,博弈理论的进一步完善 和发展。在这一阶段,博弈论专家们除了对一些重要 的基本概念作了系统阐述和证明外,还对合作博弈解、 稳定集、核心的概念作了更深入的研究和推广。 (1)奥曼和皮莱格(1960)、M•马希勒(1965)、 夏普里(1969)等人系统研究了非转移效用的联盟 博弈问题,从而完善和发展了博弈论。 在60年代,博弈论研究的重大突破和发展是不完全 信息博弈论的创立。 (2)1966年,奥曼和马希勒的研究中出现了具有不 完全信息的无限重复博弈。
博弈论简史
尽管博弈论的思想与实践“古已有之”,且 “不绝于史”,但现代博弈论的建立及其理 论体系的形成却是20世纪40年代中期到50年 代初期才完成的事。 第一阶段:1944年以前,早期思想和基本概 念的形成。这一时期,博弈论并未形成完整 的思想体系和方法论体系,人们主要集中于 严格的竞争对策的研究,即“不是你死,便 是我亡”的二人零和博弈。但这一阶段却提 出了一些重要的基本概念和定理。这些概念 和定理成为现代博弈论发展的基础。
博弈论简史
在第四卷中,夏普里和吉利斯共同提出了作为一般 解概念的核心的概念。此外,夏普里(1953)还开 创了随机博弈理论。 (5)1957年, R •卢卡斯和H •雷法出版了博弈论的 另一部经典著作《博弈和决策》,慎重的提出了博弈 论的局限性。 (6) 1959年,R•J •奥曼引进了强均衡的概念。M • 舒比克出版了《策略与市场结构:竞争、垄断与博弈 论》,标志着博弈论在经济学中应用的开始。 在50年代末,还出现了关于重复博弈的研究, 主要结果就是“无名氏定理”。此外,还出现了关于 随机博弈和动态博弈的概念和模型。
博弈论简史
(2)1950~1953年,普林斯顿大学数学系的约翰•纳 什发表了四篇划时代意义的论文。纳什证明了非合作 博弈均衡的存在性,并提出了“纳什方案”,该方案 建议对合作博弈的研究可通过简化为非合作博弈形式 来进行;纳什还创立了公理化讨价还价理论,证明了 纳什讨价还价解的存在性。人们认为,纳什为非合作 博弈的一般理论和合作的讨价还价理论奠定了基础。 (3)1950年,A•W •塔克在斯坦福大学的一份备忘录 中揭示了“囚徒困境”这一迄今仍经久不衰的经典案 例。 (4)1952年,J •C •麦克金斯出版了第一本博弈论教 科书《博弈论入门》。由H•W •库恩和A•W •塔克编 辑的《博弈论论文集》共四卷也在普林斯顿大学出版。 在该书第二卷中,库恩(1953)提出了扩展型博弈 及其形成; L •夏普里(1953)定义了智者联盟博弈 解的概念,即著名的“夏普里值”。
博弈论简史
(1)1838年,法国经济学家奥古斯汀•古诺在分析生 产者竞争时,就利用均衡概念研究寡头市场的情况, 并使用了“解” 的概念,该概念实际上是后来纳什 均衡的一种严格说法。 (2)1913年,产生了博弈论中的第一个定理——泽 梅罗定理。 (3)1921-1927年间,E•波雷尔发表了四篇关于策略 博弈的文章,第一次给出了一个混合策略的现代形式。 (4)1928年,冯•诺伊曼证明了最小最大定理,该定 理被认为是博弈论的精华,也正因此,一般公认博弈 论的研究始于1928年。 此外,这一阶段还提出了博弈的扩展形式、纯策 略、策略形式、混合策略、个体理性等重要概念。
G={P,A, U , S,I} P(Player)——局中人,按照局中人之间是否 相互合作分为合作博弈(数学/对策论)和非合 作博弈;按照局中人的个数分为单人博弈(运筹 /决策论)、二人博弈和多人博弈; A(Action)——策略集,按照策略是有限的还 是无限的分为有限博弈和无限博弈; U(Utility)——支付函数,按照支付分为零和 博弈(运筹/对策论)和非零和博弈。 S(Stage)——博弈进程,按照博弈进程分为 静态博弈和动态博弈; I(Information)——信息,按照信息是否完全 分为完全信息博弈和不完全信息博弈。