静态博弈模型1

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Байду номын сангаас
12
3.2 博弈模型 例 3.1 囚徒困境 (prisoners’s dilemma) (见文 献[1]第 88 页) 囚徒困境最早是由美国普林斯顿大学 数学家阿尔伯特· 塔克(Albert tucker)1950 年提出来的。他当时编了一个故事向斯坦福 大学的一群心理学家们解释什么是博弈 论,这个故事后来成为博弈论中最著名的案 例。故事内容是:两个嫌疑犯(A 和 B)作案 后被警察抓住,隔离审讯;警方的政策是―坦 白从宽,抗拒从严 ‖,如果两人都坦白则各 判 8 年;如果一人坦白另一人抵赖,坦白者 被立即释放,抵赖的判 10 年;如果都抵赖 则因证据不足各判 1 年。 问题:两名嫌疑犯选择坦白或抵赖? 结论:单次囚徒困境博弈的纳什均衡是:犯 罪嫌疑人 A 和 B 都坦白。
8
2002 年 8 月 21 日约翰· 纳什在北京作题为 《通过代理来研究博弈中的合作》的公众报告
9
1950 年,Melvin Dresher 和 Merrill Flood 在 Rand Corporation 在一项试验中正式引出了 归功于 A. W. Tucker 的囚犯困境(Prisoner's Dilemma) 。 纳什均衡是指博弈中这样的局面,对于 每个参与者来说,只要其他人不改变策略, 他就无法改善自己的状况。纳什在证明了在 每个参与者都只有有限种策略选择、并允许 混合策略的前提下, Nash 平衡一定存在。 以 两家公司的价格大战为例,纳什均衡意味着 两败俱伤的可能:在对方不改变价格的条件 下,既不能提价,否则会进一步丧失市场; 也不能降价,因为会出现赔本甩卖。于是两 家公司可以改变原先的利益格局,通过谈判 寻求新的利益评估分摊方案,也就是纳什均 衡。类似的推理也可以用到选举,群体之间 的利益冲突,潜在战争爆发前的僵局,议会 中的法案争执等。
2
博 弈 论 可 以 划 分 为 合 作 博 弈 (cooperative game)和非合作博弈(non-cooperative game)。
博弈有两种划分:从参与人出场的先后顺序 来看, 博弈分为静态博弈(static game)和动态 博弈(dynamic game)。 从参与人对对方信息的掌握程度来看, 博 弈 分 为 完 全 信 息 博 弈 (complete information game) 和 不 完 全 信 息 博 弈 (non-complete information game)。
冯· 诺依曼
4
―纳什均衡‖理论。约翰· 纳什(John F. Nash), 生于 1928 年 6 月 13 日。由于一笔优厚的奖 学金,纳什选择了 Princeton ,来到阿尔伯 特· 爱因斯坦(Albert Einstein)当时生活的 地方,并曾经与他有过接触。 1950 年,22 岁 的 约 翰 ·纳 什 以 非 合 作 博 弈 (Non-cooperative Games) 为题的 27 页博士 论文毕业,非合作博弈处理的是多人参与游 戏时每个游戏者的最佳策略。他在这篇博士 论文中有一个重要发现,他提出了多人非合 作博弈和后来称为纳什均衡的概念,为非合 作博弈(non-cooperative game theory)和交 易理论(bargaining theory)作了奠定性的贡 献。 后续的研究者对博弈论的贡献,都是建 立在这一概念之上的。 由于纳什均衡的提出 和不断完善为博弈论广泛应用于经济学、 管 理学、社会学、政治学、军事科学等领域奠 定了坚实的理论基础。当时年轻的约翰 · 纳 什在普林斯顿求学期间开始研究发展这一 领域,并在 1994 年凭借对博弈论的突出贡 献获得了诺贝尔经济学奖。
6
——1994 年瑞典皇家科学院公告 Noted mathematician John Nash, Jr. (1928- ) received his Ph.D. from Princeton University in 1950. The impact of his 27 page dissertation on the fields of mathematics and economics was tremendous. In 1951 he joined the faculty of the Massachusetts Institute of Technology in Cambridge. His battle with schizophrenia began around 1958, and the struggle with this illness would continue for much of his life. Nash eventually returned to the community of Princeton. He was awarded the Nobel Prize in Economics in 1994. The 2001 film A Beautiful Mind, staring Russell Crowe, was loosely based on the life of Nash.
13
求解博弈的方法主要有:划线法、严格 下策反复消去法、决策树方法、上策均衡、 纳什均衡定义、反应函数法等。 划线法 : 先找出自己针对其他博弈方每 种策略或策略组合(对多人博弈)的最佳对策, 即自己的可选策略中与其他博弈方的策略 或策略组合配合 , 给自己带来最大得益的策 略(这种相对最佳对策总是存在的 ,不过不一 定唯一),然后在此基础上,通过对其他博弈方 策略选择的判断 , 包括对其他博弈方对自己 策略判断的判断等 , 预测博弈的可能结果和 确定自己的最优策略。 严格下策反复消去法 : 任何理性的博弈 方都不可能采用严格下策。囚徒的困境博弈 的两个博弈方都不会采用``抵赖"策略。 因此, 我们可以把``抵赖"策略依次(或同时)从他们 各自的策略空间中排除掉。在任何博弈中 , 只要我们发现哪个博弈方的某些策略是相 对于他的其他策略的严格下策 , 可以把它们 消去。 决策树方法:将博弈用树状结构来表示, 这种方法直观明了。
10
20 世纪 90 年代至今诺贝尔奖经济学奖三次 授予对博弈论研究有突出贡献的学者,见表 1-1。
表 1-1 博弈论研究领域获得诺贝尔经济学奖情况 获奖 时间 1994 年 纳什、海萨 致力于博弈论的基础理论研究,对非合 尼和泽尔腾 作博弈理论的产生和发展做出巨大贡 献 1996 年 莫里斯 和维克瑞 2005 年 奥曼和谢林 在不对称信息条件下激励机制问题方 面的基础性研究 通过博弈论的分析加深了我们对冲突 与合作的理解,主要截包括谢林定理 等。 获奖学者 获奖原因
3
现代电子计算机之父和现代博弈论创立者 约翰· 冯· 诺依曼(John Von Neumann)美籍 匈牙利人, 1903 年 12 月 28 日出生于匈牙利 的布达佩斯。冯 · 诺依曼对人类的最大贡献 是对计算机科学、 计算机技术、 数值分析和 经济学中的博弈论的开拓性工作。约翰· 冯 诺依曼(John vonNeumann)在 1944 年与 Princeton 经 济 学 家 奥 斯 卡 · 摩根士特恩 ( OskarMorgenstern )的著作《博弈论和经 济行为》 ,通过阐释二人零和博弈论,正式 奠定了现代博弈论的基础。 他被经济学家公 认为博弈论之父。
7
John F. Nash (born June 13, 1928, Bluefield, W.Va., U.S.) U.S. mathematician. He earned a doctorate from Princeton University at 22. He began teaching at Massachusetts Institute of Technology in 1951 but left in the late 1950s because of mental illness; thereafter he was informally associated with Princeton. Beginning in the 1950s with his influential thesis "Non-cooperative Games," Nash established the mathematical principles of game theory. His theory, known as the Nash solution or Nash equilibrium, attempted to explain the dynamics of threat and action among competitors. Despite its practical limitations, it was widely applied by business strategists. He shared the 1994 Nobel Prize in Economics with John C. Harsanyi (1920 – 2000) and Reinhard Selten (b. 1930). A film version of his life, A Beautiful Mind (2001), won an Academy Award for best picture.
5
Mathematician John Nash, right, receiving a Nobel Prize in 1994 for his 1950 dissertation on game theory.
Sylvia Nasar's biography of John Nash, "A Beautiful Mind," has become a New York Times Best Seller.
11
约翰· 纳什发表的研究论文:
[1] J. F. Nash, Jr. (1950) Non-cooperative games. PhD. dissertation, Princeton University, 1950. [2] J.F. Nash, Jr. (1950) Equilibrium Points in n-person Games, Proceedings of the National Academy of Sciences 36: 48–49. MR0031701 [3] J.F. Nash, Jr. (1950) The Bargaining Problem, Econometrica 18: 155–162. MR0035977 http://www.doc88.com/p-19016396704.html [4]J.F. Nash, Jr. (1951) Non-cooperative Games, Annals of Mathematics 54, 286–295. [5] J.F. Nash, Jr. (1953) Two-person Cooperative Games, Econometrica 21, 128–140. MR0053471
本科生《博弈论及其在管理中的应用》
第 3 讲 静态博弈模型 I
禹海波
经济与管理学院 电子邮箱:haibo@bjut.edu.cn 教学邮箱 yhb_teach@126.com
1
本讲通过囚徒困境模型(参见文献[1]第 88 页) ,介绍求解静态博弈模型的理论与方法, 包括划线法、 纳什均衡定义、 反应函数法等。 3.1 现代博弈论的产生与发展 现代意义上的博弈论则产生于 20 世纪四十 年代至五十年代。 一般认为, 1944 年同冯· 诺 伊 曼 (Von Neumann) 和 摩 根 斯 坦 恩 (Morgenstern)合作出版的著作《博弈论与经 济行为》 (The Theory of Games and Economic Behavior)提出合作博弈的基本模型,标志着 现代博弈论的开始。20 世纪 50 年代,纳什 (Nash)提出了非合作博弈论, 塔科尔(Tucker) 定义了―囚徒困境‖,从而奠定了现代非合作 博弈的理论基石。60 年代,泽尔腾(Selten) 将纳什均衡引入动态分析,创立了 ―精炼纳 什均衡‖的概念;海萨尼(Harsanyi)则把不完 全信息引入博弈论的研究,随后出现了不完 全信息博弈论。至此,博弈论的理论构架基 本完成。
相关文档
最新文档