博弈论非常好的讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈 ,属于动态博弈
• 即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
2020/4/1
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
2020/4/1
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2020/4/1
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨 (Joseph E. Stiglitz)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
2020/4/1
如何在博弈中获胜?
• …… 真的能在博弈中(总是)获 胜吗?
获奖原因:“通过博弈论分析加强了 我们对冲突和合作的理解”所作出 的贡献而获奖。
2020/4/1
罗伯特·奥曼
2020/4/1
托马斯·谢林
2020/4/1
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效 率、公正、公平 • 非合作博弈(non-cooperative game)
2020/4/1
2020/4/1
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾 (Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
• 对手和你一样聪明! • 许多博弈相当复杂,博弈论并不
能提供万无一失的应对办法。
2020/4/1
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀 ,40%的人能得良好。
• 所有学生达成一个协议,大家都不要太用功 ,如何?想法不错,但无法实施!稍加努力即 可胜过他人,诱惑大矣。
2020/4/1
案例1:囚犯困境
支付
嫌疑 人B
Because We Had a Flat Tire”
• 两个学生想要推迟考试,谎称由于返校途中 轮胎漏气,未能很好地备考。
• 教授分别对他们提出了问题:“哪个轮胎漏 气?”如何应答?
• 他们本应该预计到教授的招数,提前准备好 答案。
• 在博弈中,参与者应该向前看到未来的行动 ,然后通过向后推理,推算出目前的最佳行 动。
2020/4/1
约翰·纳什 1928年生于美国
2020/4/1
莱因哈 德·泽 尔腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
• 是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
• 如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
2020/4/1
零和博弈与非零和博弈
• 按照大家是否清楚对局情况下每个 局中人的得益。
• “各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识( common knowledge)。
• 据“共同知识”的掌握分为完全信 息与不完全信息博弈。
2020/4/1
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
• 常和博弈也是利益对抗程度最高的博弈 。
• 非常和(变和)博弈蕴含双赢或多赢。
2020/4/1
2020/4/1
• 张维迎著,《博弈论与信息经济学》,上海三联书店 、上海人民出版社,1996年版。
• Roger B. Myerson著:Game Theory(原文版、译文版 ),中国经济出版社,2001年版。
• 博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
2020/4/1
如何在“博弈”中获胜 ?
• 日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
• How can you win such games? • 许多博弈都包含着运气、技术和策略。 • 策略是为了获胜所需要的一种智力的技巧。
2020/4/1
2020/4/1
2020/4/1
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素: (1)参与人(players)iN={1,2,…,n} ; (2)战略(strategies),siSi(战略空间); (3)支付(payoffs),ui=ui(s-i,si)。
2020/4/1
约瑟夫·斯蒂格利茨, 1943年生于美国的 印第安纳州,1967 年获美国麻省理工 学院博士头衔,曾 担任世界银行的首 席经济学家,现任 美国哥伦比亚大学 经济学教授
2005年诺贝尔经济学奖获得者
以罗伯特·奥曼色列经济学家罗伯特 -奥曼(Robert J. Aumann)和美 国经济学家托马斯·谢林(Thomas C. Schelling)
它是对于如何最好地利用身体(物质)的技 巧的一种算计。
2020/4/1
什么是策略博弈?
What is a Game of Strategy?
• 策略思考本质上涉及到与他人的相互影响。其他人 在同一时间、对同一情形也在进行类似的思考。
• 博弈论就是用来分析这样交互式的决策的。 • 理性的行为指的是:明白自己的目的和偏好,同时
• 某些博弈中,由于偶然的外因可以对策 略贴标签,或者参与者之间拥有某些共 同的知识体验,导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完 全不可能。
2020/4/1
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
• 教授们为何如此苛刻? • 如果允许某种迟交,而且教授又不能辨
博弈论与信息经济学
Game Theory and Economics of Information
2020/4/1
博弈论基本思想
• 人们在日常生活中进行着博弈,与配偶, 朋友,陌生人,老板/员工,教授等。
• 类似的博弈也在商业活动、政治和外交事 务、战争中进行着——在任何一种情况下 ,人们相互影响以达成彼此有利的协议或 者解决争端。
强调个人理性,其结果可能有效率, 也可能无效率。
2020/4/1
非合作博弈的基本分类
静态 动态
完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
2020/4/1
静态博弈与动态博弈
(static games and dynamic games)
别真伪,那么学生就总是会迟交。 • 期限本身就毫无意义了。 • 避免这一“滑梯”通常只有一种办法,
就是“没有例外”的策略。
2020/4/1
例3:为什么教授如此苛刻?
• 问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
• 他必须找到某种使拒绝变得强硬和可信 的方法。
• 拿行政程序或者学校政策来做挡箭牌 • 在课程开始时做出明确和严格的宣布 • 通过几次严打来获得“冷面杀手”的声
2020/4/1
常和博弈与非常和博弈
(constant-sum game and variable-sum game)
• 如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
• 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
• 如果双方都没有准备,他能够独立地编出一 个2020相/4/1 互一致的谎言吗?
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
• “乘客侧前轮”看起来是一个合乎逻辑的选择 。
• 但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之 ,是否她认为这一选择对你同样显然。…… 以此类推。
• 施锡铨编著,《博弈论》上海财大出版社,2000年版 。
• 谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
• 谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
2020/4/1
课程主要内容
第一章 完全信息静态博弈 第二章 完全信息动态博弈 第三章 不完全信息静态博弈 第四章 不完全信息动态博弈 第五章 委托-代理理论 第六章 逆向选择与信号传递
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
2020/4/1
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所 大学的教授。
乔治·阿克尔洛夫 1940年生于美国的 纽黑文,1966年获 美国麻省理工学院 博士头衔,现为美 国加利福尼亚州大 学经济学教授。
• 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
2020/4/1
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
• 我们无法从所有这样的博弈的结构中找 到一般和本质的东西,来保证这样的收 敛。
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为零,这个博 弈就叫零和博弈;
• 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为零 ,这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
• 正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
• 存2020在/4/1 双赢的博弈吗?
例2:焦点博弈 “We Can’t Take the Exam,
誉
2020/4/1
2020/4/1
2020/4/1
案例:囚犯困境
支付
嫌疑 人B
嫌疑人A
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
2020/4/1
Leabharlann Baidu传统微观经济学的比较
• 一致性 利益最大化原则 均衡原则 • 不一致 人与人之间的关系-个人理性导致集体非理
性-设计协调性机制-满足个人理性前提 下达到集体理性 信息不完全-委托-代理理论、信号传递与 信息筛选模型
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著 ,《信息经济学引论:激励与合约》,上海财经大学出 版社,2004年版。
• 即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
2020/4/1
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
2020/4/1
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2020/4/1
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨 (Joseph E. Stiglitz)
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
2020/4/1
如何在博弈中获胜?
• …… 真的能在博弈中(总是)获 胜吗?
获奖原因:“通过博弈论分析加强了 我们对冲突和合作的理解”所作出 的贡献而获奖。
2020/4/1
罗伯特·奥曼
2020/4/1
托马斯·谢林
2020/4/1
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效 率、公正、公平 • 非合作博弈(non-cooperative game)
2020/4/1
2020/4/1
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾 (Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
• 对手和你一样聪明! • 许多博弈相当复杂,博弈论并不
能提供万无一失的应对办法。
2020/4/1
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀 ,40%的人能得良好。
• 所有学生达成一个协议,大家都不要太用功 ,如何?想法不错,但无法实施!稍加努力即 可胜过他人,诱惑大矣。
2020/4/1
案例1:囚犯困境
支付
嫌疑 人B
Because We Had a Flat Tire”
• 两个学生想要推迟考试,谎称由于返校途中 轮胎漏气,未能很好地备考。
• 教授分别对他们提出了问题:“哪个轮胎漏 气?”如何应答?
• 他们本应该预计到教授的招数,提前准备好 答案。
• 在博弈中,参与者应该向前看到未来的行动 ,然后通过向后推理,推算出目前的最佳行 动。
2020/4/1
约翰·纳什 1928年生于美国
2020/4/1
莱因哈 德·泽 尔腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
• 是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
• 如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
2020/4/1
零和博弈与非零和博弈
• 按照大家是否清楚对局情况下每个 局中人的得益。
• “各种对局情况下每个人的得益是 多少” 是所有局中人的共同知识( common knowledge)。
• 据“共同知识”的掌握分为完全信 息与不完全信息博弈。
2020/4/1
完美信息博弈与不完美信息博弈
(games with perfect information and games with imperfect information)
• 常和博弈也是利益对抗程度最高的博弈 。
• 非常和(变和)博弈蕴含双赢或多赢。
2020/4/1
2020/4/1
• 张维迎著,《博弈论与信息经济学》,上海三联书店 、上海人民出版社,1996年版。
• Roger B. Myerson著:Game Theory(原文版、译文版 ),中国经济出版社,2001年版。
• 博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
2020/4/1
如何在“博弈”中获胜 ?
• 日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
• How can you win such games? • 许多博弈都包含着运气、技术和策略。 • 策略是为了获胜所需要的一种智力的技巧。
2020/4/1
2020/4/1
2020/4/1
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN} 有三个基本要素: (1)参与人(players)iN={1,2,…,n} ; (2)战略(strategies),siSi(战略空间); (3)支付(payoffs),ui=ui(s-i,si)。
2020/4/1
约瑟夫·斯蒂格利茨, 1943年生于美国的 印第安纳州,1967 年获美国麻省理工 学院博士头衔,曾 担任世界银行的首 席经济学家,现任 美国哥伦比亚大学 经济学教授
2005年诺贝尔经济学奖获得者
以罗伯特·奥曼色列经济学家罗伯特 -奥曼(Robert J. Aumann)和美 国经济学家托马斯·谢林(Thomas C. Schelling)
它是对于如何最好地利用身体(物质)的技 巧的一种算计。
2020/4/1
什么是策略博弈?
What is a Game of Strategy?
• 策略思考本质上涉及到与他人的相互影响。其他人 在同一时间、对同一情形也在进行类似的思考。
• 博弈论就是用来分析这样交互式的决策的。 • 理性的行为指的是:明白自己的目的和偏好,同时
• 某些博弈中,由于偶然的外因可以对策 略贴标签,或者参与者之间拥有某些共 同的知识体验,导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完 全不可能。
2020/4/1
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
• 教授们为何如此苛刻? • 如果允许某种迟交,而且教授又不能辨
博弈论与信息经济学
Game Theory and Economics of Information
2020/4/1
博弈论基本思想
• 人们在日常生活中进行着博弈,与配偶, 朋友,陌生人,老板/员工,教授等。
• 类似的博弈也在商业活动、政治和外交事 务、战争中进行着——在任何一种情况下 ,人们相互影响以达成彼此有利的协议或 者解决争端。
强调个人理性,其结果可能有效率, 也可能无效率。
2020/4/1
非合作博弈的基本分类
静态 动态
完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
2020/4/1
静态博弈与动态博弈
(static games and dynamic games)
别真伪,那么学生就总是会迟交。 • 期限本身就毫无意义了。 • 避免这一“滑梯”通常只有一种办法,
就是“没有例外”的策略。
2020/4/1
例3:为什么教授如此苛刻?
• 问题是,一个好心肠的教授如何维持如 此铁石心肠的承诺?
• 他必须找到某种使拒绝变得强硬和可信 的方法。
• 拿行政程序或者学校政策来做挡箭牌 • 在课程开始时做出明确和严格的宣布 • 通过几次严打来获得“冷面杀手”的声
2020/4/1
常和博弈与非常和博弈
(constant-sum game and variable-sum game)
• 如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
• 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
• 如果双方都没有准备,他能够独立地编出一 个2020相/4/1 互一致的谎言吗?
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
• “乘客侧前轮”看起来是一个合乎逻辑的选择 。
• 但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之 ,是否她认为这一选择对你同样显然。…… 以此类推。
• 施锡铨编著,《博弈论》上海财大出版社,2000年版 。
• 谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
• 谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
2020/4/1
课程主要内容
第一章 完全信息静态博弈 第二章 完全信息动态博弈 第三章 不完全信息静态博弈 第四章 不完全信息动态博弈 第五章 委托-代理理论 第六章 逆向选择与信号传递
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
2020/4/1
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所 大学的教授。
乔治·阿克尔洛夫 1940年生于美国的 纽黑文,1966年获 美国麻省理工学院 博士头衔,现为美 国加利福尼亚州大 学经济学教授。
• 也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
2020/4/1
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
• 我们无法从所有这样的博弈的结构中找 到一般和本质的东西,来保证这样的收 敛。
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为零,这个博 弈就叫零和博弈;
• 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为零 ,这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
• 正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
• 存2020在/4/1 双赢的博弈吗?
例2:焦点博弈 “We Can’t Take the Exam,
誉
2020/4/1
2020/4/1
2020/4/1
案例:囚犯困境
支付
嫌疑 人B
嫌疑人A
抵赖
坦白
抵赖 -1,-1 0,-9
坦白 -9,0 -6,-6
2020/4/1
Leabharlann Baidu传统微观经济学的比较
• 一致性 利益最大化原则 均衡原则 • 不一致 人与人之间的关系-个人理性导致集体非理
性-设计协调性机制-满足个人理性前提 下达到集体理性 信息不完全-委托-代理理论、信号传递与 信息筛选模型
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著 ,《信息经济学引论:激励与合约》,上海财经大学出 版社,2004年版。