博弈论第8讲
博弈论PPT课件
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
博弈论 蒋文华 浙江大学
第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。
第一章何为“博弈”博:博览全局弈:对弈棋局→谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。
第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。
特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提示:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。
由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。
博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。
特别提示:站在别人的立场上想一想,就是为自己未来的遭遇着想。
——米兰·昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。
----汉代刘向,《围棋赋》二、西方的理解game(规则)费厄泼赖(fair play)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。
二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。
博弈论讲义完整PPT课件
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页
高级微观经济学 第八章 博弈论
第八章 博弈论前面章节对经济人最优决策的讨论,是在简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(Game Theory)。
最近十几年来,博弈论在经济学中得到了广泛应用,在揭示经济行为相互制约性质方面取得了重大进展。
大部分经济行为都可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。
第一节 博弈事例博弈是一种日常现象,例如棋手下棋,双方都要根据对方的行动来决定自己的行动,双方的目的都是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个以上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益都取决于所有当事人的行动。
当所有当事人都拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,并把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
在每个局中人的收益都依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人都必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(Matching Pennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人都有一块硬币,并且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,每个局中人可选择的策略都有两种:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。
当甲和乙都作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
第八讲 有限理性及其对博弈的影响
协调博弈的优先博弈方快速学习模型
12
8.2.1 协调博弈的有限博弈方快速学习模型
全部采用 A 或 B 的情况不需讨论,采用 A 策略博弈方 数量和位置有实质差异的只有 6 种情况
A B B B A B B A A A A A A A B A B A A B A A A B
B
初次博弈为 1A 的最优反应动态 (已包含有相邻 2A ,非相连 3A 和 4A 三种情况)
核心:博弈方策略类型比例是动态变化的,其变
化速度可用动态复制方程表示:
dx dt x ( u y u)
x 0时,无模拟榜样,博弈方不会有意识地改变策略。 x 0 时,若变化率为正,采用“同意”策略的博弈方
逐渐增多;若变化率为负,采用“不同意”策略的博弈 方逐渐增多。
x( x x 2 ) x 2 (1 x ) x 2 x 3
分析过程如下协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型13策略博弈方数量和位置有实质差异的只有种情况初次博弈为1a的最优反应动态已包含有相邻2a非相连3a4a三种情况协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型14初次博弈为相连3a的最优反应动态初次博弈为相邻2a的最优反应动态协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型15进化稳定策略在博弈方的动态调整策略中能达到又对少量偏离的扰动有稳健性满足这两种性质的稳定状态称进化稳定策略ess分析现实问题必须根据实际情况建立分析框架协调博弈的优先博弈方快速学习模型协调博弈的优先博弈方快速学习模型16博弈方策略连续分布时的最优反应动态分析以古诺模型为例两个寡头的反应函数分别是个单位
博弈论完整版PPT课件
ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
博弈论PPT资料整理
博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。
第八讲 蜈蚣博弈
A —— B —— A ——…… A —— B —— A —— B —— (10,10) | * * * * | * * * | * * * * * * | * * * *| * * * * | * * * | (1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
A —— B —— A ——…… A —— B —— A —— B —— (10,10) | * * * * | * * * | * * * * * * | * * * *| * * * * | * * * | (1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
A —— B —— A ——…… A —— B —— A —— B —— (10,10) | * * * * | * * * | * * * * * * | * * * *| * * * * | * * * | (1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
感悟
• 这就是一个五年期限的倒后推理过程。实际上还可以延长 或缩短时问跨度,但思路是一样的。 • 当你无所茫从的时候,一定要停下手来,静静地问一下自 己:五年后你最希望得到什么?哪些事情能够帮助你达到 目标?你现在所做的哪些事情有助于你达到这个目标吗? 如果不能,你为什么要做?只有你能清清楚楚地回答这些 问题时,休才能算是具备了学习人生博弈的最基本的条件。 如果无法回答这些问题,那么就需要检讨一下自己想要成 为什么样的人。 • 如果你没有清晰的目标,就会被诅咒一辈子,为那些有清 晰目标的人工作,事实就是如此。当你在人才上奔波时, 所追求的不是为了达成自己的目标,而是努力为了达成别 人的目标,就是这么简单。
博弈论最全完整-讲解课件
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年 生于美 国
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和 美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效率、公 正、公平 • 非合作博弈(non-cooperative game)
强调个人理性,其结果可能有效率,也可能 无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分 析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所
• 也就是说,需要的是对这样的情况下该选什么 的预期的收敛。这一使得参与者能够成功合作 的共同预期的策略被称为焦点。心有灵犀一点 通。
《博弈论》精品讲义
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009
博弈论全套课件
三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论,流传最广的是一个叫做“囚 徒 困 境 ” 的 故 事 。 这 个 博 弈 是 1950 年 图 克 (Tucker)提出的,这个博弈模型提出后曾引 发了大量的相关研究,也有许多关于“囚徒困 境”的版本。“囚徒困境”对博弈论的发展起 到了巨大的推动作用。可以说凡是讲博弈论, 都会说到这个经典的博弈模型。
在过去二三十年中,博弈论已成为社会科 学研究的一个重要方法。有人说,如果未来社 会科学还有纯理论的话,那就是博弈论。无论 是合作博弈还是非合作博弈都给我们提供了一 种系统的分析方法,使人们在其命运取决于他 人的行为时制定出相应的战略。特别是当许多 相互依赖的因素共存,没有任何决策能独立于 其它许多决策之外时,博弈论更是价值巨大。
最近十几年来,博弈论在经济学尤其是微 观经济学中得到了广泛的运用, 博弈论在许多 方面改写了微观经济学的基础,经济学家们已经 把研究策略相互作用的博弈论当作最合适的分 析工具来分析各类经济问题,诸如公共经济、 国际贸易、自然资源、企业管理等。在现代经 济学里,博弈论已经成为十分标准的分析工具。 除经济学以外, 博弈论目前在生物学、管理学 、国际关系、计算机科学、政治学、军事战略 和其他很多学科都有广泛的应用。现在已经有 愈来愈多的人开始关注、了解并学习博弈理论 。
博弈论(Game Theory)是一种关于游戏的 理论, 又叫做对策论, 是一门以数学为基础的、 研究对抗冲突中最优解问题的学科。事实上, 博弈论也正是衍生于古老的游戏,如象棋、围 棋、扑克等。
博弈论作为一门学科,是在20世纪50~60 年代发展起来的,当非零和博弈理论、特别是 不完全信息博弈理论获得充分发展时,才成为 现实。到20世纪70年代,博弈论正式成为主流 经济学研究的主要方法之一。1994年诺贝尔经 济学奖同时授予了纳什、泽尔腾、海萨尼三位 博弈论专家。2005年诺贝尔经济学奖又授予了 美国经济学家托马斯.谢林(Thomas Schelling)和以色列经济学家罗伯特.奥曼 (Robert Aumann),以表彰他们在合作博弈 方面的巨大贡献。
《博弈论》精品讲义
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
5
1.博弈现象
➢田忌赛马:正确的策略可以反败为胜。 ➢囚徒困境:
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论20092009
正大光明 公正無私
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论20092009
正大光明 公正無私
如两人写的一样, 就 认为他们讲真话, 并 按 所 写数额赔偿;如果两人写的不一样,就认定低 者讲真话,并照此价格赔偿。同时,对讲真话的 旅客奖励2元钱,对讲假话的旅客罚款2元。
理性原则下,他们会写多少价格呢?
博弈论20092009
正大光明 公正無私
11
2. 博弈概念
➢什么是博弈:
个人或团体间在依存和对抗、合作和冲突 中的决策问题。
正大光明 公正無私
43
∴I的最优混合策略为
(1,2)
(1, 4
3) 4
同理,II的最优混合策略为
G=8
(1,2)
(1, 2
1) 2
博弈论-8
11
不完全信息古诺模型
22
此时卖者认为买者的期望报价
1 ab cb ps xdx cb E[ pb (vb ) pb (vb ) ps ] P pb (vb ) ps 1 ( ps ab cb ) 2
卖者目标函数
1 max[ ( ps E[ pb (vb ) pb (vb ) ps ]) vs ] P[ pb (vb ) ps ] ps 2
第5章 不完全信息静态博弈
1
本章概要
不完全信息博弈 海萨尼转换 不完全信息静态博弈的战略式表述 贝叶斯均衡 贝叶斯均衡与混合战略 机制设计理论初步 显示原理
2
不完全信息博弈 古诺博弈
企业1和2的成本可能高(cH),也可能低(cL) 企业1和2互不知道对方边际成本的情况下进行产量竞 争
问题——双方如何报价?如何成交?
18
分析过程
P(b j bi ) P[V (b j ) V (bi )]
当参与人i叫价bi时,获胜的概率是对方叫价低于bi的概率 ,或者等价地说,是对方的保留价格低于V (bi)的概率。 由于参与人对该物品的保留价格是 [0,1]上的均匀分布, 这一概率就等于V (bi)。所以,一个具有保留价格vi、叫价 bi的参与人的期望支付为: V (bi) ×(vi-bi)+[(1-V (bi)] ×0 从而他的目标是: max V (bi )(vi - bi ) 一阶条件
博弈论最全完整-讲解
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
存在双赢的博弈吗?实用文档
6
例2:焦点博弈 “We Can’t Take the Exam,
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
实用文档
17
约翰·纳什 1928年生于美国
莱因哈 德·泽 尔腾, 1930 年生于 德国
实用文档
约翰· 海萨尼 1920年 生于美 国
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
实用文档
19
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英 国
实用文档
20
2001年诺贝尔经济学奖获得者
实用文档
35
第一章 完全信息静态博弈
博弈论的基本概念及战略式表述 纳什均衡
纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
实用文档
36
第一节 博弈论的基本概念
与战略式表述
Байду номын сангаас
实用文档
37
博弈论的基本概念与战略式表述
博弈论(game theory)是研究决策主体的行 为发生直接相互作用时候的决策以及这种 决策的均衡问题。
《博弈论》课程课件
破釜沉舟这种策略实际上有很多的变种。
36
3、企业应该在什么时候诚实 这里我们考虑一个所谓的诚信企业的动态博 弈,
占便宜 到诚信公司 顾客 不到诚信公司 诚信公司赚1000元 顾客损失2000元
25
这个模型是这样的:
第一个模型 假设:地球是圆的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到远方驶来 船只的船桅,并逐渐看到船的下部(与现实 中观察到的事实相符)
26
第二个模型
假设:地球是平的 已知:光线是按直线行走的(现实中观 察到的事实) 那么:在港口的人,首先看到的是整个 船身(与现实中观察到的事实相悖)
18
博弈论在研究的过程中有两个基本前提假设 一是,理性人假设。 二是,博弈结构对参与者是公共知识。特别
是,参与者满足完美回忆。
19
例6 旅行者困境 两个旅行者在旅游圣地买了两个花瓶,但在 回程途中被航空公司打碎。航空公司知道花 瓶大约值100元,但并不清楚花瓶的确切价 格。于是,航空公司要求两位旅客各自写下 花瓶的价格,并按照两个旅客中所写的最低 价格进行赔偿(航空公司认为写最低价格的 旅客讲的是真话),为了鼓励旅客讲真话, 规定对讲真话的旅客奖励2元,对讲假话的旅 客罚款2元。容易证明,在理性人的假设下, 这个游戏唯一的结果是两人都写0。
22
表 1 博弈的分类和均衡概念
完全信息 静态 非完全信息
完全信息静态博弈 非完全信息静态博弈 (纳什均衡) (贝叶斯均衡)
完全信息动态博弈 非完全信息动态博弈 动态 (子博弈精炼均衡) (序列均衡)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
说参与人i知道自己的收益函数等同于说参与 人i知道自己的类型,类似地,说参与人i可能 不确定其他参与人的收益函数,也就等同于 说参与人i不能确定其他参与人的类型。
tk 表示参与人i的第k种类型(参与人i共有
K种类型;Ti 表示参与人i的类型空间(类
型集),既Ti ={t1,…tk};
t={t1,…ti,…,tn }表示一个类型组合,
Definition (贝叶斯纳什均衡) 在静态贝叶斯博弈G={A1, …,An; T1 , …,Tn; P1 , …,Pn; μ1 , …, μn}中,如果对 任意博弈方i和他的每一种可能的类型ti∈Ti , si*(ti)所选择的行动ai都能满足: max ∑{ ui[s1*(t1), …,si-1*(ti-1), ai ,
引入一个虚拟的参与人,记为N。无须确 定它的收益函数;它的唯一作用是决定 Ti ={t1,…tk ,…,tK }及 Pi ={p1,…pk ,…,pK }; N把参与人i的真实类型只告诉参与人i自 己,把Ti ={t1,…tk ,…,tK }及 Pi ={p1,…pk ,…,pK } 告诉所有参与 人;
静态贝叶斯博弈定义
给定参与人i只知道自己的类型θi,而不知 道其他参与人的类型θ-i,参与人i将选择 ai(θi)以最大化自己的期望效用。参与人i 的期望效用函数定义为
vi pi (i | i )ui (ai (i ), ai (i );i ,i )
i
Definition(策略): 在静态贝叶斯博弈G={A1, …,An; T1 , …,Tn; P1 , …,Pn; μ1 , …, μn}中,参与人i 的一个策略就是一个类型依存的函数si(ti) , 其中对Ti ,中的每一个类型ti,si(ti)包含了自 然赋予i的 可能类型为ti时,i将从自己的策 略空间Si中选择策略si或者说从自己的行动 空间Ai中选择行动ai。
表3-1 市场进入博弈:不完全信息 在位者 低成本情况 默许 斗争 30, 80 -10, 100 0, 400 0, 400
高成本情况 进入 进入者 不进入 默许 40. 50 0, 300 斗争 -10, 0 0, 300
一个简例:市场进入博弈
但进入者不知道在位者究竟是高成本还是低成本,因 此,进入者的最优选择依赖于他对在位者成本的信念。 表3-1 市场进入博弈:不完全信息 在位者 低成本情况 默许 斗争 30, 80 -10, 100 0, 400 0, 400
ai∈ Ai
t-i
si+1*(ti+1), …, sn*(tn), ti] p(t-i︱ ti}
则称策略组合 s*=(s1*,…, sn*)为G的 一个 (纯策略)贝叶斯纳什均衡。(BNE)
贝叶斯纳什均衡(Bayesian Nash Equilibrium)
N人不完全信息静态博弈的纯战略贝叶 斯纳什均衡是一个类型依存的战略组合 {ai*, i=1,…,n},其中每个参与人i在给定 自己类型θi和其他参与人类型依存战略a*(θ )的情况下,最大化自己的期望效用 i -i 函数vi。
假定在位者有两种可能成本函数:高成 本和低成本。对应两种不同成本的不同 策略组合的支付矩阵如表3-1所示。
一个简例:市场进入博弈
如果在位者是高成本
表3-1 市场进入博弈:不完全信息 在位者 低成本情况 默许 斗争 30, 80 -10, 100 0, 400 0, 400
高成本情况 进入 进入者 不进入 默许 40. 50 0, 300 斗争 -10, 0 0, 300
ti-1 ={t1,…ti-1 , ti+1 ,…,tn }表示除参与人 i之 外其他参与人的类型组合。
注意: Ti ={t1,…tk ,…,tK }及 Pi ={p1,…pk ,…,pK } 是common knowledge 对存在private information 的博弈,1967 年前被认为是没法分析的。1967-1968年 Harsanyi提出了如下的解决办法: “Harsanyi Transformation‖
如果在博弈中至少有一个参与人不知道 其他参与人的收益函数,则称该博弈为 不完全信息博弈。
This chapter begins our study of games of incomplete information, also called Bayesian games. Recall that in a game of complete information the players’ payoff functions are common knowledge. In a game of incomplete information, in contrast, at least one player is uncertain about another player’s payoff function.
高成本情况 进入 进入者 不进入 默许 40. 50 0, 300 斗争 -10, 0 0, 300
一个简例:市场进入博弈
假定进入者认为在位者是高成本的概率 是p,则是低成本的概率是(1-p)。
进入者进入的期望支付是p(40)+(1-p)(-10) 进入者不进入的期望支付是0 比较上面两个表达式,可知进入者的最优 选择为 如果p≥1/5,进入;如果p<1/5,不进入。
上次内容回顾
子博弈完美均衡与纳什均衡(BI)
先动优势?后动优势?
讨价还价博弈
多阶段静态博弈
前向归纳法 重复博弈与连锁店悖论
1
不完全信息静态博弈
STATIC GAME OF INCOMPLETE INFORMATION
不完全信息
在前面的分析中,我们假定收益函数是 所有参与人的共同知识(Common Knowledge)
如果在位者是低成本
表3-1 市场进入博弈:不完全信息 在位者 低成本情况 默许 斗争 30, 80 -10, 100 0, 400 0, 400
高成本情况 进入 进入者 不进入 默许 40. 50 0, 300 斗争 -10, 0 0, 300
一个简例:市场进入博弈
进入者最优行为是不进入,在位者最优行为是斗 争(一旦低成本者进入)。
静态贝叶斯博弈定义
N人静态贝叶斯博弈的战略式表述包括: 参与人的类型空间Θi,条件概率p1,…,pn, 类型依存战略空间为Ai(θi), 类型依存收 益函数ui(ai,a-i; θi), i=1,…,n。参与人i知 道自己的类型θi(属于Θi),条件概率 pi=pi(θ-i| θi)描述给定自己属于θi的情况下, 参与人i关于其他参与人类型的一个估计。 可以用G={Ai; θi;pi; ui; i=1,…,n}表示这个 博弈。
所有参与人同时行动,从各自的A中选择a;
除N之外所有参与人的收益函数为 μi={a1,… ai,…, an ; ti}。 由此,某个参与人对参与人i的类型不确定转 变成N决定参与人i的类型,从而可利用 Bayesian法则进行分析。
Definition The normal-form representation of an n-player static Bayesian game specifies the players’ action spaces A1, …,Ai, …An, their type spaces T1 , …, Ti , … ,Tn , their beliefs P1 , …, Pi , … ,Pn , and their payoff functions μ1 , …, μi , … ,μn. Player i’s type, ti ,is privately known by player i, determines player i’s payoff function, μi={a1,… ai,…, an ; ti}, and ti is a member of the set of possible types, Ti . Player i’s belief P-i describes i’s uncertainty about the n-1 other players’ possible types.We denote this game by G={A1, …,An; T1 , …,Tn; P1 , …,Pn; μ1 , …, μn}.
贝叶斯纳什均衡(Bayesian Nash Equilibrium)
换言之,战略组合a*=(a1*(θ1),…i,以及ai属于Ai,有下式成立。
ai ( i ) arg max pi ( i | i )ui (ai ( i ), ai ( i ); i , i )
不完全信息
一些不完全信息的例子
与一个陌生人打交道 购买一幅艺术品 一个企业想进入某个市场 参与投标的各个厂商 消费者不知道企业产品的真正质量 用人单位不知道应聘者的真正水平和能力 二手车市场,买家不知道旧车的真正状况。。。。
Private Information:共同知识之外的 信息;只有参与人i自己知道,其他参与 人不知道的信息。 例如: C2=CL?还是C2= CH? 厂商2自 己知道,厂商1不知道, C2是厂商2的 私人信息。 类型Types:对参与人私人信息的一个完 备描述。
* ai
i
贝叶斯纳什均衡(Bayesian Nash Equilibrium)
类似地,可以定义混合策略贝叶斯纳什 均衡。此处从略。
均衡的存在形式、纳什均衡存在性定理 的推广,此处从略。 通过海萨尼转换,不完全信息静态博弈 就转化成完全但不完美信息博弈
一个简例:市场进入博弈
一个企业决定是否进入一个新的产业, 但不知道在位企业的成本函数,也不知 道一旦进入,在位者决定默许还是斗争。
一个简例:市场进入博弈
进入者最优行为是进入,在位者最优行为是默许。