13第十三章 博弈论(北大第2版)
博弈论
效用(英文:Utility),是经济学中最常用的概念之一。
一般而言,效用是指对于消费者通过消费或者享受闲暇等使自己的需求、欲望等得到的满足的一个度量。
正和博弈亦称为合作博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加。
负和博弈,是指双方冲突和斗争的结果,是所得小于所失,就是我们通常所说的其结果的总和为负数,也是一种两败俱伤的博弈,结果双方都有不同程度的损失那是定理在一个有n个博弈方的博弈G=﹛S1,…,Sn:u1,…,un}中,如果n是有限的,且Si 都是有限集(对i=1,…,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
是由纳什发现的。
美苏争霸的囚徒困境军备竞赛是囚徒困境的又一个典型例子。
下面讲的,源自30年前美国的博弈论课本,本书不敢掠美。
从军事上看,30多年前,美国和苏联是世界上的两个超级大国,它们相互对垒。
假定每一方都有两种策略选择,一个是扩军,发展战略核武器,甚至实施“星球大战”计划等;另一个是彻底裁军,直至不设军备。
如果双方都扩军,则各花费2 000亿美元用于军费。
彻底裁军,则军费为0。
在一个弱肉强食的世界上,如果美国裁军不设防,但是苏联扩军,苏联就可以任意欺侮和损害美国。
这样,美国会受到很大损失。
损失之大,直至丧失主权。
这使我们可以非正式地把这种情况下美国的赢利记做–∞,即负无穷大。
这时候,欺侮人的一方的赢利是多少呢?你可能想象应该是+∞,即正无穷大。
其实不然。
你想想,砍伐一片森林所造成的损失,难道可以用所得到的木材的价值来补偿吗?更不必说占领甚至炸毁对方一座城市,你所得到的远远低于对方的损失。
被欺侮一方的损失,并不会等量地转化为欺侮人的一方的利益,这常常是对抗的规律。
所以,在一方扩军欺侮别人而另一方裁军任人欺侮的情况下,我们假定欺侮人的一方将只掠夺到一个有限数额的财富,比方说10 000亿美元。
这10 000亿美元的掠夺成本是上面讲的2 000亿美元。
吉本斯博弈论2课件
■ 与x0相邻的节点是x0的后 续节 (successors ). x0的后续节点 是x1, x2
■ 对任何两个相邻的节点来说, 与 根相连接的路径更长的那个节点 是另一个节点的后续节.
■ 例3: x7 是x3的后续节点, 因为它
们相邻, 而且x7到 x0的路径比x3
到x0的路径更长
x4
x0 x1
x5
-1, 1
1 , -1
TT 1 , -1 -1, 1
Game theory-Chapter 2
17
Nash equilibrium
■完全信息动态博弈中的纳什均衡集(the set of Nash equilibrium)就是它的标准式的纳什均衡 集合.
Game theory-Chapter 2
18
弈可能的终点
x4
■ 例4: x4, x5, x6, x7, x8 都是终点 节
x0 x1
x5 x7
x2 x3
x6 x8
Game theory-Chapter 2
11
Game tree
■ 除终点节以外的任何节 点都代表了某个参与人.
■ 对于终点节以外的任意 后节续点节来的说边, 连缘接代它表和了它这的Player 2 个节点所代表的参与人 H 可能采取的行动
A
F
1, 2
A
F
2, 1
0, 0
2, 1
0, 0
Accommodate is the Nash equilibrium in this subgame.
Game theory-Chapter 2
26
Find subgame perfect Nash equilibria backward induction
博弈论2
定理3.3.1
如果阶段博弈G有纳什均衡,对任意有限或无限阶段 的T,重复博弈G(T)有子博弈完美纳什均衡:即在每 一阶段重复采用阶段博弈G的纳什均衡。
该定理的证明比较简单,只需验证它符合定义3.2.3规 定的子博弈完美纳什均衡的条件就可以了。
开环策略集
若局中人 i 在 t 阶段进行行动决策时,不知道该 阶段前其它局中人的行为选择,而又要在自己的原博弈 行动集 S i 中选择一个行动 sit Si ,这时他的策略称 为开环策略,全部开环策略称为开环策略集。 显然,对T次重复博弈,局中人 i 的开环策略集
5 i i j 1 j
(3.3.6) 现5位船主对其自身的游船的定价进行博弈,这是 一个静态的5人非合作博弈。
j 1
ui (s) Di ( si ) si 180si 6s si s j i 1, 2,3, 4,5
2 i
5
例3.3.2
ui 0 si
游船定价的博弈(续)
s (s1 , s2 ,, sn )为G的一个行动组合,且 是原博弈的纳什均衡点, P (s ) P (sc ) 。 局中人的策略为: i 对任意 i N 有: i
(1)第一阶段选择 s Si ,以后也一直选择行动 s ; (2)若第 t 阶段博弈前有任意其它局中人 j N \{i}
4 1 4 4 4 1
2
例3.3.1
价格战重复博弈(续)
当局中人1在第t期改变策略,局中人2具有前期信息反馈, t期时,局中人2也一定改变策略选择“降价”策略。 1 则在 t期时, 1 局中人1也能分析出局中人2的行为选择,因此在 局中人1也会选择“降价”行为。这样局中人1的总收益为:
博弈论2(方法论基础)
(2)行动 ACTIONS OR MOVES
• 参与人在博弈的某个时点的决策变量。 (坦白) • N个参与人的行动的有序集称为行动组合 (坦白,抵赖)。
11
行动的顺序
• 对于博弈的结果非常重要。有关静态和动 态博弈的区分就是基于行动的顺序做出的。 • 同样的行动集合,行动的顺序不同,每个 参与人的最有决策就不同,博弈的结果也 不同。尤其在不完全信息博弈中,后行动 者依赖观察先行动者的行动来获取信息。
• “搭便车”现象; • 公共物品,穷人和富人修路博弈(中产阶 级对社会的稳定作用); • 大股东对管理者的监督; • 天塌下来有高个子顶着。
31
性别战与先动优势
• 双均衡的性别战
女 足球 男 足球 芭蕾 芭蕾
2,1 0,0
0,0 1,2
32
一对谈恋爱的男女安排业余活动, 一对谈恋爱的男女安排业余活动 , 他们有二种选 或去看足球比赛,或去看芭蕾舞演出。 择,或去看足球比赛,或去看芭蕾舞演出。男方偏好 足球,女方偏好芭蕾,但他们宁愿在一起,不愿分开。 足球,女方偏好芭蕾,但他们宁愿在一起,不愿分开。 上表给出了这个博弈的得益矩阵。在这个博弈中, 上表给出了这个博弈的得益矩阵。在这个博弈中,如 果双方同时决定,则有两个纳什均衡, 果双方同时决定,则有两个纳什均衡,即都去看足球 比赛和都去看芭蕾演出。 比赛和都去看芭蕾演出。 但是到底最后他们去看足 球比赛还是去看芭蕾演出,并不能从中获得结论。 球比赛还是去看芭蕾演出,并不能从中获得结论。如 果假设这是个序列博弈,例如, 果假设这是个序列博弈,例如,当女方先作出选择看 芭蕾演出时,男方只能选择芭蕾; 芭蕾演出时,男方只能选择芭蕾;当女方先选择了看 足球比赛时,男方也只能选择足球。反之, 足球比赛时,男方也只能选择足球。反之,当男方先 选择了看足球比赛时,女方只能选择看足球比赛; 选择了看足球比赛时,女方只能选择看足球比赛;当 男方先选择了看芭蕾演出时,女方只能选择芭蕾。 男方先选择了看芭蕾演出时,女方只能选择芭蕾。
西方经济学第二版博弈论
六、共有财产
• 共有财产是指那些没有明确的所有者, 人人都可以免费使用的财产,包括共有 资源,比如海洋、湖泊、草场等资源。
• 如果能够对共有财产的产权进行重新构 造,使之界定明确,则可以改进资源配 置的效率。如果无法界定产权,则必须 通过法律或行政手段进行严格控制,才 能使共有财产免遭滥用。
一些经济学家认为,由于环境与生态资源属 于公共财产(common property),根本不可能做 到明确产权。
另一些经济学家则指出,即使可能做到明 确产权,除了当代人以外的受害者也无法亲自 维护自身的利益。
还有一些经济学家认为,由于在环境和生态 问题上,明确产权只意味着将某些权利给予某一 方,而不是具体的经济当事人,因而就存在着拥 有产权一方的某些经济当事人通过发出威胁来获 利的可能性,这就表明市场机制无法使环境污染 最优化。
图10-12 对完全垄断厂商征收一次总付税
习题
1. 什么是市场失灵?有哪些因素会导致市场失 灵?在市场失灵的情况下是否一定需要政府干预? 为什么?
2. 什么是逆选择?什么是败德行为?什么是委 托人-代理人问题?
3. 什么是外部性?为什么说外部性会使资源配 置效率受损?
4. 什么是公共产品?提供公共产品的效率条件
一、对完全垄断厂商的价格调节 二、对完全垄断厂商的税收调节
一、对完全垄断厂商的价格调节
• 由于与完全竞争厂商相比,完全垄断厂商 总是实行高价格、低产量政策,所以对 完全垄断厂商的价格调节是指对垄断产 品实行限价政策,也就是说政府的调节 价总是低于垄断价。
对于图10-9的 例子来讲,政府
使调节价P2等于 完全竞争价Pc时,
博弈论
12 完全信息静态博弈2 完全信息静态博弈2.1 基本分析思路和方法2.2 纳什均衡2.3 无限策略博弈分析和反应函数2.4 混合策略和混合策略纳什均衡2.5 纳什均衡的存在性2.6 纳什均衡的选择和分析方法扩展囚徒困境-3,-30,-5-5,0-1,-1坦白抵赖坦白抵赖甲乙上策:如果不管其他博弈方选择什么策略,一个博弈方的某个策略给他带来的得益始终高于其他策略,至少不低于其他策略,那么这个策略就是该博弈方的上策。
-3大于-50大于-1坦白是甲的上策坦白是乙的上策在乙选择坦白的情况下——甲选择坦白在乙选择抵赖的情况下——甲选择坦白严格上策的严格上策。
就称为博弈方那么,都有以及任一使得对任何,,博弈方存在策略合个博弈方的任何策略组如果对其他i s s s u s s u s s s s s s s s s n i i i i i i i i i i i n i i i ****111)(),(),,,,,(1−−−+−−′>≠′=−L L例1:博弈G 的得益矩阵如图所示:7,36,62,23,7上下左右甲乙。
“右”是乙的严格上策,“上”是甲的严格上策证明==*2*1:s s如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这样的策略组合就是该博弈的一个上策均衡。
(1)上策均衡如囚徒困境-3,-30,-5-5, 0-1,-1坦白抵赖坦白抵赖甲乙衡坦白,坦白):上策均策略组合(*=s 均衡——稳定的博弈结果(策略组合)严格上策均衡都成立。
对所有策略组合,不等式对于任何一个博弈方一个严格上策均衡:的为博弈满足以下条件,就称它,的一个策略组合。
如果;人博弈是设),,,(),,,,,(),,,,,,(},,2,1{),,(},,,{),,,(211111*11**2*1*1121**2*1*n n i i i i n i i i i n n n n n s s s s s s s s u s s s s s u n i G s s s s u u S S G n S S S s s s s L L L L L L L L L L L +−+−>∈==××∈=例1:7,36,62,23,7上下左右甲乙。
博弈论PPT解读
> 假定参与人1对参与人2的信念, 证明Z是最优反应策略
≥
静态环境下的行为分析 (严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集
合为最优反应策略集合,可理性化策略基于某一信念无法剔除 R={(U,L)} R={A,B} X {X,Y}
博弈论
演讲人
2021-03-21
目录
01. 博弈的表述 02. 静态环境下的行为分析 03. 动态环境下的行为分析
01
博弈的表述
博弈的表述
扩展型表示博弈
信息集与决策节点的关系
策略
策略空间(策略集合)
S={H,L}
1
2
单个策略
s=H
策略组合
(A,B)
3
4
策略组合的集合
S={A,B}X{C,D}={(A, C ),(A,D),(B,C),(B,D)}
0
3
最后对剩下的策略进行 检验
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出参与人1以1的概率选择某策略时,参与人2的最优反应策略
在B中,因此也在UD中
两方博弈,最优反应策略集合=非严格劣策略集合,B=UD
找出劣于其他纯策略的策略
不在UD中,也不在B中
最后对剩下的策略 进行检验
(严格劣策略的重复剔除法)重复占优法留下可理性化策略,可理性化策略集合 为最优反应策略集合,可理性化策略基于某一信念无法剔除
R={(U,L)} R={A,B} X {X,Y}
静态环境下的行为分析
定位博弈与合伙人博弈
分阶段剔除劣策略从而获得可理性化策略的集合,当剔除所有劣策略时, 上界和下界都会收敛于各参与人最优反应曲线相交的点
博弈论课件
脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。
博弈论最全完整-讲解课件
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
• 艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
• 因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
学习交流PPT
17
约翰· 海萨尼 1920年 生于美 国
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
学习交流PPT
18
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和 美国人威廉-维克瑞(William Vickrey)
托马斯·谢林
学习交流PPT
24
导论
三、博弈论的基本类型
学习交流PPT
25
合作博弈与非合作博弈
• 合作博弈(cooperative game) 达成有约束力的协议(binding
agreement),强调团体理性,强调效率、公 正、公平 • 非合作博弈(non-cooperative game)
强调个人理性,其结果可能有效率,也可能 无效率。
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分 析”领域做出了重要贡献。
学习交流PPT
21
迈克尔·斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所
• 也就是说,需要的是对这样的情况下该选什么 的预期的收敛。这一使得参与者能够成功合作 的共同预期的策略被称为焦点。心有灵犀一点 通。
北京大学微观经济学教案第十三章博弈论初步
第十三章博弈论初步目前博弈论发展的非常深入,这里只是介绍一些初步知识。
在四、五十年代,由冯·诺依曼(Von Neumann)、摩根斯坦恩(Morgenstern)把对策论、运筹学引入经济学,形成了最早的博弈论。
几时年来,博弈论在经济学中发挥着越来越大的重要作用,1994年的诺贝尔经济学奖就授予三位博弈论学家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)。
博弈论的英文是GAME THEORY,字面的意思是游戏策略,及用类似游戏中解决问题的方法,揭示解决社会、经济及其他领域问题的策略、对策,因此有的还把博弈论译成对策论。
准确的说博弈论是在给定的条件下寻求最优策略,这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响。
策略性活动在社会、经济、政治生活中大量存在,也可以说,整个社会、经济、政治生活都是博弈行为。
因此,博弈论作为一种方法,广泛的应用在经济、政治、军事、外交中,只是博弈论在经济学中应用的最广泛、最成功。
如前面介绍过的古诺均衡、STACKELBERG均衡、CHAMBERLIN 均衡、BERTRAND 均衡、HOTELLING 均衡,都属于经济学中的博弈过程。
第一节基本概念一、博弈论1.定义:博弈论是描述、分析多人决策行为的一种决策理论,是多个经济主体在相互影响下的多元决策,决策的均衡结果取决于双方或多方的决策。
如下棋,最后的结果就是由下棋双方你来我往轮流做出决策,决策又相互影响、相互作用而得出的结果。
2.博弈论与优化理论的异同点1)相同点:博弈论与优化理论都是在给定的条件下,寻求最优决策的过程;2)不同点:A.优化理论可以看成是单人决策,而博弈理论可以看成是多人决策。
在优先理论的决策过程中,影响结果的所有变量都控制在决策者自己手里;而在博弈论的决策过程中,影响结果的变量是由多个决策者操纵的。
如企业在追求成本最小化、产量最大化、利润最大化的过程中总是假定外部条件给定,这实际上表明是一个优化问题,因为除了给定的外部条件外,剩下的因素都有决策者来控制,从而决策者自己就能控制决策的结果;如果外部条件不是给定的,而是有其他主体参与的过程,这时的决策过程就变成了一个博弈过程了,因为决策的最终结果不但取决于决策者本身,而且也取决于其他决策者的决策。
第九章:博奕论和信息经济学初步(微观经济学-北师大-杨波)全篇
纳什均衡
“情侣之争”均衡的特点是:女士选择方案确定后,男士会选择最有利的方案;男士选择方案确定后,女士会选择最有利的方案。这种假定对手已选定策略,局中人所选择的最有利方案称为纳什均衡。在纳什均衡中,不可能通过任何调整,使局中人的收益有所改善。
在经济学中的应用;厂商为什么要做广告
思考:
1、卡特尔协议为什么不稳定,用本节理论来解释。 2、囚徒困境实际上反映了个人理性与集体理性的分离,用它来分析说明无序的竞争也许是有害的。
练习:
古董案:存在均衡解吗? 斗鸡博奕:存在占优均衡或纳什均衡吗?
收益表:
寡头博弈
(300,300)
(1300,500)
(500,1300)
二、信息经济学
1、信息不对称市场之逆向选择 2、信息不对称市场之道德风险
S S
历史人物:
阿克劳夫、斯蒂格里茨 斯蒂格里茨的箱子。
1、逆向选择
定义:逆向选择是一种信息不对称的市场行为,其特征是在事前(合同前)市场参与者掌握的信息是不对称,市场参与者的一方隐蔽相关信息,由此,市场出现的不是优化选择,而是劣化选择。市场失效。
第九章:博奕论和信息经济学初步
一、博奕论初步 二、信息经济学初步
一、博奕论初步
引入:田忌赛马 行动特点:根据对手的行动,再进行决策。 决策特点:对手不同的行动,自己的决策也不同。
代表人物:
冯·诺依曼 纳什、海萨尼、泽尔腾。 (林德贝克、斯塔尔)
基本概念
第一个要素是局中人或称作参与者,就是博弈过程的参加者,或者说是选择过程的主体。 第二个要素是策略或称作战略,就是局中人的行为方案。局中人选择时采取的策略集合称作结果。战略与行动是不一样的。 第三个要素是收益,就是局中人追求目标的成果,例如,利润和效用。 博弈论的基本出发点是:假定竞争对手已经进行了充分的选择,在此基础上选择自己的最有利的策略;同时,对手所进行选择时也是如此。(非合作博奕)
13第十三章 博弈论和竞争策略 中央财经大学 张苏
9
• The situation is totally different now. Scientific journals and advanced textbooks are filled with analyses that build on game theory, as it has been developed by this year's Laureates in economics, John Nash, John Harsanyi and Reinhard Selten.
•
But after one semester as a chem. eng. student I reacted negatively to the regimentation of courses such as mechanical drawing and shifted to chemistry instead. But again, after continuing in chemistry for a while I encountered difficulties with quantitative analysis where it was not a matter of how well one could think and understand or learn facts but of how well one could handle a pipette and perform a titration in the laboratory. Also the mathematics faculty were encouraging me to shift into mathematics as my major and explaining to me that it was not almost impossible to make a good career in America as a mathematician. So I shifted again and became officially a student of mathematics. And in the end I had learned and progressed so much in 4 mathematics that they gave me an M. S. in addition to my B. S. w hen I graduated.
博弈论1 (2)全篇
6
四、古典博弈论的三个基本假设:参与人是理性的;他们有 这些理性的共同知识;他们知道博弈规则。
理性的三个基本内涵:理性的局中人具有关于博弈的完全知 识;可以确切知道整个状态空间;具有相对无限的逻辑能力。
五、博弈的典型例子
1 .囚徒困境 坦白
坦白
不坦白
-6,-6 -1,-8
3
2、博弈与一般决策的区别
二、博弈模型要素
1、参与人:博弈中的决策主体。他的目的是通过选择策 略以最大化自己的支付(效用)水平。
虚拟参与人(自然):指决定外生的随机变量的概率分布 的机制。自然作为虚拟参与人没有自己的支付与目标函数, 即所有的结果对它都是无差异的。
2、策略:参与人在给定信息集(信息集包含了一个参与人有关 其他参与人之前行动的知识,可理解为参与人在特定时刻有关 变量值的知识。一个参与人无法准确知道的变量全体属于一个 信息集)的情况下的行动规则。它规定参与人在什么时候选择 什么行动。[策略是可供局中人选择对付其它局中人的完整行动 方案。]
21
例 某个地方的居民均匀地环绕一个圆形湖居 住。两小贩来此地推销商品。1)若居民都选 择离自己较近的小贩购买商品,问小贩选择推 销地点博弈的NE是什么?2)若有三个小贩同 时到此地推销商品,则推销地点博弈的NE又是 什么?3)若圆形湖的周长是1(千米),居民 的购买量是Q=1-D,D为居民与小贩推销点距 离,则两个和三个小贩博弈的NE各是什么?
14
例6 设 s1 [10,0] s2 [3,0]
u1 (s) 10s1 7s1s2 s12
u2 s 15s2 5s1s2 s22
求NE。
15
例7 设 s1 [10,0] s2 [3,0]
(完整版)博弈论知识点总结
博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(P,l),其中P为市场价格,丨为消费者可支配收入。
2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
rock
0,0
1,-1 -1,1
-1,1
0,0 1,-1
1,-1
-1,1 0,0
Person A
paper scissors
11
(3)The Battle of the Sexes(性别之战或恋爱博弈)
• 两个恋人:小丽和小勇 • 策略:看歌剧和看足球赛 • 得益:若小勇同意陪小丽看歌剧,小 丽得益(或效用)为2,小勇得益为1; 若小丽同意陪小勇去看足球赛则小勇 得益为2,小丽得益为1;否则双方得 益都为0。
(D,R)是不是可能的最优选择?
Player B L R U
Player A
(3,9) (1,8)
D
(0,0) (2,1)
如果B选择R,A的最优反应是D; 如果A选择D,而B的最优反应是R. 所以, (D,R)是一个可能的最优组合
27
(D,L)是不是一个可能的最优组合
Player B L R U
18
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
19
Prisoners’ Dilemma
• Prisoners’ Dilemma 结果:
– Player A – 占优策略:招供(confess) – Player B – 占优策略:招供( confess)
38
This is called Iterated Elimination of Dominated Strategies.
• 使用重复剔除劣策略法的前提:
– 1.确信任何理性博弈参与人都不会使用严格 占劣策略。 – 2.上述理性条件是一种公共知识(This rationality requirement is common knowledge).
• 公共知识(Common Knowledge): Everybody knows everybody knows everybody knows ...
39
• 下列博弈是否可以使用占劣策略?
Left Top Middle Bottom 3,2 3,6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
• 此时实现占优策略均衡:
– 双方都采取“招供”
20
一、占优策略及占优策略均衡
• 1.占优策略(Dominant strategy) – 在某个博弈中,如果不管其他博弈方选择 什么样策略,一博弈方的某个策略给他带 来的得益始终高于其他策略,至少不低于 其他策略,则该策略就是该博弈方的占优 策略。
21
9
Matching Pennies (猜硬币博弈) 的表达 Player B
Heads Tails
Heads Player A
-1, 1
1, -1
Tails
1, -1
-1, 1
A手握硬币让B猜测手中硬币的正反面
10
(2)Rock-scissors-paper Game
Person B
rock paper scissors
23
进一步对占优策略均衡的理解:
• 1.占优策略的实施并不依赖于其他博弈 参与人的策略选择,就是说,不管其他 人选择什么策略,他的占优策略均衡都 是唯一的。 • 2.占优策略均衡反映了所有博弈方的绝 对偏好,因此非常稳定。 • 3.根据占优策略均衡可以对博弈结果作 出最肯定的一致预测,有明确的结果。 且结果是唯一的。
如果B选择L,则A的最优反映肯定是U; 如果A选择U,则B的最优反映肯定是L。 所以, (U,L)是一个可能最优选择组合。 29
Nash Equilibrium: Matrix
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
(U,L) 和(D,R)是该博弈的两个最优策略组合,即在 每个组合中,每个人的策略都是给定其他参与人策略 情况下的最优反应。 一旦实现了有这两个组合所表示的均衡时,没有一个 人愿意偏离该均衡。这样的均衡被称为纳什均衡。 30
3r d 1s t
2n d
4 t
40
2.划线法求解NE B
Left Top 3,2 6 1,1 Center 5,4 4,2 6,3 Right 4,3 2,5 5,4
41
A
Middle Bottom
Game B
B
L
T 3, 5
R
1, 4
A
C
2, 6
4, 5
B
1, 2
0, 3
42
―猜硬币博弈‖是否有纳什均衡?如何求解?
一、博弈论定义
• 博弈论就是指研究多个个体 在平等的对局中各自利用对 方的策略变换自己的对抗策 略,以实现自己利益最大化 的学科。
6
二、如何表达一个博弈现象
在研究中任何博弈要考虑到
博弈参与者有哪些?数量如何? 博弈的规则或制约条件如何? 对手策略与自身的对应策略? 各种策略下自己的收益如何?
24
例子
Player B L R
U Player A D
(3,9) (1,8)
(0,0) (2,1)
25
(U,R)是最优选择吗?
Player B L R
U Player A
(3,9) (1,8)
(0,0) (2,1)
D
如果B选择R,A的最优选择是D; 如果A选择U,B的最优选择是L。 26 所以, (U,R) 不是一个可能的最优选择。
第十章
博弈论与厂商的 策略性行为
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
2
本章内容:
• • • • 第一节 博弈论概述 第二节 纳什均衡 第三节 子博弈精炼纳什均衡 第四节 重复博弈
3
简单经济学说史 – 1950’s-- era of general equilibrium – 1960’s-- era of growth – 1970’s—era of economics of information – 1980’s – era of game theory – 1990’s—era of new institutional economics
15
三、博弈的分类
1.静态博弈和动态博弈
静态博弈:是指所有博弈方同时或可看作同 时选择策略、采取行动的博弈。 动态博弈:是指博弈方的选择、行动有先有 后,而且后选择、后行动的博弈方在自己进 行选择、行动之前可以看到在他之前选择、 行动的博弈方的选择、行动的博弈。
16
2.完全信息博弈和不完全信息博弈
• 这个唯一剩下的策略组合被称为重复剔 除劣策略的占优策略均衡
37
Repeated elimination can find the NE
B
Left Top 3,2 1,6 1,1
2n d
Center 5,4 4,2 6,3
4th
Right 4,3 2,5 5,4
3 r 1 d st
A
Middle Bottom
32
四、如何求解纳什均衡?
• 第一种方法:占劣策略剔除法 • 第二种方法:划线法
33
Game A
B Playe Black Red r A Play er
Red Black 2,2 0,5 5,0 3,3
34
Game B
L
T 3, 5
R
1, 4
C
2, 6
4, 5
B
1, 2
0, 3
35
Solution: Iterated Elimination
B
L
T 3, 5
R
1, 4
2nd
3rd
A
C
2, 6
4, 5
B
1, 2
0, 3
1st
36
2.占劣策略重复剔除法 Elimination of Dominated Strategies
• 基本思路:
– 基于完全信息和理性的假定,首先找出某个 参与人的劣策略(若存在),剔除这个劣策 略后,重新构造一个不包含剔除劣策略的新 博弈,然后再剔除某个参与人的劣策略;重 复这一过程,一直到只剩下一个唯一的策略 组合为止。
二、纳什均衡及其含义
• “纳什均衡”
– 指这样一种策略组合,在给定别人策 略选择的情况下,没有任何单个参与 人有积极性选择其他策略。 – 或者说,没有人可以通过单方面改变 自己的策略而提高自己的得益的状态。
31
纳什均衡的进一步理解
– 第一,在该策略组合中,每个参与人的策略都是 给定其他参与人的策略情况下的最佳反应。 – 第二,该策略具有自我实施(self-enforcing)的功 能。 – 第三、一旦实现了纳什均衡,任何博弈方都没有 积极性偏离该均衡状态。 – 第四、占优策略均衡一定是纳什均衡,但纳什均 衡不一定就是占优策略均衡。
– 2000’s—Now: Micro-foundation of Macroeconomics………
4
何谓博弈
• 本义:下棋 • 下棋的特点是什么? • 下棋和企业的市场竞争 有何共同点?
– 有规矩,讲策略,争输 赢
• 西方:game
– 含义比下棋更全面 – 竞争、合作
5 2016/10/15
5
12
The Battle of the Sexes(性别之战或恋爱博弈)
小丽
Football Opera
Football
2,1
0,0
小勇
Opera
0,0
1,2
13
(4)The Game of Chicken(斗鸡博弈)