博弈论讲义3(1)
博弈论讲义完整版
第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈
一 博弈的基本概念及战略表述 二 占优战略(上策)均衡
三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?
博弈论本科讲义
在中观经济研究中,劳动力经济学和金融理 论都有关于企业要素投入品市场的博弈模型, 即使在一个企业内部也存在博弈问题:工人之 间会为同一个升迁机会勾心斗角,不同部门之 间为争取公司的资金投入相互竞争;从宏观角 度看,国际经济学中有关于国家间的相互竞争 或相互串谋、选择关税或其他贸易政策的模型; 至于产业组织理论更是大量应用博弈论的方法 (见Jean Tirole的《产业组织理论》)。
如果n个参与人每人从自己的Si中选择一个策略 siategy profile),参与人i之外的其他参 与人的策略组合可记为s-i=( s1,s2,﹍,si-1 , si+1 ,﹍, sn)。
例如田忌的某个策略s田忌=上中下,或中下上, 等等;S田忌={上中下,上下中,中上下,中下 上 ,下上中,下中上}
贷市场的过高利息。此外,阿克尔洛夫还把信 息不对称运用于解释各种社会问题,比如因为信 息不对称,医疗保险市场上,老年人、个体劳动 者的医疗保险利益得不到保障。
三、基本概念
1、参与人Players:一个博弈中的决策主体, 他们各自的目的是通过选择行动(策略)以最 大化自己的目标函数/效用水平/支付函数。他们 可以是自然人或团体或法人,如企业、国家、 地区、社团、欧盟、北约等。 那些不作决策或虽做决策但不直接承担决 策后果的被动主体不是参与人,而只能当做环 境参数来处理。如指手划脚的看牌人、看棋人, 企业的顾问等。 对参与人的决策来说,最重要的是必须有
教材——P5 博弈论就是系统研究各种各 样博弈中参与人的合理选择及其 均衡的理论。
关于“经济博弈论”:
博弈论是研究人们在利益相互影响的格局 中的策略选择问题、是研究多人决策问题的理 论。而策略选择是人们经济行为的核心内容, 此外,经济学和博弈论的研究模式是一样的: 即强调个人理性,也就是在给定的约束条件下 追求效用最大化。可见,经济学和博弈论具 有内在的联系。在经济学和博弈论具有的这 种天然联系的基础上产生了经济博弈论。
(最新经营)博弈理论知识讲义
第八章博弈论前面章节对经济人最优决策的讨论,是于简单环境下进行的,没有考虑经济人之间决策相互影响的问题。
本章讨论这个问题,建立复杂环境下的决策理论。
开展这种研究的的理论叫做博弈论,也称为对策论(GameTheory)。
最近十几年来,博弈论于经济学中得到了广泛应用,于揭示经济行为相互制约性质方面取得了重大进展。
大部分经济行为均可视作博弈的特殊情况,比如把经济系统看成是一种博弈,把竞争均衡看成是该博弈的古诺-纳什均衡。
博弈论的思想精髓与方法,已成为经济分析基础的必要组成部分。
第一节博弈事例博弈是一种日常现象,例如棋手下棋,双方均要根据对方的行动来决定自己的行动,双方的目的均是要战胜对方,互不相容,互相影响,互相制约。
一般来讲,博弈现象的特征表现为两个或两个之上具有利害冲突的当事人处于一种不相容的状态中,一方的行动取决于对方的行动,每个当事人的收益均取决于所有当事人的行动。
当所有当事人均拿定主意作出决策时,博弈的局势就暂时确定下来。
博弈论就是研究这种不相容现象的一种理论,且把当事人叫做局中人(player)。
博弈论推广了标准的一人决策理论。
于每个局中人的收益均依赖于其他局中人的选择的情况下,追求收益最大化的局中人应该如何采取行动?显然,为了确定出可行的策略,每个局中人均必须考虑其他局中人面临的问题。
下面来举例说明。
例1.便士匹配(MatchingPennies)(二人零和博弈)设博弈中有两个局中人甲和乙,每个局中人均有一块硬币,且且各自独立安排硬币是否正面朝上。
局中人的收益情况是这样的:如果两个局中人同时出示硬币正面或反面,那么甲赢得1元,乙输掉1元;如果一个局中人出示硬币正面,另一个局中人出示硬币反面,那么甲输掉1元,乙赢得1元。
对于这个博弈,正面朝上和反面朝上,即甲和乙的策略集合均是{正面,反面}。
当甲和乙均作出选择时,博弈的局势就确定了。
显然,该博弈的局势集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各种可能的局势的全体,也称为局势表,即表1。
博弈论第三讲
x1
x2
x4
x3
x5
x6
x7
an edge connecting nodes x1 and x5
x8
7
Game tree
A path is a sequence of distinct
nodes y1, y2, y3, ..., yn-1, yn such that yi and yi+1 are adjacent, for i=1, 2, ..., n-1. We say that this path is from y1 to yn. We can also use the sequence of edges induced by these nodes to denote the path.
13
Entry game
Challenger’s strategies
In Out Incumbent’s strategies Accommodate (if challenger plays In) Fight (if challenger plays In) Payoffs Normal-form representation
Dynamic Games of Complete Information
Entry game
An incumbent monopolist faces the possibility of entry by a
challenger. The challenger may choose to enter or stay out. If the challenger enters, the incumbent can choose either to accommodate or to fight. The payoffs are common knowledge.
博弈论算法讲义
博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里,一个博弈可以用两种不同的方式来表述:一种是战略式表述(strategic form representation ),另一种是扩展式表述(或译为“展开式表述”)(extensive form representation )。
从分析的角度看,战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。
1.1博弈的战略式表述战略式表述又称为标准式表述(normal form representation )。
在这种表述中,所参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。
战略式表述给出:1.博弈的参与人集合:(),1,2,,i n ∈ΓΓ=。
2.每个参与人的战略空间:,1,2,,i S i n =。
3.每个参与人的支付函数:12(,,,),1,2,,i n u s s s i n =。
我们用()11,,;,,n n G S S u u =代表战略式表述博弈。
例如在两个寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;战略式表述博弈为:{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。
1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =,战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。
如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略,即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式,i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。
博弈论讲义3-不完美信息静态博弈
不完全信息博弈中,至少有一个参与者i有多个可能的 类型,其他参与者虽然知道ti∈Ti,但都无法确知ti在 Ti中的具体取值。
如果只有虚拟参与人具有多个类型,则是不完全信息
如果有虚拟参与人以外的某些参与人有多个类型,则属于信息 不对称。
版权所有余向华源自12信息问题与市场的建立
“柠檬”市场现象(Akerlof):
由于信息问题引发逆向选择(劣币驱逐良币),
导致有效的市场可能建立不起来,或发展慢。
普遍存在于产品市场、劳动力市场(包括教师市场的问
题)、保险市场、信贷市场等上
“碟猫”市场现象:
本能不存在的市场,由于信息的不完全反给创
造出来了。比如赌石市场、彩票市场
第3篇 不完全信息静态博弈
3.1 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈 海萨尼转换 不完全信息静态博弈的策略式表述和贝叶斯纳什均衡
3.2 贝叶斯纳什均衡与混合策略均衡的纯化 3.3 贝叶斯纳什均衡应用举例 3.4 非对称信息下的机制设计问题
版权所有
余向华
1
信息问题与现实生活
爱心困惑:面对一个个乞丐向你行乞,你会如何决定呢? 佛心者:宁可被骗一千次,绝不放过一次帮助需要帮助者。 人心者:宁可错过千次帮助需要帮助的人,绝不愿被骗一次?
不帮、或者收集信息再决定?
婚恋困惑:知人知面与知心问题 食品安全中的信息问题 信息与法律举证问题 …
版权所有
余向华
2
信息问题与市场运行
在信息不完美的情况下,博弈参与者的收益为期望收益: 被求者
接受 不接受
求爱博弈:
求爱 100,100
品德优良者求爱 求爱者 不求爱 0,0
《博弈论》精品讲义
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009
博弈论讲义
A:(2/3,1/3),B:(1/3,2/3)是本博弈的 混合策略纳什均衡
完全信息动态博弈
参与人先后行动 每个参与人对每个参与人的得益具有完全信 息 博弈树 参与人的行动顺序(when to move,谁在 什么时候行动) 参与人的信息集(what known,每次行动 时参与人知道些什么)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合:(s1,…,si,…,sn) ui=ui(s1,…,si,…sn) 一个参与人的支付不仅取决于自己的策略选择, 而且取决于其他参与人的策略选择 Max ui=ui(s1,…,si,…sn)
囚徒困境博弈的标准式表述
B
抵赖 坦白
抵赖
-1,-1 0,-10
-10,0 -8,-8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
-1,-1 0,-10
-10,0 -8 -8
A
博弈论讲义3
你看过电影《美丽心灵》 吗?(老梁说电影)
2015年1月28日星期三
博弈论与日常生活
1、纳什:天才还是疯子?
纳什(John Forbes Nash )其人:
1928年出生于美国弗吉尼亚州,1948年同时 被4所大学录取,包括普林斯顿、哈佛,最终纳什 选择了普林斯顿。1950年,发表博士论文《非合 作博弈》,同年又发表《n人博弈中的均衡》。 1957年,与艾丽西亚结婚,不幸的是,第二年, 被送进精神病院。
甲
表白
乙
表白
不表白
(10,10) (10,10)
不表白
(10,10) (0,0)
2015年1月28日星期三
博弈论与日常生活
【案例二】
一对夫妻在屋子里休息,邻居敲门来借锤子,不 情愿地借给了他。
第二天来借锯,丈夫说,我们下午正要用,邻 居问,你们两个都要去吗?答,是的。 那太好了,你们去剪树枝,肯定不打球了,把 高尔夫球杆借我一用?
2015年1月28日星期三
博弈论与日常生活
4、纳什均衡
纳什均衡定义: 假设有n个局中人参与博弈,给定其他人策略的条件下, 每个局中人选择自己的最优策略(个人最优策略可能 依赖于也可能不依赖于他人的战略),从而使自己效 用最大化。所有局中人策略构成一个策略组合 (Strategy Profile)。纳什均衡指的是这样一种战 略组合,这种策略组合由所有参与人最优策略组成。 即在给定别人策略的情况下,没有人有足够理由打破 这种均衡。
博弈论与日常生活
占优均衡
以囚徒1为例,无论囚徒2采取什么策 略…
囚徒2
坦
囚 徒 1
白
不坦白 (0, -10) (-1, -1)
博弈论概要1-3完全版III
交通大学博弈论课程概要 (III)周林第四部分:不完全信息扩展式博弈1. 一般扩展式博弈的定义(F-T 3.3.1)一个一般扩展式博弈由(有向)博弈树表示。
博弈树由点和联结点的枝组成。
前点和后点。
起点无前点,终点无后点。
除起点外,每点有唯一的直接前访点。
除终点外的点代表决策点,每点x 只属于一个博弈者i (x ),从这点出发的枝代表i (x )在x 处的行动集A (x ) 。
博弈者i (x )在x 处拥有的信息由信息集h (x )表示。
h (x )包括了所有i (x )不能同x 区分开来的点。
对所有的h (x )中的点x ’,A (x ’) = A (x ) 。
因此我们可以将行动集记为A (h ) 。
对一个不完全信息的扩展式博弈来说,起点代表“自然”,从自然出发的枝代表外生随机事件,概率分布是给定的,不受博弈者选择的影响。
每一终点处给出所有博弈者的收益。
(当博弈进行无穷阶段时,所有博弈者的收益由博弈的历史决定。
)2. 一般扩展式博弈的策略式博弈表示(F-T3.4)每一个博弈者的一个策略罗列了他在他的每一信息集上的行动,是一个从信息集到行动的映射)()(,:i i i i h A h s A H s ∈→。
如果每一博弈者都选取一个特定的策略,我们可以用它们确定行动的历史,从而求出每人的收益。
这样我们就得到了一般扩展式博弈的策略式博弈表示。
3. 混合策略和行为策略。
混合策略在整个博弈尚未开始以前混合,行为策略在博弈开始后每一决策点处混合。
对具有完美记忆的博弈,混合策略和行为策略是等价的(Kuhn 定理)。
(F-T 3.4)4. 一般扩展式博弈的求解。
Nash 均衡和Nash 均衡的精细:逆向归纳法和子博弈完美。
(F-T 3.5)5. 重要例子:行动可观察无限重复博弈与无名氏定理:只要博弈者足够耐心,任何一个满足个人理性的可行的收益分配可以由一个无限重复博弈的Nash 均衡(或子博弈完美Nash 均衡)实现。
《博弈论》精品讲义
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
5
1.博弈现象
➢田忌赛马:正确的策略可以反败为胜。 ➢囚徒困境:
乙 甲
理性的人是自私自利的; 理性选择不是全局最优。
博弈论20092009
正大光明 公正無私
6
➢经济合作:
乙 甲
诚信的价值; 一报还一报策略; 人类生存环境启示。
博弈论20092009
正大光明 公正無私
如两人写的一样, 就 认为他们讲真话, 并 按 所 写数额赔偿;如果两人写的不一样,就认定低 者讲真话,并照此价格赔偿。同时,对讲真话的 旅客奖励2元钱,对讲假话的旅客罚款2元。
理性原则下,他们会写多少价格呢?
博弈论20092009
正大光明 公正無私
11
2. 博弈概念
➢什么是博弈:
个人或团体间在依存和对抗、合作和冲突 中的决策问题。
正大光明 公正無私
43
∴I的最优混合策略为
(1,2)
(1, 4
3) 4
同理,II的最优混合策略为
G=8
(1,2)
(1, 2
1) 2
博弈论——不完全信息静态博弈讲义
3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。
不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。
如在拍卖商品或工程招投标中。
信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。
不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。
但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。
在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。
3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。
Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。
N 首先行动,决定每个局中人的特征。
每个局中人知道自己的特征,但不知道其他局中人特征。
这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。
这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。
局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。
用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。
博弈论讲义3(1)
流浪汉
寻找工作的概率小于0.2
政府
概率为1:不救济
流浪汉
寻找工作
政府 救济
五 混合战略纳什均衡
用上述方法:求该猜谜游 戏的混合战略纳什均衡
正面 反面
1
正面 -1, -1 1,
-1
1
反面
1,
-1,
五 混合战略纳什均衡
练习:模型化下述划拳博弈: 两个老朋友在一起喝酒,每个人有四个纯战略: 杠子、老虎、鸡和虫子,输赢规则是:杠子降 鸡,鸡吃虫子,虫子降杠子,两人同时出令。 如果一个打败另一个,赢的效用为1,输的效 用为-1,否则效用为0,写出这个博弈的支付 矩阵,这个博弈有纯战略均衡吗?计算其混合 战略纳什均衡。
大猪
按
5,1
4,4
0,0
正面
正面
1 -1, -1 1,
反面
-1
等待 9,-1
1 -1,
反面
1,
五 混合战略纳什均衡
如何寻找混合战略纳什均衡?
支付最大化法
支付等值法 由于混合战略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。 最优混合战略:是指使期望效用函数最大的混合战 略(给定对方的混合战略) 在两人博弈里,混合战略纳什均衡是两个参与人的 最优混合战略的组合。
假定参与人i有K个纯战略:Si si1 , sik , 称为i的一个混合战略,这里 ik (sik) 是i选择sik的概率,对于所有的 k 1, ,K, 0 ik 1, 1 ik 1。
k
五 混合战略纳什均衡
纯战略可以理解为混合战略的特例,即在诸多 战略中,选该纯战略si的概率为1,选其他纯战 略的概率为0。 小猪 按 等待
博弈论讲义3
垄断利润为:
π m = (a − c) 2 > (a − c) 2
1 4 2 9
每个企业在选择自己 的最优产量时,只考虑 对本企业利润的影响, 而忽视了对另外一个企 业的外部负效应。
案例1 库诺特(Cournot)寡头竞争模型 练习:
假定有n个库诺特寡头企业,每个企业具有相 同的不变单位成本c,市场逆需求函数p=a-Q, 其中p是市场价格,Q = ∑ q 是总供给量,a是大 于0的常数,企业的战略是选择产量qi最大化利 润 π i = qi (a − Q − c) ,给定其他企业的产量q-i,, 求库诺特-纳什均衡,均衡产量和价格如何随n 的变化而变化?为什么?
纳什均衡应用举例
案例1 库诺特(Cournot)寡头竞争模型 案例2 公共地的悲剧 案例3 普林斯顿大学的一道习题
案例1 库诺特(Cournot)寡头竞争模型
企业1 参与人:企业1 企业2 参与人:企业1、企业2 战略: 战略: 支付: 支付: 选择产量
企业2
利润, 利润,利润是两个企业产量的函数
G = ∑ gi
i =1 n
n个农民饲养的总量
V: 代表每只羊的平均价值,v是G的函数,v=v(G), 因为每只羊至少要一定数量的草才不至于饿死,有一个 最大的可存活量Gmax,: 当G<Gmax时,v(G)>0; 当G>=G(x)时,v(G)=0。
案例2 公共地的悲剧
当草地上羊很少时,增加一只羊也许不会对其 他羊的价值有太大影响,但随着羊的不断增加, 每只羊的价值将急剧下降。
q 1* = R1 ( q 2 )
* q 2 = R 2 ( q1 )
案例1 库诺特(Cournot)寡头竞争模型
q = R1 (q2 )