12完全信息动态博弈(子博弈完美的纳什均衡)
第二章:完全信息动态博弈
不完美信息:2不能区 分1是采用了L还是S
L L L ( 2, 2 ) 1
L 2 S L 2 S
( 2 , 2)
(-1,-1) (-1,-1) ( 1, 1)
2
S
S
(-1,-1)
1
S 2
L
S
(-1,-1)
足
2,1
-1,-1
-1,-1
1,2
男
巴
扩展式表述 (extensive form representation) 多用博弈树
男的策略:{足球,芭蕾},选择足球;还是选择芭蕾。 女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾, 芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管他选什么,我都选芭蕾; 4、足球策略:不管他选什么,我都选足球。 策略即:如果他选择什么,我就怎样行动的相机行动方 案。在扩展式博弈里,参与人是相机行事,即“等待” 博弈到达一个自己的信息集(包含一个或多个决策结后, 再采取行动方案。
结 nodes
( 2, 2)
L L 1 S 2 2
S
L
(-1,-1) (-1,-1)
S
( 1 , 1)
信息集分单节信息集 和多节信息集;如果 用虚线匡起来表示2知 道自己位于信息集内, 但不知道是哪一点, 因为他没能观察到对 手的行动;如果博弈 树的所有信息集都是 单结的,称为完美信 息博弈
完美信息(perfect information)与 不完美信息(imperfect information)
第一节 博弈的扩展式表述
在静态博弈中,所有参与人同时行动(或行动虽有先 后,但没有人在自己行动之前观测到别人到行动); 在动态博弈中,参与人的行动有先后顺序,且后行动 者在自己行动之前能观测到先行动者的行动。
子博弈精炼纳什均衡的基本概念
子博弈精炼纳什均衡的基本概念在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行为,来获得有关先行动者的信息,从而证实或修正自己对先行动者的判断。
完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择。
而在不完全信息动态博弈中,问题变得更加简单。
博弈开始时,某一参与人既不知道其他参与人的真实类型,也不知道其他参与人所属类型的分布概率。
他只是对这一概率分布有自己的主观判断,即有自己的信念。
博弈开始后,该参与人将根据他所观察到的其他参与人的行为,来修正自己的信念。
并根据这种不断变化的信念,作出自己的战略选择。
动态博弈行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择,因此,为了做最优的行动选择,每个参与人都必须这样思考问题:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?如下棋。
[1]子博弈精炼纳什均衡包含两层含义:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。
子博弈精炼纳什均衡就是要剔除那些只在特定情况下是合理的,而在其他情况下并不合理的行动规则在动态博弈中,参与人的行动有先后顺序,后行动的参与人在自己行动之前就可以观察到先行动者(参与人)的行为,并在此基础上选择相应的策略。
而且,由于先行动者拥有后行动者可能选择策略的完全信息,因而先行动者在选择自己的策略时,就可以预先考虑自己的选择对后行动者选择的影响,并采取相应的对策。
子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
当只当参与人的战略在其子博弈的系列(第二代、第三代…)中,每一个子博弈都构成纳什均衡,就构成了子博弈精练纳什均衡子博弈子博弈(Subgame)[编辑]什么是子博弈子博弈是指在动态博弈中,所有参与人先后都采取了一次行动后所构成的一组新的博弈,这组博弈中的每一个都称为“子博弈”。
完全信息动态博弈(子博弈完美的纳什均衡)
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
(-1,1,0)
.
例:
2 L
1 R
(200,200) M
S (a,b)
N 1
T
(50,300)
(300,0)
➢ 若 a=100,b=150,SPNE是什么? ➢ 若改变a b的数值,能否使L-N-T成为SPNE? ➢ 什么情况下,2会获得300或更高的支付?
Stage1: 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过;
若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受,而哥哥最 终将一无所获。
均衡路径: 哥哥提出方案为1/2:1/2, 弟弟接受
.
例:要挟诉讼
(要求赔偿S) 指控
B
拒绝
起诉
A
放弃
威胁不可 信
(TX-P-C, -TX-D)
( -C , 0 )
A
不指控
接受
( 0 ,0 ) ( S-C, -S )
若 TX<P 则 A将选择放弃
SPNE:A不指控
.
例:要挟诉讼
威胁可信
拒绝
(要求赔偿S) 指控
B
A
不指控
接受
( 0 ,0 )
起诉
A
(TX-P-C, -TX-D)
放弃
( -P- C , 0 )
(S-P-C,-S)
.
例:要挟诉讼
如果原告将P提前支付,TX-C-P>-C-P, 只要胜诉的可能大于0,原告将起诉。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果TX >P+C , 原告会指控。
博弈论——完全信息动态博弈
博弈论——完全信息动态博弈2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与⼈在不同的时间选择⾏动。
完全信息动态博弈指的是各博弈⽅先后⾏动,后⾏动者知道先⾏动者的具体⾏动是什么且各博弈⽅对博弈中各种策略组合下所有参与⼈相应的得益都完全了解的博弈静态博弈习惯⽤战略式(Strategic form representation)表述,动态博弈习惯⽤扩展式(Extensive form representation)表述。
战略式表述的三要素:参与⼈集合、每个参与⼈的战略集合、由战略组合决定的每个参与⼈的⽀付。
扩展式表述的要素包括:参与⼈集合、参与⼈的⾏动顺序、参与⼈的⾏动空间、参与⼈的信息集、参与⼈的⽀付函数、外⽣事件(⾃然的选择)的概率分布。
n⼈有限战略博弈的扩展式表述⽤博弈树来表⽰1(1,2) (0,3)①结:包括决策结和终点结。
决策结是参与⼈采取⾏动的时点,终点结是博弈⾏动路径的终点。
第⼀个⾏动选择对应的决策结为“初始结”,⽤空⼼圆表⽰,其它决策结⽤实⼼圆表⽰。
X表⽰结的集合,x X表⽰某个特定的结。
z表⽰终点结,Z表⽰终点结集合。
表⽰结之间的顺序关系,x x′表⽰x在x′之前。
x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。
以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。
在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。
②枝:博弈树上,枝是从⼀个决策结到其直接后续结的连线,每⼀个枝代表参与⼈的⼀个⾏动选择。
在每⼀个枝旁标注该具体⾏动的代号。
⼀般地,每个决策结下有多个枝,给出每次⾏动时参与⼈的⾏动空间,即此时有哪些⾏动可供选择。
③信息集(information sets):博弈树中某⼀决策者在某⼀⾏动阶段具有相同信息的所有决策结集合称为⼀个信息集。
博弈树上的所有决策结分割成不同的信息集。
每⼀个信息集是决策结集合的⼀个⼦集(信息集是由决策结构成的集合),该⼦集包括所有满⾜下列条件的决策结:(1)每⼀个决策结都是同⼀个参与⼈的决策结。
博弈论原理与方法-关于均衡的分析
同时自己又要尽可能猜出对方的策略。
在一次博弈中结果取决于机会,在多次重复
中,如果双方决策都正确,则我们可求得平
均的双方收益。彼此得益相同。
绪论-博弈基本要素
参与人players
又称“局中人”或”博弈方”,是指博弈中独
立决策、独立承担后果、以自身利益最大化来
选择行动的决策主体(可以是个人、也可以是
策略,假设寡头2采用低价策略,那么寡头1采用高
价策略得益20,采用低价策略得益60,它也应采用
低价策略。用同样方法可得寡头2也应采用低价策略。
低价-低价对双方不是理想的结果,但因为双方均无
法信任,所以均坚持采用低价策略。
绪论-几个典型模型
猜方
正面
猜硬币游戏
反面
正面
盖方
反面
分析:
在本博弈什均衡动态化,加入了
接近实际的不完全信息条件。他们的工作为后
人继续发展博弈论,提供了基本思路和模型
绪论-博弈论的历史沿革
博弈论根据其所采用的假设不同而分为合作博
弈理论和非合作博弈理论。两者的区别在于参
与人在博弈过程中是否能够达成一个具有约束
力的协议(binding agreement) 。倘若不能,则
博弈理论开始于1944年由冯·诺依曼(Von
Neumann)和摩根斯坦恩(Oskar Morgenstern)合
作的《博弈论和经济行为》(The Theory of
Games and Economic Behaviour)一书由Princeton
University Press出版。
20世纪50年代以来,纳什(Nash)、泽尔腾
博弈论第四章 完全且完美信息动态博弈
房地产开发博弈 精选ppt
支付
横向扩展式举例:
进入者
进入 在位者
合作(40,50) 斗争(-10,0)
不进入(0,300) 市场进入阻挠博弈树
精选ppt
扩展型
为了让“树”描绘博弈,其结点和枝需要满足三 条性质:
1.单一的出发点。重要的是知道博弈从何处开 始,所以必须有一个,也只能有一个出发点。
2. 无循环。重要的是在博弈运行中,我们不要 陷入僵局;树枝循原路折回并造成一个循环一定 是不可接受的。
3. 单方向前进。重要的是,对于博弈如何进行 下去不能模棱两可,因此,必定不存在二个或多 个枝导向同一个结。
精选ppt
为保证这三条性质,在前结点上强加下述限
制: 1.结点不能是自身的前结点。
一个纳什均衡称为精炼纳什均衡,当只当参与人 的战略在每个子博弈中都构成纳什均衡,也就是 说,组成完美纳什均衡的战略必须在每一个子博 弈中都是最优的。
一个精炼纳什均衡首先必须是一个纳什均衡,但 纳什均衡不一定是精炼纳什均衡。
承诺行动-当事人使自己的威胁战略变得可置信的 行动。
精选ppt
子博弈完美纳什均衡
精选ppt
完全且完美信息动态博弈的主要特点
(1)行动是顺序发生的, (2)下一步行动选择之前,所有以前的行动都
可以被观察到, (3)每个可能的行动组合下局中人的收益是共
同知识。
精选ppt
第三章 完全且完美信息动态博弈
一 博弈扩展式表述 二 子博弈完美纳什均衡 三、用逆向归纳法求-子博弈完美
精选ppt
扩展式表示的一个例子
精选ppt
博弈树始于 局中人1 的一个决策结点,这时1
要从L和R中作出选择,如果局中人1选择L,其后就
《经济博弈论》期末考试复习题及参考答案
经济博弈论复习题(课程代码262268)一、 名词解释混合战略纳什均衡;子博弈精炼纳什均衡:完全信息动态博弈:不完全信息动态博弈:完 全信息静态博弈:帕累托上策均衡;囚徒困境:纳什均衡:子博弈;完美信息动态博弈;颐 抖手均衡;柠檢原理:完美贝叶斯均衡二、 计算分析题1、 在市场进入模型中,市场需求函数为p=13-Q,进入者和在位者生产的边际成本都为1, 固泄成本为0,潜在进入者的进入成本为4。
博弈时序为:在位者首先决左产量水平;潜在 进入者在观察到在位者的产量水平之后决定是否进入:如果不进入,则博弈结束,如果进入, 则进入者选择产疑水平。
求解以上博弈精炼纳什均衡。
2、 考虑如下扰动的性别战略博弈,其中A 服从[0, 1]的均匀分布,Of£<l 山和匕是独 立的,匕是参与人i 的私人信息。
求出以上博弈所有纯战略贝叶斯均衡。
3、求下列信号传递模型的贝叶斯Nash 均衡(讨论分离均衡和混同均衡)(2.1)(6.2)(3.1)(4J)5、古诺IW 弈:市场反需求函数为P (Q )= a- Q,其中Q = q 】+q2为市场总产豊q :为企 业i (i = l, 2)的产量。
两个企业的总成本都为Ci (qJ = cqi 。
请您思考以下问题: 1)在完全信息静态条件下,这一博弈的纳什均衡是什么?2)假设这一阶段博弈重复无限次。
试问:在什么样的贴现条件下,证产量组合(響,響)是子博弈精炼纳什均衡的?6、考虑一卞工作申请的佔弈。
两个学生同时向两家企业申请工作,每家企业只有一个工作 岗位。
工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个 学生申请,该学生获得工作:如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。
现在假泄每家企业的工资满足:W 1/2<W :<2W 1,则问: a.写出以上博弈的战略式描述b.求出以上博弈的所有纳什均衡7、(差异价格竞争)假立两个寡头企业进行价格竞争,但产品并不完全相同,企业,的市场需求门厂)="-门+匕仏丿=1,2),两家企业的生产成本函数为 g 求两个寡头同 时选择价格时的纳什均衡。
博弈类型
fan1952在n个参与者博弈中如果每个参与者的纯策略空间s是欧氏空间上的一个非空的闭的有界的凸集收益函数是连续的且对si是拟凹的则博弈至少存在一个纯策略纳什均衡
第5章 博弈类型 章
5.1 完全信息静态博弈 完全信息静态博弈—— 纳什均衡
纳什均衡:在n个参与者博弈G={S1,…, Sn;u1,…,un}中,如果对于每一个参与者 i(i=1,2,…,n),si*是针对其他n-1个参与者所选策 略(s1*,…,si-1*,si+1*,…,sn*)的最优反应策略,即 ui(si*,…,si-1*,si+1*,…,sn*) ≥ui(s1*,…,si-1*,si+1*,sn*)_NE 对Si中所有的si都成立,则策略组合 s*=(s1*,…,si*,…,sn*)称为该博弈的一个纳什均衡。
纳什均衡的存在性定理II (Nubreu,1952;Glicksberg,1952;Fan,1952)
在n个参与者博弈中,如果每个参与者的纯策略 空间Si是欧氏空间上的一个非空的、闭的、有界 的凸集,收益函数是连续的且对si是拟凹的,则 博弈至少存在一个纯策略纳什均衡。
纳什均衡的存在性定理III(Glicksherg,1952)
每一个严格占优策略均衡一定是纳什均衡 每一个逐步剔除严格劣策略均衡一定是纳什 均衡 若一个策略组合是纳什均衡,则它一定不会 被逐步剔除严格劣策略所剔除。 纳什均衡是一个比逐步剔除严格劣策略均衡 条件更强的解
纳什均衡的存在性定理I(Nash,1950)
在n个参与者的博弈中,若每个参与者的策略空 间中纯策略是有限的,则博弈至少存在一个纳什 均衡。
划线法:选一个博弈参与者,找出其每一策略 的最优收益,下收益下划线;再选另一个参与 者,划出其每个策略的最优收益;…,每一收益 都有下划线的策略组合即为纳什均衡。 参与者2 例:
第二章完全信息动态博弈篇章
i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型
用逆向归纳法求解,首先考虑给定q1的情况下,企业2 的最优选择。企业2的问题是:
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着:
轮流出价的讨价还价模型
一般来说,如果 0 i 1, i 1, 2均衡结果不 仅依赖于贴现因子的相对比率,而且依赖于博 弈时间长度T和谁在最后阶段出价。然而这种 依存关系随T的变大而变小;当T趋于无穷大时 ,我们得到“先动优势”:即如果 1 2 唯 一的均衡是 x 1 (1 ). 定理(Rubinstein 1982):在无限期轮流出价 博弈中,唯一的子博弈精炼纳什均衡结果是: 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵 (仅考虑整数)
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
•
一 博弈扩展式表述
二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 应用举例 斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎 旅行者困境 五 重复博弈
轮流出价的讨价还价模型(1)
02-博弈的概念与构成要素
三、博弈的构成要素
博弈的信息(Information)。博弈进行过程中,
参加者对博弈构成要素的认知,一般而言主
要是对博弈进行的次序和收益的信息了解情
况。
四、博弈论的发展历史
• 1838年库诺特(Cournot)(或译为古诺寡头) 竞争模型(数量战); • 1883年伯川德(Bertrand)(或译为伯特兰德) 寡头竞争模型(价格战); • 1944年冯诺依曼和摩根斯坦发表《博弈论和 经济行为》; • 1950年纳什(Nash)提出了纳什均衡的概念。 (美丽心灵); • “Equilibrium points in n-person games”, “Non-cooperative games”, “The bargaining problem”.
例二:运输路线
自 然 好天气75%) 坏天气25%
商 水 路 -7000 人 陆 路 -10000 -16000 -10000 好天气 (75%) 1 0
坏天气 (25%)
运输路线得益矩阵 -7000 单人博弈实质 个体最优化问题
-10000 -16000 -10000
运输路线扩展形
(2)两人博弈
四、博弈论的发展历史
静态 完全信息静态博弈 纳什均衡 纳什(1950,1951) 动态
完全信息动态博弈 完全信息 子博弈精炼纳什均衡 泽尔腾(1965) 不完全信息动态博弈 精炼贝叶斯纳什均衡 不完全信息静态博弈 泽尔腾(1975) 不完全信息 贝叶斯纳什均衡 海萨尼(1967-1968) Kreps和Wilson(1982) Fudenberg和Tirole (1991)
(1)三厂商离散产量模型
Q = q1 + q2 + q3
11-完全信息动态博弈(子博弈完美的纳什均衡)
威胁 ---- 事后:B威胁,若A选下,自己选左
• A相信
• A不信
(U,L) (2,9) (D,R) (3,1)
问题:可信性 Credibility
承诺和威胁都是不可信的!
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” & “穷寇莫追”
B
(L,L) U 2, 9 1, 0 (L,R) 2, 9 3, 1 (R,R) 2, 1 3, 1 (R,L) 2, 1 1, 0
A
D
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动
L U
( 2, 9 )
( 2, 1 )
B1
R
A
D
B2
L R
( 1, 0 )
( 3, 1 )
博弈树
game tree
完全信息动态博弈
Subgame Perfect Nash Equilibrium
完全信息动态博弈
序贯博弈问题
动态博弈经典模型 重复博弈与合作问题
§3.1 序贯博弈问题
Sequential Games
强盗分金
答案是:
1号强盗分给 3号1枚金币, 五个强盗抢得100 枚金币,他们决定:
dbackwardbackwardinductioninduction3311均衡路径均衡路径equilibriumpathequilibriumpathspnespne子博弈精炼纳什均衡子博弈精炼纳什均衡seltenselten19651965subgameperfectnashequilibriumsubgameperfectnashequilibrium泽尔腾19651965年发表年发表需求减少条件下寡需求减少条件下寡头垄断模型的对策论描述头垄断模型的对策论描述一文提出了一文提出了子博弈精炼纳什均衡子博弈精炼纳什均衡的概念又称的概念又称子子对策完美纳什均衡对策完美纳什均衡reinhardseltenreinhardselten19301930reinhardseltenreinhardselten子博弈精子博弈精炼纳什均均衡的创立者
博弈论(2)专业知识
假如你是第一种强盗,你该怎样提出分配 方案才干使自己旳收益最大化呢?
博弈论2023
45
➢ 启示:第五人看似安全,其实并没利益,因 为威胁不可置信。收买失意者更为轻易
为何革命者总是找穷苦人? 为何恐怖分子在阿富汗受欢迎? 为何组织中旳一把手,经常抛开二号人物, 而与会计出纳打得火热?
策略组合s*,对于任意旳ε,存在着一种位于 [0,1]区间上旳正数向量δ1,…,δn和一种完全 混合策略向量σ1,…,σn,使得每一种策略都被策 略(1-δi)si+δiσn所取代旳新博弈有一种纳什均衡, 且该纳什均衡中旳每一种策略和s*旳距离不大于ε。
博弈论2023
35
例: 出 史密斯 进
(1,1) 上
注:不完全信息不等于不对称信息
博弈论2023
8
例:扑克牌游戏下注前行为规则。
(1)全部牌洗成面朝上; (完美,拟定)
(2)全部牌洗成面朝下且不能看自己旳牌; (不完全,对称,拟定)
(3)全部牌洗成面朝下且参加人只能看自己旳牌; (不完全,不对称,拟定)
(4)全部牌洗成面朝上,但每个参加人随即都能够 用手护住并悄悄丢掉一张牌;
博弈论2023
4
博弈论2023
5
博弈论2023
6
博弈论2023
7
➢信息类型
完美perfect:每个信息集都是单结旳。
完全complete:自然(类型或支付)不首先 行动或它旳最初行动被全部人观察到。
拟定certain:自然(类型或支付)不在任何一 种参加人行动之后行动。
对称symmetric:没有人在行动时或终点结 处拥有与其他人不同旳信息。
经典:博弈论-完全信息动态博弈
2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素: (1) 参与人集合:i=1,2,…,n。此外,用N代表虚拟
参与人——自然。 (2) 行动顺序:谁在什么时候行动。 (3) 参与人的行动空间: (4) 参与人的信息集: (5) 参与人的策略集: (6) 参与人的支付函数: (7)外生事件的概率分布。
博弈的收益矩阵
(1)高需求
开发 开发商A 不开发
(2)低需求
开发 开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
-1, -1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分: 静态博弈:两个开发商同时决策,或后决策者不
能观察到先行动者的行动。 动态博弈:博弈有先后顺序,且后决策者能观察
完全信息动态博弈图示:N A B
开发 (2,2)
高需求
○
A
N
低需求
开发 不开发 开发 不开发
不开发 (4,0)
开发 (0,4) B 不开发 (0,0)
开发 (-1,-1) 不开发 (1,0)
开发 (0,1) 不开发 (0,0)
(4)不完全信息动态情形:ANB
开发商A不清楚市场的需求状态,决定是否开发; 开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。 按开发商是否知道市场需求状态分:
完全信息博弈:若两个开发商都知道市场需求状 态(高需求或低需求)。
不完全信息博弈:由自然决定市场的需求状态, 两开发商不知道。 共同知识:在市场各种可能状态和各开发商不同策 略组合下的得益矩阵是双方的共同知识。
博弈论复习题及答案
可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位;(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35;画出两企业的损益矩阵求纳什均衡。
9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。
如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。
如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。
(1)将这一市场用囚徒困境的博弈加以表示。
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
;若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。
若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。
由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。
12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡(2)两厂商合作的结果是什么答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。
若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A 企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A 企业可获得30万元利润,B企业可获得6万元利润。
博弈论名词简答论述
博弈论名词简答论述名词解释:01、参与⼈:指的是博弈中选择⾏动以最⼤化⾃⼰效⽤(收益)的决策主体,参与⼈有时也称局中⼈,可以是个⼈,也可以是企业、国家等团体。
02、策略:是参与⼈选择⾏动的规则,如“以⽛还⽛”是⼀种策略。
03、结果:是指博弈分析者感兴趣的要素的集合,常⽤⽀付矩阵或收益矩阵来表⽰。
04、均衡:是所有参与⼈的最优策略或⾏动的组合。
05、博弈:⼀些个⼈、队组或其他组织,⾯对⼀定的环境条件,在⼀定的规则下,同时或者先后,⼀次或者多次,从各⾃允许选择的⾏为或战略进⾏选择并加以实施,各⾃取得相应结果或收益的过程。
06、静态博弈:指参与⼈同时选择⾏动或虽⾮同时但后⾏动者并不知道先⾏动者采取什么样的⾏动。
07、动态博弈:指参与⼈的⾏动有先后顺序,且后⾏动者能够观察到先⾏动者所选择的⾏动。
08、零和博弈:是指在博弈中,⼀⽅的得益就是另⼀⽅的损失,所有博弈⽅的得益总和为零。
09、上策均衡:如果⼀个博弈的某个策略组合中的所有策略都是各个博弈⽅各⾃的上策,那么这个策略组合肯定是所有博弈⽅都愿意选择的,必然是该博弈⽐较稳定的结果,我们称这样的策略组合为该博弈的⼀个上策均衡。
10、重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。
11、纳什均衡:纳什均衡是指这样⼀种策略组合,这种策略组合由所有参与⼈的最优策略组成,即给定别⼈策略的情况下,没有任何单个参与⼈有积极性选择其他策略,从⽽没有任何参与⼈有积极性打破这种均衡。
12、⼦博弈:由⼀个动态博弈第⼀阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集合和进⾏博弈所需要的全部信息,能够⾃成⼀个博弈的原博弈的部分,称为原动态博弈的⼀个⼦博弈。
13、有限理性博弈:存在有限理性博弈⽅的博弈可称为有限理性博弈。
14、完美信息的动态博弈:动态博弈中在轮到⾏为时对博弈的进程完全了解的博弈⽅,称为具有完美信息的博弈⽅,如果动态博弈的所有博弈⽅都有完没信息,则称为完美信息的动态博弈。
第三讲完全信息动态博弈
在这里,B选择的策略称为“冷酷策略” (grim strategies)。冷酷策略是指重复 博弈中的任何参与人的一次性不合作将引 起其他参与人的永远不合作,从而导致所 有参与人的收益减少。因此,所有参与人 具有维持合作的积极性。我们再来讨论博 弈重复次数为有限时的情况。
第16页,本讲稿共23页
第1页,本讲稿共23页
一、子博弈精炼纳什均衡
子博弈精炼纳什均衡的创立者. ——1994年诺贝尔经济 学奖获奖者、莱茵哈德·泽尔腾。
泽尔腾则在60年代中期将纳什均衡概念引入动态 分析。在1965年发表《需求减少条件下寡头垄断模型 的对策论描述》一文,提出了“子博弈精炼纳什均衡” 的概念,又称“子对策完美纳什均衡”。这一研究对纳 什均衡进行了第一次改进,选择了更具说服力的均衡点。 海萨尼在60年代末把不完全信息引入博弈分析。
第9页,本讲稿共23页
以上的分析,就是子博弈精炼纳什均衡解的过程。 策略(A开发,B不开发)就是上述子博弈精炼纳 什均衡解。 ▪ 所谓“子博弈”(sub-game)是指它本身可以作为一 个独立的博弈进行分析,它是原博弈的一部分。例如 ,在表3-1中,每一行或每一列都是整个博弈的一个 子博弈。而且,任何博弈本身可被称为自身的一个子 博弈。 ▪ 只有当某一策略组合在每一个子博弈(包括原博弈 )上都构成一个纳什均衡,这一策略组合才是子博 弈精炼纳什均衡解。显然,如果整个博弈是惟一的 子博弈,纳什均衡与子博弈精炼纳什均衡是完全相 同的。
第18页,本讲稿共23页
三、动态博弈策略行动
在动态博弈中,由于参与人的行动有先后 顺序,而参与人行动顺序直接影响博弈的 结果。因此,参与人为了使其他参与人的 选择对自己有利,往往会主动采取一些行 动影响其他参与人对自己行为的预期,从 而达到对自己有利的结果。参与人所采取 的这些行为称之为“策略行”(strategic move)。
完全信息动态搏弈-子博弈精炼纳什均衡
二 子博弈精练纳什均衡
一个纳什均衡称为精练纳什均衡,当只当 参与人的战略在每个子博弈中都构成纳什 均衡,也就是说,组成精练纳什均衡的战 略必须在每一个子博弈中都是最优的。
博弈战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 博弈扩展式表述
博弈的扩展式表述包括三个要素:
行动顺序 信息 完全信息
动态 完全信息动态博弈 子博弈精练纳什均衡 泽尔腾(1965) 不完全信息动态博弈 精练贝叶斯纳什均衡 泽尔腾(1965) Kreps 和Wilson(1982) Fudenberg 和Tirole(1991)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡 海萨尼(1967-1968)
一 博弈扩展式表述 二 子博弈精练纳什均衡 三 应用举例
博弈的战略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小
投入:1亿
假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿,
需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
x之前的所有结的集合,称为x的前列集P(x),x之后的所有结的 集合称为x的后续集T(x)。
枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参 与人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满 足下列条件的决策结: 1 每个决策结都是同一个参与人的决策结; 2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟 处于哪一个决策结.
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPNE(开发,放弃) 开发,放弃)
问题: 问题:可信性 Credibility
承诺和威胁都是不可信 不可信的 承诺和威胁都是不可信的!
思考: 思考:
如何能使承诺和威胁变得可信? 如何能使承诺和威胁变得可信? 增加撤销承诺或威胁所要受到的损失 让对方知道 穷寇莫追” “破釜沉舟” & “穷寇莫追” 破釜沉舟” 穷寇莫追
实施 乙 不给 不实施 甲 给
威胁不 可信
(-∞, -∞)
(0,0)
(-1000,0) 1000,
例:开金矿博弈 —— 两阶段博弈
• B在开采价值为4万元的金 在开采价值为4 矿时缺1 矿时缺1万元资金 • A恰好有1万元资金可以投 恰好有1 资 • B向A将1万元,承诺开采到 万元, 金子后,与A对半分成 金子后, • A是否应该将钱借给B? 是否应该将钱借给B
完全信息动态博弈
完全信息动态博弈 序贯博弈 Sequential Games 重复博弈 Repeated Games 逆推方法
Backward induction
博弈的扩展式 ——
博弈树
game tree
子博弈精炼的纳什均衡
SPNE
子博弈精炼纳什均衡 SPNE
子博弈精炼纳什均衡 SPNE
扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* ) 是一个子博弈精炼纳什均衡 如果: 是一个子博弈精炼纳什均衡, 如果: 子博弈精炼纳什均衡, 它是原博弈的纳什均衡; 它是原博弈的纳什均衡; 原博弈的纳什均衡 它在每一个子博弈上也都构成纳什均衡。 它在每一个子博弈上也都构成纳什均衡。 子博弈上也都构成纳什均衡
高 高
(500,500) 500,500) (1000,700) 1000,700) (700,1000) 700,1000) (600,600) 600,600)
B1
低 高
A
低
B2
低
例:房地产开发竞争
两家公司, 有 A B 两家公司, 各有两种选择 开发/放弃 开发/ A公司资金充足—— 先行 公司资金充足 B公司需要筹措资金—— 后行 公司需要筹措资金 只一家开发,获利2000 2000万 只一家开发,获利2000万 两家都开发,各损失1000 1000万 两家都开发,各损失1000万
承诺不 可信
(2, (2,2) 打
威胁不 可信
(-1《孙子兵法·九地》:“焚舟破釜,若驱群羊而往, 孙子兵法·九地》 焚舟破釜,若驱群羊而往, 驱而来,莫知所之。 驱而来,莫知所之。” 《史记·项羽本纪》: 史记·项羽本纪》 项羽乃悉引兵渡河, “项羽乃悉引兵渡河, 皆沉船,破釜甑, 皆沉船,破釜甑,烧 庐舍,持三日粮, 庐舍,持三日粮,以 示士卒必死, 示士卒必死,无一还 心。”
“穷寇莫追” 穷寇莫追” 穷寇莫追
《孙子·军争》:“穷寇勿迫,此用兵之法也。” 孙子·军争》 穷寇勿迫,此用兵之法也。 明·罗贯中《三国演义》 罗贯中《三国演义》 第九十五回: 第九十五回: 兵法云: 归师莫掩, 兵法云:“归师莫掩, 穷寇莫追。 穷寇莫追。”
如何使威胁可信? 如何使威胁可信?
开发 开发 A 放弃 B2 B1 放弃 开发 放弃 ( 2, 0) ( 0, 2) ( 0, 0) (0,-1.5) (0,-1.5) (2,-1.5) (2,-1.5) (-1,-1)
Burn one's boats
色诺芬 Xenophon, Ξενοφών, Ξενοφώ 约前427年 355年 雅典人。 约前427年-前355年。雅典人。军 事家,文史学家。 事家,文史学家。 主要作品有:《长征记》 《居 主要作品有: 长征记》 鲁士的教育》《希腊史》 》《希腊史 鲁士的教育》《希腊史》 《回忆 苏格拉底》以及《经济论》 苏格拉底》以及《经济论》。
SPNE(开发,放弃) 开发,放弃)
威胁可信,SPNE(放弃,开发) 威胁可信,SPNE 放弃,开发)
例:
乙向甲所要1000 乙向甲所要1000元 1000元 并威胁甲,如果不给就与他同归于尽 并威胁甲, 甲是否会相信乙? 甲是否会相信乙? 博弈的结果如何? 博弈的结果如何?
SPNE (不给,不实施) 不给,不实施)
例:房地产开发竞争
B
开发, 开发,开发 开发,放弃 放弃,放弃 放弃,开发 开发, 放弃, 放弃, 开发
-1,-1 0, 2
-1,-1 0, 0
2, 0 0, 0
2, 0 0, 2
A
放弃
开发 开发 A 放弃 B2 B1 放弃 开发 放弃
( - 1, - 1 ) ( 2, 0) ( 0, 2) ( 0, 0)
例:
高档 高档 A 低档
500,500 700,1000
B 低挡
1000,700 600,600
A B是两家彩电生产企业 B是两家彩电生产企业 如果A先于B进行产品选择并投产, 如果A先于B进行产品选择并投产,即企业乙在决 定产品时已经知道企业甲的选择 请用扩展式表示这一博弈
NE (高档,低档)&(低档,高档) 高档,低档) 低档,高档) SPNE (高档,低档) 高档,低档)
承诺不 可信
分 B 借 不分 A 不借 (1,0) ( 0, 4) (2,2)
例:开金矿博弈 —— 三阶段博弈
有法律保障
分 B 借 不分 A A 不借 (1,0) 不打 (0,4) (2, (2,2) 打 (1,0)
威胁可信
例:开金矿博弈 —— 三阶段博弈
法律保障不足
分 借 B1 不分 A A 不借 (1,0) 不打 (0,4)