完全信息动态博弈
第3讲 完全信息动态博弈
最优化的一阶条件意味着: s(q1) (a q1 c) =1 2 2
第3讲 完全信息动态博弈
假定q1 a c。这实际上是库诺特模型中企业2的反应函数,不同的 是,这里,s(q1)是当企业1选择q1时企业2的实际选择,而在库诺 2 特模型中,R2 q1)是企业2对于假设的q1的最优反应。 ( 因为企业1预测到企业2将根据s(q1)选择q 2,企业1在第一阶段的问 2 题是: max 1 = q1,s(q1)=q1 a q1 s(q1) c) ( 2 2
第3讲 完全信息动态博弈
• 这个例子也说明,在博弈中,拥有信息优势可能 使参与人处于劣势,而这在单人决策中是不可能 的。企业2在斯坦克尔伯格博弈中的利润之所以低 于库诺特博弈中的利润,是因为它在决策之前就 知道了企业1的产量。即使企业1先行动,但如果 企业2在决策之前不能观测到企业1的产量,我们 就回到了库诺特均衡,因为此时,企业1的先动优 势就不存在了。
第3讲 完全信息动态博弈
* 1 回忆一下,在上一讲得到的库诺特模型的纳什均衡是q1 =q* = (a c), 2 3 3 比较这两个结果,发现斯坦克尔伯格均衡的总产量 (a c)大于库诺特 4 2 的总产量 (a c)。但是,企业1的斯坦克尔伯格均衡产量大于库诺特 3
均衡产量,而企业2的斯坦克尔伯格均衡产量小于库诺特均衡产量。 因为企业1本来可以选择库诺特均衡产量但它没有选择,说明企业1在斯坦 克尔伯格博弈中的利润大于库诺特博弈中的利润,而总产量上升意味着 总利润下降了从而企业2的利润一定下降了。这就是所谓的“先动优势”。
第3讲 完全信息动态博弈
• 宏观经济政策的动态一致性 宏观经济学上与子博弈精炼纳什均衡相对应的概 念是政府政策的动态一致性(dynamic consistency 或time consistency)。政府政策 的动态一致性指的是,一个政策不仅在制定阶段 应该是最优的(从政府的角度),而且在指定之 后的执行阶段也应该是最优的,假设没有任何新 的信息出现。如果一个政策只是在制定阶段是最 优的,而在执行阶段并不是最优的,这个政策就 是动态不一致的。说它是动态不一致的,是因为
第4章 完全信息动态博弈
• 我们也可以这样来理解参与者 的行动,参与者2之所以威胁当 我们也可以这样来理解参与者2的行动,参与者 之所以威胁当 的行动 参与者1出 时 他要选择c1,目的在于通过威胁使参与者1选 参与者 出L时,他要选择 ,目的在于通过威胁使参与者 选 择有利于参与者2的 ,因为在参与者1选择 选择R下 参与者2通过 择有利于参与者 的R,因为在参与者 选择 下,参与者 通过 选择d2,能得到3的报酬 明显好于当参与者1选 ,参与者2 的报酬, 选择 ,能得到 的报酬,明显好于当参与者 选L,参与者 时的收益2。但我们要问的是,如果参与者1不顾参与者 不顾参与者2 选d1时的收益 。但我们要问的是,如果参与者 不顾参与者 时的收益 的威胁而选择了L,参与者2可能会出 可能会出c1吗 在参与者2为理性 的威胁而选择了 ,参与者 可能会出 吗?在参与者 为理性 是公共信息的条件下,参与者2选择 的报酬为1,而选择d1 选择c1的报酬为 是公共信息的条件下,参与者 选择 的报酬为 ,而选择 的报酬为2。由于d1要优于 要优于c1,因而参与者1没有理由相信参 的报酬为 。由于 要优于 ,因而参与者 没有理由相信参 与者2会实施他的威胁 也就是说,参与者2的策略 会实施他的威胁, 的策略c1d2是一 与者 会实施他的威胁,也就是说,参与者 的策略 是一 个不可置信的威胁。如果威胁成真, 个不可置信的威胁。如果威胁成真,c1d2就是一个动态不一致 就是一个动态不一致 的策略,因为参与者2事前是理性的 但在博弈进行到(L)时 事前是理性的, 的策略,因为参与者 事前是理性的,但在博弈进行到 时, 他却成了一个非理性的人(选择了c1,而不是d1)。 )。出现上述 他却成了一个非理性的人(选择了 ,而不是 )。出现上述 问题的原因,在于一个纳什均衡只要求在博弈的总体上, 问题的原因,在于一个纳什均衡只要求在博弈的总体上,参与 者的策略须为均衡, 者的策略须为均衡,而对博弈进行到某个部分时是否仍为均衡 没有要求,这就可能导致总体和局部的冲突, 没有要求,这就可能导致总体和局部的冲突,产生不合理的结 果。
博弈论 第 三 章 完全信息动态博弈讲解
房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
第三讲 完全信息动态博弈
第三章完全信息动态博弈第一节完全信息动态博弈的扩展式表述动态博弈的根本特征是,参与人的行动有先后顺序,且后行动的参与人在自己行动之前能观测到先行动的参与人的行动,特别是能根据先行动的参与人的行动调整或做出自己的战略选择。
运用战略式表述动态博弈的缺陷表现在:1.看不出行动的先后顺序;2.对于描述2人以上的博弈较不方便。
因此,扩展式表述extensive form representation被用于描述动态博弈。
一、扩展式表述的要素1.参与人集合:i=1,……,n。
此外,用N代表虚拟参与人“自然”。
2.参与人的行动顺序the order of moves:谁在什么时候行动。
3.参与人的行动空间action set:在每次行动时,参与人有些什么选择。
4.参与人的信息集information set:每次行动时,参与人知道些什么。
5.参与人的支付函数:在行动结束之后,每个参与人得到些什么(支付是所有行动的函数)。
6.外生事件(即自然的选择)的概率分布。
如同两人有限博弈的战略表述可以用支付矩阵表示一样,n人有限博弈的扩展式表述可以用博弈树game tree表示。
二、博弈树的基本建筑材料building blocks(4,4)(8,)(-3,-3)1,),8),),1),)图3-1(一)结nodes1.结的分类(1)决策结decision nodes:参与人采取行动的时点。
包括:起点结——initial nodes非起点结——(2)终点结terminal nodes:博弈行动路径的终点。
2.结的顺序关系precedence relation用X表示所有结的集合,x∈X表示某个特定的结。
x≺x"表示“x在x"之前”≺3.前列集the set of predecessors和后续集the set of successors定义P(x)为在x之前的所有结的集合,简称为x的前列集;定义T(x)为x之后的所有结的集合,简称为x的后续集。
经济博弈论_谢识予_2_完全信息动态博弈0.1
单结信息集:只包含一个决策结的信息集 完美(Perfect)信息:博弈树的所有信息都是单结的。 ——博弈中没有任何参与人同时行动,且后行动者能观察到先 行动者的行动,且所有参与人观察到N的行动)
1 动态博弈的扩展式表述
静态博弈用扩展式表述 A
坦白 抵赖 坦白
Q:何为完 全信息? B
抵赖
囚 徒 困 境 博 弈
-3,-3 -4,-3
-3,-3 0,0
1,-2 -4,-3 割耳
1,-2 0,0 (-3,-3) (1,-2) 默认 割耳 (-4,-3) (0,0)
三个NE: (不画,{割耳,默认}) (画,{默认,割耳}) (画,{默认,默认})
画 小孩 不画
父亲
父亲
默认
4 NE的缺陷——不可置信的威胁
换句话说,与抽烟有关决策不是单人在中性环境中 的决定,而是一种博弈。“今日卡门”和不同偏好的卡 门自己,即“未来卡门”间的博弈。
5 逆向归纳法
继续抽 未来的 卡门 不抽 今天的卡门
-1,1
1,-1
0,0 两个“卡门”如何行事? 未来卡门如何行事? 考虑到未来卡门的未来行动,今日卡门今日如何行事?
2 动态博弈中的策略
博弈树中参与人在结点上所选择的单个行动—— 一步/招 (move)
美中军事博弈
但是,参与人可以制定一个行动计划,将每个决策结上 的选择都事先规定好,即使这个决策点实际上不会出 美国 现。——策略
中国 中国
策略: 人不犯我、我不犯人; 人若犯我、我必犯人
不犯人
(-2,-2) (2,-4) (3,-5) (0,0)
4 NE的缺陷——不可置信的威胁
完全信息动态博弈(子博弈完美的纳什均衡)
对抗
强硬
甲
丙
不行动(-2,1,-1)
不对抗
(-1,1,0)
.
例:
2 L
1 R
(200,200) M
S (a,b)
N 1
T
(50,300)
(300,0)
➢ 若 a=100,b=150,SPNE是什么? ➢ 若改变a b的数值,能否使L-N-T成为SPNE? ➢ 什么情况下,2会获得300或更高的支付?
Stage1: 哥哥的方案若能使弟弟获得至少一半冰欺凌,则方案通过;
若不能使弟弟获得至少一半冰欺凌,则弟弟不会接受,而哥哥最 终将一无所获。
均衡路径: 哥哥提出方案为1/2:1/2, 弟弟接受
.
例:要挟诉讼
(要求赔偿S) 指控
B
拒绝
起诉
A
放弃
威胁不可 信
(TX-P-C, -TX-D)
( -C , 0 )
A
不指控
接受
( 0 ,0 ) ( S-C, -S )
若 TX<P 则 A将选择放弃
SPNE:A不指控
.
例:要挟诉讼
威胁可信
拒绝
(要求赔偿S) 指控
B
A
不指控
接受
( 0 ,0 )
起诉
A
(TX-P-C, -TX-D)
放弃
( -P- C , 0 )
(S-P-C,-S)
.
例:要挟诉讼
如果原告将P提前支付,TX-C-P>-C-P, 只要胜诉的可能大于0,原告将起诉。 如果S<TX+D, 被告将接受原告的赔偿请求。 如果TX >P+C , 原告会指控。
第三章完全且完美信息动态博弈
第三章完全且完美信息动态博弈在动态博弈中,参与者需要根据对手的行为和策略来调整自己的行动,以便达到最佳的结果。
动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。
完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。
在完全信息动态博弈中,参与者可以通过观察对手的行为来推断出对手的策略和收益函数。
这种博弈可以通过逆向归纳法来求解,即从博弈的阶段开始,逐步向前推导出每个阶段的最佳策略。
逆向归纳法是一种有效的求解完全信息动态博弈的方法,它可以帮助参与者找到最佳策略,从而实现最佳的结果。
然而,在现实世界中,完全信息动态博弈并不常见。
大多数博弈都是不完全信息动态博弈,参与者无法知道其他参与者的策略和收益函数。
在这种情况下,参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。
这种博弈可以通过贝叶斯纳什均衡来求解,即参与者根据对手的类型和收益函数来选择自己的策略,以达到最佳的结果。
完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,并且参与者能够观察到其他参与者的行为和策略。
这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解,从而帮助参与者找到最佳策略,实现最佳的结果。
在完全且完美信息动态博弈中,参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数,从而调整自己的策略,以实现最佳的结果。
在完全且完美信息动态博弈中,参与者之间的互动是基于透明和预知性的。
每个参与者不仅清楚自己的策略选择和可能的收益,同时也了解其他参与者将如何根据这些信息做出反应。
这种透明度使得参与者能够做出更加精确的决策,因为他们能够预测对手的行动并据此调整自己的策略。
这种博弈的一个关键特点是,参与者之间的信息是对称的。
这意味着没有参与者拥有其他参与者所不知道的信息优势。
这种信息对称性使得博弈变得更加公平,因为它消除了信息不对称带来的不确定性。
08 完全信息动态博弈(子博弈完美的纳什均衡)PPT课件
思考:
如何能使承诺和威胁变得可信?
增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” “穷寇莫追”
“破釜沉舟”
《孙子兵法·九地》:“焚舟破釜,若驱群羊而往, 驱而来,莫知所之。”
《史记·项羽本纪》: “项羽乃悉引兵渡河, 皆沉船,破釜甑,烧 庐舍,持三日粮,以 示士卒必死,无一还 心。”
子博弈 Sub-game
原博弈中的一部分(次级博弈)
L
B1
U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
如何寻找均衡?
L
B1 U
R
A
D
L B2
R
( 22,99 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
NE:(U , L)&(D , R)
逆推
backward induction
泽尔腾1965年发表《需求减少条件下寡头 垄断模型的对策论描述》一文,提出了“子 博弈精炼纳什均衡”的概念,又称“子对策 完美纳什均衡”。
• 莱茵哈德·泽尔腾 Reinhard Selten ,子博弈精 炼纳什均均衡的创立者。
• 1994年因在“非合作博
弈理论中开创性的均衡分 析”方面的杰出贡献而荣 获诺贝尔经济学奖。
例:动态游戏 - 博弈树
假设:A 先行动,B 后行动Leabharlann LB1U R
A
D
L
B2
R
( 2,9 ) ( 2,1 ) ( 1,0 ) ( 3,1 )
博弈树 game tree
结点 node 枝 branch 信息集 information set
第二章完全信息动态博弈篇章
i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型
用逆向归纳法求解,首先考虑给定q1的情况下,企业2 的最优选择。企业2的问题是:
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着:
轮流出价的讨价还价模型
一般来说,如果 0 i 1, i 1, 2均衡结果不 仅依赖于贴现因子的相对比率,而且依赖于博 弈时间长度T和谁在最后阶段出价。然而这种 依存关系随T的变大而变小;当T趋于无穷大时 ,我们得到“先动优势”:即如果 1 2 唯 一的均衡是 x 1 (1 ). 定理(Rubinstein 1982):在无限期轮流出价 博弈中,唯一的子博弈精炼纳什均衡结果是: 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵 (仅考虑整数)
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
•
一 博弈扩展式表述
二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 应用举例 斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎 旅行者困境 五 重复博弈
轮流出价的讨价还价模型(1)
3.2完全且完美信息动态博弈
动态博弈的一个中心问题是“可信性”问题。 所谓可信性是指动态博弈中先行为的 参与人是否该相信后行为的参与人会 采取对自己有利的或不利的行为。因为后行 为方将来会采取对先行为方有利的行为相当 于一种“许诺”,而将来会采取对先行为方 不利的行为相当于一种“威胁”,因此我们 可将可信性分为“许诺的可信性”和 “威胁的可信性”
我们以“开金矿博弈”为例来讨论可信性问题
甲要开采一价值4万元的金矿,缺1万元的资金, 向乙借1万元,许诺采到金子后与乙平分。 乙是否借钱给甲呢?
乙最需要关心的就是甲采到金子后是否会履行诺 言跟自己平分,因为万一甲采到金子后不但不跟 乙平分,而且还赖帐或卷款潜逃,则乙连自己的 本钱都收不回来。关键的是要判断的许诺是否可 信!以自身利益最大化原则,甲必然选择不分! 乙清楚甲的行为准则,最好的选择是不借!对乙 来说,甲的许诺是不可信的! 要想使甲的许诺成为可信的,加上第三阶段,让 乙在甲违约时采用法律手段---“打官司”,乙的利 益受到法律保护,甲的许诺是可信的。乙在第一 阶段选择借,甲在第二阶段选择分。
行动有先后顺序,不同的参与人在不同时
点行动,先行动者的选择影响后行动者的 选择空间,后行动者可以观察到先行动者 做了什么选择。 因此,为了做出最优的行动选择,每个参 与人都必须这样思考问题: 如果我如此选择,对方将如何应对?如果 我是他,我将会如何行动?给定他的应对, 什么是我的最优选择?
动态博弈的有效分析概念,除了要符合纳什
均衡的基本要求以外,还必须满足另一个关 键的要求,那就是它(或者它们)必须能够 排除博弈方策略中不可信的行为设定,也就 是各种不可信的威胁和承诺。 只有满足这样要求的均衡概念在动态博弈分 析中才有真正的稳定性,才能对动态博弈作 出有效的分析和预测。
完全信息动态博弈名词解释
完全信息动态博弈名词解释完全信息动态博弈是一种研究行为科学者、决策者和经济学家最关心的对策理论形式之一。
它试图研究他们在某种状况下,如何让一组参与者在他们之间分得最大的利益。
完全信息动态博弈是一种行为科学模型,可以通过模拟和抽象实际的情况来研究系统中的行为。
因此,它是一种重要的研究工具,可以用来模拟和研究不同情境下的博弈局势。
完全信息动态博弈涉及有两个或更多参与者,每个人都有自己的可以改变的决策行为。
它还涉及到一个模型环境,这些参与者都使用相同的规则来发展他们的决策,而改变决策可以带来某种好处或坏处。
所以,完全信息动态博弈是由多个参与者的行为引起的系统分析模型,而这些参与者都会因为相同的模型而产生不同的决策。
完全信息动态博弈的一个重要特征是完全信息,意味着每个参与者都知道另一个参与者的行动,也知道另一个参与者从这个行动中获得什么样的利益损失。
这允许他们考虑到彼此的角色,更好地理解另一个参与者对他们自己利益和损失的影响。
有时候,完全信息会被认为是一种缺乏竞争元素的情况,因为当参与者都知道对方的行动时,他们就不太可能达成共同的行为。
另一个重要特征是动态性,这意味着参与者可以在游戏过程中改变决策,而这一改变可以影响其他参与者的利润。
此外,动态博弈还可以用胜负来衡量收益,因为参与者根据他们的行动可以获得更多的收益。
最后,完全信息动态博弈的最重要的特征是它的模型,这是一套模拟环境,用来模拟实际的情景。
它可以用来研究任何情况下,参与者之间如何分享收益,以及参与者如何通过谈判、竞争和协调来获得更多的收益。
因此,完全信息动态博弈可以分析各种实际情况,并可以用来模拟不同的决策情况,以及政策决策的合理性和可行性。
由于完全信息动态博弈能够模拟不同的决策情景和实际情况,它已经成为了一种广泛应用的行为科学模型。
它可以用来研究像国际关系、政治研究、社会心理学以及商业决策等复杂情况。
完全信息动态博弈可以用来预测不同参与者之间的行为,并为研究者提供一个更好的分析模型。
动态完全信息三阶段博弈模型
动态完全信息三阶段博弈模型1. 介绍在博弈论领域,动态完全信息三阶段博弈模型是分析多参与者之间战略互动的有力工具。
在玩家完全了解游戏结构并能够观察到其他玩家行动的情况下,这个模型抓住了决策的本质。
本文旨在通过探索其关键特征、战略考虑和潜在应用,全面理解这一博弈模型。
2. 主体2.1动态完全信息三阶段博弈模型的主要特征动态完全信息三阶段博弈模型包括初始阶段、中间阶段和最终阶段三个不同的阶段。
每个阶段都代表一个特定的时间点,玩家在此做出决策并进行战略互动。
这种模式提供了几个区别于其他游戏模式的关键特征:2.1.1顺序决策:与玩家同时做出决策的同步游戏不同,三阶段游戏模型允许顺序决策。
在每个阶段中,玩家将基于之前玩家的行动而轮流做出选择,从而创造出一个动态且不断发展的游戏环境。
2.1.2完全信息:该模型假设参与者拥有关于博弈结构的完整信息,包括所有参与者的偏好、策略和收益。
这种完美的信息使玩家能够基于他们对整个游戏的了解做出理性的决定。
2.1.3多重均衡:三阶段博弈模型通常呈现多重均衡,即在其他玩家选择的策略下,每个玩家的策略都是最优的。
这些平衡在效率和公平性方面可能有所不同,从而导致玩家之间的战略考虑和潜在冲突。
2.2动态完全信息三阶段博弈模型中的策略考虑2.2.1前向归纳法:该博弈模型中一个重要的策略考虑是前向归纳法,即从最后阶段向后推理,以确定最优策略。
玩家预测未来玩家的行动,战略性地调整他们的选择,以最大化他们的长期收益。
这种战略思维对于玩家利用潜在机会和避免次优结果至关重要。
2.2.2时机与承诺:三阶段博弈模型强调了时机与承诺在决策中的重要性。
玩家必须仔细考虑何时采取行动,因为时机会对结果产生重大影响。
此外,承诺在塑造玩家的策略中发挥作用,因为在早期阶段做出的承诺可以影响未来玩家的行动。
2.2.3声誉和可信度:在这个博弈模型中,声誉和可信度是至关重要的考虑因素。
玩家过去的行动和行为可以建立影响其他玩家选择和期望的声誉。
经典:博弈论-完全信息动态博弈
2、博弈的扩展式表述的要素
博弈的扩展式表述包含以下要素: (1) 参与人集合:i=1,2,…,n。此外,用N代表虚拟
参与人——自然。 (2) 行动顺序:谁在什么时候行动。 (3) 参与人的行动空间: (4) 参与人的信息集: (5) 参与人的策略集: (6) 参与人的支付函数: (7)外生事件的概率分布。
博弈的收益矩阵
(1)高需求
开发 开发商A 不开发
(2)低需求
开发 开发商A 不开发
开发商B
开发
不开发
2, 2
4, 0
0, 4
0, 0
开发商B
开发
不开发
-1, -1
1, 0
0, 1
0, 0
博弈分类
按开发商博弈的先后顺序分: 静态博弈:两个开发商同时决策,或后决策者不
能观察到先行动者的行动。 动态博弈:博弈有先后顺序,且后决策者能观察
完全信息动态博弈图示:N A B
开发 (2,2)
高需求
○
A
N
低需求
开发 不开发 开发 不开发
不开发 (4,0)
开发 (0,4) B 不开发 (0,0)
开发 (-1,-1) 不开发 (1,0)
开发 (0,1) 不开发 (0,0)
(4)不完全信息动态情形:ANB
开发商A不清楚市场的需求状态,决定是否开发; 开发商B 在观察到市场需求和A的决策后决定是否开发。
到先行动者的行动后再行动。 按开发商是否知道市场需求状态分:
完全信息博弈:若两个开发商都知道市场需求状 态(高需求或低需求)。
不完全信息博弈:由自然决定市场的需求状态, 两开发商不知道。 共同知识:在市场各种可能状态和各开发商不同策 略组合下的得益矩阵是双方的共同知识。
完全信息动态博弈模型
完全信息动态博弈模型完全信息动态博弈模型是博弈论中的一种重要模型,它描述了参与者具有完全信息(即对所有相关信息都有准确了解)的情况下进行的博弈过程。
在该模型中,参与者能够观察其他人的行为和选择,并根据这些观察作出自己的决策。
在完全信息动态博弈模型中,博弈过程分为多个阶段。
每个参与者在每个阶段都必须做出自己的决策,而后续的决策将依赖于先前的决策。
参与者可以根据观察到的其他人的行为和选择来调整自己的策略。
这种博弈模型特别适用于描述多个参与者之间具有时间序列关系的情况,如竞价拍卖、价格战等。
完全信息动态博弈模型可以用博弈树来表示。
博弈树由一系列节点和边组成,每个节点表示参与者的决策点,边表示参与者的决策选择。
根节点表示博弈的初始状态,而叶节点表示博弈的终止状态。
在每个节点上,参与者根据其他人的选择和观察到的信息来做出决策。
通过沿着博弈树的边一步一步向下移动,参与者可以在每个阶段根据观察到的信息进行反应和调整。
完全信息动态博弈模型需要考虑的核心概念是策略和均衡。
策略是参与者通过决策选择在每个节点上的行为规则,决定了参与者在每个阶段应该如何行动。
而均衡是一种状态,其中所有的参与者都无法通过单方行动来改善自己的收益。
在完全信息动态博弈模型中,通常存在多个均衡解,其中每个参与者都选择出使自己获得最大收益的策略。
通过建立完全信息动态博弈模型,我们可以分析不同参与者的决策行为和相应结果的演化过程。
通过求解均衡解,我们可以预测在不同情况下各参与者的最佳策略选择,从而为参与者提供决策依据。
此外,完全信息动态博弈模型也可以用于研究不同决策因素对博弈结果的影响,并为参与者提供制定最优策略的指导。
总之,完全信息动态博弈模型是博弈论中重要的一个模型,它描述了参与者具有完全信息的情况下进行的博弈过程。
通过建立博弈树、分析策略和求解均衡解,我们可以预测参与者的决策行为和相应结果的演化,并提供决策指导。
这种模型对于研究多个参与者之间具有时间序列关系的博弈情况非常有用,为决策者提供了重要的参考和指导。
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
第3章 博弈论与信息经济学--完全信息动态博弈
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。
完全信息动态博弈
乙 借 不借 甲 借
乙
不借
甲 (1,0)
(1,0)
分
不分
分
不分
(2,2) (2,2) (0,4) 打
乙 不打 (0,4)
不可信的许诺 (1,0)
可信的威胁
先来后到博弈
在市场经济活动中常常有这样一种现象,当某个厂商先行开 拓或占领了某个市场以后,其他厂商为丰厚的利润所吸引也 会随后跟进。这时,先占领市场者大多都不会无动于衷,而 是利用自己先行一步的优势对后来者进行打击。但这种打击 往往需要付出一定代价,当然如果能够达到挤走后来者的目 的,它就会长期地独占或垄断市场,所以长期地看先到者还 是合算的。那么,当一个先到者面临一个后来者争夺市场的 威胁时,空间应该如何抉择呢?
* A t A n n * Bi t Bi i 1 i 1
(a v c) 2 (2n 1)(a v c) 2 , ] 解得: t [ 2 4n(n 1)b 4n(n 1) b
(a bQ v c)Q n(a w v)[a v nw (n 1)c] b(n 1) 2
Bi qi a bQ w v bqi 0 awv qi ( n 1)b Q qi
i 1 n
n( a w v ) ( n 1)b
子博弈精炼纳什均衡的应用举例
斯坦克尔伯格(Stackelberg)寡头竞争模型 如同在库诺特模型中一样,在斯坦克尔伯格模型中,企业的行动也 是选择产量。不同的是,在斯坦克尔伯格模型中,企业1(称为领头 企业,leader)首先选择产量q1,企业2(称为尾随企业,follower) 观测到q1,然后选择自己的产量q2,此时他们选择的产量以及所得 利润分别是多少?
完全信息动态博弈 经典例子
完全信息动态博弈经典例子完全信息动态博弈是博弈论中的一个重要概念,指的是博弈参与者在做决策时拥有完全的信息。
下面是符合要求的10个完全信息动态博弈的经典例子:1. 拍卖场景:假设有两个竞拍者参与一场拍卖,他们都知道对方的出价和拍卖物品的价值,他们需要根据对方的出价和自己对拍卖物品价值的估计来决定自己的出价。
2. 囚徒困境:两名囚犯被关押在不同的牢房中,检察官给他们一个选择,如果他们都保持沉默,那么都只会被判轻罪;如果其中一个人供出另一个人,供出者会被判轻罪,而另一个人则会被判重罪;如果两人都供出对方,那么都会被判重罪。
囚犯在做出决策时,都知道对方的选择和可能的后果。
3. 企业竞争:两家竞争对手企业同时决定是否要进入一个新市场。
如果只有一家企业进入市场,它将获得垄断地位,赢得较高的利润;如果两家企业都进入市场,将会有激烈的竞争,利润都会下降。
两家企业在做出决策时,了解对方的行动和可能的后果。
4. 汽车悖论:假设有两辆车同时行驶在一条单行道上,它们需要决定是否要超车。
如果只有一辆车超车,它将获得更快的到达目的地的时间;如果两辆车同时超车,将会导致交通堵塞,两辆车的到达时间都会延长。
两辆车在做出决策时,了解对方的行动和可能的后果。
5. 资源分配:假设有两个人需要共同分配一笔资源,他们都知道对方对资源的需求和自己对资源的评估。
他们需要根据对方的需求和自己的评估来决定如何分配资源。
6. 股票交易:假设有两个投资者同时决定是否要买入或卖出某只股票。
他们都知道对方的交易意向和市场的情况,他们需要根据对方的交易意向和市场情况来决定自己的交易策略。
7. 网络安全攻防:假设有两个黑客分别掌握了对方的攻击技术和防御技术。
他们需要根据对方的技术和自己的技术来决定如何进行攻击或防御。
8. 购物决策:假设有两个消费者同时决定是否要购买某个商品。
他们都知道对方的购买意向和商品的价格,他们需要根据对方的购买意向和商品的价格来决定自己的购买策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的扩展式表述
扩展式表述所“扩展” 扩展式表述所“扩展”的主要是参与人的战略空间 战略式表述简单地给出参与人有些什么战略可以选择, 战略式表述简单地给出参与人有些什么战略可以选择, 每个战略的动态描述 动态 而扩展式表述要给出每个战略的动态描述:谁在什么 时候行动, 时候行动,每次行动时有些什么具体行动方案可供选 择,以及知道些什么 此时的战略:如果你这样, 此时的战略:如果你这样,我将怎样
不开 开 (1,0) (0,8)
(8,0)
(-3,-3)
B知道自 然的选择; 但不知道A 信息集:房地产博弈III 的选择(或A、 B同时决策)
A 开发 N1 大 B1 开发 (4,4) 小 B2 不开发 开 (8,0) (-3,-3) 不开 开 (1,0) (0,8) 大 B3 不开 开 (0,0) (0,1) 不开发 N2 小 B4 不开 (0,0)
囚徒困境博弈的扩展式表述
A
坦白 抵赖 坦白
B
抵赖
B
抵赖 坦白
B
坦白
A
抵赖 坦白
A
抵赖 坦白 抵赖
(-8,-8)
(0,-10)
(-10,0) (-1,-1) (-8,-8) (0,-10) (-10,0)
(-1,-1)
囚徒困境博弈的扩展式表述
智猪博弈的扩展式表述?
案例2-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 0,0
完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡 泽尔腾(1965) 泽尔腾(1965)
考虑下列问题: 考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡, 一个博弈可能有多个(甚至无穷多个)纳什均衡,究 竟哪个更合理? 竟哪个更合理? 纳什均衡假定每一个参与人在选择自己的最优战略时 纳什均衡假定每一个参与人在选择自己的最优战略时 假定所有其他参与人的战略是给定的, 假定所有其他参与人的战略是给定的,但是如果参与 人的行动有先有后, 人的行动有先有后,后行动者的选择空间依赖于前行 动者的选择, 动者的选择,前行动者在选择时不可能不考虑自己的 行动对后行动者的影响。 行动对后行动者的影响。 子博弈完美纳什均衡的一个重要改进是将“ 子博弈完美纳什均衡的一个重要改进是将“合理纳什 均衡” 不合理纳什均衡”分开。 均衡”与“不合理纳什均衡”分开。
什么是参与人 的战略? 的战略? A
开发 不开发
B
开发
x
不开发
B
开发
x’
不开发
简写为: 简写为: (开发,开发),(开发,不开发), 开发,开发),(开发,不开发), ),(开发 不开发,开发),(不开发, ),(不开发 (不开发,开发),(不开发,不开 ),括号内的第一个元素对应A选择 发), “开发”时B的选择,第二个元素对应A 选择“不开发”时B的选择。
博弈的扩展式表述
要素: 要素:
参与人集合 参与人的行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件( 自然”的选择) 外生事件(即“自然”的选择)的概率分布
参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件的概率分布
A
开发
参与人(A,B,N)
女
芭蕾
x
1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管他选什么,我都选芭蕾;
(1,2)
(-1,-1)(0,0)
(2,1)
4、足球策略:不管他选什么,我都选足球。
策略即 如果他选择什么,我就怎样行动的相机行动方案。 策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展
战略集合
L L n 维向量 s = s1, s 2, , s i, , s n)称为一个战略组合 (
在静态博弈中,战略和行动是相同的。 在静态博弈中,战略和行动是相同的。 作为一种行动规则,战略必须是完备的。 作为一种行动规则,战略必须是完备的。
性别战博弈的扩展式表述
男
足球 芭蕾 足球
女
芭蕾
女
芭蕾
子博弈完美纳什均衡
一个纳什均衡称为完美纳什均衡,当只当参与 人的战略在每个子博弈中都构成纳什均衡,也 就是说,组成完美纳什均衡的战略必须在每一 个子博弈中都是最优的。 一个完美纳什均衡首先必须是一个纳什均衡, 但纳什均衡不一定是完美纳什均衡。 承诺行动-当事人使自己的威胁战略变得可置信 的行动。
参与人1 丈夫)和参与人2 妻子) 参与人1(丈夫)和参与人2(妻子)必须独立决定出门时是否 带伞。他们知道下雨和不下雨的可能性均为50% 支付函数为: 50%, 带伞。他们知道下雨和不下雨的可能性均为50%,支付函数为: 如果只有一人带伞,下雨时带伞者的效用为-2.5, 如果只有一人带伞,下雨时带伞者的效用为-2.5,不带伞者的 效用为不下雨时带伞的效用为-1,不带的效用为 不带的效用为0 效用为-3;不下雨时带伞的效用为-1,不带的效用为0;如两人 都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给 不下雨时每人的效用为1; 都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给 出下列四种情况下的扩展式及战略式表述: 出下列四种情况下的扩展式及战略式表述: (1)两人出门前都不知道是否会下雨; (1)两人出门前都不知道是否会下雨;并且两人同时决定是否带 两人出门前都不知道是否会下雨 即每一方在决策时都不知道对方的决策); 伞(即每一方在决策时都不知道对方的决策); (2)两人在出门前都不知道是否会下雨,但丈夫先决策, (2)两人在出门前都不知道是否会下雨,但丈夫先决策,妻子观 两人在出门前都不知道是否会下雨 察到丈夫是否带伞后才决定自己是否带伞; 察到丈夫是否带伞后才决定自己是否带伞; (3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策, (3)丈夫出门前知道是否会下雨,但妻子不知道,但丈夫先决策, 丈夫出门前知道是否会下雨 妻子后决策; 妻子后决策; (4),同(3),但妻子先决策,丈夫后决策. (4),同(3),但妻子先决策,丈夫后决策. 但妻子先决策
大
小
结, 终点结ຫໍສະໝຸດ (4,4)(0,1)
(0,0)
房地产开发博弈
支付
B在决策 时不确切地 信息集:房地产博弈II 知道自然的 选择;
A
B的决策 结由4个变 为2个
大 B1 开发 (4,4)
开发 N1 小 B2 不开发 开
不开发 N2 大 B3 不开 开 (0,0) (0,1) 小 B4 不开 (0,0)
(-3,-3)
(1,0) (0,1)
(0,0)
扩展式 A
开发 不开发
路径
在扩展式博弈中,所有n 在扩展式博弈中,所有n个参与人 的一个纯战略组合决定了博弈树 上的一个路径。 上的一个路径。 (开发,{不开发,开发})决定 开发, 不开发,开发} 了博弈的路径为A—开发 B—不 了博弈的路径为A 开发—B 不 开发 开发---( 开发--(1,0) (不开发,{开发,开发})决定 不开发, 开发,开发} 了路径:? 了路径:?
动态博弈的战略的表述
战略:参与人在给定信息集的情况下选择行动的规则, 战略:参与人在给定信息集的情况下选择行动的规则,它规定 参与人在什么情况下选择什么行动,是参与人的“相机行动方 参与人在什么情况下选择什么行动,是参与人的“ 案”。
s i 表示第 i 个参与人的特定战略 如果 n 个参与人每人选择一个 s i 表示第 i 个人选择的战略 S i = {s i }代表第 i 个参与人所有可选择的 战略,
式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的 式博弈里,参与人是相机行事, 等待” 信息集(包含一个或多个决策结)后,再采取行动方案。 信息集(包含一个或多个决策结 后 再采取行动方案。
扩展式表述博弈的纳什均衡
若A先行动,B在知道A的行动后行动,则 A有一个信息集,两个可选择的行动,战 略空间为:(开发,不开发); :(开发,不开发) :(开发 B有两个信息集,四个可选择的行动,B 有四个纯战略: 开发策略:不论A开发不开发,我开发; 开发策略:不论A开发不开发,我开发; 追随策略: 开发我开发, 不开发我不开发; 追随策略:A开发我开发,A不开发我不开发; 对抗策略:A开发我不开发,A不开发我开发; 对抗策略: 开发我不开发, 不开发我开发; 不开发策略不论A开发不开发我不开发, 不开发策略不论A开发不开发我不开发,
完全信息动态博弈-子博弈完美纳什均衡(举例)泽尔 腾(1965)
行动 合作(40,50) 进入
进入者
在位者
斗争(-10,0)
不可置信威胁
不进入(0,300) 市场进入阻挠博弈树 特点:剔除博弈中包含的不可置信威胁。 承诺行动-破釜沉舟-背水一战 给定进入者进入,剔除(进入,斗争),(进入,默许) 是唯一的子博弈完美纳什均衡 支付函数
博弈战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 开发商A 不开发 开发商B 开发 不开发
4000, 4000,4000 0,8000 8000, 8000,0 0,0
开发商B 开发 不开发
-3000,-3000 3000, 0,1000 1000, 1000,0 0,0
博弈的战略式表述
2.3 完全信息动态博弈
本节内容: 本节内容: 一 博弈扩展式表述 二 子博弈完美纳什均衡 三 应用举例
博弈的战略表述
案例- 房地产开发项目-假设有A、B两家开发商
市场需求:可能大,也可能小 投入:1亿
假定市场上有两栋楼出售: 假定市场上有两栋楼出售: 1.4亿 需求大时,每栋售价1.4 需求大时,每栋售价1.4亿, 需求小时,售价7千万; 需求小时,售价7千万; 如果市场上只有一栋楼 1.8亿 需求大时,可卖1.8 需求大时,可卖1.8亿 需求小时,可卖1.1 1.1亿 需求小时,可卖1.1亿