第12讲:完美贝叶斯均衡
完美贝叶斯均衡之应用实例简述
Markus M. Mobius之信誉博弈
我们因此要一种不能通过逆向推导求解的模型,例如,一种不完 全信息博弈。更准确地说,我们要求一些主体类型的不确定性 (例如,成为“疯狂”合作者的不确定性)。一个长期博弈方 可以利用这种使自己像疯狂类型那样行事的微小的潜在信誉 (可能性)。在某些方面,理性博弈方可以“隐藏”在疯狂类型 之后。 在信誉模型中,有两种例子:(1)长期生存博弈方面对许多短 期生存的对手,譬如,连锁店博弈;(2)许多长期生存的博弈 方(之间的博弈),譬如,囚徒困境博弈。
Markus M. Mobius之信誉博弈
2、连锁店博弈 连锁店博弈是由Selten (1978),即一个大的连锁店面对许多市场 的序列进入。每个时期都有一个进入者要决定是进入还是离开。
进入者
进入
离开
在位者
(0,a)
战斗
容纳
(-1,-1)
(b,0)
Markus M. Mobius之信誉博弈
如果进入者离开,在位者享有支付a > 0。如果他进入,连锁店选 择战斗策略的话,双方都得到-1,如果选择容纳,则进入者得到 b > 0,而连锁店得到0。 我们已经知道,这个阶段博弈有唯一的SPE。现在考虑这个博弈 在T个市场重复的博弈。独特SPE仍然是所有市场连锁店选择容 纳,而每个进入者都选择进入——即使在位者在前一个时期选择 战斗。Selten把这种均衡称为连锁店悖论。 评论:我们可以通过让进入者分别可能是弱或强(类型),来 引入不完全信息,而强进入者总是会进入。这个博弈仍然会有 独特SPE,这时,所有进入者进入,而在位者总是容纳。
声明方 (类型)
T1
T2
行为方(行为)
α1
α2
2 ,1
精炼贝叶斯Nash均衡
• 参与人2选择L’与R’的期望收益分别为2-p 和1+p,因此,如果p>1/2,则最优战略 为R’;如果p<1/2 ,则最优战略为L’。
要将子博弈精炼Nash均衡中“均衡精炼” 的思想应用到不完全信息扩展式博弈中, 就必须做到: 1) 对每个参与人i,在其信息集上给出关 于自己位于该信息集中哪一个决策结的 信念(或推断); 2) 对参与人i的每个信息集,在给定参与 人i在该信息集上的信念(或推断)情况下, 参与人的战略是对其他参与人战略的一 个最优反应,即参与人的选择必须满足 序惯理性(sequential rationality)。
L
R
• 不仅要求参与人2的均衡战略在由单决策 结构成的信息集上最优,而且还要求参 与人3的均衡战略在由多决策结构成的信 息集和上最优。
• 但对于位于由多决策结构成的信息集(I3 ({x4,x5})或I3({x6,x7}))上的参与人3,当轮 到他行动时,由于对已发生的历史即参 与人2是选择了L’还是R’并不清楚,因此 也就不知道自己是位于决策结x4 (或x6)还 是决策结x5 (或x7)上。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
• 精炼贝叶斯Nash均衡既包含了一个战略 组合,又包含一个信念系统。 • 这里信念系统对每个信息集都确定了位 于该信息集上的参与人所持有的信念。 • 这种信念是信念持有人对已发生历史的 一个推断,也可理解为他对自己位于信 息集上哪一个决策结的“一种估计”。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
精炼贝叶斯Nash均衡
纯策略贝叶斯纳什均衡例题
纯策略贝叶斯纳什均衡例题引言:纯策略贝叶斯纳什均衡是博弈论中常用的概念之一,它可以用于分析多方参与的决策问题。
本文将通过一个例题来解释纯策略贝叶斯纳什均衡的概念及应用。
例题背景:假设有两家咖啡店,分别是A店和B店。
每天早晨,两家咖啡店都需要决定自己的咖啡价格。
同时,消费者也需要决定去哪家咖啡店购买。
假设消费者根据市场情况作出购买决策。
A店和B店的利润与消费者选择有关。
情景一:A店设置较高的价格,B店设置较低的价格。
这种情况下,消费者更愿意选择购买B店的咖啡。
B店的利润将最大化,而A店的利润将最小化。
情景二:A店和B店都设置较低的价格。
这种情况下,消费者会更加倾向于选择购买A店的咖啡。
A店的利润将最大化,而B店的利润将最小化。
情景三:A店和B店都设置较高的价格。
这种情况下,消费者没有购买的动力,两家咖啡店的利润都会很低。
分析与求解:我们可以将上述情景转化为一个博弈论的模型,其中A店和B店是两个决策者,他们需要根据对方的策略来决定自己的策略。
消费者的选择将影响两家咖啡店的利润。
根据纯策略贝叶斯纳什均衡的概念,我们需要确定每个决策者的策略组合,以获得最优的结果。
在这个例题中,我们需要确定A店和B店的咖啡价格。
假设A店有80%的机会成为消费者的首选,B店有20%的机会。
根据这个信息,我们可以得到以下策略组合:情景一:A店设置高价格,B店设置低价格。
情景二:A店设置低价格,B店设置低价格。
情景三:A店设置高价格,B店设置高价格。
然后我们可以计算每种策略组合下两家咖啡店的利润,并找出使两家咖啡店利润最大化的策略组合。
结论:通过计算,我们可以得到以下结果:情景一:A店设置高价格,B店设置低价格。
这种情况下,A店的利润最大化,B店的利润最小化。
因此,纯策略贝叶斯纳什均衡的结果是,A店设置高价格,B店设置低价格时,两家咖啡店的利润最优化。
扩展思考:本例题中我们假设了A店有80%的机会成为消费者的首选,B店有20%的机会。
第12讲:完美贝叶斯均衡
1
1
差 卖
1
卖
不卖 (0,0)
23
2
买 不买 买 不买
(2,1) (0,0) (1,-1) (-1,0)
23
为什么称这种均衡为完美贝叶斯均衡?
首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似; 其次,因为要求3和要求4规定“判断”的形成必须符合 贝叶斯法则。
(a)在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续 策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的 得益或期望得益最大。 (b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段 中,针对所有可能情况如何行为的完整计划。
好 不卖 (0,0)
1
1
差 卖
1
卖
不卖 (0,0)
20
当某策略组合及相应的判断满足这样四个要求时, 称为一个“完美贝叶斯均衡”。
为什么称这种均衡为完美贝叶斯均衡?
21
为什么称这种均衡为完美贝叶斯均衡?
首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似;
22
− 要求2:给定各博弈方的“判断”,他们的策略必
35
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有一个
关于博弈达到该信息集中每个节点可能性的“判断”( Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须是“ 序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法 则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断”由贝 叶斯法则和各博弈方在此处可能有的均衡策略决定。
博弈论——策略互动的艺术_哈尔滨工业大学中国大学mooc课后章节答案期末考试题库2023年
博弈论——策略互动的艺术_哈尔滨工业大学中国大学mooc课后章节答案期末考试题库2023年1.观察如下的一个博弈树,【图片】下面结论正确的是()。
答案:该博弈实质上是一个二人同时进行的博弈,其中参与人1的策略集为{a,b},参与人2的策略集为{c, d}2.关于纳什均衡、子博弈完美均衡、完美贝叶斯均衡三个概念,下面说法正确的是()。
答案:完美贝叶斯均衡一定是子博弈完美均衡3.关于博弈论纳什均衡的论述,下列说法中,()是正确的。
答案:纳什均衡中任意一个参与人的对应策略,一定是关于该均衡中其他参与人在均衡中的策略或策略组合的最佳应对(best reply)4.下面例子,()不属于博弈行为。
答案:樵夫在森林砍柴,樵夫和树木的关系5.再考虑孩子教育博弈问题,假设博弈支付矩阵如下所示孩子认真学习沉迷游戏母亲溺爱e, 21, f冷酷的爱a, bc, d如果在博弈均衡情况下,孩子的均衡策略是“认真学习”和“沉迷游戏”策略的完全非退化随机化(孩子均以严格正概率选择这两个策略),且博弈只存在一个纳什均衡,那么下面表述为真的选项是( )答案:母亲也必须对“溺爱”和“冷酷的爱”进行完全非退化的随机化(以严格正概率选择“溺爱”和“冷酷的爱”)6.考虑如下的孩子教育博弈,支付矩阵如下(a,b,c均大于0)孩子认真学习沉迷游戏母亲溺爱3, 21, 3冷酷的爱a, bc, d如果希望博弈均衡为(冷酷的爱,认真学习),那么a~d需要满足的条件为()答案:a≥3且b≥d7.对于如下图所示的博弈【图片】若参与人1选择行动L、M和R的概率分别为0.2,0.3和0.5,那么根据“策略-信念”的一致性要求,当博弈到达参与人2的信息集时,下面选项正确的是()。
答案:参与人2认为她在左边决策节点的概率和右边节点的概率分别为0.4和0.6 8.目前新能源汽车在世界范围内处于方兴未艾的状态,关于新能源汽车行业,从博弈“竞合”角度,下面说法合理的是()(可多选)答案:提升电动汽车电池续航能力会增加汽车的价值_适度的国内竞争,会有利于我国新能源汽车行业的发展_在相对偏僻的商场增设充电桩,会实现商场和新能源汽车销售企业的共赢9.关于博弈“竞合”的表述,最为贴切的表述是()答案:竞合的含义是,竞争与合作同时存在的过程10.下面选项哪个不属于破解囚徒困境的方法()答案:事先制定君子协定11.改变博弈的PARTS法中,S的含义是()答案:Scope 博弈的范围12.下面关于博弈树的说法,正确的是()。
精炼贝叶斯均衡
子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
N
让我们再一次考虑市场进入的例子: 高 [u]
在位者
低 [1-u]
P=4
进入者
P=5
进入
不进入 进入
则要求Pr ob{ah} 0,即参与人i必须以正的概率选择 a h ,否则,后验概率没
有定义.如果 Pr ob{a h} 0 ,我们允许Pr ob{ah} 0 在[0,1]区间取任 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | ah} 对应的是
非均衡中径上的信息集
(7,0)
(5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
博弈论与信息经济学 江西财经大学图4.陶1长市琪场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择;
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼
贝叶斯均衡PPT15页
贝叶斯均衡
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事Βιβλιοθήκη 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
40、学而不思则罔,思而不学则殆。——孔子
精炼贝叶斯Nash均衡的精炼
信息集的严格劣战略:
• 考虑轮到参与人行动的一个信息集。战 略si*为始于这一信息集的严格劣战略, 如果存在另一个战略si使得对i在给定信 息集可能持有的每一推断,并且对每一 其他参与人后续战略可能的组合,i在给 定信息集根据si选择行动并在其后根据si 选择后续战略得到的收益,严格大于根 据si*选择行动和后续战略得到的收益。
2) 对于信号博弈的精练贝叶斯Nash均衡, 可将信念精炼标准1重新表述如下。
• 在信号博弈中,M中的信号mj称为T中 类型ti的劣信号,如果存在另外一个信 号mj’,使得ti选择mj’的最小可能收益 大于ti选择mj的最大可能收益,即
Minus ti , mj , ak Max us ti , m j , ak
u [ p] L
t1
0.5
R
[q]
u
0,1
2,0
d 接收者
d 接收者 u [1 q] d
1,0
自然
0.5
1,0
u L [1 p]
0,0
R
1,1
d
t2
2,1
• 对q≥1/2,战略和推断[(L,L),(u,u),p=0.5,q] 构成博弈的一个混同精炼贝叶斯Nash均 衡。
• 由于类型为t1的发送者选择R的最大收益为1, 而选择L的最小收益为2,因此,发送者的战 略(R, L)和(R, R)为始于类型为t1的发送者的信 息集的严格劣战略。所以,根据信号条件(5), q=0。因此,博弈的精炼贝叶斯Nash均衡[(L, L),(u,u),p=0.5, q≥1/2]不满足信号条件(5)。 • 分离精炼贝叶斯Nash均衡[(L,R),(u,d),p=1,q=0] 则自然满足信号条件(5)。
不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。
然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。
2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。
如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。
“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。
4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。
决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。
海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。
5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。
B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。
如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。
如果阻挠的成本低,A企业的最优战略是阻挠。
⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。
这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。
12第十二章贝叶斯纳什均衡及其精炼
第十二章贝叶斯纳什均衡及其精炼前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。
本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。
12.1不完全信息博弈与贝叶斯纳什均衡一、不完全信息博弈完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(common knowledge)的博弈。
反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。
二、海萨尼(Harsanyi)转换在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。
至于“类型”概念,以两个企业博弈的例子说明。
假设参与人1为在位者企业,参与人2为进入者企业。
进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。
但是进入者不知道在位者的成本是高还是低。
因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。
海萨尼提出通过引入“自然”概念解决这个问题。
即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。
即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。
在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。
应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。
通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。
用表示参与人的一个特定类型,表示参i θi i Θ与人所有可能类型的集合,,并假定i i i Θ∈θ取自某个客观的分布函数。
n i i 1}{=θ),,(1n P θθL为简化起见,假定只有参与人本人观察到自i 己的类型,其他人都不能察到。
但依据海萨尼i θi θ公理,我们假定分布函数是所有参与),,(1n P θθL 人的共同知识,就是说,在博弈开始时,所有参与人关于自然行动的信念是相同的。
利用完美贝叶斯均衡讨论不完全信息的医疗事故赔偿金的谈判
合仍达不成协议 , 则双方 的得益都是 0。 第三步 , 出在赔偿金额谈判这 一博弈 中, 给 唯一 的完美 贝
叶斯均衡 :
件下会 选择 直接谈判 来解 决事情 。那 么 , 患者要 选择什 么策 略组合和判断才能最 大限度地 保障 自己的利 益呢?这就是 完
美贝叶斯均衡所要解 决的问题 。
维普资讯
J u n l fMah maia dcn o r a te t lMe iie o c
Vo. 1 12
N 0 .3
20 08
文章编号 :0 44 3 (0 8 0—3 60 10 —3 7 20 )30 6—2
中图分类号 : 1 R3 1
谈判 中如何实现 自己的利 益进行 研究 , 以期 建立一 种定 量化 的赔偿 模型。
( 如保 险赔付等 ) 即赔偿金额为 0。 ,
3 .假设 医患之 间的讨价还 价最多只能进行 两个 回合 , 每 个 回合都由患者 家属提出赔偿数额 , 由医院选择 是否接受 。
如果第 一回合医院就接受 患者 家属 的要求 , 则博 弈结束 , 否则开始第 二个 回合 , 如第 二 回合医 院不接受则 表示 医 院决 定通过法律等其 它手段解 决此问题 。若协议在第 二个 回合 达 成, 则双方 的得益都要打折扣 , 折算 成第一 回合 达成协议得 益
方承受度 内, 患者选择这一策略组 合和判断可以使 自己的利益最大化 。 关键词 : 完美贝叶斯均衡 ; 医疗事故 ; 赔 偿金
所谓博弈论就是研究 决策 主体 的行 为发 生直接相互作 用
值、 精力损耗 等) 否则大家都会倾 向于多讨 价还价、 , 晚达成协
议。
时候 的决策 以及这 种决策 的均衡 问题 。通 俗一 点说 , 就是 一
贝叶斯纳什均衡
一、现代博弈论简单发展史
• 1960年开始,不同类型的博弈问题的研究取得突破性进展
•
•
1965年,Selten将纳什均衡概念引入动态分析,提出“子博弈精炼纳什均衡”
1967年,Harsanyi把不完全信息引入博弈论研究,提出“海萨尼转换”方 法,给出“贝叶斯纳什75)、Kreps和Wilson(1982)、Fudenberg和
2002:弗农史密斯(Vernon Lomax Smith) 贡献主要在于通过实验室实验来测试根据经济学理论 而做出预测的未知或不确定性。是对以博弈论为基础构 建的理论模型进行实证证伪工作的一大创举。(两位美 国学者丹尼尔·卡纳曼和弗农史密斯 ) 2005(以色列)奥曼( Robert J. Aumann)、谢林(美)( Thomas C. Schelling) 他们通过博弈理论分析增加了世人对合作与冲突的 理解。其理论模型应用在解释社会中不同性质的冲 突、贸易纠纷、价格之争以及寻求长期合作的模式 等经济学和其他社会科学领域。
二、博弈论与主流经济学的发展
• 博弈论研究对象:
当成果无法由个体完全掌握,而结局须视群体共同决策 而定时,个人为了取胜,应该采取什么策略
• 方法论:
经济学、政治学、管理、军事、外交、国际关系、 公共选择、犯罪学
• “深蓝”和“更深的蓝”使用动态博弈理论 编写程序,后来战胜了无敌的卡斯帕罗夫
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解” ——保罗· 萨缪尔森
(一) 完全信息静态博弈:纳什均衡
基本分析思路和方法
• 占优战略均衡: (dominant-strategy equilibrium) 反映了所有人的绝对偏好,因此十分稳定。但 这种情况较少见。又称为上策均衡。
论述完美贝叶斯均衡的
论述完美贝叶斯均衡的
定义
完美贝叶斯均衡是一种多人博弈模型,其中所有参与者都独立地做出
最佳决定,以获得最大的利益。
在这种博弈模型中,每个参与者都分
析了他们的行为生成的期望价值,对其进行优化,以获得最大的利润。
该概念可以抽象表示为:一种状况下,当一个人采取了一个行为,其
他人改变自己行为以使自己的利益最大化,并最终达到一种合作平衡。
完美贝叶斯均衡提出的假设是,如果一个参与者的行为可以影响到其
它参与者的利润,那么对他们来说,当他们考虑总利润(以及对其他
参与者的影响)时,他们会选择一种有利于其本身利润和有益于其他
参与者的行为。
因此,这种博弈模型最终可以使所有参与者获得最大
利益。
完美贝叶斯均衡名词解释
完美贝叶斯均衡名词解释
嘿,你知道啥是完美贝叶斯均衡不?这可不是个简单的概念啊!咱就说,它就像是一场精彩刺激的游戏里的致胜策略。
比如说,你和朋友玩猜硬币正反面的游戏。
你得根据各种信息去判断朋友会出正面还是反面,这就是在寻找一种平衡。
完美贝叶斯均衡就是在这种复杂的情况下,大家都能做出最明智的选择。
想象一下,在一个商业竞争的场景里,各个公司就像在棋盘上的棋子。
它们要根据对手的行动、市场的变化等等因素来决定自己的下一步。
这时候,完美贝叶斯均衡就是那个能让它们在竞争中站稳脚跟的法宝。
它可不是随随便便就能达到的哦!这需要对各种信息的精准把握和分析。
就好像你要去一个陌生的地方,你得知道路线、天气、当地的风俗习惯等等,才能顺利到达目的地。
再比如,谈恋爱的时候,你和对方的互动也是一种微妙的平衡。
你要根据对方的反应、情绪来调整自己的行为,这也是一种类似完美贝叶斯均衡的状态呀!
完美贝叶斯均衡真的很神奇,它在很多领域都有着重要的作用。
不管是经济、政治,还是我们的日常生活,都能看到它的影子。
它就像是一个隐藏的规则,默默地影响着一切。
总之,完美贝叶斯均衡可不是一般的概念,它是复杂系统中的智慧结晶。
你现在是不是对它有了更深刻的理解呢?我觉得啊,了解它真的能让我们在面对各种情况时更加从容和明智!。
贝叶斯均衡剖析课件
未来发展方向
算法优化
针对贝叶斯均衡的计算复杂性,未来研究可以进一步优化算法, 提高计算效率和准确性。
放宽假设条件
为了扩大贝叶斯均衡的应用范围,未来研究可以尝试放宽完全理性、 完全信息等假设条件,使其更接近现实问题。
动态博弈和演化博弈的考虑
未来研究可以加强贝叶斯均衡在动态博弈和演化博弈中的应用,以 更好地解释市场现象和预测市场趋势。
且每个参与者都能预测对手的最优行动。
贝叶斯均衡的特性
贝叶斯均衡是一种纳什均衡,它 基于参与者的类型和对手的类型 概率分布来选择最优的策略或概 率分布。
贝叶斯均衡是一种静态均衡,因 为它假定参与者在游戏开始时就 知道自己的类型和对手的类型概 率分布。
贝叶斯均衡具有个体理性和集体 理性的特点,即每个参与者的最 优策略或概率分布都能导致整个 博弈的均衡结果。
混合策略贝叶斯均衡是一种动态均衡,因为它允许参与者通过选择概率 分布来随机化其行动。
完美贝叶斯均衡
完美贝叶斯均衡是指参与者在给定自己 类型和对手类型概率分布的情况下,选 择最优的策略或概率分布来最大化自己
的期望效用。
在完美贝叶斯均衡中,每个参与者都预 完美贝叶斯均衡是一种理想化的均衡, 测对手会选择最优的策略或概率分布, 因为它假定参与者在游戏开始时就知道 并据此选择自己的最优策略或概率分布。 自己的类型和对手的类型概率分布,并
贝叶斯均衡剖析课件
• 贝叶斯博弈理论概述 • 贝叶斯均衡的种类与特点 • 贝叶斯均衡的求解方法 • 贝叶斯均衡的应用场景 • 贝叶斯均衡的挑战与未来发展 • 案例分析:某行业的贝叶斯博弈分析
目录
贝叶斯博弈理论概述
贝叶斯博弈的基本概念
信念
在贝叶斯博弈中,每个参与者都 有自己对其他参与者行为的信念。 这些信念基于参与者的经验和信息。
贝叶斯准则法
贝叶斯准则法
贝叶斯的统计学中有一个基本的工具叫贝叶斯法则、也称为贝叶斯公式,尽管它是一个数学公式,但其原理毋需数字也可明了。
如果你看到一个人总是做一些好事,则那个人多半会是一个好人。
这就是说,当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。
用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。
贝叶斯法则又被称为贝叶斯定理、贝叶斯规则是概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。
所谓贝叶斯法则,是指当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率。
但行为经济学家发现,人们在决策过程中往往并不遵循贝叶斯规律,而是给予最近发生的事件和最新的经验以更多的权值,在决策和做出判断时过分看重近期的事件。
面对复杂而笼统的问题,人们往往走捷径,依据可能性而非根据概率来决策。
这种对经典模型的系统性偏离称为“偏差”。
由于心理偏差的存在,投资者在决策判断时并非绝对理性,会行为偏差,进而影响资本市场上价格的变动。
但长期以来,由于缺乏有力的替代工具,经济学家不得不在分析中坚持贝叶斯法则。
贝叶斯优化 准则
贝叶斯优化准则贝叶斯优化(Bayesian optimization)是一种用于优化目标函数的迭代式方法,其目标是在尽可能少的迭代次数内找到函数的全局最优解或局部最优解。
贝叶斯优化通过在参数空间中建立目标函数的后验模型,并使用这个模型来指导下一步的参数选择,以在每次迭代中寻找最有希望的参数值。
以下是贝叶斯优化的几个关键要素和步骤:1.先验模型:贝叶斯优化首先需要选择一个先验模型来表示目标函数的未知性质。
通常采用高斯过程(Gaussian Process, GP)作为先验模型,因为它能够提供目标函数的一个联合分布的先验估计。
2.采样:在初始阶段,通过在参数空间中随机采样来收集一些观察数据点。
这些数据点用于拟合高斯过程的初始参数,从而构建目标函数的后验模型。
3.建模:基于初始采样数据,使用高斯过程拟合目标函数的后验模型。
高斯过程会给出目标函数在每个参数点的概率分布,包括均值和方差。
4.选择下一个采样点:利用后验模型,通过一种称为采样策略(Acquisition Function)的方法来选择下一个最有希望的参数值。
采样策略通常会权衡探索未探索区域(Exploration)和利用已知信息(Exploitation)之间的平衡,以在参数空间中找到最可能包含最优解的区域。
5.观察:根据采样策略选择的参数值,观察目标函数在该点的实际值,并将这个观察结果添加到已有的数据集中。
6.更新模型:使用新的观察数据,更新高斯过程的参数,进而更新目标函数的后验模型。
这样就可以在下一轮迭代中更准确地预测目标函数在参数空间中的行为。
7.重复迭代:重复以上步骤,直到达到预设的停止条件,如达到最大迭代次数、收敛到一个满意的解或达到预设的目标精度为止。
贝叶斯优化的主要优点之一是能够在相对较少的迭代次数内找到全局最优解或局部最优解,尤其在参数空间维度较高、目标函数计算代价较高的情况下效果显著。
其核心思想是通过在参数空间中动态地收集观察数据并更新模型,来逐步地探索和优化目标函数的全局形状。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完全且完美信息动态博弈:子博弈完美纳什
均衡 完全但不完美信息动态博弈:完美贝叶斯均 衡
26
完全且完美信 息动态博弈
• 子博弈完美 纳什均衡
完全但不完美 信息动态博弈
• 完美贝叶斯 均衡
27
子博弈完美纳什均衡是完美贝叶斯均衡在完全且完 美信息动态博弈中的特例。
28
子博弈完美纳什均衡是完美贝叶斯均衡在完全且完 美信息动态博弈中的特例。
5
由于完全但不完美信息动态博弈中存在“多节点信息 集”,因此子博弈概念的理解和逆推归纳法的应用都需 要作一些修正。 不完美信息动态博弈的扩展形必然包含多节点信息 集,至少部分阶段不构成子博弈。
6
均衡策略组合对任何种类博弈的分析都是关键,对 不完美信息动态博弈也不例外。 对一个动态博弈来讲,“可信性”始终是均衡的一 个中心问题,理想的均衡必须能够排除任何不可信 的威胁或承诺。
15
2
买 不买 买 不买
(2,1) (0,0) (1,-1) (-1,0)
−
−
要求3:在均衡路径上的信息集处,“判断”由贝叶斯法 则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断”由贝 叶斯法则和各博弈方在此处可能有的均衡策略决定。
好
不卖 (0,0)
1
1
差 卖
1
卖
不卖
2
买
LECTURE 12:
PERFECT
1
BAYESIAN EQUILIBRIUM
0.引言 1.完美贝叶斯均衡的要求 2.完美贝叶斯均衡的初步解释
2.1 两方两阶段不完全信息动态博弈 2.2 三方三阶段不完全信息动态博弈
2
0.引言
3
完全且完美信息的二手车交易模型
好 不卖 (0,0)
1
1
差 卖
1
卖
不卖 (0,0)
23
2
买 不买 买 不买
(2,1) (0,0) (1,-1) (-1,0)
23
为什么称这种均衡为完美贝叶斯均衡?
首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似; 其次,因为要求3和要求4规定“判断”的形成必须符合 贝叶斯法则。
不买 买 不买
(0,0)
16
(2,1) (0,0) (1,-1) (-1,0)
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有 一个关于博弈达到该信息集中每个节点可能性的 “判断”(Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须 是“序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶 斯法则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断” 由贝叶斯法则和各博弈方在此处可能有的均衡策略 决定。
36
对四个条件的分析
“要求2”的序列理性相当于子博弈完美纳什均衡中 的子博弈完美性要求,实际上在子博弈中(不完美 信息动态博弈中也可能存在子博弈)就是子博弈完 美性,而在多节点信息集开始的不构成子博弈的部 分中,序列理性通过要求各博弈方遵守最大利益原 则而排除博弈方策略中不可信的威胁或承诺。
37
17
当某策略组合及相应的判断满足这样四个要求时, 称为一个“完美贝叶斯均衡”。
18
当某策略组合及相应的判断满足这样四个要求时, 称为一个“完美贝叶斯均衡”。
为什么称这种均衡为完美贝叶斯均衡?
19
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有 一个关于博弈达到该信息集中每个节点可能性的 “判断”(Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须 是“序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶 斯法则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断” 由贝叶斯法则和各博弈方在此处可能有的均衡策略 决定。
35
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有一个
关于博弈达到该信息集中每个节点可能性的“判断”( Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须是“ 序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法 则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断”由贝 叶斯法则和各博弈方在此处可能有的均衡策略决定。
33 33
2.完美贝叶斯均衡的初步解释
2.1 两方两阶段不完全信息动态博弈 2.2 三方三阶段不完全信息动态博弈
34
对四个条件Leabharlann 分析“要求1”是解决完全但不完美信息动态博弈的基本 前提。
在多节点信息集处轮到选择的博弈方,至少必须对其中每个 节点达到的可能性大小有一个基本判断,否则其决策就会失 去根据,从而也不可能存在策略的稳定性,更谈不上均衡。
博弈方1是主动选择和理性行为的,因此概率分布p(s|g)和 p(s|b)取决 于博弈方1的理性策略。 好 不卖 (0,0)
1
1
差 卖
1
卖
不卖 (0,0)
12
2
买 不买 买 不买
(2,1) (0,0) (1,-1) (-1,0)
1.完美贝叶斯均衡的要求
13
−
完美贝叶斯均衡的要求 要求1:在每个信息集,轮到选择的博弈方必须具有一个关于博 弈达到该信息集中每个节点可能性的“判断”(Belief)。
对四个条件的分析
当然,序列理性首先要求策略组合在给定的各方判 断下是纳什均衡。
38
对四个条件的分析
序列理性要求对保证完美贝叶斯均衡的真正稳定性 是很重要的。
39
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有一个
关于博弈达到该信息集中每个节点可能性的“判断”( Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须是“ 序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法 则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断”由贝 叶斯法则和各博弈方在此处可能有的均衡策略决定。
−
完全但不完美信息的二手车交易模型 “逆推归纳法”的分析结果(设p(g)≠0,1):
(1)若卖方(博弈方1)在车况“差”时选择“卖”的概率 p(s|b)<p(g)/[1- p(g)],那么买方(博弈方2)对卖方(博弈 方1)决定卖车时车况“好” 的“判断” p(g|s)>1/2,此时博 弈方2在第三阶段总是选择“买”,博弈方1在第二阶段总是选 择“卖” ;
30
子博弈完美纳什均衡是完美贝叶斯均衡在完全且完 美信息动态博弈中的特例。
序列理性在子博弈中就是子博弈完美性,再在整个博弈中就是 纳什均衡,而在完全且完美信息动态博弈中,所有轮到选择博 弈方的信息集都是单节点的,他们对博弈到达该节点的“判断” 都是概率等于1,这些判断当然都是满足贝叶斯法则和以其他 博弈方的后续策略为基础的。
40
2.1 两方两阶段不完全信息动态博弈
41
R L(p) U (2,1) D (0,0)
1 2
M(1-p) (1,3) U (0 ,0) D
(0,1)
42
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有
一个关于博弈达到该信息集中每个节点可能性的“ 判断”(Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须 是“序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶 斯法则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断” 由贝叶斯法则和各博弈方在此处可能有的均衡策略 决定。
P ( Ai | B )
P ( Ai ) P ( B | Ai )
P( A ) P( B | A )
k k k 1
n
− 注意(贝叶斯公式是专门用来计算后验概率的):
(1)条件概率P(Ai|B),…,P(An|B)称为A1,…,An的后验概率, 因为它们是在知道事件B发生之后,事件A1, …,An发生的概 率。 (2)对应地,P(A1),…,P(An)称为A1,…,An的先验概率。 (3)由于B的发生提供了新的信息,因而产生了从先验概率到后验 概率的变化。 10
即,在完全且完美信息动态博弈中,完美贝叶斯均衡就 是子博弈完美纳什均衡。
29
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有
一个关于博弈达到该信息集中每个节点可能性的“ 判断”(Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须 是“序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶 斯法则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断” 由贝叶斯法则和各博弈方在此处可能有的均衡策略 决定。
20
当某策略组合及相应的判断满足这样四个要求时, 称为一个“完美贝叶斯均衡”。
为什么称这种均衡为完美贝叶斯均衡?
21
为什么称这种均衡为完美贝叶斯均衡?
首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似;
22
− 要求2:给定各博弈方的“判断”,他们的策略必
须是“序列理性”的。
(a)即,在各个信息集,给定轮到选择博弈方的判断和其他博弈 方的“后续策略”,该博弈方的行为及以后阶段的“后续策 略”,必须使自己的得益或期望得益最大。 (b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后 的阶段中,针对所有可能情况如何行为的完整计划。