贝叶斯均衡

合集下载

最新10 不完全信息博弈和贝叶斯均衡

最新10 不完全信息博弈和贝叶斯均衡

0,400
• 在这种情形下,进入者有关在位者的成本 信息是不完全的。当在位者具有不同的成 本时,所表现出来的博弈情形是不一样的, 对应的均衡也是不一样的。
• 高成本情形:
(进入,默许)(不进入,斗争)
• 低成本情形:
(不进入,斗争)
斗鸡博弈
• 两个所谓的勇士举着长枪,准备从独木 桥的两端冲上桥中央进行决斗。每位勇 士都有两种选择:冲上去(用U表示),或 退下来(用D表示)。若两人都冲上去,则 两败俱伤;若一方上去而另一方退下来, 冲上去者取得胜利,退下来的丢了面子 (至少心理上是这样的);若两人都退下 来,两人都丢面子。
• 完美信息(perfect information):在博弈 过程的任何时点,每个参与人都能观察到 并记忆之前各参与人所选择的行动。
• 前面两章我们讨论了完全信息博弈问题, 但在现实生活中我们遇到更多的可能是不 完全信息博弈问题。
• 例如:
• 在企业的新产品开发过程中,企业对市场 的需求可能并不清楚;
参与人2为软弱者
2
U
D
U -4, -4
0, -2
U -4, -4
0, 0
1
1
D
0, 2
1, 0
D
0, 0
1, 1
(3) 参与人1为软弱者 参与人2为强硬者
(4) 参与人都为软弱者
• 在“斗鸡博弈”中,虽然在博弈开始之前 每位决斗者都知道自己的性格特征,但对 对手的性格特征往往不甚了解。
• 这意味着,当博弈真正开始的时候,双方 对到底体现为哪一种博弈情形并不清楚。
2
U
D
U
-4, -4
1
D
-2, 2
2, -2 0, 0

简述静态贝叶斯纳什均衡的定义

简述静态贝叶斯纳什均衡的定义

简述静态贝叶斯纳什均衡的定义对于混合策略的研究来说,首先要对非线性博弈的特征和最优化行为进行分析。

1.纳什均衡有两个要素:最大化( max),不可分离的互斥的收益或成本函数( competing, non-separable, utility or cost function)。

2.静态贝叶斯纳什均衡也称为传统贝叶斯纳什均衡。

3.。

静态贝叶斯纳什均衡问题是一种特殊情形,混合策略均衡问题属于静态纳什均衡问题。

4.为了理解静态贝叶斯纳什均衡问题的概念,需要简单地介绍一下关于纳什均衡和博弈论的基本知识。

纳什均衡是指在某种动态的竞争博弈中,策略空间的均衡点,这个均衡点就是纳什均衡点。

在混合策略博弈中,一个重要的结果就是一个动态的博弈最优策略问题。

这个博弈最优策略问题的实质就是求解混合策略的一个均衡点,也就是寻找一个混合策略的纳什均衡。

2.静态贝叶斯纳什均衡中,策略x的支付是它的价值( CP)。

所谓价值是指X执行后所获得的一组值,这组值取决于X执行后的回报。

静态贝叶斯纳什均衡中,不仅X有策略x, Y也有策略x。

所以,静态贝叶斯纳什均衡并没有更多的优势,在竞争均衡策略方面,与随机选择博弈的有效策略非常相似。

静态贝叶斯纳什均衡被证明是一个简单策略组合的有效策略问题。

在静态贝叶斯纳什均衡中,无论哪个博弈方,都可以通过使用一定的技巧,在策略空间中搜索纳什均衡。

在策略组合的静态贝叶斯纳什均衡问题中,存在着局部优势或劣势,所以,它们是不完美的均衡策略组合。

静态贝叶斯纳什均衡问题是一种特殊情形,而现实世界中的许多博弈类型都属于混合策略问题。

在一个典型的混合策略博弈中,例如卡特尔博弈中,支付是互斥的,那么静态贝叶斯纳什均衡就是简单策略组合的一个纳什均衡。

3.基于上述原因,在分析一个混合策略博弈时,首先必须考虑静态纳什均衡。

不管最初的纳什均衡是否包含随机的一组输入值,在实际应用中都必须选择静态纳什均衡作为目标函数。

第14章精炼贝叶斯Nash均衡的精炼-ppt课件

第14章精炼贝叶斯Nash均衡的精炼-ppt课件

3,2 3,2
2,3 4,2
3,4 3,2
1,1
Control Science and Engineering, HUST
All Rights Reserved, 2019, Luo Yunfeng
A j
L, L L, R R, L R, R
L 4,1
4,1
3,2
3,2
i
R 3,2
3,2
2,3
• 对q≥1/2,战略和推断[(L,L),(u,u),p=0.5,q] 构成博弈的一个混同精炼贝叶斯Nash平 衡。
Control Science and Engineering, HUST
All Rights Reserved, 2019, Luo Yunfeng
• 由于类型为t1的发送者选择R的最大收益为1, 而选择L的最小收益为2,因此,发送者的战 略(R, L)和(R, R)为始于类型为t1的发送者的信 息集的严厉劣战略。所以,根据信号条件(5), q=0。因此,博弈的精炼贝叶斯Nash平衡 [(L,L),(u,u),p=0.5, q≥1/2]不满足信号条件(5)。
1,2
1,2
x2
A
B
A x3 B
B, B 1,2 1,2 1,2
2,4
0,2 1,2
2,2
Control Science and Engineering, HUST
All Rights Reserved, 2019, Luo Yunfeng
• M并不是参与人2在整个博弈中的严厉劣 战略,但在参与人1选择A的情况下(即假 设参与人1将战略B剔除的情况下),M却 是参与人2在信息集I2({x1})的严厉劣战略。
Control Science and Engineering, HUST

第6章 贝叶斯博弈与贝叶斯均衡

第6章 贝叶斯博弈与贝叶斯均衡
• ——Harsanyi用N表示“自然” ,一个选择参与人1类型的 虚拟参与人,将图6-2的不完全信息博弈转换为图6-3的不完 美信息博弈。
• ——在所有参与人对自然行动的概率分布具有一致的判断 下,纳什均衡的概念便可以运用到这个博弈。 Harsanyi的 贝叶斯均衡(或贝叶斯纳什均衡)正是不完美信息博弈的 纳什均衡。
• ——这表明提供公共品的参与人类型位于区间[clБайду номын сангаас ci* ]:只有 参与人i的成本足够地低,他才会提供。类似地,参与人j供
给,当且仅当,cj∈ [cl, cj* ],对于某个cj* ; • ——由于zj≡prob(cl≤cj≤cj*)=P(cj*),均衡的临界水平ci*满足ci*
=1-P(cj*)。因此,ci*和cj*必须满足等式c*=1-P(1-P(c*))。如果 方程存在唯一的解,那么必有ci*=c*=1-P(c*)。 • ——例如,如果P(.)在区间[0,2]上服从均匀分布(P(c)=c/2), 那么c*是唯一且等于2/3。即使参与人的提供成本属于区间 (2/3,1),尽管收益超过成本,但是他不会提供。
不完全信息下的公共品供给博弈
• 1、公共品供给博弈 • ——参与人1和2; • ——策略:供给是0-1决策,即要么提供要么不提供; • ——支付:如图6-4; • ——信息:公共品带来的效用是共同知识,但每一个参与
人的供给成本是私人知识。ci在区间[cl,cu]上服从独立同分 布P(.),这里P(.)是连续且严格递增的,cl<1<cu,P(cl)=0, P(cu)=1。 • ——参与人i的纯策略是从区间[cl,cu]到集合{0,1}的一个函 数si(ci)。这样,参与人i的收益是ui(si,sj,ci)=max(s1,s2)-cisi; • ——贝叶斯均衡是一组满足如下条件的策略组合(s1*,s2*): 对于每一个参与人i和每一个可能值ci,si* (ci)最大化了 Ecj[ui(si (ci), sj* (cj),ci)]

贝叶斯纳什均衡

贝叶斯纳什均衡

一、现代博弈论简单发展史
• 1960年开始,不同类型的博弈问题的研究取得突破性进展


1965年,Selten将纳什均衡概念引入动态分析,提出“子博弈精炼纳什均衡”
1967年,Harsanyi把不完全信息引入博弈论研究,提出“海萨尼转换”方 法,给出“贝叶斯纳什75)、Kreps和Wilson(1982)、Fudenberg和
2002:弗农史密斯(Vernon Lomax Smith) 贡献主要在于通过实验室实验来测试根据经济学理论 而做出预测的未知或不确定性。是对以博弈论为基础构 建的理论模型进行实证证伪工作的一大创举。(两位美 国学者丹尼尔·卡纳曼和弗农史密斯 ) 2005(以色列)奥曼( Robert J. Aumann)、谢林(美)( Thomas C. Schelling) 他们通过博弈理论分析增加了世人对合作与冲突的 理解。其理论模型应用在解释社会中不同性质的冲 突、贸易纠纷、价格之争以及寻求长期合作的模式 等经济学和其他社会科学领域。
二、博弈论与主流经济学的发展
• 博弈论研究对象:
当成果无法由个体完全掌握,而结局须视群体共同决策 而定时,个人为了取胜,应该采取什么策略
• 方法论:
经济学、政治学、管理、军事、外交、国际关系、 公共选择、犯罪学
• “深蓝”和“更深的蓝”使用动态博弈理论 编写程序,后来战胜了无敌的卡斯帕罗夫
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解” ——保罗· 萨缪尔森
(一) 完全信息静态博弈:纳什均衡
基本分析思路和方法
• 占优战略均衡: (dominant-strategy equilibrium) 反映了所有人的绝对偏好,因此十分稳定。但 这种情况较少见。又称为上策均衡。

博弈论贝叶斯博弈与贝叶斯均衡ppt课件

博弈论贝叶斯博弈与贝叶斯均衡ppt课件
the example
given
by
Ha
rsanyi, consider the following prob
abilities of occurrence for the fou
rDepaprtmoenst sofiMabthlemeaticsmatch-ups:
Bayesian Nash Equilibrium
Department of Mathematics
不完全信息博弈问题
将博弈开始时就存在事前不确 定性的博弈问题称为不完全信息博弈问 题。
Department of Mathematics
例子:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥 的两端冲上桥中央进行决斗。每位勇士都有
两种选择:冲上去(用U表示),或退下来(用D
Department of Mathematics
Example: Scalping Tickets
• For example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money bef ore the UVa-Miami football game
This yields the following payoff matrix an d a single pure strategy Nash equilibriu m:
BS b1, BW b1 BS b1, BW b2 BS b2, BW b1 BS b2, BW b2
AS a1, AW a1 AS a1, AW a2 AS a2, AW a1 AS a2, AW a2
Department of Mathematics

贝叶斯均衡

贝叶斯均衡

( 10 ,16 ) ( 0 , 20 ) ( 0 , 40 ) ( 0 , 40 ) | ( 2 ,8 ) ( 20 , 20 ) ( 2 ,16 ) ( 0 , 20 ) ( 0 , 40 ) ( 0 , 40 )
(1)海萨尼从不完全信息
模型的特征入手,引入
故 q 2 (c L )
( 2)求企业 1关于企业 2的策略反应函数。 固定企业的策略 即求解优化问题: max [ a q 1 q 2 ( c H ) c 1 ] q 1 (1 )[ a q 1 q 2 ( c L ) c 1 ] q 1
q1
s 2 ( c 2 ),最大期望支付
(1)企业 2 对于企业 1的策略反应函数。 固定 q 1 及 c 2 ,求 s 2 ( c 2 ) q 2 ,最大化企业 即求解优化问题: max
q2 2
2的利润 2 ,
(a q1 q 2 c 2 )q 2 a q1 c 2 2


2ቤተ መጻሕፍቲ ባይዱ
q 2
0 知 a q 1 q 2 c 2 0,解得 q 2 ( c 2 ) a q1 c L 2 , q 2 (c H ) a q1 c H 2
私人信息和共同信息的区别: 1、私人信息
2、共同信息 共同知识 共同知识:并非是每个人都知道的知识 两个例子:脏脸问题 信封之谜 脏脸问题: 甲、乙、丙三人都戴红帽子,他们可以看到对方的帽子颜 色,但看不到自己帽子的颜色,问甲自己戴什么颜色的帽 子?问乙自己戴什么颜色的帽子?问丙自己戴什么颜色的 帽子?都回答不出。但一个旁观者告诉他们“他们至少有 一人戴红帽子”,问甲自己戴什么颜色的帽子?问乙自己 戴什么颜色的帽子?最后问丙自己戴什么颜色的帽子?甲、 乙不知,丙却知道自己的是红帽子。

10 贝叶斯Nash均衡的应用

10 贝叶斯Nash均衡的应用
h H c2 (q2 ) c2 q2
市场需求由以下函数决定:
P a Q,Q q1 q2
进一步假设:
a 2; 3 H 5 c1 1, c , c2 ; 4 4 1 p 2
L 2
对于企业2:
2 q2 ( P c2 ) q2 (a q1 q2 c2 )
• 令 z j Pr ob(a (c j ) 1) 表示均衡状态下参与 人j提供的概率,则参与人j不提供的概率 为 1 z j。
j

• 参与人i提供(对方不提供自己才提供) 的预期收益为:
1 (1 z j ) 1 z j
• 因此,只有当 ci 1 z j 时,参与人i才会提 供。
i i
• 由于
z j Pr ob( a j (c j ) 1) Pr ob( c c j c j) Pr ob(c j ) Pr ob( c )

Pr ob(c j) • 当参与人i的收益等于其提供的成本时,得到临 界值 ci ,所以临界值 ci 须满足
据此有:
如果ci 1 z j,a (ci ) 1 ; 如果ci 1 z j,a (ci ) 0。
• 因此,存在 ci 使得只有当 ci [ c , ci ](ci c ) 时,参与人i才会提供。 • 同理,存在 c j 使得只有当 c j [ c , cj ](cj c ) 时, 参与人j才会提供。
假设:
• 企业1的成本函数为共同知识: c1 (q1 ) c1 q1 • 企业2的成本函数为私人信息,这意味着企业2 有不同的类型: l L c2 (q2 ) c2 q2
L H 其中, 。 c2 c2 • 企业1知道企业2是 c2L 的概率为p,是 c2H 的概率 是1-p,p和1-p为共同知识。

贝叶斯均衡剖析课件

贝叶斯均衡剖析课件
的适用性有限。
未来发展方向
算法优化
针对贝叶斯均衡的计算复杂性,未来研究可以进一步优化算法, 提高计算效率和准确性。
放宽假设条件
为了扩大贝叶斯均衡的应用范围,未来研究可以尝试放宽完全理性、 完全信息等假设条件,使其更接近现实问题。
动态博弈和演化博弈的考虑
未来研究可以加强贝叶斯均衡在动态博弈和演化博弈中的应用,以 更好地解释市场现象和预测市场趋势。
且每个参与者都能预测对手的最优行动。
贝叶斯均衡的特性
贝叶斯均衡是一种纳什均衡,它 基于参与者的类型和对手的类型 概率分布来选择最优的策略或概 率分布。
贝叶斯均衡是一种静态均衡,因 为它假定参与者在游戏开始时就 知道自己的类型和对手的类型概 率分布。
贝叶斯均衡具有个体理性和集体 理性的特点,即每个参与者的最 优策略或概率分布都能导致整个 博弈的均衡结果。
混合策略贝叶斯均衡是一种动态均衡,因为它允许参与者通过选择概率 分布来随机化其行动。
完美贝叶斯均衡
完美贝叶斯均衡是指参与者在给定自己 类型和对手类型概率分布的情况下,选 择最优的策略或概率分布来最大化自己
的期望效用。
在完美贝叶斯均衡中,每个参与者都预 完美贝叶斯均衡是一种理想化的均衡, 测对手会选择最优的策略或概率分布, 因为它假定参与者在游戏开始时就知道 并据此选择自己的最优策略或概率分布。 自己的类型和对手的类型概率分布,并
贝叶斯均衡剖析课件
• 贝叶斯博弈理论概述 • 贝叶斯均衡的种类与特点 • 贝叶斯均衡的求解方法 • 贝叶斯均衡的应用场景 • 贝叶斯均衡的挑战与未来发展 • 案例分析:某行业的贝叶斯博弈分析
目录
贝叶斯博弈理论概述
贝叶斯博弈的基本概念
信念
在贝叶斯博弈中,每个参与者都 有自己对其他参与者行为的信念。 这些信念基于参与者的经验和信息。

纯策略贝叶斯纳什均衡例题

纯策略贝叶斯纳什均衡例题

纯策略贝叶斯纳什均衡例题引言:纯策略贝叶斯纳什均衡是博弈论中常用的概念之一,它可以用于分析多方参与的决策问题。

本文将通过一个例题来解释纯策略贝叶斯纳什均衡的概念及应用。

例题背景:假设有两家咖啡店,分别是A店和B店。

每天早晨,两家咖啡店都需要决定自己的咖啡价格。

同时,消费者也需要决定去哪家咖啡店购买。

假设消费者根据市场情况作出购买决策。

A店和B店的利润与消费者选择有关。

情景一:A店设置较高的价格,B店设置较低的价格。

这种情况下,消费者更愿意选择购买B店的咖啡。

B店的利润将最大化,而A店的利润将最小化。

情景二:A店和B店都设置较低的价格。

这种情况下,消费者会更加倾向于选择购买A店的咖啡。

A店的利润将最大化,而B店的利润将最小化。

情景三:A店和B店都设置较高的价格。

这种情况下,消费者没有购买的动力,两家咖啡店的利润都会很低。

分析与求解:我们可以将上述情景转化为一个博弈论的模型,其中A店和B店是两个决策者,他们需要根据对方的策略来决定自己的策略。

消费者的选择将影响两家咖啡店的利润。

根据纯策略贝叶斯纳什均衡的概念,我们需要确定每个决策者的策略组合,以获得最优的结果。

在这个例题中,我们需要确定A店和B店的咖啡价格。

假设A店有80%的机会成为消费者的首选,B店有20%的机会。

根据这个信息,我们可以得到以下策略组合:情景一:A店设置高价格,B店设置低价格。

情景二:A店设置低价格,B店设置低价格。

情景三:A店设置高价格,B店设置高价格。

然后我们可以计算每种策略组合下两家咖啡店的利润,并找出使两家咖啡店利润最大化的策略组合。

结论:通过计算,我们可以得到以下结果:情景一:A店设置高价格,B店设置低价格。

这种情况下,A店的利润最大化,B店的利润最小化。

因此,纯策略贝叶斯纳什均衡的结果是,A店设置高价格,B店设置低价格时,两家咖啡店的利润最优化。

扩展思考:本例题中我们假设了A店有80%的机会成为消费者的首选,B店有20%的机会。

贝叶斯分离均衡

贝叶斯分离均衡

贝叶斯分离均衡
贝叶斯分离均衡(Bayesian Separating Equilibrium)是一种均
衡概念,用于分析博弈论模型中的信息不对称情况下的决策问题。

在贝叶斯分离均衡中,每个参与者在做出决策之前,会对其他参与者的类型进行统计推断,并基于这些推断做出最优决策。

在贝叶斯分离均衡中,每个参与者都有一个类型,表示其私有信息。

每个类型对应不同的概率分布,可以影响参与者的行为。

参与者会根据自己的类型和其他参与者的可能类型来进行最优决策。

贝叶斯分离均衡通过解决统计推断和决策制定之间的互动问题,提供了一种描述信息不完全和不对称情况下的最优决策方式。

贝叶斯分离均衡是现代博弈论的重要概念,常用于解决拍卖、市场竞争和投标等领域的问题。

它可以揭示参与者的最优行为策略,并为经济学家和决策者提供决策分析工具。

第12讲:完美贝叶斯均衡

第12讲:完美贝叶斯均衡

1
1
差 卖
1

不卖 (0,0)
23
2
买 不买 买 不买
(2,1) (0,0) (1,-1) (-1,0)
23

为什么称这种均衡为完美贝叶斯均衡?
首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似; 其次,因为要求3和要求4规定“判断”的形成必须符合 贝叶斯法则。
(a)在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续 策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的 得益或期望得益最大。 (b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段 中,针对所有可能情况如何行为的完整计划。
好 不卖 (0,0)
1
1
差 卖
1

不卖 (0,0)
20

当某策略组合及相应的判断满足这样四个要求时, 称为一个“完美贝叶斯均衡”。

为什么称这种均衡为完美贝叶斯均衡?
21

为什么称这种均衡为完美贝叶斯均衡?

首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似;
22
− 要求2:给定各博弈方的“判断”,他们的策略必

35
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有一个
关于博弈达到该信息集中每个节点可能性的“判断”( Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须是“ 序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法 则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断”由贝 叶斯法则和各博弈方在此处可能有的均衡策略决定。

精炼贝叶斯均衡

精炼贝叶斯均衡

子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
N
让我们再一次考虑市场进入的例子: 高 [u]
在位者
低 [1-u]
P=4
进入者
P=5
进入
不进入 进入
则要求Pr ob{ah} 0,即参与人i必须以正的概率选择 a h ,否则,后验概率没
有定义.如果 Pr ob{a h} 0 ,我们允许Pr ob{ah} 0 在[0,1]区间取任 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | ah} 对应的是
非均衡中径上的信息集
(7,0)
(5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
博弈论与信息经济学 江西财经大学图4.陶1长市琪场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择;
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼

4.1精炼贝叶斯均衡概述(6.1)

4.1精炼贝叶斯均衡概述(6.1)
如果2的战略为A’,则要求4对3 的推断也没有任何限制。 如果2的战略是以Q1的概率选择 L,Q2的概率选择R,1-Q1-Q2的概 率选A',(Q1+Q2>0), 这时,要求4就限定了3的推断: p=Q1/(Q1+Q2)。
=
4.1精炼贝叶斯均衡概述

精炼贝叶斯均衡与其他均衡的关系 精炼贝叶斯均衡的优点
5
4.1精炼贝叶斯均衡概述
在图4.1.1中,要求1意味着如果博弈的进行达到参与者2的非单节信息 集,则参与者2必须对具体达到哪一个节有一个推断。这样的推断就表 示为到达两个节的概率p和1-p,见图4.1.3。
6
4.1精炼贝叶斯均衡概述
给定参与者2的推断,选择R’的期望收益就等于p*0+(1-p)*1=1-p,而 选择L’的期望收益等于p*1+(1-p)*2=2-p 。由于对任意的p,都有2p>1-p,要求2就排除了2选择R’的可能性,从而,在本例中简单要求 每一参与者持有一个推断,并且在此推断下选择最优行动,就足以使 我们排除不合理的均衡(R,R’)。
3,33,3
1,2
1,1
在这个子博弈中,存在唯一的纳什均衡(L,R'),因此整个博弈唯一
的子博弈精炼纳什均衡为(D,L,R’)。
这一组战略和推断p=1,同时满足了要求1-4,因此,构成了一个精炼 贝叶斯均衡。
4.1精炼贝叶斯均衡概述
下面考虑纳什均衡战略(A,L,L')和推断P=0。 根据给定的战略(A,L,L'),到达不了3的信息集。因此,按照要求1-3,并没有对3 的推断进行限制。
4.1精炼贝叶斯均衡概述
1
4.1精炼贝叶斯均衡概述
考虑如下完全非完美信息动态博弈

完美贝叶斯均衡名词解释

完美贝叶斯均衡名词解释

完美贝叶斯均衡名词解释
嘿,你知道啥是完美贝叶斯均衡不?这可不是个简单的概念啊!咱就说,它就像是一场精彩刺激的游戏里的致胜策略。

比如说,你和朋友玩猜硬币正反面的游戏。

你得根据各种信息去判断朋友会出正面还是反面,这就是在寻找一种平衡。

完美贝叶斯均衡就是在这种复杂的情况下,大家都能做出最明智的选择。

想象一下,在一个商业竞争的场景里,各个公司就像在棋盘上的棋子。

它们要根据对手的行动、市场的变化等等因素来决定自己的下一步。

这时候,完美贝叶斯均衡就是那个能让它们在竞争中站稳脚跟的法宝。

它可不是随随便便就能达到的哦!这需要对各种信息的精准把握和分析。

就好像你要去一个陌生的地方,你得知道路线、天气、当地的风俗习惯等等,才能顺利到达目的地。

再比如,谈恋爱的时候,你和对方的互动也是一种微妙的平衡。

你要根据对方的反应、情绪来调整自己的行为,这也是一种类似完美贝叶斯均衡的状态呀!
完美贝叶斯均衡真的很神奇,它在很多领域都有着重要的作用。

不管是经济、政治,还是我们的日常生活,都能看到它的影子。

它就像是一个隐藏的规则,默默地影响着一切。

总之,完美贝叶斯均衡可不是一般的概念,它是复杂系统中的智慧结晶。

你现在是不是对它有了更深刻的理解呢?我觉得啊,了解它真的能让我们在面对各种情况时更加从容和明智!。

10 不完全信息博弈和贝叶斯均衡

10 不完全信息博弈和贝叶斯均衡
• 现在考虑这样的情形:假设参与人可能有 这样的两种性格特征(类型)——“强 硬”(用s表示)或“软弱”(用w表示)。
• “强硬”的参与人:争强好胜、不达目的 誓不罢休的决斗者;
• “软弱”的参与人:胆小怕事、遇事希望 息事宁人的决斗者。
斗鸡博弈:不完全信息
强硬 U
D
1 软弱
U
D
2
强硬
软弱
U
D
U
D
1
x1
U
D
2
软 弱(1 p)
x2
U
D
2
U
D
U
D
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
0,1
如果“自然”选择参与人2的性格特征是“强硬”的,则意味 着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1;
N
强硬( p)
x0
1
x1
U
D
2
软 弱(1 p)
x2
U
D
2
U
D
U
• 当一个参与人并不知道在与谁博弈时,博 弈的规则是无法定义的,如何处理不完全 信息导致的这一问题?
二、海萨尼(Harsanyi)转换
• 为了解决该问题,海萨尼提出了Harsanyi 转换。
• 海萨尼提出的解决办法:引入虚拟参与 人——自然,由自然首先决定参与人的不 同类型,从而将不完全信息博弈转换为不 完美信息博弈。
三、贝叶斯博弈的战略式描述
• 不完全信息博弈:完全信息博弈在不完 全信息上的拓展,我们又将其称为贝叶 斯博弈;
• 贝叶斯博弈:静态贝叶斯博弈和动态贝 叶斯博弈;

精炼贝叶斯均衡

精炼贝叶斯均衡

~
si* (si ,i ) arg max
pi ( i | ahi )ui (si , si ,i );
~
(B)pi (i | ahi ) 是使用贝叶斯法则从先验概率 pi (i | i,) 观测到的
a
h和最优战略
i
s
*
i
(.)
得到(在可能的情况下)
博弈论与信息经济学 江西财经大学 陶长琪
子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼
均衡和贝叶斯推断的结合它要求:(1)在每一个信息集上,决策者必须有一个 定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信 息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3) 每一个参与人根据贝叶斯法则和均衡战略修正后验概率。
4.3 精炼贝叶斯均衡的再精炼及其他 均衡概念
赵乐欢制作历经10天终于于2005.1.11日凌晨基本完成,非常感谢
刘艳艳同4学.第3四-章1及剔第除六劣章,战第略七章的文档! 4.3-2直观标准 4.3-3克瑞普斯-威尔逊(KrepsWilson)序贯均衡 4.3-4泽尔腾(Selten)的颤抖手精炼均 衡
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

不完全信息动态博弈模型的精炼贝叶斯均衡是一个策略组合
s* ( ) (s1* (1 ),, sn* ( n ))
和一个后验概率p ( p1, p2 ,, pn ),满足: (1)对所有居中人i,及每个信息集h
arg max s* (si ,i )
pi ( i | ahi )ui (si , si ;i )
(3)根据行动参与人获得相应支付。
信号要求: 1、信号接收者能够在观察到m后对发出者的
私人类型进行判断,得出后验分布。 2R、信号接收者采取行动使其期望支付最大
化。 2S、信号发出者采取行动使其支付最大化。 3、信号接收者对信号集中持有推断必须决定
于贝叶斯法则和发送者的决策。
满足以上条件的策略组合和推断为信号传 递博弈的精炼贝叶斯均衡。
完美贝叶斯均衡
不完全信息动态博弈 要求: 1、在各个信息集,博弈方必须具备一个关于博弈达到该 信息集中每个节点可能性的判断,即博弈达到该信息集中 各个节点概率分布。 2、各博弈方的策略是序列理性的,即博弈方的行为及以 后阶段的后续策略(针对有可能的情况如何应对的完整计 划)必须使自己的期望得益最大。 3、在均衡路径上的信息集处,博弈方的可能性的判断由 贝叶斯法则和各博弈方的均衡决策决定。 4、在不处于均衡路径上的信息集处,博弈方的可能性的 判断由贝叶斯法则和各博弈方在此处可能有的均衡决策决 定。
求解纯策略意义下信号博弈的精炼 贝叶斯均衡的步骤
(1)求信号接收者的推断依存的子博弈精炼
均衡策略。即求解
max aA


*u2
(m,
a;
)
(2)求信号发送者的推断依存的子博弈精炼
均衡策略。即求解
max
mM
ui
(m,
a(m*
);
)
(3)求信号博弈的精炼贝叶斯均衡。
单一价格二手车模型
信号传递博弈的精炼贝叶斯均衡是一个策略组合
(m* ( ),a* ( ))
和信号接收者对信号发送者的类型推断
满足:
* p( | m)
(1)m* ( ) arg max ui (m, a(m* ); )
m
(2)a* (m) arg max *u2 (m, a; )
a
(4)对给定的n 1个局中人的行动组合(a1, a2 ,, an ;t1,t2 ,,tn ), 局中人i可获得支付ui ui (a1, a2 ,, an ;t1,t2 ,,tn )。
称策略组合(
s1*
(),
s
* 2
(),,
s
* n
()
)为不完全信息静态博弈的贝叶斯
纳什均衡,对于i, ti Ti及si* (ti ) ai*,如果ai*最大化局中人i的
n
动空间为A0 Ti ,即n个局中人的类型空间的乘积空间。自然所 i 1
选的行动是t (t1,t ,,tn ),即它为每个局中人i选择了类型ti。 (3)海萨尼把静态博弈转换为了动态博弈,博弈时序为:
n
①自然选择t (t1,t ,, tn ) A0 Ti , i 1
②自然把ti仅通知局中人i而不通知其余局中人 ③局中人i(i 1,2,, n)同时选择行动ai Ai
(0)自然按概率分布 p( )选择信号发出者的 私人类型 ,并告知信号发出者,信号接收 者不知,但知其分布类型 p()。
(1)信号发出者了解 后选择信号m并发射 信号,m所在空间成为信号空间。
(2)信号接收者观察到信号m后形成对信号 发出者的私人类型的判断——后验分布 p( | )
然后选择行动a。
c1
1
6
(cH
cL )
q2* (cL )

a
2cL 3
c1

6
(cH
cL )
用贝叶斯均衡解释混合策略均衡
以性别战博弈为例 博弈矩阵为
足球 芭蕾
足球
芭蕾
芭足蕾球
(2,1) (0,0)
(0,0) (1,2)

足球 芭蕾

(2
m ,1)
(0,0)
(0,0)
(1)海萨尼从不完全信息模型的特征入手,引入一个概念类型: ti Ti ,i 1,2,, n。Ti为局中人i的类型空间,ti为局中人i的类型。 t i 对局中人i是已知的,对于其他局中人是随机变量,但t i的概率 分布是共同知识。
(2)海萨尼在模型中引入一个虚拟局中人0,称为自然。它的行
定义
在不完全信息静态博弈(也称为贝叶斯博弈)中,参与人 同时行动,没有机会观察到别人的选择。给定其他参与人 的战略选择,每个参与人的最优战略依赖于自己的类型。 由于每个参与人仅知道其他参与人有关类型的分布概率, 而不知道其真实类型,因而,他不可能知道其他参与人实 际上会选择什么战略。但是,他能够正确地预测到其他参 与人的选择与其各自的有关类型之间的关系。因此,该参 与人的决策目标就是:在给定自己的类型,以及给定其他 参与人的类型与战略选择之间关系的条件下,使得自己的 期望效用最大化。
si
i
(2)pi ( i | ahi )是使用贝叶斯法则从先验概率pi ( i | i )观测
到的a
h i
和最
优策略s
* i
()得到的
信号传递博弈的精炼贝叶斯均衡
信号传递博弈是不完全信息动态博弈模型 中的一个简单又重要的博弈模型。模型中 有两个参与人——信号发送者和信号接收 者,信号发送者具有私人类型 , 的概率 分布是共同知识。博弈按照海萨尼转换下 的信号传递博弈的时序进行。
不完全信息意味着至少有一个参与人有多个类型。不完全
信息博弈是指、至少有一参与人不知道其他参与人的支付 函数。比如说, 你想去买件衣服时, 你并不清楚衣服的最低 价, 你和某人谈恋爱, 但在结婚前, 双方都是展现最好的一 面, 双方都不是很了解对方的很多品质, 等等, 这样的例子 举不胜举。在古代, 人们已经开始用到不完全信息博弈了。 比如在《三国演义》中, 周瑜伪造假降书, 诱骗曹操杀了蔡 摺、张允二将。曹操遂派蔡中、蔡和两兄弟假装降周瑜, 企图夺取东吴情报。周瑜识破曹操的诡计, 将计就计, 对黄 盖施以苦肉计。这一博弈中, 曹操只知道自己的部下蔡中、 蔡和是假降, 但不知道周瑜的情报周瑜知道蔡中、蔡和是 假降, 但曹操不知道周瑜知道自己是假降, 曹操不知道周瑜 已经识别了自己的计划。也就是说曹操的信息对周瑜的信 息是不完全的, 但周瑜很清楚曹操计谋, 于是周瑜就将计就 计。这一博弈属于不完全信息博弈。
他们没人都知道他们至少有一人戴红帽子,也知
道对方也知道他们至少有一人戴红帽子,但是对 甲而言,他不知道乙知道丙知道他们至少有一人 戴红帽子,所以该信息虽然每人都知道,但不属 于共同知识。
信封之谜:
A有两个儿子M、N,他要给两个儿子一些钱,钱 的数额分别写在给他们的信封中,并告诉他们, 钱的数额为10n-1和10n(其中n为1-7之间的数), M的信封中为1000,N的信封中为10000,A问他 们是否要交换,他们均同意,A又问你们确定要 交换,他们还是都同意, A又问你们确定要交换, 他们还是都同意, A再次问你们确定要交换,结 果N不同意M同意。
私人信息和共同信息的区别: 1、私人信息
2、共同信息 共同知识 共同知识:并非是每个人都知道的知识 两个例子:脏脸问题 信封之谜 脏脸问题:
甲、乙、丙三人都戴红帽子,他们可以看到对方的帽子颜 色,但看不到自己帽子的颜色,问甲自己戴什么颜色的帽 子?问乙自己戴什么颜色的帽子?问丙自己戴什么颜色的 帽子?都回答不出。但一个旁观者告诉他们“他们至少有 一人戴红帽子”,问甲自己戴什么颜色的帽子?问乙自己 戴什么颜色的帽子?最后问丙自己戴什么颜色的帽子?甲、 乙不知,丙却知道自己的是红帽子。
a q1 c2 2
故q2 (cL )

a

q1 2
cL
, q2 (cH
)

a

q1 2
cH
(2)求企业1关于企业2的策略反应函数。
固定企业的策略s2 (c2 ),最大期望支付 1 p(c2 ), c2T2
即求解优化问题:
max [a q1

q1

q2
(cH
)

c1 ]q1

(1,2 f )
它除了有纯策略均衡(足球,足球)(芭蕾,芭
蕾)外,还有一个混合策略(x*,y*),其中
x*=(2/3,1/3),y*=(1/3,2/3)。这个混合策略为一系
列纯策略意义下的贝叶斯纳什均衡的极限。
显示原理
对任何贝叶斯博弈的任何贝叶斯纳什均衡s* 都可以重构为一个激励相容的直接机制。 这里的重构为经过适当的设计,可构成一 个新的贝叶斯博弈,对于局中人的任何一 个类型组合t=(t1,t2,…,tn),每个局中人在新 的博弈下贝叶斯均衡的支付与原博弈中贝 叶斯均衡下的支付完全一样。
贝叶斯均衡及其应用
• 预备知识(共同知识) • 静态博弈中的贝叶斯均衡 • 不完全信息下的古诺模型 • 用贝叶斯均衡解释混合策略均衡 • 显示原理 • 动态博弈中的贝叶斯均衡 • 信号传递博弈的精炼贝叶斯均衡 • 单一价格二手车模型 • 就业市场信号博弈 • 信息不完全条件下的囚徒困境问题
不完全信息博弈:




H
L

默许 抵制 默许 抵制
进 如 者
H L
不进进入入
(10,10) (0,20)
进入 (15,10)
不进入 (0,20)
(10,8) (10,15) (0,20) | (0,40) (2,8) (20,20) (0,20) (0,40)
(10,16) (0,40) (2,16) (0,40)
相关文档
最新文档