贝叶斯纳什均衡场进入
不完全信息动态博弈-精练贝叶斯纳什均衡
一 精练贝叶斯纳什均衡 基本思路
贝叶斯法则
精练贝叶斯纳什均衡 不完美信息博弈的精练贝叶斯均衡 二 信号传递博弈及其应用举例 三 博弈论概念简要总结
基本思路-不完全信息动态博弈
类型:自然首先选择参与人的类型,参与人自己知道,其 他参与人不知道。--不完全信息
行动:行动有先有后,后行动者能观测到先行动者的行动, 但不能观测到其类型。--动态博弈 但是,参与人是类型依存型的,每个参与人的行动都 传递有关自己类型的信息,后行动者可以通过观察先行动 者的行动来推断自己的最优行动。先行动者预测到自己的 行动被后行动者利用,就会设法传递对自己最有利的信息。
不完全信息动态博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
[x]
高
T=2,如果进入者已进入,在位 者成本函数为共同知识,若在位 者为高成本,p=5时,每个企业 利润为3,扣除进入成本2,进入 者利润为1。若在位者为低成本, p=4,在位者利润是5,进入者成 本为1,扣除进入成本2,其利润 为-1。
P=6
进入者 进入 不进入 进入 不进入 进入 不进入 进入 不进入 进入
价格
在位者高成本时的利润 在位者低成5
6 9
P=6
7 8
基本思路-不完全信息动态博弈
进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在 位者高成本函数相同。
T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为 高成本,企业企业成本函数相同,对称库诺特均衡产量下的价格p=5时, 每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本, 两个企业成本函数不同,非对称库诺特均衡产量下的价格p=4,在位者利润 是5,进入者成本为1,扣除进入成本2,其利润为-1。
贝叶斯纳什均衡
一、现代博弈论简单发展史
• 1960年开始,不同类型的博弈问题的研究取得突破性进展
•
•
1965年,Selten将纳什均衡概念引入动态分析,提出“子博弈精炼纳什均衡”
1967年,Harsanyi把不完全信息引入博弈论研究,提出“海萨尼转换”方 法,给出“贝叶斯纳什75)、Kreps和Wilson(1982)、Fudenberg和
2002:弗农史密斯(Vernon Lomax Smith) 贡献主要在于通过实验室实验来测试根据经济学理论 而做出预测的未知或不确定性。是对以博弈论为基础构 建的理论模型进行实证证伪工作的一大创举。(两位美 国学者丹尼尔·卡纳曼和弗农史密斯 ) 2005(以色列)奥曼( Robert J. Aumann)、谢林(美)( Thomas C. Schelling) 他们通过博弈理论分析增加了世人对合作与冲突的 理解。其理论模型应用在解释社会中不同性质的冲 突、贸易纠纷、价格之争以及寻求长期合作的模式 等经济学和其他社会科学领域。
二、博弈论与主流经济学的发展
• 博弈论研究对象:
当成果无法由个体完全掌握,而结局须视群体共同决策 而定时,个人为了取胜,应该采取什么策略
• 方法论:
经济学、政治学、管理、军事、外交、国际关系、 公共选择、犯罪学
• “深蓝”和“更深的蓝”使用动态博弈理论 编写程序,后来战胜了无敌的卡斯帕罗夫
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解” ——保罗· 萨缪尔森
(一) 完全信息静态博弈:纳什均衡
基本分析思路和方法
• 占优战略均衡: (dominant-strategy equilibrium) 反映了所有人的绝对偏好,因此十分稳定。但 这种情况较少见。又称为上策均衡。
贝叶斯纳什均衡场进入共35页文档
40、人类Leabharlann 律,事物有规律,这是不 容忽视 的。— —爱献 生
1、最灵繁的人也看不见自己的背脊。——非洲 2、最困难的事情就是认识自己。——希腊 3、有勇气承担命运这才是英雄好汉。——黑塞 4、与肝胆人共事,无字句处读书。——周恩来 5、阅读使人充实,会谈使人敏捷,写作使人精确。——培根
贝叶斯纳什均衡场进入
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
不完全信息静态博弈:贝叶斯纳什均衡
海萨尼转换
类型:一个参与人拥有的所有的个人信息(即所有不是共同知
识的信息)称为他的类型。 根据这个定义,甚至允许参与人不知道其他参与人是否知道自己 的类型。
例如:市场进入博弈:在位者不知道进入者是否知道自己是高成 本还是低成本,只知道进入者有p’的概率知道自己的成本函数, (1-p’)的概率不知道自己的成本函数。
不完全信息博弈
பைடு நூலகம்
不完全信息:每一个参与人对所有其他参与人的(对手)的特 征、战略空间及支付函数有准确的 知识,否则为不完全信息。 类似上述情况称为不完全信息博弈,即在不完全信息博弈中, 至少有一个参与人不知道其他参与人的支付函数。
不完全信息静态博弈 -贝叶斯纳什均衡
一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
司马懿自马上远远望之,见诸葛亮神态自 若,顿时心生疑忌,犹豫再三,难下决断。又 接到远山中可能有埋伏的情报,于是叫后军做 前军,前军做后军,急速退去。司马懿之子司 马昭问:“莫非诸葛亮无军,故做此态,父何 故便退兵?”
司马懿说:“亮平生谨慎,不曾弄险,今 大开城门,必有埋伏,我兵若进,必中计也。” 孔明见魏军退去,抚掌而笑,众官无不骇 然。诸葛亮说,司马懿“料吾生平谨慎,必不 弄险,疑有伏兵,所以退去。吾非行险,盖因 不得已而用之,弃城而去,必为之所擒。”
不完全信息静态博弈 -贝叶斯纳什均衡
一 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈
海萨尼转换
不完全信息静态博弈的战略式表述和贝叶斯纳什均衡
二 贝叶斯纳什均衡应用举例
三 贝叶斯纳什均衡与混合战略均衡
精炼贝叶斯Nash均衡
• 参与人2选择L’与R’的期望收益分别为2-p 和1+p,因此,如果p>1/2,则最优战略 为R’;如果p<1/2 ,则最优战略为L’。
要将子博弈精炼Nash均衡中“均衡精炼” 的思想应用到不完全信息扩展式博弈中, 就必须做到: 1) 对每个参与人i,在其信息集上给出关 于自己位于该信息集中哪一个决策结的 信念(或推断); 2) 对参与人i的每个信息集,在给定参与 人i在该信息集上的信念(或推断)情况下, 参与人的战略是对其他参与人战略的一 个最优反应,即参与人的选择必须满足 序惯理性(sequential rationality)。
L
R
• 不仅要求参与人2的均衡战略在由单决策 结构成的信息集上最优,而且还要求参 与人3的均衡战略在由多决策结构成的信 息集和上最优。
• 但对于位于由多决策结构成的信息集(I3 ({x4,x5})或I3({x6,x7}))上的参与人3,当轮 到他行动时,由于对已发生的历史即参 与人2是选择了L’还是R’并不清楚,因此 也就不知道自己是位于决策结x4 (或x6)还 是决策结x5 (或x7)上。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
• 精炼贝叶斯Nash均衡既包含了一个战略 组合,又包含一个信念系统。 • 这里信念系统对每个信息集都确定了位 于该信息集上的参与人所持有的信念。 • 这种信念是信念持有人对已发生历史的 一个推断,也可理解为他对自己位于信 息集上哪一个决策结的“一种估计”。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
精炼贝叶斯Nash均衡
10 贝叶斯Nash均衡的应用
市场需求由以下函数决定:
P a Q,Q q1 q2
进一步假设:
a 2; 3 H 5 c1 1, c , c2 ; 4 4 1 p 2
L 2
对于企业2:
2 q2 ( P c2 ) q2 (a q1 q2 c2 )
• 令 z j Pr ob(a (c j ) 1) 表示均衡状态下参与 人j提供的概率,则参与人j不提供的概率 为 1 z j。
j
• 参与人i提供(对方不提供自己才提供) 的预期收益为:
1 (1 z j ) 1 z j
• 因此,只有当 ci 1 z j 时,参与人i才会提 供。
i i
• 由于
z j Pr ob( a j (c j ) 1) Pr ob( c c j c j) Pr ob(c j ) Pr ob( c )
Pr ob(c j) • 当参与人i的收益等于其提供的成本时,得到临 界值 ci ,所以临界值 ci 须满足
据此有:
如果ci 1 z j,a (ci ) 1 ; 如果ci 1 z j,a (ci ) 0。
• 因此,存在 ci 使得只有当 ci [ c , ci ](ci c ) 时,参与人i才会提供。 • 同理,存在 c j 使得只有当 c j [ c , cj ](cj c ) 时, 参与人j才会提供。
假设:
• 企业1的成本函数为共同知识: c1 (q1 ) c1 q1 • 企业2的成本函数为私人信息,这意味着企业2 有不同的类型: l L c2 (q2 ) c2 q2
L H 其中, 。 c2 c2 • 企业1知道企业2是 c2L 的概率为p,是 c2H 的概率 是1-p,p和1-p为共同知识。
贝叶斯均衡剖析课件
未来发展方向
算法优化
针对贝叶斯均衡的计算复杂性,未来研究可以进一步优化算法, 提高计算效率和准确性。
放宽假设条件
为了扩大贝叶斯均衡的应用范围,未来研究可以尝试放宽完全理性、 完全信息等假设条件,使其更接近现实问题。
动态博弈和演化博弈的考虑
未来研究可以加强贝叶斯均衡在动态博弈和演化博弈中的应用,以 更好地解释市场现象和预测市场趋势。
且每个参与者都能预测对手的最优行动。
贝叶斯均衡的特性
贝叶斯均衡是一种纳什均衡,它 基于参与者的类型和对手的类型 概率分布来选择最优的策略或概 率分布。
贝叶斯均衡是一种静态均衡,因 为它假定参与者在游戏开始时就 知道自己的类型和对手的类型概 率分布。
贝叶斯均衡具有个体理性和集体 理性的特点,即每个参与者的最 优策略或概率分布都能导致整个 博弈的均衡结果。
混合策略贝叶斯均衡是一种动态均衡,因为它允许参与者通过选择概率 分布来随机化其行动。
完美贝叶斯均衡
完美贝叶斯均衡是指参与者在给定自己 类型和对手类型概率分布的情况下,选 择最优的策略或概率分布来最大化自己
的期望效用。
在完美贝叶斯均衡中,每个参与者都预 完美贝叶斯均衡是一种理想化的均衡, 测对手会选择最优的策略或概率分布, 因为它假定参与者在游戏开始时就知道 并据此选择自己的最优策略或概率分布。 自己的类型和对手的类型概率分布,并
贝叶斯均衡剖析课件
• 贝叶斯博弈理论概述 • 贝叶斯均衡的种类与特点 • 贝叶斯均衡的求解方法 • 贝叶斯均衡的应用场景 • 贝叶斯均衡的挑战与未来发展 • 案例分析:某行业的贝叶斯博弈分析
目录
贝叶斯博弈理论概述
贝叶斯博弈的基本概念
信念
在贝叶斯博弈中,每个参与者都 有自己对其他参与者行为的信念。 这些信念基于参与者的经验和信息。
纯策略贝叶斯纳什均衡例题
纯策略贝叶斯纳什均衡例题引言:纯策略贝叶斯纳什均衡是博弈论中常用的概念之一,它可以用于分析多方参与的决策问题。
本文将通过一个例题来解释纯策略贝叶斯纳什均衡的概念及应用。
例题背景:假设有两家咖啡店,分别是A店和B店。
每天早晨,两家咖啡店都需要决定自己的咖啡价格。
同时,消费者也需要决定去哪家咖啡店购买。
假设消费者根据市场情况作出购买决策。
A店和B店的利润与消费者选择有关。
情景一:A店设置较高的价格,B店设置较低的价格。
这种情况下,消费者更愿意选择购买B店的咖啡。
B店的利润将最大化,而A店的利润将最小化。
情景二:A店和B店都设置较低的价格。
这种情况下,消费者会更加倾向于选择购买A店的咖啡。
A店的利润将最大化,而B店的利润将最小化。
情景三:A店和B店都设置较高的价格。
这种情况下,消费者没有购买的动力,两家咖啡店的利润都会很低。
分析与求解:我们可以将上述情景转化为一个博弈论的模型,其中A店和B店是两个决策者,他们需要根据对方的策略来决定自己的策略。
消费者的选择将影响两家咖啡店的利润。
根据纯策略贝叶斯纳什均衡的概念,我们需要确定每个决策者的策略组合,以获得最优的结果。
在这个例题中,我们需要确定A店和B店的咖啡价格。
假设A店有80%的机会成为消费者的首选,B店有20%的机会。
根据这个信息,我们可以得到以下策略组合:情景一:A店设置高价格,B店设置低价格。
情景二:A店设置低价格,B店设置低价格。
情景三:A店设置高价格,B店设置高价格。
然后我们可以计算每种策略组合下两家咖啡店的利润,并找出使两家咖啡店利润最大化的策略组合。
结论:通过计算,我们可以得到以下结果:情景一:A店设置高价格,B店设置低价格。
这种情况下,A店的利润最大化,B店的利润最小化。
因此,纯策略贝叶斯纳什均衡的结果是,A店设置高价格,B店设置低价格时,两家咖啡店的利润最优化。
扩展思考:本例题中我们假设了A店有80%的机会成为消费者的首选,B店有20%的机会。
精炼贝叶斯均衡
子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
N
让我们再一次考虑市场进入的例子: 高 [u]
在位者
低 [1-u]
P=4
进入者
P=5
进入
不进入 进入
则要求Pr ob{ah} 0,即参与人i必须以正的概率选择 a h ,否则,后验概率没
有定义.如果 Pr ob{a h} 0 ,我们允许Pr ob{ah} 0 在[0,1]区间取任 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | ah} 对应的是
非均衡中径上的信息集
(7,0)
(5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
博弈论与信息经济学 江西财经大学图4.陶1长市琪场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择;
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼
不完全信息博弈和贝叶斯纳什均衡
2.{ i}i =1 取自某个客观的分布函数P(θ 1,• •θ n ) • θ
3.博弈方0让每个实际博弈方知道自己的类型,但不让(全部或 部分)博弈方知道其他博弈方的类型 同时从各自的行为空间中选择行动方案a1 , ⋯, an , 其中 ai ( i )∈ Ai ( i ), θ θ 而行动空间是类型依存的 5.各博弈方得益ui = ui (a1 ,⋯ , an , θ i ), i = 1, ⋯, n 4.在前述基础上,在进行原来的静态博弈,即各个实际博弈方
-
3.1.3 不完全信息静态博弈的战略式表 述和贝叶斯纳什均衡 3.1 定义
-
-
3.2 博弈顺序
3.3 假设 3.3.2 Ai (θ i ) 和 u i ( a1 , ⋯ , a n , θ i ) 本身是共同 知识; 知识 3.3.1 参与人的类型是相互独立的 参与人的类型是相互独立的;
3.1.1不完全信息静态博弈 不完全信息静态博弈 1.1 定义: 定义: 不满足完全信息假设的博弈, 不满足完全信息假设的博弈,即在不完全 信息博弈中,至少有一个参与人不知道其他参 信息博弈中, 与人的支付函数。 与人的支付函数。 1.2 例:市场进入博弈 市场进入博弈
Байду номын сангаас
3.1.2 海萨尼转换
1.引进虚拟自然博弈方,可称为博弈方0,其作用是在博弈方选择 之前,为每个实际博弈方按随机方式或者说抽取他们的类型,构 成向量θ = (θ1 ,⋯,θ n),其中θ i ∈ Θ i , i = 1,⋯, n
3.4 期望效用
__ -
3.5 贝叶斯纳什均衡
-
-
-
精炼贝叶斯Nash均衡的精炼
信息集的严格劣战略:
• 考虑轮到参与人行动的一个信息集。战 略si*为始于这一信息集的严格劣战略, 如果存在另一个战略si使得对i在给定信 息集可能持有的每一推断,并且对每一 其他参与人后续战略可能的组合,i在给 定信息集根据si选择行动并在其后根据si 选择后续战略得到的收益,严格大于根 据si*选择行动和后续战略得到的收益。
2) 对于信号博弈的精练贝叶斯Nash均衡, 可将信念精炼标准1重新表述如下。
• 在信号博弈中,M中的信号mj称为T中 类型ti的劣信号,如果存在另外一个信 号mj’,使得ti选择mj’的最小可能收益 大于ti选择mj的最大可能收益,即
Minus ti , mj , ak Max us ti , m j , ak
u [ p] L
t1
0.5
R
[q]
u
0,1
2,0
d 接收者
d 接收者 u [1 q] d
1,0
自然
0.5
1,0
u L [1 p]
0,0
R
1,1
d
t2
2,1
• 对q≥1/2,战略和推断[(L,L),(u,u),p=0.5,q] 构成博弈的一个混同精炼贝叶斯Nash均 衡。
• 由于类型为t1的发送者选择R的最大收益为1, 而选择L的最小收益为2,因此,发送者的战 略(R, L)和(R, R)为始于类型为t1的发送者的信 息集的严格劣战略。所以,根据信号条件(5), q=0。因此,博弈的精炼贝叶斯Nash均衡[(L, L),(u,u),p=0.5, q≥1/2]不满足信号条件(5)。 • 分离精炼贝叶斯Nash均衡[(L,R),(u,d),p=1,q=0] 则自然满足信号条件(5)。
18不完全信息博弈贝叶斯纳什均衡1
海萨尼转换 The Harsanyi transformation
Nature
A的类型 B的类型
A知道自己的 类型,知道B 的概率分布
B知道自己的 类型,知道A 的概率分布
1/2
商人B
Nature
1/2
商人A 商人B
H
C
H 2, 2 0, -1
C -1, 0 1, 1
H
C
H 2, 2 0, 3
C -1, 0 1, 1
贝叶斯博弈的战略表达式
参与者空间: N {0,1, , n} 参与者的行动空间:A {A1, , An} 参与者的类型空间:T {T1, ,Tn} 参与者的信念: p { p1, , pn}
参与者的收益函数:u {u1, , un}
G {A1, , An;T1, Tn; p1, pn;u1, ,un}
厂商A的最优反应
B选(H,H) A选H; B选(H,C) A选H B选(C,H) A选H; B选(C,C) A选C
商1人/2B
H
C
H 2, 2 0, -1
C -1, 0 1, 1
类型:良商
商1人/2B
H
C
H 2, 2 0, 3
C -1, 0 1, 1
类型:奸商
厂商B的最优反应: A选H,良商B选H,奸商B选C; A选C,良商B选C,奸商B选C
信息不对称的例子: 结婚
信息不对称的例子: 市场进入
在位者 新企业
信息不对称的例子: 信用困境
H
A
C
信念 Belief
良商
B
H
C
2, 2
0, -1
-1, 0 +1, +1
不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。
然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。
2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。
如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。
“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。
4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。
决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。
海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。
5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。
B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。
如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。
如果阻挠的成本低,A企业的最优战略是阻挠。
⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。
这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。
贝叶斯纳什均衡例题假设有两家企业
贝叶斯纳什均衡例题假设有两家企业摘要:1.贝叶斯纳什均衡的概述2.贝叶斯纳什均衡的例题:两家企业的博弈3.贝叶斯纳什均衡的应用范围正文:一、贝叶斯纳什均衡的概述贝叶斯纳什均衡(Bayesian Nash Equilibrium)是一种博弈论中的概念,指的是在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略。
在这种均衡状态下,每个参与者都认为自己的选择是最佳的,因为其他参与者也作出了相同的选择。
二、贝叶斯纳什均衡的例题:两家企业的博弈假设有两家企业A 和B,它们分别面临市场进入与否的决策。
企业A 可以选择进入或不进入市场,企业B 也可以选择进入或不进入市场。
两个企业的收益取决于它们各自的决策以及对方企业的决策。
如果企业A 进入市场,企业B 选择阻挠的概率为x,此时企业A 的收益为-10;如果企业A 进入市场,企业B 不阻挠的概率为1-x,此时企业A 的收益为40。
同样,如果企业B 进入市场,企业A 选择阻挠的收益为-10,企业B 不阻挠的收益为40。
在这个博弈过程中,企业A 和企业B 都希望最大化自己的收益。
因此,它们需要根据对方的决策来选择自己的最优策略。
在贝叶斯纳什均衡状态下,企业A 和企业B 都选择了能使自己收益最大化的策略,此时没有人有积极性选择其他策略。
三、贝叶斯纳什均衡的应用范围贝叶斯纳什均衡是一种理论分析工具,它可以帮助我们在不确定性条件下,预测和分析各个参与者的决策行为。
在实际应用中,贝叶斯纳什均衡可以用于解决许多经济、社会和政治领域的问题,例如价格博弈、专利竞争、国际贸易等。
12第十二章贝叶斯纳什均衡及其精炼
第十二章贝叶斯纳什均衡及其精炼前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。
本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。
12.1不完全信息博弈与贝叶斯纳什均衡一、不完全信息博弈完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(common knowledge)的博弈。
反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。
二、海萨尼(Harsanyi)转换在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。
至于“类型”概念,以两个企业博弈的例子说明。
假设参与人1为在位者企业,参与人2为进入者企业。
进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。
但是进入者不知道在位者的成本是高还是低。
因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。
海萨尼提出通过引入“自然”概念解决这个问题。
即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。
即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。
在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。
应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。
通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。
用表示参与人的一个特定类型,表示参i θi i Θ与人所有可能类型的集合,,并假定i i i Θ∈θ取自某个客观的分布函数。
n i i 1}{=θ),,(1n P θθL为简化起见,假定只有参与人本人观察到自i 己的类型,其他人都不能察到。
但依据海萨尼i θi θ公理,我们假定分布函数是所有参与),,(1n P θθL 人的共同知识,就是说,在博弈开始时,所有参与人关于自然行动的信念是相同的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 最后的结果可能有两种情况:
– – 懦弱的李四不吃辣椒,而强悍的李四吃辣椒, 且吃得足够多,张三通过李四吃辣椒的行动来 判定李四的类型,然后选择是否欺负李四。 – – 懦弱的李四和强悍的李四都吃了同样多数量 的辣椒,张三不能从李四的行动中推出任何新 的信息,其先验概率分布仍然是{0.2,0.8},所以 不会欺负李四。
进入 不进入
40 0
50 300
–
市场进入;低成本情况
在位者
默许
进入者
斗争 -10 0 140 400
进入 不进入
30 0
100 400
精炼贝叶斯(纳什)均衡
精炼贝叶斯(纳什)均衡是不完全信息动态 博弈的均衡概念。 在市场进入博弈中,精炼贝叶斯均衡是:在 位企业产品定价较高,潜在企业推断其为高成本, 选择进入;在位企业产品定价较低,潜在企业推 断其为低成本,选择不进入。
市场进入阻止
在位者
默许 进入 进入者 40,50 0,300 斗争 -10,0 0,300
不进入
子博弈精炼纳什均衡
默许 进入
(40,50)
在位者 斗争
进入者 不进入 (0,300) (-10,0)
市场进入阻挠博弈树
贝叶斯纳什均衡
– 市场进入;高成本情况
在位者
பைடு நூலகம்
默许
进入者
斗争 -10 0 0 300
先行者优势——Stackelberg 模型
• 企业 1
–
必须考虑企业 2 的反应
• 企业 2
–
将企业1 的产量作为给定的并按照古诺反应曲 线来决定产量
博弈论(Game Theory)简介
约翰· 纳什, 1928年生于美国 1994年Nobel 经济学 奖得主
约翰· 海萨尼, 莱因哈德· 泽尔腾, 1920年生于美国 1930年生于德国 1994年Nobel 经济学 1994年Nobel 经济学奖得主 奖得主
• 影片《美丽心灵》是一部以纳什的生平经历为基础而创作 的人物传记片。该片获得了奥斯卡金像奖,几乎包揽了 2002年电影类的全球最高奖项。影片主人公原型纳什因此 而成为热门的公众人物。
• 1996年,两位将博弈论应用于不对称信息 下机制设计的经济学家莫里斯(Mirrlees)和 维克里(Vickrey)获诺贝尔经济学奖。
纳什均衡
乙 L
甲 U D
7 6 10 8 3 8
R
5 9
表: 纳什均衡
占优均衡与纳什均衡的区别
占优均衡:我所做的是:不管你做什么我所能做的最好的。 你所做的是:不管我做什么你所能做的最好的。 纳什均衡:我所做的是:给定你所做的我所能做的最好的。 你所做的是:给定我所做的你所能做的最好的。
占优均衡是纳什均衡的一个特例
张三与李四的博弈
• 张三恃强凌弱,第一次与李四见面,不知李四是 强是弱,但根据第一印象判定李四为弱者的概率 是0.2,为强者的概率是0.8, 那么一开始张三不会 冒然欺负李四。 • 假定张三可以通过李四吃早餐时吃辣椒的数量来 修正对李四的看法,假定强者喜欢吃辣椒,弱者 不喜欢吃辣椒。 • 如果李四知道不吃辣椒的后果,即使生性懦弱, 不喜食辣椒,也会强迫自己吃一些辣椒,以示自 己不是弱者,但是张三自然会仔细观察李四能吃 多少辣椒。除非,李四吃得足够多,否则张三不 会认为李四是强者。对李四而言,即使是强者也 不愿意招惹是非,可能会吃足够多的辣椒,使得 弱者是无法承受的。
什么是分配论
产品价格理论讨论了均衡价格和均衡数量,是
由需求和供给决定的,但并没有说明影响需求的收
入水平是如何决定的,也没有说明影响供给的要素 价格是如何决定的。因此,在讨论了产品市场后, 还要进一步讨论要素市场的价格决定理论。 消费者是生产要素的所有者,生产要素的价格 和使用量是决定消费者收入水平的重要因素,因此 要素价格理论又称为分配理论。
• 2001年三位经济学家阿克洛夫(Akerlof)、 斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运 用博弈论研究信息经济学所取得的成就而 成为该年度的诺贝尔经济学奖得主。
博弈的基本要素
(1)博弈参与者(player)
(2)策略空间(strategy) (3)决策行为结果(payoff)
博弈论中的均衡
例: 两个寡头进行价格战博弈的收益矩阵。
厂商B 低价 低价 厂商A 高价 -50,100 10,10 高价 100,-50 50,50
博弈论中的均衡是一组稳定的博弈结果。双方均 不愿先改变策略。博弈的均衡是稳定的,因而是 可以预测的。
纳什均衡
• 纳什均衡:在一个纳什均衡里,任何一 个参与者都不会改变自己的策略,如果 其他参与者均不改变各自的策略。 • 博弈中双方都没有绝对的最优策略,一 方的最优策略取决于对方的选择。 • 占优策略均衡一定是纳什均衡,但纳什 均衡不一定是占优策略均衡。
– 囚犯的两难困境(prisoner’s dilemma)
嫌犯B
坦白
嫌犯A
不坦白
-1 -12
坦白 不坦白
-10
-10
-12
-1
-2
-2
B航空公司
打折
A航空公司
不打折
11亿 6亿
打折 不打折
8亿
8亿
6亿
11亿
10亿
10亿
智猪博弈
背景:在一个猪圈里住着一大一小两头猪。它们从同一个食槽中 获得食物。但食槽的按钮与食物的出口分布在相反的两端。每按 一次按钮,可得10个单位食物,但需付出2个单位劳动。 规则:若大猪按按钮:大猪吃6个单位,小猪吃4个单位; 若小猪按按钮:大猪吃9个单位,小猪吃1个单位; 若一起去按:大猪吃7个单位,小猪吃3个单位; 问题:哪头猪将会去按按钮?
小猪 大猪 按 等待 按 5,1 9,-1 等待 4,4 0,0
斗鸡博弈
• 假设两只公鸡遇到一起,每只公鸡都有两个行动选 择:进攻或后退。 • 后退是很丢面子的事情,若鸡甲进攻,乙后退,则 甲赢。双方前进,两败俱伤。 鸡乙 进 退
鸡 甲
进
退
-3,-3
0, 2
2,0
0,0
双方都没有占优策略 存在两个稳定的状态(纳什均衡):(0,2);(2,0)
• • • •
双人博弈和N人博弈 静态博弈和动态博弈 合作博弈与非合作博弈 完全信息博弈与不完全信息博弈
• 占优策略均衡 • 占优策略:无论其他参与者采取什么策 略,某参与者的惟一的最优策略就是他 的占优策略。 • 博弈均衡:是指博弈的所有参与者都不 想改变自己的策略的这样一种相对静止 的状态。 • 占优策略均衡:由博弈中的所有参与者 的占优策略所构成的均衡。