贝叶斯均衡素材
精炼贝叶斯均衡例题
精炼贝叶斯均衡例题贝叶斯均衡是概率论中一个较为重要的分支,其基本理论是有限理性决策理论。
它们是以Richard T. Ely在19世纪,使用经济学来提出的,主要探讨如何在使用有限信息做决策的情况下,最大化效益。
精炼贝叶斯均衡是指在模型中,玩家对自身信息的正确性有信心并且其他玩家也存在立场,在这种情况下的策略均衡。
通俗说法,它是在玩家根据对手的行为,更加精准地估计对手所处的策略状态,以及限制条件的情况下,产生的纳什均衡。
精炼贝叶斯均衡的计算,需要使用具体的信息集和对玩家的行动做出正确的估计。
以下面一个例子来说明:假设有一家咖啡厅准备推出新口味的拿铁,有两种口味,蜂蜜口味和香草口味。
因为不同口味的制作流程不同,而且又有部分食材是共通的,因此咖啡厅必须根据便利性考虑存储各种成分。
现在有两个人,Jack和Lucy,都喜欢在这家咖啡厅买咖啡。
他们对各种口味的选择和买咖啡时间很有信心,而且他们都被告知了咖啡厅会根据每天的订货量来决定存储的食材成分。
他们均希望让自己能够尽可能的喝到新口味。
我们假设Jack和Lucy同等了解咖啡厅的情况,并且都认为咖啡厅在每个工作日的早晨期间会根据他们的订货量来决定存储的食材成分。
如果订货量多,他们会添加更多的食材。
以上是对信息集的设置。
对于玩家的策略设置,我们定义了以下几种:对于咖啡厅,他们会考虑以下几种策略:1. 咖啡厅只供应其中一种口味的咖啡2. 咖啡厅以某种比率供应两种口味的咖啡而对于买咖啡的玩家,他们的策略则包括:1. Jack选择口味为香草的几率为p2. Lucy选择口味为香草的几率为q以上信息和设置提供了一个小的例子,可以帮助我们更加容易地理解精炼贝叶斯均衡的计算。
因为这个游戏中,两名玩家均有信心并且共享U0成分,那么我们就可以设计一个模型,来准确的计算出最优的商家策略和消费者策略,从而为各个方面提供最大的效益。
总之,精炼贝叶斯均衡的应用非常广泛,不仅在经济学,也在公司管理、政治学等领域有各种应用。
博弈论贝叶斯博弈与贝叶斯均衡ppt课件
given
by
Ha
rsanyi, consider the following prob
abilities of occurrence for the fou
rDepaprtmoenst sofiMabthlemeaticsmatch-ups:
Bayesian Nash Equilibrium
Department of Mathematics
不完全信息博弈问题
将博弈开始时就存在事前不确 定性的博弈问题称为不完全信息博弈问 题。
Department of Mathematics
例子:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥 的两端冲上桥中央进行决斗。每位勇士都有
两种选择:冲上去(用U表示),或退下来(用D
Department of Mathematics
Example: Scalping Tickets
• For example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money bef ore the UVa-Miami football game
This yields the following payoff matrix an d a single pure strategy Nash equilibriu m:
BS b1, BW b1 BS b1, BW b2 BS b2, BW b1 BS b2, BW b2
AS a1, AW a1 AS a1, AW a2 AS a2, AW a1 AS a2, AW a2
Department of Mathematics
纯策略贝叶斯纳什均衡例题
纯策略贝叶斯纳什均衡例题引言:纯策略贝叶斯纳什均衡是博弈论中常用的概念之一,它可以用于分析多方参与的决策问题。
本文将通过一个例题来解释纯策略贝叶斯纳什均衡的概念及应用。
例题背景:假设有两家咖啡店,分别是A店和B店。
每天早晨,两家咖啡店都需要决定自己的咖啡价格。
同时,消费者也需要决定去哪家咖啡店购买。
假设消费者根据市场情况作出购买决策。
A店和B店的利润与消费者选择有关。
情景一:A店设置较高的价格,B店设置较低的价格。
这种情况下,消费者更愿意选择购买B店的咖啡。
B店的利润将最大化,而A店的利润将最小化。
情景二:A店和B店都设置较低的价格。
这种情况下,消费者会更加倾向于选择购买A店的咖啡。
A店的利润将最大化,而B店的利润将最小化。
情景三:A店和B店都设置较高的价格。
这种情况下,消费者没有购买的动力,两家咖啡店的利润都会很低。
分析与求解:我们可以将上述情景转化为一个博弈论的模型,其中A店和B店是两个决策者,他们需要根据对方的策略来决定自己的策略。
消费者的选择将影响两家咖啡店的利润。
根据纯策略贝叶斯纳什均衡的概念,我们需要确定每个决策者的策略组合,以获得最优的结果。
在这个例题中,我们需要确定A店和B店的咖啡价格。
假设A店有80%的机会成为消费者的首选,B店有20%的机会。
根据这个信息,我们可以得到以下策略组合:情景一:A店设置高价格,B店设置低价格。
情景二:A店设置低价格,B店设置低价格。
情景三:A店设置高价格,B店设置高价格。
然后我们可以计算每种策略组合下两家咖啡店的利润,并找出使两家咖啡店利润最大化的策略组合。
结论:通过计算,我们可以得到以下结果:情景一:A店设置高价格,B店设置低价格。
这种情况下,A店的利润最大化,B店的利润最小化。
因此,纯策略贝叶斯纳什均衡的结果是,A店设置高价格,B店设置低价格时,两家咖啡店的利润最优化。
扩展思考:本例题中我们假设了A店有80%的机会成为消费者的首选,B店有20%的机会。
精炼贝叶斯均衡
子博弈精炼纳什均衡.但是,精炼纳什均衡(L,B)显然依赖于一个
不可置信的威胁:如果博弈进入参与人2的信息集,U严格优于B,选
择B不是序贯理性的;顺此,参与人1不应该相信参与人2会选择 B.尽
管子博弈精炼均衡不能剔除(L,B),我们可以使用精炼贝叶斯均衡
剔除(L,B)
博弈论与信息经济学 江西财经大学 陶长琪
精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战 略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡;并且,在所 有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的 信念.
N
让我们再一次考虑市场进入的例子: 高 [u]
在位者
低 [1-u]
P=4
进入者
P=5
进入
不进入 进入
则要求Pr ob{ah} 0,即参与人i必须以正的概率选择 a h ,否则,后验概率没
有定义.如果 Pr ob{a h} 0 ,我们允许Pr ob{ah} 0 在[0,1]区间取任 何值,只要所取的值与均衡战略相容.在动态博弈中,Pr ob{ k | ah} 对应的是
非均衡中径上的信息集
(7,0)
(5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
博弈论与信息经济学 江西财经大学图4.陶1长市琪场进入博弈
4.1-1 基本思路
注意:进入者第一阶段的利润恒为0.我们省略了第二阶段博弈的扩展式,代 之以库诺特均衡支付向量和垄断利润.这样做的理由是,在博弈进入第二阶段后, 如果进入者已经进入,库诺特均衡产量(和对应的价格)是每个企业的最优选择;
赵乐如欢果制进作入者历没经有1进0入天,终单于阶段于垄2断0产05量.1(.1和1价日格凌)是晨在基位本者的完最成优,选非择。常感谢 刘艳精艳炼同贝学叶斯第均四衡章(p及er第fec六t B章ay,es第ian七eq章ui的libr文ium档)!是贝叶斯均衡、子博弈精炼
精炼贝叶斯Nash均衡的精炼
信息集的严格劣战略:
• 考虑轮到参与人行动的一个信息集。战 略si*为始于这一信息集的严格劣战略, 如果存在另一个战略si使得对i在给定信 息集可能持有的每一推断,并且对每一 其他参与人后续战略可能的组合,i在给 定信息集根据si选择行动并在其后根据si 选择后续战略得到的收益,严格大于根 据si*选择行动和后续战略得到的收益。
2) 对于信号博弈的精练贝叶斯Nash均衡, 可将信念精炼标准1重新表述如下。
• 在信号博弈中,M中的信号mj称为T中 类型ti的劣信号,如果存在另外一个信 号mj’,使得ti选择mj’的最小可能收益 大于ti选择mj的最大可能收益,即
Minus ti , mj , ak Max us ti , m j , ak
u [ p] L
t1
0.5
R
[q]
u
0,1
2,0
d 接收者
d 接收者 u [1 q] d
1,0
自然
0.5
1,0
u L [1 p]
0,0
R
1,1
d
t2
2,1
• 对q≥1/2,战略和推断[(L,L),(u,u),p=0.5,q] 构成博弈的一个混同精炼贝叶斯Nash均 衡。
• 由于类型为t1的发送者选择R的最大收益为1, 而选择L的最小收益为2,因此,发送者的战 略(R, L)和(R, R)为始于类型为t1的发送者的信 息集的严格劣战略。所以,根据信号条件(5), q=0。因此,博弈的精炼贝叶斯Nash均衡[(L, L),(u,u),p=0.5, q≥1/2]不满足信号条件(5)。 • 分离精炼贝叶斯Nash均衡[(L,R),(u,d),p=1,q=0] 则自然满足信号条件(5)。
贝叶斯精炼纳什均衡解经典例题和解答
贝叶斯精炼纳什均衡解经典例题和解答贝叶斯精炼纳什均衡(Bayesian refinement of Nash equilibrium)是博弈论中的一个概念,它结合了贝叶斯理论和纳什均衡的概念,用于描述在不完全信息博弈中玩家对其他玩家类型的不确定性。
这里我将为你提供一个经典的例题,并给出相应的解答。
考虑一个简化的拍卖场景,有两个潜在的买家:买家A和买家B。
拍卖的物品是一幅画,卖家想以尽可能高的价格卖出这幅画。
买家A和买家B对这幅画的估值分别服从正态分布,其均值和标准差如下:买家A的估值:均值为100,标准差为20买家B的估值:均值为120,标准差为15拍卖的规则如下:卖家首先设定一个底价p(reserve price),然后买家A和买家B分别出价。
如果买家A的出价高于底价p,并且买家B的出价也高于底价p,那么拍卖的赢家是出价最高的买家,并且他们需要支付自己的出价。
如果只有一个买家的出价高于底价p,那么这个买家获胜,并以底价p购买这幅画。
如果两个买家都没有出价高于底价p,那么拍卖失败,画作不会被卖出。
现在我们来解答这个问题:1. 假设卖家设定底价p为90,请计算在这个底价下,买家A和买家B的最优出价以及对应的期望收益。
为了计算买家A和买家B的最优出价,我们可以使用贝叶斯精炼纳什均衡的概念。
在这个场景中,买家A和买家B都面临不完全信息,即对方的估值是未知的。
我们需要通过贝叶斯理论来计算每个买家对对方估值的后验概率分布,然后根据这些概率分布来确定最优出价。
买家A的后验概率分布可以通过贝叶斯定理计算得到:P(v_A|p) = P(p|v_A) * P(v_A) / P(p)其中,v_A表示买家A对画作的估值,P(v_A)表示买家A对估值的先验概率分布(正态分布),P(p|v_A)表示在买家A估值为v_A的情况下,底价p被设定的概率,P(p)表示底价被设定为p的概率。
根据题目中给出的信息,买家A的估值服从均值为100,标准差为20的正态分布,我们可以计算P(v_A)。
贝叶斯纳什均衡例题假设有两家企业
贝叶斯纳什均衡例题假设有两家企业摘要:1.贝叶斯纳什均衡的概述2.贝叶斯纳什均衡的例题:两家企业的博弈3.贝叶斯纳什均衡的应用范围正文:一、贝叶斯纳什均衡的概述贝叶斯纳什均衡(Bayesian Nash Equilibrium)是一种博弈论中的概念,指的是在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略。
在这种均衡状态下,每个参与者都认为自己的选择是最佳的,因为其他参与者也作出了相同的选择。
二、贝叶斯纳什均衡的例题:两家企业的博弈假设有两家企业A 和B,它们分别面临市场进入与否的决策。
企业A 可以选择进入或不进入市场,企业B 也可以选择进入或不进入市场。
两个企业的收益取决于它们各自的决策以及对方企业的决策。
如果企业A 进入市场,企业B 选择阻挠的概率为x,此时企业A 的收益为-10;如果企业A 进入市场,企业B 不阻挠的概率为1-x,此时企业A 的收益为40。
同样,如果企业B 进入市场,企业A 选择阻挠的收益为-10,企业B 不阻挠的收益为40。
在这个博弈过程中,企业A 和企业B 都希望最大化自己的收益。
因此,它们需要根据对方的决策来选择自己的最优策略。
在贝叶斯纳什均衡状态下,企业A 和企业B 都选择了能使自己收益最大化的策略,此时没有人有积极性选择其他策略。
三、贝叶斯纳什均衡的应用范围贝叶斯纳什均衡是一种理论分析工具,它可以帮助我们在不确定性条件下,预测和分析各个参与者的决策行为。
在实际应用中,贝叶斯纳什均衡可以用于解决许多经济、社会和政治领域的问题,例如价格博弈、专利竞争、国际贸易等。
贝叶斯分离均衡
贝叶斯分离均衡
贝叶斯分离均衡(Bayesian Separating Equilibrium)是一种均
衡概念,用于分析博弈论模型中的信息不对称情况下的决策问题。
在贝叶斯分离均衡中,每个参与者在做出决策之前,会对其他参与者的类型进行统计推断,并基于这些推断做出最优决策。
在贝叶斯分离均衡中,每个参与者都有一个类型,表示其私有信息。
每个类型对应不同的概率分布,可以影响参与者的行为。
参与者会根据自己的类型和其他参与者的可能类型来进行最优决策。
贝叶斯分离均衡通过解决统计推断和决策制定之间的互动问题,提供了一种描述信息不完全和不对称情况下的最优决策方式。
贝叶斯分离均衡是现代博弈论的重要概念,常用于解决拍卖、市场竞争和投标等领域的问题。
它可以揭示参与者的最优行为策略,并为经济学家和决策者提供决策分析工具。
贝叶斯均衡PPT15页
贝叶斯均衡
16、自己选择的路、跪着也要把它走 完。 17、一般情况下)不想三年以后的事, 只想现 在的事Βιβλιοθήκη 。现在 有成就 ,以后 才能更 辉煌。
18、敢于向黑暗宣战的人,心里必须 充满光 明。 19、学习的关键--重复。
20、懦弱的人只会裹足不前,莽撞的 人只能 引为烧 身,只 有真正 勇敢的 人才能 所向披 靡。
谢谢!
36、自己的鞋子,自己知道紧在哪里。——西班牙
37、我们唯一不会改正的缺点是软弱。——拉罗什福科
xiexie! 38、我这个人走得很慢,但是我从不后退。——亚伯拉罕·林肯
39、勿问成功的秘诀为何,且尽全力做你应该做的事吧。——美华纳
40、学而不思则罔,思而不学则殆。——孔子
贝叶斯均衡
( 10 ,16 ) ( 0 , 20 ) ( 0 , 40 ) ( 0 , 40 ) | ( 2 ,8 ) ( 20 , 20 ) ( 2 ,16 ) ( 0 , 20 ) ( 0 , 40 ) ( 0 , 40 )
(1)海萨尼从不完全信息
模型的特征入手,引入
故 q 2 (c L )
( 2)求企业 1关于企业 2的策略反应函数。 固定企业的策略 即求解优化问题: max [ a q 1 q 2 ( c H ) c 1 ] q 1 (1 )[ a q 1 q 2 ( c L ) c 1 ] q 1
q1
s 2 ( c 2 ),最大期望支付
(1)企业 2 对于企业 1的策略反应函数。 固定 q 1 及 c 2 ,求 s 2 ( c 2 ) q 2 ,最大化企业 即求解优化问题: max
q2 2
2的利润 2 ,
(a q1 q 2 c 2 )q 2 a q1 c 2 2
由
2ቤተ መጻሕፍቲ ባይዱ
q 2
0 知 a q 1 q 2 c 2 0,解得 q 2 ( c 2 ) a q1 c L 2 , q 2 (c H ) a q1 c H 2
私人信息和共同信息的区别: 1、私人信息
2、共同信息 共同知识 共同知识:并非是每个人都知道的知识 两个例子:脏脸问题 信封之谜 脏脸问题: 甲、乙、丙三人都戴红帽子,他们可以看到对方的帽子颜 色,但看不到自己帽子的颜色,问甲自己戴什么颜色的帽 子?问乙自己戴什么颜色的帽子?问丙自己戴什么颜色的 帽子?都回答不出。但一个旁观者告诉他们“他们至少有 一人戴红帽子”,问甲自己戴什么颜色的帽子?问乙自己 戴什么颜色的帽子?最后问丙自己戴什么颜色的帽子?甲、 乙不知,丙却知道自己的是红帽子。
第12讲:完美贝叶斯均衡
1
1
差 卖
1
卖
不卖 (0,0)
23
2
买 不买 买 不买
(2,1) (0,0) (1,-1) (-1,0)
23
为什么称这种均衡为完美贝叶斯均衡?
首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似; 其次,因为要求3和要求4规定“判断”的形成必须符合 贝叶斯法则。
(a)在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续 策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的 得益或期望得益最大。 (b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段 中,针对所有可能情况如何行为的完整计划。
好 不卖 (0,0)
1
1
差 卖
1
卖
不卖 (0,0)
20
当某策略组合及相应的判断满足这样四个要求时, 称为一个“完美贝叶斯均衡”。
为什么称这种均衡为完美贝叶斯均衡?
21
为什么称这种均衡为完美贝叶斯均衡?
首先,因为它的第二个要求“序列理性”,与子博弈完 美纳什均衡中的子博弈完美性要求相似;
22
− 要求2:给定各博弈方的“判断”,他们的策略必
35
完美贝叶斯均衡
要求1:在每个信息集,轮到选择的博弈方必须具有一个
关于博弈达到该信息集中每个节点可能性的“判断”( Belief)。 要求2:给定各博弈方的“判断”,他们的策略必须是“ 序列理性”的。 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法 则和各博弈方的均衡策略决定。 要求4:在不处于均衡路径上的信息集处,“判断”由贝 叶斯法则和各博弈方在此处可能有的均衡策略决定。
贝叶斯纳什均衡例题
贝叶斯纳什均衡例题
贝叶斯纳什均衡 (Bayesian Nash Equilibrium) 是一种非合作的博弈理论。
在贝叶斯纳什均衡中,每个参与者根据其他参与者的策略和历史数据,计算出自己在给定其他参与者的策略下的最大收益,并采取最优策略。
以下是一个贝叶斯纳什均衡的例题。
假设有三个人,分别是 A、B、C,他们玩一个猜拳游戏。
游戏规则如下:
1. A 和 B 随机猜拳,胜负概率均为 50%。
2. 如果 A 和 B 获胜,则 C 获胜的概率为 25%。
3. 如果 A 和 B 失败,则 C 获胜的概率为 75%。
现在问,谁是游戏的胜者,如果 A 和 B 采取随机策略,而 C 采取最优策略。
根据贝叶斯纳什均衡的定义,我们需要计算出每个参与者在给定其他参与者策略下的最优策略。
首先,对于 A 和 B,由于他们是随机的,所以可以采取任何策略,因此他们的最优策略是随机。
其次,对于 C,他需要计算出自己在 A 和 B 随机策略下的最大收益。
根据游戏规则,如果 A 和 B 随机,则 C 的最大收益为 25%。
因此,C 的最优策略是采取赢的概率为 25% 的拳法。
最后,由于 C 已经采取了最优策略,A 和 B 将不得不采取随机策略。
因此,游戏的胜者是 C。
需要注意的是,贝叶斯纳什均衡只适用于非合作的博弈理论。
在合作博弈中,参与者之间的策略选择需要基于信任和相互利益。
贝叶斯纳什均衡场进入共35页文档
40、人类Leabharlann 律,事物有规律,这是不 容忽视 的。— —爱献 生
1、最灵繁的人也看不见自己的背脊。——非洲 2、最困难的事情就是认识自己。——希腊 3、有勇气承担命运这才是英雄好汉。——黑塞 4、与肝胆人共事,无字句处读书。——周恩来 5、阅读使人充实,会谈使人敏捷,写作使人精确。——培根
贝叶斯纳什均衡场进入
36、如果我们国家的法律中只有某种 神灵, 而不是 殚精竭 虑将神 灵揉进 宪法, 总体上 来说, 法律就 会更好 。—— 马克·吐 温 37、纲纪废弃之日,便是暴政兴起之 时。— —威·皮 物特
38、若是没有公众舆论的支持,法律 是丝毫 没有力 量的。 ——菲 力普斯 39、一个判例造出另一个判例,它们 迅速累 聚,进 而变成 法律。 ——朱 尼厄斯
完美贝叶斯均衡之应用实例简述
Markus M. Mobius之信誉博弈
我们因此要一种不能通过逆向推导求解的模型,例如,一种不完 全信息博弈。更准确地说,我们要求一些主体类型的不确定性 (例如,成为“疯狂”合作者的不确定性)。一个长期博弈方 可以利用这种使自己像疯狂类型那样行事的微小的潜在信誉 (可能性)。在某些方面,理性博弈方可以“隐藏”在疯狂类型 之后。 在信誉模型中,有两种例子:(1)长期生存博弈方面对许多短 期生存的对手,譬如,连锁店博弈;(2)许多长期生存的博弈 方(之间的博弈),譬如,囚徒困境博弈。
Markus M. Mobius之信誉博弈
2、连锁店博弈 连锁店博弈是由Selten (1978),即一个大的连锁店面对许多市场 的序列进入。每个时期都有一个进入者要决定是进入还是离开。
进入者
进入
离开
在位者
(0,a)
战斗
容纳
(-1,-1)
(b,0)
Markus M. Mobius之信誉博弈
如果进入者离开,在位者享有支付a > 0。如果他进入,连锁店选 择战斗策略的话,双方都得到-1,如果选择容纳,则进入者得到 b > 0,而连锁店得到0。 我们已经知道,这个阶段博弈有唯一的SPE。现在考虑这个博弈 在T个市场重复的博弈。独特SPE仍然是所有市场连锁店选择容 纳,而每个进入者都选择进入——即使在位者在前一个时期选择 战斗。Selten把这种均衡称为连锁店悖论。 评论:我们可以通过让进入者分别可能是弱或强(类型),来 引入不完全信息,而强进入者总是会进入。这个博弈仍然会有 独特SPE,这时,所有进入者进入,而在位者总是容纳。
声明方 (类型)
T1
T2
行为方(行为)
α1
α2
2 ,1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• • • • • • • • • •
预备知识(共同知识) 静态博弈中的贝叶斯均衡 不完全信息下的古诺模型 用贝叶斯均衡解释混合策略均衡 显示原理 动态博弈中的贝叶斯均衡 信号传递博弈的精炼贝叶斯均衡 单一价格二手车模型 就业市场信号博弈 信息不完全条件下的囚徒困境问题
不完全信息博弈: 不完全信息意味着至少有一个参与人有多个类型。不完全 信息博弈是指、至少有一参与人不知道其他参与人的支付 函数。比如说, 你想去买件衣服时, 你并不清楚衣服的最低 价, 你和某人谈恋爱, 但在结婚前, 双方都是展现最好的一 面, 双方都不是很了解对方的很多品质, 等等, 这样的例子 举不胜举。在古代, 人们已经开始用到不完全信息博弈了。 比如在《三国演义》中, 周瑜伪造假降书, 诱骗曹操杀了蔡 摺、张允二将。曹操遂派蔡中、蔡和两兄弟假装降周瑜, 企图夺取东吴情报。周瑜识破曹操的诡计, 将计就计, 对黄 盖施以苦肉计。这一博弈中, 曹操只知道自己的部下蔡中、 蔡和是假降, 但不知道周瑜的情报周瑜知道蔡中、蔡和是 假降, 但曹操不知道周瑜知道自己是假降, 曹操不知道周瑜 已经识别了自己的计划。也就是说曹操的信息对周瑜的信 息是不完全的, 但周瑜很清楚曹操计谋, 于是周瑜就将计就 计。这一博弈属于不完全信息博弈。
进入 (10,10) 进 H 不进入 (0,20) 如 L 进入 (15,10) 者 不进入 (0,20)
( 1 )海萨尼从不完全信息 模型的特征入手,引入 一个概念类型: t i Ti , i 1,2,, n。Ti 为局中人i的类型空间, t i 为局中人i的类型。 t i 对局中人i是已知的,对于其他局 中人是随机变量,但 t i的概率 分布是共同知识。 (2)海萨尼在模型中引入 一个虚拟局中人 0,称为自然。它的行 动空间为A0 Ti ,即n个局中人的类型空间的 乘积空间。自然所
例:有两个局中人:市场潜在进入者和在位 者,他们的生产成本可能是高成本H也可能 是低成本L,但不为对方所了解,而H、L的 概率分布为他们的共同知识,支付矩阵为:
在 潜 在 默许 H 抵制 默许 位 者 L 抵制 (10,8) (10,15) (10,16) (0,20) (0,40) (0,40) | (2,8) (20,20) (2,16) (0,20) (0,40) (0,40)
不完全信息下的古诺模型
设两个企业生产同质产品,进行产量竞争。分别以 q1、q2表示产量,记Q= q1+q2。产品价格由市场 逆需求函数p(Q)=a-Q决定,企业i的成本为 ci(qi)=ci· qi。其中c2是企业2的私人类型。企业2的 类型空间为T2={cH,cL},(cH>cL), cL的概率为:p {c2=cH}= , {c2=cL}=1- 。
定义
在不完全信息静态博弈(也称为贝叶斯博弈)中,参与人 同时行动,没有机会观察到别人的选择。给定其他参与人 的战略选择,每个参与人的最优战略依赖于自己的类型。 由于每个参与人仅知道其他参与人有关类型的分布概率, 而不知道其真实类型,因而,他不可能知道其他参与人实 际上会选择什么战略。但是,他能够正确地预测到其他参 与人的选择与其各自的有关类型之间的关系。因此,该参 与人的决策目标就是:在给定自己的类型,以及给定其他 参与人的类型与战略选择之间关系的条件下,使得自己的 期望效用最大化。 贝叶斯纳什均衡是一种类型依赖型战略组合。在给定自己 的类型和其他参与人类型的分布概率的条件下,这种战略 组合使得每个参与人的期望效用达到了最大化。
(4)对给定的n 1个局中人的行动组合 (a1 , a 2 , , a n ; t1 , t 2 , , t n ), 局中人i可获得支付u i u i (a1 , a 2 , , a n ; t1 , t 2 , , t n )。
* *息静态博弈 的贝叶斯
私人信息和共同信息的区别: 1、私人信息
2、共同信息 共同知识 共同知识:并非是每个人都知道的知识 两个例子:脏脸问题 信封之谜 脏脸问题: 甲、乙、丙三人都戴红帽子,他们可以看到对方的帽子颜 色,但看不到自己帽子的颜色,问甲自己戴什么颜色的帽 子?问乙自己戴什么颜色的帽子?问丙自己戴什么颜色的 帽子?都回答不出。但一个旁观者告诉他们“他们至少有 一人戴红帽子”,问甲自己戴什么颜色的帽子?问乙自己 戴什么颜色的帽子?最后问丙自己戴什么颜色的帽子?甲、 乙不知,丙却知道自己的是红帽子。
纳什均衡,对于 i, t i Ti 及si* (t i ) ai*,如果ai*最大化局中人 i的
* 期望支付,即 si* (t i ) arg max u i ( s i (t i ), a i ; t1 , , t n ) p i (t i | t i ) ai ti
i 1 n
选的行动是t (t1 , t ,, t n ),即它为每个局中人 i选择了类型t i。 (3)海萨尼把静态博弈转 换为了动态博弈,博弈 时序为: ①自然选择t (t1 , t ,, t n ) A0 Ti ,
i 1 n
②自然把t i 仅通知局中人 i而不通知其余局中人 ③局中人i (i 1,2,, n)同时选择行动 ai Ai
他们没人都知道他们至少有一人戴红帽子,也知 道对方也知道他们至少有一人戴红帽子,但是对 甲而言,他不知道乙知道丙知道他们至少有一人 戴红帽子,所以该信息虽然每人都知道,但不属 于共同知识。 信封之谜: A有两个儿子M、N,他要给两个儿子一些钱,钱 的数额分别写在给他们的信封中,并告诉他们, 钱的数额为10n-1和10n(其中n为1-7之间的数), M的信封中为1000,N的信封中为10000,A问他 们是否要交换,他们均同意,A又问你们确定要 交换,他们还是都同意, A又问你们确定要交换, 他们还是都同意, A再次问你们确定要交换,结 果N不同意M同意。