Lecture 5 不完全信息动态博弈
第五讲 完全但不完美信息动态博弈
p( g | s)
p( g ) p(s | g ) p( s)
p( g ) p( s | g ) p( g ) p( s | g ) p(b) p( s | b)
再由
p b s 1 - p g s 求 p b s
24
完美贝叶斯均衡
5.2 完美贝叶斯均衡
36
5.3.3 模型的纯策略完美贝叶斯均衡
有了完美贝叶斯均衡的概念就可以讨论如何通过逆推归纳 法来求解。 (逆推归纳法的依据:1.理性选择 2.最优性原理)
例1
单一价格二手车交易模型(市场部分成功):假设差车 出现的概率 很小,此时好车多,( V>P>W),差车伪 pb 装费 C 相对于 P 很小(好坏车差距不大)
注意:这个例子仅是完全不完美的一种情况! 比如: 在动态博弈中,只要有一个博弈方看不到自己选择 前其它某一博弈方的行为就能构成一个不完美信息的动 态博弈。
概念和例子
6
5.1.2 不完美信息动态博弈的表示
完美信息的动态博弈可用有根树来表示(用逆推法 求解),那么不完美信息 动态博弈该如何表示呢?
车况的好坏直接影响到买卖双方的策略选择
单一价格二手车交易博弈模型
32
5.3.2 单一价格二手车交易均衡类型
二手车交易有许多可能的结果,什么情况是好,什么情况 是差呢,如下给出几种不同的市场均衡。 一般的,根据市场效率将市场分为四种: 市场完全失败——好的产品(存在潜在利益)也不敢投 入市场(相当于无市场)。 市场完全成功——只有好的产品投入市场,而买方买下 所有产品实现利益 市场部分成功——好、坏皆投入,买方好坏都买(有损 失和得利) 市场接近失败——所有好的和部分坏的,而买方以一定 概率买入 问题:讨论不同市场中 V, W, P, C 的组合
第五章 不完全信息动态博弈
第五章不完全信息动态博弈5.1 精炼贝叶斯纳什均衡5.1-1 基本概念在完全信息动态博弈的情况下,每个参与人的类型是共同知识(common knowledge),每个参与人都是在已知自己以及其他人类型的情形下按照行动顺序进行选择(做出决策)。
但是,在不完全信息动态博弈(dynamic game of incomplete information)的情况下,每个参与人只知道自己的类型而不知道其他参与人的类型,这样就好像是在博弈的开始阶段,存在一个参与人,名为“自然”,它先选择每个参与人的类型,然后参与人开始行动,参与人的行动有先有后,后行动者可以观察到先行动者的行动,但不能观察到先行动者所属于的类型。
但是,因为参与人的行动是依据参与人所属的类型而作出的,每个参与人的行动都传递着有关自己所属类型的信息,后行动者可以通过先行动者的行动来猜测先行动者的类型或者修正对先行动者所属类型的先验信念(表现为概率分布),然后根据修正后的后验信念选择自己的最优行动。
同样,先行动者会预测到自己的行动将被后行动者所利用,就会设法选择某些特定行动来迷惑后行动者,即选择那些传递对自己最有利的信息、避免传递对自己不利信息的行动。
因此,博弈过程不仅仅是参与人选择行动的过程,而且是参与人不断修正自己信念的过程,比起完全信息动态博弈的情况要更加复杂。
精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔腾(Selten)的完全信息动态博弈子博弈精炼纳什均衡和海萨尼(Harsanyi)的不完全信息静态博弈贝叶斯均衡的结合。
精炼贝叶斯均衡要求,给定有关其他其他参与人所属类型的信念,参与人的战略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡:并且,在所有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人的类型的信念。
在不完全信息静态博弈中,我们有一个与参与人的信念相关的概念,用概率(probability)来表示,它在整个博弈的过程中是不变的,可以说是一个坚定的信念;而在不完全信息动态博弈的情况下,该概念就不再适用了,因为参与人的信念是会不断修正的,对于参与人的信念,我们分为两类,一类是先验概率(prior probability),而另外一类是后验概率(posterior probability)。
不完全信息 动态 斯塔克尔伯格博弈模型
不完全信息动态斯塔克尔伯格博弈模型下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!不完全信息动态斯塔克尔伯格博弈模型1. 引言斯塔克尔伯格博弈模型是一种常见的非合作博弈模型,它描述了市场上的领导者和追随者之间的相互作用。
第5讲-不完全信息动态博弈
1.基本思路
• 在不完全信息动态博弈(dynamic game of incomplete information)中,“自然”首先选择 参与人的类型,参与人自己知道,其他参与人不 知道;在自然选择之后,参与人开始行动,参与 人的行动有先有后,后行动者能观测到先行动者 的行动,但不能观测到先行动者的类型。
第5讲 不完全信息动态博弈
不一样的。假定存在一个价格P*,只有低成本企业 才有利可图,而高成本企业司不敢模仿这个价格 的。 • 那么,精炼贝叶斯均衡是,低成本在位者选择P*, 高成本企业选择一个较高的垄断价格。如果进入 者观察到在位者选择了P*,这就推断其为低成本, 不进入;否则,就认为在位者是高成本,进入。 • 这就是由米尔格罗姆和罗伯茨于1982年提出的著 名的“垄断限价模型”。
马上认为这个人一定是好人,除非这件好事非常非常地好,因为否 则的话,坏人总是有积极性干件好事以使我们认为他是一个好人)。 当然,如果我们认为坏人干好事并不仅仅是为了假装好人,我们对 他的看法就不会改变,因为,根据贝叶斯法则:
第5讲 不完全信息动态博弈
ProbBP GT p*1 =1
q*0 P*1 这里,p>0是坏人干好事的概率,q>0好人干好事的概率。 从上面例子可以看到,我们如何改变对一个人的看法不仅依赖于我们 认为他是好人或坏人的先验概率,而且依赖于我们如何“认为”好人 干好事和坏人干好事的条件概率。
• 但是,因为参与人的行动是类型依存的,每个参 与人的行动都传递着有关自己类型的某种信息, 后行动者可以通过观察先行动者所选择的行动来
第5讲 不完全信息动态博弈
推断其类型或修正对其类型的先验信念(概率分 布),然后选择自己的最优行动。先行动者预测 到自己的行动将被后行动者所利用,就会设法选 择传递对自己最有利的信息,避免传递对自己不 利的信息。 • 因此,博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
不完全信息动态博弈
创立目的就是和波音这样已成规模的公司竞争。
波音早于空客成立,所以当欧洲各国抢占市场时,波音早
已在欧洲站稳脚跟。波音公司先进入市场,就可能出现两种情
况——波音公司是一个“无先发优势”的企业,也可能是一个
“有先发优势”的企业。
第5页
2
波音与空客之战
第五章
不完全信息动态博弈
主要内容
第一节
不完全信息动态博弈
第二节
精炼贝叶斯纳什均衡
第三节
信号博弈
第四节
先验信念、策略互动、后验概率
第 2 页
第一节
不完全信息动态博弈
不完全信息动态博弈特点
波音与空客之战
第3页
1
不完全信息动态博弈特点
不完全信息动态博弈:指至少有一方参与者对于博弈的信息不是
完全了解,并且参与者的行动存在先后顺序。和不完全信息静态
由方程 2q1 q2 8 和 q1 2q2 8 可得:
q1=8/3,q2=8/3
在“无先发优势”条件下波音公司利润π(q1)=64/3,空客
公司利润为π(q2)=10/3。
也就是说,在波音公司是“无先发优势”条件下,空客
公司会选择生产,与波音公司竞争。
第 13 页
第二节
精炼贝叶斯纳什均衡
自己肯定选择策略R,所以对这个动态博弈来说,博弈路径必
定是甲选择策略T,乙选择策略R。
第 22 页
3
不可置信的威胁与可置信的威胁
不可置信威胁又称空洞威胁,是完全没有任何威胁作用的威
胁。比如在上述博弈中,乙为了让甲选择策略N,就对甲说,
如果不选择N,乙会选择策略L,局中人甲得益就是0,但甲选
不完全信息动态博弈精品文档27页
4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。
在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。
同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。
我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。
从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。
例简单的非完全信息动态博弈Nt1(p) t2 (1–p)1 1L R L R2 2L R L R L RL Ru1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t为个人信息。
参与人2 不知道t,但知道t的概率分布。
博弈的时序:(1)参与人1选择行动a1A1;(2)参与人2观察a1,选择a2A2博弈的收益:u1 (a1, a2, t ), u2 (a1, a2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。
作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。
因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。
不完全信息动态博弈
不完全信息动态博弈不完全信息动态博弈(Dynamic Games with Incomplete Information)[编辑]什么是不完全信息动态博弈在动态博弈中,行动有先后次序;在不完全信息条件下,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
在不完全信息动态博弈一开始,某一参与人根据其他参与人的不同类型及其所属类型的概率分布,建立自己的初步判断。
当博弈开始后,该参与人就可以根据他所观察到的其他参与人的实际行动,来修正自己的初步判断。
并根据这种不断变化的判断,选择自己的策略。
[编辑]相关例子以下是几个关于不完全信息动态博弈的例子:1.黔驴技穷精炼贝叶斯均衡是完全信息动态博弈的子博弈精炼纳什均衡与不完全信息静态博弈的贝叶斯纳什均衡的结合。
贝叶斯方法是概率统计中的一种分析方法。
它是指根据所观察到现象的有关特征,并对有关特征的概率分布的主观判断(即先验概率)进行修正的标准方法。
中国著名成语故事黔驴技穷,就是贝叶斯方法思想的一个典型表达。
老虎没有见过驴子,因而不知道自己比驴子强还是弱。
老虎的战略是:如果自己弱,那就只能躲,如果自己强,那就吃驴子。
对于自己并不了解驴子,老虎的做法是不断试探,通过试探,修改自己对驴子的看法。
如果驴子表现温顺无能,老虎就认为驴子是美食的概率比较大,起初驴子没有反应,老虎认为驴子不像强敌,胆子越来越大。
后来驴子大叫,老虎以为驴子要吃它,吓的逃走,但后来想想,又觉得不一定,于是继续试探,直到驴子踢老虎,老虎才觉得驴子“仅此技耳”,于是采取自己强时的最优行动——吃驴子。
2.信号传递由于信息不完全,每个人都希望向对方传递对自己有利的信号。
比如,在招聘时,应聘者总是显示自己最好的一面。
不完全信息动态博弈
2、贝叶斯法则
(2)假如我们观测到这个人干了一件坏事,我们将如何改变对他的看法呢?
– 若我们相信,好人绝不会干坏事,只有坏人才会干坏事,那么我们可以肯定,他绝 不可能是一个好人:
即可假定:p( BT | GP) 0, p( BP) 1 2 , p(GP) 1 2 0 1 2 p( BT | GP) p(GP) Pr ob{GP | BT} 0 Pr ob{BT} 0 1 2 p 1 2
事之后,我们如何修正他是好人的先验概率依赖于我们认为这件好事好到什么程度。
第一种情况:一件非常好的好事p(GT|GP)=1(好人一定干),p(GT|BP)=0(坏 1 1 人绝不可能干) p(GT | GP) p(GP) 2 则 Pr ob{GP | GT } 1 p(GT | GP) p(GP) p(GT | BP) p( BP) 1 1 0 1 2 2 结论:他肯定是个好人(尽管事前认为这个人是好人的概率只有1/2),(从观察
h k
H
即i选择行动ah的“总”概率是每一种类型的i选择ah的条件概率p(ah|θ k)
k 1
的加权平均,权数是他属于每种类型的先验概率p(θ k)。后验行动(选择 ah)通过先验概率属于类型p(θ k)来确定。
2、贝叶斯法则
假如我观测到i选择了ah,i∈θ k的后验概率是多少?
类型 k 参与人选择行动a h
若我们认为坏人干好事并不仅仅是为了假装好人,p(GT|BP)=p,p(BP)=1,
k 1
的行动ah,给定i∈θk,选的条件概率为 p(a | ), p(a h | k ) 1 (总有 h 1 一行动会选到),则i选择ah的概率是: K h h 1 1 h K K 公式1 : Pr ob{a } p(a / ) p( ) p(a | ) p( ) p(ah 事后选类型
第五章-不完全信息动态博弈2全篇
最优垄断价格 MR=MC p实<p垄
✓这一现象的一个老的解释是:若价格等于垄断价格,其他企 业看到有利可图,就会进入;相反,若价格低一些,其他企 业看到进入无利可图,就不会进入,垄断企业就可以继续保 持其垄断地位。 ✓结论:价格作为一种承诺是不可置信的,因为不论垄断者现 在索取什么价格,一旦其他企业进入,垄断者就会改变价格, 因此,靠低价格是不可能阻止进入的。 ✓米尔格罗姆和罗伯茨(1982)提出的解释是,垄断限价可能 反映了这样一个事实,即其他企业不知道垄断者的生产成本, 垄断者试图用低价格来告诉其他企业自己是低成本,进入是 无利可图的。
p( 1)
p( 1) 0 p( 2 )
1
p( 1 | m2 )
p(m2
p(m2 | 1) p( 1) | 1) p( 1) p(m2 | 2 ) p( 2 )
(1 ) p( 1) (1 ) p( 1) 1 p( 2)
(1 ) p(1) (1 ) p(1) (1 ) p( 2 )
7
1、分离均衡(separating equilibrium)
✓分离均衡(separating equilibrium):不同类型的发送者(参 与人1)以1的概率选择不同的信号,或者说,没有任何类型选择 与其他类型相同的信号。 ✓假定K(类型数)=J(信号数)=2,则分离均衡(SE)意味着: 若m1是类型θ1的最优选择,m1就不可能是θ2的最优选择,并且, m2一定是类型θ2的最优选择。即:
p( 1)
p( 2 | m2 )
1 p( 2 )
1 p( 2 ) p( 2 )
(1 ) p( 1) 1 p( 2 ) p( 1) p( 2 )
(见到m2信号, 2的后验概率将大于先验概率)
不完全信息动态博弈
L
3
p
R D
(3,3,3) U (0,1,2)
U
(1,2,1)
D (0,1,1)
要求4: 对不在均衡路径上的信息集,推断由贝叶斯 法则以及可能情况下的参与者的均衡战略决定。
精炼贝叶斯均衡要求:
在每个信息集上,决策者必须有一个定义在属于该信息集 的所有决策结上的一个概率分布(信念); 给定该信息集上的概率分布和其他参与人的后续战略,参 与人的行动必须是最优的;
考察战略组合(B,L,U; p=0)是否为精炼贝叶斯 均衡
战略组合(B,L,U)是一NE,没有参与 人愿意单独偏离这一结果 这一组战略及推断也满足要求 l到3(要求3自动满足)。
1 B (2,0,0) F 2
3的信息集不在均衡路径上。 精炼贝叶斯均衡要求:3在非均 衡路径的信息集上的“判断” 也必须与2的均衡战略L吻合。 1-p
L M p (1,3) 2
R 1-p
U
B U
(2,1)
(0,0)
(0,2)
(0,1)
要求3: 在处于均衡路径之上的信息集中,推断由贝叶斯 法则及参与者的均衡战略给出。 定义 :对于一个给定的扩展式博弈中的均衡,如果博弈按 照均衡战略进行时将以正的概率达到某信息集,我们称此 信息集处于均衡路径之上。反之,如果博弈根据均衡战略 进行时,肯定不会达到某信息集,我们称之为不在均衡路 径上的信息集。(其中“均衡”可以是纳什、子博弈精炼、 贝叶斯以及精炼贝叶斯均衡)
面试
“北京某外资企业招工,报酬丰厚,要求严格, 一些高学历的年轻人过五关斩六将,几乎就要 如愿以偿了,最后一关是总经理面试,到了面 试时间之后,总结理突然说:“我有点急事, 请等我10分钟。”总经理走后,踌躇满志的年 轻人围着老板的办公桌,你翻看文件,我看来 信,没一个闲着,10分钟后,总经理回来了, 宣布说:“面试已经结束,很遗憾,你们没有 被录取。”年轻人惊惑不已:“面试还没开始 呢!”总经理说;“我不在期间,你们的表现 就是面试,本公司不能录用不守规矩不懂礼貌 的人
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.2 信号博弈
Case 1:混同于行动L的PBE
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,发送者都选择L,因此������ = 0.5(没有信念更新)。 要使得均衡成立,需要接受者在给定信念下达到最优选择
•
•
要使得均衡成立,还需要发送者选择L比选择R要好。 混同均衡:
• •
((强势进入,合作);p=1) 求解PBE时,一定要列举出信念
择价格战的支付为-1,因此在位者的最优选择是合作。给定在 位者选择合作,进入者会选择强势进入。
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
由C1,在位者(I)形成信念 ������ 和 1 − ������,分别为������和������的概率 由C2,给定信念,在位者(I)的期望支付为
������, ������ , ������, ������ ; ������ = 0.5, ������ ≤ 2/3
5.2 信号博弈
Case 2:混同于行动R的PBE
接受者分别在观察到L和R后形成信念������和������,由于在该情况
下,发送者都选择R,因此������ = 0.5(没有信念更新)。 要使得均衡成立,需要接受者在给定信念下达到最优选择
•
显然当������ ≤ 2/3时,两种类型的发送者选择L会更好
观察到L后,接受者选择������的支付为3∗0.5+4∗0.5=3.5,选择������ 的支付为0∗0.5+1∗0.5=0.5,从而最优选择为������。使得在均衡 路径上类型������1 和������2 的发送者支付分别为1和2。 观察到R后,给定信念������,接受者选择������的支付为������,选择������ 的支付为2(1−������)。若������ ≥ 2/3,接受者的最优选择为������,类 型������1 和������2 的发送者支付分别为2和1;若������ ≤ 2/3,接受者的 最优选择为������ ,类型������1 和������2 的发送者支付分别为0和1
5.1 不完全信息动态博弈
例5.1.1:吓阻进入
5.1 不完全信息动态博弈
例5.1.1:吓阻进入(1)
由C1,在位者(I)形成信念 ������和 1 − ������,分别为强势进入和
弱势进入的概率:
由C2,给定信念,在位者选择合作的期望支付为1 − ������,选 由C3,在均衡路径上,信念由进入者的策略决定p=1 均衡
若������ < ������,不存在分离均衡,存在两类混同均衡
饼干, 饼干 , 决斗, 不决斗 ; ������ = 0.1, ������ ≥ 0.5
啤酒, 啤酒 , 决斗, 不决斗 ; ������ ≥ 0.5, ������ = 0.1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
分离均衡:
• • • •
分离均衡中理智在位者选择原价,因此������ = 0 理智的在位者第一期采用原价的总支付为50 + 50������ 观察到在位者第一期采用低价,进入者认为在位者一定是 疯狂的,因此在第二期会选择不进入,这使得理智在位者 第一期选择低价的总支付为100 + 30������ 分离均衡要求50 + 50������ ≥ 100 + 30������ ,即������ ≤ 0.4
•
• • •
观察到L后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择L的支付分别为1和2。
观察到R后,接受者的最优选择为������。使得类型������1 和������2 的发 送者选择R支付分别为1和0 发送者������1 选择R(支付为1)与选择R(支付为1)无差异 发送者������2 选择L(支付为2)优于选择R(支付为0)
������ < ������时,第一类混同均衡中接讯者观察到啤酒(非均衡路
径)后的信念������ ≥ 0.5是不合理的:类型为弱(������1 )的发讯者均衡 中报酬为B+D高于D(这是传递信号啤酒后的最高报酬),根 据直观准则,信念������ = 0 ,因而这个PBE被剔除了。
5.3 声誉模型
• •
进入者的策略{In,c}决定在位者在均衡路径上的信念为������ = 1 > 1/3,给定该信念,进入者的策略{In,c}与在位者的策 略c互为最优反应,得到WPBE ������������, ������ , ������ ; ������ = 1 进入者的策略{Out,c}使得信念出现在非均衡路径上,此 时任意信念为������ < 1/3,进入者的策略{Out,c}与在位者的 策略f互为最优反应,得到WPBE ������������������,������ , ������ ; ������ < 1/3 第二个均衡非均衡路径上的策略������ 使得信念������ = 1,与������ < 1/3矛盾,因此可以去掉 ������������, ������ , ������ ; ������ = 1
•
•
给定在位者选������ ,进入者(E)的最优选择是������ ,子博弈上得 到支付3,因此在最初会选择In
给定在位者选������ ,进入者(E)的最优选择是������ ,子博弈上得 到支付-2,因此在最初会选择Out
5.1 不完全信息动态博弈
例5.1.2:吓阻进入(2)
由C3,在均衡路径上,信念由进入者的策略决定
要使得均衡成立,还需要发送者������1选择R,������2选择L为最优。 分离均衡:
������, ������ , ������, ������ ; ������ = 0, ������ = 1
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.2 信号博弈
5.2.1 “啤酒饼干”博弈与“直观准则”
5.2 信号博弈
u
d
(4, 0)
(1,3)
L
[ p]
发送者
R
[q]
u
(2,1)
t1
自然
0.5
d
[1 q]
(0, 0)
(1, 0)
(2, 4)
u
[1 p]
t2 0.5发送者来自u(0,1)d
L
R
d
(1, 2)
5.2 信号博弈
该博弈可能存在的纯策略PBE有。
•
•
•
•
1、混同于行动L的PBE——无论发送者的类型是t1和t2,发 送者的策略都为(L,L) 2、混同于行动R的PBE——无论发送者的类型是t1和t2,发 送者的策略都为(R,R) 3、分离均衡——类型t1的发送者选择L,类型t2发送者选择R, 发送者的策略都为(L,R) 4、分离均衡——类型t1的发送者选择R,类型t2的发送者选择 L,发送者的策略都为(R,L)
当������ ≤ 0.4时,存在分离均衡
原价, 低价 , 进入, 不进 ; ������ = 0
5.3 声誉模型
5.3.1 “声誉”与连锁店悖论
混同均衡:
• • •
混同均衡中理智在位者选择低价,因此������ = ������ 理智的在位者第一期采用原价的总支付为50 + 50������ 观察到在位者第一期采用低价,进入者认为在位者是理智 的概率为������。此时,其选择不进入的支付为0,选择进入的 支付为������ ∗ 10������ + (1 − ������)(−10������) 。因此若������ ≥ 0.5,进入者 最优选择为进入,从而在位者选择低价的支付为30 + 50������ ;若������ ≤ 0.5,进入者最优选择为不进,从而在位者选择低 价的支付为30 + 100������ 。 混同均衡要求30 + 100������ ≥ 50 + 50������ ,即������ ≥ 0.4
由C4,在非均衡路径上,信念由进入者的策略决定
•
唯一的均衡PBE为
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的一般形式
5.2 信号博弈
信号博弈的均衡
信号传递博弈的所有可能精炼贝叶斯均衡可以划分为三类:
分离均衡、混同均衡和半分离均衡。
• •
•
分离均衡(Separating Equilibrium):不同类型的发送者以1 的概率选择不同的信号,信号准确地揭示出类型。 混同均衡(Pooling Equilibrium):不同类型的发送者选择 相同的信号,接收者不修正先验概率(发送者的选择没有 信息量)。 半分离均衡(Semi-separating Equilibrium):一些类型的发 送者随机地选择信号,另一类的发送者选择特定的信号。
直观准则 (Intuitive Criterion):如果信息(m)后的信息集合在非
均衡路径上,而且该信息m对类型������������ 的传讯者而言是均衡被占 优的(equilibrium-dominated),即������������ 在均衡路径的报酬高于������������ 发送 信息m之后的最高报酬,那么接讯者观察到信息m后对类型������������ 的 信念应该为0。
发送者������1 选择L(支付为1)优于选择R(支付为0) 发送者������2 选择R(支付为1)的支付低于L(支付为2),从 而无法达成均衡。
5.2 信号博弈
Case 4:分离均衡(R,L)
接受者分别在观察到L和R后形成信念������和������,由于在该情况