不完全信息动态博弈
不完全信息动态博弈模型
不完全信息动态博弈模型随着信息技术的迅猛发展和普及,人们在日常生活和工作中收集、传递和利用信息的能力越来越强。
然而,在现实生活中,我们常常会面临不完全信息的情况,尤其是在决策和博弈的过程中。
不完全信息动态博弈模型便应运而生,用于研究这种情况下的决策和行为。
不完全信息动态博弈模型指的是在博弈过程中,参与者并不完全了解其他参与者的信息,即参与者们面临着不确定性的决策环境。
在这种情况下,每个参与者的决策都会受到其他参与者决策的影响,而其他参与者的决策又受到他们所接收到的信息的影响。
因此,不完全信息动态博弈模型考虑了参与者的行动、信息和反应的交互作用,揭示了决策者在不完全信息环境下的最优策略。
在不完全信息动态博弈模型中,每个参与者有两个基本要素:策略和信息。
策略是指参与者为了达到自己的目标而采取的行动规则,而信息则是指参与者关于其他参与者决策或环境的知识。
在不完全信息动态博弈模型中,参与者的信息通常分为两种:私有信息和公共信息。
私有信息指的是只有某个参与者能够获得的信息,而公共信息是所有参与者都能够获得的信息。
不完全信息动态博弈模型通常采用博弈树来描述参与者们的行动和决策过程。
博弈树是一种图形化的表示方法,用来展示参与者之间的相互关系和决策的顺序。
在博弈树中,每个节点代表一个状态或者一个决策点,而边则表示参与者们的选择。
通过不完全信息动态博弈模型,我们可以研究和分析参与者们在不完全信息环境下的最优策略。
在这种模型中,参与者们会根据自己拥有的信息和对其他参与者可能行动的推测,选择最优的策略。
同时,他们也会考虑到其他参与者可能的反应和对自己行动的影响,以及在不完全信息环境下可能的不确定性。
不完全信息动态博弈模型在实际应用中有着广泛的应用。
例如,在商业领域中,企业面临着市场竞争和不确定性因素,通过不完全信息动态博弈模型可以帮助企业制定最优的决策策略。
在政治和军事领域中,各方面临着战略竞争和信息不对称的情况,通过不完全信息动态博弈模型可以揭示参与者之间的决策和行为规则。
第5讲-不完全信息动态博弈
1.基本思路
• 在不完全信息动态博弈(dynamic game of incomplete information)中,“自然”首先选择 参与人的类型,参与人自己知道,其他参与人不 知道;在自然选择之后,参与人开始行动,参与 人的行动有先有后,后行动者能观测到先行动者 的行动,但不能观测到先行动者的类型。
第5讲 不完全信息动态博弈
不一样的。假定存在一个价格P*,只有低成本企业 才有利可图,而高成本企业司不敢模仿这个价格 的。 • 那么,精炼贝叶斯均衡是,低成本在位者选择P*, 高成本企业选择一个较高的垄断价格。如果进入 者观察到在位者选择了P*,这就推断其为低成本, 不进入;否则,就认为在位者是高成本,进入。 • 这就是由米尔格罗姆和罗伯茨于1982年提出的著 名的“垄断限价模型”。
马上认为这个人一定是好人,除非这件好事非常非常地好,因为否 则的话,坏人总是有积极性干件好事以使我们认为他是一个好人)。 当然,如果我们认为坏人干好事并不仅仅是为了假装好人,我们对 他的看法就不会改变,因为,根据贝叶斯法则:
第5讲 不完全信息动态博弈
ProbBP GT p*1 =1
q*0 P*1 这里,p>0是坏人干好事的概率,q>0好人干好事的概率。 从上面例子可以看到,我们如何改变对一个人的看法不仅依赖于我们 认为他是好人或坏人的先验概率,而且依赖于我们如何“认为”好人 干好事和坏人干好事的条件概率。
• 但是,因为参与人的行动是类型依存的,每个参 与人的行动都传递着有关自己类型的某种信息, 后行动者可以通过观察先行动者所选择的行动来
第5讲 不完全信息动态博弈
推断其类型或修正对其类型的先验信念(概率分 布),然后选择自己的最优行动。先行动者预测 到自己的行动将被后行动者所利用,就会设法选 择传递对自己最有利的信息,避免传递对自己不 利的信息。 • 因此,博弈过程不仅是参与人选择行动的过程, 而且是参与人不断修正信念的过程。
不完全信息动态博弈
有偏好的早餐。软弱型假装成粗暴型而避免冲突,获得更高利润。
b,1 D [p] Q
D 0,1 B [q]
b+d,0 0,-1
N R
D [1-p] Q
N
0.1
N
0.9
N d,0 R D b,-
1 B [1-q]
N
信号博弈的完美贝叶斯均衡
斯彭斯的劳动力模型
考察下面的信号博弈模型(斯彭斯,1974):在模型中,有两个参 与人,一个雇主和一个雇员,记雇员为参与人1(信号发送者),雇 主为参与人2(信号接收者),雇主是不知情的参与人。博弈顺序为:
,不偏好的早餐价值为0,而避免冲突价值
。
对接收者来说,与软弱型(粗暴型)冲突的支付为
1(-1),所有其他支付为0。
“啤酒和热狗”信号博弈
在啤酒和热狗博弈中,
是发送者的一个分离策略,这里
代表在发送者是软弱类型的情况下,选择热狗。如果 ,那
么,发送者的策略
和接收者的策略
以及后验概率
和 是这个博弈的完美贝叶斯均衡。这里 代表在发送 者选择热狗的情况下,接收者选择冲突,也可以类似地解释 。
不完全信息动态博弈
1.1.1 基本概念
不完全信息意味着至少有一个参与人拥有私人信息, 通常用类型表示拥有不同私人信息的参与人,类型由“ 自然”或“上帝”给定。
博弈顺序: (1)“自然”选择参与人的类型,并 将类型告诉参与人自己,不告诉其他参与人,只将类型 分布告诉其他参与人;(2)参与人开始行动,参与人 的行动有先有后,后行动者能观察到先行动者的行动, 而不能观察到先行动者的类型。
(surly);B代表啤酒,Q代表热狗;D代表与发送者冲突(duel),
N代表不与发送者冲突。 [p]表示当接收者接收到信号 后,认为发
不完全信息动态博弈
创立目的就是和波音这样已成规模的公司竞争。
波音早于空客成立,所以当欧洲各国抢占市场时,波音早
已在欧洲站稳脚跟。波音公司先进入市场,就可能出现两种情
况——波音公司是一个“无先发优势”的企业,也可能是一个
“有先发优势”的企业。
第5页
2
波音与空客之战
第五章
不完全信息动态博弈
主要内容
第一节
不完全信息动态博弈
第二节
精炼贝叶斯纳什均衡
第三节
信号博弈
第四节
先验信念、策略互动、后验概率
第 2 页
第一节
不完全信息动态博弈
不完全信息动态博弈特点
波音与空客之战
第3页
1
不完全信息动态博弈特点
不完全信息动态博弈:指至少有一方参与者对于博弈的信息不是
完全了解,并且参与者的行动存在先后顺序。和不完全信息静态
由方程 2q1 q2 8 和 q1 2q2 8 可得:
q1=8/3,q2=8/3
在“无先发优势”条件下波音公司利润π(q1)=64/3,空客
公司利润为π(q2)=10/3。
也就是说,在波音公司是“无先发优势”条件下,空客
公司会选择生产,与波音公司竞争。
第 13 页
第二节
精炼贝叶斯纳什均衡
自己肯定选择策略R,所以对这个动态博弈来说,博弈路径必
定是甲选择策略T,乙选择策略R。
第 22 页
3
不可置信的威胁与可置信的威胁
不可置信威胁又称空洞威胁,是完全没有任何威胁作用的威
胁。比如在上述博弈中,乙为了让甲选择策略N,就对甲说,
如果不选择N,乙会选择策略L,局中人甲得益就是0,但甲选
讲义6不完全信息动态博弈
不完全信息动态博弈的模型假设可能受到现实世界的限制。例如,玩家可能不完全了解其他玩家的类型 或策略,而这些类型和策略可能随着时间的推移而改变。这需要进一步研究和改进模型假设。
应用挑战
01 02 03
实际应用中的信息不对称
在不完全信息动态博弈中,信息不对称是一个常见的问题 。例如,在金融市场中,投资者可能不完全了解公司的财 务状况或未来的市场趋势。这使得应用不完全信息动态博 弈更加困难,需要更多的数据和信息来建立准确的模型。
不完全信息博弈的未来研究方向
目前,不完全信息博弈的研究已经涉及许多复杂的问题和挑战,未来的研究需要进一步 拓展和完善该领域的基础理论和方法,以更好地解释和解决现实世界中的问题。
02
不完全信息动态博弈模型
静态博弈与动态博弈的区别
静态博弈
参与人在同时进行决策,且决策 前都不知道其他参与人的类型和 策略。
政策制定
公共资源分配
政策制定者可以利用不完全信息动态 博弈来分析公共资源的分配问题,如 教育、医疗、环保等领域的资源分配 。
税收政策
反垄断政策
不完全信息动态博弈可以用于分析企 业的垄断行为,为政策制定者提供制 定反垄断政策的依据。
政策制定者可以通过分析企业和个人 的博弈行为,来制定合理的税收政策 ,以达到社会福利最大化的目的。
讲义6不完全信息动态博弈
汇报人: 2023-12-15
目录
• 不完全信息博弈概述 • 不完全信息动态博弈模型 • 不完全信息动态博弈的求解方
法 • 不完全信息动态博弈的应用 • 不完全信息动态博弈的挑战与
未来发展 • 不完全信息动态博弈案例研究
01
不完全信息博弈概述
定义与特点
第六章 不完全信息动态博弈
6.3 不完全信息动态博弈的转换
在静态贝叶斯博弈中,处理不完全信息的办法是 将博弈方的信息差异解释为博弈方有不同的类型 (由可能的私有信息决定),并引入一个为博弈方选 择类型的虚拟博弈方,从而将不完全信息博弈转 化为完全但不完美信息动态博弈,即海萨尼转换。 这种处理方法同样适用于不完全信息动态博弈, 经过过海萨尼转化后,变成了多一个阶段的完全 且不完美信息动态博弈,因此,仍然可用完美贝 叶斯均衡来分析。
第六章 不完全信息动态博弈
Hale Waihona Puke 6.1 不完全信息动态博弈概念6.2 不完美信息动态博弈例子 6.3 不完全信息动态博弈的转换
6.1 不完全信息动态博弈概念
不完全信息动态博弈的概念
满足两个条件: (1) 博弈方选择行为时是有先后次序 (2) 不完全信息:至少有一个博弈方不 完全清楚其他博弈方的得益
6.2 不完美信息动态博弈例子
例1: 古玩市场上的“讨价还价” 例2: 英式或日式拍卖
以上两例中,对于标的物的估价是各自的私 有信息,对方无法知道,进而导致对各在各种情况 下的得意不清。
例3:求婚博弈。姑娘父母对小伙子的考验 程度过大,可能吓走小伙子,破坏女儿幸福, 但有希望进行一定的考验,以便验证其是否 真心。
07 不完全信息动态博弈
行为方行为
a1
声明方 类型
a2
1,1 2,0 1. 2. 3. 不同类型的声明方必须偏好行为方不同行为 对应声明方不同类型,行为方必须偏好不同行为 行为方的偏好必须与声明方具有一致性
t1 t2
2,0 1,1
不能传递信息(声明方 与行为方偏好相反)
练习
行为方行为
a1
声明方 t2 类型
t3
t1
0,1 0,0 0,0
信号博弈精炼贝叶斯均衡
1.信号接收方 R在观察到信号发出方 S的信号 m j 之后,必须有关于 S的类型 的判断,即 S选择 m j时, S是每种类型 ti的概率分布 p (ti | m j ) ≥ 0, ∑ p (ti |m j ) = 1
ti
2.给定 R的判断 p (ti | m j )和 S的信号 m j,R的行为 a * ( m j )必须使 R的期望得益 最大,即 a * ( m j )是最大化问题 max ∑ p (ti |m j )u R (ti , m j , ak )的解
引例2 引例2
N
[u ] 高
在位者 P=4 进入者 进 不进 进 进 不进 不进 进 P=6
底 [1 − u ]
P=5
P=4
P=5
P=6
进 不进
不进 进
不进
在位者的垄断利润情况 P=4 高成本 低成本 2 6 P=5 6 9 P=6 7 8
两企业同在市场的各自利润情况 均衡价格 高成本 低成本 5 4 在位者 3 5 进入者 3-2=1 1-2= -1
那么在第一阶段,低成本的甲权衡: 那么在第一阶段,低成本的甲权衡: 选择价格5 无法扭转乙的信念,甲的收益为14 14; 选择价格5,无法扭转乙的信念,甲的收益为14; 选择价格4 进一步揭示自己的低成本,则乙不进入,甲收益15 15; 选择价格4,进一步揭示自己的低成本,则乙不进入,甲收益15; 权衡比较选择价格4 权衡比较选择价格4 高成本的甲则需要权衡: 高成本的甲则需要权衡: 选择价格为6,导致乙坚定的进入市场,甲收益为10 选择价格为 ,导致乙坚定的进入市场,甲收益为 选择价格5,乙无法修正先验概率则进入,甲收益为9 选择价格 ,乙无法修正先验概率则进入,甲收益为 选择4不划算 选择 不划算 权衡比较选择价格6 权衡比较选择价格
第章不完全信息动态博弈
P( A1
/
B)
P( A1)P(B / A1) P( A1)P(B / A1) P( A2 )P(B /
A2 )
0.4 * 0.00001 0.4*0.00001 0.6*0.00243
0.0027
P( A2
/
B)
P( A2 )P(B / A2 ) P( A1)P(B / A1) P( A2 )P(B
❖ 假设国际市场飞机需求函数为:P = 10 – Q ❖ 其中:Q = q1 + q2。 ❖ 波音公司和空中客车公司的行动存在先后顺序。 ❖ 波音公司先进入市场,空中客车公司后进入市场。 ❖ 波音公司和空中客车公司都明确知道空中客车公司的生产函数。 ❖ 波音公司明确知道自己的生产函数,但空中客车公司不知道波
“无先发优势”的公司。 ❖ 波音公司“有先发优势”时,其成本函数为:C(q1) = q1。 ❖ 波音公司“无先发优势”时,其成本函数为:C(q1) = 2q1。 ❖ 空中客车公司的生产函数没有不确定性。 ❖ 空中客车公司的生产函数为:C(q2) = 2q2。 ❖ 空中客车公司进入市场需要付出一个额外的固定成本。
企业生产过程中“规模经济”(Economy of Scale)特征 越发明显。生产规模越大,企业生产成本越低。 ❖ 规模经济的生产模式催生不完全竞争的市场结构。 ❖ 具有规模经济生产特征的企业越做越大,逐渐在市场中占据一 定垄断地位,进而打破完全竞争的市场结构,产生垄断竞争、 寡头、甚至垄断等不完全竞争的市场结构模式。
❖ 先验概率形成后,根据之后得到信息对先验概率进行修正, 得到后验概率。
❖ 贝叶斯公式是连接先验概率和后验概率的桥梁。
一、贝叶斯公式
❖ 贝叶斯公式(逆概公式):设试验 E 的的样本空间为 Ω。 事件 A1,A2,…,An 构成样本空间 Ω 的一个划分(或构成 一个完备事件组),且 P(Ai) > 0,(i = 1,2,…,n) 则对任意一个事件 B(P(B) > 0),有:
@第7章 不完全信息动态博弈
三 、 信 号 博 弈
1. 行为传递的信息和信号机制 2. 信号博弈模型和完美贝叶斯均衡 3. 股权换投资 4.劳动市场信号博弈
行为传递的信息和信号机制
• 萨摩亚岛居民的文身;波那佩岛的山药;孔雀开屏; 蛙鸣 • 信号:经济或其他活动中具有信息传递作用的行为 • 信号机制:通过信号传递信息的过程 • 信号发出方:通过行为传递信息的一方 • 信号接收方:获得信息的一方 • 二手车模型中昂贵的承诺
连续型声明博弈
• 声明方类型标准分布于区间[0,1],即T=[0,1],行为方 的行动空间A= [0,1]。 • 声明方得益函数 ,行为方得益函 数 。 (t , a ) = −[a − (t + b)] U U (t , a ) = −(a − t )
2 S
2
R
可以看出,当声明方类型为t时,声明方最希望的行为 方行为是 ,而行为方对自己最有利的行动是 。
(一)声明的信息传递作用
二 、 空 口 声 明 博 弈
•声明 声明:消费者偏好,企业新闻发布会,国家间威胁恐吓。 声明 •声明不直接影响事物、利益,但往往影响接受声明者行为, 通过接受声明者行为对利益产生影响。 •声明无或几乎无成本,接受者不一定采取有利于声明者的 行为,因为双方利益往往不一致,因此声明的真实性没有保 证。接受者不会轻易相信声明。 •声明的影响取决于接受者的理解、判断和反应。 •当声明者和接受者利益一致或没有冲突时,声明会使接受 者相信。房客声明不喜欢暖气太足房东会相信;工人提出有 恐高症不适合高空作业雇主会相信;顾客喜欢甜或咸厨师会 相信。工人声明自己高素质雇主并不会轻易相信因为相信。
一、不完全信息动态博弈的海萨尼转换
二、空口声明博弈 三、信号博弈 四、不完全信息下的谈判博弈 五、有限次重复囚徒困境中的声誉模型
第五章-不完全信息动态博弈2全篇
最优垄断价格 MR=MC p实<p垄
✓这一现象的一个老的解释是:若价格等于垄断价格,其他企 业看到有利可图,就会进入;相反,若价格低一些,其他企 业看到进入无利可图,就不会进入,垄断企业就可以继续保 持其垄断地位。 ✓结论:价格作为一种承诺是不可置信的,因为不论垄断者现 在索取什么价格,一旦其他企业进入,垄断者就会改变价格, 因此,靠低价格是不可能阻止进入的。 ✓米尔格罗姆和罗伯茨(1982)提出的解释是,垄断限价可能 反映了这样一个事实,即其他企业不知道垄断者的生产成本, 垄断者试图用低价格来告诉其他企业自己是低成本,进入是 无利可图的。
p( 1)
p( 1) 0 p( 2 )
1
p( 1 | m2 )
p(m2
p(m2 | 1) p( 1) | 1) p( 1) p(m2 | 2 ) p( 2 )
(1 ) p( 1) (1 ) p( 1) 1 p( 2)
(1 ) p(1) (1 ) p(1) (1 ) p( 2 )
7
1、分离均衡(separating equilibrium)
✓分离均衡(separating equilibrium):不同类型的发送者(参 与人1)以1的概率选择不同的信号,或者说,没有任何类型选择 与其他类型相同的信号。 ✓假定K(类型数)=J(信号数)=2,则分离均衡(SE)意味着: 若m1是类型θ1的最优选择,m1就不可能是θ2的最优选择,并且, m2一定是类型θ2的最优选择。即:
p( 1)
p( 2 | m2 )
1 p( 2 )
1 p( 2 ) p( 2 )
(1 ) p( 1) 1 p( 2 ) p( 1) p( 2 )
(见到m2信号, 2的后验概率将大于先验概率)
不完全信息动态博弈
4 不完全信息动态博弈4.1 精炼贝叶斯均衡概述不完全信息动态博弈就其基本要素来看是不完全信息与博弈的动态性质的一种综合。
在处理不完全信息要素时,通过将某些参与人“类型”的不确定性作为信息不完全性的一种表征,这种方法将继续得以采用,即博弈中参与人面临的信息不完全性(无论它是指何种信息)将完全由某些参与人的“类型”的不确定性加以刻画。
同时,作为动态博弈,“序贯理性”的思想将一直得到贯彻。
我们在不完全信息动态博弈中将信息不完全程度削减到零,则不完全信息动态博弈就自然应退化成一种完全信息动态博弈,其相应的精炼均衡概念就由精炼贝叶斯回到子博弈精炼均衡。
从这种意义上来看,不完全信息动态博弈的精炼均衡概念是子博弈精炼均衡概念的一种推广,正如不完全信息动态博弈应被视作完全信息动态博弈的一种推广一样。
例简单的非完全信息动态博弈Nt1(p) t2 (1–p)1 1L R L R2 2L R L R L R L Ru1u1u1u1 u1u1u1u1u2u2u2u2 u2u2u2u2参与人1的类型t 为个人信息。
参与人2 不知道t ,但知道t 的概率分布。
博弈的时序:(1)参与人1选择行动a 1 A 1;(2)参与人2观察a 1,选择a 2 A 2博弈的收益: u 1 (a 1, a 2, t ), u 2 (a 1, a 2, t )精炼贝叶斯均衡博弈的纳什均衡是一种“僵持”状态的战略组合,当所有的参与人都选择该战略组合中给出的相应战略时,任何一个参与人都不会有单方面偏离这一选择的动机。
作为动态博弈,一个战略是参与人在其可能进行行动选择的所有信息集上将作何选择的一整套规定或计划,而作为不完全信息博弈,这种规定或计划还是“类型依存”的,即不同类型的参与人将选择不同的战略规定。
因此,一个不完全信息动态博弈的纳什均衡将是指这样的一种类型依存性的战略组合(或战略组合的族),当给定其他参与人的战略时(其他参与人的战略是类型依存的,所以,说给定其他参与人的战略即指给定其他参与人的战略与类型的依存关系),任一参与人在其任何类型下由该组合给出的类型依存战略是其最优的。
博弈论7不完全信息动态博弈概论
❖ 定义:精炼贝叶斯均衡s*(t)=( s*1 (t1), …, s*n
(tn))是一个战略组合,和一个后验概率组合
p ( p1, p2 , , pn ) ,满足:
(1) 对于所有的参与人i,在每一个信息集h,
arg max si*(si ,ti )
pi (ti aih )ui (si , si , ti )
❖ 即在每一个信息集中应该行动的参与者(以及参与者 随后的战略),对于给定的该参与者在此信息集中的 推断,以及其他参与者随后的战略必须是最优反应。
❖ 要求1意味着如果博弈的进行达到参与者2的非单节 信息集,则参与者2必须对具体到达哪一个节(也就 是参与者1选择了L还是R)有一个推断。这样的推断 就表示为到达这两个节的概率p和1-p。
❖ 当参与人 i在他的某个信息集h上观察到其他
n-1个参与人行动组合 ahi ,条件概率 , pi (ti | ahi ) 是参与者i在观察到 ahi 的情况下,
对参与者的类型t-i的修改,这个修正产生
pi (ti | ahi )的推断称为后验概率
❖ 在例1图7-1中,设R(t11),R(t12)是参与人1的 两个战略。从而该博弈表示为完全但不完美
❖ 假定i属于类型tk的先验概率为
K
p(tk ) 0, p(tk ) 1 k 1
❖ 给定i属于tk,i选择ah的条件概率为
p(ah tk ), p(ah tk ) 1 h
❖ 则i选择ah的全概率是:
❖ 根据概率公式,观测到i选择了行 动ah,i属于类型tk的后验概率为:
p(ah tk ) p(tk ) p(ah t k ) p(t k )
❖ 参与人的行动是类型依存的,每个参与人的 行动都传递着有关自己类型的某种信息,
博弈的四种基本类型
博弈的四种基本类型和四种关系1.完全信息静态博弈:参与者的信息完全公开,所有参与者同时做出决策。
例如,囚徒困境。
2.完全信息动态博弈:信息完全公开,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争。
3.不完全信息静态博弈:参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈。
4.不完全信息动态博弈:信息不完全公开,参与者的决策有先后顺序。
例如,信号传递博弈。
每种类型的定义和特点:完全信息静态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,所有参与者同时做出决策。
例如,囚徒困境是一个典型的完全信息静态博弈,其中两个罪犯在审讯时选择坦白或不坦白。
完全信息动态博弈:在这种类型的博弈中,所有参与者的信息和收益函数都是公开的,但参与者的决策有先后顺序。
例如,斯坦科尔伯格寡头竞争模型中,企业先后决定产量,后行动的企业可以根据先行动企业的决策来调整自己的策略。
不完全信息静态博弈:在这种类型的博弈中,参与者的信息不完全公开,所有参与者同时做出决策。
例如,性别战博弈中,两个参与者不知道对方的策略,只能根据自己的猜测做出决策。
不完全信息动态博弈:在这种类型的博弈中,参与者的信息不完全公开,决策有先后顺序。
例如,信号传递博弈中,先行动的企业可以通过发送信号来影响后行动企业的决策。
博弈的四种关系一、零和博弈定义:在零和博弈中,参与各方的利益总和是固定的,一方的收益必然意味着另一方的损失,所以双方的收益和损失之和为零。
举例:在扑克游戏中,赢家赢得的钱与输家输掉的钱数量相等,这就是典型的零和博弈。
你赢了一定数量的筹码,就意味着其他玩家输了同样数量的筹码,整个游戏过程中筹码的总量并没有增加或减少。
二、正和博弈定义:正和博弈也称为合作博弈,是指参与各方的利益总和大于零,即通过合作可以实现共赢的局面。
举例:企业之间的合作研发项目,各方共同投入资源,研发成功后,每个参与企业都能获得比单独行动时更多的收益。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2的信息集在均衡 路径上
1
均衡(M,U)中,2的推断 一定是:给1的均衡战
略M,参与者2知道已
经到达了信息集中的哪 一个节,即p=1。
L M
精炼贝叶斯均衡为{M,U;p=1}
R
精炼贝叶斯均衡是均衡战略和
p
2
1-p 均衡信念的结合
(1,3)
U
B
B
U
(2,1)
(0,0)
(0,2)
(0,1)
设想存在一个混合战略均衡,其中参与者1选择M 的概率为q1,R的
后验信念:参与人根据贝叶斯法则和均衡战略修正后验 概率
后续博弈:从每个信息集开始的博弈的剩余部分称为一 个后续博弈。
一、精炼贝叶斯均衡
引入精炼贝叶斯均衡的目的是为了进一步强化(即加强对 条件的要求)贝叶斯纳什均衡,这和子博弈精炼纳什均衡 强化了纳什均衡是相同的。
如果参与者的战略要成为博弈的一个精炼贝叶斯均衡,它 们不仅必须是整个博弈的贝叶斯纳什均衡,而且还必须构 成每一个后续博弈的贝叶斯纳什均衡。如果参与者的战略 要成为一个子博弈精炼纳什均衡,则它们不仅必须是整个 博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。
(2,0
(8,0)
θ<1/2,下列战略组合是一个贝叶斯均衡:不论在位者选 择什么价格,进入者总是认为在位者高成本概率为 θ*<1/2 ,总是选择不进入;高成本在位者选择p=6,低成 本在位者选择p=5。
该均衡是否合理?——均衡中包含不可置信的战略。
一个合理均衡应满足如下要求:给定每个参与人有关其 他参与人类型的后验信念,参与人的战略组合在每个后 续博弈上构成贝叶斯均衡。
➢ 后行动者通过观察先行动者的行动来推断其类型或修正对其 类型的先验信念(概率分布),然后选择自己的行动。
一、精炼贝叶斯均衡
➢ 先行动者预测自己的行动将被后行动者所利用,就会设 法传递对自己最有利的信息,避免传递对自己不力的信 息。
➢ ——博弈过程不仅是选择行动的过程,也是参与人修正 信念的过程。
参与人2在自己信息 集,轮到选择的博 弈方必须具有一个 关于博弈达到该信 息集中每个节点可 能性的“判断”。
1
L M p
(1,3)
U
给定该信念,2的行动必须是最优的 (给定该信念,2的战略选择在后续博 弈上构成贝叶斯均衡)。
2选择U的期望支付为1*p+2*(1-p)=2p
2选择B的期望支付为0*p+1*(1-p)=1-
例,张三与李四的博弈 ➢ 张三恃强凌弱,第一次与李四见面,不知李四强弱。但
对李四类型有先验概率{0.8.0.2} ➢ 张三通过观察李四吃辣椒的数量修正李四强弱的看法
(后验概率),并以此确定对李四的态度
一、精炼贝叶斯均衡
➢ 李四预测到这一点,即使生性懦弱,也会强迫自己吃辣 椒,以传达对自己有利的信息。
精炼贝叶斯均衡是对贝叶斯均衡的精炼,也是子博弈思想 在不完全信息博弈中的推广,它本身是纳什均衡。
二、不完美信息博弈的精炼贝叶斯均衡
1
L M
R
2 (1,3)
U
B
B
U
(2,1)
(0,0)
(0,2)
(0,1)
二、不完美信息博弈的精炼贝叶斯均衡
L 1M
R
2
U
B
1,3
1,3
2,1
0,0
0,2
0,1
该博弈存在两个纯战略NE: (M,U);(L,B)
(M,U);(L,B)同样是子博弈 精炼纳什均衡
(L,B)却又明显要依赖于一个不可信的威胁:如果轮到参 与者2行动,则选择 U优于选择B,1便不会由于2威胁他将 在其后的行动中选择B,而去选择L
在信息完全但不完美的博弈中,尽管(L,B)是SPNE,它依 赖一个不可信的空头威胁,应该从合理的预测中排除。
➢ 两种结果:
——懦弱李四不吃辣椒,强悍李四吃辣椒且吃的足够多, 使得懦弱李四不敢模仿。张三能够区分李四类型并选择 是否欺负李四。
——两类李四都吃同样多辣椒,张三不能从李四吃辣椒行 为中推出自己的信息,维持对李四的类型的先验信念{0.8, 0.2}
在位者的价格选择中包含关于 其类型的信息,进入者可据此 修正对在位者类型的先验信念 →在位者行动时必须考虑价格
不完全信息动态博弈
精炼贝叶斯均衡 不完美信息博弈的精炼贝叶斯均衡 信号博弈
一、精炼贝叶斯均衡
不完全信息博弈
➢ “自然”选择参与人类型,参与人自己知道,其他参与人不 知道;
➢ 自然选择之后,参与人开始行动,行动有先后顺序,后行动 者能观察到先行动者的行动,但不能观察到先行动者类型。 (先行动者行动类型依存,每个参与人行动都传递着关于自 己类型的某种信息)
p<2-p 2选择U。 给定2的后续战略(1
R 1-p
知道2选择U),1的 最优选择是M
2
2如果观察到1没
有选择L,则2一定
知道1选择了M,
B
B 于是有p=1
U
(2,1)
(0,0)
(0,2)
(0,1)
要求3: 在处于均衡路径之上的信息集中,推断由贝叶斯 法则及参与者的均衡战略给出。
定义 :对于一个给定的扩展式博弈中的均衡,如果博弈按 照均衡战略进行时将以正的概率达到某信息集,我们称此 信息集处于均衡路径之上。反之,如果博弈根据均衡战略 进行时,肯定不会达到某信息集,我们称之为不在均衡路 径上的信息集。(其中“均衡”可以是纳什、子博弈精炼、 贝叶斯以及精炼贝叶斯均衡)
完全信息条件下,若在 位者高成本——“进 入”;若在位者低成 本——不进入
选择的信息效应
单阶段最优垄断
古诺均衡下的价格
价格
N
假设低成本在
高 θ 在位者
低 1-θ
位者不会选择 P=6,结果会 怎样?
P=4 P=5
P=6
P=4 P=5
P=6
进入者
进 不进 进 不进 进 不进 进 不进 进 不进进 不进
(3,1) (7,0) (3, 1) (7,0) (3, 1) (7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
精炼贝叶斯均衡
➢ 要求1:在每一信息集中,应该行动的参与者必须对博弈 进行到该信息集中的哪个节有一个推断。对于非单节信息 集,推断是在信息集中不同节点的一个概率分布;对于单 节的信息集,参与者的推断就是到达此单一决策节的概率 为l。
➢ 要求2: 给定参与者的推断,参与者的战略必须满足序贯 理性的要求。即在各个信息集,给定该信息集上概率分布 和其他参与人的后续策略,参与人的行动必须是最优的。