完全但不完美信息动态博弈

合集下载

第五讲 完全但不完美信息动态博弈

第五讲 完全但不完美信息动态博弈


p( g | s)
p( g ) p(s | g ) p( s)


p( g ) p( s | g ) p( g ) p( s | g ) p(b) p( s | b)
再由
p b s 1 - p g s 求 p b s
24
完美贝叶斯均衡
5.2 完美贝叶斯均衡
36
5.3.3 模型的纯策略完美贝叶斯均衡

有了完美贝叶斯均衡的概念就可以讨论如何通过逆推归纳 法来求解。 (逆推归纳法的依据:1.理性选择 2.最优性原理)

例1
单一价格二手车交易模型(市场部分成功):假设差车 出现的概率 很小,此时好车多,( V>P>W),差车伪 pb 装费 C 相对于 P 很小(好坏车差距不大)

注意:这个例子仅是完全不完美的一种情况! 比如: 在动态博弈中,只要有一个博弈方看不到自己选择 前其它某一博弈方的行为就能构成一个不完美信息的动 态博弈。

概念和例子
6
5.1.2 不完美信息动态博弈的表示

完美信息的动态博弈可用有根树来表示(用逆推法 求解),那么不完美信息 动态博弈该如何表示呢?

车况的好坏直接影响到买卖双方的策略选择
单一价格二手车交易博弈模型
32
5.3.2 单一价格二手车交易均衡类型



二手车交易有许多可能的结果,什么情况是好,什么情况 是差呢,如下给出几种不同的市场均衡。 一般的,根据市场效率将市场分为四种: 市场完全失败——好的产品(存在潜在利益)也不敢投 入市场(相当于无市场)。 市场完全成功——只有好的产品投入市场,而买方买下 所有产品实现利益 市场部分成功——好、坏皆投入,买方好坏都买(有损 失和得利) 市场接近失败——所有好的和部分坏的,而买方以一定 概率买入 问题:讨论不同市场中 V, W, P, C 的组合

第六章完全但不完美信息动态a总结

第六章完全但不完美信息动态a总结
第六章

完全但不完美信息动态博弈



不完美信息动态博弈 完美贝叶斯均衡 单一价格二手车交易 双价二手车交易模型 昂贵的承诺
1
2019/1/9
6.1

不完美信息动态博弈


概念 多节点信息集和不完美信息动态博弈的表示 多节点信息集和子博弈
2
2019/1/9
6.1.1

概念

完美信息动态博弈:完全了解自己行为之前博弈 进程的博弈方称为“完美信息的博弈方”,如果 一个动态博弈中所有博弈方都是具有完美信息的, 该博弈就为“完全信息动态博弈”。 由于保密或信息不灵等原因,许多动态博弈中后 行为的某些博弈方无法看到在自己行为之前其他 博弈方的选择-“不完美信息动态博弈”。
2019/1/9
子博弈的含义:
1、2对完全完美和完全不完美是同样的约束。 3则针对完全不完美而言。 3说明框出的部分不能作为子博弈 1 L R 原因在于它分割了节点3的信息集 2 2 因为到达3的路径有两条 LL,RL L R L R 可知的信息是2选L,而1选R 3 还是L的可能性都存在。

6
2019/1/9
6.1.2多节点信息集和 不完美信息动态博弈的表 示
0
好天气75% 坏天气25%
1
水路 陆 路 -10 000 水 路 -16 000
陆路
-10 000
-7 000
7
2019/1/9
6.1.2多节点信息集和 不完美信息动态博弈的表 示


由于1不知0的选择,他所能知道的仅是一个以 历史根据为依据的一个概率。而他在选择时无 法知道0的确切情况,所以将第二层的两个结点 结合起来表示这个博弈过程。于是产生四种可 能的结果(好,水)(好,陆)(坏,水) (坏,陆)。 注意!此处仅有1的收益,而0的收益本身并无 意义。此为一个完全不完美信息的动态博弈。

博弈论谢识予第四五章参考答案

博弈论谢识予第四五章参考答案

第四章参考答案2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。

在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。

这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。

3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。

从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次16重复博弈中无法直接运用,因为没有最后一次重复。

因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。

此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。

从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。

例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。

两类重复博弈民间定理的差异也说明了这一点。

最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。

上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。

6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。

这两个纳什均衡的得益都帕累托劣于(B,S)。

一次性博弈中效率较高的(B,S)不可能实现。

第三讲非合作博弈的解:(4)

第三讲非合作博弈的解:(4)

例子:斯坦伯尔伯模型。两个厂商垄断某个市场,其中厂商 1处于支配地位,它先行动,然后从属企业2后行动。假定 市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是 企业1和2的公共知识。问:厂商1和2是如解。
假定厂商1和2所决定的产量分别为q1,q2。 企业2后行动,对于企业1的任何行动,即任意给定的产量,
• 例子:假定甲在开采一个价值4万元的金矿时需要1万元 资金,乙有1万元资金。甲向乙借钱来开金矿。在这个 博弈的第一阶段,甲向乙承诺: 如果乙借钱给他的话, 那么他就会将采到的金子与乙对半分成,即(2,3)—— 乙得到2万元的金子,同时收回自己的1万元投资。对于 甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止, 双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进 入第二个阶段。在第二阶段中,若甲遵守他的承诺,分 给乙一半的金子,这样两人的收益为(2,3),其中1万 元为投资成本。然而,若甲违背自己的承诺,博弈就会 进入到第三个阶段: 如果乙同甲打官司,那么由于打官 司费时费力, 两个人的收益为(0,1);若乙不打官司, 那么两个人的收益就为(5,0)。
安娜
2 1
鲍伯
1 4
安娜
4 3 蜈蚣博弈
鲍伯 2n+1
3 6
安娜 鲍伯
2n+2
2n 2n-1
2 n-1 2 n+2
• 这个博弈有两个参与人安娜和鲍伯。该博弈从安娜开始,她有两 个策略“合作”和“不合作”,若她选择“不合作”,博弈即刻 终止,安娜得到2,鲍伯得到1;若她选择“合作”,那么博弈继 续进行,由鲍伯开始选择。鲍伯同样有“合作”和“不合作”两 种策略。在这第二轮选择中,若鲍伯选择“不合作”,博弈终止, 选择“合作”,博弈继续进行……在这个博弈最后一轮,即第2n 轮,若鲍伯选择“不合作”,他所得2n+1,安娜得2n-1;若他选 择“合作”,鲍伯得2n+1安娜得2n+2。

博弈论基础读书笔记三完全信息动态博弈和逆向归纳法

博弈论基础读书笔记三完全信息动态博弈和逆向归纳法

博弈论基础读书笔记三完全信息动态博弈和逆向归纳法第⼆章完全信息动态博弈先来说明两个概念:1、是指在博弈中,参与⼈同时选择或虽⾮同时选择但后⾏动者并不知道先⾏动者采取了什么具体⾏动。

2、是指在博弈中,参与⼈的⾏动有先后顺序,且后⾏动者能够观察到先⾏动者所选择的⾏动。

这⼀章,我们来讨论关于完全信息(即参与者的收益函数是共同知识的博弈)动态博弈的问题。

在这⾥我们还将博弈分为两种:完美信息博弈:即要选择⾏动的参与者完全知道这⼀步之前所有的博弈过程。

完全但不完美信息博弈:即要选择⾏动的参与者不知道这⼀步之前的博弈过程。

进⾏这章之前先简要的解释⼀些东西:所有的动态博弈的中⼼问题都是可信任性。

下⾯给⼀个经典的⼿雷博弈的例⼦:第⼀,参与者1可以选择⽀付1000美元给参与者2或者是⼀分不给。

第⼆,参与者2观察参与者1的选择,然后决定是否引爆⼀颗⼿雷将两个⼈同炸死。

如果参与者2威胁参与者1如果他不付1000美元就引爆⼿雷,如果参与者1相信这个威胁,则最优选择是⽀付1000美元。

但参与者1却不会对这⼀威胁信以为真,因为它不可置信(参与者2不会蠢到因为1000美元⽽同归于尽,⾄于参与者1考虑参与者2是不是疯⼦的情况在第三章讨论)。

这个例⼦就是典型的完全且完美信息博弈。

在2.1节我们将在后⾯使⽤逆向归纳解,来求解这个问题。

在2.2节我们会丰富前⼀节的博弈模型使之成为完全但不完美博弈,我们会定义这种博弈的⼦博弈精炼解,它是逆向归纳法的延申。

在2.3节研究重复博弈,即多次重复⼀个给定博弈。

这⾥分析问题的中⼼使(可信的)威胁和对以后做出的承诺对当前⾏为的影响。

在2.4节中我们介绍分析⼀般的完全信息动态博弈所需要的⼯具。

不再区别信息是否是完美的。

本节和本章的重点都在语⾔,⼀个完全信息动态博弈可能会有多个纳什均衡,但其中⼀些均衡或许包含了不可置信的威胁和承诺,⼦博弈精炼纳什均衡则是通过了可信检验的均衡。

看到这⾥你可能还是⼀头雾⽔,但是⽆所谓,让我们⼀节⼀节的来讲,看到最后你在回头看前⾯的总结可能会更有利于你对本章的理解。

完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子完全信息博弈和不完全信息博弈是博弈论中常见的两种博弈模型。

在完全信息博弈中,参与者对对手的策略和利益有完全了解,而在不完全信息博弈中,参与者对对手的策略和利益了解不完全。

下面将给出10个例子来说明这两种博弈模型。

1. 完全信息博弈:象棋对局象棋是一种典型的完全信息博弈。

在游戏开始之前,双方玩家对对手的棋子摆放和可能的走法有全面的了解。

每一个棋子的能力和走法都是公开的,玩家可以根据对手的走法进行推理和决策。

双方都可以清楚地看到棋盘上的所有信息,这使得象棋成为一个完全信息博弈的范例。

2. 完全信息博弈:扑克牌游戏扑克牌游戏是另一个典型的完全信息博弈。

在游戏开始之前,玩家可以看到自己的牌和公共牌,可以推断其他玩家手中可能的牌型。

玩家可以根据对手的表情、下注行为和牌型推断对手的策略,并做出相应的决策。

3. 完全信息博弈:国际象棋比赛国际象棋比赛是另一个典型的完全信息博弈。

在比赛开始之前,双方选手可以看到对手的棋子摆放和可能的走法,可以根据对手的走法进行推理和决策。

选手可以通过分析对手的行为和棋局的发展,制定出相应的策略。

4. 完全信息博弈:囚徒困境囚徒困境是博弈论中著名的例子。

在这个博弈中,两个囚犯被关押在不同的牢房中,检察官给每个囚犯提供了一个交代罪行的机会。

如果两个囚犯都选择交代,那么他们都会被判刑。

如果两个囚犯都选择保持沉默,那么他们都会被判轻刑。

如果一个囚犯交代而另一个保持沉默,那么前者将获得豁免,后者将被判重刑。

这个博弈的特点是,双方玩家知道对方的利益和策略,并可以根据对方的策略做出自己的决策。

5. 完全信息博弈:足球比赛足球比赛是一种典型的完全信息博弈。

在比赛开始之前,双方球队都可以看到对方的阵容和战术,可以根据对手的策略进行相应的调整。

球队可以根据比赛的进展和对手的表现,调整自己的战术和策略。

6. 不完全信息博弈:扑克牌对局尽管扑克牌游戏可以被看作是完全信息博弈的例子,但在某些情况下,扑克牌对局也可以被看作是不完全信息博弈。

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈

第三章完全且完美信息动态博弈在动态博弈中,参与者需要根据对手的行为和策略来调整自己的行动,以便达到最佳的结果。

动态博弈可以分为完全信息动态博弈和不完全信息动态博弈。

完全信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,而不完全信息动态博弈则是指参与者不知道其他参与者的策略和收益函数。

在完全信息动态博弈中,参与者可以通过观察对手的行为来推断出对手的策略和收益函数。

这种博弈可以通过逆向归纳法来求解,即从博弈的阶段开始,逐步向前推导出每个阶段的最佳策略。

逆向归纳法是一种有效的求解完全信息动态博弈的方法,它可以帮助参与者找到最佳策略,从而实现最佳的结果。

然而,在现实世界中,完全信息动态博弈并不常见。

大多数博弈都是不完全信息动态博弈,参与者无法知道其他参与者的策略和收益函数。

在这种情况下,参与者需要通过观察对手的行为和策略来推断出对手的类型和收益函数。

这种博弈可以通过贝叶斯纳什均衡来求解,即参与者根据对手的类型和收益函数来选择自己的策略,以达到最佳的结果。

完全且完美信息动态博弈是指所有参与者都知道其他参与者的策略和收益函数,并且参与者能够观察到其他参与者的行为和策略。

这种博弈可以通过逆向归纳法和贝叶斯纳什均衡来求解,从而帮助参与者找到最佳策略,实现最佳的结果。

在完全且完美信息动态博弈中,参与者可以通过观察对手的行为和策略来推断出对手的类型和收益函数,从而调整自己的策略,以实现最佳的结果。

在完全且完美信息动态博弈中,参与者之间的互动是基于透明和预知性的。

每个参与者不仅清楚自己的策略选择和可能的收益,同时也了解其他参与者将如何根据这些信息做出反应。

这种透明度使得参与者能够做出更加精确的决策,因为他们能够预测对手的行动并据此调整自己的策略。

这种博弈的一个关键特点是,参与者之间的信息是对称的。

这意味着没有参与者拥有其他参与者所不知道的信息优势。

这种信息对称性使得博弈变得更加公平,因为它消除了信息不对称带来的不确定性。

第六章(完全但不完美信息动态博弈)

第六章(完全但不完美信息动态博弈)

在卖方选择卖的前提下,买方选择买既有赚的可 能(车况好),也有亏的可能(车况差),选择不买 当然肯定不会吃亏,但也失去了获得利益的机会。因 此,买方是否决定买还要对车况是好、差的概率做出 判断。
第二节 完美贝叶斯均衡
在完全且完美信息动态博弈中,子博弈完美性保
证了均衡策略中没有任何不可信的威胁或承诺的。而
第六章 完全但不完美信息动态
动态博弈中当后行为的博弈方不唯一地确知先行
为博弈方的行为时,称为“不完美信息的动态博弈”。
对于这类博弈,当各博弈方对博弈结束时每个博弈方
的得益是完全清楚的,称这种博弈为 “完全但不完 美
信息动态博弈”,或简称为“不完美信息动态博弈”。
即在给定此判断和“其他博弈方后续策略”的情
况 下,该博弈方其后的行为选择意在使自己的期望得益 最大。 条件3:在均衡路径上的信息集处,“判断”要 符 合贝叶斯法则和各博弈方的均衡策略。 条件4:在非均衡路径上的信息集处,“判断” 也 要符合贝叶斯法则和各博弈方在此处可能有的均衡策 略。 当一个策略组合及相应的判断满足这四个条件时 称为“完美贝叶斯均衡”。
在这里因为存在多节点信息集,包含这些多节点信息 集的博弈阶段不构成真子博弈,因此子博弈完美性要 求无法满足,也就无法完全排除不可信的威胁或承诺 无法保证均衡策略中所有选择的可信性,子博弈精炼
纳什均衡的概念失去了意义,因此必须发展新的均衡
概念。
一、完美贝叶斯均衡的定义
当一个策略组合及相应的判断满足如下四个条件 时,称其为 “完美贝叶斯均衡”。 条件 1:在各个信息集处,轮到选择的博弈方必 须有关于博弈达到该信息集中每个节点的可能性的 “判断”。 对多节点信息集,“判断” 就是博弈达到该信 息 集各节点的概率分布;对单节点信息集,“判断” 应 理解为达到该节点的概率为 l 。 条件2:给定轮到选择博弈方的“判断”,他的 后

6完全但不完美信息动态博弈概要

6完全但不完美信息动态博弈概要

叶斯法则,根据再次阻挠这一可观察到的行为,B认为A
属于高阻挠成本企业的概率变成

A属于高成本企业的概率=0.32(A属于高成本企业的
先验概率)×0.2(高成本企业对新进入市场的企业进行
阻挠的概率)÷0.744=0.086

这样,根据A一次又一次的阻挠行为,B对A所属类型
的判断逐步发生变化,越来越倾向于将A判断为低阻挠成
“对二手车车况的准确评估” 是消费者购买二手车时最关注的 因素(有93% 的受访者将该因素列为影响其购买行为的三大关键要素之 一) , 其次是
“透明合理的销售价格” (有83% 的受访者将该因素列为影响其 购买行为的三大关键要素之一) , 最后是
“二手车车型” (有51% 的受访者将该因
素列为影响其购买行为的三大关键要素之一) 。问卷调查结果从另一个侧面 也显示了信息不对称问题对二手车市场发展的限制有多么严重。
本企业了。
第二部分 汽车市场
第一节 不完美信息动态博弈 一、概念和例子 动态博弈中当后行为的博弈方不了解先行为博弈 方的部分或全部行为时,称为“不完美信息的动态博 弈” 。 对于这类博弈,当各博弈方对博弈结束时每个博 弈方的得益是完全清楚的,称这种博弈为 “完全但 不 完美信息动态博弈”,或简称为 “不完美信息动态 博
第二阶段卖方若选择 “不卖”,交易没有发生;
如果他选择“卖”,则进行到买方选择的第三阶段,
此时买方并不知道卖方的选择究竟是“好—卖”还是
1
“差—卖”,用多节点信息集表示这种不完美性。
第三阶段买方不能直接作出针对性的选择,他


必须对这个多节点信息集中各节点出现的可能性做 1
1
出判断。

完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子

完全信息博弈和不完全信息博弈例子一、完全信息博弈的例子:1. 战争博弈:两个国家之间的战争可以被看作是一个完全信息博弈。

在这种情况下,每个国家都知道对方的军事力量、资源和战略,因此可以做出相应的决策,例如增加军事投入、调整战略等。

2. 棋类游戏:例如国际象棋、围棋等,这些游戏中,双方玩家都知道对方的棋子位置和规则,因此可以通过计算和预测对方的行动来做出最佳决策。

3. 拍卖:拍卖是一个经典的完全信息博弈。

在拍卖中,卖家和买家都了解物品的属性、市场需求和竞争对手的出价,因此可以根据这些信息来制定自己的出价策略。

4. 投标竞争:在企业之间的投标竞争中,每个企业都知道自己的成本、竞争对手的能力和市场需求,因此可以根据这些信息来制定自己的投标价格和竞争策略。

5. 股票交易:在股票市场上,投资者可以根据公司的财务报表、行业趋势和市场预期来做出投资决策。

这些信息都是公开的,每个投资者都可以获得相同的信息。

6. 价格竞争:在一个完全竞争的市场中,所有的卖方都知道其他卖方的价格和产品质量,因此可以根据市场需求和成本来制定自己的价格策略。

7. 职业博弈:在职业生涯中,每个人都可以根据自己的技能、经验和市场需求来选择自己的职业方向和工作机会。

8. 选举竞争:在政治选举中,候选人可以根据选民的偏好、政策议程和竞争对手的策略来制定自己的竞选策略。

9. 赛车比赛:在赛车比赛中,每个车手都知道自己和其他车手的技术水平、赛车性能和赛道条件,因此可以根据这些信息来制定自己的赛车策略。

10. 模拟游戏:在模拟游戏中,玩家可以根据游戏中的规则、目标和对手的行动来制定自己的游戏策略,例如《模拟城市》、《模拟经营》等。

二、不完全信息博弈的例子:1. 扑克牌游戏:扑克牌是一个典型的不完全信息博弈。

每个玩家只能看到自己的手牌和公共牌,对手的手牌是未知的。

因此,玩家需要通过对对手的行动、下注和表情的观察来推测对手的手牌和策略,并做出相应的决策。

完全但不完美信息动态博弈博弈论

完全但不完美信息动态博弈博弈论

A不知道自然的选择;B不知道A的选择,知道自然的选择
房地产开发博弈
N


(1/2) (1/2)
A
A
开发
B
不开发 开发
BB
不开发
B

不开
不开
不开

(4,4) (8,0)(0,8)(0,0()-3,-3()1,0()0,1)(0,0)
A知道自然的选择;B知道A的选择,但不知道自然的选择
房地产开发博弈
0.75 3
(3)求解二手车交易
卖方


卖方
卖方

买方

不卖 (0,0) 不买 买

买方
不卖 (0,0)
不买
(2,1)
(0,0) (1,-1) (-1,0)
需要判断的是:卖方决定卖车时车况好、差的概率 p(g|s)、p(b|s) 已知先验概率 p(g)=0.5,p(b)=0.5
问题
能否从图上分析:车况好时,车主卖车的概率p(s|g) ? 车况差时,车主卖车的概率 p(s|b) ?
的车子占绝大多数,并且卖方伪装差车的费用C相对 于价格P很小,则下列策略组合和判断构成一个市场 部分成功的完美贝叶斯均衡:
(i)卖方选择卖,不管车子好差; (ii)买方选择买,只要卖方卖; (iii)买方的判断为p(g|s)= pg, p(b|s)= pb 。
卖方


卖方
卖方

买方

不卖 (0,0) 不买 买
Bayes法则正是人们根据新的信息从先验概率得 到后验概率的方法。
全概率公式和贝叶斯公式
设试验E的样本空间为s,A为E的事件,B1, B2,…,Bn为s的一个划分,且P(Bi)>0,则 全概率公式为:

博弈论原理 第4讲 完全但不完美信息动态博弈

博弈论原理  第4讲 完全但不完美信息动态博弈

要求2
给定各博弈方的“判断”,他们的策略必须是“序列理性”的。即在 各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略 ”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益 或期望得益最大。此处“后续策略”即相应的博弈方在所讨论信息集 以后的阶段中,针对所有可能情况如何行为的完整计划。
好 1
卖 2 买 不买 买 卖
1
差 1
不卖 0 ,0 不卖 0 ,0
不买
2,1 0,0 1,-1 -1,0
4.1.2 不完美信息动态博弈的表示
二手车问题的多节点信息集:
好 1 差
工商管理学院
School .Busi Admin
1
卖 2 买 2 ,1 不买 买 不买
1 卖
不卖 0 ,0 不卖 0 ,0
好 1
卖 2 不买 买 卖
1
差 1
不卖 0 ,0 不卖 0 ,0

不买
2,1 0,0 1,-1 -1,0
工商管理学院
School .Busi Admin
有了这些信息或判断,买方或卖 方就能对自己获利的机会、损失 风险的大小程度心中有数,从而 作出正确的判断和选择。 在这个博弈中双方决策需要的信 息或判断与双方的选择有关,两 个博弈方的选择、信息和判断之 间形成了一种复杂的交互决定关 系。
工商管理学院
School .Busi Admin
子博弈完美 纳什均衡
在完全且完美信息动态博弈中,满足子博弈完美纳什均衡。其 中引入子博弈、可信性概念,由此才可保证在一定的条件下解 的存在性。对动态而言这种均衡策略组合必须有一定的可信性 加以保证(确保其为均衡,某种最优性)。理想的均衡必须能
够排除任何不可信的威胁和诺言。

经济博弈论判断题

经济博弈论判断题

判断下列表述是否正确,并作简单讨论:(1)如果一博弈有两个纯策略纳什均衡,则一定还存在一个混合策略纳什均衡。

(2)上策均衡一定是帕累托最优的均衡。

(3)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。

(4)完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程,但清楚博弈的得益。

(5)囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

(6)帕累托上策均衡一定是上策均衡。

(7)风险上策均衡一定是上策均衡。

(8)上策均衡一定是纳什均衡。

(9)纳什均衡的一致预测性质是指不同博弈方的预测相同、无差异。

(10)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

(11)严格下策反复消去法不会消去任何上策均衡,但却可以简化博弈。

(12)严格下策反复消去法把严格下策消去时,不会消去纳什均衡。

(13)多重纳什均衡不会影响纳什均衡的一致预测性质。

(14)纯策略纳什均衡和混合策略纳什均衡都不一定存在。

(15)在动态博弈中后行为博弈方有更多信息,可减少决策的盲目性,并作有针对性的选择,因此总处于较有利的地位。

(16)在动态博弈中先行为博弈方可以抢先采取有利于自己的行为,因此一定有行动优势。

(17)子博弈完美纳什均衡能够排除均衡策略中不可信的行为(威胁或承诺)因此具有真正的稳定性。

(18)子博弈完美纳什均衡和逆推归纳法并不能解决动态博弈分析的所有问题。

(19)子博弈完美纳什均衡和逆推归纳法能解决动态博弈分析的所有问题。

(20)重复博弈能否促进博弈方更合作和提高博弈效率,取决于原博弈的结构和重复博弈次数。

博弈论8 完全但不完美信息动态博弈PPT课件

博弈论8 完全但不完美信息动态博弈PPT课件

2
(0,0) (0,0)
买 不买
买 不买
(P, V-P) (0, 0) (P-C, W-P) (-C, 0)
➢ 买方在自己的决策信息集 处选择“不买”的期望得益:
单一价格二手车交易
E2 = 0.
Cont…
第一阶段: 由于P<C, 卖方伪装成好车然后卖掉仍然要亏损,理性的卖方不卖差
车,但车好时,卖方总选择卖。
➢ 市场完全成功:只有质量好的商品才被卖,而质 量差的卖方不敢卖,买方选择买。市场上的商品 都是好的
➢ 市场部分成功:所有卖方不管商品好坏都卖,买 方不管商品好坏都买,交易总是能够完成
➢ 市场接近失败:所有好商品都被投放在市场,只 有部分坏商品被投放,但买方按一定概率购买市 场上的商品
二、均衡类型
合并均衡 分开均衡
混成均衡
8.1.3 模型的纯策略完美贝叶斯均衡
一、市场部分成功的(纯策略)完美贝叶斯均衡(合并均衡) 如果V>P>W,P>C, 并且pb很小
(纯策略)完美贝叶斯均衡(合并均衡): (1)卖方选择卖,不管车子好或差; (2)买方选择买,只要卖方卖; (3)买方的判断为 p(g|s)=pg,p(b|s)=pb
二、市场接近失败的数字例子
假设: V3000,W0,P2000,C1000 pgpb0.5
容易检验前面的两个条件。略
下面考虑混合策略:
混合策略完美贝叶斯均衡均衡:
(1)卖方在车好时选卖,车差时以0.5概率随机选择卖或不 卖
(2)买方以0.5概率随机选择买或不买
(3)买方的判断为 p(g|s)2,p(b|s)1
第八章
不完全信息动态博弈的应用: 二手车模型
8.1 单一价格二手车模型

第八章 不完全信息动态博弈2

第八章  不完全信息动态博弈2
息集上不知道哪一个结会将会达到,因此他关于这 个问题需要一个“信念”,由此提出下列条件: 个问题需要一个“信念”,由此提出下列条件: R1: 在每一个信息集,在该集具有行动的参与人关于 博弈到达信息集中的哪一个结必须有一 个信念。 对于非单点信息集,信念是集中各个结上的概率分 布;对于单点集,信念则置概率1 布;对于单点集,信念则置概率1于单决策集上。
Bayes法则举例:如果我们把所有的人划分为好人(GP) Bayes法则举例:如果我们把所有的人划分为好人(GP) 和坏人(BP)两类;所有的事分为好事(GT)和坏事 和坏人(BP)两类;所有的事分为好事(GT)和坏事 (BT)两类,如果我观测到某人干了件好事,则有 (BT)两类,如果我观测到某人干了件好事,则有 P{GT}=P{GT|GP}P{GP}+P{GT| P{GT}=P{GT|GP}P{GP}+P{GT|BP}P{BP} P{GP|GT}=P{GT|GP}P{GP}/P{GT}为具体起见, P{GP|GT}=P{GT|GP}P{GP}/P{GT}为具体起见, 我们认为某人为好人的概率为1/2,那么在观察到告 我们认为某人为好人的概率为1/2,那么在观察到告 干了件好事后如何修正他是好人的概率? 干了件好事后如何修正他是好人的概率?设: ①设P{GT|GP}=1,P{GT|GP}=0, 则P{GP| P{GT|GP}=1,P{GT|GP}=0, P{GP| GT}=1 ②设P{GP|GT}=1,P{GT|BP}=1,则 P{GP|GT}=1,P{GT|BP}=1,则 P{GP|GT}=1/2,即无改变。 P{GP|GT}=1/2,即无改变。 ③设P{GT|GP}=1,P{GT|BP}=1/2,则 ③设P{GT|GP}=1,P{GT|BP}=1/2,则 P{GP|GT}=2/3,即他是好人的可能性增大了。 P{GP|GT}=2/3,即他是好人的可能性增大了。

完全但不完美信息动态博弈教学内容

完全但不完美信息动态博弈教学内容
V——好车的估价;
W——坏车的估价
好1差
1 不卖 1


不卖
2
(0,0) (0,0)
买 不买
买 不买
(P, V-P) (0, 0) (P-C, W-P) (-C,.2 均衡类型
• 市场完全失败:市场上所有的卖方,无 论商品好坏,都选择不卖
• 市场完全成功:质量好的商品的卖方将 商品投放市场,质量差的商品的卖方不 敢将商品投放市场
6.2.3 关于判断形成的进一步解释
二手车交易为例
好1差
1 不卖 1


不卖
2
p(g | s) p(g)p(s | g) p(s)
p(g)p(s | g)
p(g)p(s | g) p(b)p(s | b)
买 不买 买 不买
二手车交易扩展形
博弈方2的两个判断p(g | s),p(b | s) p(g | s)+p(b | s) 1 全概率公式:P(s)=p(g) p(s | g) p(b) p(s | b) 卖方在车况好、差两种情况下, 分别选择卖与不卖的概率分别为 p(s | g), 1 p(s | g),p(s | b), 1 p(s | b)
假设不等式 V ph W pl 0W ph 高价买好车获益>低价买差车的获益>0 高价买差车是亏本的,伪装费C>0
模型

1

1 低价
1
高价
高价
2
低价
2

不买

不买
(Ph ,V Ph) (0,0) (Ph ,WPh ) (0,0) (P l ,VP l ) (0,0) (P l ,WP l ) (0,0)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6.2.2 均衡要求的初步解释
1、判断的必要性
2、序列理性要求——实质是利益最大化要求
3、判断与策略的一致性:符合策略和 BAYES法则(包括均衡路径和非均衡路径上)
什么是“均衡路径上的信息集”?
在均衡路径上的信息集:如果博弈按照均衡 策略进行,则该信息集会以正的概率达到。
不在均衡路径上的信息集:博弈按均衡策略 进行时绝对不可能达到,或者达到的概率为 0。
6.2.1 完美贝叶斯均衡定义
• 在不完美信息动态博弈中纳什均衡和子博 弈完美纳什均衡都不能解决问题,需要引 进新的均衡概念
• 纳什均衡和子博弈完美纳什均衡分析方法, 反应函数和逆推归纳法等同样也要改进、 变化
• 无法排除不可信的威胁或承诺,发展新的 均衡概念——完美贝叶斯均衡。
一个策略组合和相应的判断满足下列4个要
6.2.3 关于判断形成的进一步解释
二手车交易为例
好1差
1 不卖 1


不卖
2
p(g | s) p(g) p(s | g) p(s)

p(g) p(s | g)
p(g) p(s | g) p(b) p(s | b)
0 1
好1差
1 不卖 1
卖卖ຫໍສະໝຸດ 不卖2(0,0) (0,0)
买 不买 买 不买
(-7000) (-10000) (-16000) (-10000) (2,1) (0,0) (1,-1) (-1,0)
运输路线扩展形
二手车交易扩展形
信息的不完美性由此得到体现
二手车博弈的解释
• 对买方来说,在以上得益的前提下,选择买既有 赚钱的可能(车况好),也有亏损的可能(车况 差),选择不买当然肯定不会吃亏,同时也失去 获得利益的机会,因此没有一个选择绝对比另一 个好。
• 完美信息动态博弈:动态博弈中的所有博弈方都有 完美信息的博弈
• 完全信息:各博弈方对博弈结束时每个博弈方的得 益是完全清楚的
• 不完美信息动态博弈的基本特征之一是博弈方之间 在信息方面是不对称的,如二手车市场
• 完全但不完美信息动态博弈或称不完美信息动态博 弈
二手车市场博弈是明显的信息不对称的
• 要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博 弈方的均衡策略决定
• 要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则 和各博弈方在此处可能有的均衡策略决定
序列理性
• “序列理性”及要求3要求4中规定的判断的形成必须 符合贝叶斯法则:
• 子博弈完美Nash均衡是完美贝叶斯均衡在完全且完 美信息动态博弈中的特例。
• 三层含义: • 这意味着通常的动态博弈方法不能使用
6.2 完美贝叶斯均衡 完美贝叶斯均衡
• 均衡策略组合对任何种类博弈分析都是关 键,对于不完美信息博弈也不例外。
• 可信性是均衡的一个中心问题,理想的均 衡排除任何不可信的威胁和承诺。博弈完 美纳什均衡。
• 在完全但不完美信息的动态博弈中,因为 存在多节点信息集。为此,必须发展新的 均衡的概念。
• 因为原博弈本身不会成为原 博弈的后续阶段,因此子博 弈不能从原博弈的第一个节 点开始,即原博弈不是自己 的子博弈
Ll 1 R
2R
2
L
L
R
• 包含所有在初始节点之后的
3
选择节点和终点,但不包含 不跟在此初始节点之后的节
L
R
LR

• 不分割任何的信息集。
子博弈的定义
• 由一个动态博弈第一阶段以外的某个阶 段开始的后续博弈阶段构成的,有初始 信息集和进行博弈所需要的全部信息, 能够自成一个博弈的原博弈的一部分
• 对四个要求的解释: • 要求1:在多节点信息集处轮到选择的博弈方,至少
必须对其中每个节点到达的可能性大小有一个基本判 断; • 要求2:序列理性通过要求各博弈方遵守最大利益原 则,而排除博弈方策略中不可信的威胁或承诺。当然 序列理性首先要求策略组合在给定的各博弈方判断下 是Nash均衡。是完美贝叶斯均衡的重要保证。
这是对要求3和要求4的基本归纳。
均衡要求的初步解释
R
1
(1,3)
L(p)
M(1-p)
2
U
DU
D
(2,1) (0,0,) (0,0) (0,1)
1、均衡策略组合:“博弈方1第 一阶段L,博弈方2第二阶段U”
均衡路径上判断:p=1
2、均衡策略组合:“博弈方1第 一阶段R,博弈方2第二阶段D”
不存在与该策略组合一致的 不在均衡路径上判断,因此该 策略组合不可能构成完美贝叶 斯均衡。
信息不对称问题
• 购买商品 • 企业人事经理雇佣员工 • 保险公司销售人员缺乏对投保人健康状
况的了解。等
• 不完全信息——博弈方在得益信息方面 的不对称。
• 不完美信息——博弈进程信息方面的不 对称。
6.1 不完美信息动态博弈
6.1.1 概念和例子
• 完美信息:博弈中后面阶段的博弈方有关于前面阶 段博弈进程的充分信息
求,称为一个“完美贝叶斯均衡”:
• 要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈 达到该信息集中每个节点可能性的“判断”。对非单节点信息集,一 个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对 单节点信息集,则可理解为“判断达到该节点的概率为1”
• 要求2:给定各博弈方的“判断”, 他们的策略必须是“序列理性” 的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的 “后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使 自己的得益或期望得益最大。此处所谓“后续策略”即相应的博弈方 在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计 划
例子




买 不买
车子

不卖




买 不买
不卖
银行
好 差
提前 不提前 提前 不提前
二手车与新车的感觉比较;原车 主(卖方)选择如何使用车子。
6.1.2 不完美信息动态博弈的表示
多节点信息集扩展形表示 (博弈方信息不完美)
• 对卖方来说,车况好时卖不卖都没有损失,只有 得益的可能性,因此卖总比不卖好。但车况差时 卖得出和卖不出则截然相反,有信息判断:
• 买方或卖方就至少能对获利机会、损失风险的大 小程度心中有数,在自己承受能力的基础上作出 正确的判断和选择。但双方决策需要的这些信息 或判断又都与双方的选择有关。
6.1.3 不完美信息动态博弈的子博弈
相关文档
最新文档