不完全信息动态博弈学习资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四 颤抖手均衡
1、其基本思想是:在任何一个博弈中,每一个局中人均 有可能犯错误,如同一个人抓东西时因手的颤抖使其发生 偏差而抓不住一样(这种均衡概念的名称即来源于此),这 样局中人在选择策略时就需要考虑到其他局中人犯错误的 可能性,这样的均衡比纳什均衡概念更为合理。
2、泽尔滕将非均衡事件的发生解释为局中人策略选择时的“颤 抖”,当局中人发现博弈偏离均衡时,他将这一事件归结为某一 个其他局中人的非蓄意错误。在发生颤抖的博弈中.局中人要针 对这些颤抖作出最佳反应,从而构成了纳什均衡。当颤抖的幅度 缩小时,被颤抖扰动的博弈中均衡的极限就是颤抖手均衡。颤抖 手均衡要求均衡策略不仅是对对手策略的最佳反应,而且是当对 手策略发生微小(或无限小)颤抖时的最佳反应;
黔驴之技不完全信息动态博弈
市场进入不完全信息动态博弈
二 信号博弈
1、什么是信号博弈 信号博弈是一类比较简单但有着广泛应用的不完全信息动态 博弈。在这种博弈中,有两个参与人,双方各自都只行动一次, 后行动的参与人具有不完全信息,但他能够从先行动的参与人所 采取的行动中获得部分信息,因此,先行动的参与人的行动对后 行动的参与入来讲就好像是某种反应其支付函数的信号,因此, 这种博弈被称为“信号博弈”, 其中,先行动的参与人就被称为信号发送者,后行动的参与 人被称为信号接收者。
(二)完美贝叶斯一纳什均衡
对动态博弈进行分析,可信性问题始终是一 个中心问题,一个理想的均衡必须是排除了所有 不可信的威胁和许诺的。
在动态博弈中,行动有先后次序,后行动者可以通过观察先行动者的行动获 得有关后者偏好、战略空间等方面的信息,修正自己的判断 。
对应于不完全信息动态博弈的均衡概念是“精炼贝叶斯均衡”。这个概念是 完
全信息动态博弈的精炼纳什均衡和不完全信息静态博弈的贝叶斯均衡的结合。
在完全信息动态博弈中,鉴于纳什均衡本身无法排除不可信的威胁和许诺, 我们加上了子博弈完美这一要求(即要求策略组合在每一个子博弈中都能构成 纳什均衡),并称这样的纳什均衡为子博弈完美纳什均衡.
对于不完全信息动态博弈,由于贝叶斯纳什均衡同样未能排除不可信的威胁 和许诺,我们需要对贝叶斯纳什均衡进一步强化(即加强对条件的要求), 并把强化后的贝叶斯纳什均衡称为精练(完美)贝叶斯纳什均衡,简称为精练 (完美)贝叶斯均衡。
先行动者理性预测到自己的行动将被后行动者所利用,就会设法选择
传递对自己有利的信息,避免传递对自己不利的信息。
因此,该博弈过程的实质不仅是参与人选择行动的过程,而且wenku.baidu.com参与
人不断修正信念的过程。精练贝叶斯纳什均衡是完全信息动态子博弈精练
不完全信息动态博弈的精炼贝叶斯均衡 应用及分析
你与张三不完全信息动态博弈
不完全信息动态博弈
二手车交易博弈
二手车交易博弈
1、二手车交易看成这样一个动态博弈
先是自然(N)决定二手车的类型:好车或差车。
卖主(参与人1)知道自己的类型后选择卖或不卖,若卖主选择不 卖,则博弈结束;若选择卖,则轮到顾客(参与人2)决定买还是
不 买。
顾客在轮到决策的时点上,只能观测到卖主选择了卖的行动而不 知道卖主的类型是好车还是差车(即顾客不知道自然的选择是好 车还是差车)。(这是不完美信息)
精炼贝叶斯均衡的要点在于当事人要根据所观察到的他人的行为 来修正自己有关后者类型的“信念”(主观概率).并由此选择自
己的行动。
精炼贝叶斯均衡是所有参与人战略和信念的一种结合,它满足如下条件:
(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;
(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得 的。
2、序贯均衡对非均衡路径上后验概率的处理是:首先假定在每个信息集上, 局中人选择严格混合策略(即以严格正的概率选择每一个行动),从而博弈到达 每一个信息集的概率严格为正,这样贝叶斯公式在每一个信息集上都可以适 用而不会出现后验概率任意取位的情况;然后,将均衡作为这种严格混合策 略和相应后验概率的序列的极限,而能够成为这种极限的均衡就是序均衡。
这个交易里有两个决策节点就形成 一个多节点的信息集 (用椭 圆圈出)。
2、多节点信息集有如下特征:
(1)在此信息集中的每一个节点都轮到该参与人行动,
(2)当博弈的进行达到该信息集中的某个节点时,轮到行动的 参与人并不知道实际到达了哪一个节点,而只知道到达了其中的 某个节点的概率(先验概率或后验概率)。
因此,用更为广义的后续博弈的概念来代替子博 弈的概念。前面我们已经定义过的子博弈必须开 始于单节点信息集,并且不能分割信息集,与之
不同的是“后续博弈”是指从任何信息集(不论 是
单节点的还是包含多节点的)开始的动态博弈的 后续部分。
精练贝叶斯纳什均衡的理解
在不完全信息动态博弈中,“自然”首先选择参与人的类型 ,参与人
(3).分离策略 指信号发送者针对不同的类型完全选择不同的信号。这类策略 中,信号准确地表现类型,接收者可以通过所观测到的信号准确
地判断出发送者的类型。
三 序贯均衡
1、序贯均衡的概念是由克瑞普斯和威尔逊(1982)首先提出的。它的原理与完 美贝叶斯一纳什均衡相似,也应用于动态贝叶斯博弈,但更着重强调非均衡 路径上后验概率的形成,对局中人随着博弈的进行修正自己信念的方式作了 更加严格的要求,认为局中人的行动必须由对行动历史的信念合理化决定。
信号博弈可以划分为三类;混同策略、半分离策略和分离策略。 各自的意义如下:
(1)混同策略 混同策略这类策略中,信号发送者在不同类型下部发出相同的信 号。因而,信号接收者无法从观测到的信号中得到新的信息,也 就无法对先验概率进行修正。
(2).半分离策略 指信号发送者对某些类型选择特定的信号,而对另—些类型则随 机地选择信号。这时,信号接收者观测到某些信号能够准确地判 断出发送者的类型,而观测到另外某些信号时尽管不能完全判断 出发送者的类型,但是能够据以修正自己的先验概率。

己知道,其他参与人不知道;
在“自然”选择之后,参与人开始行动,参与人的行动有先有后,后

动者能观测到先行动者的行动,但不能观测到先行动者的类型。
因为参与人的行动是类型依存的,每个参与人的行动都传递着自己类
型的某种信息,后行动者可以通过观察先行动者所选择的行动来推断其类
型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动。
相关文档
最新文档