博弈论_贝叶斯博弈与贝叶斯Nash均衡

合集下载

贝叶斯博弈与贝叶斯Nash均衡

贝叶斯博弈与贝叶斯Nash均衡

• 贝叶斯博弈(the static Bayesian game)是关 于不完全信息静态博弈的一种建模方式, 也是不完全信息静态博弈的标准式描述。
贝叶斯博弈的定义
• 贝叶斯博弈包含以下五个要素: (1)参与人集合 Γ ={1, 2,..., n} ; (2)参与人的类型集T1,…,T2; (3)参与人关于其他参与人类型的推断 p1(t−1 t1),
• 用 pi (t−i ti ) 表示参与人i在知道自己类型为ti 的情况下,关于其他参与人类型的推断
(即条件概率),则
p= i (t−i ti )
p= (t−i , ti ) p(ti )
p(t−i , ti )
∑ p(t−i , ti )
t− i ∈T− i
• 其中, p(ti ) 为边缘密度函数。
• 但由于参与人1不知道对手究竟是“强硬” 的还是“软弱”的,因此,此时的参与 人1就觉得自己似乎是在与两个决斗者进 行决斗,一个是“强硬”的,另一个是 “软弱”的。
• 当一个参与人并不知道在与谁博弈时, 博弈的规则是没有定义的,如何处理不 完全信息?
• Harsanyi提出了Harsanyi转换。
p(t1,…,tn)表示定义在参与人类型组合上 的一个联合分布密度函数,Harsanyi转换 假定:对于一个给定的不完全信息博弈 问题,存在一个参与人关于“自然”选 择的推断p(t1,…,tn),且p(t1,…,tn)为共同知 识。也就是说,Harsanyi转换假定所有参 与人关于“自然”行动的信念(belief)是 相同的,并且为共同知识。
• 用 vi (ai , s−i;ti )表示给定其他参与人的战

s−i
=(s1
(⋅),
,
si−1

博弈论中的纳什均衡

博弈论中的纳什均衡

博弈论中的纳什均衡纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》(1950)的博士论文。

该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。

纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

定义:纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他改变策略他的支付将会降低。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈,但是研究博弈论常常会使人陷入一种只追求个人利益的误区,事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设,并不总能说明事实。

只是假定他们只是选择对自己最有利的策略,而不考虑社会福利或任何其他对手的利益。

也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。

子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。

即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。

子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。

为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。

譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。

在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。

这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。

而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。

这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。

定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。

如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

贝叶斯博弈

贝叶斯博弈

不完全信息的市场进入博弈参与人:企业1,企业2行动空间:企业1选择建厂或不建厂,企业2 选择进入或不进入行动顺序和信息结构:自然先以概率对(p,1 p)选择企业1 的成本类型(高,低),企业1 观察到自然的选择而企业2 不能观察到自然的选择;然后企业1 和企业2 同时采取其可选的行动。

赢利状况:如下表对于例子的不完全信息博弈,将不完全信息博弈转化为标准形式贝叶斯博弈。

这一方法是Harsanyi(1967-1968)创造的。

企业1选择DB, 企业2选择IN,构成贝叶斯纳什均衡;意思是,企业1当高成本类型时,选择“不建厂”,而当低成本类型时企业1选择“建厂”,企业2选择“进入”与企业1展开竞争。

贝叶斯纳什均衡的结果为:(2.3,0.4),即双方获得的均衡利润。

不完全信息动态博弈(贝叶斯博弈)我们将介绍另一种新的均衡概念——完美贝叶斯均衡,就有了四个均衡概念:完全信息静态博弈中的纳什均衡、完全信息动态博弈中的子博弈完美纳什均衡、不完全信息静态博弈中的贝叶斯纳什均衡以及不完全信息动态博弈中的完美贝叶斯均衡。

表面上看好像对所研究的每一类型的博弈都发明出了一种新的均衡概念,但事实上这些概念是密切相关的。

随我们研究的博弈逐步复杂,我们对均衡概念也逐渐强化,从而可以排除复杂博弈中不合理或没有意义的均衡,而如果我们运用适用于简单博弈的均衡概念就无法区分。

在每一种情况下,较强的均衡概念只在应用于复杂的博弈时才不同于较弱的均衡概念,而对简单的博弈并没有区别。

引入完美贝叶斯均衡的目的是为了进一步强化(即加强对条件的要求)贝叶斯纳什均衡,这和子博弈完美纳什均衡强化了纳什均衡是相同的。

正如我们在完全信息动态博弈中加上了子博弈完美的条件,是因为纳什均衡无法包含威胁和承诺都应是可信的这一思想;我们在对非完全信息动态博弈的分析中将集中于完美贝叶斯均衡,是因为贝叶斯纳什均衡也存在同样的不足。

回顾前面讲过的,如果参与者的策略要成为一个子博弈完美纳什均衡,则它们不仅必须是整个博弈的纳什均衡,还必须是其中每一个子博弈的纳什均衡。

贝叶斯均衡剖析课件

贝叶斯均衡剖析课件
的适用性有限。
未来发展方向
算法优化
针对贝叶斯均衡的计算复杂性,未来研究可以进一步优化算法, 提高计算效率和准确性。
放宽假设条件
为了扩大贝叶斯均衡的应用范围,未来研究可以尝试放宽完全理性、 完全信息等假设条件,使其更接近现实问题。
动态博弈和演化博弈的考虑
未来研究可以加强贝叶斯均衡在动态博弈和演化博弈中的应用,以 更好地解释市场现象和预测市场趋势。
且每个参与者都能预测对手的最优行动。
贝叶斯均衡的特性
贝叶斯均衡是一种纳什均衡,它 基于参与者的类型和对手的类型 概率分布来选择最优的策略或概 率分布。
贝叶斯均衡是一种静态均衡,因 为它假定参与者在游戏开始时就 知道自己的类型和对手的类型概 率分布。
贝叶斯均衡具有个体理性和集体 理性的特点,即每个参与者的最 优策略或概率分布都能导致整个 博弈的均衡结果。
混合策略贝叶斯均衡是一种动态均衡,因为它允许参与者通过选择概率 分布来随机化其行动。
完美贝叶斯均衡
完美贝叶斯均衡是指参与者在给定自己 类型和对手类型概率分布的情况下,选 择最优的策略或概率分布来最大化自己
的期望效用。
在完美贝叶斯均衡中,每个参与者都预 完美贝叶斯均衡是一种理想化的均衡, 测对手会选择最优的策略或概率分布, 因为它假定参与者在游戏开始时就知道 并据此选择自己的最优策略或概率分布。 自己的类型和对手的类型概率分布,并
贝叶斯均衡剖析课件
• 贝叶斯博弈理论概述 • 贝叶斯均衡的种类与特点 • 贝叶斯均衡的求解方法 • 贝叶斯均衡的应用场景 • 贝叶斯均衡的挑战与未来发展 • 案例分析:某行业的贝叶斯博弈分析
目录
贝叶斯博弈理论概述
贝叶斯博弈的基本概念
信念
在贝叶斯博弈中,每个参与者都 有自己对其他参与者行为的信念。 这些信念基于参与者的经验和信息。

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。

本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。

【关键词】博弈论;纳什均衡;重复博弈博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。

但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。

在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。

因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。

一、博弈的主要类型博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。

依据不同的分类标准,博弈可以被划分为不同的类型。

1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。

动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。

Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。

重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。

2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈

子博弈精炼纳什均衡+贝叶斯法则+信号博弈一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。

子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。

即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。

子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。

为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。

譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a子博弈和图3.6b子博弈。

在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。

这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。

而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。

这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。

定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。

贝叶斯博弈模型

贝叶斯博弈模型

贝叶斯博弈模型1. 引言贝叶斯博弈模型是一种重要的博弈模型之一,它可以用于解决多方参与的决策问题。

本文将先介绍贝叶斯博弈的基本概念和数学公式,然后利用一个具体案例来说明贝叶斯博弈的应用。

2. 贝叶斯博弈的基本概念贝叶斯博弈是一类博弈模型,其中参与者的信息不完全。

与传统的博弈模型不同,贝叶斯博弈模型中参与者的决策被视为一个随机变量,而不是唯一确定的策略。

参与者在制定决策时,需要考虑其他参与者的信息和策略。

在贝叶斯博弈中,参与者的信息受到随机变量的影响。

这些随机变量可能来自于环境、其他参与者的行为或其他因素。

每个参与者都有一个先验信念,即他们在未观察到其他参与者的策略和收益时的信念。

参与者在不断观察和收集信息的同时更新自己的信念,从而制定更为准确的策略。

贝叶斯博弈模型的核心是博弈的贝叶斯纳什均衡。

贝叶斯纳什均衡是一组随机策略,其中每个参与者的策略都是最优的,即使其他参与者的策略是未知的。

换句话说,贝叶斯纳什均衡是参与者在自己的信息不完全的情况下,最优策略的概率分布。

3. 贝叶斯博弈的数学公式在贝叶斯博弈中,每个参与者都有一个随机变量Ai表示他的私有信息。

公共信息O也是一个随机变量,表示所有参与者都知道的信息。

参与者对于公共信息的信念被表示为对O的后验分布P(O|A1,…,An)。

参与者的策略S是一个函数,它映射Ai和O到应该采取的行动。

贝叶斯博弈的收益函数表示参与者的收益是他的策略和其他参与者的策略的函数。

每个参与者都希望最大化自己的期望收益。

因此,每个参与者的目标是找到使他的后验预期收益最大化的策略。

假设有N个参与者,第i个参与者的策略为Si(Ai,O),则贝叶斯纳什均衡定义为每个参与者的策略Si(Ai,O)都使得其他参与者的策略Si-1(A1,O) ~ Si-1(Ai-1,O)的条件下他的收益最大化。

换句话说,对于所有i∈{1,2,…,N},Si(Ai,O)都是贝叶斯纳什均衡当且仅当:E[S1(A1,O)|A1]≥E[S1(A1’,O)|A1] (1)······E[SN(AN,O)|AN]≥E[SN(AN’,O)|AN] (2)式(1)和式(2)表示每个参与者的策略都是其他参与者的策略的反应。

不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈:贝叶斯纳什均衡海萨尼1、前两篇⽂章讲的博弈都包含⼀个基本假设,即所有参与⼈都知道博弈的结构、规则、⽀付函数,因⽽称为完全信息博弈。

然⽽现实中,参与者并不了解其他参与者的⼀些信息,即不完全信息博弈(games of incomplete information)。

2、当对⼿有多种情况时,⽐如市场博弈的例⼦,在位者成本函数可能有需求⾼、需求中、需求低三种情况,那么可以采取“海萨尼转换”,即引⼊⼀个虚拟的参与⼈“⾃然”,⾃然⾸先⾏动,选择参与⼈的类型,被选择的参与⼈知道⾃⼰的真实类型,其他参与⼈并不清楚这个参与⼈的真实类型,但知道各种可能类型的概率分布。

如下图所⽰:3、这种情况下,可以通过海萨尼转换(Harsanyi transformation)把不完全信息博弈转换成完全但不完美信息博弈(complete but inprefer information)。

“不完美信息”指“⾃然”作出了选择,但其他参与⼈并不知道它的具体选择是什么,仅知道各种选择的概率分布。

4、在静态不完全信息博弈中,参与⼈同时⾏动,每个参与⼈的最优战略依赖于⾃⼰的类型,他不可能准确的知道其他参与⼈实际上会做出什么选择,但他能正确的预测其他参与⼈的选择是如何依赖于各⾃的类型的。

决策的⽬标就是在给定⾃⼰的类型和别⼈的类型依从战略的情况下,最⼤化⾃⼰的期望效⽤。

海萨尼定义了“贝叶斯纳什均衡”,给定⾃⼰的类型和别⼈类型的概率分布,每个参与⼈的期望效⽤达到了最⼤化,没有⼈有积极性选择其他战略。

5、举个例⼦,某⼀市场原来被A企业所垄断,现在B企业考虑是否进⼊。

B企业知道,A企业是否允许它进⼊,取决于A企业阻挠B企业进⼊所花费的成本。

如果阻挠的成本⾼,A企业的最优战略是默许B进⼊。

如果阻挠的成本低,A企业的最优战略是阻挠。

⽀付矩阵如下表所⽰:B企业并不知道A企业的阻挠成本是⾼还是低。

这⾥,某⼀参与⼈本⼈知道、其他参与⼈不知道的信息称为私⼈信息。

贝叶斯纳什均衡例题假设有两家企业

贝叶斯纳什均衡例题假设有两家企业

贝叶斯纳什均衡例题假设有两家企业摘要:1.贝叶斯纳什均衡的概述2.贝叶斯纳什均衡的例题:两家企业的博弈3.贝叶斯纳什均衡的应用范围正文:一、贝叶斯纳什均衡的概述贝叶斯纳什均衡(Bayesian Nash Equilibrium)是一种博弈论中的概念,指的是在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略。

在这种均衡状态下,每个参与者都认为自己的选择是最佳的,因为其他参与者也作出了相同的选择。

二、贝叶斯纳什均衡的例题:两家企业的博弈假设有两家企业A 和B,它们分别面临市场进入与否的决策。

企业A 可以选择进入或不进入市场,企业B 也可以选择进入或不进入市场。

两个企业的收益取决于它们各自的决策以及对方企业的决策。

如果企业A 进入市场,企业B 选择阻挠的概率为x,此时企业A 的收益为-10;如果企业A 进入市场,企业B 不阻挠的概率为1-x,此时企业A 的收益为40。

同样,如果企业B 进入市场,企业A 选择阻挠的收益为-10,企业B 不阻挠的收益为40。

在这个博弈过程中,企业A 和企业B 都希望最大化自己的收益。

因此,它们需要根据对方的决策来选择自己的最优策略。

在贝叶斯纳什均衡状态下,企业A 和企业B 都选择了能使自己收益最大化的策略,此时没有人有积极性选择其他策略。

三、贝叶斯纳什均衡的应用范围贝叶斯纳什均衡是一种理论分析工具,它可以帮助我们在不确定性条件下,预测和分析各个参与者的决策行为。

在实际应用中,贝叶斯纳什均衡可以用于解决许多经济、社会和政治领域的问题,例如价格博弈、专利竞争、国际贸易等。

博弈论——不完全信息静态博弈讲义

博弈论——不完全信息静态博弈讲义

3 不完全信息静态博弈3.1 简介博弈论在1970年代之后逐渐进入主流经济学体系,主要是由于它在不完全信息条件下的经济分析中表现出特别的优势。

不完全信息指经济活动中一部分经济主体的某些特征对于其他主体来说是不清楚的。

如在拍卖商品或工程招投标中。

信息不完全又称为信息不对称,即其他局中人没有特定局中人清楚特定局中人自身的特征。

不完全信息静态博弈就是假定某些局中人具有其他局中人不清楚的某些特征的静态博弈。

但对于局中人本身来说,他自身的这些不为人所知的特征对于他自己来说是清楚的,因而称这些特征为局中人自己拥有的“私人信息”(private information)。

在博弈论中,习惯地将局中人的“私人信息”集中表现为局中人的支付函数特征,也就是说,局中人的私人特征将完全通过其支付函数特征表征出来,而不完全信息就表现为一些局中人不清楚另一局中人的支付函数,当然,每个局中人是完全清楚自己的支付函数的。

3.2 理论: 静态贝叶斯博弈和贝叶斯纳什均衡在假定局中人拥有私人信息的情况下,其他局中人对特定局中人的支付函数类型并不清楚,局中人不知道他在与谁博弈,在1967年前,博弈论专家认为此时博弈的结构特征是不确定的,无法进行分析。

Harsanyi (1967、1968)提出了一种处理不完全信息博弈的方法,即引入一个虚拟的局中人——“自然N ”。

N 首先行动,决定每个局中人的特征。

每个局中人知道自己的特征,但不知道其他局中人特征。

这种方法将不完全信息静态博弈变成一个两阶段动态博弈,第一个阶段是自然N 的行动选择,第二阶段是除N 外的局中人的静态博弈。

这种转换被称为“Harsanyi 转换”,它将不完全信息博弈转换为完全但不完美信息博弈。

局中人拥有的私人信息为他的“类型”,由其支付函数决定,故常将支付函数等同于类型。

用i θ表示局中人i 的一个特定类型,i H 表示局中人i 所有可能类型的集合,即i i H ∈θ,称i H 为局中人i 的类型空间,n i ,,1 =。

10 不完全信息博弈和贝叶斯均衡

10 不完全信息博弈和贝叶斯均衡
• 现在考虑这样的情形:假设参与人可能有 这样的两种性格特征(类型)——“强 硬”(用s表示)或“软弱”(用w表示)。
• “强硬”的参与人:争强好胜、不达目的 誓不罢休的决斗者;
• “软弱”的参与人:胆小怕事、遇事希望 息事宁人的决斗者。
斗鸡博弈:不完全信息
强硬 U
D
1 软弱
U
D
2
强硬
软弱
U
D
U
D
1
x1
U
D
2
软 弱(1 p)
x2
U
D
2
U
D
U
D
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
0,1
如果“自然”选择参与人2的性格特征是“强硬”的,则意味 着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1;
N
强硬( p)
x0
1
x1
U
D
2
软 弱(1 p)
x2
U
D
2
U
D
U
• 当一个参与人并不知道在与谁博弈时,博 弈的规则是无法定义的,如何处理不完全 信息导致的这一问题?
二、海萨尼(Harsanyi)转换
• 为了解决该问题,海萨尼提出了Harsanyi 转换。
• 海萨尼提出的解决办法:引入虚拟参与 人——自然,由自然首先决定参与人的不 同类型,从而将不完全信息博弈转换为不 完美信息博弈。
三、贝叶斯博弈的战略式描述
• 不完全信息博弈:完全信息博弈在不完 全信息上的拓展,我们又将其称为贝叶 斯博弈;
• 贝叶斯博弈:静态贝叶斯博弈和动态贝 叶斯博弈;

虚拟行动博弈论名词解释

虚拟行动博弈论名词解释

博弈论有关名词解释囚徒困境;从博弈中的两个利益主体出发选择行为,结果是既没有实现两人的最大利益,也没有真正实现自身的个体最大化利益。

占优均衡:不管对手战略为何,该参与人可找到一最佳战略。

纳什均衡;即双方在给定的策略下,双方都不愿以改变自己的策略。

混合战略;参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动。

子博弈:是原博弈的一部分,本身可以作为一个独立博弈进行分析。

由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足下列条件:(1)x是一个单结信息集;(2)子博弈不改变原博弈的信息集和支付向量。

重复剔除劣战略的占优均衡;逐次删去绝对劣势战略得到唯一的占优战略。

静态博弈;指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么行动。

动态博弈;指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

不可置信的威胁;在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。

-完全信息博弈;每一个参与者对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。

信息集;每次行动时,参与人知道什么;参与人在决策结上所拥有的信息的集合,拥有同样信息的决策结属于同一信息集,即信息集包含的决策结拥有同样的信息。

序贯理性;在每一个信息集中,应该行动的参与人对于给定该参与人在此信息集上的推断,以及其他参与人随后的战略必须是最优反应,即在任何后续博弈中都是理性的。

海萨尼转换;在处理不完全信息博弈问题中,引入一个虚拟的参与人“自然”,自然首先行动决定参与人的特征,其他参与人不知道。

逆向归纳法;从博弈树行动的相反顺序,从后依次往前求得各自博弈的纳什均衡。

零和博弈;是指在博弈中,一方的得益就是另一方的损失,所有的博弈的得益总和为零。

贝叶斯纳什均衡;是一种类型依次从战略组合,在给定自己类型和其他参与人的类型的概率分布情况下,每一个类型依存战略使得每一个参与人的期望效用最大,也就是说,没有人有积极性选择其他战略。

博弈论_贝叶斯博弈与贝叶斯Nash均衡

博弈论_贝叶斯博弈与贝叶斯Nash均衡

7.6 7.0 8.8 8.2
8.8 9.1 13.6 13.9
Example calculation: Bayesian Nash Equilibrium payoff = (.4)(-1) + (.1)(0) + (.2)(28) + (.3)(12) = 8.8
• 在‚斗鸡博弈‛中,虽然在博弈开始之 前每位决斗者都了解(知道)自己的性格特 征,但对对手的性格特征往往不甚了解 或了解不全。 • 在这种情况下即使所有的决斗者都看到 了上面的四个战略式博弈 ,但对决斗者 来讲,仍存在着所谓的事前不确定性即 博弈开始之前就不知道的信息。
Department of Mathematics
• 博弈存在唯一的Nash均衡——(D, D)。 • 双方都息事宁人,希望和平共处,因此 双方都选择退下来。
Department of Mathematics Northwest University
U
1
2
D
2, -2 0, 0
1
U U D
-4, -4 -2, 0
2
D
2, 0 0, 1
U D
-4, -4 -2, 2
Department of Mathematics
Northwest University
• 但由于参与人1不知道对手究竟是‚强硬‛ 的还是‚软弱‛的,因此,此时的参与 人1就觉得自己似乎是在与两个决斗者进 行决斗,一个是‚强硬‛的,另一个是 ‚软弱‛的。 • 当一个参与人并不知道在与谁博弈时, 博弈的规则是没有意义的。
Department of Mathematics
Northwest University
• 考察这样的情形:假设参与人可能有这 样的两种性格特征(类型)——―强硬‛(用 s表示)或‚软弱‛(用w表示)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1) 参与人都为强硬者
(2) 参与人1为强硬者 参与人2为软弱者
U
1
2
D
0, -2 1, 0
1
U U D
-4, -4 0, 0
2
D
0, 0 1, 1
U D
-4, -4 0, 2
(3) 参与人1为软弱者 参与人2为强硬者
Department of Mathematics
(4) 参与人都为软弱者
Northwest University
Northwest University
连锁店博弈
某著名品牌的连锁店(不妨称为参与人A) 在K个城市中有分店,城市标号为1,…,K。 在每个城市k(k=1,…,K)有惟一一个潜在竞 争者(称为参与人k),该竞争者决定是否 与参与人A竞争——进入(用I表示)和不进 入(用O表示)。如果参与人k决定去竞争, 那么参与人A可以抵制(用F表示)也可以 不抵制(用C表示)。
Northwest University
• 同样,‚软弱‛的参与人1也会面临类似 的问题。此时,‚斗鸡博弈‛就是一个 不完全信息博弈问题。
Department of Mathematics
Northwest University
• 对于不完全信息博弈问题,是不可能应 用前面两部分介绍的方法进行求解的。
• 在‚斗鸡博弈‛中,虽然在博弈开始之 前每位决斗者都了解(知道)自己的性格特 征,但对对手的性格特征往往不甚了解 或了解不全。 • 在这种情况下即使所有的决斗者都看到 了上面的四个战略式博弈 ,但对决斗者 来讲,仍存在着所谓的事前不确定性即 博弈开始之前就不知道的信息。
Department of Mathematics
• 博弈存在唯一的Nash均衡——(D, D)。 • 双方都息事宁人,希望和平共处,因此 双方都选择退下来。
Department of Mathematics Northwest University
U
1
2
D
2, -2 0, 0
1
U U D
-4, -4 -2, 0
2
D
2, 0 0, 1
U D
-4, -4 -2, 2
Department of Mathematics
Northwest University
• 但由于参与人1不知道对手究竟是‚强硬‛ 的还是‚软弱‛的,因此,此时的参与 人1就觉得自己似乎是在与两个决斗者进 行决斗,一个是‚强硬‛的,另一个是 ‚软弱‛的。 • 当一个参与人并不知道在与谁博弈时, 博弈的规则是没有意义的。
S W S W
Department of Mathematics
Northwest University
Bayesian Nash Equilibrium
This yields the following payoff matrix and a single pure strategy Nash equilibrium:
A Better Example from Harsanyi
• A seeks to maximize (maxmin) payoff and B seeks to minimize (m inmax) payoff • Fixed action profiles: (a1, a2) and (b1, b2) • Each leads an army which assumes one of two states: Strong or W eak
Department of Mathematics
Northwest University
• 考察这样的情形:假设参与人可能有这 样的两种性格特征(类型)——―强硬‛(用 s表示)或‚软弱‛(用w表示)。
• 所谓‚强硬‛的参与人是指那些喜欢争强好胜、 不达目的誓不罢休的决斗者; • 而‚软弱‛的参与人是指那些胆小怕事、遇事 希望息事宁人的决斗者。
) BS (AW, BW BW
AS AW
4/10 2/10
1/10 3/10
AS a2, AW a1
BS b1, BW b1
Department of Mathematics
Northwest University
Bayesian Players
• Each player knows his own state and estima tes his opponents state • Each player has a pure strategy for every po ssible match-up B B • Each player forms a strategy based on the e A 1/10 4/10 xpected payoff 2/10 3/10 A • To continue the example given by Harsanyi, consider the following probabilities of occur rence for the four possible match-ups:
• Types: Buyer or Seller • Locations: in front of Durty Nellie’s Pub or at the Fry’s Spring Gar age of Mathematics Department Northwest University
• Consider two Generals A and B
• This yields four possible match-ups – (AS, BS), (AS, BW), ( AW, BS), (AW, BW) – with corresponding payoff matrices, eachb having its own Nash equilibrium: b b b b b b b
BS b1, BW b1 BS b1, BW b2 BS b2, BW b1 6.2 1.0 14.6 9.4 BS b2, BW b2 7.4 3.1 19.4 15.1
AS a1, AW a1 AS a1, AW a2 AS a2, AW a1 AS a2, AW a2
Department of Mathematics Northwest University
不完全信息博弈问题
将博弈开始时就存在事前不确定性 的博弈问题称为不完全信息博弈问题。
Department of Mathematics
Northwest University
例子:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥的 两端冲上桥中央进行决斗。每位勇士都有两 种选择:冲上去(用U表示),或退下来(用D表 示)。若两人都冲上去,则两败俱伤;若一方 上去而另一方退下来,冲上去者取得胜利(至 少心理上是这样的),退下来的丢了面子;若 两人都退下来,两人都丢面子。
Northwest University
• 对于‚强硬‛的参与人1来讲,虽然他看 到了上面的战略式博弈,但他不知道对 手是‚强硬‛的还是‚软弱‛的,所以 博弈开始之前他无法确定博弈是根据(1) 还是(2)进行。 这意味着‚强硬‛的参与 人1面临着事前无法确定的信息。
Department of Mathematics
1 2 1 2 1 2 1 2
a1 2 -1 a2 [Harsanyi]
5 20

a1 a2
-24 0
-36 24
a1 a2
28 40
15 4
a1 a2
12 2
20 13
(AS, BS)
(AS, BW)
(AW, BS)
= (.4)(-1) + (.1)(0) + (.2)(28) + (.3)(12) = 8.8
Department of Mathematics
Northwest University
• 显然,当具有不同性格特征的决斗者相 遇时,所表现出来的博弈情形是不同的。 • 令U表示冲上去;D表示退下去,则每种 情况下博弈情形如下图所示。
Department of Mathematics
Northwest University
当参与人都为强硬者时
U
1 2
D
2, -2 0, 0
U D
-4, -4 -2, 2
• 博弈存在两个纯战略Nash均衡—— (U, D)和(D,U)。
• 解释:双方都争强好胜,但都不愿意发生直接 冲突,都希望在自己冲上去时,对方退下来。
Department of Mathematics Northwest University
第三部分: 不完全信息静态博弈
第十章贝叶斯博弈与贝叶斯Nash均衡
主要内容: 一、贝叶斯博弈 二、贝叶斯Nash均衡 三、贝叶斯Nash均衡的应用 四、关于混合战略Nash均衡的一个解释
Department of Mathematics
Northwest University
一、贝叶斯博弈
• 前面两部分我们讨论了完全信息博弈问 题,但在现实生活中我们遇到更多的可 能是不完全信息博弈问题。
当参与人1为软弱者参与人2为强硬者时
U
1
2
D
0, -2 1, 0
U D
-4, -4 0, 2
• 博弈存在唯一的Nash均衡——(D, U)。
Department of Mathematics
Northwest University
当参与人都为软弱者时
U
1
2
D
0, 0 1, 1
U D
-4, -4 0, 0
Department of Mathematics
Northwest University
相关文档
最新文档