贝叶斯博弈与贝叶斯Nash均衡
不完全信息博弈
• 这个博弈的一个纯策略ai(ci) 是从﹝c’, c’’﹞到﹛0,1﹜的一个函数,其中0表示不 提供,1表示提供。参与人的支付函数为: • Ui(ai,a j, ci)=max(a1, a2)-aici • 如果j提供,i不提供, Ui(0,1, ci)=max(0, 1)-0ci=1;如果i提供, j不提供, Ui(1,0, ci)=max(1, 0)-1ci=1-ci • 贝叶斯均衡是一个策略组合,便得对于每 个i和每个可能的ci,策略ai﹡ (ci) 最大化参 与人i的期望效用。
因为z j≡Prob﹙ c’ ≤c j ≤c j ﹡﹚= P﹙ c j ﹡﹚ ,均衡分割点ci﹡必须满足ci﹡=1P﹙ c j ﹡﹚。因此ci﹡ 和c j ﹡都必须满足 方程c﹡=1- P(1-P﹙ c ﹡﹚)。假定存在 唯一的一个c﹡,解这个方程,那么下列条 件一定成立: ci﹡ = c﹡= 1- P﹙ c ﹡﹚。 比如说,如果P(· )是定义在﹝0,2﹞上 均匀分布( P(c)≡c/2 ),那么c﹡是唯 一的,等于2/3。为了检查c﹡=2/3确实是个 均衡点,如果参与人i不提供,他的期望支 付是P(c﹡)=1/3;如果成本为c﹡时提供, 他的期望支付为1- c﹡,提供是最优的。
• 那么q2L =1/2(5/4-q1); q2H =1/2(3/4-q1) • 企业1不知道企业2的真实成本从而不知道企 业2的最优反应是q2L还是q2H ,因此企业1选 择q1最大化下列期望利润函数: • E u1 =1/2 q1 (1- q1- q2L )+ 1/2 q1 (1- q1q2H ) 解一阶条件可得企业1的反应函数: • q1﹡= 1/2 (1- q1H- q2L )=1/2(1-Eq2) • 解反应函数可得贝叶斯均衡为: • q1﹡=1/3; q2L﹡=11/24; q2H﹡=5/24
贝叶斯纳什均衡
一、现代博弈论简单发展史
• 1960年开始,不同类型的博弈问题的研究取得突破性进展
•
•
1965年,Selten将纳什均衡概念引入动态分析,提出“子博弈精炼纳什均衡”
1967年,Harsanyi把不完全信息引入博弈论研究,提出“海萨尼转换”方 法,给出“贝叶斯纳什75)、Kreps和Wilson(1982)、Fudenberg和
2002:弗农史密斯(Vernon Lomax Smith) 贡献主要在于通过实验室实验来测试根据经济学理论 而做出预测的未知或不确定性。是对以博弈论为基础构 建的理论模型进行实证证伪工作的一大创举。(两位美 国学者丹尼尔·卡纳曼和弗农史密斯 ) 2005(以色列)奥曼( Robert J. Aumann)、谢林(美)( Thomas C. Schelling) 他们通过博弈理论分析增加了世人对合作与冲突的 理解。其理论模型应用在解释社会中不同性质的冲 突、贸易纠纷、价格之争以及寻求长期合作的模式 等经济学和其他社会科学领域。
二、博弈论与主流经济学的发展
• 博弈论研究对象:
当成果无法由个体完全掌握,而结局须视群体共同决策 而定时,个人为了取胜,应该采取什么策略
• 方法论:
经济学、政治学、管理、军事、外交、国际关系、 公共选择、犯罪学
• “深蓝”和“更深的蓝”使用动态博弈理论 编写程序,后来战胜了无敌的卡斯帕罗夫
“要想在现代社会做一个有文化的人,你必 须对博弈论有一个大致了解” ——保罗· 萨缪尔森
(一) 完全信息静态博弈:纳什均衡
基本分析思路和方法
• 占优战略均衡: (dominant-strategy equilibrium) 反映了所有人的绝对偏好,因此十分稳定。但 这种情况较少见。又称为上策均衡。
子博弈精炼纳什均衡+贝叶斯法则+信号博弈
一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈”这个概念。
子博弈(sub game):由一个单结信息集X开始的与所有该决策结的后续结(包括终点结)组成的,能够自成一个博弈的原博弈的一部分。
即给定“历史”,每一个行动选择开始至博弈结束构成了的一个博弈,称为原动态博弈的一个“子博弈”。
子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。
为了叙述方便,一般用表示博弈树中开始于决策结的子博弈。
譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。
在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进行到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。
这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。
而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。
这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。
定义3.1:子博弈精炼纳什均衡(SPNE):扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。
如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
精炼贝叶斯Nash均衡
• 参与人2选择L’与R’的期望收益分别为2-p 和1+p,因此,如果p>1/2,则最优战略 为R’;如果p<1/2 ,则最优战略为L’。
要将子博弈精炼Nash均衡中“均衡精炼” 的思想应用到不完全信息扩展式博弈中, 就必须做到: 1) 对每个参与人i,在其信息集上给出关 于自己位于该信息集中哪一个决策结的 信念(或推断); 2) 对参与人i的每个信息集,在给定参与 人i在该信息集上的信念(或推断)情况下, 参与人的战略是对其他参与人战略的一 个最优反应,即参与人的选择必须满足 序惯理性(sequential rationality)。
L
R
• 不仅要求参与人2的均衡战略在由单决策 结构成的信息集上最优,而且还要求参 与人3的均衡战略在由多决策结构成的信 息集和上最优。
• 但对于位于由多决策结构成的信息集(I3 ({x4,x5})或I3({x6,x7}))上的参与人3,当轮 到他行动时,由于对已发生的历史即参 与人2是选择了L’还是R’并不清楚,因此 也就不知道自己是位于决策结x4 (或x6)还 是决策结x5 (或x7)上。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
• 精炼贝叶斯Nash均衡既包含了一个战略 组合,又包含一个信念系统。 • 这里信念系统对每个信息集都确定了位 于该信息集上的参与人所持有的信念。 • 这种信念是信念持有人对已发生历史的 一个推断,也可理解为他对自己位于信 息集上哪一个决策结的“一种估计”。
精炼贝叶斯Nash均衡
主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较
精炼贝叶斯Nash均衡
贝叶斯均衡剖析课件
未来发展方向
算法优化
针对贝叶斯均衡的计算复杂性,未来研究可以进一步优化算法, 提高计算效率和准确性。
放宽假设条件
为了扩大贝叶斯均衡的应用范围,未来研究可以尝试放宽完全理性、 完全信息等假设条件,使其更接近现实问题。
动态博弈和演化博弈的考虑
未来研究可以加强贝叶斯均衡在动态博弈和演化博弈中的应用,以 更好地解释市场现象和预测市场趋势。
且每个参与者都能预测对手的最优行动。
贝叶斯均衡的特性
贝叶斯均衡是一种纳什均衡,它 基于参与者的类型和对手的类型 概率分布来选择最优的策略或概 率分布。
贝叶斯均衡是一种静态均衡,因 为它假定参与者在游戏开始时就 知道自己的类型和对手的类型概 率分布。
贝叶斯均衡具有个体理性和集体 理性的特点,即每个参与者的最 优策略或概率分布都能导致整个 博弈的均衡结果。
混合策略贝叶斯均衡是一种动态均衡,因为它允许参与者通过选择概率 分布来随机化其行动。
完美贝叶斯均衡
完美贝叶斯均衡是指参与者在给定自己 类型和对手类型概率分布的情况下,选 择最优的策略或概率分布来最大化自己
的期望效用。
在完美贝叶斯均衡中,每个参与者都预 完美贝叶斯均衡是一种理想化的均衡, 测对手会选择最优的策略或概率分布, 因为它假定参与者在游戏开始时就知道 并据此选择自己的最优策略或概率分布。 自己的类型和对手的类型概率分布,并
贝叶斯均衡剖析课件
• 贝叶斯博弈理论概述 • 贝叶斯均衡的种类与特点 • 贝叶斯均衡的求解方法 • 贝叶斯均衡的应用场景 • 贝叶斯均衡的挑战与未来发展 • 案例分析:某行业的贝叶斯博弈分析
目录
贝叶斯博弈理论概述
贝叶斯博弈的基本概念
信念
在贝叶斯博弈中,每个参与者都 有自己对其他参与者行为的信念。 这些信念基于参与者的经验和信息。
博弈论的主要均衡概念及其比较
博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石,对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。
本文首先将博弈划分为不同的类型,并对主要的均衡概念进行了数学描述,最后对不同的均衡概念进行了比较。
【关键词】博弈论;纳什均衡;重复博弈博弈论在现代经济学中占据着相当重要的位置,在微观经济学的本科教学环节中,如果将博弈论这一部分排除在外,那么教学内容是不完整的,并且和现代微观经济学的发展严重脱节。
但是由于课时以及学生接受能力的限制,对博弈论的内容进行全面深入地讲解难以做到,因此,将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。
在博弈论的基本概念当中,最重要的当属博弈均衡的概念,这些概念的掌握有助于学生把握博弈论的整体框架,并对博弈论的后续学习至关重要。
因此,本文将主要的博弈均衡概念进行分类和表述,并对不同的博弈概念进行比较,以期对博弈论的教学有所助益。
一、博弈的主要类型博弈构成的基本要素包括:1、参与人(1~N);2、各个参与人各自可选择的行动集合Ai={ai};3、参与人i的策略Si,给定信息集,该策略决定在博弈的每一阶段他选择的行动;4、参与人的收益Ui (S1,S2…SN)。
依据不同的分类标准,博弈可以被划分为不同的类型。
1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈,如猜硬币、投标等,静态博弈一般可以用支付矩阵来表达。
动态博弈是指博弈各方按照一定的先后次序进行策略的选择,典型的例子如对弈,动态博弈一般可以用“博弈树”来表达。
Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。
重复博弈是指同一个博弈(静态或动态)反复进行所构成的博弈过程,如体育比赛中的多局赛制等。
2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈,不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。
子博弈精炼纳什均衡+贝叶斯法则+信号博弈
一:子博弈精炼纳什均衡在给出子博弈精炼Nash均衡的正式定义之前,我们需要先介绍“子博弈〞这个概念。
子博弈〔sub game〕:由一个单结信息集X开始的与所有该决策结的后续结〔包括终点结〕组成的,能够自成一个博弈的原博弈的一局部。
即给定“历史〞,每一个行动选择开始至博弈完毕构成了的一个博弈,称为原动态博弈的一个“子博弈〞。
子博弈可以作为一个独立的博弈进展分析,并且与原博弈具有一样的信息结构。
为了表达方便,一般用表示博弈树中开始于决策结的子博弈。
譬如图3.5,该博弈存在3个子博弈:除了原博弈自己以外,还存在两个子博弈图3.6a 子博弈和图3.6b子博弈。
在静态博弈分析时,我们所说的战略是指参与人声明他将做出何种选择,而他们往往也是按照声明做出实际选择的;在动态博弈中,战略尽管仍然具有这种含义,但博弈在行动选择上参与人具有选择行动的先后顺序情况下,参与人有了一种额外的选择——事后机会主义,后动的局中人完全可以根据博弈进展到此时对局中人最为有利的方式选择行动,而放弃事前所声明的战略所规定的行动选择选择其行动。
这意味着,在动态博弈中,即使参与人人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略又规定了各个参与人在其所有信息集上的行动选择,这些行动选择也可能并非参与人在对应信息集上的最优行动选择。
而当博弈实际进展到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以想象参与人届时并不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。
这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼〞纳什均衡的思想,应当将其消掉。
定义3.1:子博弈精炼纳什均衡〔SPNE〕:扩展式博弈的策略组合 S*=(S1*,…, Si*,…, Sn* )是一个子博弈精炼纳什均衡当且仅当:如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡。
如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足:在整个动态博弈与它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡〞。
精炼贝叶斯Nash均衡的精炼
信息集的严格劣战略:
• 考虑轮到参与人行动的一个信息集。战 略si*为始于这一信息集的严格劣战略, 如果存在另一个战略si使得对i在给定信 息集可能持有的每一推断,并且对每一 其他参与人后续战略可能的组合,i在给 定信息集根据si选择行动并在其后根据si 选择后续战略得到的收益,严格大于根 据si*选择行动和后续战略得到的收益。
2) 对于信号博弈的精练贝叶斯Nash均衡, 可将信念精炼标准1重新表述如下。
• 在信号博弈中,M中的信号mj称为T中 类型ti的劣信号,如果存在另外一个信 号mj’,使得ti选择mj’的最小可能收益 大于ti选择mj的最大可能收益,即
Minus ti , mj , ak Max us ti , m j , ak
u [ p] L
t1
0.5
R
[q]
u
0,1
2,0
d 接收者
d 接收者 u [1 q] d
1,0
自然
0.5
1,0
u L [1 p]
0,0
R
1,1
d
t2
2,1
• 对q≥1/2,战略和推断[(L,L),(u,u),p=0.5,q] 构成博弈的一个混同精炼贝叶斯Nash均 衡。
• 由于类型为t1的发送者选择R的最大收益为1, 而选择L的最小收益为2,因此,发送者的战 略(R, L)和(R, R)为始于类型为t1的发送者的信 息集的严格劣战略。所以,根据信号条件(5), q=0。因此,博弈的精炼贝叶斯Nash均衡[(L, L),(u,u),p=0.5, q≥1/2]不满足信号条件(5)。 • 分离精炼贝叶斯Nash均衡[(L,R),(u,d),p=1,q=0] 则自然满足信号条件(5)。
贝叶斯博弈模型
贝叶斯博弈模型1. 引言贝叶斯博弈模型是一种重要的博弈模型之一,它可以用于解决多方参与的决策问题。
本文将先介绍贝叶斯博弈的基本概念和数学公式,然后利用一个具体案例来说明贝叶斯博弈的应用。
2. 贝叶斯博弈的基本概念贝叶斯博弈是一类博弈模型,其中参与者的信息不完全。
与传统的博弈模型不同,贝叶斯博弈模型中参与者的决策被视为一个随机变量,而不是唯一确定的策略。
参与者在制定决策时,需要考虑其他参与者的信息和策略。
在贝叶斯博弈中,参与者的信息受到随机变量的影响。
这些随机变量可能来自于环境、其他参与者的行为或其他因素。
每个参与者都有一个先验信念,即他们在未观察到其他参与者的策略和收益时的信念。
参与者在不断观察和收集信息的同时更新自己的信念,从而制定更为准确的策略。
贝叶斯博弈模型的核心是博弈的贝叶斯纳什均衡。
贝叶斯纳什均衡是一组随机策略,其中每个参与者的策略都是最优的,即使其他参与者的策略是未知的。
换句话说,贝叶斯纳什均衡是参与者在自己的信息不完全的情况下,最优策略的概率分布。
3. 贝叶斯博弈的数学公式在贝叶斯博弈中,每个参与者都有一个随机变量Ai表示他的私有信息。
公共信息O也是一个随机变量,表示所有参与者都知道的信息。
参与者对于公共信息的信念被表示为对O的后验分布P(O|A1,…,An)。
参与者的策略S是一个函数,它映射Ai和O到应该采取的行动。
贝叶斯博弈的收益函数表示参与者的收益是他的策略和其他参与者的策略的函数。
每个参与者都希望最大化自己的期望收益。
因此,每个参与者的目标是找到使他的后验预期收益最大化的策略。
假设有N个参与者,第i个参与者的策略为Si(Ai,O),则贝叶斯纳什均衡定义为每个参与者的策略Si(Ai,O)都使得其他参与者的策略Si-1(A1,O) ~ Si-1(Ai-1,O)的条件下他的收益最大化。
换句话说,对于所有i∈{1,2,…,N},Si(Ai,O)都是贝叶斯纳什均衡当且仅当:E[S1(A1,O)|A1]≥E[S1(A1’,O)|A1] (1)······E[SN(AN,O)|AN]≥E[SN(AN’,O)|AN] (2)式(1)和式(2)表示每个参与者的策略都是其他参与者的策略的反应。
贝叶斯纳什均衡例题假设有两家企业
贝叶斯纳什均衡例题假设有两家企业摘要:1.贝叶斯纳什均衡的概述2.贝叶斯纳什均衡的例题:两家企业的博弈3.贝叶斯纳什均衡的应用范围正文:一、贝叶斯纳什均衡的概述贝叶斯纳什均衡(Bayesian Nash Equilibrium)是一种博弈论中的概念,指的是在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略。
在这种均衡状态下,每个参与者都认为自己的选择是最佳的,因为其他参与者也作出了相同的选择。
二、贝叶斯纳什均衡的例题:两家企业的博弈假设有两家企业A 和B,它们分别面临市场进入与否的决策。
企业A 可以选择进入或不进入市场,企业B 也可以选择进入或不进入市场。
两个企业的收益取决于它们各自的决策以及对方企业的决策。
如果企业A 进入市场,企业B 选择阻挠的概率为x,此时企业A 的收益为-10;如果企业A 进入市场,企业B 不阻挠的概率为1-x,此时企业A 的收益为40。
同样,如果企业B 进入市场,企业A 选择阻挠的收益为-10,企业B 不阻挠的收益为40。
在这个博弈过程中,企业A 和企业B 都希望最大化自己的收益。
因此,它们需要根据对方的决策来选择自己的最优策略。
在贝叶斯纳什均衡状态下,企业A 和企业B 都选择了能使自己收益最大化的策略,此时没有人有积极性选择其他策略。
三、贝叶斯纳什均衡的应用范围贝叶斯纳什均衡是一种理论分析工具,它可以帮助我们在不确定性条件下,预测和分析各个参与者的决策行为。
在实际应用中,贝叶斯纳什均衡可以用于解决许多经济、社会和政治领域的问题,例如价格博弈、专利竞争、国际贸易等。
10 不完全信息博弈和贝叶斯均衡
• “强硬”的参与人:争强好胜、不达目的 誓不罢休的决斗者;
• “软弱”的参与人:胆小怕事、遇事希望 息事宁人的决斗者。
斗鸡博弈:不完全信息
强硬 U
D
1 软弱
U
D
2
强硬
软弱
U
D
U
D
1
x1
U
D
2
软 弱(1 p)
x2
U
D
2
U
D
U
D
U
D
UD
-4,-4
2,-2
-2,2
0,0
-4,-4
2,0
-2,0
0,1
如果“自然”选择参与人2的性格特征是“强硬”的,则意味 着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1;
N
强硬( p)
x0
1
x1
U
D
2
软 弱(1 p)
x2
U
D
2
U
D
U
• 当一个参与人并不知道在与谁博弈时,博 弈的规则是无法定义的,如何处理不完全 信息导致的这一问题?
二、海萨尼(Harsanyi)转换
• 为了解决该问题,海萨尼提出了Harsanyi 转换。
• 海萨尼提出的解决办法:引入虚拟参与 人——自然,由自然首先决定参与人的不 同类型,从而将不完全信息博弈转换为不 完美信息博弈。
三、贝叶斯博弈的战略式描述
• 不完全信息博弈:完全信息博弈在不完 全信息上的拓展,我们又将其称为贝叶 斯博弈;
• 贝叶斯博弈:静态贝叶斯博弈和动态贝 叶斯博弈;
12第十二章贝叶斯纳什均衡及其精炼
第十二章贝叶斯纳什均衡及其精炼前两章讨论的是完全信息条件下的博弈,给出了博弈的基本分析框架。
本章将讨论不完全信息下的博弈行为,包括不完全信息静态博弈和不完全信息动态博弈。
12.1不完全信息博弈与贝叶斯纳什均衡一、不完全信息博弈完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(common knowledge)的博弈。
反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。
二、海萨尼(Harsanyi)转换在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。
至于“类型”概念,以两个企业博弈的例子说明。
假设参与人1为在位者企业,参与人2为进入者企业。
进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。
但是进入者不知道在位者的成本是高还是低。
因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。
海萨尼提出通过引入“自然”概念解决这个问题。
即由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。
即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。
在本例中,通过自然选择在位者的成本类型,进入者再针对高成本或低成本进行是否进入的博弈决策。
应当指出,通过自然选择类型的划分,不仅是针对支付函数而言的,其包括参与人所拥有的所有个人信息,如战略空间和信息集等等。
通过上述分析可知道,不完全信息意味着,至少有一个参与人拥有多种类型,否则就成为完全信息博弈。
用表示参与人的一个特定类型,表示参i θi i Θ与人所有可能类型的集合,,并假定i i i Θ∈θ取自某个客观的分布函数。
n i i 1}{=θ),,(1n P θθL为简化起见,假定只有参与人本人观察到自i 己的类型,其他人都不能察到。
但依据海萨尼i θi θ公理,我们假定分布函数是所有参与),,(1n P θθL 人的共同知识,就是说,在博弈开始时,所有参与人关于自然行动的信念是相同的。
18不完全信息博弈贝叶斯纳什均衡1
海萨尼转换 The Harsanyi transformation
Nature
A的类型 B的类型
A知道自己的 类型,知道B 的概率分布
B知道自己的 类型,知道A 的概率分布
1/2
商人B
Nature
1/2
商人A 商人B
H
C
H 2, 2 0, -1
C -1, 0 1, 1
H
C
H 2, 2 0, 3
C -1, 0 1, 1
贝叶斯博弈的战略表达式
参与者空间: N {0,1, , n} 参与者的行动空间:A {A1, , An} 参与者的类型空间:T {T1, ,Tn} 参与者的信念: p { p1, , pn}
参与者的收益函数:u {u1, , un}
G {A1, , An;T1, Tn; p1, pn;u1, ,un}
厂商A的最优反应
B选(H,H) A选H; B选(H,C) A选H B选(C,H) A选H; B选(C,C) A选C
商1人/2B
H
C
H 2, 2 0, -1
C -1, 0 1, 1
类型:良商
商1人/2B
H
C
H 2, 2 0, 3
C -1, 0 1, 1
类型:奸商
厂商B的最优反应: A选H,良商B选H,奸商B选C; A选C,良商B选C,奸商B选C
信息不对称的例子: 结婚
信息不对称的例子: 市场进入
在位者 新企业
信息不对称的例子: 信用困境
H
A
C
信念 Belief
良商
B
H
C
2, 2
0, -1
-1, 0 +1, +1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 贝叶斯博弈(the static Bayesian game)是关 于不完全信息静态博弈的一种建模方式, 也是不完全信息静态博弈的标准式描述。
贝叶斯博弈的定义
• 贝叶斯博弈包含以下五个要素: (1)参与人集合 Γ ={1, 2,..., n} ; (2)参与人的类型集T1,…,T2; (3)参与人关于其他参与人类型的推断 p1(t−1 t1),
• 用 pi (t−i ti ) 表示参与人i在知道自己类型为ti 的情况下,关于其他参与人类型的推断
(即条件概率),则
p= i (t−i ti )
p= (t−i , ti ) p(ti )
p(t−i , ti )
∑ p(t−i , ti )
t− i ∈T− i
• 其中, p(ti ) 为边缘密度函数。
• 但由于参与人1不知道对手究竟是“强硬” 的还是“软弱”的,因此,此时的参与 人1就觉得自己似乎是在与两个决斗者进 行决斗,一个是“强硬”的,另一个是 “软弱”的。
• 当一个参与人并不知道在与谁博弈时, 博弈的规则是没有定义的,如何处理不 完全信息?
• Harsanyi提出了Harsanyi转换。
p(t1,…,tn)表示定义在参与人类型组合上 的一个联合分布密度函数,Harsanyi转换 假定:对于一个给定的不完全信息博弈 问题,存在一个参与人关于“自然”选 择的推断p(t1,…,tn),且p(t1,…,tn)为共同知 识。也就是说,Harsanyi转换假定所有参 与人关于“自然”行动的信念(belief)是 相同的,并且为共同知识。
• 用 vi (ai , s−i;ti )表示给定其他参与人的战
略
s−i
=(s1
(⋅),
,
si−1
(⋅),
si+1
(⋅), ,
sn
(⋅))
,类型为ti的
参与人i选择行动ai时的期望效用,则
∑ vi (ai , s−i ;ti ) =
pi (t−i ti )ui (ai , a−i (t−i );ti )
U
1
D
2
U
D
-4, -4
0, -2
0, 2
1, 0
U
1
D
-4, -4
2, 0
-2, 0
0, 1
(2) 参与人1为强硬者
参与人2为软弱者
2
U
D
-4, -4
0, 0
0, 0
1, 1
(3) 参与人1为软弱者 参与人2为强硬者
(4) 参与人都为软弱者
• 在“斗鸡博弈”中,虽然在博弈开始之 前每位决斗者都了解(知道)自己的性格特 征,但对对手的性格特征往往不甚了解 或了解不全。
• 在Harsanyi转换中规定:参与人关于“自 然”选择的推断为共同知识。
• 也就是说,两个决斗者不仅同时一起看 到了“自然”随机选择参与人2的性格特 征,而且同时一起看到了“自然”以一 定的概率分布随机选择参与人2的性格特 征。
在应用Harsanyi转换时,需要注意以下问题:
• 1) “自然”的选择。在一般的不完全信息 博弈问题中,Harsanyi转换规定“自然” 选择的是参与人的类型(type)。
U -4, -4
0, -2
1
D
0, 2
1, 0
• 博弈存在唯一的Nash均衡——(D, U)。
当参与人都为软弱者时
2
U
D
U -4, -4
0, 0
1
D
0, 0
1, 1
• 博弈存在唯一的Nash均衡——(D, D)。
2
U
D
2
U
D
U
1
D
-4, -4 -2, 2
2, -2
U
1
0, 0
D
(1) 参与人都为强硬者
t− i ∈T− i
• 其中,对 ∀t−i , ∈T−i a−i (t−i ) 为给定t-i时由s-i 所确定的其他参与人的行动组合
s−i
(t−i
)
=
(s1
(t1
), ,
si −1 (ti −1 ),
si+1
(ti
+1
),
,
sn
(tn
))
• 在贝叶斯博弈中,对于一个理性的参与
人i,当他只知道自己的类型ti而不知道其 他参与人的类型时,给定其他参与人的
U
1
D
2
U
D
-4, -4
2, -2
-2, 2
0, 0
• 博弈存在两个纯战略Nash均衡—— (U, D)和(D,U)。
当参与人1为强硬者参与人2为软弱者时
2
U
D
U -4, -4
2, 0
1
D
-2, 00, 1Fra bibliotek• 博弈存在唯一的Nash均衡——(U, D)。
当参与人1为软弱者参与人2为强硬者时
2
U
D
∑ ai∗
(ti
)
∈
arg
max
ai∈Ai (ti
)
t−
i
∈T−
i
pi (t−i
ti )ui (ai , a−∗i (t−i );ti )
存在性结论
• 定理 一个有限的贝叶斯博弈一定存在贝 叶斯Nash均衡。
贝叶斯Nash均衡定义的另一种表示方式
•
在静态贝叶斯博弈
G
=<
Γ; (T i
);
(
p i
…, pn (t−n tn;) (4)参与人类型相依的行动集A(t1),…, A(tn); (5)参与人类型相依的支付函数 u1(a1(t1), a2(t2),, an (tn );t1)
,…, un (a1(t1), a2 (t2 ),, an (tn );tn ) 。
规定贝叶斯博弈的时间顺序如下:
由∂π 2 = 0,得:
∂q2
q2 (q1,= t)
• 在这种情况下即使所有的决斗者都看到 了上面的四个战略式博弈 ,但对决斗者 来讲,仍存在着所谓的事前不确定性即 博弈开始之前就不知道的信息。
• 对于“强硬”的参与人1来讲,虽然他看 到了上面的战略式博弈,但他不知道对 手是“强硬”的还是“软弱”的,所以 博弈开始之前他无法确定博弈是根据(1) 还是(2)进行。 这意味着“强硬”的参与 人1面临着事前无法确定的信息。
第三部分: 不完全信息静态博弈
第十章贝叶斯博弈与贝叶斯Nash均衡
主要内容: 一、贝叶斯博弈 二、贝叶斯Nash均衡 三、贝叶斯Nash均衡的应用 四、关于混合战略Nash均衡的一个解释
一、贝叶斯博弈
• 前面两部分我们讨论了完全信息博弈问 题,但在现实生活中我们遇到更多的可 能是不完全信息博弈问题。
• 同样,“软弱”的参与人1也会面临类似 的问题。此时,“斗鸡博弈”就是一个 不完全信息博弈问题。
• 对于不完全信息博弈问题,是不可能应 用前面两部分介绍的方法进行求解的。
• 这是因为给定参与人1为“强硬”的决斗 者,如果对手是“软弱”的,那么博弈 就只存在惟一的Nash均衡(U, D),参与人 1有惟一的最优选择“冲上去”;如果对 手是“强硬”的,则博弈就会出现两个N ash均衡(U,D)和(D,U),参与人1的最优选 择取决于对手的选择。
• 为了分析,对“斗鸡博弈”进行简化。
• 假设参与人1是“强硬”的决斗者,参与 人2可能是“强硬”的也可能是“软弱” 的,参与人1不知道但参与人2清楚,而 且这一假设为所有的参与人所知道。
Harsanyi转换
• 对于简化的“斗鸡博弈”,Harsanyi转换 是这样处理的: 在原博弈中引入一个“虚拟”参与 人——“自然”(nature,用N表示),构造 一个参与人为:两个决斗者和“自然” 的三人博弈。
动组合 (a1∗(t1), a2∗(t2 ),, an∗(tn )) ,其中每个参与人 在给定自己的类型ti和其他参与人的类型相依 行动 a−∗i (t−i ) 的情况下最大化自己的期望效用。
•
也就是,行动组合
(a1∗
(t1),
a2∗
(t2
), ,
an∗
(tn
))
是一个
纯战略贝叶斯Nash均衡,如果对 ∀i∈Γ ,
• 用ti表示参与人i的一个特定的类型,Ti表 示参与人i所有类型的集合(亦称类型空间,
type space),即ti ∈Ti ,t=(t1,…,tn)表示一 个所有参与人的类型组合, t-i=(t1,…,ti1,…,tn)表示除参与人i之外其他参与人的 类型组合。所以,t=(ti, t-i)。
• 2) 参与人关于“自然”选择的推断。用
市场需求:
P= a − Q
Q= q1 + q2
进一步假设:
a = 2;
=c1 1,= c2L
3 4
,= c2H
5; 4
p=1 2
企业2:
π 2 = q2 ⋅ (P − c2 )
= q2 ⋅ (a − c2 − q2 − q1)
• 令 a − c2 = t 则 π 2=q2 ⋅ (t − q2 − q1)
“自然”首先行动决定参与人2的性格特征(即选择
的参H选与ar择人sa参2n是与y“i人转强1换不硬知”道的,还但是参“与软人弱2”知的道),。“自然”
N
x0 强硬( p)
1
x1
U
D
2
软弱(1− p)
x2
U
D
2
UD
UD
UD
UD
-4 ,-4
2 ,-2
-2 ,2
0,0
-4 ,-4
2,0
-2 ,0