博弈论与信息经济学 第二章 完全信息动态博弈
信息经济学部分习题解答
解:设金钱总数为M。
对赌徒i,战略空间Si=[0,M],si∈Si,支付
函数ui为
ui
si 0
if if
si M
i
si M
i
所有满足∑isi≤M的选择都是纳什均衡。纳什均 衡有无穷多个。
5.(库诺特博弈)假定有n个库诺特寡头企业,每 个企业具有相同的不变单位成本c,市场逆需求 函数是p = a - Q,其中p是市场价格,Q = ∑jqj是 总供给量,a是大于零的常数。企业i的战略是 选择产量qi最大化利润 πi=qi(a-Q-c),给定其他 企业的产量q-i,求库诺特-纳什均衡。
2
q2
14q12q220
求解可得 q 14q24 116
假设企业1第一阶段投资引进新技术。此时
两个企业的边际成本下降到1,利润函数为:
1 1 q 1 4 q 2 q 1 q 1 f
2 1 q 4 1 q 2 q 2 2 q 2
一阶最优条件为
1
q1
142q1q210
求 故解当可1得9q 6 1 fq 22 1 1 31644 q2 q11 f3 2 q1 25122 时10,99 引6 f进新技术
解:根据问题的假设可知各企业的利润函数为
i piq ciqaqijn iqjqiciq
其中i=1,…,n。
将利润函数对qi求导并令其为0得:
i
qi
n
a
ji
qj
c2qi 0
解得各企业对其他企业产量的反应函数为:
n
qi aji qj c/2
根据n个企业之间的对称性,可知 q1 *q2 *qn * 必然成立。代入上述反应函数可解得:
q
2
再代入企业1的反应函数,得
非合作博弈经济管理学及财务知识分析理论
(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 概念没有规定参与人如何修正自己的信念。但是,如果进 入者可以任意修订自己有关在位者成本函数的信念,上述 不完全信息动态博弈可以有任意均衡。
假定参与人的类型是独立分布的,参与人i有K个类型, 有h个可能的行动,өk和ah分别代表一个特定的类型和 一个特定的行动。
如果我们观察到i选择了ah,i属于өk的后验概率是多少?
p(ahk)p(k) p(ahk)p(k)
Por{b kah}
(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯推断的结合。它要求:
✓ 1、在每个信息集上,决策者必须有一个定义 在属于该信息集的所有决策结上的一个概率分 布(信念);
第二个弟子……
第三个弟子……
贝叶斯法则
在日常生活中,当面临不确定时,我们对某事 件发生的可能性有一个判断,然后,会根据新 的信息来修正这个判断。
✓ 统计学上,修正之前的判断称为“先验概率”
✓ 修正后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则
基本思路-不完全信息动态博弈
成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的, 毛驴也是如此。最终老虎将毛驴吃掉。
完全信息动态博弈和演化博弈的关系
完全信息动态博弈和演化博弈的关系在博弈论的研究领域中,完全信息动态博弈和演化博弈是两个重要的分支。
它们分别从不同的角度研究博弈现象,但二者之间也存在一定的联系和关系。
本文将探讨完全信息动态博弈和演化博弈的关系,并对它们的特点和应用进行分析。
1. 完全信息动态博弈的定义和特点完全信息动态博弈是指博弈参与者在博弈过程中具备完全信息的情况下,根据先后顺序依次做出决策,随着时间的推移,博弈过程也在不断变化。
在完全信息动态博弈中,博弈参与者对于其他参与者的行动和策略都有准确的了解,能够全面考虑对手的决策,以此来优化自己的策略选择。
完全信息动态博弈的特点包括:首先,信息对称,每个博弈者都能了解其他博弈者的策略和收益函数;其次,决策按照时间顺序依次进行,每个博弈者的行动会对其他人的决策产生影响;最后,完全信息动态博弈具有策略的时序性,参与者需要根据他们观察到的其他人的决策来选择自己的策略。
2. 演化博弈的定义和特点演化博弈是指博弈参与者根据其在群体中的优势来选择策略,并通过遗传和选择机制在演化过程中逐步改变策略的过程。
演化博弈考虑的不是个体之间的完全信息,而是从整体出发,通过个体之间的相互作用和进化选择来探讨不同策略之间的稳定性和最终结果。
演化博弈的特点包括:首先,演化博弈关注的是群体中不同策略的相对频率和进化趋势,而不是个体行动的绝对收益;其次,演化博弈中存在着演化稳定策略,即一旦某种策略在群体中形成,就会对其他策略形成一种稳定的威胁;最后,演化博弈的结果依赖于演化的时间尺度和环境的改变。
3. 完全信息动态博弈与演化博弈的关系完全信息动态博弈和演化博弈虽然从不同的角度出发,但也存在一定的联系和关系。
首先,完全信息动态博弈可以看作演化博弈的一种特殊情况,即当演化博弈的时间尺度趋于无穷时,完全信息动态博弈的结果可以看作是演化博弈的极限情况。
因此,完全信息动态博弈可以为演化博弈提供一种基础理论框架。
其次,演化博弈可以用来解释完全信息动态博弈中出现的某些稳定策略。
完全完美信息动态博弈
• 子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因 此是真正稳定的。
• 子博弈是倒着看的,从最小的子博弈开始我们就找稳定策略组合, 直至最开始的节点,那么当然是稳定的了。大家会发展这正是逆推 归纳法。
• 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
• 战略空间是连续函数:产量。
(-2,5) 制止
仿冒
A 不仿冒
B 不制止 (5,5)
(2,2)
(10,4)
4.1.2 动态博弈的基本特点
• 策略是在整个博弈中所有选择、行为的计划,不能分割。 • 结果是上述“计划型”策略的策略组合,构成一条路径. • 得益对应每条路径,而不是对应每步选择、行为.
• 动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先 选择、行为的博弈方常常更有利,有“先行优势”。
动)开始。这里参与者1面临的选择是L’’。那么在第二阶段,参与者2预测 到一旦博弈进入到第三阶段,则参与者1会选择L’’ ,这会使2的收益为0, 从而参与者2在第二阶段的选择为:L‘可得收益1, R“可得收益0,于是 L‘是最优的。
• 这样在第一阶段,参与者1预测到如果博弈进入到第二阶段,2将选择L’, 使参与者1的收益为1,从而参与者1在第一阶段的选择是:L收益为2, R收益 为1,于是L是最优的。
乙
借
不借
甲
分
(2,2) 打
(1,0) 不分
乙
不打
(-1,0)
(0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
• 第一个图中,通过法律手段使乙的利益得到保障,这样乙的完整策略: “第一阶段借,如果第二阶段甲不分,第三阶段打官司。”甲的完整策 略是:“第二阶段分。”这是这个3阶段动态博弈的解。
博弈论基础读书笔记三完全信息动态博弈和逆向归纳法
博弈论基础读书笔记三完全信息动态博弈和逆向归纳法第⼆章完全信息动态博弈先来说明两个概念:1、是指在博弈中,参与⼈同时选择或虽⾮同时选择但后⾏动者并不知道先⾏动者采取了什么具体⾏动。
2、是指在博弈中,参与⼈的⾏动有先后顺序,且后⾏动者能够观察到先⾏动者所选择的⾏动。
这⼀章,我们来讨论关于完全信息(即参与者的收益函数是共同知识的博弈)动态博弈的问题。
在这⾥我们还将博弈分为两种:完美信息博弈:即要选择⾏动的参与者完全知道这⼀步之前所有的博弈过程。
完全但不完美信息博弈:即要选择⾏动的参与者不知道这⼀步之前的博弈过程。
进⾏这章之前先简要的解释⼀些东西:所有的动态博弈的中⼼问题都是可信任性。
下⾯给⼀个经典的⼿雷博弈的例⼦:第⼀,参与者1可以选择⽀付1000美元给参与者2或者是⼀分不给。
第⼆,参与者2观察参与者1的选择,然后决定是否引爆⼀颗⼿雷将两个⼈同炸死。
如果参与者2威胁参与者1如果他不付1000美元就引爆⼿雷,如果参与者1相信这个威胁,则最优选择是⽀付1000美元。
但参与者1却不会对这⼀威胁信以为真,因为它不可置信(参与者2不会蠢到因为1000美元⽽同归于尽,⾄于参与者1考虑参与者2是不是疯⼦的情况在第三章讨论)。
这个例⼦就是典型的完全且完美信息博弈。
在2.1节我们将在后⾯使⽤逆向归纳解,来求解这个问题。
在2.2节我们会丰富前⼀节的博弈模型使之成为完全但不完美博弈,我们会定义这种博弈的⼦博弈精炼解,它是逆向归纳法的延申。
在2.3节研究重复博弈,即多次重复⼀个给定博弈。
这⾥分析问题的中⼼使(可信的)威胁和对以后做出的承诺对当前⾏为的影响。
在2.4节中我们介绍分析⼀般的完全信息动态博弈所需要的⼯具。
不再区别信息是否是完美的。
本节和本章的重点都在语⾔,⼀个完全信息动态博弈可能会有多个纳什均衡,但其中⼀些均衡或许包含了不可置信的威胁和承诺,⼦博弈精炼纳什均衡则是通过了可信检验的均衡。
看到这⾥你可能还是⼀头雾⽔,但是⽆所谓,让我们⼀节⼀节的来讲,看到最后你在回头看前⾯的总结可能会更有利于你对本章的理解。
完全信息动态博弈模型
完全信息动态博弈模型完全信息动态博弈模型是博弈论中一种重要的博弈模型,它描述了一组参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。
下面将详细介绍完全信息动态博弈模型的相关内容。
一、博弈的参与者:完全信息动态博弈模型中,通常包括两个或多个参与者,每个参与者都可以做出自己的决策和行动。
参与者可以是个人、组织、公司等,他们之间存在着相互竞争和合作的关系。
二、博弈的信息:完全信息动态博弈模型中的参与者拥有完全信息,即每个参与者都能够获得关于其他参与者的决策和行动的完整信息。
通过完全信息,参与者能够准确地评估自己的决策和行动对其他参与者的影响,并作出最优化的决策。
三、博弈的行动和策略:在完全信息动态博弈中,参与者可以选择不同的行动和策略来达到自己的目标。
每个参与者根据自己对其他参与者行动和策略的评估,以及自己的目标和利益,选择最优化的行动和策略。
四、博弈的时间顺序:完全信息动态博弈是一个时间序列上的博弈模型,参与者的决策和行动是有序进行的。
参与者按照一定的时间顺序依次进行决策和行动,每个参与者都会考虑前面参与者的行动和决策对自己的影响,进而作出自己的决策。
五、博弈的结果和收益:完全信息动态博弈模型的结果是参与者的收益和利益。
通过多轮反复的博弈过程,参与者根据自己的决策和行动可以获得不同的结果和收益。
每个参与者的最终目标是通过优化自己的决策和行动,获得最大的收益和利益。
完全信息动态博弈模型是博弈论中一种重要的模型,它能够帮助我们分析和理解多方参与者在了解所有相关信息的情况下,通过一系列决策和行动来实现最优化的结果。
通过对博弈的参与者、信息、行动和策略、时间顺序以及结果和收益的分析,可以更好地理解和应用完全信息动态博弈模型。
博弈论——完全信息动态博弈
2 完全信息的动态博弈2.1完全和完美信息的动态博弈动态博弈(dynamic game):参与人在不同的时间选择行动。
完全信息动态博弈指的是各博弈方先后行动,后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合下所有参与人相应的得益都完全了解的博弈静态博弈习惯用战略式(Strategic form representation)表述,动态博弈习惯用扩展式(Extensive form representation)表述。
战略式表述的三要素:参与人集合、每个参与人的战略集合、由战略组合决定的每个参与人的支付。
扩展式表述的要素包括:参与人集合、参与人的行动顺序、参与人的行动空间、参与人的信息集、参与人的支付函数、外生事件(自然的选择)的概率分布。
n人有限战略博弈的扩展式表述用博弈树来表示1(1,2) (0,3)①结:包括决策结和终点结。
决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。
第一个行动选择对应的决策结为“初始结”,用空心圆表示,其它决策结用实心圆表示。
X表示结的集合,x X表示某个特定的结。
z表示终点结,Z表示终点结集合。
表示结之间的顺序关系,x x´表示x在x´之前。
x之前所有结的集合称为x的前列集,x之后所有结的集合称为x的后续集。
以下两种情况不允许:前者违背了传递性和反对称性;后者违背了前列节必须是全排序的。
在以上两个假设之下,每个终点结都完全决定了博弈树的某个路径。
②枝:博弈树上,枝是从一个决策结到其直接后续结的连线,每一个枝代表参与人的一个行动选择。
在每一个枝旁标注该具体行动的代号。
一般地,每个决策结下有多个枝,给出每次行动时参与人的行动空间,即此时有哪些行动可供选择。
③信息集(information sets):博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结集合称为一个信息集。
博弈树上的所有决策结分割成不同的信息集。
每一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结。
博弈论与信息经济学-非合作博弈理论
例2.2 石头、剪刀、布的支付矩阵
乙 甲
石头 剪刀
石头
0,0 -1,1
剪刀
1,-1 0,0
布
-1,1 1,-1
布 1,-1 -1,1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解
乙 甲 上 中 下
左
0,4 4,0 3,5
策 略:政 济
府:救济,不救
不找工作
下岗工人:找工作,
工人 政府
救济
找工作 不找 3,2 -1,3
不救济 -1,1 0,0
求出性别大战博弈的混合策略纳什均衡
女
足球
男
足球 3,2
芭蕾 1,1
芭蕾 -1,-1 2,3
第五节 纳什均衡的存在性
定理1:(Nash, 1950)每个有限策略型博弈至 少存在一个纳什均衡(纯策略的或混合策略的)。
上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
中上下 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1
下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
例2.4 性别大战(battle of the sexes)
局中人:男,女 策 略:男:看足球,看芭蕾 女:看足球,看芭蕾 支付矩阵:见下一页
性别大战的支付矩阵
女 男
足球
足球 3,2
芭蕾 1,1
芭蕾
-1,-1
2,3
第二节 重复剔除严格劣策略均衡
博弈论与信息经济学GameTheoryandInformationEconomics课件
而提出改造世界的方案,设计出各种在 信息不对称情况下保障市场有效运转的 机制是另一大贡献,甚至认为是更大的 贡献。
一 博弈论与信息经济学
博弈论
给定信息结构,求均 衡结果 均衡理论 方法论导向 实证的
信息经济学
给定信息结构,求契 约安排 契约设计理论 问题导向 规范的
模型
隐藏行动的道德 风险
隐藏信息的道德 风险
逆向选择风险
信号传递和信息 甄别
委托人
地主 股东 住户 公民 社会 雇主 股东 原告/被告 雇主 保险公司
雇主 买方投资
代理人
佃农 经理 房东 政府官员 犯罪 雇员 经理 代理律师 雇员 投保人
工人 卖方
行动、类型或信号
耕作努力 工作努力 房屋修缮 廉洁或贪污 偷盗的次数 任务的难易/工作努力 市场需求/投资决策 赢的概率/办案努力 工作技能 感染爱滋病病毒
险模型
时
非对称发生在事前(签约前),逆向选择模型;
间
非对称发生在事后(签约后),道德风险模型。
研究不可观测行动的模型称为隐藏行动模型;
研究不可观测信息的模型称为隐藏信息(或知识)模型
隐藏行动的道德风险
签约时信息是对称的
高
接受
选择行动
提供合同
努力或不 自然
努力
代理人
低
委托人
代理人 不接受
某些可 观测的 结果
作为博弈者,最佳策略是最大限度地利 用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社会 整体福利增加。
第六章 委托-代理理论(I)
一 博弈论与信息经济学 二 信息经济学的分类 三 委托-代理理论的分析思路和框架 四 对称信息下的最优合同
2 yan完全信息动态博弈
3 战略式表述下的纳什均衡Ⅱ
NE(不开发,{开发,开发}):B威胁无论A是否开发自己都将 开发,A相信了威胁,则最好选择不开发;如果A选择不开 发,则B选择{开发,开发}是最优的。 A会相信B的威胁吗?如果A选择了开发,B的最好选择不 开发。——B的威胁是不可置信的(not credible) :给定A选择 了“开发”,“开发”不是B的最优选择。 (不开发,{开发,开发})不会是该博弈合理的均衡。为什么?
不开发策略:不论A开发不开发我不开 发)——{不开发,不开发};
(-3,-3)
(1,0) (0,1)
(0,0)
战略空间为:{开发,开发}、{开发, 不开发} 、{不开发,开发} (不开发, 不开发}。
3 战略式表述下的纳什均衡Ⅰ
B
{开发 ,开发} {开发,不开发} {不开发,开发} {不开发,不开发}
B
不开发 开发
B
不开发 开发
B
不开发 开发
B
开发
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8)
(0,0)
(0,1)
(0,0)
房地产开发博弈
1 动态博弈的扩展式表述Ⅴ
静态博弈用扩展式表述。例囚徒困境博弈 A
坦白 抵赖 坦白
B
抵赖
B
抵赖 坦白
B
抵赖 坦白
A
坦白 抵赖
A
抵赖
坦白
(-8,-8)
2 完全衡 子博弈精炼纳什均衡 子博弈精炼纳什均衡应用举例
2 完全信息动态博弈
参与人的行动有先后顺序,且后行动者能够观察到先行动 者的行动。 先行动者的选择影响后行动者的选择空间,后行动者可 以观察到先行动者做了什么选择,因此,为了做出最优的行 动选择,每个参与人都必须这样思考问题:如果我如此选 择,对方将如何应对?给定他的应对,什么是我的最优选 择?
博弈论完全且完美信息动态博弈.ppt
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
能否找到子博弈?
好1差
1 不卖
1
卖
卖
不卖
2
(0,0) (0,0)
买 不买
买 不买
(2,1)
(0,0)
(1,-1)
(-1,0)
二手车交易扩展形
结论:
(1)子博弈不能包括原博弈的第一阶段, 即动态博弈本身不会是它自己的子博弈;
(2)子博弈必须有一个明确的初始信息集, 以及必须包含初始阶段之后的所有博弈 阶段,即子博弈不能分割任何信息集或在 有多节点信息集的不完美信息博弈中可 能不存在子博弈。
3.3 子博弈和子博弈完美纳什均衡
3.3.1 子博弈 3.3.2 子博弈完美纳什均衡
3.3.1 子博弈
定义:由一个动态博弈 第一阶段以外的某阶段 开始的后续博弈阶段构 成的,有初始信息集和 进行博弈所需要的全部 信息,能够自成一个博 弈的原博弈的一部分, 称为原动态博弈的一个 “子博弈”。
乙 借
第三种开金矿博弈中, (不借-不打,不分)和 (借-打,分)都是纳什均衡。但后者不可信,不 可能实现或稳定。
结论:纳什均衡在动态博弈可能缺乏稳定性,也就 是说,在完全信息静态博弈中稳定的纳什均衡,在 动态博弈中可能是不稳定的,不能作为预测的基础。
根源:纳什均衡本身不能排除博弈方策略中包含的 不可信的行为设定,不能解决动态博弈的相机选择 引起的可信性问题
《博弈论与信息经济学》
第三章
完全且完美信息动态博弈
本章讨论动态博弈,所有博弈方都对博弈 过程和得益完全了解的完全且完美信息动态博 弈。这类博弈也是现实中常见的基本博弈类型。 由于动态博弈中博弈方的选择、行为有先后次 序,因此在表示方法、利益关系、分析方法和 均衡概念等方面,都与静态博弈有很大区别。 本章对动态博弈分析的概念和方法,特别是子 博弈完美均衡和逆推归纳法作系统介绍,并介 绍各种经典的动态博弈模型。
第二章完全信息动态博弈篇章
i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型
用逆向归纳法求解,首先考虑给定q1的情况下,企业2 的最优选择。企业2的问题是:
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着:
轮流出价的讨价还价模型
一般来说,如果 0 i 1, i 1, 2均衡结果不 仅依赖于贴现因子的相对比率,而且依赖于博 弈时间长度T和谁在最后阶段出价。然而这种 依存关系随T的变大而变小;当T趋于无穷大时 ,我们得到“先动优势”:即如果 1 2 唯 一的均衡是 x 1 (1 ). 定理(Rubinstein 1982):在无限期轮流出价 博弈中,唯一的子博弈精炼纳什均衡结果是: 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵 (仅考虑整数)
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
•
一 博弈扩展式表述
二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 应用举例 斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎 旅行者困境 五 重复博弈
轮流出价的讨价还价模型(1)
博弈论与信息经济学讲义2012-2下+_2012[1].2.29晚_
纳什均衡与占优战略均衡及重复剔除的占优均 衡:
(1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡; (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
练习: 找出下列两队夫妻的纳什均衡
妻子 活着 恩爱夫妻 丈夫 活着 死了
2,2 0,-6
三 重复剔除的占优均衡
注意: 与占优战略均衡中的占优战略和劣战略不 同,这里的占优战略或劣战略可能只是相对于 另一个特定战略而言。
三 重复剔除的占优均衡
案例2-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 0,0 4大于1 0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
木村 北 北 肯尼 南 南
2,-2 1,-1
2,-2 3,-3
三 重复剔除的占优均衡
练习:在下列战略式表达中,找出重复剔除的 占优均衡
C1 R1 R2 R3
4,3 2,1 3,0
C2
5,1 8,4 9,6
C3
6,2 3,6 2,8
三 重复剔除的占优均衡
注意:
1、严格占优战略下,重复剔除的占优均衡结果 与劣战略的剔除顺序无关;弱占优战略下,重 复剔除的占优均衡结果与弱劣战略的剔除顺序 有关。 2、重复剔除的占优均衡要求每个参与人是理性 的,而且要求“理性”是参与人的共同知识。 即:所有参与人知道所有参与是理性的,所有 参与人知道所有参与人知道所有参与是理性的
博弈论与信息经济学教学大纲
《博弈论与信息经济学》教学大纲(2014年秋季)教学目的学生将学习和运用一系列的经济学分析工具来研究各种策略互动行为,例如纳什均衡、逆向归纳和贝叶斯均衡等。
它涵盖的内容包括完全和不完全信息下的静态博弈,完全信息和不完全信息下的动态博弈,逆向选择和道德风险等。
本课程的学习可以培养学生们策略思维的技巧和习惯,并运用博弈论的基本原理来理解和分析社会、经济和商业生活中的策略行为。
预备知识微积分学和概率论课程语言教材·《策略与博弈:理论及实践》,(美)杜塔(Dutta) 著,上海财经大学,2005版。
·《博弈论基础》,吉本斯,中国社会科学出版社,1999年版。
参考书·《策略博弈》(第二版),阿维纳什迪克西特和苏珊斯克丝著,中国人民大学出版社,2009年版;·《妙趣横生的博弈论》,阿维纳什•迪克西特和巴里•纳尔伯夫著机械工业出版社,2009年;考核方式作业与课堂参与:25%;期中考试:25%;期末考试:50%。
期中考试和期末考试均采用闭卷形式。
考试期中考试时间和地点见课堂通知,除重大疾病外,不接受缓考申请;期末考试时间地点见教务处通知。
学术诚实涉及学生的学术不诚实问题主要包括考试作弊、作业抄袭、伪造或不当使用在校学习成绩、未经老师允许获取、利用考试材料;对于学术不诚实的最低惩罚是考试给予0分,其他的惩罚包括通告学校相关部门并按照有关规定进行处理。
教学内容与课时安排按每周4课时,13周总52课时设计,实际教学进度将根据情况进行适当调整。
有【*】标记章节为选讲部分,由任课老师自主选择。
第一部分:完全信息静态博弈(预估14课时)1.策略式博弈表示2.占优策略3.重复剔除严格劣策略4.纯策略纳什均衡5.补充:期望效用与风险厌恶6.混合策略纳什均衡第二部分: 完全信息动态博弈(预估8课时)7.扩展式博弈表示8.逆向推理9.子博弈完美纳什均衡(SPE)10.重复博弈第三部分:不对称信息博弈(预估30课时)11.道德风险12.不完全信息静态博弈13.机制设计与差别定价【*】14.拍卖15.不完全信息动态博弈【*】16.逆向选择与信号传递。
博弈论第二章——博弈规则
U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论与信息经济学讲义09_10_
声誉:有信誉的商店、品牌货 标准化:麦当劳
逆向选择
描述几种卖主能使买主相信他们产品是 高质量的方法,哪种方法适用于下列产 品: 梅泰洗衣机、汉堡王汉堡、大钻石。
第八章 逆向选择与信号传递
一 逆向选择-旧车市场 二 保险市场上的逆向选择问题 三 逆向选择与信贷市场上的配给制 四 信号传递-斯宾塞劳动力市场模型
非对称发生在事前(签约前),逆向选择模型; 非对称发生在事后(签约后),道德风险模型。 研究不可观测行动的模型称为隐藏行动模型; 研究不可观测信息的模型称为隐藏信息(或知识)模型
第八章 逆向选择与信号传递
一 逆向选择-旧车市场 二 保险市场上的逆向选择问题 三 逆向选择与信贷市场上的配给制 四 信号传递-斯宾塞劳动力市场模型
四
信号传递-斯宾塞劳动力市场模型
信号传递模型-有私人信息的一方先行动
信息甄别模型-没有私人信息的一方先行动
信号传递模型
接受 状态 发送信号 提供合同 消息 不接受
自然
状态 代理人
委托人
代理人
代理人:知道自己类型,为了显示自己的类型,代 理人选择某种信号传递自己的类型给委托人。 委托人:不知道代理人的类型,但能观测到代理人传递的信号,在 观测到信号后与代理人签定合同。
信号传递模型
例子:雇主与雇员
雇员知道自己的能力,雇主不知 道;为了显示自己的能力,雇员选择 接受教育水平;雇主根据教育水平支 付工资。
委托人:雇主
代理人:雇员
信号传递模型
劳动力市场:信息不对称,劳动者对他们能 提供的劳动的质量比厂商知道得多。
完全信息动态博弈 经典例子
完全信息动态博弈经典例子完全信息动态博弈是博弈论中的一个重要概念,指的是博弈参与者在做决策时拥有完全的信息。
下面是符合要求的10个完全信息动态博弈的经典例子:1. 拍卖场景:假设有两个竞拍者参与一场拍卖,他们都知道对方的出价和拍卖物品的价值,他们需要根据对方的出价和自己对拍卖物品价值的估计来决定自己的出价。
2. 囚徒困境:两名囚犯被关押在不同的牢房中,检察官给他们一个选择,如果他们都保持沉默,那么都只会被判轻罪;如果其中一个人供出另一个人,供出者会被判轻罪,而另一个人则会被判重罪;如果两人都供出对方,那么都会被判重罪。
囚犯在做出决策时,都知道对方的选择和可能的后果。
3. 企业竞争:两家竞争对手企业同时决定是否要进入一个新市场。
如果只有一家企业进入市场,它将获得垄断地位,赢得较高的利润;如果两家企业都进入市场,将会有激烈的竞争,利润都会下降。
两家企业在做出决策时,了解对方的行动和可能的后果。
4. 汽车悖论:假设有两辆车同时行驶在一条单行道上,它们需要决定是否要超车。
如果只有一辆车超车,它将获得更快的到达目的地的时间;如果两辆车同时超车,将会导致交通堵塞,两辆车的到达时间都会延长。
两辆车在做出决策时,了解对方的行动和可能的后果。
5. 资源分配:假设有两个人需要共同分配一笔资源,他们都知道对方对资源的需求和自己对资源的评估。
他们需要根据对方的需求和自己的评估来决定如何分配资源。
6. 股票交易:假设有两个投资者同时决定是否要买入或卖出某只股票。
他们都知道对方的交易意向和市场的情况,他们需要根据对方的交易意向和市场情况来决定自己的交易策略。
7. 网络安全攻防:假设有两个黑客分别掌握了对方的攻击技术和防御技术。
他们需要根据对方的技术和自己的技术来决定如何进行攻击或防御。
8. 购物决策:假设有两个消费者同时决定是否要购买某个商品。
他们都知道对方的购买意向和商品的价格,他们需要根据对方的购买意向和商品的价格来决定自己的购买策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(0,0)
21 22 23 24
S1 {开发,开发}—威胁战略 S 2 {开发,不开发}—跟随战略 S 3 {不开发,开发}—差异化战略 S 4 {不开发,不开发}—放弃战略
扩展式表达博弈的纳什均衡
则:
21 22 23 24 21 23 22 24
(即如果A开发,B不开发;如果A不 开发,B开发),因此(开发,{不开
x’
开发 不开发
发,开发})是这个博弈的唯一的子博
弈精炼纳什均衡。
(0,1)
(0,0)
子博弈(c)
子博弈精炼纳什均衡
用逆向归纳法求解子博弈精炼纳什均衡: 假定博弈有两个阶段,第一阶段参与人1行动,第二阶段 参与人2行动,并且2在行动前观测到1的选择。 令A1是参与人1的行动空间,A2是参与人2的行动空间。
(0,0)
子博弈精炼纳什均衡
例:
U (2,0) L 1 D 2 R 1 D’ (0,2)
Step1:参与人1(第二次行动)——U’ Step2:参与人2——L Step3:参与人1——U 所以,精炼均衡({U,U’},L)
(1,1) U’ (3,0)
用逆向归纳法求解子博弈精炼纳什均衡的过程,实质是重复剔除劣 战略过程在扩展式表述博弈上的扩展:从最后一个决策结开始依次剔除 掉每一个子博弈的劣战略,最后生存下来的战略构成精炼纳什均衡。
在扩展式表述博弈中,所有n个参与人的一个纯战略组合s= (si,…,sn)决定了博弈树上的一个路径。每一个战略组合 (即博弈树的路径)决定了一个支付向量u=(u1,…,un)。 战略组合si*是扩展式博弈的一个纳什均衡,如果对于所有 的i,si*最大化 u ( s s ) ,即 i i i
ui ( si s i ) ui ( si s i ).si si
子博弈精炼纳什均衡
现在以上例进行说明:
A
开发
不开发
这个博弈有三个子博弈,除原博弈外,子 博弈(b)和(c)实际上是两个单人博弈(即在 每个博弈中,只有开发商B在决策)。
x’ x
开发 (-3,-3) 不开发 (1,0) 开发 (0,1)
B
开发
B x
开发 不开发
x’
不开发 (0,0)
不开发
(0,1) ( -3 , -3 ) (1,0)
纳什均衡(不开发,{开发,开发})中B的均衡 战略{开发,开发}在子博弈(c)上构成纳什均衡, 但在子博弈(b)上不构成纳什均衡,因此,(不开 发,{开发,开发})不是一个子博弈精炼纳什均 衡; 同理,纳什均衡(开发,{不开发,不开发})中 B的均衡战略{不开发,不开发}在子博弈(b)上构 成纳什均衡,但在子博弈(c)上不构成纳什均衡, 因此, (开发,{不开发,不开发})也不是一个 子博弈精炼纳什均衡。
不开发 开发
(0,1) ( -3 , -3 ) (1,0)
(0,0)
子博弈精炼纳什均衡应用举例
1.斯坦科尔伯格寡头竞争模型 例: 市场上有两家企业,企业 1 首先选择产量
博弈树
博弈的扩展形(即博弈树)构造,包括结、枝和信息集。
(1) 结:包括决策结和终点结两类。决策结是参与人
采取行动的时点,终点结是博弈行动路径的终点。
用 X 所有结的结合, x X 表示某个特定的结。 用 " " x x' '意味着 x在 x ' ' 之前。 表示定义在X上的顺序关系: 假定 " " 满足传递性和反对称性,从而意味着顺序关系 " " 是半序的,即有些结之间是不可比较的。
注意:因为一个参与人的纳什均衡战略是假定其他参与人的战略为给 定时在最优战略,所有参与人似乎时在同时选择战略。但这并意味着 在纳什均衡中,参与人一定是在同时选择行动。
扩展式表达博弈的纳什均衡
在扩展式表述博弈中,混合战略被称为“行为战略”以 区别于战略式表述博弈的混合战略概念。行为战略是指 参与人在每一个信息集上随机地选择行动。一个行为战 略规定了对应每一个信息集的行动集合上的概率分布, 且不同信息集上的概率分布是独立的。每一个行为战略 组合b=(b1,…,bn)给出一个支付空间上的概率分布。 b*=(b1*,…,bn*)是一个行为战略纳什均衡,如果没 有任何参与人可以通过选择其他行为战略增加自己的期 望效用。
博弈树
(3)信息集:博弈树上的所有决策结分割成不同的信息集。 每一个信息集是决策结集合的一个子集,该子集包括所有 满足下列条件的决策结:
①每一个决策结都是同一参与人的决策结。
②该参与人知道博弈进入该集合的某个决策结,但不知道自 己究竟处于哪一个决策结。
引入信息集的目的是描述下列情况:当一个参与人要作出
完美回忆:指没有参与人会忘记自己以前知道的事情,所 有参与人都知道自己以前的选择。
扩展式表达博弈的纳什均衡
为了说明如何从扩展式表达构造战略式表达,让我们考虑 房地产开发博弈的例子。假定在博弈开始之前自然就选择 了“低需求”,并且已成为参与人的共同信息;再假定开 发商A先决策,开发商B在观测到A的选择后决策。那么, 博弈的扩展式表述如图所示。
承诺行动与子博弈精炼纳什均衡
有些纳什均衡之所以不是精炼均衡,是因为他们包含了不可置信的威 胁战略。这一点意味着,如果参与人能在博弈之前采取某种措施改变 自己的行动空间或支付函数,原来不可置信的威胁就可能变得可置信, 博弈的精炼均衡就会相应改变。我们将这些为改变博弈结果而采取的 措施称为“承诺行动”。 有些情况下,一个参与人可以通过减少自己的选择机会使自己受益, 原因在于保证自己不选择某些行动可以改变对手的最优选择。这样的 承诺是完全承诺。
博弈树
( 2 )枝:在博弈树上,枝是从一个决策结到它的直接后续 结的连线(有时用箭头表述),每一个枝代表参与人的一 个行动选择。并且,当且仅当参与人选择不同的行动时, 从一个给定的结出发博弈才会到达不同的直接后续结。博 弈树的枝不仅完整地描述了每个决策结参与人的行动空间, 而且给出了从一个决策结到下一个决策结的路径。正因为 如此,每一个终点结才完全决定了博弈树的路径。
1 2 1 2 1 2 1 2
上例说明:一个行为战略可能对应多个混合战略;但逆定理不成立,即一 个混合战略只对应一个行为战略。
库恩(Kuhn,1953)证明,在完美回忆博弈中,混合战 略和行为战略是等价的。
子博弈精炼纳什均衡
例:
A
开发
从上一节讨论中,可得三个纳什均衡:
不开发
B
开发 不开发 开发
这个博弈的子博弈精炼 纳什均衡为( a1 , a2 (a1 ))。
子博弈精炼纳什均衡
例:
A
开发 不开发
Step1:B的最优行动规则—— 差异化战略S3={不开发,开发}
Step2:A——开发
不开发
B
开发 不开发 开发
B
所以,精炼均衡是(开发,{不 开发,开发})
(0,1) ( -3 , -3 ) (1,0)
博弈论
任课教师: 南京航空航天大学 经管学院
李帮义 教授
博弈论与信息经济学
第二章 完全信息动态博弈
博弈的扩展式表述
博弈的扩展式表述包括以下要素: 1.参与人的集合:i=1,…,n. N—虚拟参与人“自然”。 2.参与人的行动顺序:谁在什么时候行动。 3.参与人的行动空间:在每次行动时,参与人有些什么选择。 4.参与人的信息集:每次行动时,参与人知道些什么。 5.参与人的支付函数:在行动结束之后,每个参与人得到些 什么(支付是所有行动的函数)。 6.外生事件(即自然的选择)的概率分布。
(0,0)
(b)子博弈Ⅰ
(c)子博弈Ⅱ
如前所述,这个博弈有三个纳什均衡:(不开发,{开发,开发}); (开 发,{不开发,开发}); (开发,{不开发,不开发})
子博弈精炼纳什均衡
检验这三个纳什均衡是否满足子博弈精炼纳什均衡的要求。
x
开发 不开发
在子博弈(b),B的最优选择是不开发;在子博 弈(c),B的最优选择是开发。
A
开发 不开发
B
开发 (-3,-3) 不开发 开发
B
不开发 (0,0)
(1,0) (0,1)
这是一个完美信息博弈(每个人的信息集都是单结的)。
扩展式表达博弈的纳什均衡
为了构造出这个博弈的战略式表述,首先注意到,A只有一个 信息集,两个可选择的行动,因而A的行动空间也即战略空 间:SA=(开发,不开发)。但B有两个信息集,每个信息集上 有两个可选择的行动,因而B有四个纯战略,分别为: 1.不论A开发还是不开发,我开发—威胁战略S1=(开发,不开发). 2.A开发我开发,A不开发我不开发—跟随战略S2=(开发,不开发). 3.A开发我不开发,A不开发我开发—差异化战略S3=(不开发,开 发). 4.不论A开发还是不开发,我不开发—放弃战略S4=(不开发,不 开发).
参与人1: 参与人2: Step1:a1 A1源自支付函数 u1 (a1 , a2 )
a2 A2 支付函数 u2 (a1 , a2 )
max u 2 ( a1 , a 2 ) a 2 ( a1 ) a 2 A2
Step2:
maxu1 (a1 , a2 (a1 )) a1
博弈树
定义 P( x) 为在 x 之前的所有结的集合,简称为 x 的前列集。 如果 P( x) ,x 称为初始结。
定义 T ( x) 为在 x 之后的所有结的集合,简称为 x 的后续集。
如果 T ( x) , x 称为终点结。
除了终点结之外的所有结都是决策结。 在图示中,用空心圆“○”代表初始结,实心圆“●” 代表其他决策结。
扩展式表达博弈的纳什均衡
例: