第三章经济博弈论
第三章信息经济学的研究方法—博弈论
第一节 概述-人生处处皆博弈
人生是永不停歇的博弈过程,博弈意 略达到合意的结果。
作为博弈者,最佳策略是最大限度地 利用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社 会整体福利增加。
一、博弈论的定义
博弈论(game theory,又译为对策论,游戏论)
定义:研究决策主体的行为在直接相互作用时,人们如 何进行决策、以及这种决策如何达到均衡。
五、博弈论与信息经济学
博弈论是给定信息结构求均衡结果,它实际上是一种均衡理论, 我们最终要找的是一个均衡的结果,博弈论是方法论导向的, 它实际上是一种解决问题的方法。它是一个实证的方法。
信息经济学是给定信息结构求契约的安排。它实际上是一种契 约设计理论,它是问题导向的。它是一个规范的方法。
石匠的决策与拳击手的决策的区别
一、博弈论的定义
2、理性人假设 理性人是指一个很好定义的偏好,在面临给定的约束条件下
最大化自己的偏好。
博弈论说起来有些绕嘴,但理解起来很好理解,那就是 每个对弈者在决定采取哪种行动时,不但要根据自身的利益 和目的行事,而且要考虑到他的决策行为对其他人可能的影 响,通过选择最佳行动计划,来寻求收益或效用的最大化。
(一)囚徒困境
假定: (1)每个局中人都知道博弈规则和博弈结果的支付
矩阵; (2)每个局中人都是理性的(个人理性和个人最优
决策); (3)不能“串通”
(一)囚徒困境——纳什均衡
囚徒A
坦白
坦白 囚徒 B
-8,-8
抵赖 -10,0
抵赖 0,-10 -1,-1
-8大于-10 0大于-1
(坦白,坦白)是纳什均衡
第三章 信息经济学的研究方法 ——博弈论
《经济博弈论》期末考试复习
《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。
它包括四个要素:参与者,策略,次序和得益。
2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。
即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。
即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。
各博弈方的策略选择范围称策略空间。
每个博弈方各选一个策略构成一个策略组合。
(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
(4)得益。
各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。
3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。
主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。
假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。
如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。
合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。
有限理性:博弈方的判断选择能力有缺陷。
区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。
所以不能简单地假设各博弈方都完全理性。
5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。
第一章课后题:2、4、56.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
《经济博弈论》期末考试复习解析
《经济博弈论》期末考试复习资料第一章导论1.博弈的概念:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。
它包括四个要素:参与者,策略,次序和得益。
2.一个博弈的构成要素:博弈模型有下列要素:(1)博弈方。
即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。
即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。
各博弈方的策略选择范围称策略空间。
每个博弈方各选一个策略构成一个策略组合。
(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。
(4)得益。
各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。
3.合作博弈和非合作博弈的区别:合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。
主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。
假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。
如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。
合作博弈:团体理性(效率高,公正,公平)非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率)4.完全理性和有限理性:完全理性:有完美的分析判断能力和不会犯选择行为的错误。
有限理性:博弈方的判断选择能力有缺陷。
区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。
所以不能简单地假设各博弈方都完全理性。
5.个体理性和集体理性:个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。
第一章课后题:2、4、52.设定一个博弈模型必须确定哪几个方面?设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为,以及理性的程度等。
经济博弈论
1、纳什均衡的概念。
对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。
2、非合作博弈与合作博弈的区别。
形成合作博弈的两个条件:(1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。
(2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。
如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。
也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。
这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。
因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。
3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。
纯策略是混合策略的特例。
按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。
混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。
策略组合指参与者可能采取的所有行动方案的集合。
策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。
所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。
4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博弈、完美信息动态博弈和不完美信息动态博弈博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。
经济博弈论Chapter03_331007283
描求扩证序境。
of play.参无论何时采取行动,参与者都需要考虑他们当前的行动会如何影响未来的行动,包括对手和博它动,指出了博弈的所有可能结果。
决所有的连续决策点。
decision maker in a 博策树。
博节分每一分支都从博弈树上的一个决策点指向另一个决策点或终结点。
terminal node.在一个分支;不过,仅允许有一个分支指向任何一个决将引收益。
终结点并不是所有博弈必需的;一些博弈理论上可以永远进行下去on forever我参Anode is called a 参安均会发生什么?一个名叫卡门的少女正在决定是否要吸烟。
A teenager named Carmen is deciding whether to smoke.首如不一带给她不同的感受和收益。
taste, as well as different payoffs.单门分析一开始,考虑与终结点直接相连的那些行动点。
Start analysis by considering those action nodes that lead directly to terminal nodes.在利在通沿着贯穿整个博弈树的标出的唯一路径,就知道了当所有参与者在正确预测了所有的未来后果下做出最优选择时,这当由The outcome that arises from playing these在在会,甚至根本就没出现!但是,它的可能的出现和潜在的策略在决定今日卡门的招术时发挥了作用。
三每捐但为的所有结果进行赋值(排序)。
可3不多少种?如我均参不However, the equilibrium path of play is complete specification of the rollback equilibrium.它反略得到的。
艾尼塔根在街道花园博弈的反转均衡中,艾米丽得到了最好的结果(the opportunity to make the first move.先不后当这些操纵的招术就是Tactics for such manipulation are第第第第第第第三步:反转求解Step 3: Rollback第一它Slide 47一但一国然对实考有人拿出下。
经济博弈论第三章
本章讨论完全且完美信息动态博弈。
本章对动态博弈分析的概念和方法, 特别是子博弈完美均衡和逆推归纳法作系 统介绍,并介绍各种经典的动态博弈模型。
本章分六节
3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论
斯塔克博 格模型 先后
> < < 厂商1 >;厂商2 <
古诺模型
同时
选择次序 总产量 价格 总利润 各自利润
3.4.2 劳资博弈
先由工会决定工资率,再由厂商决定雇用多少劳动力。 工会效用:u(W,L),厂商得意:∏(W,L)=R(L)- W×L
max (W , L) max [ R ( L) WL]
不制止 (5,5)
(10,4)
3.1.2 动态博弈的基本特点
策略是在整个博弈中所有选择、行为 得益对应一条路径
动态博弈的非对称性——先后次序决定动 态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有 “先行优势”。
3.2 可信性和纳什均衡的问题
3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法
3.4.1 寡占的斯塔克博格模型
先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而非同 时选择即可。
Q q1 q2 , P P(Q) 8 Q
c1 c2 2
2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12 u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q2
经济博弈论ppt课件
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
经济博弈论潘
1.1.2 定义
博弈-----个人、队组或其他组织,面对一定的环境条件,在一定的 规则下,同时或先后,一次或多次,从各自允许选择的行为或策 略中进行选择并加以买施,并从中各自取得相应结果的过程。
一个博弈需要设定下列4个方面: (1)博弈的参加者 (2)各博弈方各自可选择的全部策略或行为的集合。 (3)进行博弈的次序。 (4)博弈方的得益。
而“非合作博弈”则是指在各博弈方之间不能存在任何有约束力的协 议,也就是说各博弈方不能公然“串通”、“共谋”的博弈问题。
1.1.3 博弈论研究的历史和发展述评
产量决策的古诺(Cournot)模型
价格决策的伯特兰德(Bertrand)模型
本世纪20年代,法国数学家波雷尔(Borel)用最佳策略的概念研究了下 棋和其他许多具体的决策问题,并试图把它们作为应用数学的分支加 以系统研究 1944年诺依曼(Neumann)和摩根斯坦(Morgensten)合著的《博弈论和 经济行为》一书的出版标志着系统的博弈理论的初步形成。
1.2.2齐威王与田忌赛马
传说齐威王经常要大将田忌与他赛马,赛马的规则是这样的:每次双 方各出三匹马,一对一比赛三场,每一场的输方要赔一千斤铜给赢方。 齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等。由 于齐威王的上、中、下三匹马都分别比田忌的上、中、下三匹马略胜
一筹,因此田忌每次都是连输三场,要输掉三千斤铜。实际上,田忌 的上马虽不如齐威王的上马,却比齐威王的中马和下马都要好,同样, 田忌的中马则比齐威王的下马要好一些,田忌每次都连输三场是有些 冤枉的。后来田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自 己的上马去对抗齐威王的上马,而是用下马去对抗齐威王的上马,上 马则去对抗齐威王的中马,中马去对抗齐威王的下马。 田忌的谋士孙膑给田忌出了个主意,即让田忌不要用自己的上马去对 抗齐威王的上马,而是用下马去对抗齐威王的上马,上马则去对抗齐 威王的中马,中马去对抗齐威王的下马。这样,虽然第一场田忌必输 无疑,但后两场田忌却都能赢,二胜一负,田忌反而能赢齐威王一千 斤铜。 这个著名的故事生动地告诉我们巧用策略是多么的重要,在实力、条 件一定的情况下,对已方力量和有利条件的巧妙调度和运用常会起到 意想不到的效果。
经济博弈论(第三章)
第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。
现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。
这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。
依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。
例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。
动态博弈由于添加了时间因素,因而更加贴近现实。
根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。
在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。
3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。
动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。
一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。
此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。
设有一个商人要从A 地向B 地运输一批货物。
《经济博弈论》PPT课件
二、应用
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
该博弈不存在上策均衡
14
严格下策反复消去法:
博 弈上 方 1下
博弈方2 左中 右 1,0 1,3 0,1 0,4 0,2 2,0
博 弈
上
方 1
下
博弈方2 左中 1,0 1,3 0,4 0,2
策略组合(上,中)
➢ 由此导出了博弈分析中的严格下策反复消去法。
11
例:囚徒困境
对囚徒困境博弈中的两个博弈方来说不管对方的策略如何,各自 两种可选策略中的“坦白”策略都比“不坦白”策略来得好
囚徒 乙
坦白
不坦白
囚 坦白 徒 甲
不坦白
-5, -5 -8, 0
0, -8 -1, -1
两个罪犯的得益矩阵
这时我们称“不坦白”是两个博弈中的相对于“坦白”策略的 “严格下策”。
此时该方法失效,失效的根源是策略的相互依存性, 他们之间可能没有严格的依存关系。
严格下策反复消去法是博弈分析的标准工具之一。
16
2.1.3 划线法
博弈方的最终目标都是实现自身的最大得益。 在具有策略和利益相互依存性的博弈问题中,各个博弈
方的得益既取决于自己选择的策略,还与其他博弈方选 择的策略有关,因此,博弈方在决策时必须考虑其他博 弈方的存在和策略选择。
24
箭头法分析囚徒困境
囚 坦白 徒 1 不坦白
囚徒2 坦白 -5,-5
-8,0
不坦白 0,-8 -1,-1
25
箭头法分析例子
博弈方2
博
左
中
右
弈 方
上
1, 0
1, 3
经济博弈论
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。
经济博弈论谢识予
策略
每个囚犯都有坦白和抵赖两种策略。 在给定对方策略的情况下,每个囚 犯都追求自身利益最大化。
结果
最终的结果往往是两个囚犯都选择 坦白,这并不是最优解。
智猪博弈
描述
智猪博弈描述了两个实力不同的 大猪在猪圈里抢食的情况。
策略
大猪可以选择主动去踩踏板,小 猪可以选择等待。
结果
最优策略是小猪等待,大猪踩踏 板。
有多个参与者,如市场结构、政策制 定等。
双人博弈
有两个参与者,如商业竞争、合作、 贸易关系等。
博弈的策略与行动
01
02
03
纯策略
指参与者采取的明确行动 方案,不涉及概率。
混合策略
指参与者以一定概率采取 不同行动,以达到最佳预 期结果。
反应函数
描述参与者如何根据对手 的策略选择自己的最优策 略。
博弈的结果与均衡
可以更全面地分析经济问题。
跨学科研究
借鉴其他学科的研究方法和成果,如心理 学、社会学和政治学等,可以丰富博弈论
的应用领域和解释力。
实证研究
通过实证研究来检验博弈论的预测和结论, 不断完善和发展博弈论在经济领域的应用。
提高政策制定水平
通过应用博弈论分析政策制定中的利益关 系和策略互动,可以提高政策制定的科学 性和有效性。
动态博弈和演化博弈
多智能体系统
研究将更加关注博弈的动态性和演化性, 以更好地解释现实世界中的长期策略互动 和变化。
结合人工智能和博弈论,构建多智能体系 统,模拟更复杂的策略互动和集体行为。
06
结论
博弈论对经济分析的贡献
解释经济行为
博弈论通过分析参与者的策略互动,能够解释市场中的竞争行为、 合作行为以及经济主体的决策过程。
博弈论与信息经济学不完全信息静态博弈
参加人i懂得自己旳类型 i i ,条件概率 pi pi (i i ) 描述 给定自己属于 i 旳情况下,参加人i有关其他参加人类型 i i旳不拟定性。我们用 G {A1,, An ;1,,n ; p1,, pn ;u1,,un} 代表这个博弈。
j
bi
aj cj
bi
aj cj
ui (vi bi ) P bi b j v j
1 2 (vi
bi ) P
bi
bj
vj
(vi
bi )
bi
aj cj
求导得:bi vi
1 2
vi
1 2
aj
由于bi vi
ci vi
ai
ci
1 2 , ai
1 2 aj
0
综上所述,bi vi
贝叶斯均衡是一组战略组合源自(a1.,a
2
.)
,使得对于每一
种
i
和每一种可能旳 ci
,战略
a
i
(.)最大化参加人
i
旳期望
效用函数
Ec
j
ui
(ai
,
a
j
ci
,
ci
)
。令
z
j
Pa j c j 1为均衡状
态下参加人 j 提供旳概率。最大化行为意味着,只有当参加
人 i 预期参加人 j 不提供时,参加人 i 才会考虑自己是否提
懂得(成本ci 是参加人 i 旳类型)。 c1和 c2 具有相同旳、独立旳定义在[c, c]
上旳分布函数,且是共同知识。
经济博弈论(山东联盟) 智慧树知到网课章节测试答案
1、选择题:设定博弈模型必须确定的方面包括选项:A:博弈方B:策略C:得益D:博弈次序E:信息结构F:行为逻辑和理性程度答案: 【博弈方,策略,得益,博弈次序,信息结构,行为逻辑和理性程度】2、选择题:“囚徒困境”的内在根源是个体理性与集体理性的矛盾。
选项:A:对B:错答案: 【对】3、选择题:根据博弈过程,博弈可以分为选项:A:静态博弈B:动态博弈C:进化博弈D:重复博弈答案: 【静态博弈,动态博弈,重复博弈】4、选择题:根据博弈方的行为逻辑,是否允许存在有约束力协议,博弈可以分为选项:A:零和博弈B:非合作博弈C:变和博弈D:合作博弈答案: 【非合作博弈,合作博弈】5、选择题:单人博弈就是个人最优化决策,与典型的博弈选择题有本质区别。
选项:A:对B:错答案: 【对】1、选择题:重复剔除劣战略的计算步骤依次是(A)→(B)→(C)→(D)A、找出某个参与人的劣战略,把这个劣战略剔除掉B、重新构造一个不包含已剔除战略的新的博弈C、然后再剔除这个新的博弈中的某个参与人的劣战略D、继续这个过程,一直到只剩下一个唯一的战略组合为止选项:A:对B:错答案: 【对】2、选择题:对于参与人A和B构成的静态博弈,采用划线法求纳什均衡的计算步骤依次是(C)→(B)→(A)A、首先考虑A的战略,对于每一个B的给定的战略,找出A的最优战略,在其对应的支付下划一横杠,B、然后再用类似的方法找出B的最优战略。
C、在完成这个过程后,如果某个支付格的两个数字下都有杠,这个数字格对应的战略组合就是一个纳什均衡。
选项:A:对B:错答案: 【错】5、选择题:中、日两国对东海主权存在争议。
设想中国石油与日本石油这两家石油公司同时决定是否开发东海油气资源,双方在各种情况下的收益(单位:亿元)如下表所示。
该博弈的纯策略纳什均衡为选项:A:(开发,不开发)B:(不开发,开发)C:(开发,开发)D:(不开发,不开发)答案: 【(开发,不开发),(不开发,开发)】1、选择题:设一四阶段两博弈方之间的动态博弈如下图所示,子博弈完美纳什均衡策略组合双方的收益是选项:A:(5,2)B:(5,3)C:(4,2)D:(4,3)答案: 【(5,3)】5、选择题:在下列的囚徒的困境博弈的重复博弈中,如果贴现因子为1,问两博弈方都采用“开始时不坦白,在第t阶段则采用对方第t-1阶段策略”的“以牙还牙”策略,无限次重复博弈情况下,可以构成子博弈完美纳什均衡。
第3章 博弈论与信息经济学--完全信息动态博弈
二、子博弈精炼纳什均衡
第三,由于不考虑自己选择对别人选择的影响,纳 均衡允许了不可置信威胁的存在。如“市场阻挠博 弈”中,如果进入者者真的进入,在位者的最优行 动显然是默许而不是斗争,因为默许带来50的利润, 斗争则将预期的利润化为乌有。所以,斗争是一种 不可置信的威胁,
©&® by H. Q. Feng, CUFE 21/58
二、子博弈精炼纳什均衡
泽尔腾的“子博弈精炼纳什均衡”
一个纳什均衡称为精炼纳什均衡,当且仅当参与 人的战略在每一个子博弈中都构成纳什均衡。
就是说,组成精炼纳什均衡的战略必须在每一个 子博弈中都是最优的。
©&® by H. Q. Feng, CUFE
就是说,如果在位企业摆出一副“你进入我斗争”的 架势,那么进入企业不应该被这种威胁所吓倒。因 为它是不可置信的。但是,纳什均衡概念承认了这 种不可置信的威胁,所以(不进入,斗争)便成为 一个纳什均衡。
©&® by H. Q. Feng, CUFE 18/58
子博弈精炼纳什均衡-不可置信威胁
美国普林斯顿大学古尔教授1997年在《经济学透视》里发表文 章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦 的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告 状,我都把你们两个关起来,关起来比没有玩具更可怕。现 在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说: 快把玩具还我,不然我就要去告诉爸爸。哥哥想,你真要告 诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而 告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你 不会告状,因此哥哥对弟弟的警告置之不理。 的确,如果弟弟是会算计自己利益的理性人,在这样的环境下, 还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可 置信的。
信息经济学-第三章之一
二、经济博弈论主要概念及表述 (一)博弈的基本概念
局中人(players):指做决策的个体。每个局中人 的目标都是通过选择行动来使自己的效用最大化。
虚拟局中人(pseudo-players):指以一种纯机械的 方式来采取行动的个体。自然是一种虚拟局中人,它在博 弈的特定时点上以特定的概率随机选择行动。 例如: ——你要出门,要决定是否带伞 ——两个人打牌
奥曼发现,在很多现实情况中,长期合作关系的维系远比 一次简单的际遇来得容易,因此短期博弈理论往往具有很 多限制性。为此,他首先提出了完整详尽的无限期重复博 弈理论,并严格论证了何种结果能够在长时期的关系中得 到维持。
谢林于20世纪60年代出版的著作《冲突的战略》(The Strategy of Conflict),着力阐述了在双方处于僵持时,采取一些战略性手段 的重要性。这些手段包括:事先承诺、边缘政策和有威慑力的威胁。 应用在核军备竞赛方面,上述理论为美国提供了处理一个根本问题 的战略,这个问题就是如何发挥那些杀伤力极大武器的作用,由于 它们的杀伤力太大,人们并不认为会真的投入使用。
动态结构 (扩展博弈) 完全信息动态博弈 子博弈精练Nash均衡
完全信息结构
Nash均衡
Nash(1950,1951)
不完全信息静态博弈
Selten(1965)
不完全信息动态博弈
不完全信息结构
贝叶斯Nash均衡
Harsanyi(1967-1968)
精练贝叶斯Nash均衡
Selten(1975)等
信息结构与行动结构框架图
1994年诺贝尔经济学奖获得者:
美国数学家John F. Nash,德国经济学家Reinhard Selten,美籍匈牙利
经济学家John C. Harsanyi。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
不接受,出S
[S2, (10000 S2 )]
[ 2S, 2 (10000 S)]
甲第一阶段出价
S1 10000 10000 2S
乙方接受,其得益为:
10000 2S
当0.5 1时,越大,
甲的得益越大,乙的得益越小
当0 0.5时,越大,
的选择W*,满足:
max u W, L(W*)
与厂商的反应函数相切的那条无差
异曲线对应的效用,就是工会能实 现的最大效用,W*是工会实现最大 W
效用必须选择的工资率,L*(W*)
是厂商对工会的W*最佳反应。
W*
这个博弈的均衡解[W*,L*(W*)]
就是一个子博弈完美纳什均衡
0
maxu[W , L*(W )]
S1 10000 10000 2S
S S1 10000 10000 2S
S* 10000
1
10000 S* 10000 1
例:讨价还价博弈
• 两个兄弟分一块冰激凌。哥哥先提出一个分割比 例,弟弟可以接受或拒绝,接受则按哥哥的提议 分割,若拒绝就自己提出一个比例。但这时候冰 激凌己化得只剩I/2了。对弟弟提议的比例哥哥也 可以选择接受或拒绝,若接受则按弟弟的提议分 割,若拒绝冰激凌会全部化光。因为兄弟之间不 应该做损人不利己的事,因此我们假设接受和拒 绝利益相同时兄弟俩都会接受。求该博弈的子博 弈完美纳什均衡。如果冰激凌每阶段只化掉1/3, 博奔的子博弈完美纳什均衡是什么?
逆推归纳法:第一步,先分析第二阶段厂商的选择
要求厂商对工会选择的工资率W的反应函数L(W)
厂商得益函数: =(W, L)=R(L) W L
(’W, L)=R(’L) W=0
3.4.2 劳资博弈
逆推归纳法:第一步,先分析第二阶段厂商的选择 要求厂商对工会选择的工资率W的反应函数L(W)
• 再比如,在外交中,美国经常向中国承诺只承认一 个中国的原则,我国政府向国际社会承诺中国强大 也决不会采用霸权政策。大家常见的很多耳熟目详 的俗语都是承诺与威胁,比如“人不犯我,我不犯 人”、“坦白从宽,抗拒从严”、“以眼还眼,以 牙还牙”等。
借
3.2.2 纳什均衡的问题 甲
分
根据纳什均衡的定义可以判断,乙 (2,2)
厂商得益函数: =(W, L)=R(L) W L
(’W, L)=R(’L) W=0
max (W , L) max[R(L) WL]
L0
L0
R
R(L) 斜率为W
WL
0
L* (W )
L
厂商的反应函数
3.4.2 劳资博弈
逆推归纳法:第二步,再分析第一阶段工会的选择
工会知道:厂商会根据自己选择的工资率W选择雇佣工人数量L(W*),工会
的策略是第一阶段选择“借”,若第
打
乙 不借
(1,0) 不分
乙 不打
二阶段甲选择“不分”,第三阶段选 择“打”, 甲的策略是第二阶段选择
(-1,0) (0,4)
“分”。
法律保障不足 的开金矿博弈
实际结果是:乙在第一阶段不会选择 “借”,甲在第二阶段也不会选择 “分”,乙在第三阶段也不会选择 “打”。 •是不纳排结可什除果信均博相的衡弈反威在方的胁动策原。态略因博中是弈所第可包三能含阶缺的段乏不的稳可“定信打性的”的行为根设源定在,于不它能不解能
经济博弈论
第三章 完全且完美信息动态博弈
• 动态博弈的表示法和特点 • 可信性和纳什均衡的问题 • 子博弈和子博弈完美纳什均衡 • 几个经典动态博弈模型 • 有同时选择的动态博弈模型 • 动态博弈分析的问题和扩展讨论
3.1 动态博弈的表示法和特点
3.1.1 阶段和扩展性表示
• 阶段:动态博弈中一个博弈方的一次选择行为 • 仿冒和反仿冒博弈
最后结果是:
甲 分
(2,2) 打
(1,0) 不分 乙
不打
乙的完整策略是第一阶段选择 “借”,若第二阶段甲选择“不分”, 第三阶段选择“打”
甲的完整策略是第二阶段选择“分”
(1,0)
(0,4)
有法律保障的 开金矿博弈
3.2 可信性和纳什均衡的问题 3.2.1 相机选择和策略中的可信性问题
法律制度必须满足两方面的要求:一是
决动态博弈的相机选择引起的可信性问题
3.2.3 逆推归纳法
• 定义:从动态博弈的最后一个阶 段博弈方的行为开始分析,逐步 倒推回前一个阶段相应博弈方的 行为选择,一直到第一个阶段的 分 分析方法
乙
借
不借
甲
不分 (1,0)
(2,2)
(0,4)
由于逆推归纳法确定的各个博弈方在各阶段的选择,都是 建立在后阶段各个博弈方理性选择的基础上,因此自然排除了 不可信的威胁和承诺的可能性,因此它得出的结论是比较可靠 的,确定的各个博弈方的策略组合具有稳定性。
6q1
q1(3
q1 2
)
q12
3q1
1 2
q12
u1
q1
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型
厂商1 厂商2
产量 3单位 1.5单位
求得:
得益 4.5 2.25
q1* 3 q2* 1.5
比较:
古诺模型
厂商1 2单位
4
厂商2 2单位
4
比较说明:两厂商地位不对称。 厂商1具有先行优势,得到较多的 利益。同时也说明信息较多并不 一定能得到较多的利益
仿冒 A 不仿冒
阶段的行为,而是各博弈方在整个博弈中轮 到选择的每个阶段,针对前面的阶段的各种
(-2,5) B 制止
不制止(5,5)
情况作相应的选择和行为的完整计划,以及 (2,2) (10,4) 由不同博弈方的这种计划构成的组合,这种
计划称作动态博弈中博弈方的“策略”。
例如,在仿冒和反仿冒博弈中,仿冒企业A:在第一阶段仿冒, 如果第二阶段B制止,第三阶段就不仿冒,否则第三阶段继续 仿冒。仿冒企业B:在第一阶段A仿冒时第二阶段不制止,第三 阶段A继续仿冒时,第四阶段制止。
逆推归纳法
第二阶段:厂商2决策 在决策时,厂商1选择的产量q1已经确定了,厂商2知道这一点,因此 对厂商2来讲,相当于在给定q1的情况下,求使u2最大值的q2。
q2
1 2
6
q1
3
q1 2
第一阶段:厂商1决策
厂商1知道厂商2的这种决策思路,于是厂商1的得益函数转化为
u1 q1, q2*
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型
Q q1 q2 , P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2 )] 2q2 6q2 q1q2 q22
(S1,10000 S1) 接受
1 不接受,出S
[S2, (10000 S2 )]
[ 2S, 2 (10000 S)]
第三回合、甲的方案是自己得 S=10000
第二回合,乙出价S2满足: 甲:S2 2S 即S2 S
乙:(10000 -S2) (10000 -S) =10000 - 2S 10000 2 2S
W 0
L*(W ) L*(W *)
u3 u2 u1 u0
L
工会的无差异曲线
3.4.3 讨价还价博弈
• 讨价还价博弈:假设两人就如何分配1万元现金进行谈判,规 则是这样ห้องสมุดไป่ตู้首先由甲提出一个分割比例,对甲提出的比例 乙可以接受也可以不接受;如果乙不接受则他应提出另一 个方案,让甲选择接受与否……
三阶段讨价还价博弈,即第三回合甲的方案具有强制约束力
动态博弈的结果首先是指策略组合,其次是指博弈的路径, 最后是各博弈方的得益。
3.1.2 动态博弈的基本特点
动态博弈的非对称性
动态博弈的非对称性是指各博弈方的地位是不对称的。 由于后行为的博弈方有更多的信息帮助他选择行为,可 减少决策的盲目性针对性地选择,处于有利地位。 不过,信息较多的博弈方并不一定能得到更大的利益。
1
出S1
接受
2 不接受,出S2
(S1,10000 S1) 接受
1 不接受,出S
关键:
1.第三回合甲的方案有强制力; 2.消耗系数的存在,谈判时间 越长对双方都不利。
[S2, (10000 S2)] [ 2S, 2(10000 S)]
三回合讨价还价
1
出S1
接受
2 不接受,出S2
甲的得益越小,乙的得益越大
二、无限回合讨价还价
解题思路:对一个无限回合博弈来讲,从第三回合开始,还是 从第一回合开始,结果都应该是一样的。
假如从第一回合开始,甲出价S,乙接受,双方得益分别为S, 10000-S 假如从第三回合开始,甲出价S,乙接受,双方得益分别为S, 10000-S 如果把上述第三回合理解成从第一回合开始的无限回合博弈的第三回合, 那么,由于第三回合的出价是最终出价,因此该博弈相当于前面的三回 合讨价还价博弈。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
该博弈假设寡头市场上有两个厂商,与古诺模型一样,决策 内容也是产量。不同的是一方较强一方较弱,较强的一方先 选择产量,较弱的一方则根据较强的一方的产量选择自己的 产量。