经济博弈论(3)
经济博弈论3
不借
最大利益为重,甲有一个 不可信承诺,正因为此所 以使得甲乙合作最成为了
分
甲 不分
(1,0)
不可能
(2,2)
(0,4)
开金矿博弈
在本博弈中,如果已打官
借
司是可信的,则甲在第二
甲
阶段一定会选择分,则乙
在第一阶段一定会选择借, 分
所以最终(借,分)。此
例也说明晚上的法律制度 (2,2)
制度,不仅哪呢过保障社
乙 借
初始信息集和进行博弈所
甲
需要的全部信息,能够自 成一个博弈的原博弈的一 分
不分
部分,称为原动态博弈的 (2,2)
乙
一个“子博弈”。
不借 (1,0)
子博弈:即动态博弈中满足 一定要求的局部所构成的 次级博弈
(-1,0) (0,4)
二级子博弈
三级子博弈
仿冒
A 不仿冒
B
不制止 (0,10)
制止
(-2,5) 制止
(-1,0) (0,4)
衡路上的节点。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
斯塔克博格模型是动态的寡头产量博弈模型。 先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而
不委托 委托人的利益,R(E)是指较 高的产出, R(S)较低的产出,
2
接受
[R(0),0] 拒绝
w(E)是较高的报酬,代理人 要得到较高的报酬但有较高 的负效用-S, w(S)是较低的
2
[R(0),0]
报酬
代理人的选择
经济博弈论
1、纳什均衡的概念。
对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。
2、非合作博弈与合作博弈的区别。
形成合作博弈的两个条件:(1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。
(2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。
如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。
也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。
这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。
因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。
3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。
纯策略是混合策略的特例。
按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。
混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。
策略组合指参与者可能采取的所有行动方案的集合。
策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。
所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。
4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博弈、完美信息动态博弈和不完美信息动态博弈博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。
博弈论专题(经济学专题)2007.9
市场进入阻挠博弈树
(3)、概念:一个纳什均衡称为精炼纳什均衡,当且只当参 与人的战略在每一个子博弈中都构成纳什均衡,即组成精炼纳 什均衡的战略必须在每一个博弈中都是最优的。因此,(进入, 斗争)不是一个精炼纳什均衡,而(进入,合作)是惟一的子 博弈精炼纳什均衡。
* “ 不可置信——承诺行动”的例子: 谈恋爱;
(2 )扩展性博弈形式的5个要素:参与人;每个参与人选择
行动的时点;每个参与人在每次行动时可供选择的行动集合;每 个参与人在每次行动时有关对手过去行动选择的信息;支付函数。
博弈树——是扩展型的一种形象化表述。 “子博弈”
(40,50) 在位者 合作
进入 进入者
不进入
斗争 (-10,0)
(0,300)
9,-1
0,0
搜集 大股东
等待
小股东
搜集
等待
5,1
4,4
9,-1
0,0
研发 大企业
等待
小企业
研发
等待
5,1
4,4
9,-1
0,0
3、性别战:
女 足球
芭蕾
男
足球 2,1
0,0
芭蕾 0,0
1,2
先动优势:若男的买票,两人就会出现在足球场;若女的买 票,两人就会出现在芭蕾舞厅;
4、斗鸡博弈: 进
A 退
(3)纳什均衡允许了不可置信威胁的存在。在市场进入的例 子中,如果在位者摆出一幅“你进入我就斗争”的架式,(不 进入,斗争)便成为一个纳什均衡。
在位者
默许
斗争
进入 进入者
40,50
不进入 0,300
-10,0 0,300
2、泽尔腾的贡献
(1)针对静态纳什均衡的问题,泽尔腾对动态博弈进行了分析, 定义了子博弈精炼纳什均衡。将纳什均衡中不可置信威胁战略剔 除出去,使均衡战略不再包含不可置信的威胁。它要求参与人的 决策在任何时点上都是最优的。决策者要“应变”,而不是 “固守”。
经济博弈论Chapter03_331007283
描求扩证序境。
of play.参无论何时采取行动,参与者都需要考虑他们当前的行动会如何影响未来的行动,包括对手和博它动,指出了博弈的所有可能结果。
决所有的连续决策点。
decision maker in a 博策树。
博节分每一分支都从博弈树上的一个决策点指向另一个决策点或终结点。
terminal node.在一个分支;不过,仅允许有一个分支指向任何一个决将引收益。
终结点并不是所有博弈必需的;一些博弈理论上可以永远进行下去on forever我参Anode is called a 参安均会发生什么?一个名叫卡门的少女正在决定是否要吸烟。
A teenager named Carmen is deciding whether to smoke.首如不一带给她不同的感受和收益。
taste, as well as different payoffs.单门分析一开始,考虑与终结点直接相连的那些行动点。
Start analysis by considering those action nodes that lead directly to terminal nodes.在利在通沿着贯穿整个博弈树的标出的唯一路径,就知道了当所有参与者在正确预测了所有的未来后果下做出最优选择时,这当由The outcome that arises from playing these在在会,甚至根本就没出现!但是,它的可能的出现和潜在的策略在决定今日卡门的招术时发挥了作用。
三每捐但为的所有结果进行赋值(排序)。
可3不多少种?如我均参不However, the equilibrium path of play is complete specification of the rollback equilibrium.它反略得到的。
艾尼塔根在街道花园博弈的反转均衡中,艾米丽得到了最好的结果(the opportunity to make the first move.先不后当这些操纵的招术就是Tactics for such manipulation are第第第第第第第三步:反转求解Step 3: Rollback第一它Slide 47一但一国然对实考有人拿出下。
经济学博弈
•
试想有两只公鸡遇到一起,每只公鸡有两
个行动选择:一是退下来,一是进攻。如果
一方退下来,而对方没有退下来,对方获得
胜利,这只公鸡则很丢面子;如果对方也退
下来双方则打个平手;如果自己没退下来,
而对方退下来,自己则胜利,对方则失败;
如果两只公鸡都前进,那么则两败俱伤。因
此,对每只公鸡来说,最好的结果是,对方
注意①对每一方,有限军备都是全局优势策略,扩军和
不设防都是全局劣势策略。
②此问题也可用重复剔除的占优均衡求得博弈问题
的解为(有限军备,有限军备)。
2024/10/12
中南财经政法大学信息学院
22
例7:寻找纳什均衡
2024/10/12
C1
C2
R1
100,100
0,0
50,101
R2
50,0
1,1
60,0
中南财经政法大学信息学院
21
军备考虑为扩军、有限军备、不设防,那么G为:
B
扩军
有限
裁军
扩军
(-2000,-2000)
(-1600,-1500)
(8000,-∞)
有限
(-1500,-1600)
(-500,-500)
(9500,-∞)
裁军
(-∞,8000)
(-∞,9500)
(0,0)
A
据划线法求得Nash均衡为双方采用有限军备策略。
中南财经政法大学信息学院
11
纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我
的策略,你的策略也是你的最好的策略。即双方在给
定的策略下不愿意调整自己的策略。请同学分析:
洪开荣《经济博弈论》习题答案
《经济博弈论》思考题第1章纳什均衡1、每位学者的贡献都是建立在前者理论基础之上的,排名考虑的因素是理论的原创性。
纳什提出了纳什均衡概念,建立了一种互动分析模式;泽尔腾以纳什均衡为基础建立了策略性思维的动态分析模式;海萨尼提出海萨尼转换及其均衡体系。
2、博弈论学科对数学工具的利用使得博弈论乃至经济学成为一门真正的科学。
博弈均衡数学表达式的简明与繁复意味着背景事实的简明与繁复。
3、要素包括参与人,行动,支付和信息。
明确了三要素也就完成了建模。
模型的表述4分析方法就是关注各个参与人之间的互动及相互之间的影响。
比如,甲、乙两公司分数两个国家,在开发某种新产品时有下面矩阵表示的博弈关系的收益,这些不同策略组合下的收益则是双方互动选择的结果。
5、博弈论和经济学都是基于“理性人”的假设,人们都是追求自身利益的最大化。
以性别战博弈为例,女生选择芭蕾时,尽管男生更偏好足球,但此时他为使收益最大化,会选择芭蕾,即男生的最适反应是芭蕾。
同样,男生选择足球时,尽管女生更偏好芭蕾,但此时她为使收益最大化,会选择足球,即女生的最适反应是足球。
6、(1)博弈双方是在比较每个策略下自己的受益而做出选择,得益值的绝对值也就失去了意义。
必然会选择(不坦白,不坦白),因为这样双方的收益都能最大化。
7、博弈至少是在两方之间进行的,博弈的过程中双方都是理性的,在理性的指引下做出策略选择,故博弈论应包含理性、互动和决策。
其中理性是前提,互动是过程,决策时结果。
博弈过程中,各方都追求其自身的利益最大化,也就是给定对方的策略,自己的策略总是最优的。
博弈双方的两个最优反应以最适合的方式结合起来,也就是互为最适反应,这就会说博弈论的决策方法。
8、以囚徒困境为例,若双方同时选择抵赖,收益为(-1,-1),此时,双方收益和最大,但这种非纳什均衡的情况是不稳定的。
纳什均衡下,双方的策略为(坦白,坦白),收益为(-8,-8),此时收益明显比双方同时抵赖要低。
博弈论与经济生活(3)
例题: 重复剔除的占优均衡
行先生
M优于L 列先生
L
M
R 行:没有占优战略
U
1,0
1,2
0,1
列:M严格优于R
D 0,3
这里的占优战略或劣战略可能只是相对于另一 个特定战略而言。 ➢ 如果重复剔除后的战略组合不唯一,该博弈就 不是重复剔除的方法可解的。
安徽农业大学理学院 ·张成堂
例子 重复剔除的占优战略均衡
乙
L
M
R
U 甲
S
1,0 0,2
1,3 0,1
3,0 3,0
D 0,2
2,4
5,3
安徽农业大学理学院 ·张成堂
智猪博弈(Boxed Pig Game)
安徽农业大学理学院 ·张成堂
“智猪博弈”的启示
原版的“智猪博弈”故事给了竞争中的弱者 (小猪)以等待为最佳策略的启发。但是对于社 会而言,因为小猪未能参与竞争,小猪搭便车时 的社会资源配置的并不是最佳状态。为使资源最 有效配置,规则的设计者是不愿看见有人搭便车 的,政府如此,公司的老板也是如此。而能否完 全杜绝“搭便车”现象,就要看游戏规则的核心 指标设置是否合适了。
猪圈中有一头大猪和一头小猪,在猪圈的一 端设有一个按钮,每按一下,位于猪圈另一端 的食槽中就会有10单位的猪食进槽,但每按一 下按钮会耗去相当于2单位猪食的成本。
如果大猪先到食槽,则大猪吃到9单位食物, 小猪仅能吃到1单位食位食物;
如果小猪先到,大猪吃6单位而小猪吃4单位 食物。表5给出这个博弈的支付矩阵。
入大量资金进行技术创新,开发新产品,而中 小企业是小猪,不会进行大规模技术创新,而 是等待大企业的新产品形成新的市场后生产模 仿大企业的新产品的产品去销售。
经济博弈论(第三章)
第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。
现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。
这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。
依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。
例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。
动态博弈由于添加了时间因素,因而更加贴近现实。
根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。
在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。
3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。
动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。
一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。
此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。
设有一个商人要从A 地向B 地运输一批货物。
exfd经济博弈论3—完全且完美信息动态博弈
动态博弈中博弈方的策略是他们自己预先设定
的,在各个博弈阶段针对各种情况的相应行为 选择的计划。
这些策略实际上并没有强制力,而且实施起来 有一个过程,因此只要符合博弈方自己的利益, 他们完全可以在博弈过程中改变计划。我们称 这种问题为动态博弈中的“相机选择 (Contingent Play)”。
(-1,0) (0,4)
法律保障不足的开金矿博弈 ——分钱打官司都不可信
稳定。为什么会出现这种情
况呢?
其实,该博弈中 (不借-不打,不分)和(借-打,分)都是纳什
均衡。但后者不可信,不可能实现或稳定。
上述纳什均衡不稳定的原因,主要在于如果甲在第二阶段选择了 “不分”而不是“分”,乙策略中设定的第三阶段“打”是不可 信的,不可能真正实施,理由是该行为对乙自身也是不利的,追 求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析 就可以掌握乙的这个弱点,因此不可能理睬乙策略中的“打”官 司威胁,在第二阶段不会选择“分”。反过来,乙也不会愚蠢到 想靠一个明显不可信的威胁撑腰,冒险将资金借给甲,因此他在 第一阶段也不可能“借”。
第三章 完全且完美信息动态博弈
本章讨论动态博弈(Dynamic Games),所
有博弈方都对博弈过程和得益完全了解的完全 且完美信息动态博弈。这类博弈也是现实中常
见的基本博弈类型。由于动态博弈中博弈方的 选择、行为有先后次序,因此在表示方法、利 益关系、分析方法和均衡概念等方面,都与静 态博弈有很大区别。本章对动态博弈的概念和 分析方法,特别是子博弈完美均衡和逆推归纳 法作系统介绍,并介绍各种经典的动态博弈模 型。
所以,在一个动态博弈中,博弈的结果包括双
方(或多方)采用的策略组合,实现的博弈路 径和各博弈方的得益。
经济博弈论
非合作博弈强调个体理性
(individual rationality),就是
从个体的角度考虑策略选择,使得
个体收益最大。所以非合作博弈研
究的是参与者在利益相互影响的情
况下如何选策略使自己的收益最大,
即策略选择问题。
约翰·纳什 (J. Nash)
纳什均衡(Nash Equilibrium):所有参与人最优策略的
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
1、参与人指的是博弈中选择行动以最大化自己 效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选择 时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博弈 进程中,什么情况下选择什么行动的预先安排;
第一节 引言
1
博弈理论简介
博弈论(Game Theory):研究具有斗争或竞争性质现象的理 论和方法。
三要素:参与者(players)集合,策略(strategies)集合和收益 (payoffs)集
分类: 合作博弈、非合作博弈; 静态博弈、动态博弈; 完全信息博弈、不完全信息博弈;
研究博弈论的意义:理解人类的经济行为;理解社会和生态 物种系统中的合作行为以及自自组织斑图。
13
从游戏到博弈
游戏的特点:下棋,打牌,赌博,田径, 球类等等,共同的特点是策略
策略的好坏决定游戏的结果
游戏的特征:规则,结果,策略,策略和 利益的依存性
14
想一想
假如你正跟恋人用手机通电话,突 然信号断了。这时,你会立即拨电话 过去,还是等你的恋人拨电话过来?
很显然,你是否应拨电话过去,取 决于你的恋人是否会拨过来。如果你 们其中一方要拨,那么另一方最好是 等待;如果一方等待,那么另一方就 最好是拨过去。因为如果双方都拨, 那么就会出现线路忙;如果双方都等 待,那么时间就会在等待中流逝。
《经济博弈论》期末考试复习题及参考答案
《经济博弈论》期末考试复习题及参考答案一、单项选择题1、博弈论中,参与人的策略有()A 有限的B 无限的C 有限和无限两种情况D 以上都不对参考答案:C解释:在博弈论中,参与人的策略可以是有限的,也可以是无限的,具体取决于博弈的类型和设定。
2、下列属于完全信息静态博弈的是()A 囚徒困境B 斗鸡博弈C 市场进入博弈D 以上都是参考答案:D解释:囚徒困境、斗鸡博弈和市场进入博弈都属于完全信息静态博弈。
3、在一个两人博弈中,如果双方都知道对方的策略空间和收益函数,这被称为()A 完全信息博弈B 不完全信息博弈C 静态博弈D 动态博弈参考答案:A解释:完全信息博弈意味着博弈中的参与人对彼此的策略空间和收益函数都有清晰的了解。
4、占优策略均衡一定是纳什均衡,纳什均衡()是占优策略均衡。
A 一定B 不一定C 一定不D 以上都不对参考答案:B解释:占优策略均衡是一种更强的均衡概念,占优策略均衡一定是纳什均衡,但纳什均衡不一定是占优策略均衡。
5、对于“囚徒困境”博弈,()A 双方都独立依照自身利益行事,结果限于最不利的局面B 双方都独立依照自身利益行事,导致最好的选择C 双方进行合作,得到了最好的结果D 以上说法都不对参考答案:A解释:在“囚徒困境”中,每个囚徒都从自身利益出发选择坦白,最终导致双方都受到较重的惩罚,这是一种个体理性导致集体非理性的结果。
二、多项选择题1、以下属于博弈构成要素的有()A 参与人B 策略C 收益D 信息E 均衡参考答案:ABCDE解释:博弈的构成要素通常包括参与人、策略、收益、信息和均衡等。
参与人是进行博弈的主体;策略是参与人在博弈中可选择的行动方案;收益是参与人采取不同策略所得到的结果;信息是参与人对博弈局面的了解程度;均衡是博弈的稳定状态。
2、常见的博弈类型有()A 完全信息静态博弈B 完全信息动态博弈C 不完全信息静态博弈D 不完全信息动态博弈参考答案:ABCD解释:这四种博弈类型是根据信息是否完全和博弈的进行时态来划分的。
博弈论第三章混合策略纳什均衡.
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
vG 1,
4
1 vG 0,
0.2
• 解二:支付等值法
如果一个混合策略是政府的最优选择,那一定意 味着流浪汉在寻找工作与游闲之间是无差异的, 即:
vL 1, 1 3 vL 0, 0.5
游闲
(3,2) (-1,3)
(-1,1) (0,0)
政府和流浪汉的博弈
• 思考:政府会采用纯策略吗?流浪汉呢?这 个博弈有没有纯策略的纳什均衡? • ——跟你玩剪子石头布游戏一样,你会一直 采用纯策略吗? • 那么政府和流浪汉最有可能采用什么策略? • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略,就可以采用针 对性的策略,使自己的支付增加。
L 2 1 0
0.5
解二:支付等值法
• 政府选择救济策略 • 政府选择不救济策略
0 1 期望效用 期望效用 vG 1, 3 11 vG 0, 1 01 4 1
EUA p1 X 1 p 2 X 2 ... pnXn
政府和流浪汉的博弈
• 政府想帮助流浪汉,但前提是后者必须试图寻 找工作,否则,不予帮助;而流浪汉若知道政 府采用救济策略的话,他就不会寻找工作。他 们只有在得不到政府救济时才会寻找工作。他 们获得的支付如图所示:
流浪汉
寻找工作
救济 政府 不救济
乙 红q 红p 甲 黑1-p -1, 1 1, -1 黑1-q 1, -1 -1, 1
§ 反应函数
• A的目标是期望支付越大越好。我们之所以把A的 期望支付整理成不含p的一项和含p的一项这个样 子,是因为A只能选择p而不能q,因此,A能通过 选择p来影响第一项,而不能直接影响第二项。 (1-2q)>0即q<1/2时,A把p选择等于1最好;当 (1-2q)<0即q>1/2时,A把p选择等于0最好;当 (1-2q)=0即q=1/2时,A可以在[0,1]之间随便 选择一个p。这样我们可以得到A的反应函数是, 同样道理我们可以得到B的反应函数。 • 0, 如果q>1/2 1, 如果p>1/2 • p [0,1], 如果q=1/2 q [0,1], 如果p=1/2 • 1, 如果q<1/2 0, 如果p<1/2
经济博弈论试题及答案
经济博弈论试题及答案(正文部分)第一部分:试题1. 请简要解释什么是经济博弈论。
2. 请列举并解释博弈论中的一些重要概念,如纳什均衡、占优策略和囚徒困境等。
3. 在实际生活中,经济博弈论有哪些应用领域?请举例说明。
4. 什么是合作博弈?请阐述合作博弈的特点,并提供一个相关的实例。
5. 请简述零和博弈与非零和博弈的区别,并给出一个具体案例。
第二部分:答案1. 经济博弈论是一种集合数学、经济学和策略分析于一体的理论框架,用于研究决策者在相互关联的环境中做出决策时所面临的策略选择和结果影响。
2. (1) 纳什均衡:指在博弈中,所有参与者都选择最优策略时所构成的一组策略组合,使得没有一个参与者单方面改变策略可以使自己的收益提高。
(2) 占优策略:指在博弈中,一方参与者在某种策略下收益最大化,无论其他参与者采用何种策略。
(3) 囚徒困境:是博弈论中的一个经典案例,描述的是两个囚犯是否应该合作以最大化自己的收益。
在该案例中,即使合作能带来最优结果,囚犯之间因互相不信任而往往选择背叛。
3. 经济博弈论在实际生活中有广泛的应用。
例如:(1) 在企业竞争中,博弈论可以帮助企业决定定价策略和市场竞争策略,以及对手可能采取的行动。
(2) 在国际贸易谈判中,博弈论可以用于分析各个国家的利益诉求和谈判策略,以实现最优结果。
(3) 在环境保护领域,博弈论可以用于研究各个利益相关方之间的博弈行为,以促进合作与共识。
4. 合作博弈是指参与者在博弈中通过合作来实现收益最大化的行为。
合作博弈的特点包括:(1) 合作和沟通:参与者可以进行合作,共同制定策略,并通过沟通交流来实现最优结果。
(2) 利益共享:参与者之间共享合作所带来的利益,以实现总体收益的最大化。
(3) 长期合作:合作博弈通常需要参与者在长期内保持合作,以实现稳定的收益。
例子:两个企业在同一个市场上竞争,它们可以选择合作并共同制定定价策略,以实现最大化利润。
通过长期合作和有序竞争,两个企业可以避免价格战和利润损失。
《经济博弈论》复习题参考答案
《经济博弈论》复习题及参考答案一、名词解释1、混合战略纳什均衡如果在博弈的利益表中,无法找到任何一方都可以接受(不一定利益最大化)的方案,也就是没有哪一种组合是在给定对手策略下没有动机改变自己策略的情况。
这时博弈没有纯策略均衡,需要一个“概率表”指导博弈结果。
在博弈G={S1,S2……Sn;U1,U2……Un}中第i个博弈方策略空间为Si={Si1……Sik}则博弈方以概率分布Pi=(Pi……Pik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。
2、子博弈精炼纳什均衡对于扩展式博弈的策略组合S*=(S1*,…,Si*,…,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。
子博弈精练纳什均衡所要求的是参与人应该是序惯理性的。
对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。
3、完全信息动态博弈完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息。
4、不完全信息动态博弈指在动态博弈中,行动有先后次序,博弈的每一参与人知道其他参与人的有哪几种类型以及各种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系,但是,参与人并不知道其他的参与人具体属于哪一种类型。
由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。
5、完全信息静态博弈完全信息静态博弈指的是信息对于博弈双方来说是完全公开的情况下,双方在博弈中所决定的决策是同时的或者不同时但在对方做决策前不为对方所知的。
6、囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000
不开发
1000,0 0,0
3
开发商A
2013-7-27
博弈的战略式表述
博弈的基本概念及战略表述
• 博弈的基本特征是一个参与人的支付不仅取决于自己 的战略选择,而且取决于所有其他参与人的战略选择
2013-7-27 10
博弈的基本概念及战略表述
结果:博弈分析感兴趣的所有东西 如均衡战略组合、均衡行动组合、均衡支付组合等。
2013-7-27
11
博弈的基本概念及战略表述
均衡:所有参与人的最优战略的组合 一般记为:
(乙至多失去的数)
例、设有一个两人零和有限对策、博弈方A的支付矩阵如下:
7 3 16 3 8 2 4 1 9 0 5 1
求A和B的最优策略。
24
2013-7-27
解:
min : 7 1 8 -8 2 2 4 3 16 1 9 -9 3 0 5 -3 max : 16 2 5 min : 2
解:方案一
• 情形一:甲选α3,乙选β3。
结局:博弈方甲不仅得不到9,反而输掉10。
• 情形二:考虑到乙选β3的心理,甲选α4。
结局:博弈方乙不但得不到10,反而损失6。 分析得,双方都要考虑如何在不冒风险的情况 下得到自己最好的收入。
2013-7-27 19
方案二
• 对博弈方甲: A中每一行的最小数字(赢得最少—最坏的情 况)分别是: -8, 2, -10, -3 其中最大数字(最好的结果)为2。 结果是:博弈方甲选α2参加博弈时,可保证收 益不低于2。
i
max : 2
max min aij 甲方:
i j
2
乙方: min max a
j
ij
2
结论:甲方的最优策略为:策略a2 ,乙的最优策略为:策略b2。
2013-7-27 25
三、一般两人博弈分析(一)占优策略均衡
1、优劣策略
• 定义:设有G ={S1,S2,A,B} 若对一切j(1≤j≤n),均有 aij≥akj 则称博弈方甲的纯策略αi优于纯策略αk, 或纯策略αk劣于纯策略αi。 同样,若对一切i(1≤i≤m)均有 bij≥bik 则称博弈方乙的纯策略βj优于纯策略βk, 或纯策略βk劣于纯策略βj。
2013-7-27 26
• 例3、设G={S1,S2,C}
1 C 2 3
(1,1) (2,3) (2,1) (1,2) (1,4) (7,4) (2,5) (4,3) (7,3)
1
2
3
试分析策略的优劣。
解: 对于甲: 由a3j≥ a2j
自然:指决定外生的随机变量的机制 为分析方便引入,自然作为虚拟参与人没有自己的支付和 目标函数(即所有结果对它是无差异的)
2013-7-27 5
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
行动
自然选择参与人的类型
你 接受 不接受
-50,0 0,0 100,100
求爱博弈: 品德优良者求爱 求爱者
2013-7-27
8
博弈的基本概念及战略表述
战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
si 表示第i个参与人的特定战略 Si si 代表第i个参与人所有可选择的战略集合 如果n个参与人每人选择一个战略, n维向量s s1,s2, ,si, ,sn)称为一个战略组合 ( si 表示第i个人选择的战略
在静态博弈中,战略和行动是相同的。 作为一种行动规则,战略必须是完备的。
2013-7-27 9
博弈的基本概念及战略表述
• 支付函数:参与人从博弈中获得的效用水平,或者指 参与人得到的期望效用水平。
ui 表示第i个参与人的支付(效用水平) u u1,u2, ,ui, ,un)为n个人的支付组合 ( ui是所有参与人战略选择的函数: ui ui s1 , s2 ,, si ,, sn
max min aij
2013-7-27
(甲至少可以获得的数)
23
i
j
其次,如果乙采取策略Nj ,则乙至多失去
max aij
i
(第j列的最大者)
由于乙希望ai j 越小越好,因此乙当然选择 j, 使得 达到最小。即乙选择策略Nj , 使得他的支付不多于:
max aij
i
min max aij
j i
2013-7-27 20
• 对博弈方乙: A中每一列的最大数字(输得最多—最坏情况) 分别是: 9, 2, 6 其中最小数字(最好的结果)为2。 结果是:博弈方乙选β2参加博弈时,可保证至 多输掉2。 结论:策略组合(α2,β2)是一个最稳妥能使 双方满足的一种策略组合。 • 也称这样的策略组合为博弈问题在纯策略范围 内的类对应着一个均衡 完全信息静态博弈 Nash均衡 完全信息动态博弈 子博弈精练Nash均衡 不完全信息静态博弈 贝叶斯Nash均衡 不完全信息动态博弈 精练贝叶斯Nash均衡
* 均衡(equilibrium): S * (S1*, ,S n ) 是指有博弈中的几个博弈方每方选取的最佳策略所组 成的一个策略组合。
4
2013-7-27
博弈的基本概念及战略表述
参与人:博弈论中选择行动以最大化自己效用的决策主体。
可以是自然人,也可以是团体,如企业、国家甚至由若干 国家组成的集团(OPEC、欧盟等)。
博弈的参与人集合:i , (1,2, , n) i代表参与人 N代表自然 虚拟参与人:“自然”作为虚拟参与人
2013-7-27
22
得益矩阵
a11 a21 A a m1
a12 a22 am 2
a1n a2 n amn
(第i行的最小者)
j
首先,如果甲采取策略Si ,则甲至少可以获得
min aij
j
由于甲希望ai j 越大越好,因此甲当然选择 i, 使得 min aij 达到最大。即甲选择策略Si 使得他的所获不少于:
* * s * ( s1 , , si* , , sn )
其中,si*是第i个参与人在均衡情况下的最优战略, 它是i的所有可能的战略中使ui或Eui 最大化的战略。 si s1, ,si 1 , si 1 , , sn )表示由除i之外的所有参与人的战略组成向量。 ( si*是给定si 情况下第i个参与人的最优战略意味着: ui ( si*, si ) ui ( si' , si )si' si* 均衡意味着对所有的i 1,2, , n, 上式同样成立
2013-7-27
15
二、两人零和博弈
• 定义:在两人博弈问题中,若各盈利矩阵 分别为: A=(aij)m B=(bij)m 且aij=-bij (或u1(s1i,s2j)+ u2(s1i,s2j)=0) 则称此博弈为两人零和博弈。
2013-7-27 16
• 特点
① 两人零和博弈表明,博弈方无论采取 什么策略,无论博弈的最终结局如何, 两个博弈方总有一方赢,另一方输, 且输赢数相同。 ② 定义中u1(s1i,s2j)+ u2(s1i,s2j)=0是 一种标准化。若u1(s1i,s2j)+ u2(s1i,s2j)=C,也是一种两人零(常) 和博弈。
即α3优于α2 对于乙: 由bi2≥ bi3 即β2优于β3
进入
不进入 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱
2013-7-27
接受 进入 求爱者
你 不接受
100, - 100 -50,0 0,0
6
不进入 0,0
对手特征、战略空间
不完全信息动态博弈-精练贝叶斯纳什均衡 泽尔腾(1965)
成语故事:黔之驴-驴虎博弈
2013-7-27 1
博弈的基本概念及战略表述
案例- 房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿
假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿, 需求小时,售价7千万;
如果市场上只有一栋楼
需求大时,可卖1.8亿 需求小时,可卖1.1亿
2013-7-27 2
2013-7-27 14
博弈方乙对应着一个盈利u2(s1i,s2j) 记bij= u2(s1i,s2j)
得博弈方乙的盈利矩阵 B=(bij)m 若cij=(aij,bij) 则有C=(cij)m=
(a11 , b11 ) ... (a1m , b1m ) ... ... ... ( a , b ) ... ( a , b ) mm mm m1 m1
• • 博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动:参与人的决策变量 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的。最终 将毛驴吃掉。
行动 有先后 对手特征、 支付函数、 战略空间 未知