完全信息静态博弈及其纳什均衡解
信息经济学部分习题解答
解:设金钱总数为M。
对赌徒i,战略空间Si=[0,M],si∈Si,支付
函数ui为
ui
si 0
if if
si M
i
si M
i
所有满足∑isi≤M的选择都是纳什均衡。纳什均 衡有无穷多个。
5.(库诺特博弈)假定有n个库诺特寡头企业,每 个企业具有相同的不变单位成本c,市场逆需求 函数是p = a - Q,其中p是市场价格,Q = ∑jqj是 总供给量,a是大于零的常数。企业i的战略是 选择产量qi最大化利润 πi=qi(a-Q-c),给定其他 企业的产量q-i,求库诺特-纳什均衡。
2
q2
14q12q220
求解可得 q 14q24 116
假设企业1第一阶段投资引进新技术。此时
两个企业的边际成本下降到1,利润函数为:
1 1 q 1 4 q 2 q 1 q 1 f
2 1 q 4 1 q 2 q 2 2 q 2
一阶最优条件为
1
q1
142q1q210
求 故解当可1得9q 6 1 fq 22 1 1 31644 q2 q11 f3 2 q1 25122 时10,99 引6 f进新技术
解:根据问题的假设可知各企业的利润函数为
i piq ciqaqijn iqjqiciq
其中i=1,…,n。
将利润函数对qi求导并令其为0得:
i
qi
n
a
ji
qj
c2qi 0
解得各企业对其他企业产量的反应函数为:
n
qi aji qj c/2
根据n个企业之间的对称性,可知 q1 *q2 *qn * 必然成立。代入上述反应函数可解得:
q
2
再代入企业1的反应函数,得
大学老师上课点名现象的博弈分析
大学老师上课点名现象的博弈分析摘要:大学老师上课点名是日常教学过程中很常见的现象。
本文试图通过给定不同的假设条件,用博弈论的基本原理构造出不同的模型,对学生与学生之间、老师与学生间的博弈行为进行分析。
关键词:模型、博弈行为、博弈分析在大学教育中,老师点名被普遍当作是保证学生出勤率督促学生学习的有效方式。
分析老师和学生作为不同的决策主体如何对点名做出反应并判断二者在不同决策下获得的支付(收益),对于改进点名的效率,理解学生的行为模式进而更好地完成教学工作无疑具有重要意义。
一、博弈模型原理概述本文使用的模型主要应用以下博弈论原理:(一)完全信息静态博弈完全信息静态博弈指的是各博弈方同时决策,且所有博弈方对博弈中的各种情况下的策略及其得益都完全了解。
“完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、.支付函数等)有完全的了解,“‘静态”指的是所有参与人同时选择行动且只选择一次。
“同时行动”在这里是一个信息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他参与人的选择,我们就说他们在同时行动。
(二)纳什均衡在博弈G=﹛S1,…,S n:μ1,…,μn﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,s n*)中,任一博弈方i的策略s i*,都是对其余博弈方策略的组合(s1*,…s i-1*,s i+1*,…,s n*)的最佳对策,也即μi(s1*,…s i-1*,s i*,s i+1*,…,s n*)≥μi(s1*,…s i-1*,s ij*,s i+1*,…,s n*)对任意s ij∈S i都成立,则称(s1*,…,s n*)为G的一个纳什均衡。
(三)混合战略混合战略是指博弈的参与者以一定的概率去选择某种战略。
这类博弈虽然在一次操作中有输有赢,但将这个博弈多次重复进行,可以研究各个战略应赋予多大的概率,能获得最大的期望(平均)收益。
(四)动态博弈动态博弈(dynamic game)是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。
完全信息静态博弈及其纳什均衡解
第三章完全信息静态博弈及其纳什均衡解1.完全信息静态博弈定义 3.1.完全信息静态博弈。
完全信息静态是指,博弈中的参与人同时采取行动,或者尽管参与人行动的采取有先后顺序,但后行动的人在行动时不知道先采取行动的人采取的是什么行动;同时博弈参与人的策略空间及策略组合下的支付是博弈中所有参与人的“公共知识”。
两个特点:(1)静态;(2)完全信息。
完全信息静态博弈例子。
例1:锤子-剪刀-布例2:交通行驶非“完全信息静态博弈”例子:英式拍卖——动态博弈;第一密封价格及第二密封价格拍卖——不完全信息博弈。
2.纳什均衡及其判定定义3.2 纳什均衡。
在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,一个策略组合{s1*,s2*,…,s n*},若满足u i(s1*,…,s i*,…s n*)≥u i(s1*,…s i,…,s n*)(i=1…n),则称这个策略组合为{s1*,s2*,…,s n*}为该博弈G的一个纳什均衡。
某策略组合是纳什均衡指的是,在该策略组合上任何一个参与人的收益在其他人策略不改变的情况下都至少是弱优的。
特点:(1)每个人没有单独改变策略的动机;(2)局部最优。
纳什均衡判定方法:用定义来判定:某点是均衡看它是否符合纳什均衡的定义。
求解纳什均衡的方法:(2)用定义来求解(3)对于策略空间为连续的博弈,用求极值的方法来求得。
3.纳什均衡存在定理:(纳什)定理3.1.在一个n人博弈的标准式G={S1,S2,…,S n; u1,u2,…,u n}中,如果n是有限的,且对每个i, S i是有限的,则博弈至少存在一个纳什均衡。
这里的均衡可能包含混合策略均衡。
证明:略例子3:囚徒困境的均衡例1:“锤子-剪刀-布”的均衡?4.混合策略与混合策略的均衡纯策略与混合策略概念。
定义.3.3.一个策略是纯策略指的是参与人策略空间中的某个确定策略;而一个混合策略是参与人策略空间上的一个概率分布,一般地,某个人i的策略空间为{s i1,s i2,…,s ik},则参与人i在策略空间上的一个概率分布p i=(p i1,p i2,…,p ik)构成他的一个混合策略,其中p i1+p i2+…+p ik=1。
博弈论论文(囚徒困境案例纳什均衡案例完全信息静态博弈完全信息动态博弈)
二、博弈论的发展史 2.1中国传统文化中的博弈论
在我国,博弈论的思想源远流长,古代人民很早就认识了博弈问题,虽然没有形 成一套完整的理论体系和方法,但博弈论的思想和实践活动,则可以追溯到 2000 多年 前。著名的"齐王与田忌骞马"就是一经典事例。这里,田忌进行的是"在给定齐王策略 不变情况下如何取胜"这一策略选择,实际上就是现代博弈论中的完全信息条件下的两 人博弈问题。著名的《孙子兵法》一书对战争胜负的认识,以及胜负之间诸因素的相 互作用的深刻论述,和所提出的一系列军事对策等,都反映出其系统的博弈论思想。 而《三十六计》则可以称做是一部活生生的军事博弈论教科书。《孙子兵法》和《三
博弈论论文
摘要:在现实生活中,人们的利益冲突与一致具有普遍性。因此,几乎所有的决 策问题都可以认为是博弈。虽然博弈论是数学的一个分支,但其应用范围十分广泛, 在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈 论的案例。本文对博弈论发展简史、博弈论基本概念进行阐述,对囚徒困境、纳什均 衡、完全信息静态博弈、完全信息动态博弈、进行解析与案例分析。 关键词:博弈论、博弈论发展简史、博弈论基本概念、囚徒困境案例、纳什均衡 案例、完全信息静态博弈、完全信息动态博弈。
一、在生活中广泛应用的博弈论
在高飞老师的带领下,经过一段时间的学习,我对博弈论有了一些肤浅的理解。 诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈, 有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说 博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学 语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所 以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策 性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。目前在生 物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛 的应用。人们每天都面临着无数个选择,而博弈能运用具体的案例模型和相对应的决 策方法,让人们在最短的时间内作出最有利于自己的选择。 早在 1994 年,提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教 授就共同分享了当年的诺贝尔经济学奖和 93 万美元的奖金。2005 年,瑞典皇家科学 院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托 马斯·谢林,以表彰他们在博弈论领域作出的贡献。纳什的贡献是在 1944 年与奥斯 卡·摩根斯特恩合著了《博弈论与经济行为》一书,标志着现代系统博弈理论的的初步 形成。而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用 到了博弈学理论。奥曼用数学分析为博弈论列出了精确的公式,谢林则是想通过实践 来展示博弈论在社会各个领域的实际意义。他们两位利用博弈论对商业谈判、种族隔 离、武器控制等领域进行了实际分析,谢林教授认为博弈论运用的重要领域应该包括 核威慑和武器控制,同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理 等方面。
完全信息静态博弈:纳什均衡
博弈分析的目的是预测博弈的均衡结果, 即给定每个参与人都是理性的,什么是所有参 与人最优的策略组合?
纳什均衡是完全信息静态博弈解的一般概
念,也是所有其他类型博弈解的基本要求。
我们先介绍几种纳什均衡解的特殊情况,
再定义一般意义下的纳什均衡。
wuweiwei100@
继续这个过程,一直到只剩下一个唯一的策略组合为止。
这个唯一剩下的策略组合就是这个博弈的均衡解,称为“重 复剔除的占优均衡”。
wuweiwei100@
2、智猪博弈
小猪 乙 a 按 3,1 7,-1 b 等待 2,4 0,0
a 按 甲 大猪 b 等待
猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮, 每按一下,位于猪圈另一端的食槽中就会有8单位的猪食进 槽,但每按一下按钮会耗去2单位的成本。如果大猪先到食 槽,则大猪吃到7单位食物,小猪仅能吃到1单位食物;如果 两猪同时到食槽,则大猪吃5单位,小猪吃3单位食物;如果 小猪先到,大猪、小猪各吃4单位食物。
得益是8000亿美元。
wuweiwei100@
军备竞赛博弈
苏联
扩军 裁军
8000,- ∞ 0,0 -2000,-2000 - ∞,8000
扩军
美国 裁军
美苏两国如果不搞军备竞赛,各自把资源用于 民品生产,不是很好吗?问题是,如果我把资源 用于民品生产,而你增加军费支出,我不就受到 威胁吗?这样对我不好。纳什均衡是两国都大量 增加军费预算,两国的社会福利都变得更糟。
wuweiwei100@
例
囚徒困境博弈
乙
招 不招
招
甲
-8,-8
经济博弈论 02 完全信息静态博弈(Park)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
完全信息静态博弈论模型
完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。
在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。
完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。
本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。
一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。
参与者通过制定决策来追求自身的利益。
1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。
策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。
1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。
支付函数可以表示为参与者的收益、成本或效用。
1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。
换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。
二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。
支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。
2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。
通过计算每个参与者的最优响应,可以找到纳什均衡。
2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。
前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。
三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。
3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。
完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。
3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。
第2讲 完全信息静态博弈【博弈论经典】
第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。
博弈论四种类型
贝叶斯纳什均衡
混合战略(不完全信息情况下纯战略均衡的极限)
对原混合战略加入少许不确定性因素,求极限。
性别战
1、均衡存在性
2、不确定性体现为类型的不确定性
一般贝叶斯均衡
Harsanyi转换
机制设计
不完全信息动态博弈
在博弈开始前参与人之间的信息存在不确定性,同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。
无限次重复博弈均衡(无名氏定理)
与贴现因子有关
囚徒困境(冷酷战略)
无限期轮流讨价还价模型
一般博弈
逆向归纳法求解
斯坦科尔伯格寡头竞争
雇主与公会之间的竞争
不完全信息静态博弈
在博弈开始之前参与人之间的信息存在不确定性,但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。
不确定是参与人的了性的不确定性
精炼贝叶斯纳什均衡
信号传递博弈
分离均衡
根据所得信息修正判断概率,根据收益最大化决策
信号传递博弈
不完全信息重复博弈与声誉
Milgrom-Roberts垄断限价模型
不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。
混同均衡
准分离均衡
类型
信息和行动特点
均衡
均衡类型
特别均衡
求解方法
学过的例子
性质
完全信息静态博弈
每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动相同。
纳什均衡
纯战略纳什均衡(PNE)
02+完全信息静态博弈
i 都成立,则称
s* (s1*,sn* ) 为 G 的一个纳什均衡
通俗的讲:参与人(局中人)单独改变策略不会得到好处的 对局(策略组合),就叫做纳什均衡。
3.1 离散策略空间的博弈纳什均衡分析
1)上策均衡(优势策略均衡) dominant strategy
上策:不管其它参与人选择什么策略,一参与人 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
你的方案: 集中两个师进攻甲 一个师进攻甲,一个师进攻乙 集中两个师进攻乙
敌人的方案: 三个师驻守甲 两个师驻守甲,一个师驻守乙 一个师驻守甲,两个师驻守乙 三个师驻守乙
敌人
a 我军
b
c
A -,+ +,- +,-
B -,+ -,+ +,-
C +,- -,+ -,+
D +,- +,- -,+
Q q1 q2
c1 c2 2
P P(Q) 8 Q
求两厂商的均衡产量?
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
u2 q2P(Q) c2q2 q2[8 (q1 q2)] 2q2 6q2 q1q2 q22
+,- -,+
诺曼底战役模拟
3) 相对优势策略划线法
情侣博弈:大海喜欢看足球,丽娟喜欢看芭蕾舞。
他们都宁愿在一起,也不愿分开行动。
丽娟
足球
芭蕾
足球 大海 芭蕾
ห้องสมุดไป่ตู้
2,1 0,0
0,0 1,2
本例有两种纳什均衡结果会出现,要么一 起去看足球,要么一起去看芭蕾舞,但在一次博 弈中究竟会出现哪一种???
国库经收处行为的完全信息静态博弈分析
支 付 :即特 定 的战 略 组 合 下 参 与 人 的 效 用 水 平 。
其 中 .国库 经 收处 的 效用 函 数 与 以 下 几 个 因素 相 关 : 国库 经 收 处 经 营 自身 业 务 所 带 来 的稳 定 的 自然 增 长 利 润 S 国库 经 收处 经 营经 收业 务 所 带 来 的外 部 效 应 生 的 隐性 收益 S 经 营经 收 业 务所 产 生 的 成 本 为 S。 国
高 国库 资 金 使 用 效 率 ; 其 次 是 , 再 主体 地 位 不 均 等 , 国 库 经 收 处 是 市 场 经 济 的直 接 参 与 者 , 代 理 国库 经 收 在 业 务 中处 于 被 监 管 的地 位 , 人 民银 行 经 理 国库 是 法 而 律 赋 予 的圣 神 职 责 , 对 于 国 库 经 收 处 处 于 监 管 的地 相
一
l l l
如 下 图所 示
(G 一 G1  ̄) -
种 是 严 格 按 照 国 库 制 度 管 理 的 相 关 法 律 和 制 度 严
国库 经 收 处 和人 民银 行 博 弈过 程 面临 的 博 弈矩 阵
格 国库 经 收 处 的 义 务 . 时 收 纳 报 解 预 算 收 入 ; 种 及 一 是 国库 经 收处 为 追 求 自 身利 益 最 大 化 而 不 严 格 遵 守 代 理 协 议 。 国库 经 收 处 的 行 为 可用 集 合 表 示 为 A T C
\ p \p ≯ p : p p ≯
三 、 策 建 议 政
( ) 格 开 户准 人 制 。 级 人 民银 行 会 计 部 门 、 一 严 各 国 库 部 门要 从 维 护 《 民 币 银 行 结 算 账 户 管 理 办 法 》 人 严 肃性 的角度 , 强协调 配合 , 财政 专户开户 管理 , 加 对 建 议 在 开 立 财 政 资 金 专 户 时 必 须 经 国库 部 门 先 行 审 核 后 , 由会 计 部 门审批 开 户 , 成 内 部 管 理 合 力 。 再 形 ( ) 善 资金 管 理体 制 。 将 预 算 内 、 资金 全 部 二 完 要 外 纳 入 国 库 管 理 , 政 府 的 全 部 财 政 性 资 金 ( 括 政 府 将 包 预 算 资 金 和 预 算 外 资 金 ) 中 在 国 库 , 面 推 行 以 国 集 全 库 单 一 账 户 为 基 础 、 民 银 行 直 接 支 付 为 主要 方 式 的 人 资 金 缴 拨 制 度 , 支 持 地 方 财 政 资 金 的 保 值 、 值 需 要 增 要 , 力 开 展 国库 现 金 运 作 , 力 提 高 财 政 资 金 使 用 大 努 效 益 , 进 财 政 专 户 资 金 从 商 业 银 行 回 流 国 库 。 断 促 不
完全信息静态博弈-纳什均衡
2009.10.16-2009.11.11
南京理工大学经管院应用经济系 劉琦
34
2009.10.16-2009.11.11
南京理工大学经管院应用经济系 劉琦
35
聚点理论
2009.10.16-2009.11.11
南京理工大学经管院应用经济系 劉琦
36
2009.10.16-2009.11.11
南京理工大学经管院应用经济系 劉琦
25
2009.10.16-2009.11.11
南京理工大学经管院应用经济系 劉琦
26
02 完全信息静态博弈
假设C为单位成本,则两商店的利润分别为
( p , p ) ( p c) D ( p , p ) ( p , p ) ( p c) D ( p , p )
当a=1-b时,即两商店位于同一位置,完全无差异,则
p
*
1
p
* 2
c
如果企业的竞争战略是价格,则Bertrand证明,即使只 有两个企业,在均衡情况下,价格等于边际成本,企业的 利润为零,与完全竞争市场均衡一样。这就是“伯川德悖 论(Bertrand Paradox)”。 解开这个悖论的办法之一就是引入产品的差异性。
* * ,sn ) 的各一个策略组成的某个策略组合 (s1 中,任一参与人
* * 的策略,都是对其余参与人策略的组合 (s1 ,si*1 , si*1 ,...sn )
* * * * ,si*1, si* , si*1,...sn ) ui (s1 ,si*1, si , si*1,...s, 的最佳对策,即 ui (s1 n)
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
古诺模型的反应函数
maxu1 max(6q1 q1q2 q12 )
* * ( ui (si* , s )对任意 s S i 都成立,则称 ) u ( s , s i i i i )
i
s
*
* * ( s1 , sn ) 为 G 的一个纳什均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1第四章 完全信息动态博弈及其均衡解1.完全且完美信息动态博弈完全信息博弈指的是参与者的收益是共同知识。
完全且完美信息动态博弈指的是:博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。
因此,我完全且完美信息动态博弈的特点:(1)行动是顺序发生的;(2)下一步行动选择之前所有以前的行动都可以被观察到;(3)每一可能的行动组合下的参与人的收益都是公共知识。
而不完美信息博弈指的是,在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。
例4.1.我们来考虑这样一个动态博弈: 假定甲在开采一个价值4万元的金矿时需要1万元资金,乙有1万元资金。
甲向乙借钱来开金矿。
在这个博弈的第一阶段,甲向乙承诺: 如果乙借钱给他的话,那么他就会将采到的金子与乙对半分成,即(2,3)——乙得到2万元的金子,同时收回自己的1万元投资。
对于甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止,双方收益为(0,1)。
如果乙借钱给甲的话,那么博弈进入第二个阶段。
在第二阶段中,若甲遵守他的承诺,分给乙一半的金子,这样两人的收益为(2,3),其中1万元为投资成本。
〖JP3〗然而,若甲违背自己的承诺,博弈就会进入到第三个阶段: 如果乙同甲打官司,那么由于打官司费时费力, 两个人的收益为(0,1);若乙不打官司,那么两个人的收益就为(5,0)。
参见图1。
乙借 不借甲分 不分 (0,1)乙 乙 (2,3) 打官司 不打官司(1,2) (5,0)图1. 借钱博弈的博弈树2.逆向归纳法与子博弈纳什均衡解逆向归纳法(Backward induction )又称逆推法,是指这样一种动态博弈求解方法:从博弈的最后一步开始,计算最后一步的参与人的最优行动,逐步逆推到博弈开始时进行第一步的参与人的最优行动,从而确定每个参与人的最优行动。
在动态博弈中逆向归纳法能够进行的前提:参与人是理性的——任何一步参与人都选择甲乙2最优策略;理性是公共知识——参与人选择最优策略是其他人所能够预测的。
在完全且完美信息动态博弈中逆向归纳法能够求得子博弈精炼纳什解。
乙借 ╳ 不借甲分 ╳ 不分 (0,1)乙 乙 (2,3) 打官司 ╳ 不打官司(1,2) (5,0)图2. 借钱博弈的逆向归纳法的求解过程在例4.1中这样一个动态博弈,用逆向归纳法,我们就可以推知,如果甲做出“不分”的选择,那么乙一定会选择“打”官司。
因为对于乙而言,打官司的收益为1,不打官司的收益是0,所以,作为一个理性人,乙一定会选择打官司。
而如果甲知道在“不分”的情况下乙必定选择“打官司”,那么甲就一定会选择“分”一半的金子给乙,因为对甲而言,“分”的收益是2,“不分”的收益是0。
所以,甲的承诺是可置信的。
而对于乙来说,他会选择“借”,因为“借”的收益是3,“不借”的收益是1。
因此,该博弈最终的子博弈精炼纳什均衡点就是(2,3)。
例4.2.斯坦克尔伯模型。
两个厂商垄断某个市场,其中厂商1处于支配地位,它先行动,然后从属企业2后行动。
假定市场需求函数为p=a-Q 。
厂商的单位产品的成本c 。
这些是企业1和2的公共知识。
问:厂商1和2是如何决定的它们的生产产量的。
假定厂商1和2所决定的产量分别为q 1,q 2。
我们用逆向归纳法来求解。
企业2后行动,对于企业1的任何行动,即任意给定的产量,企业2确定产量以使利润最大,即使L 2=p ×q 2-c ×q 2最大。
假定企业1决定的产量为q 1,因为:L 2=p ×q 2-c ×q 2=(a-q 1-q 2)×q 2-c ×q 2由dL 2/dq 2=0:q 1-2q 2=a-c (1)甲乙即:q2=(q1-a+c)/2企业1先行动,它能够预知企业2的最优化行为,即在它的最优产量q1给定的情况下,企业将按照q2=(q1-a+c)/2进行决策。
这样,企业的利润函数为:L1=p×q1-c×q1=(a-q1-q2)×q1-c×q1=(a-q1-q2)×q1-c×q1而q2是q1如下的函数:q2=(q1-a+c)/2由dL1/dq1=0:q1*=(a-c)/2于是,q2*=(a-c)/4因此,((a-c)/2,(a-c)/4)为逆向归纳法解。
该解被称为子博弈精炼纳什均衡解。
此时总产量为q2=3(a-c)/4,价格为(a+3c)/4企业1的利润L1=(a-c)2/8企业2的利润为L2=(a-c)2/16请读者与古诺均衡解进行比较。
3.动态博弈中的威胁与承诺为了实现最大利益,使博弈在博弈参与人所希望的策略组合上实现,在他人作出行动之前的每一步参与人都会向对方可能做出某种威胁或承诺,希望对方做出或者不做出某个行动。
而通过逆向归纳法我们能够区别动态博弈中威胁或承诺是否可信。
例4.1:甲向乙承诺:借钱给我,我赚钱后将分给你。
甲的承诺是可信的。
乙威胁甲:若你不分给我,我将起诉你。
乙的威胁也是可信的。
之所以发生威胁与承诺的言语现象,是因为轮到他人行动的时候,参与人只能通过言语而影响他人的行动从而实现自己希望的结果。
甲之所以承诺,是因为他希望乙能够“借钱”给他。
同样,而乙之所以进行威胁,是因为他借钱之后,希望甲能够连本带利将钱给乙。
当然,在博弈论中因为参与人是理性人,威胁与承诺是否可置信能够被确认。
这样任何威胁与承诺都是没有意义的:若是不可置信,它是公共知识,又何必做这样的威胁或承诺;若是可置信的,因为该博弈是完全且完美信息博弈,做出这样的威胁与承诺也是无益的。
但是在实际生活中,做出这样的威胁与承诺是有意义的,因为,人们不一定认为对方是完全理性人,而认为会发生某种“偏离”:或者会受言语的影响,而“忘记”应该按照计算的行动进行,或者相信了对方的承诺或威胁而改变了原来的行动选择;等等。
4.理性的困境:蜈蚣博弈与最后通牒博弈3逆向归纳法是从动态博弈的最后一步往回推,以求解动态博弈的均衡结果。
它是完全归纳推理,其推理是演绎的,即结论是必然的。
逆向归纳法在逻辑上是严密的,然而它存在着“困境”。
逆向归纳法的逻辑严密性毋庸置疑。
然而,当我们分析一个特殊的博弈——蜈蚣博弈——的时候,一个违背直觉的悖论出现了,这个悖论被认为是对逆向归纳法的挑战。
蜈蚣博弈(centipede game)为罗森塔尔(R.Rosenthal)在1981年提出,我们这里采取的是奥曼(Aumann,1998)论文中的形式1。
安娜鲍伯安娜鲍伯安娜鲍伯2n+22n+12 1 43 2n 2 n-11 4 3 6 2n-12 n+2图 8-2 蜈蚣博弈这个博弈有两个参与人,安娜和鲍伯。
该博弈从安娜开始,她有两个策略“合作”和“不合作”,若她选择“不合作”,博弈即刻终止,安娜得到2,鲍伯得到1;若她选择“合作”,那么博弈继续进行,由鲍伯开始选择。
鲍伯同样有“合作”和“不合作”两种策略。
在这第二轮选择中,若鲍伯选择“不合作”,博弈终止,选择“合作”,博弈继续进行……在这个博弈最后一轮,即第2n轮,若鲍伯选择“不合作”,他所得2n+1,安娜得2n-1;若他选择“合作”,鲍伯得2n+1安娜得2n+2。
因这个博弈树形状像蜈蚣,因而被称为蜈蚣博弈。
在这里我们假定了,总的步数2n是一个双方都知道的有限数。
严格地说,我们假定了,该博弈的总步数2n为双方的公共知识(common knowledge)。
我们用逆向归纳法来分析这个博弈的结果:在最后一步,鲍伯在“合作”与“不合作”中进行选择时,因为“不合作”带给他的好处是2n+2,而“合作”的好处是2n+1,选择“不合作”的好处大于“合作”的好处,鲍伯应当选择“不合作”。
在倒数第二步,安娜这样想,选择“不合作”的好处是2n;而选择“合作”,在下一步鲍伯肯定会选择“不合作”,此时她的好处将是2n-1,因此在这倒数第二步安娜的理性选择“不合作”……通过这样的分析,在这个博弈的第一步安娜的理性的选择是“不合作”。
这样,这个博弈的结果是,在博弈的第一步安娜选择“不合作”,博弈即终止。
这一点构成蜈蚣博弈的完美纳什均衡点。
在这个点上,安娜得到支付2,而鲍伯得到支付1。
这样的结果是反直觉的:最大化自己支付的理性人其所得是不合理的。
从这个博弈树来看,若他们均选择“合作”,双方的支付将会很高。
但根据逆向归纳法,这个结果达不到。
在这个博弈中,每个人考虑到未来他人不合作,自己先采取不合作。
因在最后一步理性的参与人必定采取不合作,每个人的考虑是有逻辑基础的。
于是,一个违反直觉的糟糕结果便出现了。
这便是动态不合作。
对于蜈蚣博弈的这个逆向归纳法解,博弈论专家中存在赞成和反对两种观点。
著名的博弈论专家奥曼(R.J. Aumann)认为,如果“策略人是理性的”是双方的公共知识,逆向归纳法的解必然要达到。
英国伦敦经济学院的宾谟(K.Binmore)教授则认为,在蜈蚣博弈的开始存在混合策略的可能,即在博弈的开始安娜有采取“合作”的非零概率,而轮到鲍伯,他同样有采取“合1Aumann, R.J. Note on the centipede Game[J]. Games and Economic Behavior,1998, vol23,pp97-105.4作”策略的非零概率。
因此,在宾谟看来,该博弈终止于第一步不是必然的。
2本人认为,在最后一步鲍伯合作的概率必然为0,逆推到第一步,安娜的合作概率也必然为0。
这样,宾谟试图通过引进混合策略均衡以作为这个博弈的替代性的解是行不通的。
逆向归纳法悖论依然存在。
最后通牒博弈。
参与人1和2分一笔钱,如100元,1提出分配方案,2表决。
如果参与人1所提出的分配方案得到参与人2的同意,就按照该分配方案分配;如果参与者2拒绝,双方都将一无所获。
逆向归纳法解:6.完全非完美信息动态博弈博弈的扩展式表达囚徒1合作不合作囚徒2 囚徒2合作不合作合作不合作(3,3)(4,1)(1,4)(2,2)6.子博弈纳什均衡解与进化稳定策略在博弈论、行为生态学及演化心理学中,演化稳定策略ESS是一个这样的策略,一旦它被给定环境中的参与人群体采用,它不能被任何其他可能的策略所侵略。
一个ESS是纳什均衡的精炼。
它是演化稳定的纳什均衡:一旦它在一个种群中得到确认,自然选择本身足以放防止变异的可能策略侵略成功。
演化稳定策略在博弈论证是一个中心概念,它由John Maynard Smith和George R. Price在1973首先给出,并被用于人类学、演化心理学、哲学和政治科学之中。
进化稳定策略依赖于侵略的概念。
一个X-策略参与人的群体被Y策略的参与人所造访。
如果新的参与人使用Y策略比X-策略的参与人得分更高,他被认为是侵略的。
假定参与人能够选额和变换策略,这会导致原来的种群开始走向Y策略。