《博弈论基础》
博弈论基础PPT精品课程课件全册课件汇总
自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。
博弈论基础吉本斯课后答案
博弈论基础吉本斯课后答案
一、原题
1. 什么是博弈论?
答:博弈论是一门研究决策者之间的竞争性行为的学科,它研究的是如何在竞争性环境中获得最佳结果。
它涉及到决策者之间的博弈,以及如何利用策略来获得最佳结果。
2. 什么是吉本斯博弈论?
答:吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科,它研究的是如何在竞争性环境中获得最佳结果。
它是由美国经济学家约翰·吉本斯在20世纪50年代提出的,他提出了一种新的方法来研究博弈,即使用数学模型来分析博弈的结果。
3. 吉本斯博弈论的基本概念是什么?
答:吉本斯博弈论的基本概念是博弈矩阵,它是一个表格,用来描述两个或多个决策者之间的博弈。
它由行和列组成,每一行代表一个决策者,每一列代表另一个决策者,每个单元格中的数字代表每个决策者在每种可能的结果下的收益。
4. 吉本斯博弈论中的均衡点是什么?
答:吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时,每个决策者都不会有更多的收益。
这种平衡可以是一个纳什均衡,也可以是一个非纳什均衡,具体取决于博弈的结构。
博弈论基础
博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。
参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。
行动是指参与人的决策变量。
战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。
例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。
这里,“犯”与“不犯”是两种不同的行动。
战略规定了什么时候选择“犯”,什么时候选择“不犯”。
信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。
支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。
结果是指博弈者感兴趣的要素的集合。
均衡是所有参与人的最优战略或行动的组合。
上述概念中,参与人、行动、结果统称为博弈规则。
博弈分析的目的是使用博弈规则决定均衡。
二、博弈的分类根据博弈者选择的战略,可以将博弈分成合作博弈(cooperative games)与非合作博弈(non-cooperative games).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。
如果有,就是合作博弈;反之,就是非合作博弈。
根据参与人行动的先后顺序,可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。
静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。
动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。
根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。
完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。
博弈论基础Axjh(共48张PPT)
行动顺序 信息
完全信息结构
静态结构
(战略博弈)
完全信息静态博弈 Nash均衡
Nash(1950,1951)
动态结构
(扩展博弈)
完全信息动态博弈 子博弈精练Nash均衡
Selten(1965)
不完全信息结构
不完全信息静态博弈
不完全信息动态博弈
贝叶斯Nash均衡
精练贝叶斯Nash均衡
Harsanyi(1967-1968)
不完全信息(incomplete information):指至少有一个局中
人不完全了解其他局中人的收益或收益函数。
完备信息(perfect information):指一个参与人对其他参与
人的行动选择有准确的了解。
不完备信息(Imperfect information):指博弈中至少有一 个局中人不了解其他局中人的行动选择。
由大学、比勒菲尔特大学和波恩大学。其主要贡献是 在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利,1947年获布达佩 斯大学博士学位,后到 ,1954年获斯坦福大学博士 学位,曾先后任教于澳大利亚国立大学、加州伯克利 分校。于2000年去世。他的贡献是将不完全信息引入 了博弈论的研究。
例如:
出门
——对天气的判断 打牌
——对其他人的判断 装修
——对产品的了解
战略(strategies)或策略,是局中人选择行动的规则,它告诉局中
人在什么时候选择什么行动。
例如:
——“人不犯我,我不犯人;人若犯我,我必犯人”
—— 三个和尚没水喝
支付(payoff):指每个参与人从博弈中获得的效用水平。 既可以指实际支付,也可以用来指期望支付。它是所有局中 人战略或行动的函数,是每个局中人关注的核心问题。
博弈论基础吉本斯答案
定义:si?是si??的严格劣势战略(strictly dominated),如果:
ui(si?,s-i) ? ui(si??,s-i)
“沉默”是“招认”的严格劣战略
例3:
参与人2
左中右
上1,0 1,33,0
参与人1中0, 2 0,16,0
下0, 2 2,4 5,3
参与人1:没有严格劣战略。
1.13有两个纯战略纳什均衡,一个混合战略纳什均衡。
纯战略纳什均衡为:(向企业1申请,向企业2申请);(向企业2申请,向企业1申请)混合战略纳什均衡为:
{((2w1-w2)/(w1+w2),(2w2-w1)/(w1+w2)),((2w1-w2)/(w1+w2),(2w2-w1)/
(w1+w2))}
布1,-1-1,1 0,0
博弈的问题:能否知道每个参与人选择的战略?
例2:囚徒困境(the prisoner’s dilemma)
囚徒2
沉默招认
沉默-1,-1 -9,0
囚徒1
招认0,-9-6,-6
囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。
囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。
还有几本也不错的:
上面的这些教材一般不使用微积分
比较深入一点,使用了微积分:
【篇三:大连理工大学博弈论作业2】
sn;u1,…,un},假设si={si1,…,sik}。那么,
参与者i的一个混合战略为概率分布pi=(pi1,,…pik),其中对所有k=1,…,k,0≤pik≤1,且pi1+…+pik=1。
战略的一个组合: s ={s1,s2, ?, sn}.
《博弈论基础》读后感范文(二篇)
《博弈论基础》读后感范文读《博弈论基础》给我带来了很多的启发和思考。
通过阅读这本书,我对博弈论的概念、原理和应用有了更深入的了解。
首先,这本书很好地介绍了博弈论的基本概念和原理。
作者通过具体的例子和数学模型,清晰地解释了博弈论的核心思想和应用。
我对博弈的定义和分类有了更清晰的认识,同时也明白了博弈论的数学基础和形式化建模的重要性。
此外,书中还介绍了博弈论中的一些重要概念,比如纳什均衡和博弈矩阵,使我对博弈论的理论框架有了更全面的理解。
其次,这本书还涉及了博弈论的应用领域。
作者通过实际案例,讲述了博弈论在经济学、政治学、社会学等领域的应用。
我特别关注了博弈论在商业决策和谈判策略中的应用。
书中的案例非常有启发性,让我明白了博弈论在实际问题中的价值和作用。
最后,这本书给我留下了思考问题的余地。
博弈论涉及的问题非常复杂,且不断变化。
我认识到只是初步了解了博弈论的基础知识,还需要进一步的学习和研究。
这本书激发了我对博弈论研究的兴趣,并且让我明白了博弈论在现代社会中的重要性。
总之,读《博弈论基础》对我来说是一次非常有益的经历。
通过阅读这本书,我对博弈论的概念、原理和应用有了更深入的了解,而且激发了我对博弈论研究的兴趣。
我相信这本书对于对博弈论感兴趣的读者来说,也会是一本非常有价值的参考书。
《博弈论基础》读后感范文(二)读完《博弈论基础》,我对博弈论这个领域有了更深入的了解和认识。
本书通过简洁明了的语言,解释了博弈论的基本概念、原理和应用。
首先,书中介绍了博弈论的基本概念。
博弈论是研究决策者在相互作用中争夺利益的数学模型。
作者通过几个简单的例子,很好地向读者解释了博弈论的基本概念,如策略、策略组合、收益等。
其次,书中详细讲解了博弈论的基本原理。
作者通过对不完全信息博弈、合作博弈和非合作博弈等不同类型的博弈进行深入的分析,揭示了博弈论的基本原理和规律。
我尤其对合作博弈的内容印象深刻,合作博弈是指决策者之间通过合作达成最优解的博弈模型。
博弈论基础复习
《博弈论基础》主要知识点一、名词解释(5×2=10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。
纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。
混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。
扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。
博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。
博弈树类似于状态图和问题求解搜索中使用的搜索树。
完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。
子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。
行为策略是指每一个参与人在每一个信息集上随机的选择行动。
逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。
在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。
冷酷策略又称触发策略。
指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。
类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。
信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。
分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。
混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。
特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。
联盟二、选择题(5×2=10分)三、简答题(28-30分)1.博弈的分类及相关概念。
博弈论基础(不完全信息博弈)
础
不完全信息动态博弈 3、举例:市场进入博弈 举例:
炸鸡翅的价格: 炸鸡翅的价格: 1元、3元、5元 元 元 元
博
弈
论
基
础
不完全信息动态博弈
(1)进入者是否进入取决于对在位者类型的判断 ) (2)进入者将依据在位者的价格选择而修正对在位者类型的判 ) 断 (3)在位者需要考虑价格选择的信息效应,所以,在位者选择 )在位者需要考虑价格选择的信息效应,所以, 什么价格不仅与自身的成本函数有关, 什么价格不仅与自身的成本函数有关,而且与进入者的先 验概率及条件概率有关。 验概率及条件概率有关。 (4)若高成本的先验概率小于 ,则出现混同均衡:在位者不 )若高成本的先验概率小于1/5,则出现混同均衡: 论成本高低,都选择中等价格,进入者只有在观测到高价 论成本高低,都选择中等价格, 格时才选择进入 (5)若高成本的先验概率大于 ,则出现分离均衡:在位者在 )若高成本的先验概率大于1/5,则出现分离均衡: 低成本时,选择低价格,在高成本时,选择高价格, 低成本时,选择低价格,在高成本时,选择高价格,进入 者观测到低价格时选择不进入, 者观测到低价格时选择不进入,观测到中价格或高价格时 才选择进入。( 。(低成本在位者通过低价格显示自己是低成 才选择进入。(低成本在位者通过低价格显示自己是低成 此乃“认证费” 本,此乃“认证费”)
Prob(GT)=P(GT/GP)P(GP)+P(GT/BP)P(BP) ( ) ( ) ( ) ( ) ( )
(4)一个人做了好事是好人的概率
Prob(GP/GT)=P(GT/GP)P(GP)/ Prob(GT) ( ) ( ) ( ) ( )
博
弈
论
基
础
不完全信息动态博弈
博弈论基础
博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
五讲博弈论基础 共72页
第一节 博弈论导论
博弈的四要素: 1.博奕的参加者,即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。
3.进行博奕的次序。
4.博奕方的得益。 例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
第一节 博弈论导论
比如说:夜间唱歌
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
P
O
社会最优量
牧养人放牧的数量
说明
如果产权归农场主,农场主可以禁止放牧(点0),小于 社会最优量S;但此时,增加放牧给牧羊人带来的边际利 润大于给农场主造成的损失,牧羊人将有积极性贿赂农场 主,直到放牧量达到S为止;
如果产权归牧羊人,牧羊人的利润最大点是P,大于社会 最优量S;但此时,减少放牧量对牧羊人的边际利润损失 小于给农场主节约的边际成本,所以,农场主将有积极性 贿赂牧羊人,直到S;
博奕论前提假设:博弈的参与者都是理性人 所谓理性人是指有一个很好定义的偏好,在面临给定的约束 下最大化自己的偏好。 理性人可能是利己主义者,也可能是利它主义者。
第一节 博弈论导论
例:囚徒困境
囚徒A
坦白 抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为:A、B都选择坦白,各判8年刑
革命通常不是一个帕累托改进。
外部性与科斯定理
个人收益与社会收益:一项活动的社会收 益等于决策者个人得到的收益加社会其他 成员得到的收益,如养花;
个人成本与社会成本:社会成本等于决策 者的个人承担的成本加社会其他成员承担 的成本,如环境污染,交通堵塞;
博弈论基础吉本斯课后习题答案
当 n 趋 近 于 无 穷 时 , p* 趋 近 于 边 际 成 本 c, 市 场 趋 近 于 完 全 竞 争 市 场 。
1.5
双 方 都 生 产 qm / 2 时 , 每 一 方 的 利 润 都 为 π1 = (a − c)2 / 8 ; 一 方 生 产 qm / 2 , 另 一 方 生 产 qc
Gibbons《博弈论基础》第二章习题解答(部分)
2.1 采用逆向归纳法,先最大化家长的收益:给定孩子的行动 A,来选择自己的行动 B,
MaxV B
(I
p
−
B)
+
k(Ic
+
B)
一阶条件: V ' (I p − B) = k , ⇒ B* = I p ( A) −V '−1(k)
接着最大化孩子的收益,给定家长的反应函数 B* ,来选 A:
∴ U2 (S + B) 会增加,因为(*)式,U2 (S + B) 增加的幅度比U1(I1 − S ) 减小的幅度大,所以
孩子的收益效用增大了,同时家长的收益效用也增大了。
2.3 根据Shaked和Sutton的研究发现,我们可以把无限博弈截开(见Gibbons教材55页),首先分
析前三阶段: 假设在第三阶段参与人1提出S,参与人2接受1-S,则解决方案为(S,1-S)。
MaxV B
(I
p
−
B)
+
k[U1 ( I c
−
S)
+U2
(S
+
B)]
一阶条件:
V
'(I
p
−
B)
=
kU
' 2
(S
+
博弈论初步
1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey)
这两位经济学家的贡献集中于运用博弈论对 现实经济问题的解释。
企业、政府与商业环境
博弈论与竞争策略
博弈论导论—博弈论和诺贝尔经济学奖
• 2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz) 这三位作为不对称信息市场理论的奠基人被授予诺 贝尔经济学奖,以表彰他们分别在柠檬品市场等不 对称信息理论研究领域做出的基础性贡献。这些贡 献发展了博弈论的方法体系,拓宽了其经济解释范 围。 2002:弗农史密斯(Smith) 贡献主要在于通过实验室实验来测试根据经济学 理论而做出预测的未知或不确定性。是对以博弈 论为基础构建的理论模型进行实证证伪工作的一 大创举。 2005:奥曼(Aumann)、谢林(Schelling) 他们通过博弈理论分析增加了世人对合作与冲突的 理解。其理论模型应用在解释社会中不同性质的冲 突、贸易纠纷、价格之争以及寻求长期合作的模式 等经济学和其他社会科学领域。
乙 甲 石头 剪刀 布
石头 0,0 -1,1 1,-1
剪刀 1,-1 0,0 -1,1
布 -1,1 1,-1 0,0 ○ 完整博弈过程包括哪些要 素?博弈如何分类?
→ 博弈过程的要素主要有:参与人、行动空间或策略空间、行 动次序和博弈收益等。
→ 按收益可分为零和博弈和非零和博弈;按行动先后可分为静 态博弈和动态(序贯)博弈;按参与人对其他参与人的了解 程度分为完全信息博弈和不完全信息博弈。
了可置信的契约。
乙
甲 拨打
等待
拨打
等待
乙
甲 坦白
抵赖
坦白
抵赖
gibbons博弈论基础
gibbons博弈论基础
《博弈论基础》是Robert Gibbons编著的一本书,博弈论是研究多人决策问题的理论,在经济学、管理学等领域有广泛应用。
在微观研究领域,交易机制的模型(诸如讨价还价模型和拍卖模型)就涉及博弈论;在中观经济研究中,劳动力经济学和金融理论都有关于企业要素投入品市场(而非寡头垄断模型中的产出品市场)的博弈论模型;从宏观的角度看,国际经济学中有关于国家间的相互竞争(或互相串谋),选择关税或其他贸易政策的模型;宏观经济学中也有货币当局和工资、价格制定者(厂商等微观单位)间的战略相互影响,最终决定了货币政策效果的模型。
博弈论在各个领域都有广泛的应用,学习《博弈论基础》可以帮助我们更好地理解和应对复杂的决策问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、博弈规则(续)
( 3) 行 动 的 先 后 顺 序 ● 静 态 ( S tatic 同 时 ) ● 动 态 ( D y nam ic 先 后 ) ( 4) 信 息 结 构 : 参 与 人 在 行 动 时 知 道 了 什 么 (5)战略(Strategy) S = ( s 1, s 2, … , s k) = ( s k, s -k)
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) ;s*2=(C,C)}为 NE 战略 ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
(1)宏观经济学:●政策动态一致性(SPNE) ●劳动力市场 ●(金融)信贷市场 (2)微观经济学 ●外部性 ●公共产品的投资激励 ●工资(薪酬)决定
四、博弈的表示方式
1. 矩 阵 博 弈 例 : 囚 犯 困 境 囚 犯B C
囚 犯C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of Sexes)
● 新婚夫妇: Opera Opera Sandy Football ● 百年夫妻: Opera Opera Sandy Football
01-3-2
{犯;不犯}
9
2、博弈规则(续)
而我的战略集合: {s1, s2, s3, s4} 其中, s1= (犯,犯) ; s2= (犯,不犯) s3= (不犯,犯) ; s4= (不犯,不犯) 上述例子,我的战略为 s2 ( 6 )支付( Payoff) : U K( s1, s2,…, sn) =U K( sk, s-k)
01-3-2 14
例:囚犯两难(困境)矩阵博弈与博弈树的转换
( -5 , -5 ) C B○ C A○ DC B○ DC ( -2 , -2 ) C ( -1 0 , 0 ) DC ( 0 , -1 0 )
01-3-2
15
五、均衡(Equilibrium)
静态 完全信息 不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡(NE)
1、 定 义 : ● 战 略 S * = ( s* 1 , s* 2 , … , s* n ) 为 N E 战 略 等 价 于 对 k=1, 2, … , n, 有 s* k ∈ a rg · M a x { U k ( s* k , s* -k ) } ● 也 就 是 说 ,在 均 衡 战 略 下 ,如 果 他 人 不 改 变 战 略 , 任意参与人不会单方面改变战略
第六讲 博弈论基础
一. 博弈论的发展阶段
1.传统阶段: ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2.现代阶段: ●Von Neumann & Morgenstern (1944)
01-3-2
∈∏Sk
7
2、博弈规则(续)
●参与人 k 的战略应说明 k 在各种可能情况下的行动 方针,如:胡荣华与赵国荣下一盘象棋,胡自始至 终的行动计划称为“战略” ;而每一步棋称为“行 动” ● 静 态 时 , 战 略 =行 动 ●动态时,战略≠行动
01-3-2 8
2、博弈规则(续)
●“兵来将挡、水来土掩” ●“以不变应万变” 、 “以静制动” ●毛主席语录: “人不犯我,我不犯人;人若犯我,我 必犯人”—这里, 人的行动集:{犯;不犯}; 人的战略集:{犯;不犯} 我的行动集:
01-3-2 4
三、非合作博弈
1 . 引 例 ( 1 ) 零 和 博 弈 ( 对 抗 性 ) ● 猜 拳 ● 打 牌 、 下 棋 ( 2 ) 非 零 和 博 弈 ● 囚 犯 困 境 ● 体 育 比 赛
01-3-2
● 航 空 公 司 价 格 战
5
2、博弈规则
(1)参与人(Players) : ●k=1,2,…,n(虚拟参与人——自然) ●参与人是理性的(即谋求效用最大化) (2)参与人的行动集(Action Set) : ●行动 ak∈AK(行动集合) ,k=1,2,…,n ●行动组合(Profile) : a=(a1,a2,…,an)=(ak,a-k)∈∏Ak
01-3-2
10
2、博弈规则(续)
●博弈:规定谁在什么时候行动;行动时知道了什么; 有什么可供选择;得到多少 ●有限博弈:参与人有限;行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动 的博弈称为完美信息博弈 ●完美→完全;不完全→不完美
01-3-2 11
01-3-2 2
应用阶段(续)
( 3)市场营销 ● Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy ( 4)产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2● 产业规制3二、合作博弈
● Cartel ( OPEC ) ● RJVs ● 合作讨价还价模型( Nash , 1950 ) : Max{ ( X 1-D 1) ( X 2-D 2) } S. T. X 1+X 2≤ 1 其中, D 1、 D 2 分别为 1 与 2 的初始禀赋, 成为威胁点 ( Threat Point) ,产权配置改变 D 1、 D 2。 当 D 1=D 2, X 1=X 2=1/2
01-3-2
Paul Football
1 0 0 1 0 2 2 0
Paul Football
0 1 0 1 2 0 2 0
13
2、博弈树
例 : 欧 盟 航 空 公 司 空 中 争 夺 战 中 陆 ¥ 380 法 航 380 490 380 ¥ 490 法 航 490
( 8 , 8 ) ( 1 3 , 4 ) ( 4 , 1 3 )( 1 0 , 1 0 )