《博弈论基础》

合集下载

博弈论基础PPT精品课程课件全册课件汇总

博弈论基础PPT精品课程课件全册课件汇总

自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。

博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案
一、原题
1. 什么是博弈论?
答:博弈论是一门研究决策者之间的竞争性行为的学科,它研究的是如何在竞争性环境中获得最佳结果。

它涉及到决策者之间的博弈,以及如何利用策略来获得最佳结果。

2. 什么是吉本斯博弈论?
答:吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科,它研究的是如何在竞争性环境中获得最佳结果。

它是由美国经济学家约翰·吉本斯在20世纪50年代提出的,他提出了一种新的方法来研究博弈,即使用数学模型来分析博弈的结果。

3. 吉本斯博弈论的基本概念是什么?
答:吉本斯博弈论的基本概念是博弈矩阵,它是一个表格,用来描述两个或多个决策者之间的博弈。

它由行和列组成,每一行代表一个决策者,每一列代表另一个决策者,每个单元格中的数字代表每个决策者在每种可能的结果下的收益。

4. 吉本斯博弈论中的均衡点是什么?
答:吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时,每个决策者都不会有更多的收益。

这种平衡可以是一个纳什均衡,也可以是一个非纳什均衡,具体取决于博弈的结构。

博弈论基础

博弈论基础

博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。

参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。

行动是指参与人的决策变量。

战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。

例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。

这里,“犯”与“不犯”是两种不同的行动。

战略规定了什么时候选择“犯”,什么时候选择“不犯”。

信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。

支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。

结果是指博弈者感兴趣的要素的集合。

均衡是所有参与人的最优战略或行动的组合。

上述概念中,参与人、行动、结果统称为博弈规则。

博弈分析的目的是使用博弈规则决定均衡。

二、博弈的分类根据博弈者选择的战略,可以将博弈分成合作博弈(cooperative games)与非合作博弈(non-cooperative games).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。

如果有,就是合作博弈;反之,就是非合作博弈。

根据参与人行动的先后顺序,可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。

静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。

动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。

根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。

完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。

博弈论基础

博弈论基础

其他参与人选择什么策略,某参与人的 最优策略是唯一的,这样的唯一的最优 战略被称为“占优策略”; � “博弈均衡”指博弈中的所有参与人都不想 改变自己的策略的这样一种状态。
(一)占优策略均衡
� 在一个博弈中,如果每个参与人都有一
个占优策略,且每个参与人都采取占优 策略,那么由所有参与人的(占优)策 略组合所构成的均衡就是占优策略均衡。 � 占优策略均衡的求解: 常用方法——划线法
“囚犯的困境”博弈中的“报酬矩阵” (Payoff Matris)
嫌犯B 坦白 不坦白 坦白 -10,-10 0,20 嫌犯A 不坦白 -20,0 -1,-1
三、占优策略均衡和纳什均衡
� (一)占优策略均衡 � (二)纳什均衡 � (三)占优策略均衡和纳什均衡比较
(一)占优策略均衡
� 占优策略(Dominant Strategies):不论
二、博弈的基本概念
� 1、参与人(players):一个博弈中独立决策、
独立承担结果的主体。 � 2、行动(actions or moves):参与人在博弈 的某个时点的决策变量。 � 3、策略(strategies):参与人在给定信息 集的情况下的行动规则 � 4、得益(pay off)(或支付、报酬):指在 一个特定的策略组合下参与人得到的确定效用 水平,或者是指参与人得到的期望效用水平。
(二)纳什均衡
� 在一个纳什均衡里,如果其他参与人不
改变策略,任何一个参与人都不会改变 自己的策略。
(二)纳什均衡
例:斗鸡博弈 B 进 A 退 0, 2 0,0 进 -3,-3 退 2,0
(三)占优策略均衡与纳什均衡比较
� 占优策略均衡要求任何一个参与人对于
其他参与人的任何策略选择来说,其最 优的策略都是唯一的。 � 纳什均衡只要求任何一个参与人在其他 参与人的策略选择给定的条件下,其选 择的策略是最优的。 � 占优策略均衡一定是纳什均衡,但纳什 均衡不一定就是占优策略均衡。

《博弈论基础》

《博弈论基础》
01-3-2 6
2、博弈规则(续)
( 3) 行 动 的 先 后 顺 序 ● 静 态 ( S tatic 同 时 ) ● 动 态 ( D y nam ic 先 后 ) ( 4) 信 息 结 构 : 参 与 人 在 行 动 时 知 道 了 什 么 (5)战略(Strategy) S = ( s 1, s 2, … , s k) = ( s k, s -k)
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) ;s*2=(C,C)}为 NE 战略 ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
(1)宏观经济学:●政策动态一致性(SPNE) ●劳动力市场 ●(金融)信贷市场 (2)微观经济学 ●外部性 ●公共产品的投资激励 ●工资(薪酬)决定
四、博弈的表示方式
1. 矩 阵 博 弈 例 : 囚 犯 困 境 囚 犯B C
囚 犯C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of Sexes)
● 新婚夫妇: Opera Opera Sandy Football ● 百年夫妻: Opera Opera Sandy Football
01-3-2

博弈论基础

博弈论基础

博弈论基础本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。

重点:博弈论的基本思想,纳什均衡的概念,信息不对称。

难点:博弈的构成要素,纳什均衡的概念。

讲授时间:6学时一、博弈的基本要素1、博弈论与古典经济学的区别古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。

博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。

两者的根本区别:是否考虑对方的行为。

古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。

消费者A不会考虑消费者B的影响。

古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。

厂商A不会考虑厂商B的影响。

古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。

国家A不会考虑国家B的影响。

博弈论:每个人要考虑别人的行为怎样影响自己的选择。

扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。

下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。

高手与俗手的区别也就在此。

高手往往能够考虑10步甚至20步以后的变化。

总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。

2、博弈论简史博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and EconomicBehavior)一书,最早提出了博弈论的概念。

吉本斯《博弈论基础》课后习题答案

吉本斯《博弈论基础》课后习题答案
{ } ((2w1 − w2 ) /(w1 + w2 ), (2w2 − w1) /(w1 + w2 )) ,((2w1 − w2 ) /(w1 + w2 ), (2w2 − w1) /(w1 + w2 ))
1.14
证 明 : 在 混 合 战 略 纳 什 均 衡 中 , 参 与 人 i 的 混 合 战 略 为 pi* , 其 中 选 择 第 j 个 纯 战 略 sij 的 概
1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
max πi
=
max( p qi ≥0
− c)qi
=
max qi ≥0
(
a

qi

q−*i
− c)qi

由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi* = (a − q−*i − c) / 2 … … ( 1)
率 为 pi*j 。 用 反 证 法 证 明 。
假 设 pi*j > 0 , 且 sij 是 第 一 个 被 重 复 剔 除 劣 战 略 所 剔 除 的 战 略 。 那 么 参 与 人 i 必 定 存 在 另 一
个 纯 战 略 Sik, 使 得 ui (sij , p−i ) < ui (sik , p−i ) , p−i 是 其 他 参 与 人 任 意 的 战 略 组 合 。 因 为 sij 第
经济学家-
经济学家-
Gibbons《博弈论基础》第二章习题解答(部分)
2.1 采用逆向归纳法,先最大化家长的收益:给定孩子的行动 A,来选择自己的行动 B,
MaxV B
(I
p

博弈论基础

博弈论基础

博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

参见:行为生态学(behavioral ecology)。

约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

博弈论基础复习

博弈论基础复习

《博弈论基础》主要知识点一、名词解释(5×2=10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。

纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合.混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。

扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具.博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。

博弈树类似于状态图和问题求解搜索中使用的搜索树.完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈. 行为策略是指每一个参与人在每一个信息集上随机的选择行动.逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。

在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。

冷酷策略又称触发策略。

指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作.类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。

信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。

分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。

混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。

特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。

联盟二、选择题(5×2=10分)三、简答题(28—30分)1.博弈的分类及相关概念.合作博弈:强调效率、公正、公平非合作博弈:博弈论的主要研究对象,强调在互动假设下的个人理性、个人最优决策从信息角度看,博弈可分为:完全信息博弈:指局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解。

博弈论基础

博弈论基础

博弈论基础
博弈论是一门多学科交叉学科,它结合经济学、哲学、数学、计算机科学和心理学等学科,研究决策定者之间彼此博弈的结果。

弈论的最初出现是在20世纪40年代,它的主要研究动因也跟当时的历史环境有关系。

由于当时的政治环境紧张,许多国家都在考虑如何在竞争环境中实现最优的结果。

在博弈论的研究过程中,研究者会研究各种策略,确定一个最优的策略,以实现最优的结果。

例如,它可以用来研究两个竞争者之间的博弈,以确定哪一个会是最佳策略。

在政治层面,它也可用来研究各国之间的军事战略,以此来保护每一方的最大利益。

博弈论的研究也和心理学有关系,它可以用来研究决策者的决策行为,了解决策者会采取怎样的策略,从而可以为决策者提供有效的决策建议,以实现最佳结果。

此外,博弈论也可以用于研究公司之间的竞争关系,通过研究公司所拥有的资源及其竞争优势,以及如何利用这些资源,实现最佳结果。

在博弈论的研究过程中,数学也是十分重要的,它需要研究者拥有良好的数学背景,以便更好地理解博弈论的基本概念,以及如何正确分析和解决博弈中遇到的问题。

博弈论是一门复杂的学科,不仅要求研究者拥有良好的数学背景,还要求研究者对经济学、社会学、心理学等学科有所了解,以及对复杂决策问题有一定的洞察力。

可以说,博弈论研究的结果有着深远的影响,它不仅可以用来研究决策者之间的博弈,还可以用于政治、军事、经济、社会及其他领域,以实现最优的结果。

因此,对博弈论的研究具有重要意义,虽然它是一门复杂的学科,但是它也可以为政治、经济、社会及其他领域提供有效的决策建议,以实现最佳结果。

博弈论基础 mobi

博弈论基础 mobi

博弈论基础 mobi(实用版)目录1.博弈论的概述2.博弈论的基本要素3.博弈论的分类4.博弈论的应用案例5.博弈论的发展与前景正文一、博弈论的概述博弈论,作为一门研究决策制定的数学理论,主要关注在特定情况下,决策者如何做出最佳选择以实现自身目标。

博弈论的研究对象包括各种决策问题,如竞争、合作、冲突等,旨在揭示这些决策问题的规律性,并提供有效的解决方法。

二、博弈论的基本要素1.参与者:博弈中的决策者,可以是个人、组织或国家等。

2.策略:参与者可选择的行动方案。

3.支付:参与者采取某策略后获得的收益或损失。

4.博弈:参与者之间相互作用的过程,包括策略选择和支付计算。

三、博弈论的分类1.合作博弈与非合作博弈:根据参与者之间是否存在协作关系进行划分。

2.静态博弈与动态博弈:根据博弈过程的时间特性进行划分。

3.完全信息博弈与不完全信息博弈:根据参与者对对方策略的了解程度进行划分。

四、博弈论的应用案例1.囚徒困境:揭示了合作与竞争之间的矛盾,解释了为何在某些情况下,合作可能导致更差的结果。

2.拍卖理论:研究拍卖市场中的策略选择与支付分配问题,为实际拍卖活动提供理论依据。

3.信任博弈:分析信任关系对合作决策的影响,有助于理解人际关系中的信任问题。

五、博弈论的发展与前景1.发展历程:博弈论起源于 20 世纪中叶,经过几代学者的发展,已经成为一门较为完善的理论体系。

2.发展趋势:博弈论与其他学科的交叉研究日益增多,如经济学、社会学、心理学等。

3.前景展望:随着人工智能、大数据等技术的发展,博弈论在实际应用中将发挥更大的作用。

总之,博弈论作为一门研究决策制定的数学理论,不仅具有深厚的理论基础,还具有广泛的应用前景。

gibbons博弈论基础

gibbons博弈论基础

gibbons博弈论基础
《博弈论基础》是Robert Gibbons编著的一本书,博弈论是研究多人决策问题的理论,在经济学、管理学等领域有广泛应用。

在微观研究领域,交易机制的模型(诸如讨价还价模型和拍卖模型)就涉及博弈论;在中观经济研究中,劳动力经济学和金融理论都有关于企业要素投入品市场(而非寡头垄断模型中的产出品市场)的博弈论模型;从宏观的角度看,国际经济学中有关于国家间的相互竞争(或互相串谋),选择关税或其他贸易政策的模型;宏观经济学中也有货币当局和工资、价格制定者(厂商等微观单位)间的战略相互影响,最终决定了货币政策效果的模型。

博弈论在各个领域都有广泛的应用,学习《博弈论基础》可以帮助我们更好地理解和应对复杂的决策问题。

博弈论基础 mobi

博弈论基础 mobi

博弈论基础 mobi博弈论是数学中的一个重要分支,它研究的是在冲突和合作的情况下,利益相关的个体做出的决策及其结果。

在现实生活中,博弈论也被广泛应用于经济学、管理学、政治学等领域。

本文将从随机选择的8个方面出发,对博弈论的基础内容进行详细阐述。

1. 博弈论的起源与发展博弈论最早可以追溯到19世纪中叶,由数学家纳什引入并发展起来。

随着时间的推移,越来越多的研究者开始关注博弈论,并提出了许多重要的理论和方法。

例如,米尔格拉姆和奥斯特罗姆提出了博弈论的博弈形式和博弈策略的概念,深刻影响了博弈论的研究方向。

2. 博弈论的基本概念博弈论的基本概念包括参与者、策略和收益。

参与者指的是参与博弈的各方,策略是参与者在决策中选择的行动方式,收益则指的是各方根据博弈的结果所获得的利益。

3. 博弈论的解决方法为了解决博弈论中的问题,研究者提出了许多解决方法,其中最著名的是纳什均衡。

纳什均衡指的是在一个博弈中,各个参与者选择的策略组合下,不存在任何参与者想要改变策略的动机。

4. 不完全信息博弈不完全信息博弈是博弈论中的一个重要概念,指的是参与者无法完全了解其他参与者的策略和偏好。

在不完全信息博弈中,参与者需要根据对方的行为和其他信息进行决策,这给博弈的结果带来了不确定性。

5. 合作博弈和非合作博弈根据参与者之间的互动方式,博弈论可以分为合作博弈和非合作博弈。

合作博弈中,参与者通过合作来达成共同的目标;非合作博弈中,参与者通过竞争和冲突来追求自己的利益。

6. 零和博弈和非零和博弈零和博弈和非零和博弈是博弈论中的两个重要概念。

零和博弈指的是各方的收益总和为零,一方的收益增加必然导致其他方的收益减少;非零和博弈指的是各方的收益总和不一定为零。

7. 博弈论在经济学中的应用博弈论在经济学中有着广泛的应用,例如市场竞争、拍卖、博弈论模型对经济政策的制定等方面。

博弈论的应用帮助经济学家更好地理解和预测市场行为,提供了决策支持和政策建议。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

01-3-2
30
求解的一般过程 ● Maxa2∈A2{U2(a1,a2)}→反应函数 a2=R2(a1) ● Maxa1∈A1{U1(a1,a2(a1) )}→反应函数 a*1 ● 得到:SPNE (a1;R2(a1); ) 均衡结果(Outcome)(a*1;R2(a*1) : ) 例:Stackelberg(1934) :Leader-Follower Model
01-3-2
流浪汉 游荡
1
0
0
21
●纯战略 NE 不存在 ●求混合战略 NE: 设政府的混合战略 σG=(θ,1-θ) 设流浪汉的混合战略 σL=(γ,1-γ) =θ[3γ+(-1) (1-γ)]+(1-θ)[-γ+0(1-γ)] =θ(5γ-1)-γ VL(σG,σL)=γVL(θ,1)+(1-γ)VL(θ,0) =γ[2θ+(1-θ)]+(1-γ)[3θ+0(1-θ)]
01-3-2
¥490
13 10 4 10
8 13
●百年夫妻:纯战略 NE 不存在
20
3、NE 战略存在性定理(Nash,1950) :
每个有限博弈至少存在一个 NE(纯战略或混合战略) ●混合战略(Mixed Strategy) :关于纯战略集的概率向量 σk=(σk,1,σk,2,…,σk,nk) ●例:社会福利博弈 寻找工作 救济 政府 不救济
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) 2=(C,C)}为 NE 战略 ;s* ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
01-3-2 18
01-3-2
31
(贝叶斯纳什均衡)BNE
1.引例 t21 2 1 1 U D
01-3-2
t22 R 0 2 3 0 4 0 0 4
32
L
L 0
R 1 2 1
3 1 0
● 参与人 2 有两种类型:t21 与 t22,其战略为类型依存的, S2(t2) :从类型空间到战略空间的映照 ● 参与人 1 对参与人 2 的类型有先验概率 P 2)(1/2, (t : 1/2) ● 验证: 1*,S2*)为 NE,其中 S1*=U; (S S2*(t2)=L,若 t2=t21;S2*(t2)=R,若 t2=t22 证明:给定 S2*,求参与人 1 的期望效用: 若 S1=U,则п 1=1/2×3+1/2×2=5/2 若 S1=D,则п 1=1/2×0+1/2×2=2 所以,给定 S2*,S1*=U 为参与人 1 的最优战略
01-3-2
24
SPNE
1.引例:市场进入博弈 Entrant (E) Out I (Incumbent) (0,2) F (-3,-1)
01-3-2
A (2,1)
25
●2 个纯战略 NE: {Out;Fight If In};{In;Accommodate If In} ●NE{Out;F If In}在均衡路径上最优;但在非均衡路径上 (右枝)非最优:若 E 真的 In,I 的选择将是 A ●{Out;F If In}是不合理的;I 的威胁是不可臵信的(InCredible) ●那么,如何剔除基于不可臵信威胁的不合理的 NE? ●Selten(1975)引进 子博弈精练纳什均衡(SPNE)的概 念
四、博弈的表示方式
1.矩阵博弈 例:囚犯困境 囚犯 B C
囚 犯 C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of
●新婚夫妇: Opera Opera Sandy Football ●百年夫妻: Opera Opera Sandy Football
01-3-2 23
●另解(支付最大法) : 一阶条件(FOC) : dVG/dθ=0;dVL/dγ=0 γ*=0.2;θ*=0.5 ●为什么 VG 对θ求偏导,却得到γ? ●流浪汉的混合战略如何直观理解?(HarSanyi)— 设有 100 个流浪汉,则大约 20 个在寻找工作;另 外的 80 个在游荡
例:囚犯两难(困境)矩阵博弈与博弈树的转换
(-5,-5) C B○ C A○ DC B○ DC (-2,-2) C (-10,0) DC (0,-10)
01-3-2
15
五、均衡(Equilibrium)
静态 完全信息 不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡(NE)
1、定义: ●战略 S*=(s*1,s*2,…,s*n)为 NE 战略等价 于 对 k=1,2,…,n,有 s*k∈arg〃Max{Uk(s*k,s*-k)} ●也就是说, 在均衡战略下, 如果他人不改变战略, 任意参与人不会单方面改变战略
01-3-2
○1 2○ r a l 0 -1 7 b ○3 r -2 2 28 0 -1 3○ 5 l r 6 3 5 1 4 2 4
① L (-1,5,6) a (5,4,4) L 1○ R
01-3-2
R ② b (0,-1,7)
(-1,5,6)
(5,4,4)
29
● SPNE(s1,s2,s3) 1={R};s2:a If 1 Plays R; :s s3:=r,If 1 Plays L; =r,If L Plays R and 2 Plays a; =l,If L Plays R and2 Plays b ● 均衡结果: (R;a;r)
01-3-2
10
2、博弈规则(续)
●博弈:规定谁在什么时候行动;行动时知道了什么; 有什么可供选择;得到多少 ●有限博弈:参与人有限;行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动 的博弈称为完美信息博弈 ●完美→完全;不完全→不完美
01-3-2 11
01-3-2 2
应用阶段(续)
(3)市场营销 ●Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy (4)产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2
● 产业规制
3
二、合作博弈
● Cartel (OPEC) ● RJVs ● 合作讨价还价模型(Nash,1950) : Max{(X1-D1) 2-D2)} (X S.T. X1+X2≤1 其中, 1、 2 分别为 1 与 2 的初始禀赋, D D 成为威胁点 (Threat Point) ,产权配臵改变 D1、D2。 当 D1=D2,X1=X2=1/2
外部协调机制
●内部协调不能达到 Pareto 最优(如:Cartel 不能维 持) ●由外部协调机制来解决,如黑社会: 囚犯 B C C 囚犯 A
01-3-2
DC
-∞ -∞ -∞ -2 -10 -2
-∞ -10
DC
19
例 2:航空价格战 中 陆 ¥380 ¥380 8 法航 ¥490 4 NE: (8,8) 例 3:性别战 ●新婚夫妇: 2 个 NE: (Opera,Opera)(Football,Football) ;
01-3-2 33
反之,给定 S1*,S(t21)=L;S(t22)=R 分别是 t21 与 t22 类 型的参与人 2 的最优战略 2.Static B.G 的定义: {I;{Si};{ui(· )};Θ ;F(· )} ●Si 为 i 的战略空间,si∈Si 为 i 的战略(类型依存的) ●Θ =Θ 1×Θ 2×…×Θ I,而θ i∈Θ i 为 i 的类型 ●Ui(si;s-I;θ i) ●F(θ )=F(θ 1,θ 2,…,θ I)为联合分布函数;密度 函数 P(θ 1,θ 2,…,θ I)与条件概率 Pi(θ -i/θ i)为 共同知识(K.N)
01-3-2
Sexes)
Paul Football
1 0 0 1 0 2
2 0
Paul Football
0 1 0 1 2 0
2 0
13
2、博弈树
例:欧盟航空公司空中争夺战 中陆 ¥380 法航 380 490 380 ¥490 法航 490
(8,8) (13,4) (4,13) (10,10)
01-3-2 14
第六讲 博弈论基础
一.博弈论的发展阶段
1.传统阶段: ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2.现代阶段: ●Von Neumann & Morgenstern (1944)
01-3-2 34
3.BNE: {Si*(· iI=1 满足:对任意的θ i∈Θ i,有: )} Si*(θ i)∈ arg.Maxsi(θ i){∑ui(si,s-i;θ i)P(θ -i/θ i)} i=1,2,…,I
01-3-2
35
例 1:Duopoly Cournot Model 反需求函数:Pi=a-qi-qj,i、j=1,2 利润函数:п
01-3-2
则,VG(σG,σL)=θVG(1,γ)+(1-θ)VG(0,γ)
=-γ(2θ-1)+3θ
22
●由 VG(σG,σL)=θ[5γ-1]-γ 得到政府的反应对应: θ=0,当γ<0.2;θ∈[0,1],当γ=0.2;θ=1,当 γ>0.2 ●由 VL(σG,σ L)=-γ[2θ-1]+3θ 得到流浪汉的反应 对应:γ=1,当θ<0.5;γ∈[0,1],当θ=0.5;γ =0,当θ>0.5 ● NE: (σ*G,σL*) σ*G=(0.5,0.5) σL*=(0.2,0.8)
相关文档
最新文档