博弈论第2讲详解

合集下载

吉本斯博弈论2课件

吉本斯博弈论2课件

■ 与x0相邻的节点是x0的后 续节 (successors ). x0的后续节点 是x1, x2
■ 对任何两个相邻的节点来说, 与 根相连接的路径更长的那个节点 是另一个节点的后续节.
■ 例3: x7 是x3的后续节点, 因为它
们相邻, 而且x7到 x0的路径比x3
到x0的路径更长
x4
x0 x1
x5
-1, 1
1 , -1
TT 1 , -1 -1, 1
Game theory-Chapter 2
17
Nash equilibrium
■完全信息动态博弈中的纳什均衡集(the set of Nash equilibrium)就是它的标准式的纳什均衡 集合.
Game theory-Chapter 2
18
弈可能的终点
x4
■ 例4: x4, x5, x6, x7, x8 都是终点 节
x0 x1
x5 x7
x2 x3
x6 x8
Game theory-Chapter 2
11
Game tree
■ 除终点节以外的任何节 点都代表了某个参与人.
■ 对于终点节以外的任意 后节续点节来的说边, 连缘接代它表和了它这的Player 2 个节点所代表的参与人 H 可能采取的行动
A
F
1, 2
A
F
2, 1
0, 0
2, 1
0, 0
Accommodate is the Nash equilibrium in this subgame.
Game theory-Chapter 2
26
Find subgame perfect Nash equilibria backward induction

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

华工工商管理学院经济博弈论2课件

华工工商管理学院经济博弈论2课件

2.1.3 划线法
方法:对于其他博弈方每一种策略或者策略组 合,找出自己的最佳策略,并在得益上划线。
应用
博弈方2 左 博弈方1 上 下 1, 0 0, 4 中 1, 3 0, 2 右 0, 1 2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
由此可见,划线法是一种非常简便的博弈分 析方法,由于它以策略之间的相对优劣关系 为基础,因此在分析用得益矩阵表示的博弈 问题时具有普遍适用性。但并不意味着每个 用得益矩阵表示的博弈都可以用划线法求出 确定性的博弈结果。事实上,许多博弈根本 不存在确定性的结果,当然也就无法用划线 法找出这种结果。
Q q1 q2 P P(Q) 8 Q
c1 c2 2
u1 q1P(Q) c1q1 q1[8 (q1 q2 )] 2q1
6q1 q1q2 q12
u2 q2 P(Q) c2q2 q2[8 (q1 q2 )] 2q2
6q2 q1q2 q22
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
意味着猜硬币博弈中没有哪一个策略组合的双方策 略,相互都是对对方策略的最佳对策略。
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
意味着博弈中有两个策略组合都是对对方策略的最 佳对策略。
值得强调的是:虽然猜硬币和夫妻之争博弈中, 划线法也没有完全解决博弈的最终结果的问题, 但它至少已经使我们对它们的博弈方策略偏好 之间的一致不一致、共同利益和矛盾冲突的情 况有了更加清楚的认识,这对进一步解析这些 博弈中博弈方的行为有很重要的意义。 因此,与在这些博弈问题中根本无法运用的严 格下策反复消去法相比,划线法还是有优势的, 这一点在分析更复杂的博弈模型时会表现的更 加明显。

博弈论导论 2

博弈论导论 2

图 2-5 军备竞赛
思考:现实生活中还有哪些情况属于囚徒困境? 练习:将团队生产问题模型化成囚徒困境;如何理解囚徒困境与“看不见的手”之间 的矛盾?
2.1.5 走出囚徒困境
从社会福利的角度讲,囚徒困境不是帕累托最优的,但这与理性人的假设并不矛盾。
① ②
这实际上是 Betrand 价格竞争模型。 这是 Hardin(1968)发表在 Science 上但是被经济学引用最多的例子。但是,最近有学者提出了“反公地 悲剧”理论。董志强(2007)启发我使用这个简单的收益矩阵而非复杂的数学模型。 白鲨在线 2
2.3.2 性别战
如图 2-12。两个博弈相同的地方在于:(1)存在多重均衡,而且双方各自偏向一个 均衡;(2)任何一个均衡结果都是帕累托最优的。信念扮演了重要的作用。在这个博弈中, 假设男方是一个有名的拳击手,而女方也知道这点,那么(拳击,拳击)应该是一个均衡结 果,而(芭蕾,拳击)不应该出现。
白鲨在线 5
2.3.4 协调博弈
如图 2-14,史密斯公司和琼斯公司独立地决定选择何种智能手机操作系统。若两家公 司选择同样的操作系统,销售会更好。 特征:存在多重均衡,但是一些均衡帕累托优于另一些均衡,这与性别战和斗鸡博弈 都不同。 提示:一定要注意不同博弈模型的结构性特征,而不是过于关注具体数字。 思考:现实生活中有哪些博弈是性别战、斗鸡博弈和协调博弈?
图 2-1 双边优势
图 2-2 单边优势
2.1.2 定义优势策略均衡
并且,我们有 命题:如果一个博弈 N ,{Si }i 1 ,{vi ()}i 1 存在优势策略均衡 s ,那么 s 就是惟一的 优势策略均衡,并且也是惟一的纳什均衡。 证明过程略(可做思考题或作业)。
白鲨在线 1

第2讲 博弈的类型与表述

第2讲   博弈的类型与表述
第2讲
1. 博弈的基本要素
博弈的类型与表述
—— 参与人 参与人(Player)是博弈中的决策主体。一般表示为:
i I 1, 2,
, n
一局国际象棋的参与人是两位棋手;在囚徒困境的例子中,参与人是囚徒甲和囚徒乙。 —— 博弈规则 博弈的规则(Rule),规定了每位参与人何时行动,以及在轮到每位参与人行动时,他能够选 择哪些行动。 国际象棋有其详细的规则;在囚徒困境的例子中,规则就是两名囚徒分别决定是“坦白”还 是“抗拒” 。 —— 行动 在一个博弈中,在不同的阶段可能有不同的参与人需要“行动(action)” ,这些参与人在这博 弈的一阶段的行动,共同决定着博弈在这一阶段的结果。 在一个博弈中, 并非每名参与人在每一阶段都要有行动, 但是没有一名参与人在整个博弈的 任何阶段都不行动。 —— 策略 在一个博弈中,一名参与人的一个“策略(strategy,也叫‘战略’)”是该参与人的“一整套 行动计划” ,在该博弈每个轮到该参与人行动的位置,为该参与人规定一个行动。通常用 si Si 表示参与人 i 的策略,其中 Si 表示参与人 i 的“策略集” 。 策略是博弈中最重要的概念,我们在之后还会详细介绍这一概念。 —— 结果 在一个博弈中, 一个 “结果(Outcome)” 由每名参与人选择的一个策略(战略)共同组成, 因此, 博弈的一个结果就是博弈所有参与人的一个策略组合:
u u s u1 s , u2 s ,
, un s
要注意区分博弈的“结果”和“支付”—— 博弈的“结果”只是指“最终发生了什么” ,博 弈的“支付”是指“最终每个参与人获得了什么” 。但是,博弈的每个结果都必然对应着一个支 付向量,为每名参与人规定了一个支付。 例如,在囚徒困境的例子中, “甲选择‘坦白’ ,乙选择‘抗拒’ ”是一个结果,这一结果对 应的支付向量是(0,-8)。 在现实中,有时我们无法直接改变博弈的规则和各种可能出现的结果,但是,如果我们能够 通过各种办法改变博弈的各种结果对应的支付, 就能够改变博弈参与人面临的支付, 从而将博弈 导向不同的均衡结果。(举例) —— 博弈的 3 个基本要素 在上述所有有关博弈的概念之中,给定博弈的规则,构成一个 n 人博弈 n 由 3 个基本要素 是:参与人、结果和支付:

博弈论讲义2

博弈论讲义2
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,

经济博弈论第二讲

经济博弈论第二讲
▪ 每个人的得益来自于各自对房间的干净程度的效用减去 他打扫花费的时间。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2

0, 1


2, 0

-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果

-1, 1


1, -1
1, -1 -1, 1
夫 妻
2, 1

0, 0

0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。

第二讲博弈论在公共管理中的应用

第二讲博弈论在公共管理中的应用

第二讲博弈论在公共管理中的应用第二讲博弈论在公共管理中的应用一1>.公共管理要了解博弈论1.几个富有启发性的案例(1)商家作出最低价格承诺的真相是什么?所谓最低价格承诺是指商家承诺自己的价格比任何对手都低,一旦有对手的价格比自己低,作承诺的商家将退回差额,并且承诺支付一定金额的违约罚金。

思考:商家为什么要作出这种承诺呢?是为了促销或者恶性竞争吗?(2)假设有三个候选人或候选方案:x、 y 和z;有三个参加投票的人:甲、乙、丙。

三个人对候选对象的态度分别如下:甲:x y z;乙:y z x;丙:z x y。

(注:候选对象排位越靠前,表示越喜欢)现在分别有三个投票程序:程序1,x与y先pk,然后胜利者进入下一轮与z进行pk;程序2,x与z先pk,然后胜利者进入下一轮与y进行pk;程序3,z与y先pk,然后胜利者进入下一轮与x进行pk。

思考:(1)上面每个程序的最终获胜者是谁?(2)为了保证丙自己心目中最喜欢的z当选,如果丙能够操纵投票程序,他应该采用哪个投票程序?(3)如果您是甲,为了避免自己最不喜欢的丙当选,应该怎么办?(3)开店博弈假设顾客均匀分布在一条街上,他们总是选择到离自己家最近的商店购物;现有两位投资者均准备在街上开店,他们都希望到自己商店购物的顾客越多越好。

请问:投资者应该把商店开在哪里?A.开店博弈的启示:a,开店要扎堆,而且要扎在中心地带;b,商业中心是商家博弈自发的结果,政府打造商业中心应该顺应这一规律。

B.开店博弈在政治领域的启示:a,你的竞选纲领应该持中间派立场;b,你的竞选纲领应该模棱两可,使得左右两派都能从中找到对自己有利的解释。

2.什么是博弈?(1)参与博弈的各方在利益上存在或多或少的冲突、差异,这是形成博弈的基本要素。

(2)参与博弈的各方所获得的最终结果既取决于自己的决策,也取决于对手的决策。

(3)参与博弈的任何一方在决策时必须考虑对手的反应并根据对手的反应来制定自己的最佳策略(思考:为什么田忌赛马不是博弈?因为齐王根本没有博弈的意识)。

第二讲纳什均衡

第二讲纳什均衡

习题:齐威王田忌赛马矩阵

上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡

博弈论讲义2

博弈论讲义2

三 重复剔除的占优均衡
重复剔除严格劣策略:
思路:首先找到某个参与人的劣策略(假定存 在),把这个劣策略剔除掉,重新构造一个不包 含已剔除策略的新的博弈,然后再剔除这个新的 博弈中的某个参与人的劣策略,一直重复这个过 程,直到只剩下唯一的策略组合为止。 这个唯一剩下的策略组合就是这个博弈的均衡 解,称为“重复剔除的占优均衡”。
独木桥

A
退
B
进退 -3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进
斗鸡博弈
村子里有两户富户,有两种可能:一家修,另 一家就不修;一家不修,另一家就得修。
冷战期间美苏抢占地盘:一方抢占一块地盘, 另一方就占另一块。
夫妻吵架,一方厉害,另一方就出去躲躲。
注意:在混合策略纳什均衡条件下,也可能两 败俱伤。
注意: 如果所有人都有(严格)占优策略存在,
那么占优策略均衡就是可以预测的唯一 均衡。 占优策略只要求每个参与人是理性的, 而不要求每个参与人知道其他参与人是 理性的(也就是说,不要求理性是共同 知识)。为什么?
二 占优策略均衡
案例-囚徒困境
囚徒A
囚徒 B
坦白
坦白 -8,-8
抵赖
0,-10 -8大于-10
相安无事;第二天,相安无事……;直到第100天 ,突然,每个妻子都把丈夫杀了。为什么会这样?
这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀 死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不 杀死他。

如果村里只有一个男人是不忠的话,在老太太作了宣布之
后的第一天,这个男人的妻子在老太太宣布之后马上就能知道
两只猪一起去按,然后一起回槽边进食, 由于大猪吃得快可吃下8个单位的食物, 小猪只能吃到2个单位食物。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈
• 例2:公共产品的供给也是一个囚徒困境问题。 如果大家都出钱兴办公共事业,所有人的福利都会增加。问题是,如果我出钱你 不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以,每 个人的最优战略是“不出钱”,这种情况下,使得所有人的福利都得不到提高。
例3:“军备竞赛”。 例4:经济改革本身也可能是这样,在许多改革中,改革要付出成本(包括风险), 而改革的成果大家共享,结果是:尽管人人都认为改革好,却没有人真正去改革, 大家只好在都不满意的体
第们集中讨论完全信息静态博弈。 • “完全信息”指的是每个参与人对所有其他参与人的特征(包括战略空间、支付
函数等)有完全的了解。 • “静态”指的是所有参与人同时选择行动且只选择一次。“同时行动”是一个信
息概念而非日历上的时间概念:只要每个参与人在选择自己的行动时不知道其他 参与人的选择,我们就说他们在同时行动。
的组合。 定义:在博弈的战略式表述中,如果对于所有的i,si*是i的占优
战略,那么,战略组合s* = s1*,...,s*n 称为占优战略均衡(do min ant
strategy equilibrium)
第2讲 完全信息静态博弈
• 在一个博弈里,如果所有参与人都有占优战略存在,那么,占优战略均衡是可以 预测的到惟一的均衡,因为没有一个理性的参与人会选择劣战略。
• 纳什均衡是完全信息博弈解的一般概念,也是所有其他类型博弈解的基本要求。
第2讲 完全信息静态博弈
• 1.纳什均衡 纳什对博弈论的贡献有两个方面:一是合作博弈理论中的讨价还价模型,称为纳什 讨价还价解(Nash bargaining solution); 二是非合作博弈论方面,这是他的 主要贡献所在。 纳什对非合作博弈的主要贡献是他在1950年和1951年的两篇论文中在非常一般意义 上定义了非合作博弈及其均衡解,并证明了均衡解的存在。这样就奠定了非合作 博弈论的基础。纳什所定义的均衡称为“纳什均衡”,它如同瓦尔拉斯均衡一样, 已成为经济学中的专家术语。

博弈论讲义2 非合作博弈理论

博弈论讲义2 非合作博弈理论

开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
一 、博弈的基本概念及战略表述
博弈论的基本概念包括: ✓ 参与人:博弈论中选择行动以最大化自己效用的决策主体; ✓ 行动:参与人的决策变量 ✓ 战略:参与人选择行动的规则 ✓ 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和
一 、博弈的基本概念及战略表述
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 Βιβλιοθήκη 发商A开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
不完全信息动态博弈-精练贝叶斯纳什均衡 泽尔腾(1965)
一 、博弈的基本概念及战略表述
博弈的战略式表述:
战略式表述给出: 1、博弈的参与人集合:i , (1,2, , n); 2、每个参与人的战略空间:Si,i 1,2, , n; 3、每个参与人的支付函数:ui (s1, , si , , sn ),i 1,2, , n)
用G S1, ,Sn;u1, , un代表战略式表述博弈。
✓ 完美信息:指一个参与人对其他参与人(包括“自然”)的 行动选择有准确了解的情况,即每一个信息集只包含一个值。
✓ 完全信息:指自然不首先行动或自然的行动的初始行动所有 参与人观察到的情况。
✓ 共同知识:指“所有参与人知道所有参与人知道所有参与人 知道….”的知识。

博弈论第2讲

博弈论第2讲

被称为“劣策略”。 i s i ( s1 ,...si 1 , si1 ,...sn ) 是除i之外的所有参与人策略的组合。 占优策略均衡 :如果在某一个博弈中,每一个博弈者都有一个 * * * * 占优策略 si ,那么( s1 , s2 ,...sn ) 就是这个博弈的占优策 略均衡(强占优)
开发商B 需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发 开发
4000,4000 0,8000
不开发
8000,0 0,0
开发商B 开发 不开发
-3000,-3000 0,1000 1000,0 0,0
开发商A
完全信息静态博弈

完全信息
每一个参与人对所有其他参与人的特征(策略空间,支付
支付函数:
1 (不坦白, 坦白) 20
两个罪犯的得益矩阵
博弈的策略式表述(例)
双寡头古诺竞争
博弈者:两家厂商N 1, 2 每一个博弈者的策略空间 : S1 =S 2 (0, ) 支付函数 : 1 ( S1 ,S 2 ) S1 P( S1 S 2 ) c1 ( S1 )
s
* i
例1 二价拍卖
对于拍卖市场,我们通常想到的是,谁出价高交易物
即给谁。可是,你是否想到:拍卖人可能说“假话”。 好比我本来愿意出1万的,但只要第二名出3000,我出 3001就能拿下来的话,我就不会报价1万。如何让竞标 者显示出真实的信息呢? 维克瑞教授设计了一个拍卖机制:让每个人把愿意出 的价格写在纸上装入信封交给你,所有信封打开后, 出价最高的人得到那件古董,但实际付的价格是第二 位出价最高者的出价(称为二级密封价格拍卖, second-price sealed auction)。

第一课应用博弈论第二讲 完全信息静态博弈

第一课应用博弈论第二讲  完全信息静态博弈
博弈方的最终目标也是实现自身的最大得 益。不过,这里,各个博弈方的得益既取决于 自己选择的策略,还与其他博弈方选择的策略 有关。根据这种思想,科学的决策思路应该是: 先找出自己针对其他博弈方每种策略或策略组 合的最佳对策,然后在此基础上,通过对其他 博弈方策略选择的判断,预测博弈的可能结果 和确定自己的最优策略。根据上述思想,介绍 划线法寻找博弈的解。
们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
21
例3
为什么只有大企业才会花巨额金钱打广 告?
大企业是大猪,中小企业是小猪。大企 业投入大量资金为产品打广告,中小企 业等大企业的广告为产品打开销路形成 市场后才生产类似产品进行销售。
经开始对日本和德国这两个法西斯轴心国展开大反 攻。
在欧洲,以艾森豪威尔为总司令的盟国远征军,准
备横渡英吉利海峡,在欧洲开辟第二战场。欧洲只
有东翼的苏德战场是两大阵营对抗的正面战场,前
苏联方面一再要求美英同盟国及早在欧洲大陆开辟
第二战场。1944年春天,英美联军在北非战场中彻
底摧毁了德国隆美尔元帅的抵抗,德军已经完全收
德军在欧洲西线的总兵力是58个师,要布防的海岸线 长达3000公里。因此,德军只能把主要兵力放在它认为 盟国最有可能渡海登陆的地方。同时,盟军在英国能够 用于渡海作战的兵力,由于受登陆舰船容量的限制,数 量也有限,只能考虑集中有限的兵力重点进攻一个地方。 因此,无论是对于盟军还是对于德军,选择和判断盟军 将在那里登陆已经成为这次跨海作战成败的关键。
生活中其实有很多相关的例子。
19
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们

博弈论第二讲

博弈论第二讲
Fall, 2007, Fudan 7
Solving matching pennies
Player 2 Head Tail Expected payoffs
Head
Player 1 Tail
-1 ,
1
1 , -1
-1 , 1
r 1-r
1-2q 2q-1
1 , -1
Expected payoffs
q 2r-1
Fall, 2007, Fudan 3
Mixed strategy
A mixed strategy of a player is a probability
distribution over player’s (pure) strategies.


A mixed strategy for Chris is a probability distribution (p, 1-p), where p is the probability of playing Opera, and 1p is that probability of playing Prize Fight. If p=1 then Chris actually plays Opera. If p=0 then Chris actually plays Prize Fight.
-1 ,
1
1 , -1 -1 , 1
1 , -1
Head is Player 1’s best response to Player 2’s strategy Tail Tail is Player 2’s best response to Player 1’s strategy Tail
Tail is Player 1’s best response to Player 2’s strategy Head Head is Player 2’s best response to Player 1’s strategy Head
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二讲完全信息静态博弈主要内容⏹基本分析思路和方法⏹纳什均衡⏹混合策略和混合策略纳什均衡⏹纳什均衡的存在性⏹纳什均衡的选择和分析方法扩展例: 房地产开发项目-假设有A、B两家开发商市场需求:可能大,也可能小投入:1亿A、B同时决策假定市场上有两栋楼出售:✓需求大时,每栋售价1.4亿,✓需求小时,售价7千万;如果市场上只有一栋楼✓需求大时,可卖1.8亿✓需求小时,可卖1.1亿完全信息静态博弈⏹完全信息☐每一个参与人对所有其他参与人的特征(策略空间,支付函数)有完全的了解⏹静态☐指所有参与人同时选择行动且只选择一次。

☐同时选择⏹只要每一个参与人在选择自己的行动的时候不知道其他参与人的选择,我们就称之为“同时选择”⏹博弈分析的目的:预测博弈的均衡结果☐给定每一个参与人都是理性的☐每一个参与人都知道其他人是理性的☐找出每一个参与人的最优策略☐所有参与人的最优策略博弈的策略式表述(标准式表述)⏹每一个参与者的组合同时选择一个策略,所有参与者选择的策略的组合决定了每一个参与者的收益。

⏹博弈参与人:☐决策主体,通过现在行为(策略)以最大化自己的效用☐“自然”:虚拟的参与人,决定外生随机变量的概率分布的机制,没有自己的目标函数和支付函数.如,天气.⏹每一个博弈参与人的策略空间⏹如果博弈参与人每人选择一个策略,n 维向量称为策略组合,其中是的i 个参与人的选择策略.{}1,2....,N n =,1,2i S i n = 1(,)n S S S = i S博弈的策略式表述⏹支付以及支付函数☐支付:指在一个特定的策略组合下参与人得到的确定效用水平,或者是指每一个参与人得到的期望效用水平.☐支付函数(效用函数):⏹博弈:1(,)i n u S S },;,{11n n u u S S G博弈的策略式表述(例)⏹囚徒困境☐博弈者:囚徒1,囚徒2☐每一个博弈者的策略空间:☐支付函数:-10,-100,-20-20,0-1,-1坦白不坦白坦白不坦白两个罪犯的得益矩阵囚徒2囚徒11(,)20π=-不坦白坦白{}12,S S ==坦白不坦白博弈的策略式表述(例)双寡头古诺竞争{}121121121121221222N 1,2:=(0,):(,)()()(,)()()S S S S S P S S c S S S S P S S c S ππ==∞=+-=+-博弈者:两家厂商每一个博弈者的策略空间支付函数基本分析思路和方法⏹策略式博弈原则☐如果一个参与者有占优策略的话,他应该使用这个策略。

当所有参与者都具有占优策略而且都使用它们,其结果就是占优策略均衡(所有参与人的最优策略的组合)。

⏹完全信息策略式博弈原则☐一个博弈的参与者永远不应该使用劣策略。

对于某些适当的博弈,可以用重复剔除劣策略求解⏹策略式博弈原则☐任何博弈中的所有参与者最终将选择一个纳什均衡。

占优均衡⏹占优策略:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略。

即,无论其他参与者如何选择,他的最优策略是唯一的囚徒的困境中的“坦白”;双寡头削价中“低价”。

(不依赖于对方的选择)一般地,称为参与人i 的(严格)占优策略,如果对应的所有的是i 的严格最优选择,即:对应的,所有被称为“劣策略”。

是除i 之外的所有参与人策略的组合。

⏹占优策略均衡:如果在某一个博弈中,每一个博弈者都有一个占优策略,那么就是这个博弈的占优策略均衡(强占优)*i s *,i i s s -*''*(,)(,),i i i i i i i i i u s s u s s s s s--->∀∀≠'*i i s s ≠111(,...,,...)i i i n s s s s s --+=*i s ***12(,,...)n s s s例1 二价拍卖策略式博弈的描述{}12N 1,2,....,,:=....[0,)max max :(,P )0max i j i j i j i j i i i i j i j N S S V P P P u P P P ≠≠-≠===∞->⎧⎪=⎨<⎪⎩博弈者:代表所有的竞争者每一个博弈者的策略空间支付函数例:一群赌徒在赌钱,每个人将钱放在自己身边(每个人都知道自己的钱有多少),忽然吹来一阵风将所有的钱都混在一起,使他们无法分辨哪些钱是自己的,纳什均衡为他们解决这个问题。

⏹他们请来律师,律师宣布规则:☐每个人都将钱数写在纸条上,然后交给律师。

☐如果所有人要求的钱数加总不大于钱的总数,每一个人都得到自己要求的部分(如果有剩余的话,剩余部分归律师所有)。

☐如果所有人要求的钱数加总大于钱的总数,所有钱都归律师所有。

这个问题的Nash均衡是每个都拿自己的钱数。

其他任何一种分配方案中,都会有人多拿钱,有人少拿钱,少拿钱的人会后悔。

分析:我们现在假设只有2 个参与者A、B ,二者原本手中货币均为50(相互之间不知道其他人有多少钱,钱混在一起后也不知道总共有多少钱),现在,由于金钱混到一起,于是A和B 都想混水摸鱼,多得一部分钱,再假设都想得到60,那么写出支付矩阵:分析: 收益矩阵分析:⏹通过上面的支付矩阵,我们可以得出答案,只有A 和B都做出选择得到50 的时候,他们才能得到钱,不多一分也不少分,如果有一方想多得,二者将一分也得不到,钱全部归律师所有。

⏹拓展到N 人博弈,理性博弈者可以从最简单的二人博弈中发现每个人的最优策略仍然是只拿到自己本有的金额,否则,一人的多得将会导致所有人都没有,而这是一个最差的结果,按照不多得的策略,至少还可以得到自己应有的那一份。

占优均衡0.5 ,2.5-0.5,42,1.50, 0踩不踩踩不踩大猪小猪⏹占优均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。

⏹占优均衡是一个非常合理的预测。

⏹占优均衡不是普遍存在的,如,智猪博弈⏹踩一次出现4份食物⏹踩一次各猪消耗0.5单位的能量,但是,都踩,大猪得3份,小猪得1份大猪的最优选择要依赖于小猪重复剔除劣策略方法劣策略:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益少的策略。

'''''''''''''''''''''i ,,i (,)(,)iiii i i iii ii i ii iiiiiii s s s s S s s s u s s u s s s s s s s s s ----∈∈<∀i 定义:令和是参与人可选择的两个策略,即S 。

如果对于任意的其他参与人的策略组合参与人从得到的支付严格小于从选择得到的支付,即:我们说策略严格劣于。

通常,称为相对于的劣策略,称为相对于的占优策略。

重复剔除劣策略方法重复剔除的占优策略均衡:策略组合称为重复剔除的占优策略均衡,如果它是重复剔除劣策略后剩下的唯一策略组合。

如果这种唯一的策略组合存在的,我们就说该博弈是重复剔除占优可解的。

***1(,...)n s s s重复剔除劣策略方法的步骤:1.找出某个参与人的劣策略(假定存在),将这个劣策略剔除,重新构造一个不包含已剔除策略的新的博弈2.然后在继续剔除新的博弈中的某个参与人的劣策略,继续这个过程,一直到仅仅剩下一个唯一的策略组合为止.重复剔除劣策略方法⏹踩一次出现4份食物⏹踩一次各猪消耗0.5单位的能量,但是,都踩,大猪得3份,小猪得1份0.5 ,2.5-0.5,42,1.50, 0踩不踩踩不踩大猪小猪重复剔除劣策略方法⏹缺点☐参与人是理性的☐要求“理性”是共同知识☐博弈结果对双方行为的不确定性很敏感⏹需要一种适用性较强的博弈分析方法,该方法是以策略之间的相对优劣关系为基本。

8,10-10000,97,66,5U RLD试用重复剔除劣策略方法求解双寡头古诺模型的纳什均衡1212()10Q s s P P Q Scc=+==-==例2双寡头古诺模型用重复剔除劣策略的方法寻找均衡需要满足的条件:⏹利润函数是严格凹的(二阶导数小于0)⏹交叉偏导数为负的(反应函数是斜率为负的连续函数,且只交叉一次,交叉点上R1比R2更陡)稳定的均衡是存在的,且是唯一的纳什均衡的定义⏹策略空间:⏹博弈方的第个策略:⏹博弈方的得益:⏹博弈:纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略组合的最优策略,也即对任意都成立,则称为的一个纳什均衡n S S ,1ij i S s ∈i u },;,{11n n u u S SG =},;,{11n n u u S S G =),(**1n s s i ),...,,(**1*1*1n i i s s s s +- ********1111(,,,,...)(,,,,...)i i i i i n i i i ij i n u s s s s s u s s s s s -+-+≥ i j i S s ∈),(**n i s s G i i j *i s纳什均衡的含义⏹当其他人策略固定时,每一个人采用的策略是最好的⏹信念问题:每一个人都相信其他人都采用最优策略⏹如果不是Nash均衡,一定至少有一个人有动机偏离均衡,即均衡是不稳定的。

纳什均衡与重复剔除劣策略法占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡命题2.1:在n 个博弈方的博弈中,如果重复剔除劣策略法排除了除之外的所有策略组合,那么一定是该博弈的唯一的纳什均衡命题2.2:在n 个博弈方的博弈中中,如果是的一个纳什均衡,那么重复剔除劣策略法一定不会将它消去上述两个命题保证在进行纳什均衡分析之前先通过重复剔除劣策略法简化博弈是可行的),(**n i s s },;,{11n n u u S S G =),(**n i s s ),(**n i s s },;,{11n n u u S S G =G纳什均衡的一致预测性质⏹一个策略构成纳什均衡策略的唯一条件是参与人对于其他参与人均衡策略的最优选择。

⏹一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果。

☐只有纳什均衡才具有一致预测的性质☐一致预测性是纳什均衡的本质属性,所谓“一致”是指各博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测相同,无差异。

☐一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能划线法在每一个博弈方对其他博弈方每一个策略或者策略组合(对多人博弈)的最佳策略对应的收益下划线。

相关文档
最新文档