博弈论第2章
博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
《博弈论:原理、模型与教程》第02章nash均衡第02节重复剔除劣战略行为

《博弈论:原理、模型与教程》第02章N a s h均衡第02节重复剔除劣战略行为-CAL-FENGHAI.-(YICAI)-Company One1《博弈论:原理、模型与教程》第一部分完全信息静态博弈第2章 Nash 均衡重复剔除劣战略行为(已精细订正!)在“囚徒困境”中,“坦白”是小偷的占优战略,也就是说,相对于战略“抵赖”,“坦白”在任何情况下都是小偷的最优选择。
因此,小偷只会选择战略“坦白”。
反过来也可以这么理解:相对于战略“坦白”,小偷选择“抵赖”所得到的支付都要小于选择“坦白”所的得到的。
既然选择“抵赖”的所得总是小于选择“坦白”的所得,小偷当然就不会选择“抵赖”,这也就相当于小偷将战略“抵赖”从自己的选择中剔除掉了。
考察更一般的n 人博弈情形。
在n 人博弈中,如果存在参与人i 的占优战略*i s ,那么他在博弈中的战略选择问题就很简单:选择占优战略*i s 。
但在大多数博弈问题中,参与人的占优战略并不存在。
虽然不存在占优战略,但在某些博弈问题中,参与人i 在对自己的战略进行比较时,可能会发现这样的情形:存在两个战略i s '和i s ''(i s ',i s ''∈i S ),i s ''虽然不是占优战略,但与i s '相比,自己在任何情况下选择i s ''的所得都要大于选择i s '的所得。
在这种情况下,理性参与人i 的选择又有什么样的特点呢虽然不能确定参与人i 最终会选择什么样的战略,但可以肯定的是,理性参与人i 绝对不会选择战略i s '。
因为参与人i 选择战略i s ',还不如直接选择战略i s ''(因为参与人i 在任何情况下选择i s ''的所得都要大于选择i s '的所得)。
定义2-3 在n 人博弈中,如对于参与人i ,存在战略i s ',i s ''∈i S ,对j nij j i S s ≠=-∏∈∀1,有),(),(i i i i i i s s u s s u --'>''则称战略i s '为参与人i 的劣战略,或者说战略i s ''相对于战略i s '占优。
博弈论讲义2

尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,
第二讲纳什均衡

习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡
博弈论各章节课后习题答案 (2)

π2
= (10 − 4 − 2q2 )q2
−
1 2
− 4q2 ,
∂π2 ∂q 2
= 6 − 4q2
−
4
=
0
,则有
q2=
1 2
,p=5,
π1=
3 2
,π2=0.
若进入者选择不进入:q2=0,p=6,
π1=
7 2
。
由以上计算分析可以看出,垄断在位者的威慑是可信的。垄断在位者的产量为 2,进入
者进入后无利可图,所以选择不进入。市场价格为 6。
(1)
( q1*, q*2,⋯, q*n )组成该博弈的纯策略纳什均衡点。
2
∑ 式(1)两边同时求和,可得:
n
q*i
=
Q*
=
n(a
−
c
−
Q* )
,于是
Q*
=
n (a n +1
−
c)
,
i =1
q*
=
a
−c
−
Q*
=
a−c n +1
,此时
p*=a-Q*=
a + nc n +1
,当
n
趋于无群大时,有
Q*=a-c,
所以可知该问题有两个纯策略纳什均衡点(开发,不开发)和(不开发,开发)。
该博弈还有一个混合的纳什均衡(( 10 , 1 ),( 10 , 1 ))。 11 11 11 11
如果乙企业所在国政府对企业开发新产品补贴 a 个单位,则收益矩阵变为:
⎡−10,−10 + a ⎢⎣ 0,100 + a
100,0⎤ 0,0 ⎥⎦
4. 用图解法求矩阵博弈的解。
经济博弈论 02 完全信息静态博弈(Park)

都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
第2章 纳什均衡

r ( s) = r1 ( s) × r2 ( s) × × rn ( s) = {(t1 , t 2 , , t n ) t i ∈ ri ( s), i = 1,2, , n}
称为博弈G的最优反应映射 最优反应映射. 最优反应映射 博弈的最优反应映射与纳什均衡之间的关系 定理2.1 s* ∈ S 为策略型博弈 G = N, S1,, Sn , u1,, u n 的 定理 纳什均衡的充要条件是 s * ∈ r ( s * ). 设 f (Y ) 为一集值映射.若 X ∈ f ( X ) ,称x为 f (Y ) 的不 不 动点. 动点 利用不动点概念,定理2.1可以如下叙述. 命题2.4 s*是策略型博弈G的纳什均衡的充要 命题 条件是 s*是最优反应映射 r (s) 的不动点,即 s*∈ r (s*) .
按 按
等待
(4, ) 4 ( 5 ,1 ) 等待 ( 9 , 1 ) ( 0 , 0 )
严格纳什均衡为大猪"按",小猪"等待".
例2.7 在例1.8中的大堤维护博弈中,支付矩阵为
维护 维护 不维护 ( 4 , 4 ) ( 14 , 10 ) ( 10 , 14 ) ( 10 , 10 ) 不维护
N , = {1,2} , G
给出. * * * * s 2 是局中人2对 设 s = ( s1 , s 2 ) 为G的纳什均衡.即 * * * s 2的最优反应. s 于 s1 的最优反应,1 是局中人1对于
(a1n , b1n ) (a2 n , b2 n ) (amn , bmn )
2.3 最优反应映射与纳什均衡
定义2.2 局中人的最优反应映射 定义 局中人i的最优反应映射是一个定义于策略组合集合S, 取值于 策略集 Si 的子集的集值映射(映射值为集合的映射称为集值映 S 射), ri ( s) S i ,满足
博弈论第二章答案

nc + a a − c a−c a−c ⋅ −c⋅ = n +1 n +1 n +1 n +1
企业违背垄断产量时的各期利润:
n −1 (a − c ) − qi πi = a − qi − cqi 2n ∂π i (n − 1)(a − c) =a− − qi − q j − c = 0 ∂qi 2n n +1 (n + 1)a + (3n − 1)c (a − c), p = 4n 4n 2 (n + 1) 利润为 (a − c) 2 16n 2 ⇒ qi =
仅供参考! !
-4-
E-mail:beckham.23@
2
出) ,只要任何一方违背时,以后就转向阶段博弈的价格 pi = c 。 如一直使用垄断价格,则每个企业收益每期都一样为, π i = (a − c) / 8 如在t期某企业违背了战略, t+1期开始双方的收益相同都为0, 在t期它的最大收益为 ( a − c) / 4 (考虑此企业只是把价格边际上减少一点点,所有的利润都归它) ,如不违背则把以后无限期
一阶条件:
V ' ( I p − B) = kU 2' ( S + B) ,
反应函数满足:
−1 < dB* / dS = kU 2" /(−kU 2" − V " ) < 0 即,孩子储蓄减少,家
*
长给予更高的赠与。 接着最大化孩子的收益:给定反应函数 B ,来选 S:
MaxU1 ( I c − S ) + U 2 ( S + B* )
∂π i = a − ∑ qi − qi − c = 0 ∂qi a−c (i = 1,2,3 n) n +1
张维迎《博弈论与信息经济学》讲义-第02章-纳什均衡与一致预期

最优选择
这个博弈只要求一阶理性共识就可以预测均衡 结果: 如果R相信C是理性的,R就知道C不会选择C3, 所以R的最优选择是R1; R R1 如果C相信R是理性的,C就知道R不会选择R2, 所以C的最优选择是C2. 但要C预期R不会选择R3,需要二阶理性共识; 要R不预期C会选择C1,需要三阶理性共识.
– – – – 如果R(b)C 选择C2, 如果R(b)C(b)R会选择R2; 如果R(b)C(b)R(b)C会选择C1; 如果R(b)C(b)R(b)C(b)R会选择R1
Consistently aligned beliefs (CAB)
考虑(R3,C3):对方不会犯预期错误:R选 择R3,如果他认为C会选择C3;C会选择C3, 如果他认为R会选择R3. CAB CAB:每个人对别人行为的预期(信念)是正 确的; Harsanyi doctrine: 如果两个理性的人具有相同 的信息,他们一定会得出相同的推断和相同的 结论; Robert Aumann: rational agents cannot agree to disagree.
重复剔除与理性共识
重复剔除不仅要求每个人是理性的,而且要求每个人 知道其他人是理性的,每个人知道每个人知道每个人 是理性的,如此等等,即理性是"共同知识"(共识) C1 R1 R2 R3 10,4 9, 9 1,98 C2 1, 5 0, 3 0,100 C3 98,4 99,8 100,98 这个博弈只要求 一阶理性共识就 可以预测均衡结 果. 如果把(下-左) 的第一个数字改为 11呢?
纳什均衡与一致预期
张维迎 教授 北京大学光华管理学院
博弈的基本概念(1)
参与人(players):博弈中决策主体的集合:什 么人参与博弈?每个人是什么角色? 行动(actions): 每个人有些什么样行动可以选 择?在什么时候行动? 信息(information):在博弈中的知识;每个人 知道些什么(包括特征,行动等)? 战略(strategies):行动计划;每个人有什么战 略可供选择?战略的完备性;
(完整版)博弈中纯策略纳什均衡点

《博弈论及其应用》 (汪贤裕) 9
完全信息静态博弈三要素
完全信息静态博弈就是在上述三要素的基础上,分 析各局中人为实现自身利益最大化的策略行为分析。
简记为: G [N ,{Si },{Pi }]
《博弈论及其应用》 (汪贤裕) 10
§2.1.2 占优均衡
(s
||
s
(i h
)
)
(2.1.1)
i 则称,局中人 的策略 sk(i) 严格占优策略 sh(i),或称策略 sh(i)相
对于sk(i)是严格劣策略。
《囚徒困境》中、犯罪嫌疑人A和B策略(承认)就是一个严
格占优策略。
《博弈论及其应用》 (汪贤裕) 12
定义2.1.2 占优均衡
在博弈G [N,{Si},{Pi}]中,若每一个局中人 i
定理2.2.1
在n 人非合作博弈 G [N ,{Si },{Pi }] 中:
若, s
都存在一个策略
s
' i
Si
, (i
N
)
,使得
si'占优于
Si \ {si' }
中任何策略,那么策略组合
s'
(
s1'
,
s
' 2
,
sn' )
称为 G 的占优策略均衡,简称占优均衡。对应的
{Pi (s') | i N} 称为占优均衡结果。
《博弈论及其应用》 (汪贤裕) 13
定义2.1.2 占优均衡(续)
《博弈论及其应用》 (汪贤裕) 17
§2.2.1 纯策略纳什均衡
定义2.2.1 纯策略纳什均衡点和均衡结果 定理2.2.1 重复剔除占优均衡与纯策略纳什均衡 ※ 纳什均衡点与多目标规划求解比较
博弈论与信息经济学-2-3纳什均衡存在性

闭集合
开集合
x1
x2
R
x1
x2
R
闭区间
开区间
x1
x2
R
半开区间
平行阴影集合A是开的 (相对于X),虚边线上 的点不属于A,开圆盘x 在A中。
平行阴影集合A是闭的 (相对于X),因为集 合A的补集X\A是开的, 开圆盘x在X\A中,实线 上的点属于A。
凸集
• 凸集合:集合A⊂RN是凸的,如果 αx + (1- α)x’ ∈ A,其中, x,x’ ∈ A,并且α ∈ [0,1]。 • 也就是说,如果RN中的一个集合A是凸 的,那么,如果它含有两个向量x和x’, 就包含连接这两个向量的整个线段(这两 个向量的凸组合或加权平均)。
Kakutani不动点定理
• 假定f(x): X→X是定义在点集X上的对应, 如果X是非空的、闭的、有界的和凸的, f(x)对于所有的x∈X是非空的、凸的 凸的, 凸的 且上半连续(upper semi-continuous), 那么,至少存在一个x*∈X,使得 x*∈f(x*),称为不动点。 • 对应的上半连续性等价于Brouwer不动点 定理中函数的连续性。
∑→∑
γ=1
∑1 θ=1
θ=0 ∑2
γ=0
应用Kakutani不动点定理 证明纳什均衡的存在性
• 首先,因为每一个∑i都是一个概率空间,因而 是(J - 1)维的单纯形(这里J是第i个参与人的纯 战略数量),这意味着∑i(从而∑)是闭的、有界 的、凸的和非空的。 • 设a1, …, ak是Rn中的一组线性无关的点,在 λ1+…+ λk=1以及λ1≥0,…, λk ≥0时,一切点x= λ1a1+…+ λkak的集合,称为k-1维单纯形,记为 (a1, …, ak)。 • k=2时的1维单纯形就是线段;k=3时的2维单纯 形就是三角形;k=4时的3维单纯形就是三棱锥, 各有K个顶点。
博弈论第二章习题

问题1:博弈方2就如何分10000元钱进行讨价还价。
假设确定了以下原则:双方提出自己要求的数额1s 和2s ,10000021≤≤s s ,。
如果设博弈方1和,1000021≤+s s ,则两博弈方的要求都得到满足,即分得1s 和2s ;但如果1000021>+s s ,则该笔钱就被没收。
问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会选择什么数额,为什么?解:112111210000()010000s s s u s s s ≤-⎧=⎨>-⎩,那么,1210000s s =-221222110000()010000s ss u s s s ≤-⎧=⎨>-⎩那么,2110000s s =-它们是同一条直线,1210000s s +=上的任意点12(,)s s ,都是本博弈的纯策略的Nash 均衡。
假如我是其中一个博弈方,我将选择15000s =元,因为(5000,5000)是比较公平和容易接受的。
它又是一个聚点均衡。
问题2:设古诺模型中有n 家厂商。
i q 为厂商i 的产量,n q q q Q +++= 21为市场总产量。
P 为市场出清价格,且已知Q a Q P P -==)((当a Q <时,否则0=P )。
假设厂商i 生产产量i q 的总成本为ii i i cq q C C ==)(,也就是说没有固定成本且各厂的边际成本都相同,为常数)(a c c <。
假设各厂同时选择产量,该模型的纳什均衡是什么?当趋向于无穷大时博弈分析是否仍然有效?解:1()ni i i j i j pq cq a c q q π==-=--∑,1,2,,i n =令20ii j j ii a c q q q π≠∂=---=∂∑,1,2,,i n =解得:***121na c q q q n -====+,2***121na c n πππ-⎛⎫==== ⎪+⎝⎭当n 趋向于无穷大时,这是一个完全竞争市场,上述博弈分析方法其实已经失效。
第二章_博弈思维:向前展望_从后倒推2010

跳槽时和会考虑给你加薪
不辞职
老板不用多付薪金
加薪谈判博弈树
绑架和诚实
如果你的孩子被绑架,你是否按绑匪的要求给付赎金?
如果你是绑匪,刚拿到赎金,你该不该释放人质?
撕票 不支付赎金 父母
支付赎金
若被警方抓住,判绑架杀人罪
绑匪 释放人质 撕票 绑匪 释放人质 易被警方抓住,判绑架罪 易被警方抓住,判绑架罪 若被警方抓住,判绑架杀人罪
甚至要求将药免费送给贫穷国家。这后果是什么呢?
制药厂的博弈
制药厂往往担心进入与政府和社会的博弈中。它作出投资 与否的决定取决于它对政府限价决定的预测。当它认为政 府会限价时,它就不会投资开发新药。
不开发新药
药厂与政府、社会均无所得
药厂
花9900万元 研制新药
限价 政府 不限价
药厂亏20000万元, 政府与消费者获益2000万
企业为什么诚实守信?
不光顾B公司 A公司 (顾客)
光顾B公司
两公司没有得益
占A公司便宜 B公司
B公司赚1000元, A公司损失2000元
公平对待A公司 B公司赚100元, A公司赚100元
企业为什么诚实守信?
如果B公司只打算进行一次博弈,那它一定会选择多占A公
司便宜。
在一次性博弈中,即使B公司承诺会公平对待A公司,A公 司也不会相信它,所以B公司一分钱也赚不到。 或者你会说,“只要B公司公平对待A公司,不就可以赚到 100元吗?
制药厂的博弈
假设:
9900万元=研制第一剂药的成本
1元=生产第二剂及后续药品的成本 100万人=想买这种药的总人数 如果制药厂生产100万剂,则每剂的成本为: (9900万+100万)÷100万= 100元。 政府及社会人士便会指责药厂,既然只要花1元钱就可以 制造出一剂新药,卖110元并不合理,因而要求限价50元,
博弈论第二章——博弈规则

U1f(f,z)=1 盖 U1f(f,f)=-1 硬
▪ U2z(z,z)=-1
币 方
-1
U2z(f,z)=1
U2f(z,f)=1
U2f(f,f)=-1
猜硬币游戏
猜硬币方-2 正面z 反面f
正面z -1,1 1,-1 反面f 1,-1 -1,1
Uz= U1z+ U2z=-1+1-1+1=0
Uf= U1f+ U2f=1-1+1-1=0
2.2.1 博弈中的博弈方
博弈方(player/ players) 博弈中独立决策、独立承担博弈结
果的个人或组织称为博弈方。 1.单人博弈 2.双人博弈 3.多人博弈
1.单人博弈
设有一商人要从A地运输一批货物, 从A地到B地有水、陆两条路线, 走陆路运输成本10 000元,而走水 路运输成本只要7000元。但非常危 险,出现坏天气的概率为0.25,此 时会损失10%的货物。货物总价值 90 000元。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
5.张维迎.博弈论与信息经济学.上海三联书店, 2004
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
博弈论第二章 (1)

3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
第二章 纳什均衡与一致预测性

• 2.2.3.6 纳什均衡的立法意义 • 纳什均衡是一种僵局,其他参与人的策略一定,没有任何人有积极性 偏离这种均衡的局面。给定别人遵守协议的情况下,没有人有积极性 偏离协议规定的自己的行为规则。如果一个协议不构成纳什均衡,它 就不可能自动实施,因为至少有一个人会违背这个协议,不满足纳什 均衡要求的协议是没有意义的。这是纳什均衡的立法意义。立法的目 标与其实施的结果要一致,必须使得参与博弈的各方达到纳什均衡。 否则,立法就仅仅是正式或官方规则,而实际有效的支配人们的是潜 规则。潜规则的要害是三方博弈:私下达成默契的双方,蒙骗正式制 度和公正原则的代表。纳什均衡具有一致预测的本质属性是它在非合 作博弈分析中具有不可替代重要地位的根本原因之一。预测是博弈分 析最基本的目的之一。也就是说,我们之所以要进行博弈分析,最重 要的原因就是预测特定博弈的博弈方究竟会采取什么行动,博弈将有 怎样的结果。因此一个博弈分析概念的作用和价值很大程度上是由其 对博弈结果预测能力的大小决定的。纳什均衡的一致预测性质正是其 预测能力的基本保证。
• 2.2.3 纳什均衡 • 2.2.3.1划线法 • 先找出自己针对其他博弈方每种策略或策略组合 (对多人博弈)的最佳对策,即自己的可选策略 中与其他博弈方的策略或策略组合配合,给自己 带来最大得益的策略(这种相对最佳策略总是存 在的,不过不一定唯一),然后在此基础上,通 过对其他博弈方策略选择的判断,包括对其他博 弈方对自己策略判断的判断等,预测博弈的可能 结果和确定自己的最优策略。这就是划线法。
2.1 博弈的基本结构
• 2.1.1 游戏(game) • 很多游戏都有一个特点:策略或者计谋有 举足轻重的作用。 • 2.1.1.1齐威王田忌赛马:每次双方各出三 匹马,一比一比赛三场,每一场的输方要 赔一千斤铜给对方。 • 2.1.1.2猜硬币游戏
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 托玛斯 谢林(Thomas C. Schelling )84岁,美国公民。他1951年 托玛斯-谢林( 谢林 岁 美国公民。 年 获得哈佛大学经济学博士学位。 获得哈佛大学经济学博士学位。后曾在美国哈佛大学的肯尼迪学 院教学长达20 20年 担任政治经济学教授, 院教学长达20年,担任政治经济学教授,并获得退休名誉教授 的称号。之后他还在美国马里兰大学公共政策学院和经济系担任 的称号。 教授,并获得退休名誉教授称号。 教授,并获得退休名誉教授称号。他教授的课程除包括经济学理 论外,还涉及外交、国家安全、核战略以及军控等多方面。 论外,还涉及外交、国家安全、核战略以及军控等多方面。
贡献:《冲突战略》、《武器与影响》等,其中前者是相关领域中最具 开创性的理论著作之一。他的理论和思想不仅运用在经济学分析中,在外 交、军事领域也深有影响。
Robert J. Aumann
Thomas C. Schelling
罗伯特·奥曼的博弈论
• • • • • 弈论:交互式条件下“最优理性决策” 完全竞争经济:参与者连续统模型 重复博弈论:理论系统性的发展 合作与非合作博弈论:非转移效用与理性的假设 其他贡献 “奥曼可衡量选择定理”、值集函数积分结 果等 评论:
博弈论的形成
博弈论的真正起点 博弈论的真正起点—— 真正起点—— 诺伊曼、 1944年 冯 诺伊曼、摩根斯坦 1944年《博弈论和经济行 Behavior) 为》 (Theory of Games and Economic Behavior) 在这本著作中引进了扩展形(Extensive Form)表 在这本著作中引进了扩展形( 扩展形 ) 示和正规形(Normal Form)或称策略形(Strategy 示和正规形( )或称策略形( 正规形 Form)、矩阵形(Matrix Form)表示,定义了极小化 )、矩阵形 )、矩阵形( )表示,定义了极小化 ),提出了稳定集( 极大解( ),提出了稳定集 极大解(Minmax Solution),提出了稳定集(Stable Sets)解概念等,正式提出了创造一种博弈论的一般理 )解概念等, 论的主意
其他成果:“进化论博弈”(Evolutionary Game Theory) Theory) 其他成果: 进化论博弈”
“进化稳定策略”(Evolutionary Stable Nash Equilibrium) Equilibrium) 进化稳定策略” 共同知识” Knowledge) “共同知识”(Common Knowledge)
齐默罗在 齐默罗在1913年提出的关于象棋博弈的定理是博弈论的第一 年提出的关于象棋博弈的定理是博弈论的第一 个定理,提出的“逆推归纳法” 个定理,提出的“逆推归纳法”(Backward Induction Procedure)则是博弈论的第一种一般意义的分析方法 ) 波雷尔在 波雷尔在1921-1927年期间给出了混合策略的第一个现代表 年期间给出了混合策略的第一个现代表 述,并给出了有数种策略的两人博弈的极小化极大解等 诺伊曼( 诺伊曼(Von Neumann)和摩根斯坦(Morgenstern) ) 摩根斯坦( ) 1928年给出了扩展形博弈定义,证明了有限策略的两人零和博 年给出了扩展形博弈定义, 年给出了扩展形博弈定义 弈有确定的结果等
博弈论的早期研究
博弈思想源于对策问题,可谓历史悠久, 博弈思想源于对策问题,可谓历史悠久,至少可追溯到 源于对策问题 2000多年前我国古代的“齐威王田忌赛马”;1500年前巴比 多年前我国古代的“齐威王田忌赛马” 年前巴比 多年前我国古代的 伦犹太教法典中的“婚姻合同问题” 伦犹太教法典中的“婚姻合同问题”等 博弈论早期研究的起点 起点——1883年的“古诺模型”。这一 年的“ 博弈论早期研究的起点 年的 古诺模型” 模型同1883年伯特兰德的寡头竞争模型都是对博弈问题的早 模型同 年伯特兰德的寡头竞争模型都是对博弈问题的早 期零星研究 博弈论的系统研究是从本世纪初期开始的。 系统研究是从本世纪初期开始的 博弈论的系统研究是从本世纪初期开始的。系统研究博弈 理论的发端是齐默罗( 理论的发端是齐默罗(Zermelo)和波雷尔(Borel)对象棋 )和波雷尔( ) 博弈等的系统研究
2005年诺贝尔经济学奖 2005年诺贝尔经济学奖—— 年诺贝尔经济学奖
博弈论方面的贡献
• 罗伯特 奥曼(Robert J. Aumann )75岁,出生于德国法兰克福, 罗伯特-奥曼( 奥曼 岁 出生于德国法兰克福, 1955年在美国麻省理工学院获得数学博士学位现任耶路撒冷希伯 年在美国麻省理工学院获得数学博士学位现任耶路撒冷希伯 来大学理性分析中心教授、 来大学理性分析中心教授、纽约州立大学斯坦尼分校经济系和决 策科学院教授、以色列数学俱乐部主席、 策科学院教授、以色列数学俱乐部主席、美国经济联合会荣誉会 员等。他还担任《国际对策论杂志》 数理经济学杂志》 员等。他还担任《国际对策论杂志》、《数理经济学杂志》、 经济学理论杂志》 运筹学数学》等多家专业杂志社的编辑。 《经济学理论杂志》、《运筹学数学》等多家专业杂志社的编辑。
博弈论的成长-成熟时期( 博弈论的成长-成熟时期(1)
博弈论研究第三个高潮 博弈论研究第三个高潮——20世纪80、90年代 第三个高潮——20世纪 、90年代 世纪80 重要成果: 重要成果:
Elon Kohlberg的“顺推归纳法”(Forward Induction) Kohlberg的 顺推归纳法” Induction) 克瑞泼斯( Kreps)和威尔逊( Wilson) 克瑞泼斯(David M. Kreps)和威尔逊(Robert Wilson)的 序列均衡” Equilibria) “序列均衡”(Sequential Equilibria) 斯密( 进化和博弈论》 斯密(John Maynard Smith )的《进化和博弈论》 Games) (Evolution and The Theory of Games) 伯恩海姆(B.D.Bernheim)和皮尔斯(D.C.Pearce) 伯恩海姆(B.D.Bernheim)和皮尔斯(D.C.Pearce)的“可 理性化性” Rationalizability) 理性化性”(Rationalizability) 海萨尼和塞尔腾的“ 海萨尼和塞尔腾的“在非合作和合作博弈中均衡选择的一般 理论和标准” 理论和标准” 弗得伯格(D.Fudenberg)和泰勒尔首先提出的“ 弗得伯格(D.Fudenberg)和泰勒尔首先提出的“完美贝叶斯 均衡” Equilibrium) 均衡”(Perfext Bayesian Equilibrium)
重要人物和成果
塞尔腾(Selten):1965年提出“子博弈完美纳什均衡” 年提出“ 塞尔腾(Selten):1965年提出 子博弈完美纳什均衡” 1975年提出“颤抖手均衡” 1975年提出“颤抖手均衡” 年提出 海萨尼(Harsanyi) 海萨尼(Harsanyi): 1967-1968年先后提出分析不完美信息博弈问题的标准方法 1967-1968年先后提出分析不完美信息博弈问题的标准方法,“贝叶斯纳什均衡” 年先后提出分析不完美信息博弈问题的标准方法, 贝叶斯纳什均衡” 1973年提出了关于“混合策略”的不完全信息解释, 严格纳什均衡” 1973年提出了关于“混合策略”的不完全信息解释,“严格纳什均衡” 年提出了关于
博弈论的成长- 博弈论的成长-少年时期
博弈论研究的第一个高潮 博弈论研究的第一个高潮——20世纪的40年代末和50年代初 第一个高潮——20世纪的 年代末和 年代初 世纪的40年代末和50 研究基础
诺伊曼和摩根斯坦的奠基性著作 二次大战期间博弈论思想和研究方法在军事领域中的应用
代表性成果——纳什均衡 代表性成果——纳什均衡
1994年 纳什、海萨尼、 1994年,纳什、海萨尼、塞尔顿致力于对博弈论基础理论的 研究——非合作博弈 获得经济学诺贝尔奖, 非合作博弈, 研究——非合作博弈,获得经济学诺贝尔奖,使得博弈论作为 重要的经济学分支学科的地位和作用得到了最具权威性的肯定 1996年 1996年,莫里斯和维克瑞对不对称信息下激励机制问题进行 了基础性研究,获得了诺贝尔经济学奖, 了基础性研究,获得了诺贝尔经济学奖,进一步强化了博弈论 的发展趋势
主讲人: 主讲人: 王慧敏 河海大学商学院
第二章 博弈导论
2.1 博弈论发展历程 2.2 博弈相关概念、类型及方法论介绍 博弈相关概念、 2.3 非合作博弈论
河海大学商学院
授课教师: 授课教师:王慧敏
2.1 博弈论发展历程
博弈论的早期研究 博弈论的形成 博弈论的成长和发展 博弈论的成熟及与主流经济学的融合 博弈论的发展前景
博弈论的成长- 博弈论的成长-青年时期
博弈论研究第二个高潮 博弈论研究第二个高潮——20世纪50年代中后期到70年代 第二个高潮——20世纪 年代中后期到 年代 世纪50年代中后期到70
研究成果
1954-1955年的 微分博弈” 1954-1955年的“微分博弈”(Differential Games) 年的“ Games) 1959年的 强均衡” 1959年的“强均衡”(Strong Equilibrium) 年的“ Equilibrium) 重复博弈” Games) 民间定理” Theorem) “重复博弈”(Repeated Games)和“民间定理”(Folk Theorem) 1960年的 焦点” 1960年的“焦点”(Focal Point) 年的“ Point)
奥曼对博弈论和经济理论的发展作出了重要贡献。在当代博弈 论研究中几乎没有他未涉足过的领域。他的研究具有与众不同的广 度和深度,他的科学贡献从基本概念、学科的发现与形成到适当工 具与方法的发展在分析不同具体问题中的应用,都具有开创性的进 展。值得注意的是,奥曼的大部分研究与经济理论的中心问题联系 密切。一方面,这些问题为他的工作提供了刺激和推动力;另一方 面,他研究的结果产生了经济学新的见解和思维。