第二章同时决策博弈
合集下载
博弈论第二章——博弈规则.
![博弈论第二章——博弈规则.](https://img.taocdn.com/s3/m/60403ef4551810a6f5248669.png)
E(equilibrium)
▪ 均衡(equilibrium):是所有参与人的最 优战略的组合。
▪ 所谓博弈均衡,它是一种稳定的博弈结 果。
▪ 纳什均衡(Nash Equilibrium):一策 略组合中,所有的参与者面临这样的一 种情况:当其他人不改变策略时,他此 时的策略是最好的。
▪ 谢识予:给定你的 策略,我的策略是最 好的的策略,给定我的 策略,你的策略 也是最好的的策略
是指博弈分析者 感兴趣的要素的
嫌 疑 人
B
集合。是均衡行
动的组合。
坦白t
不坦 白n
嫌疑人A 坦白t 不坦白n -8,-8 0,-10 -10, 0 -1,-1
U(t,t)=0.5*(-8)+ 0.5*(-8)=-8 U(t,n)=0.5*0+ 0.5*(-10)=-5 U(n,t)=0.5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1
第二章 博弈论基本知识
2.1 什么是博弈论 2.2 博弈的结构和分类 2.3 博弈的表达方式 2.4 几类经典的博弈模型
第一节 什么是博弈论
2.1.1 从游戏到博弈 2.1.2 一个非技术性的定义 2.1.3 博弈论模型简介
2.1.1 从游戏到博弈
“博弈论”译自英文“Game
Theory”,直译就是“游戏理论”。
参考书目
1. [美]阿维纳什·K ·迪克西特.策略思维.中国人民大 学出版社,2002
2. 王则柯. 新编博弈论平话. 中信出版社,2003 3. 谢识予.经济博弈论(第二版) .复旦大学
出版社,2002
4. [美]埃里克·拉斯缪森.博弈与信息:博弈论概论. 北京大学出版社,2003
博弈论(第二章)讲义
![博弈论(第二章)讲义](https://img.taocdn.com/s3/m/4b0ed294ee06eff9aff8076e.png)
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
博弈论第3节
![博弈论第3节](https://img.taocdn.com/s3/m/197d6c0d6c85ec3a87c2c548.png)
情侣博弈和纳什均衡
情侣博弈
丽娟 足球 足球 大 海 电影 2,1 0,0 电影 0,0 1,2
足球显然不是大海的劣势策略。 电影也不是大海的劣势策略,因为如果丽娟坚持选电 影,大海选足球只得0,选电影还可以得1。 所以,大海没有全面的劣势策略。同样,丽娟也没有 全面的劣势策略。
情侣博弈的纳什均衡
(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多, 这类博弈很多,引出混合策略纳什均衡概念
二、混合策略、混合策略博弈 和混合策略纳什均衡
} 混合策略:在博弈G = {S1,LSn ; u1,Lun中,博弈方 i 的策略 混合策略 空间为 S i = {si1 , L sik },则博弈方 i以概率分布 pi = ( pi1 ,L p ik ) 随机在其 k 个可选策略中选择的“策略”,称为一个“混合策 j = 1,L, k 0 ≤ p ij ≤ p i1 + L 略”,其中 1 对 都成立,且+ p ik = 1
占优策略均衡
占优策略:不管其它博弈方选择什么策略,一博 占优策略 弈方的某个策略给他带来的得益始终高于其它 的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低 价”。 占优策略均衡:一个博弈的某个策略组合中的所 占优策略均衡 有策略都是各个博弈方各自的占优策略,必然 是该博弈比较稳定的结果 占优策略均衡不是普遍存在的
囚徒困境
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 不坦白 0, -8
-8, 0
-1, -1
两个罪犯的得益矩阵
在一个博弈里,如果所有参与人都有占优策略 存在,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,{坦白,坦白}是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论, 也许更应该研究的是怎样设计一种制度,在满足个人理性 的同时,去争取达到“集体理性”。
第二章_博弈思维:向前展望,从后倒推
![第二章_博弈思维:向前展望,从后倒推](https://img.taocdn.com/s3/m/3cff1fe0102de2bd960588d3.png)
结果是什么呢?
声称的策略与实际的策略:言语博弈问题
A向B发出威胁:如果你进入,我将阻挠。而对B来说,如
果进入,A真的阻挠的话,它将受损失-1亿,当然此时A 也有损失。对于B来说,问题是:A的威胁可臵信吗?
B 不进入 (0,10) (-1,2) 阻挠 (0,10)
进入
(4,4)
不阻挠
A
B通过分析得出:A的威胁是不可臵信的。
老板不用多付薪金
加薪谈判博弈树
加薪谈判
让老板相信你的威胁,最好的办法就是向他证明另一家 公司愿意每年多花12000元聘用你。(当然,如果真有 其事,你就不必运用博弈论来要求加薪了。) 争取加薪的另一办法是自断后路,告诉公司里的每个人, 如果你得不到加薪,你肯定会跳槽。你的目标是,把加
薪不成而留任的局面搞得越尴尬越好。
声称的策略与实际的策略:言语博弈问题
博弈论中,经常用“可臵信”和“不可臵信”的“威胁” 或“承诺”来区分行动者说出来的策略。而分析“威胁” 或“承诺”是可臵信的还是不可臵信的方法是倒推法。 倒推法(backward induction)也叫逆向归纳法。那么什 么是倒推法?
声称的策略与实际的策略:言语博弈问题
加薪谈判
如果你只是经理,不是老板。向你要求加薪的员工对你非
常重要,很不幸的是,你的员工也知道自己很重要,而且 你不想失去他们,但你又想压制一下下属的加薪要求。
这使你的谈判处于下风,因为假如员工能让你相信,只要 你不为他加薪,他就会跳槽,那你只好答应给他加薪。 你最好的办法是交出调薪的控制权,表明你对加薪无能为
加薪谈判
在博弈论的世界里没有仁慈或怜悯,只有一己之利。
在劳资博弈中,劳方是为了争取加薪,资方是为了确保 员工能在工作上全力以赴。老板绝不会无条件为员工加 薪,只有让老板相信对他有好处,员工才能得到加薪。 假如你对公司有所贡献,公司也依赖你。你希望加薪
第二章 完全信息静态博弈
![第二章 完全信息静态博弈](https://img.taocdn.com/s3/m/2dd2058f84868762caaed5b7.png)
2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总垄产断量了Q某=一q行1+业q2的(两市寡场头) 企业就是指这两家企业 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
一阶条件:
u1 p1
a1 2b1 P1 d1 P2
0
u2 p2
a2 2b2 P2 d2 P1
0
Cont…
❖
反应函数:
P1*
1 2b1
(a1
d1P2* )
P2*
1 2b2
(a2
d2 P1* )
❖ 纳什均衡( p1* , p2*)必需满足
P1*
1 2b1
2, 12 1, 11 2, 13
(3) (1)
上
甲
中
下
(3) 乙
(1)
左
中
右
4 ,12 0 , 12
3, 10 2, 11
2, 12 1, 11
3, 12
1, 8
2, 13
(2)
腐败与廉洁——两种路径
路径依赖:就是人们陷入一种情 况而发现从此难以脱身
❖ 1、换工作(我的工作:教师) ❖ 2、电脑操作系统 ❖ 3、婚姻 ❖ 4、腐败
第二章 完全信息静态博弈
完全信息静态博弈——各博弈方同时决策, 且所有博弈方对各方得益都了解的博弈。
囚徒的困境、齐威王田忌赛马、猜硬币、 石头剪子布、古诺产量决策
第二讲 完全信息静态博弈
![第二讲 完全信息静态博弈](https://img.taocdn.com/s3/m/9bbd7886d0d233d4b14e693d.png)
得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
博弈论(第二章)
![博弈论(第二章)](https://img.taocdn.com/s3/m/fb7728275a8102d276a22f23.png)
设某个村庄有三个农户,该村有一片大家都可以 自由放牧羊群的公共草地。由于这片草地的面积 有限,因此只能让不超过某一数量的羊吃饱,如 果在这片草地上的放牧的羊只的数量超过这个数 量,则每只羊都无法吃饱,从而每只羊的产出 (毛,皮和肉的总价值)就会减少,甚至有些羊 就会饿死。
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
第二讲纳什均衡
![第二讲纳什均衡](https://img.taocdn.com/s3/m/caf09afe5ef7ba0d4a733b71.png)
习题:齐威王田忌赛马矩阵
上中下 上中下
田忌
上下中 中上下 中下上 下中上 下上中
+3,-3 +1,-1 +1,-1 -1,+1 +1,-1
+1,-1 +3,-3 -1,+1 +1,-1 +1,-1
+1,-1 +1,-1 +3,-3 +1,-1 -1,+1
+1,-1 +1,-1 +1,-1 +3,-3 +1,-1
在第二行1 下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
20
第三节 纳什均衡
三、寻找纳什均衡的方法 (二)相对优势策略划线法 3.设定甲靠左行(第一行) 乙: 1>-1 乙相对优势策略:靠左行
在第一列 1下划线
2015年12月6日
博弈论第二章 第二讲纳什均衡
21
第三节 纳什均衡
四、古诺模型 max i 2.企业i的目标: π1=?,π2=? 3.企业利润最大化的一阶、二阶条件
1 0 q1 2 0 q2
2015年12月6日
2 1 2 0 2 q1 2 2 2 0 2 q 2
博弈论第二章 第二讲纳什均衡
35
第三节 纳什均衡
27
第三节
纳什均衡
要点:(1)箭 头指向的支付 大;(2)只有 一方单独改变 策略
三、寻找纳什均衡的方法 (三)箭头指向法 2.分析:(适度放牧,过度放牧) (1)给定乙不变,甲改变:0→10 (箭头向上) (2)给定甲不变,乙也不变
2015年12月6日
博弈论第二章 第二讲纳什均衡
大学课程《博弈论及其应用》PPT课件:第二章(1234节)
![大学课程《博弈论及其应用》PPT课件:第二章(1234节)](https://img.taocdn.com/s3/m/ccb698f2581b6bd97e19ea5d.png)
如果在一个博弈中,不管其他的博弈方的策略如何变化,一 个博弈方的某个策略给其带来的得益,总是相对于其他某些 策略(不必是全部)给他带来的得益要小,该策略称为相对 于其他某些策略的严格劣势策略(严格下策)。
我们在分析一个博弈方的决策行为时,首先找出某个博弈方 严格下策(假定存在),把这个策略消去,重新构造新的博 弈;然后,再消去这个新的博弈中的某个博弈方的严格下策; 继续这个过程,一直到只剩下唯一的策略组合为止。这个唯 一剩下的策略组合就是这个博弈的均衡解。这种分析方法称 之为“累次严优”,也称作“严格下策反复消去法”。
问题是,每个博弈方都要觉得偏好上策的情况很少,一般情 况是所以博弈方都没有上策,上策均衡不是普遍存在的。
在不存在严格优势策略的情况下,相对较好的选择是,不论 其他博弈方选择什么策略,该博弈方选择的某个策略给其带 来的得益不低于其可以选择的任何其他策略。通常把具有这 种性质的策略称为这个博弈方的弱优势策略。
优势策略有整体的严格优势策略(strictly dominant strategy)和 弱优势策略(weakly dominant strategy)区别。所谓的严格优势 策略,是指无论其他博弈方选择什么策略,这个博弈方的某
个策略给他带来的得益始终高于其他的策略,至少不低于其 他策略的策略。例如,囚徒的困境中的“坦白”,就是上策。
累次严优
博弈方2
左
中
上 博弈方1
下
1,0 0,4
1,3 0,2
图 2-5
右
0,1 2,0
对于图2-5描述的一个抽象博弈,不存在上策均衡。分析博弈 方1的策略,“上”策略和“下”策略都不是严格占优的优 势策略。再来分析博弈方2的三个策略,横着比较后面的得 益,“左”和“中”比较,“左”和“右”比较,没有严格
决策与博弈理论分析PPT
![决策与博弈理论分析PPT](https://img.taocdn.com/s3/m/3786d005f6ec4afe04a1b0717fd5360cba1a8ddd.png)
纳什均衡的局限性
纳什均衡假设每个玩家都完全理性,能够准确预测对手的策略,这在现实中可能并不成 立。
混合策略均衡分析
混合策略均衡
指在博弈中,每个玩家都有一定的概率采取不同的策略。
混合策略均衡的特点
混合策略均衡是一种更加现实的博弈结果,因为在实际生 活中,玩家往往无法准确预测对手的策略,需要采取一定 的随机性来应对。
国际政治博弈案例
总结词
国际政治博弈
详细描述
国际政治中,各国之间的利益冲突和战略互动经常需要运用博弈论来分析。例 如,冷战期间的美苏博弈、国际贸易谈判中的利益博弈等。
市场博弈竞争案例
总结词
市场竞争博弈
详细描述
在市场竞争中,企业之间经常运用博弈论来分析竞争对手的策略和市场格局,以制定有效的竞争策略 。例如,价格战、广告战等。
随着大数据和人工智能技术的快速发 展,如何利用这些技术提高决策效率 和精度也是未来研究的重要方向之一。
THANKS
感谢观看
06
结论与展望
决策与博弈理论的重要性和意义
决策与博弈理论在经济学、管理学、 政治学等领域具有广泛的应用价值, 为解决现实问题提供了重要的理论支 持和实践指导。
决策与博弈理论的发展对于推动相关 学科的进步和交叉融合具有重要意义, 有助于促进学科之间的交流和合作。
该理论有助于理解个体和群体在决策 过程中的行为特征和决策偏好,为企 业制定战略、政府制定政策提供科学 依据。
行为决策理论
关注实际决策过程中人的心理、情感和认知等因 素对决策的影响。
当代决策理论
综合了古典和行为决策理论的观点,强调理性和 非理性因素在决策中的共同作用。
02
博弈理论概述
博弈的定义与分类
纳什均衡假设每个玩家都完全理性,能够准确预测对手的策略,这在现实中可能并不成 立。
混合策略均衡分析
混合策略均衡
指在博弈中,每个玩家都有一定的概率采取不同的策略。
混合策略均衡的特点
混合策略均衡是一种更加现实的博弈结果,因为在实际生 活中,玩家往往无法准确预测对手的策略,需要采取一定 的随机性来应对。
国际政治博弈案例
总结词
国际政治博弈
详细描述
国际政治中,各国之间的利益冲突和战略互动经常需要运用博弈论来分析。例 如,冷战期间的美苏博弈、国际贸易谈判中的利益博弈等。
市场博弈竞争案例
总结词
市场竞争博弈
详细描述
在市场竞争中,企业之间经常运用博弈论来分析竞争对手的策略和市场格局,以制定有效的竞争策略 。例如,价格战、广告战等。
随着大数据和人工智能技术的快速发 展,如何利用这些技术提高决策效率 和精度也是未来研究的重要方向之一。
THANKS
感谢观看
06
结论与展望
决策与博弈理论的重要性和意义
决策与博弈理论在经济学、管理学、 政治学等领域具有广泛的应用价值, 为解决现实问题提供了重要的理论支 持和实践指导。
决策与博弈理论的发展对于推动相关 学科的进步和交叉融合具有重要意义, 有助于促进学科之间的交流和合作。
该理论有助于理解个体和群体在决策 过程中的行为特征和决策偏好,为企 业制定战略、政府制定政策提供科学 依据。
行为决策理论
关注实际决策过程中人的心理、情感和认知等因 素对决策的影响。
当代决策理论
综合了古典和行为决策理论的观点,强调理性和 非理性因素在决策中的共同作用。
02
博弈理论概述
博弈的定义与分类
第二章 完全信息静态非合作博弈
![第二章 完全信息静态非合作博弈](https://img.taocdn.com/s3/m/d606167301f69e3143329401.png)
博 弈 方 1 A B 2, 3 3, 1 5, 2 1, 5
博弈方2的混合策略
p A 3 pB 1 p A 2 pB 5
博弈方1的混合策略
pC 2 p D 5 pC 3 p D 1
2013-7-15
策略 收益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
2013-7-15
博弈论 重庆大学 刘辛
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上 下 中 右 左 中 左 中 1,0 1,3 0,1 0,4 0,2 2,0 1,0 1,3 0,4 0,2 1,0 1,3
ui qiV (Q ) qi c
以三农户为例 n=3,c=4
2013-7-15
博弈论 重庆大学 刘辛
18
竞争:个体利益最大化
q1 R1 ( q 2 , q3 ) 48 1 2 q2
1 2 1
1 2
q3
1 q3
q 2 R2 ( q1 , q3 ) 48
2 1 q3 R3 ( q1 , q 2 ) 48 q1 q 2 2 2
Q q1 q 2 P P (Q ) 8 Q
6 q1 q1q 2 q12
c1 c 2 2
1 q1 P (Q ) c1q1 q1[8 (q1 q2 )] 2q1
2 q2 P (Q ) c2 q2 q2 [8 (q1 q2 )] 2q2
24
博弈论 重庆大学 刘辛
五、小偷和守卫的博弈
博弈方2的混合策略
p A 3 pB 1 p A 2 pB 5
博弈方1的混合策略
pC 2 p D 5 pC 3 p D 1
2013-7-15
策略 收益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
2013-7-15
博弈论 重庆大学 刘辛
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上 下 中 右 左 中 左 中 1,0 1,3 0,1 0,4 0,2 2,0 1,0 1,3 0,4 0,2 1,0 1,3
ui qiV (Q ) qi c
以三农户为例 n=3,c=4
2013-7-15
博弈论 重庆大学 刘辛
18
竞争:个体利益最大化
q1 R1 ( q 2 , q3 ) 48 1 2 q2
1 2 1
1 2
q3
1 q3
q 2 R2 ( q1 , q3 ) 48
2 1 q3 R3 ( q1 , q 2 ) 48 q1 q 2 2 2
Q q1 q 2 P P (Q ) 8 Q
6 q1 q1q 2 q12
c1 c 2 2
1 q1 P (Q ) c1q1 q1[8 (q1 q2 )] 2q1
2 q2 P (Q ) c2 q2 q2 [8 (q1 q2 )] 2q2
24
博弈论 重庆大学 刘辛
五、小偷和守卫的博弈
同时博弈论
![同时博弈论](https://img.taocdn.com/s3/m/2d9ac93931126edb6f1a1098.png)
子; 若两人都退下来,
两人都丢面子
B
进
退
-3
0
进 -3
2
2
0
退0
0
Case4.石头剪子布
1. 博弈方1,2;
2. 可选策略: 石头、剪子 和布;
3. 几乎同时决 策;
4. 所得利益: 0表示没有输 赢;1表示赢; -1表示输。
博弈方2 石头 剪子 布
石 0,0 1,-1 -1,1 博头 弈 方 剪 -1,1 0,0 1,-1
1.2.6 完全信息博弈和不完全信息博弈
• 完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 • 不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。
将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
乙
左
中
右
0
3
1
甲上 1
1
0
4
2
0
下0
0
2
划线法——情侣博弈battle of sexes
一对情侣面临周末晚上安排什么节目的决策,Jim 是铁杆球迷,怎肯放过一场世界杯的生死之战?Eva 崇尚高雅艺术,正好有一场《胡桃夹子》的芭蕾舞剧。 分开各自做喜欢的事,对于热恋中的他们也是一种折 磨,怎么办?
Eva
同时决策/行动博弈
• 完全信息静态博弈中的行为假定
理性参与人 ----追求支付最大化
完全信息
----对策略、策略组合及相关支付完全了解
独立决策
----无勾结(不管是明的还是暗的)
• 同步决策(静态博弈)
在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的 决策时,同步决策博弈发生。
两人都丢面子
B
进
退
-3
0
进 -3
2
2
0
退0
0
Case4.石头剪子布
1. 博弈方1,2;
2. 可选策略: 石头、剪子 和布;
3. 几乎同时决 策;
4. 所得利益: 0表示没有输 赢;1表示赢; -1表示输。
博弈方2 石头 剪子 布
石 0,0 1,-1 -1,1 博头 弈 方 剪 -1,1 0,0 1,-1
1.2.6 完全信息博弈和不完全信息博弈
• 完全信息博弈:是指每一参与者都拥有所有其他参 与者的特征、策略集及得益函数等方面的准确信息的博弈。 • 不完全信息博弈:是指参与者只了解上述信息中的 一部分的博弈。
将博弈的信息特征和行为时间特征结合起来,可以进一 步把博弈细分为下面四种类型的非合作博弈,得到四种均衡:
乙
左
中
右
0
3
1
甲上 1
1
0
4
2
0
下0
0
2
划线法——情侣博弈battle of sexes
一对情侣面临周末晚上安排什么节目的决策,Jim 是铁杆球迷,怎肯放过一场世界杯的生死之战?Eva 崇尚高雅艺术,正好有一场《胡桃夹子》的芭蕾舞剧。 分开各自做喜欢的事,对于热恋中的他们也是一种折 磨,怎么办?
Eva
同时决策/行动博弈
• 完全信息静态博弈中的行为假定
理性参与人 ----追求支付最大化
完全信息
----对策略、策略组合及相关支付完全了解
独立决策
----无勾结(不管是明的还是暗的)
• 同步决策(静态博弈)
在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的 决策时,同步决策博弈发生。
同时博弈与序贯博弈
![同时博弈与序贯博弈](https://img.taocdn.com/s3/m/6627fca76f1aff00bed51eb4.png)
课外作业:试比较古诺模型与斯塔克尔博格模型的 结果有什么不同?
斯塔克尔博格模型中两个寡头先后选择的产量之 和要大于古诺模型中两个寡头同时选择的产量之 和,而斯塔克尔博格模型中两个寡头利润之和则 小于古诺模型的两个寡头利润之和。因此,市场 有一个领导者比各厂商势均力敌时对消费者而言 更好,因为斯塔克尔博格模型与古诺模型相比产 量大了,价格低了。
?第一节博弈的正规型表示与展开型表示?第二节同时决策与序贯决策的混合博弈?第三节树形博弈的子博弈?第四节子博弈精炼纳什均衡?第五节完美博弈的库恩定理?第六节动态博弈的运用第一节博弈的正规型表示与展开型表示?一如何将博弈的展开型形式转化为正规型表示?案例
主要内容
本章主要介绍: 1、如何用正规型表示和展开型表示来表述
◆
单点
集
◆
● ◆
◆
◆
完美信息博弈和不完美信息博弈
当博弈走到一个单点集的信息集时,面临决策的局 中人对于博弈迄今的历史清清楚楚,他清楚了博弈 具体走到了他的这个决策节点而不是别的决策点。 我们把这种历史清楚的博弈称为完美信息博弈。
但是当博弈走到一个非单点集的信息集时,面临决 策的局中人对于博弈迄今的历史是不清楚的,他不 清楚博弈具体走到了他的这个信息集里面的那个决 策点。我们把这种历史不清楚的博弈称为不完美信 息博弈。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
注意
1、子博弈不能从第一个阶段开始,因为原来的博 弈(母博弈)本身不能称为子博弈,即子博弈集 合是一个真子集合。
2、子博弈不能分割原来博弈(母博弈)的信息集。
D
●
B
●
A
●
C
斯塔克尔博格模型中两个寡头先后选择的产量之 和要大于古诺模型中两个寡头同时选择的产量之 和,而斯塔克尔博格模型中两个寡头利润之和则 小于古诺模型的两个寡头利润之和。因此,市场 有一个领导者比各厂商势均力敌时对消费者而言 更好,因为斯塔克尔博格模型与古诺模型相比产 量大了,价格低了。
?第一节博弈的正规型表示与展开型表示?第二节同时决策与序贯决策的混合博弈?第三节树形博弈的子博弈?第四节子博弈精炼纳什均衡?第五节完美博弈的库恩定理?第六节动态博弈的运用第一节博弈的正规型表示与展开型表示?一如何将博弈的展开型形式转化为正规型表示?案例
主要内容
本章主要介绍: 1、如何用正规型表示和展开型表示来表述
◆
单点
集
◆
● ◆
◆
◆
完美信息博弈和不完美信息博弈
当博弈走到一个单点集的信息集时,面临决策的局 中人对于博弈迄今的历史清清楚楚,他清楚了博弈 具体走到了他的这个决策节点而不是别的决策点。 我们把这种历史清楚的博弈称为完美信息博弈。
但是当博弈走到一个非单点集的信息集时,面临决 策的局中人对于博弈迄今的历史是不清楚的,他不 清楚博弈具体走到了他的这个信息集里面的那个决 策点。我们把这种历史不清楚的博弈称为不完美信 息博弈。
乙 借
甲 分 (2,2)
不分 乙
不借 (1,0)
(-1,0) (0,4)
注意
1、子博弈不能从第一个阶段开始,因为原来的博 弈(母博弈)本身不能称为子博弈,即子博弈集 合是一个真子集合。
2、子博弈不能分割原来博弈(母博弈)的信息集。
D
●
B
●
A
●
C
博弈论第二章 (1)
![博弈论第二章 (1)](https://img.taocdn.com/s3/m/bea4ebbf69dc5022aaea0068.png)
囚徒2 坦 白 囚 坦 白 徒 1 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
3、举例(2):斗鸡博弈
进 A 进 退
-3,-3 0, 2
B
退
2, 0 0, 0
独木桥
2
2014/9/22
一、博弈的标式表述
3、举例(3):齐王田忌赛马
上中下 上中下 上下中 齐 王 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 上下中 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 田忌 中上下 1,-1 1,-1 3,-3 1,-1 1,-1 -1,1 中下上 1,-1 1,-1 1,-1 3,-3 -1,1 1,-1 下上中 -1, 1 1,-1 1,-1 1,-1 3,-3 1,-1 下中上 1,-1 -1, 1 1,-1 1,-1 1,-1 3,-3
3
2014/9/22
二、重复剔除严格劣战略
3、重复剔除严格劣战略
二、重复剔除严格劣战略
(1)、思路和原理 反思占优均衡分析的思路,不难发现占优均衡分析 釆用的决策思路是一种选择法的思路,是在所有可 选择策略中选出最好一种。 剔除法与选择法在思路上正好相反,它是通过对可 选策略的相互比较,把不可能采用的较差策略排除 掉,从而筛选出较好的策略,或者至少缩小候选策 略的范围。这种剔除法的思路导出了博弈分析中的 重复剔除严格劣战略法(Iterated Elimination of Strictly Dominated Strategies)。
10:39:53
M
R
U S D
2 ,8 08 ,8 0 ,8
1,6 0 ,6 1,5
策略型博弈概述
![策略型博弈概述](https://img.taocdn.com/s3/m/3c8c65e1b84ae45c3a358c2f.png)
性别大战的支付矩阵
第二节 重复剔除严格劣策略均衡
一、基本思想:
如果一个局中人在任何情况下从某种策略中得到的支付 均小于从另一种策略中得到的支付,那么显然对他而言,前 一种策略劣于后一种策略。
从个人利益出发,被剔除的策略不会被局中人采用。从 而可以利用剔除严格劣策略的概念来简化博弈局势,可能会 得到博弈的解。
首先对局中人2的每一个策略,局中人1寻找支付最大 的策略,在其对应支付下划线;
然后对局中人1进行相应的步骤; 最后,凡是两个局中人支付下均被划线的结局就是纳 什均衡。
例2.1 囚徒困境的纳什均衡
用双划线法可以求出纳什均衡: (坦白,坦白),(-6,-6)
意义:揭示个人理性与集体理性之间的 矛盾。
例2.7 智猪博弈(boxed pigs)
止。
四、囚徒困境的解
对局中人甲而言,无论局中人乙采取何种策略, 采用“不坦白”策略得到的支付都小于采用“坦 白”策略。局中人甲的“不坦白”策略严格劣于 “坦白”策略.
“不坦白”策略都是一种严格劣策略,从而可 以剔除。博弈中局中人各自从自身利益出发的理 性选择(博弈均衡解)就是(坦白,坦白)。
例2.1 囚徒困境的支付矩阵
局,而且他们均知道其他局中人也认可这种结局。
三、纳什均衡的定义
1、博弈的纳什均衡是这样一种最优策略组合, 是一种你好、我好大家都好的理性结局,其中每 一个局中人均不能也不想单方面改变自己的策略 而增加收益,每个局中人选择的策略是对其他局 中人所选策略的最佳反应。
三、纳什均衡的定义
2、数学定义:
在策略型博G 弈{S1,.S .n.;u ,1,.u .n.}, 中,如果对于每个局
二、严格劣策略的定义
si Si ,如果存在 si Si,对于所有的
第2章_完全信息静态博弈
![第2章_完全信息静态博弈](https://img.taocdn.com/s3/m/9624d4ff941ea76e58fa04e1.png)
* q2 R2 ( q1 )
2.3.1 古诺的寡头模型
反应函数:是指每个博弈方针对其他博弈方所有战略的最佳反应构成 的函数。 纳什均衡就是各个博弈方的一组互为最佳反应对策的战略。
2.1.1 占优战略均衡(上策均衡)
开发商B 需求大的情况 开发商A 不开发 开发 开发 4000,4000 0,8000 不开发 8000,0 0,0 开发商B B严格劣 战略
A严格劣 战略
需求小的情况
开发
开发 开发商A 不开发 0,1000 -3000,-3000
不开发
1000,0 0,0
2.1.1 占优战略均衡(上策均衡)
-8, -8 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
2.1.4 箭头法
基本思路
对博弈中每个策略组合进行分析,考察在每个策略组合
处各个博弈方能否通过单独改变自己的策略而增加得益。
如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组。最后综合分析 对每个策略组合的分析情况,形成对博弈结构的判断。
有任何人有积极性破坏这个协议,则这个协议是自动
实施的。这个协议就构成了一个纳什均衡。
2.2 纳什均衡
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我的策略,
你的策略也是你的最好的策略。即双方在给定的策略下
不愿意调整自己的策略。
2.2 纳什均衡
寻找纳什均衡
参与人B
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
2.3.1 古诺的寡头模型
反应函数:是指每个博弈方针对其他博弈方所有战略的最佳反应构成 的函数。 纳什均衡就是各个博弈方的一组互为最佳反应对策的战略。
2.1.1 占优战略均衡(上策均衡)
开发商B 需求大的情况 开发商A 不开发 开发 开发 4000,4000 0,8000 不开发 8000,0 0,0 开发商B B严格劣 战略
A严格劣 战略
需求小的情况
开发
开发 开发商A 不开发 0,1000 -3000,-3000
不开发
1000,0 0,0
2.1.1 占优战略均衡(上策均衡)
-8, -8 -8, 0
0, -8 -1, -1
2, 1 0, 0
0, 0 1, 3
-1, 1 1, -1
1, -1 -1, 1
2.1.4 箭头法
基本思路
对博弈中每个策略组合进行分析,考察在每个策略组合
处各个博弈方能否通过单独改变自己的策略而增加得益。
如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后策略组合对应的得益数组。最后综合分析 对每个策略组合的分析情况,形成对博弈结构的判断。
有任何人有积极性破坏这个协议,则这个协议是自动
实施的。这个协议就构成了一个纳什均衡。
2.2 纳什均衡
通俗地说,纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我的策略,
你的策略也是你的最好的策略。即双方在给定的策略下
不愿意调整自己的策略。
2.2 纳什均衡
寻找纳什均衡
参与人B
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/11/15
13
严格劣势策略逐次消去法
理性的局中人是不会采用对自己不利的严 格劣势策略的,所以在分析博弈的可能结 局时,我们可以把局中人的严格劣势策略 都删去,只留下严格优势策略,由此得到 由双方的严格优势策略组成的博弈均衡, 叫做严格优势策略均衡。
2020/11/15
14
用严格劣势策略逐次消去法求 严格优势策略均衡
二人同时博弈
ห้องสมุดไป่ตู้
博弈中局中人的个数是博弈结构的关键 因素之一,根据局中人的个数,将博弈 分为“二人博弈”和“多人博弈”。
两人博弈就是两个各自独立决策,但策 略和利益相互依存关系的博弈方的决策 问题。例如,囚徒困境、田忌赛马、猜 硬币、打球等;经济活动中这样例子也 常见两个厂商之间的竞争、谈判、兼并 收购和劳资纠纷等。
的冲突。
2020/11/15
5
博弈的表述
博弈的三个基本要素:局中人、策略(或行动) 和得益(或支付)。
局中人:独立决策、独立承担博弈结果的个人或 组织。用i=1,2, …表示局中人,用N={1,2, …,n}表 示局中人的集合。
策略:局中人的决策内容。用Si表示局中人i可以 选择的一个特定策略,如果n个局中人每人选择 一如个 在特 囚定 徒的 困策 境略中,,则局n中维人向i的量策s=略(s集1,ss2i,=s{i…坦,白sn),。抵例 赖},而s=(坦白,坦白)是这个博弈的一个策 略组合。
左
中
右
上
1,0 1,3 0,1
下
0,4 0,2 2,0
2020/11/15
左 1,0 0,4
中 1,3 0,2
左中 1,0 1,3
15
公明博弈
注意:虚线划去的是劣势策略而不是严格劣势策略。
要求看 公 明
不要求看
2020/11/15
给看
装修行 不给看
800,600
0,0
0,1000
0,1000
公明博弈支付矩阵
2020/11/15
6
支付:每个局中人从博弈中获得的利益,它 体现每个参与博弈的局中人的追求,也是他 们行为和决策的主要依据。支付可以是利润、 收入、量化的效用、社会收益、福利等。可 以取正值,也可以取负值。
用ui表示局中人i的支付,它是策略组合s 的 函数。例如在囚徒困境博弈中,对于s=(沉 默,招供),u1(s)= -9,u2(s)=0。如果用向 量表示,支付向量为(u1(s),u2(s))=(-9,0)。 如果有n个参与人,支付向量为
2020/11/15
11
弱优势策略 (weakly dominant strategy)
并不是每一个博弈都存在严格优势策略,有 这样的情形,不存在不管其他局中人选择什 么策略,某个局中人选择他的某个策略给他 带来的支付始终高于他选择其它策略。
不管其他局中人选择什么策略,一个局中人 选择他的某个策略给他带来的支付仅仅只是 不低于他选择其它策略,我们通常把满足这 一性质的策略称为弱优势策略。
① 在二人博弈中,局中人双方的利益并不总是相 互完全冲突的,有时候也会出现双方利益方向 一致的情形。
② 在两人博弈中,掌握信息多的一方并不能保证 利益一定较多。
③ 在二人博弈中,个人追求自身利益最大化的行
为,往往并不能导致社会的最大利益,常常也
不能真正实现个人自身的最大利益。经济学常
常将这种现象称为“个人理性”与“集体理性”
设在一个n人博弈中,诸局中人的策略 集为S1,…Sn,每个局中人的支付 u1,…,un都是定义在S1×S2×…×Sn上的 函数,我们将这个博弈记作 G={S1,…Sn; u1,…,un}。这种表述方 法称为博弈的策略型表述或者正规型 表述。
2020/11/15
9
优势策略
在引论我们已经学习用支付矩阵的方 法描述一个同时决策博弈。将博弈描 述清楚并不是我们的最终目的,我们 的最终目的是把这个博弈的结果分析 清楚,即预测什么情况可能发生,什 么情况不会发生。在非合作博弈理论 中,常用的一种方法是寻找优势策略。
第二章 同时决策博弈
2020/11/15
1
主要知识点的安排
博弈的三要素和支付矩阵(第1节) *优势策略(第2节)和优势策略均衡(第3节) *相对优势策略( 第4节)和纳什均衡(第5节) 相对优势策略划线法(第6节)和箭头指向法
(第7节) 以上内容为完全信息静态博弈的分析方法 *纳什均衡的正式定义(第8节) 纳什均衡的性质——“最后归宿”(第9节) *纳什均衡的应用(第10节) 2020以/11/1上5 内容为完全信息静态博弈经典模型的应用2
2020/11/15
10
优势策略
在某个博弈中,如果不管其他局中人选择什么 策略,一个局中人的某种策略选择给他带来 的支付始终高于其他策略选择,或者至少不低 于其他策略选择,这个策略就称为优势策略。
只要这个局中人是一个理性的局中人,那么 他必定愿意选择这个策略。
优势策略可分为 ——严格优势策略(strictly dominant strategy) ——弱优势策略(weakly dominant strategy)
2020/11/15
12
严格劣势策略
不管其它博弈方的策略如何变化,给一个博
弈方带来的收益总是比另一种策略给他带来 的收益小的策略。 注意:界定一个策略是否是劣势策略,只需 要证明它比另一种策略,而不是其它所有的 策略给他带来的收益小。也就是说,对整体 而言一个博弈中只可能存在一个优势策略, 其它都是严格劣势策略。
2020/11/15
3
二人同时博弈
一般来说,局中人的个数越多,这种策 略的依存性就越复杂,分析就越困难; 但是有时候参与博弈的人数很多,博弈 的分析反而变得简单,这是因为他们的 决策会想到抵消。全体对手的决策呈现 可预见的规律。完全竞争市场的博弈就 是例证。
2020/11/15
4
二人同时博弈 研究中需要注意的问题
16
严格劣势逐次消去法的局限性
(u1(s),u2(s),…, un(s) )。
2020/11/15
7
举例
• 例如,在囚徒困境中,u1((沉默,沉默))= -1, u1((沉默,招供))= -9, u1=((招供,沉默))= 0, u1=((招供,招供))= -6。
• 同学们也可以选择支付矩阵来表示。
2020/11/15
8
博弈的策略型表述P43