第二章(完全信息静态博弈)

合集下载

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

第二章 完全信息静态博弈

第二章 完全信息静态博弈

2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总垄产断量了Q某=一q行1+业q2的(两市寡场头) 企业就是指这两家企业 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
一阶条件:
u1 p1
a1 2b1 P1 d1 P2
0
u2 p2
a2 2b2 P2 d2 P1
0
Cont…

反应函数:
P1*

1 2b1
(a1
d1P2* )
P2*

1 2b2
(a2
d2 P1* )
❖ 纳什均衡( p1* , p2*)必需满足
P1*

1 2b1
2, 12 1, 11 2, 13
(3) (1)




(3) 乙
(1)



4 ,12 0 , 12
3, 10 2, 11
2, 12 1, 11
3, 12
1, 8
2, 13
(2)
腐败与廉洁——两种路径
路径依赖:就是人们陷入一种情 况而发现从此难以脱身
❖ 1、换工作(我的工作:教师) ❖ 2、电脑操作系统 ❖ 3、婚姻 ❖ 4、腐败
第二章 完全信息静态博弈
完全信息静态博弈——各博弈方同时决策, 且所有博弈方对各方得益都了解的博弈。
囚徒的困境、齐威王田忌赛马、猜硬币、 石头剪子布、古诺产量决策

第二章完全信息静态博弈2

第二章完全信息静态博弈2
第二章完全信息静态博弈2
1
2021/2/22
本章重点讨论
一、博弈论的若干基本概念
占优战略均衡(Dominant strategy equilibrium,DSE) 重复剔除占优均衡(Iterated dominance equilibrium,IEDE) 纳什均衡(Pure Nash equilibrium,PNE) 混合战略纳什均衡(Mixed strategy Nash equilibrium,MNE)
2021/2/22
博弈:参与人
选择行动 战略
寻找最优目标(Max)支付
静态时:策略与行动一致,因为没有任何可能影响参与人行动选择的
信息被披露出来。
2
二、纳什均衡应用举例
1、Cournot寡头竞争模型(1838) 纳什均衡(1950)
2、豪泰林(Hotelling)价格竞争模型
3、公共地的悲剧(Tragedy of the commons)
② 旅行成本为td2,这里d是消费者到商店的距离
这里仍有 D1=x,D2=1-x,但这里 x应满足:
p 1 t( x a ) 2 p 2 t [ x ( 1 b ) ] 2 ( 3 )
解方程(3):p1t(x22axa2)p2t[x22(b1)x(b1)2]
p1p2 2t(1ab)x(1ab2a)(1ab)(1)t
若上例,若市场由(两企业构成的统一垄断企业控制)
其模型为:Max(q1q2)p(q1q2)[c1(q1)c2(q2)]
(q1q2[a(q1q2)])c(q1q2)
(q1q2[a(q1q2)])c(q1q2) Q(aQ)cQ (这里q1q2Q) 垄断企业利润最大化条件MR=MC
又 已 知 p a (q1 q2 ) AR M R a 2(q1 q2 ) a 2Q M C d (q1 q2 ) c c dQ

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

完全信息静态博弈

完全信息静态博弈

一 占优战略均衡
占优战略均衡
定义:在博弈的战略表达式中,如果对于所
有的i,Si*是i的占优战略,下列战略组合称为
占优战略均衡:
s* (s1*, , sn* )
一 占优战略均衡
注意:
✓ 如果所有人都有(严格)占优战略存在,那么 占优战略均衡就是可以预测的唯一均衡。
✓ 占优战略只要求每个参与人是理性的,而不要 求每个参与人知道其他参与人是理性的(也就 是说,不要求理性是共同知识)。为什么?
二 重复剔除的占优均衡
举例: 剔除顺序:R3、C3、C2、R2,战略组合(R1,C1)
C1
R1
2,12
R2
0,12
R3
0,12
C2
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。
开发商B 开发 不开发
开发 4000,4000 8000,0
不开发 0,8000
0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
斗鸡博弈
独木桥
进 A
退
B

退
-3,-3 2,0
0,2 0,0
纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
6,2
R2
2,1
R3
3,0
8,4 9,6
3,6 2,8

完全信息静态博弈

完全信息静态博弈

三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

第2章_完全信息静态博弈

第2章_完全信息静态博弈

2. “斗鸡博弈” 斗鸡博弈”
甲、乙两人相对而行,试图通过一座独木桥。 乙两人相对而行,试图通过一座独木桥。 独木桥仅能容纳一人通行。 独木桥仅能容纳一人通行。 如果两人坚持继续前行, 如果两人坚持继续前行,那么互不相让的二人势必都掉下狭仄 的独木桥,两人都会掉到河里, 的独木桥,两人都会掉到河里,均得到收益 -10。 。 如果甲选择退让,让乙先行, 如果甲选择退让,让乙先行,那么得意的乙将得到收益 20, , 面子受损的甲 得到收益 -2。 。 如果乙选择退让,让甲先行, 如果乙选择退让,让甲先行,那么得意的甲将得到收益 20, , 面子受损的乙得到收益 -2。 。 如果甲和乙均选择退让, 如果甲和乙均选择退让,那么双方均得到收益 10。 。
2.智猪博弈 .
猪栏里养了两头猪,一头大猪、一头小猪。 猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。 大猪和小猪都在思考是否去按压开关。
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第二章
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2.通过“划横线法”求解“智猪博弈”的均衡 .通过“划横线法”求解“智猪博弈”
小猪 按开关 按开关 大猪 等待 (10,-2) , ) (0,0) , ) (5,-1) , ) 等待 (4,2) , )

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。

博弈论(第二章)

博弈论(第二章)
设某个村庄有三个农户,该村有一片大家都可以 自由放牧羊群的公共草地。由于这片草地的面积 有限,因此只能让不超过某一数量的羊吃饱,如 果在这片草地上的放牧的羊只的数量超过这个数 量,则每只羊都无法吃饱,从而每只羊的产出 (毛,皮和肉的总价值)就会减少,甚至有些羊 就会饿死。
假设这些农户在夏天才到公共草地放羊,而每年 的春天就要决定养羊的数量。
(2)严格下策反复消去法也不能解决所有的博弈分析 问题 。
严格下策反复消去法的思考问题:
(1)“严格下策”和“上策”之间有没有对应关系, 什么
情况下有对应关系? (2)使用严格下策反复消去法所得到的均衡结果,是
否与消去的严格下策的次序有关。
严格下策反复消去法的练习
例2:下图中的得益矩阵表示两博弈方的一个静态博 弈,试使用严格下策反复消去法进行分析。
纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,

经济博弈论 02 完全信息静态博弈(Park)

经济博弈论 02 完全信息静态博弈(Park)
ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?

2 完全信息静态博弈

2  完全信息静态博弈

2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡

社会福利博弈
四. 混合策略纳什均衡

社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡

策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。

由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。


支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2

经济博弈论完全信息静态博弈

经济博弈论完全信息静态博弈

19
2024/9/21
2.3.2 应用
混合策略旳措施不但能够处理不存在纯策略纳什均衡旳博弈问题,一样 可应用于存在多种纯策略纳什均衡旳博弈问题。
例 夫妻之争
丈夫
该博弈与上一种博弈旳不同之处于
时装 足球
于每一方所希望对方懂得自己旳策略选
妻 时装 2,1 0,0
择以到达有利于自己旳成果。现实中,
子 足球 0,0 1,3
严格下策反复消去法与纳什均衡
严则格称下ui策(s1:,...对si ,于...,某sn )一为策u略i (s(1s,1..,.s..i*.s,.i.,.,..s.n,)sn旳),严若格u下i (s策1,..。.si ,..., sn ) ui (s1,...si*,..., sn )
命策题反复2.1消去在法n排个除博了弈方(s1*旳,..博., s弈n* )以G外 旳S1全,...,部Sn策;u1略,..组.,u合n 中,,则假(s如1*,严...格, s下n* )
9
2024/9/21
2.2.2 反应函数-古诺模型
在古诺模型中厂商1和厂商2旳反应函数分别为
q1
R1(q2 )
1 2
(6
q2
),
q2
R2 (q1)
1 2
(6
q1 )
q2 (0,6) R1(q2)
(0,3) 0
(2,2)
6
R2(q1)
(3,0) (6,0)q1
从左图能够看出,当一方旳 选择为0时,另一方旳最佳反应 为3,这正是我们前面所说过旳 实现总体最大利益旳产量,因为 一家产量为零,意味着另一家垄 断市场。当一方旳产量到达6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。

经济博弈论02完全信息静态博弈(Park)

经济博弈论02完全信息静态博弈(Park)

合策略。
02
混合策略纳什均衡
当所有参与者都选择混合策略,并且每个参与者的混合策略都是针对其
他参与者混合策略的最佳反应时,这组混合策略组合就构成了混合策略
纳什均衡。
03
混合策略纳什均衡求解
通过求解每个参与者在给定其他参与者混合策略下的期望收益最大化问
题,可以得到混合策略纳什均衡。
多重纳什均衡问题
多重纳什均衡定义
参与者、策略与收益
参与者
在完全信息静态博弈中,参与者是决策的主体,他们可以是个人、组织或国家等。每个参 与者都有各自的目标和利益诉求,通过选择不同的策略来追求自身利益最大化。
策略
策略是参与者在博弈中可选择的行动方案。在完全信息静态博弈中,每个参与者的策略空 间是已知的,包括所有可能的选择和组合。参与者需要根据自身情况和对其他参与者行为 的预期来制定最优策略。
Part
05
完全信息静态博弈实验设计与 数据分析
实验设计原则和方法
代表性原则
选择具有代表性的参与者和博弈 场景,确保实验结果具有普遍意 义。
实验方法
采用随机分组、角色扮演、问卷 调查等方法收集数据。
可控性原则
对实验条件进行严格控制,确保 实验结果不受外部因素干扰。
可重复性原则
确保实验过程可重复进行,以便 验证实验结果的稳定性和可靠性。
行为博弈论和演化博弈论发展动态
行为博弈论的研究进展
演化博弈论的研究动态
行为与演化博弈论的融 合趋势
行为博弈论将心理学、经济学等学科 的成果引入博弈论分析框架中,探讨 参与者在现实决策中的有限理性、学 习过程和情绪等因素对博弈结果的 方法来研究博弈问题,关注策略在群 体中的演化过程和稳定性分析。近年 来,演化博弈论在多个领域取得了重 要进展,如社会网络中的信息传播、 生态系统中的物种竞争等。

第二章完全信息静态博弈

第二章完全信息静态博弈

二、反应函数
前面讨论的两寡头古诺模型中,根据两厂商的 利润最大化条件可以得到两厂商的反应函数 (Reaction Function) :
q
1
R1 (q2 )
1 2
(6 q2 )
q
2
R2 (q1 )
1 2 (6 q1 )
第二十六页,编辑于星期三:十五点 五十五分。
q2 (0,6)
(0,3)
(二)纳什均衡与严格下策反复消去法
命题2.1 在 n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n } 中, 如果严格下策反复消去法排除了除 之外 (s1 *,,sn *) 的所有策略组合,那么 (s1 *, ,sn *)一定是该博弈唯一 的纳什均衡。
命题2.2 在n个博弈方的博弈 G { S 1 , ,S n ;u 1 , u n 中},如 果 (s1 *, ,s是n *)G的一个纳什均衡,那么严格下策反 复消去法一定不会将它消去。
古诺寡头模型——产量博弈分析(1)
两厂商的利润函数分别为:
u 1q 1P (Q ) c1 q 1q 1 [8 (q 1 q 2) ]2 q 1 6 q 1 q 1 q 2 q 1 2
u 2 q 2P (Q ) c2 q 2 q 2 [8 (q 1 q 2) ]2 q 2 6 q 2 q 1 q 2 q 2 2
第二章 完全信息静态博弈
基本分析思路和方法 纳什均衡 无限策略博弈分析和反应函数 混合策略和混合策略纳什均衡
第一页,编辑于星期三:十五点 五十五分。
第一节 基本分析思路和方法
上策均衡 ; 严格下策反复消去法; 划线法;
剪头法。
第二页,编辑于星期三:十五点 五十五分。
一、上策均衡

2.完全信息静态博弈

2.完全信息静态博弈
1 1 2 n
第2章 完全信息静态博弈 章
电影《美丽心灵》中,有人向纳什提出了这样一个 问题,问题的背景如下:在一个舞会上,有两个以 上的男士,有比男士更多的魅力十足的女士,但只 有一个金发女郎,男人开始邀请舞伴,但只能邀请 一次请一个女郎作为舞伴,所有男士更喜欢金发女 郎,但有女伴比无女伴要好,如果两个男士同时邀 请一个女士,两人都会被拒绝。假设你作为一个男 士,你会如何邀请舞伴?
构造博弈模型所需要的要素
1.局中人集合 局中人集合 N = {0,1,2,⋯, n},称 N 为局中人或参与人集合。N 中元素称为参与人或局
中人。参与人不专指人,它泛指参与博弈活动的政府、企业、地区、国家、 个人……等决策主体。通常用“0”表示虚拟局中人,它的行为是以确定的 概率分布进行随机选择, i = 1,2, ⋯ , 表示实际参与人。 n
T ② T ① I12 T ② I 22 T H T H ② HT T ② H H ① ①
I11
H ② T H ① I15 T ② H T ② I 25 H T H ② H
I 21
I13
H T ② T H ② T
① I14 H
I 23
I 24
H T
图2-2
信息集可以告诉我们以下4点 信息集可以告诉我们以下 点 1.在一个信息集上应由哪个参与人选择行动。 2.从一个信息集出发,局中人可能选择哪些行动。 3.局中人在一个信息集上选择行动时已知道了哪些信息。 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息 集的博弈历程。 完美信息博弈 如果G的每个信息集都是单点信息集。表明博弈的每个参与人 在选择行动时对博弈到现在为止的历程都完全了解,这时称G 为完美信息博弈 完美信息博弈。 完美信息博弈 扩展型博弈不仅能刻画动态博弈, 扩展型博弈不仅能刻画动态博弈,也能刻画静态博弈

第二章完全信息静态博弈五优品ppt

第二章完全信息静态博弈五优品ppt

人民版九年级全一册知识点人民版九年级教材是我国中学课程改革的重要成果之一,其内容涵盖了九年级学生所需的各个学科知识点。

本文将以人民版九年级全一册的知识点为主题,探讨其中一些重要的内容。

一、数学知识点在九年级数学课本中,涵盖了许多重要的数学知识点。

例如,整式、分式、函数、概率等等。

其中,整式是九年级数学的基础,它包括了常数、变量和运算符。

通过整式的学习,学生可以进一步掌握代数运算的方法,并能够应用到实际问题中。

另外一个重要的数学知识点是分式。

分式是数学中的一个概念,它包括了分子和分母两个部分。

学生通过学习分式可以进一步理解数与运算之间的关系,并能够进行分数的加减乘除运算。

此外,函数也是数学课程中的重要内容。

函数是一种数与数之间的关系,它可以用来描述各种现实问题。

通过学习函数,学生可以掌握函数的图像、函数的性质以及函数的应用等方面的知识,提高数学解决实际问题的能力。

概率也是九年级数学中的重要知识点之一。

概率是一个描述随机事件发生可能性的数值,通过学习概率,学生可以理解事件的可能性,并能够运用概率的方法进行问题的解决。

二、语文知识点在九年级语文教材中,包含了许多文学知识点和语言知识点。

其中,文学知识点主要包括了文言文、现代文、古诗词等等。

通过学习这些文学知识点,学生可以进一步了解我国古代文化和现代文学作品,提高对文学作品的理解和欣赏能力。

同时,语言知识点也是九年级语文教材的重要内容之一。

语言知识点包括了词语的用法、句子的结构、修辞手法等等。

通过学习语言知识点,学生可以提高自己的语言表达能力,并能够运用语言知识进行文学鉴赏和作文写作等活动。

三、英语知识点在九年级英语教材中,包含了许多重要的英语知识点。

其中,语法知识点是九年级英语的基础内容之一。

学生通过学习语法知识点可以掌握英语的基本语法规则,并能够正确运用到口语和书面语中。

另外一个重要的英语知识点是词汇。

词汇是英语中的基本单位,通过学习词汇,学生可以扩大自己的词汇量,并能够正确运用英语词汇进行交流和表达。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* * 最优策略。即:ui (Si* , S ) u ( S , S 1 i i 1 ) 对于任意
Si Si
和任意的 i都成立。
二、纳什均衡的一致预测性质
一致预测性是纳什均衡的本质属性。 “一致性预测”是指:如果所有博弈方都预 测
一个特定的博弈结果会出现,那么所有的博弈方
的实际行为选择都会与他们的预测一致,即没有
q1 R1 (q2 )
(0,3)
(2,2)
q2 R2 (q1 )
(3,0) (6,0) q1 图2.9 古诺模型的反应函数几何描述
三、伯特兰德寡头模型——价格博弈
当厂商1和厂商2价格分别是 P 1和 P 2 时,它们各 自的需求函数为 :
q1 q1 ( P 1, P 2 ) a1 b1 P 1 d1 P 2 q2 q2 ( P 1, P 2 ) a2 b2 P 2 d2 P 1
正是由于纳什均衡是一致性预测,因此才进一 步有下列性质:首先,各博弈方可以预测它,可以 预测他们的对手会预测它,还可以预测他们的对手 会预测自己会预测它,……;其次,预测任何非纳 什均衡策略组合将是博弈的最终结果,意味着要么 各博弈方的预测其实并不相同(预测不同的纳什均 衡会出现等),要么预期至少一个博弈方要“犯错 误”,包括对博弈结构理解的错误,对其他博弈方 的策略预测错误,其理性和计算能力有问题,或者 是实施策略时会出现差错等。
哪个博弈方有偏离这个预测结果的愿望,因此这
个预测结果最终真会成为博弈的结果。
一致预测性在博弈分析中是重要的,原因在于 一个博弈方在博弈中所作预测的内容包括他自己的 选择,因此博弈方有可能会利用预测改变自己的选 择,而具有一致预测性质的博弈分析概念就能避免 这样的矛盾,从而是稳定的和自我强制的(Self enforcing),相应选择也才是真正可预测的。 纳什均衡具有一致性预测的性质,而且只有纳 什均衡才有这种性质,任何非纳什均衡的预测都不 是一致预测,因此一致预测正是纳什均衡的本质属 性。
先找出自己针对其他博弈方每种策略或 策略组合(对多人博弈)的最佳对策,即自 己的可选策略中与其他博弈方的策略或策略 组合相配合,给自己带来最大得益的策略 (这种相对最佳对策总是存在的,不过不一 定唯一),然后在此基础上,通过对其他博 弈方策略选择的判断,包括对其他博弈方对 自己策略判断的判断等,预测博弈的可能结 果和确定自己的最优策略。

严格下策反复消去法并不能解决所有 博弈的分析问题。(如猜硬币博弈、石头• 剪子•布博弈)

严格下策反复消去法失效的原因,仍 然是在典型的博弈问题中,博弈方之间普 遍存在策略依存的特征,也就是说一个博 弈方的不同策略之间,往往不存在绝对的 优劣关系,而只存在相对的、有条件的优 劣关系。
三、划线法
1

命题2.2 在n个博弈方的博弈 G {S1 , , S n ; u1 , un } 中, * * ,, s n ) 是G的一个纳什均衡,那么严格下 如果 (s1 策反复消去法一定不会将它消去。
第三节

无限策略博弈分析和反应函数
古诺的寡头模型
反应函数

伯特兰德寡头模型
q1
一、古诺寡头模型——产量博弈
设两厂商无固定成本,边际生产成本分别为 c1 和 c2 ,策略空间分别为 s1 [0, P1max ] , s2 [0, P2 max ] , 两厂商是同时决策的。
伯特兰德寡头模型——价格博弈分析(1)
两厂商的利润函数(关于价格的函数):
u1 u1 (P1 , P2 ) P1q1 c1q1 (P1 c1 )q1 (P1 c1 )(a1 b1 P1 d1 P2 )
G {S1 , , S n ; u1 , un } , n个参与人的策略式表达博弈:
* } 是一个纳什均衡,如果 策略组合 S * {S1* ,, Si* ,Sn
对于每一个 i,si* 是给定其他所有参与人选择
* * * * * S { S , , S , S S 1 1 i 1 i 1 n } 的情况下第 i个参与人的
囚徒2 坦白 抵赖
囚 坦白 -5,-5 徒 1 抵赖 -8,0
0,-8
-1,-1
图2.7 箭头法分析囚徒的困境
第二节
纳什均衡的定义
纳什均衡
(Nash Equilibrium)


纳什均衡与严格下策反复消去法
sij G {S Si1 , , S n ; u1 , u n }
一、纳什均衡的定义
划线法算例分析
博弈方2 左 中

0,1 2,0
博弈 上 方1 下
1,0 0,4
1,3 0,2
图2.4 划线法分析
无法用划线法确定结果的博弈

猜硬币
猜硬币方 正面 反面
盖硬 正面 币方 反面
-1,1 1,-1
1,-1 -1,1
图2.5 划线法分析猜硬币博弈

夫妻之争(Battle of Sexes) 丈夫 时装 足球 妻 时装 2,1 0,0 子 足球
盖硬 正面 币方 反面
图2.10 猜硬币博弈
2、严格竞争博弈原则

第一个原则:自己的策略选择不能预先被 另一方知道或猜中。这正是没有纳什均衡 博弈与存在唯一纳什均衡博弈之间的一个 重要的本质区别。
第二个原则:在该博弈的多次重复中,博 弈方一定要避免自己的选择带有规律性, 在该博弈中博弈方必须随机选择策略。
博弈方2 左 博弈 上 1,0 0,4 中 1,3 0,2 右 0,1 2,0
方1

图2.1
严格下策反复消去法算例分析
博弈方2 左 中 博弈 上 1,0 1,3 方 1 下 0,4 0,2
图 2.2 消去博弈方2 右策略后的博弈
博弈方2 左 中 博弈 上 1,0 1,3 方1
图2.3 进一步消去 博弈方1下策后的博弈
二、反应函数
前面讨论的两寡头古诺模型中,根据两厂商的 利润最大化条件可以得到两厂商的反应函数 (Reaction Function) :
1 q 1 R1 ( q2 ) (6 q2 ) 2 q R ( q ) 1 (6 q ) 2 2 1 1 2
q2 (0,6)
二、严格下策反复消去法
(Iterated Elimination of Strictly Dominated Strategies) 一博弈方的某个策略给他带来的得益总比其它策略带 来的得益小,就称这种策略为“严格下策”。通过对可选 策略的相互比较,把不可能采用的较差策略排除掉,从而 筛选出较好的策略。

4、混合策略和混合策略纳什均衡
第二章 完全信息静态博弈


基本分析思路和方法
纳什均衡 无限策略博弈分析和反应函数

混合策略和混合策略纳什均衡
第一节 基本分析思路和方法
上策均衡

严格下策反复消去法;
划线法; 剪头法。
一、上策均衡

博弈中如果不管其他博弈方选择什么策略,一博
弈方的某个策略给他带来的得益始终高于其他策
伯特兰德寡头模型——价格博弈分析(2)
解此方程组,得 :
P1*
P2*
d1 2b2 (a2 b2 c2 ) (a1 b1c1 ) 4b1b2 d1d 2 4b1b2 d1d 2
d2 2b1 (a1 b1c1 ) (a2 b2 c2 ) 4b1b2 d1d 2 4b1b2 d1d 2

很显然,上述猜硬币博弈中两博弈方 都以1/2 的相同概率随机选择正面、反面 时,双方都无法根据对方的选择获益。 这种博弈方以一定的概率分布在可选 策略中随机选择的策略,称为“混合策 略”。 与此相对,把原来意义上的策略称为 “纯策略”。
3、混合策略定义

定义: 在博弈 G {S1 , , Sn ; u1 , , un } 中,博弈方 i Si {si1 , , sik } ,则博弈方 i以概率 的策略空间为 分布 pi ( pi1 , , pik ) 随机在其 k 个可选择策略 中选择的“策略”,称为一个 “混合策 pij 1 略” 0 。其中 对于 j=1,…, k都成立, 且 pi1 pik 1
2 1
u 2 q2 P(Q) c2 q2 q2 [8 (q1 q2 )] 2q2
2 6q2 q1q2 q2
古诺寡头模型——产量博弈分析(2)
利润最大化条件:
* * 6 q2 2 q1 0 * * 6 q 2 q 1 2 0
解得:
u1 q1 P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q12
古诺寡头模型——产量博弈分析(1)
两厂商的利润函数分别为:
u1 q1 P(Q) c1q1 q1[8 (q1 q2 )] 2q1 6q1 q1q2 q
* * (P 1 , P 2 )
为该博弈唯一的纳什均衡 。
第四节

混合策略和混合策略纳什均衡
严格竞争博弈和混合策略的引进
多重均衡博弈和混合策略


混合策略和严格劣策略重复剔除
混合策略反应函数
一、严格竞争博弈和混合策略的引进
1、猜硬币博弈
猜硬币方 正面 反面 -1,1 1,-1 1,-1 -1,1
设一市场有1、2两家厂商生产同样的产品。如果 厂商1的产量为 q1 ,厂商2的产量为 q2 ,则市场总产 量为 Q q1 q2 。设市场出清价格P(可以将产品全部 卖出去的价格)是市场总产量的函数:
P P(Q) 8 Q
再设两厂商的生产都无固定成本,且每增加一单 位产量的边际成本相等 c1 c2 2 。最后强调两厂商同 时决定各自的产量,即他们在决策之前都不知道另 一方的产量。
相关文档
最新文档