第二章 策略型博弈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


甲 放左手 放右手
猜左手 -1,1 1,-1
猜右手 1,-1 -1,1

甲 放左手 放右手
猜左手 -1,1 1,-1
猜右手 1,-1 -1,1
四、纳什均衡的求法 2、连续性博弈纳什均衡的求法 首先求出每个局中人对其他局中人策略组合的 反应函数——即在其他局中人策略组合给定时极大 化自己的支付,得到的最佳反应策略表现为其他局 中人策略组合的函数;
一、基本思想:
如果一个局中人在任何情况下从某种策略中得到的支付 均小于从另一种策略中得到的支付,那么显然对他而言,前 一种策略劣于后一种策略。 从个人利益出发,被剔除的策略不会被局中人采用。从 而可以利用剔除严格劣策略的概念来简化博弈局势,可能会
得到博弈的解。
二、严格劣策略的定义
si Si ,如果存在 si Si ,对于所有的
例2.7 智猪博弈的支付矩阵
小猪 大猪
按 5,1
9,-1
等待 4 ,4
0,0

等待
小猪 大猪
按 5 ,1
9,-1
等待 4 ,4
0 ,0

等待
小猪 大猪
按 5 ,1
9,-1
等待 4 ,4
0 ,0

等待
例2.4 性别大战博弈的支付矩阵
女 男 足球 芭蕾
足球 3,2 -1,-1
芭蕾 1,1 2,3
2 (q1 , q2 ) q2 [a (q1 q2 ) c]
Cournot 模型求解
max 1 ( q1 , q2 ) q1[ a (q1 q2 ) c]
max 2 ( q1 , q2 ) q2 [a (q1 q2 ) c ]
q2
q1
1 (q1 , q2 ) * * * [a (q1 q2 ) c] q1 (1) a 2q1 q2 c 0 q1
si ( s1 ,...si 1 , si 1 ,..., sn ) S i ( S1 ,...Si 1 , Si 1 ,..., S n )
都有 ui ( si, si ) ui ( si, si ) 且其中至少有一个为严格不等式 ,则称 si 是第i个 局中人的一个严格劣策略。
1 ,2
重复剔除严格劣策略均衡是(上,中)
·

乙 中

1 ,2
五、重复剔除严格劣策略有两个缺陷
1、每一步剔除需要局中人间相互了解的更进一步假定,
如果我们把这一过程应用到任意多步,需要假定“局中人
是理性的”是共同知识。 2、这一方法对博弈结果的预测经常是不准确的.
例2.2 石头、剪刀、布的支付矩阵

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2
甲:“不坦白”相对于“坦白”是严格劣策略
乙:“不坦白”相对于“坦白”是严格劣策略
乙 甲
坦白 -6,-6
不坦白 -1,-8
坦白

甲 坦白
坦白 -6,-6
例2.5 利用重复剔除严格劣策略求解
·

乙 左 中 右
上 下
1,0 0,3
方法能够对博弈局势进行简化,但可能得不
到博弈的均衡解。
需要引入非合作博弈理论中的核心概念 ——纳什均衡 (Nash Equilibrium)。
第三节
纳什均衡
一、纳什均衡的思想
“双赢” 或 “多赢”
二、纳什均衡的意义
它是关于博弈结局的一致性预测
如果所有局中人预测一个特定的纳什均衡会出 现,那么这种均衡就会出现。 只有纳什均衡才能使每个局中人均认可这种结 局,而且他们均知道其他局中人也认可这种结局。
博弈论与信息经济学
Game Theory and Information Economics
第二部分 非合作博弈理论
主要内容
第二章 策略型博弈 第三章 扩展型博弈 第四章 贝叶斯博弈 第五章 动态贝叶斯博弈
第二章 策略型博弈
——同时行动,如何决策
第一节
第二节 第三节
策略型博弈的表示
重复剔除严格劣策略均衡 纳什均衡
1 1 (q , q ) (a c), (a c) 3 3
1 2
1 2 (a c) 9
1 2
两寡头产量串谋模型
假设两寡头可以串谋,共同确定产量Q使总利润最大化, 利润函数为:(Q)=Q(a-Q-c)
1 总利润最大的产量为: Qm (a c) 2 1 Q1 Q2 Qm (a c) ——称为契约曲线 2 1 2 总利润为: m (a c) 4 2 Q q q2 ( a c ) 比较及含义: m 1 3 2 m 1 2 (a c) 2 9

设: 两寡头固定成本都为0,边际成本为常数c,
消费者对厂商1和2生产产品的需求量分别为:
q1 ( p1 , p2 ) a p ;1 bp2
2 (q1 , q2 ) * * * [a (q1 q2 ) c ] q2 (1) a q1 2q1 c 0 q2
Cournot 模型求解
反应函数:
1 q ( a q2 c ) 2 1 q2 (a q1 c) 2
1
纳什均衡:
三、重复剔除严格劣策略
1 、根据理性的局中人不会选Βιβλιοθήκη Baidu严格劣策略这一原则,可
以通过重复剔除严格劣策略的方法对博弈进行求解。
2 、其方法是:对每个局中人寻找严格劣策略,由于它不
会被局中人选择实施,所以找到一种后就可以将其从博弈
局势中剔除,从而得到一种新的缩减后的博弈局势,对这 种新局势重复上述过程,直到无法找到新的严格劣策略为 止。
第四节
第五节
混合策略纳什均衡
纳什均衡的存在性
博弈有两种表述方法
策略型(标准型)表述
——适合表示静态博弈 扩展型表述
——适合表示动态博弈
第一节
策略型博弈的表示
一、策略型博弈的含义
完全信息静态博弈又称为策略型博弈。完全信息是指
局中人对自己与其他局中人的所有与博弈有关的事前信息
(策略空间、支付函数等)有充分的了解(局中人的支付函
数是共同知识)。静态博弈是指在博弈中,局中人同时采取
行动,或者局中人的行动有先有后,但后行动者不能知道 先行动者的行动选择。
第一节
策略型博弈的表示
二、策略型博弈的三个要素:
1、局中人(Players): 1, 2, …, n; 2、策略(Strategies):
si Si , i 1,2,..., n ;
1 ,2 0 ,1
0 ,1 2 ,0
乙:“右”相对于“中”是严格劣策略
·

乙 左 中 右
上 下
1 ,0 0 ,3
1 ,2 0 ,1
0 ,1 2 ,0
甲:“下”相对于“上”是严格劣策略
·

乙 左 中
上 下
1 ,0 0 ,3
1 ,2 0 ,1
乙:“左”相对于“中”是严格劣策略
·

乙 左 中

1 ,0
四、纳什均衡的求法
1、双人有限博弈:双划线法
首先对局中人 2 的每一个策略,局中人 1 寻找支付最大 的策略,在其对应支付下划线; 然后对局中人1进行相应的步骤; 最后,凡是两个局中人支付下均被划线的结局就是纳 什均衡。
例2.1 囚徒困境的纳什均衡
用双划线法可以求出纳什均衡:
(坦白,坦白),(-6,-6) 意义:揭示个人理性与集体理性之间的矛盾。
不坦白
坦白
不坦白
-6,-6
-8,-1
-1,-8
-2,-2
例2.2 石头、剪刀、布的支付矩阵
乙 甲 石头 剪刀
石头 0,0 -1,1
剪刀 1,-1 0,0
布 -1,1 1,-1

1,-1
-1,1
0,1
例2.3 田忌赛马的支付矩阵
田忌 齐王 上中下 上下中 中上下 中下上 下上中 上中下 上下中 中上下 中下上 下上中 下中上 3,-3 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3 -1,1 1,-1 1,-1 1,-1 1,-1 3,-3 1,-1 1,-1 1,-1 1,-1 1,-1 3,-3 -1,1 -1,1 1,-1 1,-1 1,-1 3,-3 1,-1 -1,1 1,-1 1,-1 1,-1
下中上
1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
例2.4 性别大战(battle of the sexes) 局中人:男,女

略:男:看足球,看芭蕾
女:看足球,看芭蕾
支付矩阵:见下一页
性别大战的支付矩阵
女 男 足球 芭蕾
足球
3,2 -1,-1
芭蕾
1,1 2,3
第二节 重复剔除严格劣策略均衡

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2

甲 坦白 不坦白
坦白 -6,-6 -8,-1
不坦白 -1,-8 -2,-2
例2.7 智猪博弈(boxed pigs) 局中人:大猪,小猪
策 略:大猪:按,等待 小猪:按,等待 支付矩阵:见下一页 纳什均衡:(按,等待)
四、囚徒困境的解
对局中人甲而言,无论局中人乙采取何种策略,采用 “不坦白”策略得到的支付都小于采用“坦白”策略。 局中人甲的“不坦白”策略严格劣于“坦白”策略. “不坦白”策略都是一种严格劣策略,从而可以剔除。 博弈中局中人各自从自身利益出发的理性选择(博弈均 衡解)就是(坦白,坦白)。
例2.1 囚徒困境的支付矩阵
三、纳什均衡的定义 1、博弈的纳什均衡是这样一种最优策略组合, 是一种你好、我好大家都好的理性结局,其中每一 个局中人均不能也不想单方面改变自己的策略而增 加收益,每个局中人选择的策略是对其他局中人所 选策略的最佳反应。
三、纳什均衡的定义
2、数学定义: 在策略型博弈 G {S1 ,..., S n ; u1 ,..., un } 中,如果对于每个局中 人i,存在 si Si ,都有
图1
反应曲线、纳什均衡与契约曲线
Q1
1 (a c) 2 1 (a c) 3
厂商2的反应曲线 纳什均衡 契约曲线
1 (a c) 3 1 (a c) 2
厂商1的反应曲线
O
Q2
例2.10 两寡头价格竞争Bertrand(1883)模型 局中人:厂商1,厂商2 策 略:厂商1选择价格
p1;厂商2选择价格 p2
女 男 足球 芭蕾
足球 3 ,2 -1,-1
芭蕾 1,1 2,3
女 男 足球 芭蕾
足球 3 ,2 -1,-1
芭蕾 1,1 2,3
例2.8
猜左右手游戏
局中人:甲,乙 策 略:甲:放左手,放右手
乙:猜左手,猜右手
支付矩阵:见下一页 没有纳什均衡
乙 甲 放左手 放右手
猜左手 -1,1 1,-1
猜右手 1,-1 -1,1
例2.1 囚徒困境及其策略型表示 (Tucker,1950)
1、局中人:甲,乙 2、策 略:S甲 S乙 {坦白,不坦白}
3、支付函数——支付矩阵(双人有限博弈) 每个位臵上第一个数字表示局中人1在对应的策略组合 中得到的支付,第二个数字表示局中人2的相应所获支付。
囚徒困境的支付矩阵


坦白
3、支付函数 (Payoff functions) 表示为: G {S1 ,..., S n ; u1 ,..., un }
三、两种特殊博弈类型 1、有限博弈: (1) 博弈中局中人人数有限;
(2) 每个局中人只有有限个策略。
2、零和博弈:
博弈中局中人所获支付之和为零,即一方
所得为另一方所失。
ui ( si , s ) u ( s , s i i i i ), si S i

si arg max ui ( si , s i ), i 1, 2,..., n si S i
( s ,..., s 则称策略组合 1 n )是此博弈G的一个纳什均衡。
然后将这些反应函数联立求解即得到博弈的纳
什均衡解。
例2.9 两寡头产量竞争Cournot(1838)模型
局中人:厂商1,厂商2

略:厂商1:选择产量 q1
厂商2:选择产量 q 2

设:价格 p a (q1 q2 )
支付函数 (利润函数) :
1 (q1 , q2 ) q1[a (q1 q2 ) c]
乙 甲 石头 剪刀 布
石头 0,0 -1,1 1,-1
剪刀 1,-1 0, 0 -1,1
布 -1,1 1,-1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解



左 0 ,4
中 4 ,0
右 5 ,3


4 ,0
3 ,5
0 ,4
3 ,5
5 ,3
6 ,6
六、注意
大多数的博弈局势中使用剔除严格劣策略的
相关文档
最新文档