非合作博弈理论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* *





Ai常常是一个连续空间, i 常常是可微的,将每个参
与人收益函数对他自己的行动求微分,得到一个纯战略均 衡,于是一阶条件是: i * *
i ai , ai 0
j
举例:两家生产有差别产品的企业进行价格竞争, ai pi , 对企业i产品需求:q D p , p 1 bp dp
C
2,-1
F C
1,0
囚徒困境
3,1
纳 什 均 衡 的 引 入 和 定 义
1.引入: n 2.定义:战略组合 ai i 1 是一个纯战略纳什均 衡,当且仅当对所有 Ai 中的 a i ,
i i ai , a a , a i i i

这里 ai a1 ,...,ai 1 , ai 1 ,...,an 也即一个纳什均衡是一个行动组合,使得在视其 对手行动给定的条件下,没有一个参与人希望改 变自身的行动。这个定义可以直接扩展到允许混 合战略存在的情形。(以性别战博弈为例说明)
举例:回顾囚徒困境
(2b d )(1 bc) d 2 c p 4b 2 2d 2
* 1
* * p2 R2 p1

(回顾斯塔克伯格模型:两家企业同质产品的产量上序贯博弈)
例2:思路——逆向归纳、贴现、无差异
“几乎完美”的信息博弈
1.定义:假定博弈被分解为若干时期,在每个时期t,参与 人同时选择行动,他们知道在时期1和t-1之间每个人选择 过的所有行动。由于这种博弈只是在一个时期内引入了同 时性,因此,我们把这样的扩展型成为“几乎完美”的信 息博弈。 最简单的例子是“重复博弈”,其中,一个简单的一 期同时移动博弈被重复T次,在时期t,参与人知道t之前 的所有移动。在重复博弈中,时期之间没有实际联系。
在此输入文字标题
非合作博弈理论
主 要 内 容
1、博弈与战略 2、纳什均衡 3、精炼均衡 4、贝叶斯均衡 5、精炼贝叶斯均衡
博弈的分类及对应的均衡概念
行动顺序 静态
完全信息静态博弈 纳什均衡 不完全信息静态均衡 贝叶斯均衡
动态
完全信息动态博弈 子博弈精炼纳什均衡 不完全信息动态均衡 精炼贝叶斯均衡
a L
1 1
2,0 1,0
2,-1 3,1
a R
2 1
第 二 节 纳 什 均 衡
1.重复剔除的战略均衡 2.占优战略均衡 3.纳什均衡
重 复 剔 除 的 占 优 均 衡
博弈1
参与人2 参与人1
1 a1 L
2 a a1 l , l 2 r , r 2
3 a2 l, r
Back to 博弈1
“合理”and“不合理”
求解均衡的方法
逆向归纳过程-库恩算法:给定博弈到达最后一个决策结,该 决策结上行动行动的参与人有一个最优选择,这个最优选择 就是该决策结开始的子博弈纳什均衡,然后我们回到倒数第 二个决策结,找出倒数第二个决策者的最优选择,这个最优 选择与我们在第一步找出的最后决策者的最优选择构成倒数 第二个决策结开始的子博弈的一个纳什均衡。 如此不断直到初始结,每一步都得到对应子博弈的一个 纳什均衡,在这个过程的最后一步得到的整个博弈的纳什均 衡也就是这个博弈的子博弈精炼纳什均衡。
动态博弈(dynamic game)是指参与人的行动有先后顺序,而且行动在 后者可以观察到行动在先者的选择,并据此作出相应的选择。
2.纯战略和混合战略
纯战略(pure strategy)指参与人确定地做出一项给定的行动选择, 与之相反,参与人以某种概率选择某一行动称为混合战略(mixed strategy)。
博弈1
标 准 型
参与人2 参与人1
1 a1 L
2 a a1 l , l 2 r , r 2
3 a2 l, r
4 a2 r, l
2,0
2,-1
2,0
2,-1
a12 R
1,0
3,1
3,1
1,0
博弈2
标 准 型
参与人2 参与人1
a l
1 2
a r
2 2
4 a2 r, l
2,0
2,-1
2,0
2,-1
a12 R
1,0
3,1
3,1
1,0
占 优 战 略 均 衡
1.占优战略:无论对手作何选择,该 战略都是最优的战略
2.占优战略均衡:由博弈中的所有参 与者的占优策略组合所构成的均衡
重复剔除的战略均衡 VS 占优战略均衡
参与人2 参与人1
F
2,0
两个概念:
1.子博弈:满足三个条件 2.子博弈精炼均衡:是指一组战略,使得在任何一个子博弈 中,这组战略都组成一个纳什均衡。 这样,精炼均衡要 求,不管在博弈树的哪个点,以及是否谓语均衡路径上, 参与人所使用的战略构成均衡战略。
完美信息博弈
1.定义:完美信息博弈中,轮到行动的参与人知道这之前所 有被选择过的行动,不涉及同时行动问题。 2.举例: 例1:①描述 ②思路 ③均衡解
信息
完全信息
不完全信息
第 一 节 博 弈 与 战 略
描述扩展型→博弈树
博弈形式化
标准型
① L ② l 2 0 r l 2 1 -1 0 博弈1 R ② r 3 1 l 2 0 L
① R
博 弈 树

r l 2 1 -1 0 博弈2 r 3 1
概念比较
1.静态博弈和动态博弈
静态博弈(static game)中,参与人同时选择行动或虽有先有后但后行 动者并不知道先行动者的选择。
纳什均衡→精炼均衡
纳什均衡适用于所有博弈,而不仅仅是静态博弈,但 是如果博弈分析的目的是预测博弈参与人的行为,纳什均 衡并不太合理。 同时纳什均衡假定每一个参与人在选择自己的最优战 略时假定其他人的选择是给定的,也即参与人不考虑自己 的选择对别人的影响,因此纳什均衡很难说是动态博弈的 一个合理解。为此学者们便提出了很多改进,精炼均衡便 是一种重要的改进。
i i
i i
j
其中, 0 d b ,如果企业i单位成本为c,那么
pi c1 bpi dp j
i
一阶导为零
* * p1 p2
1 bc 2b d
ห้องสมุดไป่ตู้
均衡解
回忆古诺模型和古诺均衡(同质产品的产量博弈)
第 三 节 精 炼 均 衡
1.精炼均衡的引入 2.完美信息博弈 3.“几乎完美”的信息博弈
相关文档
最新文档