博弈论 第一章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 完全信息静态博弈1.0 对策论研究的内容与基本形式
对策论研究的内容
对策论研究多个行为主体的决策问题。
对策论研究的形式
博弈(game),由多个行为主体构成的系统。
例
Stackelberg model
Cournot model
博弈的类型
参与者行动的时间与顺序
同时行动——静态博弈;
先后行动——动态博弈。
参与者的信息多少
信息相同——完全信息;
信息不同——不完全信息。
1.1 基本理论: 博弈的标准式和纳什均衡
例1 儿童游戏:“石头、剪刀、布”。
博弈的标准式表示(normal-form representation)
(1) 参与人( player).
n 个参与人:1, 2, …, i, …, n.
(2) 战略(strategy).
一个参与人的战略是他采取的一个行动。
参与人i 的战略:s i.
参与人i 的战略空间: S i.
战略的一个组合: s ={s1,s2, …, s n}.
简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }.
(3) 收益(payoff).
参与人i 的收益:u i= u i(s1,s2, …, s n)
n个参与人博弈的标准形式表示:
G = {S1, S2, …, S n;u1, u2, … , u n}
完全信息(complete information):每个参与人知道其他人的战略空间和收益。
静态博弈(static game):所有的参与人同时行动。
每个人行动时,不知道其他人的行动。
例1(续):博弈{石头、剪刀、布} 的描述:
参与人:1,2。
战略空间:S1 = S2 = {石头、剪刀、布}
收益:两人出手的函数
u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …
u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……
收益表:两个参与人,有限个战略的博弈的表示方法。
P2
石头剪刀布
石头0 ,0 1 ,-1 -1 ,1
P1剪刀-1 ,1 0 ,0 1 ,-1
布 1 ,-1 -1 ,1 0 ,0
博弈的问题:能否知道每个参与人选择的战略?
例2: 囚徒困境(The Prisoner’s Dilemma)
囚徒 2
沉默招认
沉默-1 ,-1 -9 ,0
囚徒 1
招认0 ,-9 -6 ,-6
囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。
囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。
两人的选择: (招认,招认)。
定义:s i'是s i''的严格劣势战略(strictly dominated),如果:
u i(s i',s-i)
“沉默”是“招认”的严格劣战略
例3:
参与人2
左中右
上 1 ,01,3 3 ,0
参与人1 中0, 2 0 ,1 6 ,0
下0, 2 2, 4 5, 3
参与人1: 没有严格劣战略。
参与人2: “右”严格劣于“中”
考虑:重复剔除严格劣战略(iterated elimination of strictly dominated strategies)
可预见的两人选择: (下, 中)。
例4: 图 1.1.4
参与人2
左中右
上0 ,4 4,0 5 ,3
参与人1 中4, 0 0 ,4 5 ,3
下3, 5 3, 5 6, 6
两人都没有严格劣战略。 两人会如何选择各自的战略?
定义:s * = (s 1*,…,s n *)是一个纳什均衡(Nash equilibrium), 如果
u i (s i *,s -i *) ≥ u i (s i ,s -i *)
纳什均衡为最大化问题的解
i
i S s ∈max u i = u i (s 1*, …, s i , …, s n *)
各例中的纳什均衡: 囚徒困境: (招认,招认) 例3: (下,中)
例4( 图1. 1. 4): (下, 右).
纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.
如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.
多个纳什均衡
例5 性别战 (the battle of the Sexes)
帕特 歌剧 拳击
歌剧 2 ,1 0 ,0
克里斯
拳击 0 ,0 1 ,2
纳什均衡: (歌剧,歌剧),(拳击,拳击)
1.2 应用
例 古诺双头垄断模型(Cournot Model of Duopoly )
二个企业,生产产量: q 1, q 2
市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.
企业利润:πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i , 博弈的描述:
参与人:企业1,企业2 战略:产量 q i 收益:πi (q 1, q 2) 企业 i 选择产量求
i
i S s ∈max πi (s i , , s j *):
一阶条件
1
1
dq d π = a – c – 2q 1 – q 2* = 0 和
2
2
dq d π = a – c –q 1* –2q 2 = 0 厂商选择自己利润最大的产量
q 1 =
22q c a -- q 2 =2
1
q c a -- 解纳什均衡得
q 1* = q 2* =
3
c
a -