博弈论第一章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 完全信息静态博弈1.0 对策论的基本形式

对策论研究的形式

博弈(game),由多个行为主体构成的系统。

Strckelberg model

Cournot model

博弈的类型

参与者行动的时间与顺序

同时行动——静态博弈;

先后行动——动态博弈。

参与者的信息多少

信息相同——完全信息;

信息不同——不完全信息。

1.1 基本理论: 博弈的标准式和纳什均衡

例1 儿童游戏:“石头、剪刀、布”。

博弈的标准式表示(normal-form representation)

(1) 参与人( player).

n 个参与人:1, 2, …, i, …, n.

(2) 战略(strategy).

一个参与人的战略是他采取的一个行动。

参与人i 的战略:s i.

参与人i 的战略空间: S i.

战略的一个组合: s ={s1,s2, …, s n}.

简化表示:s- i={ s1,…, s i -1,s i+1, …, s n }.

(3) 收益(payoff).

参与人i 的收益:u i= u i(s1,s2, …, s n)

n个参与人博弈的标准形式表示:

G = {S1, S2, …, S n;u1, u2, … , u n}

完全信息(complete information):每个参与人知道其他人的战略空间和收益。

静态博弈(static game):所有的参与人同时行动。

每个人行动时,不知道其他人的行动。

例1(续):博弈{石头、剪刀、布} 的描述:

参与人:1,2。

战略空间:{石头、剪刀、布}

收益:两人出手的函数

u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …

u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……

收益表:两个参与人,有限个战略的博弈的表示方法。

P2

石头剪刀布

石头0 ,0 1 ,-1 -1 ,1

P1 剪刀-1 ,1 0 ,0 1 ,-1

布 1 ,-1 -1 ,1 0 ,0

博弈的问题:能否知道每个参与人选择的战略?

例2: 囚徒困境(The Prisoner’s Dilemma)

囚徒 2

沉默招认

沉默-1 ,-1 -9 ,0

囚徒 1

招认0 ,-9 -6 ,-6

囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。

囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。

两人的选择: (招认,招认)。

定义:s i'是s i''的严格劣势战略(strictly dominated),如果:

u i(s i',s-i)

“沉默”是“招认”的严格劣战略

例3:

参与人2

左中右

上 1 ,0 1 ,3 3 ,0

参与人1 中0, 2 0 ,1 6 ,0

下0, 2 2, 4 5, 3

参与人1: 没有严格劣战略。

参与人2: “右”严格劣于“中”

考虑:重复剔除严格劣战略(iterated elimination of strictly dominated strategies)

可预见的两人选择: (下, 中)。

例4: 图 1.1.4

参与人2

左中右

上0 ,4 4,0 5 ,3

参与人1 中4, 0 0 ,4 5 ,3

下3, 5 3, 5 6, 6

两人都没有严格劣战略。

两人会如何选择各自的战略?

定义:s* = (s1*,…,s n*)是一个纳什均衡(Nash equilibrium), 如果u i(s i*,s-i*) u i(s i,s-i*)

纳什均衡为最大化问题的解

i

i S s ∈max u i = u i (s 1*, …, s i , …, s n *)

各例中的纳什均衡: 囚徒困境: (招认,招认) 例3: (下,中)

例4( 图1. 1. 4): (下, 右).

当 u i 是可微分的时候 , 纳什均衡为下列方程组的的解:

i

n i s s s s u ∂∂)

,...,,(21= 0, i = 1,…, n

纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.

如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.

多个纳什均衡

例5 性别战 (the battle of the Sexes)

帕特 歌剧 拳击

歌剧 2 ,1 0 ,0

克里斯

拳击 0 ,0 1 ,2

纳什均衡: (歌剧,歌剧),(拳击,拳击)

1.2 应用

古诺双头垄断模型(Cournot Model of Duopoly )

二个企业,生产产量: q 1, q 2

市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.

企业利润:πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i , 博弈的描述:

参与人:企业1,企业2 战略:产量 q i 收益:πi (q 1, q 2) 企业 i 选择产量求

i

i S s ∈max

πi (s i , , s j *):

一阶条件

1

1

dq d π = a – c – 2q 1 – q 2* = 0 和

2

2

dq d π = a – c –q 1* –2q 2 = 0 解得

q 1* = q 2* =

3

c

a - 思考:用重复剔除严格劣势战略求纳什均衡

贝特兰德的双头垄断模型(Bertrand Model of Duopoly ) 两个企业生产有差别的商品。 消费者对企业 i 的需求

q i (p i , p j ) = a – p i + bp j , 成本: C i (q i ) = cq i , i = 1, 2. 战略 s i : p i ≥ 0