博弈论第一章 - 360文档中心

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1 完全信息静态博弈1.0 对策论的基本形式

对策论研究的形式

博弈(game)，由多个行为主体构成的系统。

例

Strckelberg model

Cournot model

博弈的类型

参与者行动的时间与顺序

同时行动——静态博弈；

先后行动——动态博弈。

参与者的信息多少

信息相同——完全信息；

信息不同——不完全信息。

1.1 基本理论: 博弈的标准式和纳什均衡

例1 儿童游戏：“石头、剪刀、布”。

博弈的标准式表示(normal-form representation)

(1) 参与人( player).

n 个参与人：1, 2, …, i, …, n.

(2) 战略(strategy).

一个参与人的战略是他采取的一个行动。

参与人i 的战略：s i.

参与人i 的战略空间: S i.

战略的一个组合: s ={s1，s2, …, s n}.

简化表示：s- i={ s1，…, s i -1，s i+1, …, s n }.

(3) 收益(payoff).

参与人i 的收益：u i= u i(s1，s2, …, s n)

n个参与人博弈的标准形式表示:

G = {S1, S2, …, S n；u1, u2, … , u n}

完全信息(complete information)：每个参与人知道其他人的战略空间和收益。

静态博弈(static game)：所有的参与人同时行动。

每个人行动时，不知道其他人的行动。

例1（续）：博弈{石头、剪刀、布} 的描述：

参与人：1，2。

战略空间：{石头、剪刀、布}

收益：两人出手的函数

u1 (石头，石头) = 0，u1 (石头，剪刀) = 1，u1 (石头，布) = -1 …

u2 (石头，石头) = 0，u2 (石头，剪刀) = -1，u2 (石头，布) = 1 ……

收益表：两个参与人，有限个战略的博弈的表示方法。

P2

石头剪刀布

石头0 ，0 1 ，-1 -1 ，1

P1 剪刀-1 ，1 0 ，0 1 ，-1

布 1 ，-1 -1 ，1 0 ，0

博弈的问题：能否知道每个参与人选择的战略？

例2: 囚徒困境(The Prisoner’s Dilemma)

囚徒 2

沉默招认

沉默-1 ，-1 -9 ，0

囚徒 1

招认0 ，-9 -6 ，-6

囚徒1的考虑：无论对方选沉默还是招认，自己选“招认”好于“沉默”。

囚徒2的考虑：无论对方选什么，“招认”好于“沉默”。

两人的选择: (招认,招认)。

定义：s i'是s i''的严格劣势战略（strictly dominated），如果:

u i(s i'，s-i)

“沉默”是“招认”的严格劣战略

例3:

参与人2

左中右

上 1 ，0 1 ，3 3 ，0

参与人1 中0, 2 0 ，1 6 ，0

下0, 2 2, 4 5, 3

参与人1: 没有严格劣战略。

参与人2: “右”严格劣于“中”

考虑：重复剔除严格劣战略(iterated elimination of strictly dominated strategies)

可预见的两人选择: (下, 中)。

例4: 图 1.1.4

参与人2

左中右

上0 ，4 4，0 5 ，3

参与人1 中4, 0 0 ，4 5 ，3

下3, 5 3, 5 6, 6

两人都没有严格劣战略。

两人会如何选择各自的战略？

定义：s* = (s1*，…，s n*)是一个纳什均衡(Nash equilibrium), 如果u i(s i*，s-i*) u i(s i，s-i*)

纳什均衡为最大化问题的解

i

i S s ∈max u i = u i (s 1*, …, s i , …, s n *)

各例中的纳什均衡: 囚徒困境: （招认，招认）例3: （下，中）

例4（图1. 1. 4）: (下, 右).

当 u i 是可微分的时候 , 纳什均衡为下列方程组的的解：

i

n i s s s s u ∂∂)

,...,,(21= 0, i = 1,…, n

纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.

如果战略是一个纳什均衡，它们在重复剔除严格劣势战略后留下.

多个纳什均衡

例5 性别战 (the battle of the Sexes)

帕特歌剧拳击

歌剧 2 ，1 0 ，0

克里斯

拳击 0 ，0 1 ，2

纳什均衡: (歌剧,歌剧)，(拳击,拳击)

1.2 应用

古诺双头垄断模型（Cournot Model of Duopoly ）

二个企业，生产产量: q 1, q 2

市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.

企业利润：πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i ，博弈的描述：

参与人：企业1，企业2 战略：产量 q i 收益：πi (q 1, q 2) 企业 i 选择产量求

i

i S s ∈max

πi (s i , , s j *):

一阶条件

1

dq d π = a – c – 2q 1 – q 2* = 0 和

2

dq d π = a – c –q 1* –2q 2 = 0 解得

q 1* = q 2* =

3

c

a - 思考：用重复剔除严格劣势战略求纳什均衡

贝特兰德的双头垄断模型（Bertrand Model of Duopoly ）两个企业生产有差别的商品。消费者对企业 i 的需求

q i (p i , p j ) = a – p i + bp j ，成本: C i (q i ) = cq i , i = 1, 2. 战略 s i : p i ≥ 0