博弈论第四章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4 非完全信息动态博弈

4.1 精炼贝叶斯均衡概述

例简单的非完全信息动态博弈

参与人1的类型t为个人信息。

参与人2 不知道t,但知道t的概率分布。

博弈的时序:

(1)参与人1选择行动a1∈A1;

(2)参与人2观察a1,选择a2∈A2

博弈的收益:u1 (a1, a2, t ), u2 (a1, a2, t )

u1u1u1u1 u1u1u1u1

u2u2u2u2 u2u2u2u2例:

1 R

L M 1

3

p 2 1- p

L'R'L'R'

2 0 0 0

1 0 1 2

标准式表示

参与人2

L'R'

L2,10,0

参与人1 M0, 20, 1

R1, 31, 3

纯战略纳什均衡: (L,L'), (R,R')

均为子博弈精炼纳什均衡(无子博弈)。

但是(R, R')不可信。

排除不可信的纳什均衡:

要求1 参与人必须有一个推断(belief).

要求2 参与者的战略必须满足序贯理性(sequentially rational).

定义

处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集.

处于均衡路径之外(off the equilibrium path)的信息集: 在均衡战略下,博弈不会到达此集.

要求 3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。

例要求3的说明

参与人1的类型空间:{ t1,t2,t3,t4 }

行动空间:A= { L,R}

推断p i : 观察到L 后,参与人1的类型是t i 的概率。

推断q i : 观察到R 后,参与人1的类型是t i 的概率。

p 1 + p 2 + p 3 + p 4 = 1

q 1 + q 2 + q 3 + q 4= 1

如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。 参与人2对p i 与 q i 的推断:

p 1 = 3.02.02.0+= 0.4, p 2 = 3

.02.03.0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =

3.02.02.0+= 0.4, q 4= 3.02.03.0+= 0.6,

要求 4 在处于均衡路径之外的信息集上, 可能情况下,推断由贝叶斯法则和参与人的均衡战略决定。

原文:At information sets off the equilibrium path, beliefs are determined by Bayes ’ rule and the players ’ equilibrium strategies where possible.

精炼贝叶斯均衡(perfect Bayesian equilibrium):在一个非完全信息的动态博弈中,满足要求1 – 4 的战略与推断构成的均衡。

例不满足要求4的情形。

3个参与人的博弈。

1 A 2

D 0

2

L R

[p] [1 –p]

3

L'R'L'R'

1 3 0 0

2 3 1 1

1 3

2 1

子博弈精炼纳什均衡: (D, L, R')

另有战略(A, L, L')和推断p = 0:

----纳什均衡

----满足要求1-3.

----不是精炼贝叶斯均衡: 不满足要求4: p= 0 与2的战略不相容.

例要求4中“不可能”的情形。

1 A

D

2 A'

L R1-q1-q2

[q1] [q2]

3

L'R'L'R'

如果(A, A', L') 是均衡,则参与人3的战略要针对参与人2的L 或R。

参与人3的推断必须是p = q1/(q1 + q2)

但是参与人2选A',q1 + q2 =0, 因此无法计算p。

4.2 信号博弈

4.2.A 信号博弈中的精炼贝叶斯均衡

信号博弈的参与人:信号发送者S,接收者R。

信号博弈的时间顺序

自然按照概率分布为S产生一个t i∈T

S观察t,并选择m j∈M

R观察m并选择a k∈A

收益U S(t i,m j,a k)和U R(t i,m j,a k)

信号博弈的例

T = {t1, t2}, M = {m1, m2}, A = {a1, a2},

Pr{t 1} = p , Pr{t 2} = 1 - p 。

发送者战略: 在类型为t 1时发出的信号与t 2时发出的信号:

{m 1, m 1}, {m 1, m 2}, {m 2, m 1}, {m 2, m 2}

混同(pooling)战略: 所有的类型发出相同的信号:

{m 1, m 1}, {m 2, m 2}

分离(separating)战略:不同的类型发出不同的信号:

{m 1, m 2}, {m 2, m 1}

接收者战略: 在收到信号m 1时与信号m 2时选择的行动: { a 1, a 1}, {a 1, a 2}, {a 2, a 1}, {a 2, a 2}

1,

3,1

2,2,0

3,1,0

1,2,2

信号要求 1: 接收者在观察信号m j 后,必须对发送m j 的类型有一个推断

∑∈T t i μ( t i ∣m j ) = 1

信号要求 2R : 对每一 m j , 接收者的行动 a *(m j ) 必须在给定推断 μ( t i | m j ) 后,最大化他的期望效用,

A a k ∈max ∑∈T t i μ( t i | m j ) U R (t i , m j , a k )

相关文档
最新文档