第八讲 有限理性及其对博弈的影响

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 2

u2 x c (1 x ) d

c, b d, u x u1 (1 x ) u2 可得一般 2×2 对称博弈的复制动态方程:
博 1 弈 方 2 1
a, b
b, c d
dx
x( u1 u) x u1 xu1 (1 x ) u2 dt x(1 x ) x(a c ) (1 x )(b d )

进化稳定策略
在博弈方的动态调整策略中能达到,又对少量偏 离的扰动有稳健性,满足这两种性质的稳定状态称 “进化稳定策略”(ESS)

分析现实问题,必须根据实际情况建立分析框架
协调博弈的优先博弈方快速学习模型
15
8.2.2

古诺调整过程
博弈方策略连续分布时的最优反应动态分析 以古诺模型为例,两个寡头的反应函数分别是
最优反应动态
7
8.2.1 协调博弈的有限博弈方快速学习模型

5个博弈方,相邻博弈方相互博弈的快速学习动态调整 模型: A 博弈方1
博弈方2
B
A
B
50 , 50 0 , 49
49 , 0 60 , 60
博弈内容如上图得益矩阵所示的两人对称静态博弈, 称之为“协调博弈”。该博弈有两个纯策略纳什均衡 (A,A) ,(B,B) ,一次性博弈中博弈结果具有不确定性
由于采用“不同意”策略博弈方得益 为0,博弈方会不断减少,不是ESS
23
签协议博弈的复制动态和进化稳定策略
8.3.2 一般两人对称博弈的复制动态和进化稳定策略

将上述签协议博弈的分析推广至一般的 2×2 对 称博弈,博弈内容如右图所示: 则采用两种策略博弈方的期望得益和群体平均得 博弈方 2 益为: u1 x a (1 x ) b
望得益u 和 un分别为:
y
u y x 1 (1 x ) 0 x和un x 0 (1 x ) 0 0 因此,群体平均得益: u x u y (1 x ) un x 2
签协议博弈的复制动态和进化稳定策略
20
8.3.1 签协议博弈的复制动态和进化稳定策略
22
8.3.1 签协议博弈的复制动态和进化稳定策略

当 x* 1 时,假设比例为 的博弈方“犯错误”偏离 “同意” 策略,则分别采取两种策略博弈方的期望得 益和平均得益为:
u y (1 ) 1 0 1 un (1 ) 0 0 0 u (1 ) u y un (1 )2
q1 3

q2
2
q2 3
q1
2
存在纳什均衡,即各生产 2 个单位。现假设两博弈方都知 道自己的反应函数,只是不知道对方的利润和反应函数, 也没有预见能力。在这种假设下,两寡头在第一次博弈时 各自的产量就难以确定。
古诺调整过程
16
8.2.2

古诺调整过程
分析过程
若寡头 1 生产 2.5 单位,寡头 2 生产 3 单位。第一期 结束后将这两个产量分别带入寡头 1、2 的反应函数,得 到第二期的产量 1.5 和 1.75 单位;如此类推,动态调整过 程将趋向于两寡头各生产 2 个单位。这个稳定状态具有对 微小扰动的稳健性,是一个进化稳定策略。
11
8.2.1 协调博弈的有限博弈方快速学习模型

反应规则:如在 t 时期博弈方 i 的两个邻居只要有 1个 采用 A,则在 t 1 时期采用 A,两个邻居都没采用 A, 则在 t 1 时期采用 B。博弈方 i 在 t 时期的策略与自己 在 t 1 时期采用的策略无关 5 个博弈方完全相似,除了初次博弈时所有博弈方都采 用 B 的情况外,从其余情况出发,经最优反应动态法 则的调整,最终都会收敛到所有博弈方都采用 A 的稳定 状态。分析过程如下
协调博弈的优先博弈方快速学习模型
13
8.2.1 协调博弈的有限博弈方快速学习模型
B B B A A B A A A A A A A
A
A
初次博弈为相邻 2A 的最优反应动态
A A B B A A A A A A A A A
初次博弈为相连 3A 的最优反应动态
协调博弈的优先博弈方快速学习模型
14
8.2.1 协调博弈的有限博弈方快速学习模型
协调博弈的优先博弈方快速学习模型
8
8.2.1 协调博弈的有限博弈方快速学习模型

确定分析框架

博弈方虽缺乏预见能力但能够对上一阶段博弈结果进 行总结,作出策略调整 设 5 个博弈方分别处于下图所示圆周中的 5个位置上, 每个博弈方都与左右相邻的博弈方反复博弈 1 5 4 2

3
9
协调博弈的优先博弈方快速学习模型
有限理性及其对博弈的影响
4
8.1.2 有限理性博弈分析框架

进化博弈论 研究有限理性博弈的理论 进化博弈的均衡 能通过博弈方模仿,学习的调整过程达到,能经受 错误偏离的干扰,在受到少量干扰后仍能恢复的稳健的 均衡


分析框架 由有限理性博弈方构成的,一定规模的特定群体内 成员的某种反复博弈
有限理性博弈分析框架
有限理性博弈分析框架
6
8.2 最优反应动态

分析内容
少数有快速学习能力的有限理性博弈方之间的反复博 弈和策略进化

最优反应动态
博弈方虽然在复杂局面下准确分析判断和运用预见性 的能力稍差,但能对不同策略的结果作出较正确的事后 评估,并相应调整策略。最适合描述这种理性层次博弈 方的策略调整机制,即“最优反应动态”

核心:博弈方策略类型比例是动态变化的,其变
化速度可用动态复制方程表示:
dx dt x ( u y u)

x 0时,无模拟榜样,博弈方不会有意识地改变策略。 x 0 时,若变化率为正,采用“同意”策略的博弈方
逐渐增多;若变化率为负,采用“不同意”策略的博弈 方逐渐增多。
x( x x 2 ) x 2 (1 x ) x 2 x 3
i
博弈方 i 在 t 1 时期会采用 A 当 xi (t ) 50 2 xi (t ) 49 xi (t ) 0 2 xi (t ) 60 即 xi ( t ) 22 61时 博弈方 i 在 t 1 时期会采用 B
协调博弈的优先博弈方快速学习模型

注意收敛是有条件的,
dr1 dq2
dr2 1 dq1

分析的逻辑基础不同,则构成不同的动态机制。
古诺调整过程
17
8.3.1 签协议博弈的复制动态和进化稳定策略

分析对象 学习速度较慢的有限理性博弈方的动态策略调整及其 稳定性

分析框架 博弈方组成的大群体成员的随机配对反复博弈

分析过程
博弈方学习速度慢意味着向优势策略转变是一个渐进 的过程,可以用生物进化的进化动态方程,即复制动态公
8.2.1 协调博弈的有限博弈方快速学习模型

每个位置的博弈方既可能采用 A 也可能 采用 B,总共有 25 32 种可能,包括全 部采用 A,全采用 B 和两种策略都有人 5 采用。根据采用 A 博弈方的数量和分布, 总共有 无A,1A、有相邻2A、有不相邻 4 2A、有3连A、有非3连A、4A、5A共 8 种有实质差异 博弈方能否在反复博弈过程中出现策略的收敛?
式来表示
签协议博弈的复制动态和进化稳定策略
18
8.3.1 签协议博弈的复制动态和进化稳定策略

经济活动中的各种合作都可以用签协议来代表,以右图 所示的签协议博弈为例: 根据该博弈的得益情况,有两个纯策略纳什均衡, (同意,同意) (不同意,不同意)
博 同意 弈 方 不同意 1 博弈方2 同意 不同意 1 ,1 0, 0 0 ,0 0 ,0
xi (t ) 50 2 xi (t ) 49,采用B的得益为 xi (t ) 0 2 xi (t ) 60

根据动态反应机制
22 当 xi (t ) 50 2 xi (t ) 49 xi (t ) 0 2 xi (t ) 60 即 x (t ) 61 时


有限理性及其对博弈的影响
3
8.1.1 有限理性及其对博弈的影响

博弈方有限理性对博弈的影响 博弈方不会一开始就找到最优策略,会在博弈过程 中学习博弈,必须通过试错来寻找较好的策略;也意味 着至少有部分博弈方不会采用完全理性博弈的均衡策略, 均衡是不断调整和改进而不是一次性选择的结果,而且 即使达到均衡也有可能再次偏离
“稳定性定理”可知,当 dx

协调博弈的优先博弈方快速学习模型
12
8.2.1 协调博弈的有限博弈方快速学习模型

全部采用 A 或 B 的情况不需讨论,采用 A 策略博弈方 数量和位置有实质差异的只有 6 种情况
A B B B A B B A A A A A A A B A B A A B A A A B
B
初次博弈为 1A 的最优反应动态 (已包含有相邻 2A ,非相连 3A 和 4A 三种情况)
5
8.1.2 有限理性博弈分析框架

进化博弈分析的关键 确定博弈的分析框架,即博弈方学习和策略调整的模 式或机制以及相互学习、模仿的环境条件。

主要讨论两种动态机制

有快速学习能力的小群体成员的反复博弈。
——最优反应动态

学习速度很慢的成员组成的大群体随机配对的反复博弈。 ——生物进化的 “复制动态”机制
第八讲 有限理性和进化博弈
苏 兵
西安工业大学经济管理学院 2008年
主要内容

有限理性博弈及其分析框架
最优反应动态
复制动态和进化稳定性:两人对称博弈 复制动态和进化稳定性:两人非对称博弈
有限理性及其对博弈的影响
2
8.1.1 有限理性及其对博弈的影响

有限理性:追求最大利益的理性意识,分析推理能力,识 别判断能力,记忆能力和准确行为能力等多方面的要求有 任何一方面的不完美即为有限理性 有限理性的非唯一性:博弈方有限理性的层次及各方面能 力的侧重存在差异 有限理性博弈:至少有部分博弈方具有有限理性
24
Baidu Nhomakorabea
8.3.2 一般两人对称博弈的复制动态和进化稳定策略

稳定状态:令复制动态方程 dx
可得复制动态的稳定状态,最多有 3 个,分别为
dt
F ( x) 0
bd x 0、 x 1、 x abcd
* * *

进化稳定策略:由微分方程的
dt 0
签协议博弈的复制动态和进化稳定策略
21
8.3.1 签协议博弈的复制动态和进化稳定策略

上述复制动态微分方程的相位图如下图: 除 x 0 外, 其他所有初始情况出发的复制动态过程,都会使博弈方 * * 都趋向于“同意”,即 和 是上述复制 x 1 x 0 过程的两个稳定状态。
签协议博弈的复制动态和进化稳定策略
由于 uy 1 0 且接近于1,具 有对少量错误偏离的稳健性,是ESS

当 x* 0时,假设比例为 的博弈方“犯错误”偏离 “不同意”策略,则分别采取两种策略博弈方的期望得 益和平均得益为:
u y 1 (1 ) 0 un 0 (1 ) 0 0 u u y (1 ) un 2
前者帕累托优于后者,在理性层次较低的有限理性 博弈方组成的大群体成员随机配对反复博弈的框架内分 析该博弈
签协议博弈的复制动态和进化稳定策略
19
8.3.1 签协议博弈的复制动态和进化稳定策略

分析过程 博弈方理性较低,不会一开始就找到最佳策略。不 同策略的博弈方可看作不同的类型。假设,整个群体中 为“同意”类型的博弈方占整个群体的比例为 x ,则 “不同意”博弈方比例为 1-x 博弈方的得益不仅取决于自己和随机配对遇到的对手 类型。“同意”与“不同意”两种类型博弈方各自的期
1 2
3
协调博弈的优先博弈方快速学习模型
10
8.2.1 协调博弈的有限博弈方快速学习模型

设 xi ( t )为 t 时期博弈方 i 的邻居中采用 A策略邻居的数 量 xi (t ) 0,1, 2 则采用 B 策略邻居的数量相应 2 xi (t ) 根 据第 t 期的相关情况博弈方 i 采用 A 的得益为
相关文档
最新文档