演化博弈论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Y qp*0 q(1 p)*2 (1 q)p*1 (1 q)(1 p)*0
Y / q (1 p)2 p 0
p 1/3
N-群体的演化稳定策略
定义1:策略组合 x {x1, x2,..., xn} 是纳什均衡, 如果x是演化稳定策略,如果对于任意的策 略组合 y x 存在某个 (0,1) 使得对于所有的
• 经济学家把演化博弈理论引入到经济学领域,用于分析社会制度变 迁、产业演化以及股票市场等,同时对演化博弈理论的研究也开始
1980s 由对称博弈向非对称博弈深入,并取得了一定的成果
演化博弈论的产生与发展(2)
1990s
• 演化博弈理论的发展进入了一个新的阶段。Weibull(1995)比较系统、 完整地总结了演化博弈理论,其中包含了一些最新的理论研究成果。
(0,
)
和
y
(1
)x
,有
ui (xi ,i ) ui ( yi ,i )
iI
iI
定义2:策略组合x是演化稳定策略,当且 仅当x是一个严格的纳什均衡。
问题
演化过程两个基本要素:变异,选择。 很明显,演化稳定性强调变异的作用,它
关注什么样的状态才是稳定状态。 那么,这样的稳定状态又是通过怎样的过
演化博弈论
演讲人: 杜 同 学 号:S201111054
演化博弈论
➢ 第一章 演化博弈论的概述 ➢ 第二章 演化稳定策略 ➢ 第三章 复制子动态 ➢ 第四章 应用案例 ➢ 第五章 前沿介绍
第一章 演化博弈论概述
什么是演化博弈论(1)
传统博弈理论的两个苛刻假设: (1)完全理性(2)完全信息
一个稳定状态必须对微小扰动具有稳健性才能称为进化稳定策略。 这相当于要求当干扰使x出现高于x*时, dx/dt=F(x) 必须小于0,即 F’(x*) <0 。这就是微分方程的稳定性定理。
如 F(x) =x(1-x)(1-6x) ,不难解出x*=0、 x*=1、 x*=1/6。
进一步证明,只有1/6才是ESS。因为F’(1/6) <0 ,而F’(0) >0 , F’(1) >0 。根据图2也可以看出只有1/6才是进化稳定策略。
:是一个与突变策略y有关的常数,称之为侵入界限; εy + (1 − ε)x:表示选择进化稳定策略群体与选择突变策略群
体所组成的混合群体。
演化稳定策略的定义(2)
Definition 2: 对任意的s'∈S×S,满足
(i) f(s,s)≥f(s',s); (ii)如果f(s,s)=f(s',s),那么对任意的s≠s'有 f(s,s)>f(s',s'); 则s是演化稳定策略
其他的一些理论成果包括Cressman(1992)以及Samuelson(1997)的著 作。
• 演化博弈的发展出现了一些新的思路,对演化稳定策略和合作演化 博弈的研究不断深入,学者开始关注带有随机因素影响的演化过程。
21世纪 进入2l世纪以来,国内的学者也开始关注演化博弈论,也做出了大 量的研究。
②
Ra = xR1 +(1-x) R2 ③
甲 策略1 方 策略2
乙方
策略1 策略2
a,a
b, c
c, b
d, d
根据上述收益得到复制动态方程:
dx/dt = x (R1 - Ra) =x(1-x)[(a-b-c+d)x+(b-
d)].
令:dx/dt=F(x) F(x)为x的单元函数。
因为F(x) =x(1-x)[(a-b-c+d)x+(b-d)],该复制动态最多有3个稳定状态 ,分别为x*=0、 x*=1、 x*=(b-d)/(a-b-c+d)。
Y
a
b
a 2,2
0,3
策略a 是否是演化稳定策略? 有一个规模为E的策略b入侵
策略a的平均适应度:
X b
3,0
1,1
2(1 E) E *0 2 2E 策略b的平均适应度:
3(1 E) E 3 2E 策略b 是否是演源自文库稳定策略?
有一个规模为E的策略a入侵 策略b的平均适应度:
(1 E) 3E 1 2E 策略a的平均适应度:
纳什均衡
(1 E)*0 2E 2E
纳什均衡
纳什均衡的定义: 在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一 个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的 策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…, sn*)的最佳对策,即不等式 ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij,s*i+1,…,sn*) 对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。
0
X*
1
x
标准的N总体复制子动态
与一般的两人对称博弈相似,标准的N总体 复制子动态:
•
xih [u(eih , xi ) ui (x)]xih
总体平均收益
k
u(x, x) = xiu(ei , x) i1
一般的两人对称博弈复制子动态(2)
假设
1收益代表博弈对个人适应性影响的增量效应
2每个个体继承父母的单一策略
3假设人的死亡率 相同
采用策略i的个体在时间t的出生率 u(ei , x) ,这里 是背景适应性 (与博弈结果无关),总体动态:
程演化而来的?
第三章 复制子动态
复制子动态的概述
生物种群的繁衍或者社会现象的不断变迁 ,就会产生一个时间上连续的总体动态, 这就是复制子动态(replicator dynamics)
这里的复制子是指纯策略,它可以从父母 无差别的传递给孩子,随着总体状态的改 变,纯策略(复制子)的收益和其适应性 也会相应的改变。
2. 陈星光,周晶,朱振涛. 城市交通出行方式选择的演化博弈分析[J]. 管理工程学报,2009,23(2):140-142.
3. DeokJoo Kim,Sungwook Kim. Adaptive power control algorithm based on the evolutionary game theory[J]. Journal of KISS: Information Networking,2010,37(3):228-293.
与传统博弈理论不同,演化博弈理论并不要求参 与人是完全理性的,也不要求完全信息的条件。
演化博弈论(Evolutionary Game Theory)把博弈 理论分析和动态演化过程分析结合起来的一种理 论。在方法论上,它不同于博弈论将重点放在静 态均衡和比较静态均衡上,强调的是一种动态的 均衡。演化博弈理论源于生物进化论。
一般的两人对称博弈复制子动态(1)
分析一个简单的情景:总体很大但是有限,总体中的个体 被规定好了选取对称性两人博弈中的纯策略
K:纯策略集合 u:收益函数 pi(t):当前被规定好了采取纯策略i的个体数。∑pi(t)表示总体 x(t)=(x1(t),…, xk(t)):总体状态。每个分量xi(t)表示时间t采取纯策略i的 个体占总体的比例xi(t)=pi(t)/p(t) u(ei,x):纯策略i在随机匹配中得到的期望收益
演化博弈论理论的特征
第一,以参与人群体为研究对象,分析动 态的演化过程,解释群体为何达到以及如 何达到目前的这一状态。
第二,群体的演化既有选择过程也有突变 过程。
第三,经群体选择下来的行为具有一定的 惯性。
演化博弈论的产生与发展(1)
• Alchian(1950)建议在经济分析中用自然选择的概念代替利润最大化 的 概念。Nash(1950)的“群体行为解释” 是包含较完整的演化博弈
4. 杨波,徐升华.虚拟企业知识转移激励机理的演化博弈析[J]. 情报 理论与实践,2010,33(7):50-54.
5. 徐岩,胡斌,钱任. 基于随机演化博弈的战略联盟稳定性分析 和仿真[J]. 系统工程理论与实践,2011,31(5):920-926.
第二章 演化稳定策略
演化稳定策略概述
1974年,Smith和Price提出 “演化稳定策 略”。
纳什均衡指的是这样一种战略组合,这种策略组合由所有参与 人最优策略组成。即在给定别人策略的情况下,没有人有足够 理由打破这种均衡。
纳什均衡可以通过划线法得出
纳什均衡和演化稳定(1)
a
X b
a 0,0
Y b
1,1
1,1
0,0
策略b是否是演化稳定的? 有一个规模为E的策略a入侵
策略b的平均适应度: (1 E)*0 E *1 E 策略a的平均适应度: (1 E)*1 E *0 1 E
演化稳定策略(Evolutionarily stable stragegy,ESS),是指如果占群体绝大多数的 个体选择演化稳定策略,那么小的突变者 群体就不可能侵入到这个群体。
下面我们从最简单的情况入手:考察一个 大但是有限的总体,这个总体中的个体被 规定好了选取对称性两人博弈中的纯策略
囚徒困境的演化稳定策略
•
pi [ u(ei , x) ] pi (1)
对恒等式 p(t)xi (t) pi (t) 两边求t的导数 得:
•
•
•
p xi pi p xi (2)
将式(1)带入(2)中,稍加整理可得:
•
xi [u(ei , x) u(x, x)]xi (3)
式(3)说明: 采用策略i的总 体比例的增长 率 等于策略收
益和总体平均 收益之差
一般两人对称博弈复制子 动态和ESS
如表3是一个简单的2*2对称博 弈,如果不给出收益的具体数 值,
在一个群体中,有比例为x的 人采用策略1,(1-x)的人采 用策略2。采用两种策略的博 弈方的期望收益和群体平均收 益分别为:
R1 = x*a +(1-x)b ①
R2 = x*c +(1-x)d
1950s 思想的最早理论成果。
• 1973年,Smith发表了《博弈论和动物冲突的进化》,这标志着演化 博弈论的诞生。1974年,Smith和Price提出演化博弈理论中的基本概
1970s “演化稳定策略”。1978年,生态学家Taylor和Jonker提出了演化博 弈理论的基本动态概念━━复制动态
演化博弈论的应用
➢ 自演化博弈论诞生之日起,它就逐渐的被人们用 来分析生物、经济等领域的问题。
1. Selten Reinhard.A Note on Evolutionary Stable Strategies in Asymmetric Animal Conflicts [J]. Journal of Theoretical Biology,1980,(84).
如果(S,S)不是纳什均衡,那 么S不是演化稳定策略
纳什均衡和演化稳定(2)
a
X b
a 1,1
Y b
0,0
0,0
0,0
策略b是否是演化稳定的? 有一个规模为E的策略b入侵
策略b的平均适应度: (1 E)*0 E *0 0
策略a的平均适应度:
(1 E)*0 E *1 E
如果(S,S)是严格的纳 什均衡,那么S是演化稳
定策略
演化稳定策略的定义(1)
Definition 1:
单一群体
x∈A是演化稳定策略,如果y∈A,y≠x, 存在一个 ∈(0,1),使不等式
u[x,εy + (1 − ε)x] > u[y,εy + (1 − ε)x]
对任意ε ∈(0,)都成立。
A:群体中个体博弈时的支付矩阵; y:表示突变策略;
什么是演化博弈论(2)
为什么将演化思想引入到博弈论中? (1)博弈论对生物学的影响。博弈论的策略
对应生物学中的基因 ,博弈论的收益对应 生物学中的适应度。在生物学中应用的博 弈论与经济学中的传统博弈论最大区别就 是非完全理性的选择。
(2)演化化思想对社会科学的影响。例如, 在市场竞争中,我们不必要去理性的想那 个策略才是最优的,最后能够在市场存活 下来的企业,一定是适应能力最强的公司。
混合策略的演化稳定性
胆小鬼博弈
Y
a(q)
b(1-q)
混合策略纳什均衡 ((1/3,2/3),(1/3,2/3))
a(p) 0,0
2,1
X pq*0 p(1 q)*2 (1 p)q*1 (1 p)(1 q)*0
X b(1-p) 1,2
0,0
X / p (1 q)*2 q 0 q 1/3