复杂网络上的演化博弈研究_杨涵新
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要 :在自然界和人类社会中 , 合作行为是普遍存在的 . 如何理解自私个体之间合作行为的产生和 目前 , 演化博弈理论被认为是研究合作行为的一个最有力的 维持吸引了来自各领域科学家的注意 . 手段 . 随着复杂网络理论的迅速发展 , 复杂网络上的演化博弈 受 到 广 泛 的 关 注 . 本文拟就复杂网络 上的演化博弈研究做一综述 , 并对未来的研究提出展望 . 关键词 :复杂网络 ;演化博弈 ;合作 中图分类号 :N 9 4 文献标志码 :A
R e v i e w o n t h e R e s e a r c h o f E v o l u t i o n a r G a m e s o n C o m l e x N e t w o r k s y p
1 23 , Y A N G H a n i n N G B i n o n -x WA -h g g ,
( ) 1 0 0 7-6 7 3 5 2 0 1 2 0 2-0 1 6 6-0 6 文章编号 :
复杂网络上的演化博弈研究
2, 3 杨涵新1, 汪秉宏 ( 福州大学 物理系 ,福州 3 中国科学技术大学 近代物理系 ,合肥 2 1. 5 0 0 0 2; 2. 3 0 0 2 6; ) 上海理工大学 复杂系统科学研究中心 ,上海 2 3. 0 0 0 9 3
这种状态下没有个体可以通过单方面改变自己的策
2 0 1 2-0 3-1 3 收稿日期 : , : 男, 讲师 . 研究方向 : 复杂网络 . 1 9 8 4- ) E-m a i l a n h a n x i n 0 0 1@1 6 3. c o m 作者简介 :杨涵新 ( y g
第2期
定了博弈论的基础和理论体 系 . 美 2 0世纪5 0 年 代,
[] 国数学家 N 它是指 a s h提出了著名的纳什均衡 4 , 自私个体在相互作 用 过 程 中 达 到 的 一 种 均 衡 状 态 ,
匈牙 利 数 学 家 N e u m a n n和经济学家 M o r e n s t e r n g
( 1. D e a r t m e n t o P h s i c s, F u z h o u U n i v e r s i t F u z h o u 3 5 0 0 0 2, C h i n a; p f y y, 2. D e a r t m e n t o M o d e r n P h s i c s, U n i v e r s i t o S c i e n c e a n d T e c h n o l o o C h i n a, H e e i 2 3 0 0 2 6, C h i n a; p f y y f g y f f
y s r i m x, + y =- ∑ kx +1 ky +1i=0 ki +1 这里的i 代表节点 =0 s i 的策 y, i是与y 相连的节点 略( s s i=1 表示节点i 是 合 作 者 , i =0 表 示 节 点i 是
, 力图解释上
演化博弈理论着重 述经典博弈论无法 解 答 的 问 题 . 研究有限理性的个体如何随着时间的推移在不断地 重复博弈过程中去实现收益最大化 . 在自然界和人类社会中 , 合作行为普遍存在 , 如 狮群协作捕猎 、 人类社会大规模地生产活动等等 . 从 世界的和平与发展 、 地球的环境保护 大的方面来看 , 但是在一个群体中 , 都离不开各国之间的相互协作 . 并不是所有的个体 都 会 采 取 合 作 的 行 为 . 由于个体 有些人会采取不合作( 背 叛) 存在一定的自私心 理 , 的行为 . 如何理解自 私 个 体 之 间 合 作 行 为 的 产 生 和
[ 5]
/ 初始时候每个个体 ( 节点 ) 以相同的概率 1 2 选择合 作或者背叛策略 . 每轮博弈中 , 每个个体同时和周围 的直接邻居进行博 弈 获 取 收 益 . 如果两个人都采取 合作策略 , 则 两 个 人 都 得 到 R 的 收 益. 如果两个人 都采取背叛策 略 , 则 两 个 人 分 别 得 到 P 的 收 益. 如 果一个合作一个背叛 , 那么合作者将得到收益 S, 背 叛者得到收益 T. 在囚徒困境博弈中 , 这 4 个收益 参 数的排序为 T>R>P>S. 但是在铲雪博弈中 , 收益 参数的排序变为 T>R>S>P. 为了研究上的方便 ,
:C A b s t r a c t o o e r a t i o n i s w i d e l e x i s t e n t i n n a t u r e a n d h u m a n s o c i e t . U n d e r s t a n d i n t h e p y y g e m e r e n c e a n d e r s i s t e n c e o f c o o e r a t i o n a m o n s e l f i s h i n d i v i d u a l s r e m a i n s a f a s c i n a t i n c h a l l e n e g p p g g g , f o r r e s e a r c h e r s i n d i f f e r e n t f i e l d s . S o f a r e v o l u t i o n a r a m e t h e o r h a s r o v i d e d a o w e r f u l y g y p p , f r a m e w o r k t o a d d r e s s c o o e r a t i o n. S u r r e d b t h e r a i d d e v e l o m e n t o f c o m l e x n e t w o r k t h e o r p p y p p p y a m e s a s t e a r s . t h e e v o l u t i o n a r o n c o m l e x n e t w o r k s h a v e r e c e i v e d m u c h a t t e n t i o n i n t h e f e w g p y y p , H e r e r e v i o u s a m e s i n v e s t i a t i o n s o n t h e r e s e a r c h o f e v o l u t i o n a r o n c o m l e x n e t w o r k s w e r e p g g y p a n d t h e f u r t h e r r e s e a r c h w a s l o o k e d f o r w a r d . r e v i e w e d : K e w o r d s c o m l e x n e t w o r k; e v o l u t i o n a r a m e; c o o e r a t i o n y p y g p
杨涵新 , 等: 复杂网络上的演化博弈研究
1 6 7
略而增加收益 . 纳什 均 衡 的 提 出 极 大 地 推 动 了 博 弈 论的研究和发展 . 通常博弈由 4 部分组成 : 至少有两位博弈个体 ; 每个博弈个体都有 自 己 的 博 弈 策 略 ; 当博弈个体选 按照一 定 的 博 弈 规 则 进 行 博 弈 并 据 相 择好策略后 , 应的收益函数获得收益 ; 在博弈过程中 , 博弈个体遵 进行策略上的调整 . 循自身收益最大化的最终目标 , 经典博弈理论认为个体具有完全的理性, 它们 一步到位地选择符合纳什 根据对收益函数的 分 析 , 均衡的最佳策略 . 但是在现实复杂环境中 , 人的理性 是有局限的 , 即使 再 聪 明 的 人 也 会 犯 错 误 . 同 时, 在 生物的成长与漫长 的 进 化 过 程 中 , 个体通常无法清 它们只有通过不断地试错来适应环境 , 晰了解环境 , 也就是说 , 均衡状 态 不 是 一 蹴 而 就 达 到 的 . 因 此, 生 物学家将生物进化论中的自然选择和遗传变异机制 提出了演化博弈理论 引入博弈论中 ,
1 3] 囚徒博弈 收 益 参 数 通 常 设 定 为 [ R =1, P =S=0, 1 8] 铲雪博弈 收 益 参 数 通 常 设 定 为 [ T= b>1, R=1, 人们通常 S=1- r, T=1+r, P=0 ( 0<r<1) .
( ) 背叛诱惑” 参 把 b 和r 称 为 “ t e m t a t i o n t o d e f e c t p 数. 每轮 博 弈 结 束 后 , 每个个体根据某种更新规则 进行策略更新 , 并把 更 新 后 的 策 略 作 为 自 己 下 一 轮 在通常情况下 , 经过足够长的时 博弈中采取的策略 . 间演化后 , 系统会达到一个相对稳定状态 , 即网络中 稳定状态网络中合作者的 合作者的比例趋于 稳 定 . 比例通常被称为合 作 频 率 , 是衡量系统合作水平的 重要指标 . 在复杂网络的公共品博弈中 , 初始时候 , 网络中 / 给每个节点以相同的概率 1 2 随机地赋予合作或者 背叛策略 . 每个时间步 , 网络上的每一个点i 参 与以 它自己为中心及以它的邻居为中心的k i+1 个 群 体 这里所说的 一 个 群 体 是 由 一 个 中 心 节 点 及 的博弈 . 其周围的邻居构 成 . 每 个 合 作 者i 给 每 个 群 体 分 别 / ( ) 投入 1 的资本( 也 就 是 说, 合 作 者i 投 入 的 k i+1 , 总资 本 为 1) 背 叛 者 不 投 入 任 何 成 本. 在每一个群 体中 , 获得的总资本 为 该 群 体 中 所 有 合 作 者 投 入 资 , 本的总和 , 群体的总资本会 增 值 ( 增 值 系 数 设 为 r) 升值后的收益平均 分 配 给 该 群 体 中 的 每 个 点 . 根据 这样的收益分配规则 , 节 点 x 参 与 以 节 点y 为 中 心 的群体时 , 从这个群体获得的收益为
又称对策论 , 主要研究具有形式激励结 博弈论 , 构的个体之间的相 互 作 用 . 博弈论作为应用数学的 一个分支 , 目前广 泛 应 用 于 生 物 学 、 经 济 学、 计算机
] 1-2 科学 、源自文库政 治 学、 军 事 战 略 等 诸 多 学 科[ . 1 9 4 4 年,
[ 3] , 合作出版了划时 代 巨 著 《 博弈论与经济行为》 奠
上海理工大学学报
4卷 第2期 第3 J . U n i v e r s i t o f S h a n h a i f o r S c i e n c e a n d T e c h n o l o y g g y V o l . 3 4 N o . 2 2 0 1 2
3. T h e R e s e a r c h C e n t e r o r C o m l e x S s t e m s S c i e n c e, U n i v e r s i t o S h a n h a i o r S c i e n c e a n d T e c h n o l o S h a n h a i 2 0 0 0 9 3, C h i n a) f p y y f g f g y, g