随机演化博弈的算法研究及其在复杂网络中的应用
复杂网络上的演化博弈研究_杨涵新
4卷 第2期 第3 J . U n i v e r s i t o f S h a n h a i f o r S c i e n c e a n d T e c h n o l o y g g y V o l . 3 4 N o . 2 2 0 1 2
摘要 :在自然界和人类社会中 , 合作行为是普遍存在的 . 如何理解自私个体之间合作行为的产生和 目前 , 演化博弈理论被认为是研究合作行为的一个最有力的 维持吸引了来自各领域科学家的注意 . 手段 . 随着复杂网络理论的迅速发展 , 复杂网络上的演化博弈 受 到 广 泛 的 关 注 . 本文拟就复杂网络 上的演化博弈研究做一综述 , 并对未来的研究提出展望 . 关键词 :复杂网络 ;演化博弈 ;合作 中图分类号 :N 9 4 文献标志码 :A
y s r i m x, + y =- ∑ kx +1 ky +1i=0 ki +1 这里的i 代表节点 =0 s i 的策 y, i是与y 相连的节点 略( s s i=1 表示节点i 是 合 作 者 , i =0 表 示 节 点i 是
, 力图解释上
演化博弈理论着重 述经典博弈论无法 解 答 的 问 题 . 研究有限理性的个体如何随着时间的推移在不断地 重复博弈过程中去实现收益最大化 . 在自然界和人类社会中 , 合作行为普遍存在 , 如 狮群协作捕猎 、 人类社会大规模地生产活动等等 . 从 世界的和平与发展 、 地球的环境保护 大的方面来看 , 但是在一个群体中 , 都离不开各国之间的相互协作 . 并不是所有的个体 都 会 采 取 合 作 的 行 为 . 由于个体 有些人会采取不合作( 背 叛) 存在一定的自私心 理 , 的行为 . 如何理解自 私 个 体 之 间 合 作 行 为 的 产 生 和
复杂网络中的博弈
2. 小世界网络上的囚徒窘境博弈
2001 年Abramson 和Kuperman 在期刊Physical Review E 第63 卷首先研究了WS 小世界网络上的囚徒窘境博 弈。在他们的模型中,个体采用确定性策略更新规则 :每个个体采用邻居中收益最高者的策略。底层的交 互网络是一个由一维规则环进行断开重连得到的WS 小世界网络。
第八章 复杂网络中的博弈
目录
8.1 引言 8.2 博弈论概述 8.3 复杂网络中的演化博弈 8.4 复杂网络的抗毁性分析 8.5 复杂网络的抗毁性优化和修复策略
8.1 引言
广义上讲,复杂网络中的博弈问题包括:网络的攻击 和安全防护(包括抗毁性分析和优化)、网络中的流 行病(病毒、谣言)传播和抑制、网络的同步和牵制 控制、网络的拥塞和拥塞控制、网络的级联故障和故 障预防控制、网络中个体的合作和竞争
这种情况下达到的精炼贝叶斯纳什均衡解及其求解过 程一般也比较繁难,因此在此不做过多介绍。
8.3 复杂网络的演化博弈
8.3.1 演化博弈简介 8.3.2 演化网络博弈概述 8.3.3 基于囚徒窘境博弈模型的演化网络博弈 8.3.4 基于铲雪博弈模型的演化网络博弈
8.3.1 演化博弈简介
1973 年生态学家Smith 和Price 结合生物进化论与经 典博弈论在研究生态演化的基础上提出演化博弈论的 基本均衡概念—演化稳定策略(evolutionarily stablestragegy,ESS),标志着演化博弈理论的诞生。 此后,演化博弈理论逐渐被广泛地用于生态学、社会 学和经济学等领域。
如果参与博弈的局中人不能或者不被允许达成有约束 力的合作协议,或者虽达成协议但不被遵守,则把这 种博弈称为非合作博弈。
1. 合作博弈与非合作博弈
复杂网络演化博弈理论研究综述
复杂网络演化博弈理论研究综述一、本文概述Overview of this article随着信息技术的飞速发展,复杂网络作为一种描述现实世界中各种复杂系统的有效工具,已经引起了广泛关注。
而在复杂网络中,演化博弈理论则为我们提供了一种深入理解和分析网络动态行为的重要视角。
本文旨在全面综述复杂网络演化博弈理论的研究现状和发展趋势,以期能为相关领域的学者和研究人员提供有益的参考和启示。
With the rapid development of information technology, complex networks have attracted widespread attention as an effective tool for describing various complex systems in the real world. In complex networks, evolutionary game theory provides us with an important perspective to deeply understand and analyze the dynamic behavior of networks. This article aims to comprehensively review the research status and development trends of complex network evolutionary game theory, in order to provide useful reference and inspiration for scholars and researchers in related fields.本文首先回顾了复杂网络和演化博弈理论的基本概念和研究背景,阐述了两者结合的必要性和重要性。
接着,文章从网络结构、博弈规则、动态演化等多个方面对复杂网络演化博弈理论进行了深入的分析和讨论。
随机演化博弈的算法研究
演化博弈论的文献综述
溯源 1798,Malthus的“人口论”; 1887,Darwin的“物种起源”;
当代演化博弈论在生物学上的起源 Lewontin (1961) 物种与生存环境 Smith与Price(1973)生物之间的有限战争 Smith(1982) 专著; Taylor和Jonker(1978)
0 A0 ( ) 1 A1 ( ) 2 A2 ( ) 1 A0 ( )
A12 ( )
A02 ( ) A2M 2 ( ) A1M 2 ( ) A2M 1 ( ) A0M 2 ( ) A1M 1 ( ) A2M ( )
. A0M 1 ( ) A1M ( )
* k lim k .
0
两个独立群体的演化博弈
假设前提:
假设1:参与人采用近似最优反应机制规定的决策模式,即参
与人对市场的认知程度是有局限性的; 假设2:参与人的决策是“近视”的,其决策基于参与人对当 前市场结构的认识; 假设3:参与人的决策具有不确定性,统称为“变异”。
a1 (k , 0) 2 (0) 2 2 (1) a ( k ,1) (1) 1 2 2 (2) a1 (k , 2) (2) A1k ( ) , 2 2 ( N 1) a1 (k , N 1) ( N 1) 2 ( N ) a ( k , N ) 1
严格占优策略:任意给定其他博弈参与人的纯策略选择组合,如果某 一个特定的纯策略满足如下条件,则称这个纯策略为严格占优策略:
si , si' si* , ui (si* , si ) ui (si' , si )
复杂网络上的演化博弈
t e n t e e o u i n rl t b es r t g n e l a o y a c s e t b ih d w e h v l t a i s a l t a e y a d r p i t rd n mi si s a l e .Th n,t e s o h s i v l - o y c s e h t c a t e o u c
ton r y m is o i ie we lmi d po l to nd t i e a i s p t he de e m i i tc r p i a o — i a y d na c ffn t l— xe pu a i ns a her r l ton hi O t t r n s i e lc t r dy— ‘ n m is a epr s n e a c r e e t d.So er s lson fx d pr ba iiy a d tm ea e a s v n m e u t i e o b lt n i r lo gi e .Fu t r r ,s me r c n r he mo e o e e t r s ls o v l i na y g me n c e u t fe o uto r a s o ompl x n t e e wor uc s s l— rd a c l- r e ne wo ks a ei r - kss h a ma lwo l nd s a e fe t r r nt o du e c d.Fi a l n ly,un e ol e e r l ms,f t e r s a c ie to , a os i e a pl a i r a or r s v d op n p ob e u ur e e r h d r c i ns nd p sbl p i ton a e s f c e o uton r a s O omplx ne wo k r i t d o . v l i a y g me n c e t r s a e po n e ut Ke wo d : v l ton r m e;r p ia o y mi s v l ton rl t b e s r t g y r s e o u i a y ga e lc t r d na c ;e o u i a iy s a l ta e y;c m plx ne wor ;f- o e t ks i
复杂网络上的演化博弈及其学习机制与演化动态综述
第3期2021年5月阅江学刊YuejiangAcademicJournalNo.3May2021㊃经济观察㊃复杂网络上的演化博弈及其学习机制与演化动态综述王先甲摘要:博弈论是在完全理性假设下研究多人相互作用的选择理论,演化博弈是在有限理性假设下研究群体在相互作用过程中基于个体学习与选择的群体特征演化动态理论,网络上的演化博弈是研究结构化群体的演化博弈理论㊂本文回顾了基于完全理性的博弈论,在对有限理性新的理解的基础上介绍了演化博弈理论的发展历程,着重论述了复杂网络理论与演化博弈理论交叉衍生的复杂网络上的演化博弈的研究现状与发展趋势,特别分析和总结了演化博弈中最基本㊁最核心的个体学习机制与群体演化动态特征,由此揭示演化博弈中从个体微观行为到群体宏观特征的演化机理㊂关键词:博弈论;演化博弈;复杂网络;复杂网络上的演化博弈;学习机制;演化动态中图分类号:F224.32㊀㊀文献标识码:A㊀㊀文章分类号:1674⁃7089(2021)03⁃0070⁃15基金项目:国家自然科学基金项目 复杂网络上演化博弈合作形成机理与控制策略 (71871171);国家自然科学基金重点项目 学习机制下群体博弈行为演化与管理实验 (72031009)作者简介:王先甲,博士,武汉大学经济与管理学院教授㊁博士生导师㊂㊀㊀一㊁引㊀言微观经济学主要研究完全理性假设基础上的个体选择㊂古典经济学把消费者问题和生产者问题分别看成独立的个体优化选择问题,消费者与生产者之间通过无形的市场相互联系㊂直到1959年,Debreu在著作中建立一般均衡理论,①把消费者与生产者纳入一个经济系统内,通过他们的相互作用确定市场均衡㊂这种思想和分析框架与Nash建立博弈论的思想与框架几乎完全一致㊂这种看起来十分完美的一般均衡理论至少存在两个弱点:一是仍然以完全理性为前提假设;二是无法展示市场均衡的形成过程,因为它本质上是消费者和生产者同时决策形成的㊂虽然存在这些弱点,却产生了一大进步,那就是经济07①DebreuG,TheoryofValue,NewHaven:YaleUniversityPress,1959.. All Rights Reserved.王先甲:复杂网络上的演化博弈及其学习机制与演化动态综述学界从此不太排斥用博弈论研究多个个体间的相互作用了㊂然而,多个个体相互作用通常是一个过程,并且每个个体无法预期作用过程的未来,这使得基于完全理性的决策失去了基础,因为对未来的不可知性使决策者不知道怎样进行理性选择㊂因此,多个个体在相互作用过程中对未来预期未知时如何选择就成为需要研究的重要问题㊂演化博弈为开展这类问题的研究提供了分析工具㊂演化博弈在有限理性假设下探讨群体在相互作用过程中的个体行为选择规则及群体行为演化㊂也就是说,在群体相互作用过程中个体是按某种规则进行选择而不是按完全理性假设来选择㊂既然群体博弈是一个过程,那么个体的行为选择也可能是一个过程,个体会在这个过程中不断学习以便选择对自己更有利的行为㊂因此,个体选择行为时所依据的规则本质上就是通过某种学习机制确定的㊂每个个体选择自己的行为后形成群体整体的状态(也称系统状态),群体状态刻画了群体在相互作用过程中不同时刻的特征,不同时刻状态间的关系一般称为状态转移(也称为演化动态,有时也将演化动态理解为状态转移过程的极限)㊂当组成群体的个体间具有某种特殊联系时,该群体被称为结构化群体㊂因为网络是描述结构化群体的基本工具,且结构关系会发生各种复杂的变化,所以在研究结构化群体的相互作用过程时,复杂网络上的演化博弈就成为观注的重点㊂本文试图对复杂网络上的演化博弈等相关问题的研究状况与发展趋势进行简要的回顾与总结㊂㊀㊀二、博弈论发展历程回顾博弈论是研究理性决策者之间竞争与合作关系的数学方法,其分析范围较广,几乎包括社会科学领域所有的基本问题㊂①实际上,竞争与合作行为一直伴随着人类的发展㊂一般认为最早涉及人类博弈行为的著作是2000多年以前中国春秋时期的‘孙子兵法“,②记录战争艺术的著作‘三国演义“也是研究博弈行为的智慧结晶㊂但这些相对零星的研究成果只是展现了人类博弈行为的某个侧面,尚未从科学意义上对人类博弈行为进行定量分析㊂最早采用定量方法分析人类博弈行为的研究发生在经济学领域,Cournot㊁Bertrand㊁Edgeworth分别探讨了寡头产量竞争㊁寡头价格竞争和垄断竞争㊂③经典儿童文学名著‘爱丽丝漫游仙境“的作者Dodgson(后来更名为LewisCarroll)也是一位数学家,他用零和博弈研究政治问题㊂④这些工作成功地在人类特定领域的博弈行为研究中引入了定量方法,但是还不能算是正式的博弈论研究工作㊂Zermelo开启了博弈论的第一个正式的研究工作,⑤他除了建立集合论公理体系框架之外,还首次用博弈论研究了国际象棋㊂博弈论研17①②③④⑤MyersonR,GameTheory:AnalysisofConflict,Cambridge:HarvardUniversityPress,1991.SunT,TheArtofWar,TranslatedbyClearyT,Boston&London:Shambala,1988.CournotA,RecherchessurlesPrincipesMathématiquesdelathéoriedesRichesses,Paris:Hachette,1838.BertrandJ,Théoriemathématiquedelarichessesociale ,JournaldesSavants,vol.68(1883),pp.499-508.EdgeworthF, Lateoriapuradelmonopoli ,GiornaledegliEconomisti,vol.40(1897),pp.13-31.BlackD, Lewiscarrollandthetheoryofgames ,AmericanEconomicReview,vol.59,no.2(2001),pp.206-210.DodgsonCL,ThePrinciplesofParliamentaryRepresentation,London:Harrison,1884.ZermeloE, Übereineanwendungdermengenlehreaufdietheoriedesschachspiels ,InHobsonEW,LoveAEH,eds.,ProceedingsoftheFifthInternationalCongressofMathematicians,vol.II,Cambridge:CambridgeUniversityPress,1913,pp.501-504.. All Rights Reserved.阅江学刊:2021年第3期究的第一个里程碑式的工作应该是由VonNeumann完成的,他于1928年比较完整地给出了零和博弈模型及其解的概念,①后来的主要研究者实际上都受到这一工作的启发㊂VonNeumann和Morgenstern建立了决策理论的公理体系㊁零和博弈与非零和博弈的分析框架,并将其运用于经济学研究,但是他们的理论局限于矩阵博弈㊂博弈论更一般的模型和解的概念及其分析框架是由Nash建立的,他对多人相互作用关系给出了更一般的描述并提出了Nash均衡解概念㊂Nash的研究工作和思想在很大程度上受到VonNeumann的影响,但在适应范围和分析框架方面又有本质的拓展,使博弈论最终成为研究多人相互作用行为的一般工具㊂Nash在20世纪50年代发表的关于博弈论的几篇著名论文奠定了非合作博弈的理论基础㊂②然而,由于Nash的研究工作以完全信息为基础,具有极强的数学理论性且不能处理经济学中几乎无处不在的不确定性信息问题,所以最初并未被经济学界所接受㊂Harsanyi于1977年在著作中建立了一套解释和描述多人相互作用中的不完全信息理论,③提出了BaysianNash均衡解概念和不完全信息非合作博弈论㊂但是Nash和Harsanyi的研究只能处理静态的非合作博弈,即博弈各方只能同时进行一次行为选择,不能处理多人相互作用过程的动态博弈问题㊂Selten㊁Kreps㊁Wilson建立了多阶段动态非合作博弈理论,④提出了子博弈完美Nash均衡概念和 颤抖手 精炼均衡概念㊂由于在非合作博弈研究中的杰出工作,Nash㊁Harsanyi和Selten三人在1994年被授予诺贝尔经济学奖㊂Tucker于1950年发现囚徒困境现象,⑤为非合作博弈的研究提供了典型原型,也揭示了博弈论与决策理论的重要区别,决策理论研究单人在理性假设下的决策行为,决策主体寻求的是能使自身偏好最优的行为选择,而在Nash的博弈论框架下理性人的行为出现了一种由囚徒困境所表征的特点,即个体理性与集体理性的冲突㊂实际上,囚徒困境现象在实践中广泛存在,Cournot的数量竞争模型也是囚徒困境㊂这种十分简单的博弈模型却导致博弈出现了几个不同的发展方向,其中一个是合作博弈㊂虽然VonNeumann和Morgenstern建立了合作博弈的基本框架,但是合作博弈的研究在20世纪50年代中期到60年代中后期才有了较快的发展,这一时期经济学界正在怀疑Nash提出的非合作博弈,因为它不能处理不完全信息而产生了可应用性问题㊂合作博弈按效用的可转移性可以分为效用可转移型和效用不可转移型,Aumann较早研究了效用不可转移合作博弈,⑥随后关27①②③④⑤⑥VonNeumannJ, Zurtheoriedergesellschaftsspiele ,MathematischeAnnalen,vol.100,no.1(1928),pp.295-320.VonNeumannJ,MorgensternO,TheoryofGamesandEconomicBehavior,Princeton:PrincetonUniversityPress,1944.NashJF,Bargainingproblem ,Econometrica,vol.18,no.2(1950),pp.155-162.NashJF, Non-cooperativegames ,AnnalsofMathematics,vol.54,no.2(1951),pp.286-295.NashJF, Two-personcooperativegames ,Econometrica,vol.21,no.1(1953),pp.128-140.HarsanyiJC,RationalBehaviorandBargainingEquilibriuminGamesandSocialSituations,Cambridge:CambridgeUniversityPress,1977.SeltenR, Reexaminationoftheperfectnessconceptforequilibriumpointsinextensivegame ,InternationalGameTheory,vol.4,no.1(1975),pp.25-55.KrepsD,WilsonR, Sequentialequilibrium ,Economietrica,vol.50,no.4(1982),pp.863-894.TuckerAW,ATwo-personDilemma,Unpublishednotes,StanfordUniversity,1950.AumannRJ, Thecoreofacooperativegamewithoutsidepayment ,TransactionsoftheAmericanMathematicalSociety,vol.98,no.3(1961),pp.539-552.. All Rights Reserved.王先甲:复杂网络上的演化博弈及其学习机制与演化动态综述于效用不可转移合作博弈的研究虽然并不多但依然沿用Aumann的框架㊂自VonNeumann和Morgenstern构建效用可转移合作博弈的框架以来,合作博弈基于特征函数,主要研究联盟成员如何合理有效地分配收益㊂围绕合理有效地在联盟中分配收益问题建立解概念及公理体系是合作博弈理论发展的中心㊂1953年Gillies引入了核(Core)作为合作博弈解的概念,①这个解概念具有给出的分配方案对任何子结盟没有诱导性的特性,但它不是单值的而是集值的㊂在合作博弈中集值解概念为数不少,Aumann和Mascher提出的合作博弈协商集解概念是集值的,②Peleg的内核(Kernel)解概念㊁Maschler的预核(Prekernel)解概念等都是集值解概念㊂③而Shapley在1953年提出了一个著名的单值解概念,④称为Shapley值,这个解概念可解释为每个个体得到的收益是其所有可能的边际贡献的平均值,并且Shapley用一组公理完全刻画了这个单值解概念㊂单值解概念还包括Schmeidler的核仁(Nucleolus)(它的表示形式虽然是集合,但由于采用字典序定义,实际上是一个单值解概念)㊁Tijs的τ值和平均字典值解概念㊂⑤Peleg和Sudhölter是合作博弈解概念公理化分析的集大成者㊂⑥在合作博弈研究中,Shapley的研究工作被认为是开创性的,被统称为关于稳定分配(匹配)与市场设计的研究,他与Roth一起获得2012年诺贝尔经济学奖㊂当前,博弈论几乎在所有涉及多智能体(包括人和生物)的领域得到了发展和应用㊂Aumann和Hart㊁Young和Zamir出版了四本博弈论手册,⑦堪称博弈论全书,这套博弈论手册共分80个专题对博弈论进行了较详细的论述㊂㊀㊀三、演化博弈论的发展历程回顾尽管在过去几十年里,博弈论得到了长足发展,但仍然存在一些缺陷㊂第一,经典博弈论(包括合作博弈与非合作博弈)假设参与人是完全理性的㊂在决策理论意义下,一个决策者是理性的是指他可以选择与自己偏好一致的最优决策(行为)㊂而在博弈论意义下,参与人是理性的是指参与人选择的策略(行为)在博弈中不被严格占优㊂这个定义是一种否定表示形式,它并未告诉人们直接选择什么㊂第二,以Nash均衡为基础来定义解概念给出了多人相互关系中所有参与人共同的合理的理性预期,虽然它在本质上是所有37①②③④⑤⑥⑦GilliesD,SomeTheoremsonN-personGames,Princeton:PrincetonUniversityPress,1953.AumannRJ,MaschlerM, Thebargainingsetforcooperativegame ,AdvancesinGameTheory,vol.52(1964),pp.443-476.PelegB,Vorob evNN,TóthLF, Onthekernelofcomstant-sumsimplegameswithhomogeneousweights ,IllinoisJournalofMathematics,vol.10(1966),pp.39-48.MaschlerM,PelegB,ShapleyLS, Thekernelandbargainingsetforconvexgames ,InternationalJournalofGameTheory,vol.1,no.1(1971),pp.73-93.ShapleyLS, Avalueforn-persongames ,InTuckerAW,KuhnHW,eds.,ContributionstotheTheoryofGames,vol.II,Princeton:PrincetonUniversityPress,1953,pp.307-317.SchmeidlerD, Thenucleolusofacharacteristicfunctiongame ,SiamJournalonAppliedMathematiics,vol.17(1969),pp.1163-1170.TijsSH, Boundsforthecoreofagameandtheτ-value InMoeschlinO,PallaschkeD,eds.,GameTheoryandMathematicalEconomics,Amsterdam:North-Holland,1981,pp.123-132.PelegB,SudhölterP,IntroductiontotheTheoryofCooperativeGames,Boston:KluwerAcademicPublishers,2007.AumannRJ,HartS,HandbookofGameTheorywithEconomicApplications,vol.1,Amsterdam:North-Holland,1992.AumannRJ,HartS,HandbookofGameTheorywithEconomicApplications,vol.2,Amsterdam:North-Holland,1994.AumannRJ,HartS,HandbookofGameTheorywithEconomicApplications,vol.3,Amsterdam:North-Holland,2002.YoungHP,ZamirS,HandbookofGameTheorywithEconomicApplications,vol.4,Amsterdam:North-Holland,2015.. All Rights Reserved.阅江学刊:2021年第3期参与人的选择互为最优反应的结果,却无法给出这种基于最优反应的均衡的形成过程,也不能讨论均衡的稳定性㊂第三,多重均衡问题导致经常无法排除明显不合理的均衡,进而影响参与人做出最终选择㊂第四,对合作的理解存在分歧㊂合作博弈将合作理解为结盟,而非合作博弈把合作理解为参与人选择对他人有利的策略(行为)㊂第五,无法反映参与人的学习过程㊂演化博弈虽然源于生物学,但是之所以被列入博弈论的范畴,正是因为它在一定程度上回答了上述五个问题㊂㊀㊀(一)有限理性完全理性假设是经典博弈论和经典经济学理论的基石,也是它们遭受质疑的首要问题㊂与完全理性相对立的是有限理性㊂理性本质上是讨论人在决策时选择行为的依据或原则㊂亚当∙斯密最早在其著作‘国富论“中提出经济人概念,后来被约翰∙穆勒等人总结为经济人假设,经济人假设指出人总是做出使自己利益最大化的决策㊂VonNeumann和Morgenstern建立的经典决策理论中以完全理性假设作为决策者或博弈参与人的行为选择原则,这里的完全理性假设与经济人假设是一致的㊂美国经济学家Arrow很可能是最早提出有限理性概念的学者,①他认为,人的行为是有意识理性的,但这种理性又是有限的㊂Simon一直是有限理性概念的倡导者,②他认为,人类的认知能力在心理上存在临界极限,决策中的推理活动需要足够的能力来支撑,而人类只有有限能力,决策中需要大量的信息,而能获得的信息是有限的㊂因此,决策者并非总是可以实现其最优决策,即决策者的决策是在有限理性下的决策㊂自从Simon认为有限理性是建立决策理论的基石以来,③不少学者总结了对各种有限理性进行解释和描述的模型㊂④大多数学者认为,决策者在决策过程中可以通过不断学习提高有限的知识水平㊁有限的推理能力㊁有限的信息处理能力,从而使有限理性得到不断改善㊂Thaler获得2017年诺贝尔经济学奖的工作就是通过探索有限理性展示人格特质如何系统地影响个人决策与市场㊂⑤虽然关于有限理性的多项研究成果已经获得了几届诺贝尔经济学奖,但是人们仍然认为,对有限理性的理解仅限于局部的㊁定性的分析,决策论学者㊁博弈论学者㊁经济学学者并未形成共识㊂人们对有限理性与完全理性有如下理解:当决策者面对决策问题时,如果决策者对当前和未来的信息结构和偏好结构具有完全知识,他将按完全理性假设确定的决策规则选择行为,否则,他将按其他规则选择行为㊂根据有限知识㊁有限信息㊁有限推47①②③④⑤ArrowKJ, Rationalchoicefunctionsandordings ,Economica,vol.26,no.102(1959),pp.121-127.SimonHA, Abehavioralmodelofrationalchoice ,QuarterlyJournalofEconomics,vol.69,no.1(1955),pp.99-118.[美]赫伯特㊃西蒙:‘现代决策理论的基石“,杨砺㊁徐立译,北京:北京经济学院出版社,1989年,第1页㊂SimonHA, Boundedrationalityandorganizationallearning ,OrganizationScience,vol.2,no.1(1991),pp.125-134.SeltenR,Featuresofexperimentallyobservedboundedrationality ,EuropeanEconomicReview,vol.42,no.3(1998),pp.413-436.ArthurWB, Designingeconomicagentsthatactlikehumanagents:Abehavioral-approachtoboundedrationality ,AmericanEconomicReview,vol.81,no.2(1991),pp.353-359.WallKD, Amodelofdecision-makingunderboundedrationality ,JournalofEconomicBehavior&Organization,vol.20,no.3(1993),pp.331-352.BoardR,Polynomiallyboundedrationality ,JournalofEconomicTheory,vol.63,no.2(1994),pp.246-270.SamuelsonL,Boundedrationalityandgametheory ,QuarterlyReviewofEconomicsandFinance,vol.36,no.s1(1996),pp.17-35.ThalerRH,Misbehaving:TheMakingofBehavioralEconomics,NewYork:W.W.Norton&Co.,2015.. All Rights Reserved.王先甲:复杂网络上的演化博弈及其学习机制与演化动态综述理能力确定的规则做出行为选择,称为有限理性下的选择㊂本质上,有限理性出现的原因是决策者不能完全掌握信息结构和偏好结构㊂决策者在有限理性假设下做出行为选择所依据的规则应该有利于改善他的收益㊂这样就可以连续统一地解释完全理性假设和有限理性假设下的选择行为㊂决策者可以通过各种途径改善知识㊁信息和推理能力,从而改善有限理性,改善的标志是决策者的收益提高了㊂决策者面临决策问题将以改善收益为目的,不断增进对信息结构与偏好结构的理解,从而使理性的有限性得到改善,直到对信息结构和偏好结构完全掌握,就能够按照完全理性确定的规则选择行为了㊂引入学习的观点具有必然性,因为决策者会通过不断学习改善理性的有限性并适时调整策略㊂如果将这种通过不断学习更新有限理性并调整策略的特征置入群体相互关系中,那么群体成员通过随机配对进行反复博弈㊁学习㊁调整策略,最终会显示出个体(类型或策略)适应性㊂这种思路与达尔文自然选择思想形成的生物进化理论的分析框架几乎完全相同,人类与生物的很多行为(比如竞争与合作)具有相似性,二者的学习方式完全可能互相启示㊂于是,生物学家Maynard和Price借鉴了研究生物种群群体状态进化和稳定机制的方法来分析人类的行为,将生物进化理论的思想引入博弈论,提出了演化博弈思想和演化稳定均衡策略的概念㊂这种起源于生物进化理论的博弈分析方法就被称为演化博弈论㊂㊀㊀(二)演化博弈论的发展历程回顾实际上,演化博弈思想最早应该源于Fisher在1930年开展的研究工作,①但遗憾的是他没有给出演化博弈的形式化表示与分析框架㊂Maynard和Price首先提出了源于生物学的演化博弈,并给出其形式化表示,②后经Taylor㊁Jonker㊁Selten发展而成㊂③演化博弈将生物学中的演化概念用于解释生物或人的选择行为是有限理性假设下基于规则的选择过程,并将群体博弈描述成一个过程,在动态系统稳定与博弈论的Nash均衡之间建立起联系,使得展现Nash均衡的实现过程成为可能㊂Weibull对1995年之前的演化博弈论研究进展进行了系统的总结㊂④作为研究生物认识的方法,演化博弈关注个体的行为表现特征而非生物组织内在的基因特征㊂于是,演化博弈形成的基础被认为是生物特征学的三个基本原则,即个体异质性㊁适应性和自然选择㊂表现型由基因库的多样性保障,表现型的成功生存可以用适应性测量,自然选择决定了更适应的表现型比更不适应的表现型在下一代繁殖中有更多的数量㊂变异(突变)是由偶然因素引起的,多数突变者因表现型行为不适应环境而被淘汰,少数突变者将因新的表现型更适应环境而生存㊂Maynard和Price提出了演化博弈解的概念,⑤即演化稳定均衡(策略)㊂演化稳定策略有如下性质:对己方而言,对手以小概率57①②③④⑤FisherRA,TheGeneticalTheoryofNaturalSelection,Oxford:ClarendonPress,1930.MaynardSJ,PriceGR, Thelogicofanimalconflict ,Nature,vol.246,no.5427(1973),pp.15-18.TaylorPD,JonkerLB, Evolutionarystablestrategiesandgamedynamics ,MathematicalBiosciences,vol.40,no.1(1978),pp.145-156.SeltenR, Evolutionarystabilityinextensivetwo-persongames ,MathematicalSocialSciences,vol.5,no.3(1983),pp.269-363.WeibullJW,EvolutionaryGameTheory,Cambridge:TheMITPress,1995.MaynardSJ,PriceGR, Thelogicofanimalconflict ,Nature,vol.246,no.5427(1973),pp.15-18.. All Rights Reserved.阅江学刊:2021年第3期选择变异策略时,演化稳定策略严格占优于变异策略㊂从传统的博弈论观点来理解就是:对己方而言,如果对手在演化稳定策略和变异策略之间随机选择并以很小的概率选择该变异策略时,演化稳定策略严格占优于变异策略㊂从生物学观点来理解就是:如果演化稳定策略种群被变异策略种群中的一小部分入侵,演化稳定策略种群在抵御该小变异种群过程中比变异种群有更强大的生存能力,表明演化稳定策略种群在抵御变异策略种群时具有稳定性㊂演化稳定策略还可以解释为:对己方而言,演化稳定策略对抗任何变异策略得到的收益严格大于该变异策略得到的收益㊂根据演化稳定策略的定义,可以证明演化稳定策略也是Nash均衡策略㊂由于Nash均衡策略是互为最优反应策略,所以也可以认为演化稳定策略是对任意策略的严格意义下的最优反应策略㊂由于可以将演化稳定策略理解成Nash均衡策略的一种精炼,所以它成为解决多重Nash均衡的一种方法㊂演化动态将演化稳定策略与生物演化(进化)巧妙地联系起来,演化动态描述了演化过程中个体改变策略的规则,包括演化系统结构㊁个体特征㊁策略的更新规则㊂它反映了基于适应性和学习性选择进化的本质㊂从数学上讲,演化动态是系统历史在当前时刻的动态映射㊂在复制(演化)动态关系下,可以证明渐近稳定点与演化稳定策略是等价的㊂①这样就把有限理性下某种演化动态的演化稳定策略与完全理性下的Nash均衡策略有机联系了起来㊂基于这一思想,Maynard建立了演化博弈的分析框架,②可以说是演化博弈的奠基之作㊂演化动态是演化博弈的核心概念,演化动态可分成确定性演化动态和随机性演化动态,一般来讲,对任何确定性演化动态都可以构造相应的随机演化动态㊂㊀㊀四、复杂网络上的演化博弈发展现状与发展趋势㊀㊀(一)复杂网络理论复杂网络理论是用网络工具研究由多个基本单元通过复杂相互作用构成的复杂系统的方法㊂主要研究不同网络拓扑模型及其统计特性㊁复杂网络形成机制㊁复杂网络上的动力学行为规律㊂由于现实中存在大量的复杂相互作用关系,复杂网络被认为是对大量真实复杂相互作用关系系统在结构关系上的拓扑抽象㊂复杂网络以网络为描述工具,于是,网络理论自然成为研究复杂网络的基础㊂网络理论起源于图论,③图论源于数学家Euler在1736年访问加里宁格勒时发现的七座桥散步问题㊂图论是研究图的各种性质的学问㊂图是由节点的集合和连接节点的边的集合构成的二元组,节点代表个体,边代表个体之间的相互作用关系㊂网络是被赋予某种特定意义的图㊂网络理论是研究具有特定意义的有限个体相互作用关系的工具㊂最简单的复杂网络是规则网络,主要包括格网络㊁全局耦合网络和最邻近耦合网络㊂④67①②③④PetersH,GameTheory:AMulti-leveledApproach,Berlin:SpringerVerlag,2008.MaynardSJ,EvolutionandtheTheoryofGames,Cambridge:CambridgeUniversity,1982.段志生:‘图论与复杂网络“,‘力学进展“,2008年第6期,第702-712页㊂PercM,JordanJJ,RandDG,etal, Statisticalphysicsofhumancooperation ,PhysicsReports,vol.687(2017),pp.1-51.. All Rights Reserved.王先甲:复杂网络上的演化博弈及其学习机制与演化动态综述复杂网络的复杂性主要利用结构复杂性来刻画,比如高聚类系数㊁短路径长度的小世界现象及度分布呈现幂律特征的无标度特性等,典型的复杂网络主要有随机网络㊁WS小世界网络和BA无标度网络等㊂Erdos等提出了随机网络(也称ER随机图)的概念㊂①ER随机网络模型假设网络中有N个节点,将任意两个节点以概率p进行连接,可以生成一个由N个节点构成的平均度为p(N-1)的网络,该网络的节点度满足泊松分布㊂Erdos等建立了随机网络理论并开创了基于图论的复杂网络理论的系统性研究㊂②Milgram发现了小世界现象,③由他的社会调查以及 小世界实验 可以推断地球上任意两个人之间的平均度为6(称为6度分离),表明任意两个社会成员之间总是可以通过一条相对较短的路径实现相互连接㊂Watts和Strogatz发现了这种小世界现象的结构特征,④并提出了WS小世界网络(简称WS模型)㊂这种网络有一种看上去很复杂但遵循一定规则的结构,即对于节点数给定(N)的最邻近耦合网络,把网络中任一条边以概率p断开并重新连接到另一个随机挑选的节点上,但是不允许出现重复或自连接的情况,此时概率p与网络结构有如下关系:当p=0时,该网络仍然为最邻近耦合网络;当p=1时,该网络变为特殊ER随机网络;当0<p<1时,随着p的增大,节点度之间的异质性随之增大,同时网络中可能会出现孤立簇㊂这种现象与随机重新连接性可能会破坏网络的连通性有关㊂为了保证网络连通性,Newman和Watts对WS小世界网络模型进行了修改,⑤提出了NW小世界网络(简称NW模型)㊂在NW模型中,从一个最邻近的环形网格中以概率p随机选取一对节点建立新连接,要求任何两个节点间最多只存在一条边㊂这种用随机添加新边取代WS模型中随机重新连接的方法有效地保证了网络连通性㊂NW小世界网络与WS小世界网络的基本特征是具有较大的簇系数和较小的最短平均距离,因此统称为小世界网络㊂Barabasi和Albert发现了一种具有特殊度分布特性的网络结构,⑥即极少数节点的度较大而大量节点的度较小,提出用BA无标度网络来刻画这种特性㊂BA无标度网络的生成规则为:从一个有m0个初始节点的全局连通网络开始,每次增加一个新节点,从已有节点中随机选择m(mɤm0)个节点与之连接,新节点与已有节点的相连概率与已有节点的度成正比,网络生成过程中不允许重复连接㊂这种BA无标度网络的主要特征是节点度满足幂率分布且幂率函数具备标度不变性㊂BA无标度网络可以用来描述不断增长和择优开放的现实世界㊂BA无标度网络和小世界网络一起揭示了现实世界形形色色的复杂网络具有普遍的㊁非平凡的结构特性㊂77①②③④⑤⑥ErdosP,RényiA, Onrandomgraphs ,PublicationesMathematicae,vol.6,no.4(1959),pp.290-297.ErdosP,RényiA, Ontheevolutionofrandomgraphs ,PublicationsoftheMathematicalInstituteoftheHungarianAcademyofScience,vol.5,no.1(1960),pp.17-61.MilgramS, Thesmallworldproblem ,PsychologyToday,vol.2,no.1(1967),pp.185-195.WattsDJ,StrogatzSH, Collectivedynamicsof small-world networks ,Nature,vol.393,no.6684(1998),pp.440-442.NewmanME,WattsDJ, Scalingandpercolationinthesmall-worldnetworkmodel ,PhysicalReviewE,vol.60,no.6(1999),pp.7332-7342.BarabasiAL,AlbertR, Emergenceofscalinginrandomnetworks ,Science,vol.286,no.5439(1999),pp.509-512.. All Rights Reserved.。
复杂网络上演化博弈动力学研究综述
复杂网络上演化博弈动力学研究综述作者:湛文涛纪庆群来源:《计算机光盘软件与应用》2012年第22期摘要:博弈论是研究个体之间相互作用的,演化博弈论能够很好地解释现实中的网络,因而博弈演化理论的研究越来越来得到关注。
本文对常见的复杂网络博弈理论做了介绍,然后我们探讨了这一领域的研究趋势。
关键词:网络结构;囚徒困境;合作行为中图分类号:TP3 文献标识码:A 文章编号:1007-9599 (2012) 22-0000-02博弈论(Game theory)主要是研究个体在相互作用过程中如何获得最大利益的理论,是对合作与竞争关系的一种反映。
一般而言,一个博弈通常由以下几个组成部分:a参与博弈的个体至少两个b.博弈个体可以从策略集中选取自己的博弈策略c.博弈结束后博弈个体可以得到得收益d.博弈个体进行策略更新的目的是为了达到最大收益。
经典博弈论认为博弈个体是非常理性的,博弈目的都是追求自己的最大收益,而且也知道其它博弈个体也是完全理性的;而演化博弈论以种群为研究对象,认为博弈个体是有限理性的,博弈个体的策略可能因变异而改变。
演化博弈论的特征与实际网络较为符合,使得复杂网络上的博弈演化研究得到越来约多学者的参与和研究,在这里主要综述一下复杂网络上的网络结构是如何对博弈产生影响的。
1 复杂网络中的经典网络模型当策略更新规则相同时,网络结构不一样,对博弈的影响也不一样。
在这里先介绍一下对演化博弈有影响的网络:规则网络、小世界网络和无标度网络。
1.1 规则网络:网络中节点间按某种规则连接的网络称之为规则网络。
规则网络中每个节点的边数都是一样的有,即有相同的邻居数或者度(一般用K来表示节点的度),规则网络节点之间聚成团的趋势比较大并且节点间平均最短路径比较大。
1.2 小世界网络:节点间平均路径长度比较短而聚集系数比较大是小世界网络的重要特征。
小世界网络分为两种,一种是WS小世界网络,在规则网络上进行随机化重连得到的;另一种是NW小世界网络,在规则网络上随机化加边得到的。
复杂网络上的博弈演化
通常博弈由以下4个部分所组成: (l)博弈个体:在一个博弈中至少有两位决策者(agent)参与博弈. (2)策略集:个体的博弈策略可以是纯策略,也可以是混合策略 博弈的策略集由参与博弈的个体所有可能采用的策略所组成. (3)收益矩阵:当博弈个体选定好自己的策略后,其所获取的收 益由收益矩阵中的相应元素来确定. (4)策略演化: 在多轮博弈过程中,博弈个体遵循自身收益最大 化的最终目标,即以此目标为指导原则来进行策略调整。
二、复杂网络上的演化博弈
在传统的演化博弈理论中通常假设个体间以均匀混合的方式 交互,即所有个全部相互接触,然而,现实情况中个体间的 接触总是有限的,个体仅与周围的少数其他个体接触.这样 我们就可以在博弈理论中引入网络拓扑的概念。
复杂网络理论为描述博弈个体之间的博弈关系提供了方便的 系统框架. 网络上的节点表示博弈个体 ,边代表与其邻居的博 弈关系.在每一时间步长 ,节点与其所有邻居进行博弈 ,累积 博弈获得的收益 ,然后根据更新规则进行策略更新 ,如此这样 重复迭代下去.
Nash认为,博弈问题的解应该是这样的一组策略,在这组 策略中,每一个参与者都无法通过单独改变自己的策略而 获得更多的收益。这样的状态就被称作纳什均衡态.
实际上纳什均衡态对所有的参与者来说,不一定是最好的结局。
经典博弈模型
下面以囚徒困境博弈和雪堆博弈为例来阐述纳什均衡
囚徒困境博弈: 两个小偷A和B合伙作案,被捕后被隔离审讯.如果双方都拒 绝坦白同伴的罪行,两人将会被轻判1年徒刑;为此,警方设 计了一个机制:如果A揭发B的罪行,B拒不供认A的罪行,则 A将无罪释放,而B将被重判5年徒刑;如果A、B都揭发对方 罪行,则双方均被判刑3年.
随机演化博弈Petri网模型与算法设计
收 稿 日期 :2015年 l1月 8 日,修 回 日期 :2015年 12月 27日 基 金项 目:渭南 师 范 学 院特 色学 科 建设 资助 项 目 (编号 :14TSXK03);陕 西 省 教 育 厅 科 学研 究 资助 项 目(编 号 : 2013JK0115);渭南 师范学院校级人文社科研究 资助项 目(编号 :14SKYB10);陕西省 军 民融 合产业发 展研究 资助项 目(编号 :15JMR03);渭 南市 2015年度基础研究计 划资助项 目(编号 :2015JCYJ一11)资助 。 作者简 介 :任大勇 ,男 ,博 士研究 生 ,讲师 ,研究方 向:Petri网原理及应用等 。
了合 作竞 争博 弈 的长期 演化 趋势 ,探 讨 了对 称 和非 对称合作竞争 博弈 的进化均衡与稳定性 ;文献 [4] 从博 弈参 与人 的有 限理 性 出发 ,探讨 了合作 竞 争博 弈 中复 杂性存 在 的根 源 ,构 建 了合作 竞 争博 弈 的演 化模 型 ,分析 了一 个水 平差 异化 产 品 的合作 竞争 博 弈的演化均衡 ;文献E5]综述 了网络群体行 为和 随 机演 化博 弈模 型 与分析 方法 ,介 绍 了可用 于 网络群 体行 为分 析评 价 的指标 和模 型 ,探讨 了应 用 随 机演 化博 弈模 型进 行 网络群 体行 为研 究 的可行 性 。
REN D ayong (W einan Normal University,W einan 714099)
复杂网络演化博弈理论研究综述
YANG n , RONG h — a ,L a g Ya g Z ih i一 IXin
( . e at n fA tmain,S a g a Ja o gUnv ri ,S a g a 0 2 0,Chn ; 1 D pr meto uo t o h n h i ioT n iest h n h i 0 4 y 2 ia
复 杂 网络 演化 博 弈 理论 研 究 综述
杨 阳 , 智 海 , 荣 李 翔。
(. 1 上海 交 通 大 学 自动化 系 , 海 2 0 4 ; . 华 大 学 自动 化 系 , 上 0 20 2 东 上海 2 1 2 ; . 旦 大学 电子 工 程 系 , 海 2 0 3 ) 0 60 3 复 上 04 3
第 5卷 第 4 期
20 0 8年 l 2月
复 杂 系 统 与 复 杂 性 科 学
C 0MP E S S EMS AN CO L X Y T D MP r Y S I C I EX r C EN E
Vo . No 4 15 .
De . 2 8 c 00
文 章 编号 :6 2—3 1 ( 0 8 0 17 8 3 2 0 ) 4—0 4 0 0 7— 9
复杂网络中的博弈演化和统计行为
Networks”,a
series of research
networks
such
嬲different
structures of
topology,the function of networks and evolutionary rules have
on
been published by scientists from different studying fields.In this thesis,we will focus evolutionary properties
描述真实最适宜的网络。
随着计算机技术的高速发展,人们能够收集和存储各种规模巨大且种类不同的复 杂系统的拓扑性数据。另一方面,人们可以利用计算机高速计算能力来分析这些大量 的数据,探查这些复杂系统的整体特性。在这些大量的统计分析中,研究人员发现各 种类型的复杂系统、复杂网络并不是完全随机的,但表现出相同的统计属性。美国康
提的。
其次,我们研究了动物冲突现象在不同网络中演化的统计性质。Maynard和Price 提出动物冲突的模型,模型中提出了五种动物冲突时可能运用的策略。他们的研究表 明动物之间的冲突主要是进行不严重受伤的有限性冲突,得出具有报复性的策略和试 探报复性的策略是演化稳定策略。但在动物之间的关系具有复杂网络结构时最优演化 策略就有可能不同。有些网络中最终只有一种策略生存,另外一些网络中可以有两种
示这些复杂网络的规律具有深远的科学意义。
对于复杂网络的最早研究,我们可以追朔到欧拉的七桥问题。一条小河横穿哥尼 斯堡(Konigsberg)zb镇,河中有两个小岛,岛和岸上连有七座桥。有人问:在一次散 步中能不能一次性走过所有七座桥后返回出发点?欧拉在思考了这个问题之后,将陆 地抽象为节点,把桥抽象为点与点之间的连线,并通过推理得出“不可能一次性不重 复地走完这七座桥”,从而由此开创了数学的一个分支一一图论。但此后的一段相当 长时间里,图论并没有得到足够的发展。直到20世纪60年代,两位匈牙利数学家 Erd6s和R6nyi建立了随机图理论[101。从此研究者开始对复杂网络理论进行系统的 研究。在随后的40年中,随机图理论也成为了研究复杂网络的基本理论,被认为是
复杂网络中的博弈演化和统计行为
Netch
networks
such
嬲different
structures of
topology,the function of networks and evolutionary rules have
on
been published by scientists from different studying fields.In this thesis,we will focus evolutionary properties
提的。
其次,我们研究了动物冲突现象在不同网络中演化的统计性质。Maynard和Price 提出动物冲突的模型,模型中提出了五种动物冲突时可能运用的策略。他们的研究表 明动物之间的冲突主要是进行不严重受伤的有限性冲突,得出具有报复性的策略和试 探报复性的策略是演化稳定策略。但在动物之间的关系具有复杂网络结构时最优演化 策略就有可能不同。有些网络中最终只有一种策略生存,另外一些网络中可以有两种
strategy
Can survive,and
other
networks,two
certain strategies
Can survive together,or
even
more strategies may
Ⅱ
复杂网络中的博弈演化
英文摘要
coexiSt.These results show that the structure of networks have great effects survival strategies among conflicts. Thirdly,we combine the snowdrift
animals
the
演化博弈理论与应用研究综述
演化博弈理论与应用研究综述2009年04月13日星期一 13:38摘要:本文分别对国内外关于演化博弈论的研究做了总结并指出其存在的问题,主要讨论演化博弈论的理论渊源、发展情况及存在的挑战与演化博弈论在应用研究现状及发展展望。
关键词:博弈论;演化博弈论;演化稳定策略;演化均衡;进化稳定策略Research on Evolutionary Game Theory and Application: a ReviewWANG Wen-bin,DA Qing-li, CHEN Wei-da(School of Economics and Management Southeast University, Nanjing,210096)Abstract: This paper studies the theory and application of revolutionary game theory at home and abroad. Specifically, we discussed the headstream of revolutionary game theory, its development and challenges. Finally, we show the expectation of the future research direction of the field.Keywords: game theory; revolutionary game theory; evolutionary stable strategy; evolutionary equilibrium; evolutionary stable strategy演化博弈论是在博弈论的基础上发展起来的一种理论。
传统的博弈论强调参与者必须是理性的,而且博弈的整个过程中不允许犯错误,每个决策阶段都保持理性。
这种严格理性的要求限制了博弈论的应用。
演化博弈python
演化博弈python【演化博弈python】是什么?演化博弈是一种研究自然选择和个体间互动如何影响演化过程的方法论。
它结合了生物学、经济学和数学等多个学科,通过建立数学模型来解释和预测不同个体的生存和繁殖策略。
Python 是一种广泛使用的编程语言,具有易学易用的特点,并且在科学计算和数据分析领域广泛应用。
因此,【演化博弈python】可以理解为使用Python编程语言进行演化博弈研究和模拟的过程。
一、演化博弈的基础概念在进行【演化博弈python】之前,我们首先需要了解一些基础概念。
1. 演化:指的是在一定环境下适应性更好的个体相对于适应性较差的个体更容易存活和繁殖的过程。
演化博弈的目的就是研究不同个体间的互动如何影响演化过程。
2. 博弈:指的是多个参与者在特定规则下进行的决策和行动。
参与者可以是生物个体、经济主体或者其他个体单位。
3. 策略:指参与者在面对博弈时所选择的行动方式。
策略可以是固定的、随机的或者基于某种规则的。
二、如何进行演化博弈python的建模进行【演化博弈python】的关键是建立合适的模型来描述参与者之间的互动和策略选择。
下面将介绍一种常用的模型——囚徒困境模型。
囚徒困境模型是演化博弈中常用的模型之一,它描述了两个参与者之间的合作和背叛行为。
1. 建立参与者类使用Python进行模拟时,首先需要建立参与者类。
参与者类可以包括参与者的属性和方法。
属性可以包括参与者的策略选择、得分和演化程度等。
2. 确定博弈规则在囚徒困境模型中,博弈规则可以根据合作和背叛的行为来定义。
可以规定参与者通过选择合作得到较小的效益,选择背叛得到较大的效益。
同时,为了增加模型的随机性,可以设置一定概率让参与者选择不遵循规则。
3. 进行演化博弈模拟在模拟过程中,可以随机生成一定数量的参与者,让他们进行多轮博弈,并根据博弈结果来更新参与者的策略和得分等属性。
可以设置多次模拟和迭代,以观察不同参与者之间的演化过程。
复杂网络上的演化博弈及其学习机制与演化动态综述
Overview of Evolutionary Games and Their Learning Mechanisms and Evolutionary Dynamics on
Complex Networks
作者: 王先甲[1]
作者机构: [1]武汉大学经济与管理学院
出版物刊名: 阅江学刊
页码: 70-84页
年卷期: 2021年 第3期
主题词: 博弈论;演化博弈;复杂网络;复杂网络上的演化博弈;学习机制;演化动态
摘要:博弈论是在完全理性假设下研究多人相互作用的选择理论,演化博弈是在有限理性假
设下研究群体在相互作用过程中基于个体学习与选择的群体特征演化动态理论,网络上的演化博
弈是研究结构化群体的演化博弈理论.本文回顾了基于完全理性的博弈论,在对有限理性新的理解的基础上介绍了演化博弈理论的发展历程,着重论述了复杂网络理论与演化博弈理论交叉衍生的
复杂网络上的演化博弈的研究现状与发展趋势,特别分析和总结了演化博弈中最基本、最核心的
个体学习机制与群体演化动态特征,由此揭示演化博弈中从个体微观行为到群体宏观特征的演化
机理.。
随机演化博弈的算法研究及其在复杂网络中的应用
A12 ( )
A02 ( ) A2M 2 ( ) A1M 2 ( ) A2M 1 ( ) A0M 2 ( ) A1M 1 ( ) A2M ( )
. A0M 1 ( ) A1M ( )
标准式博弈
• 标准式博弈由三种元素组成:参与人、纯策略、收益函数
纯策略; 混合策略是在纯策略上的概率分布。
纳什均衡:如果博弈中的任意一个参与人选择的纯策略,都是对其他人 选择的纯策略的最优反应,那么这样的纯策略组合为一个标准式博弈的 纯策略纳什均衡:
* * si si* , ui (si* , s ) u ( s , s i i i i ).
• 演化博弈研究具有普遍意义的有限理性的参与人:惰性、近 视、遗传、突变、变异。Kandori, Mailath和Rob (1993) • 演化博弈不仅关注博弈的稳定结构,还通过引入不同的动态 机制研究博弈系统的稳定结构和演化过程之间的关系; • 演化博弈模型可以和个人学习机制相结合,可以探讨微观层 面上参与人的互动和宏观层面上群体的均衡现象之间的关系; • 演化博弈的假设条件与建模方法更加有利于进行模拟实验来 获得实证数据。
为了解决经典博弈论的以上三种缺陷, 从二十世纪九十年代发展了演化博弈 论的研究工作。
方法缺陷
假设缺陷
演化博弈论的产生背景
• 假设缺陷:完全理性假设,即假定参与人完全了解其对手 的策略集合以及使用每个策略的概率,同时也了解博弈规 则与收益结构。参与人也具有通过精确计算推理得到最优 策略的能力。但现实中的参与人只具有有限理性(Bounded Rationality)。
其中:
复杂网络上的演化博弈
第2卷第2期 智 能 系 统 学 报 Vol.2№.22007年4月 CAA I Transactions on Intelligent Systems Apr.2007复杂网络上的演化博弈王 龙,伏 锋,陈小杰,王 靖,李卓政,谢广明,楚天广(北京大学工学院,北京100871)摘 要:主要介绍了近年来复杂网络上的演化博弈研究现状和研究方向.复杂网络理论的发展为描述博弈关系提供了系统且方便的框架,网络上的节点表示博弈个体,边代表与其邻居的博弈关系.介绍了经典演化博弈论中的演化稳定策略概念和复制动力学方程,以及二者的相互联系.介绍了混合均匀有限人口中随机演化动力学问题,并给出了与确定复制方程的相互转化关系.介绍了小世界、无标度等复杂网络上演化博弈的研究结论,给出了复杂网络上演化博弈论的未来发展方向.关键词:演化博弈论;复制动力学;演化稳定策略;复杂网络;有限人口;合作中图分类号:N949 文献标识码:A 文章编号:167324785(2007)022*******Evolutionary games on complex net w orksWAN G Long ,FU Feng ,C H EN Xiao 2jie ,WAN G Jing ,L I Zhuo 2zheng ,XIE Guang 2ming ,C HU Tian 2guang(College of Engineering ,Peking University ,Beijing 100871,China )Abstract :In t his survey ,recent develop ment s and f ut ure directions of evolutionary games on complex net 2works are p resented.The develop ment of complex network t heory provides a systematic and convenient f ramework for description of t he dynamical interactions of games.The vertices represent players ,while t he edges denote t he links between players in terms of game dynamical interaction.First ,some important concept s of evolutionarily stable strategy and replicator dynamics are int roduced ,and t he connection be 2tween t he evolutio narily stable st rategy and replicator dynamics is established.Then ,t he stochastic evolu 2tionary dynamics of finite well 2mixed pop ulatio ns and t heir relationship to t he deterministic replicator dy 2namics are presented.Some result s on fixed probability and time are also given.Furt hermore ,some recent result s of evolutionary games on complex networks such as small 2world and scale 2f ree networks are int ro 2duced.Finally ,unresolved open p roblems ,f ut ure research directions ,and possible application areas for evolutionary games on complex networks are pointed out.K eyw ords :evolutionary game ;replicator dynamics ;evolutionarily stable strategy ;complex networks ;fi 2nite pop ulations ;cooperation收稿日期:2006212218.基金项目:国家自然科学基金资助项目(60674050,60528007);973国家重点基础研究发展计划资助项目(2002CB312200);863国家高技术研究发展计划资助项目(2006AA04Z258);“十一五”规划资助项目(A2120061303). 博弈论是研究依据其他参与者的效用(utility )情况,理性参与者策略之间相互作用的一门科学[1].博弈论的要素有两点:参与博弈者的目标或利益相互冲突,且他们都是理性的.现代博弈论已成为一门横跨数学、生物、心理学、计算机科学、运筹学、经济、哲学、政治、军事战略等领域的交叉学科.公认的现代博弈论起源于数学家Von Neumann 和经济学家Morgenstern 的合著:博弈理论和经济行为[2].尽管当时这本著作中的博弈论的理论框架只适用于一些有限的特例,如只讨论了零和非合作博弈问题等,但它第一次用数学语言描述和解决了博弈问题.此后,经过许多学者的努力,特别是Nash 在非合作博弈理论中创造性地引入策略均衡的概念,博弈论日渐成为非常重要且有用的分析工具[3].近十多年来,诺贝尔经济学奖先后授予研究博弈论的科学家Nash、Selten、Harsanyi、Aumann、Schelling等人,说明博弈论越来越得到更多人的重视,博弈论的威力也得到越来越广泛的承认.1 博弈论和复杂网络所谓Nash均衡(Nash equilibrium)是指给定博弈中其他个体(player)的策略时,任何一个个体都不能单方面改变自己的策略来增加自己的收益(payoff)的情形.换言之,在Nash均衡中,相对其他个体,个体的所选策略已经是最佳的反应,此时Nash均衡成为一致解的概念.但是,作为博弈一致解的概念,在有些情况下Nash均衡并不是必要条件而是充分条件.因此,博弈论的后Nash均衡时代主要是针对博弈的假设和前提的重新修改和扩展.其中最主要的2个分支:动态博弈和非完全信息博弈.非完全信息(incomplete information)和非完美信息(imperfect information)的区别在于:前者表示博弈中的个体不精确地知道博弈收益的大小或其他博弈个体的类型(type);后者表示博弈过程的信息集合的元素个数超过一(即不知道博弈中其他个体的行动(actions)).通过Harsanyi转换(Harsanyi t ransformation),可将“非完全信息博弈”转换成“完全但非完美信息博弈”.在动态博弈中,个体决策的时间(即行动的先后次序)将对博弈结果起作用.田忌赛马就是动态博弈的例子之一.本文将介绍完全信息下非合作博弈的基本概念和演化博弈理论.演化博弈这一概念最初是由Maynard Smit h和Price 在研究对称人口博弈时提出的[4],他们成功地把博弈论应用到生物背景中去.其主要思想就是采用依赖于接触频率的适应度(frequency2dependent fit2 ness,对应于博弈论中的效用或收益)的策略更新方法.近些年,演化博弈论不仅在理论生物学中得到充分的发展,也在其他学科,如经济学、社会学、心理学等得到广泛的应用.近年来,由于复杂网络研究的兴起与发展,使得人们对各种现实网络的结构演化、复杂性有了比较清晰的认识.特别是1998年Cornell大学的Watt s 和其导师St rogatz在Nat ure杂志上撰文给出了小世界网络模型[5],复杂网络研究迅速引起了诸多领域中科研工作者的兴趣,特别是物理学界、生物学界,复杂网络理论得到了充分的探索和发展.1999年美国Not re Dame大学的Barabasi和其学生Al2 bert在Science杂志撰文指出[6],很多复杂网络的度分布近似服从幂率分布,也就是常说的无标度网络(scale2f ree networks),并给出了一个偏好连接(p referential attachment)的模型,简单探讨了这一现象的内在机制.自20世纪60年代以来,随着匈牙利数学家Erdos和Renyi的关于随机图论的论文的发表,人们对真实世界网络的认识停留在随机网络的认识水平上.Barabasi和Albert的发现,改变了以往人们对现实网络的认识,从而成为复杂网络研究的催化剂.很多有关复杂网络的重要性质、组织规律及其复杂网络上的动力学的研究论文相继发表,特别是无标度网络上传染病的阈值问题、复杂网络的层次性、结构性、自相似性等方面重要的结果[7-10].有关复杂网络研究的现状,读者可参考文献[11-15],这里不再赘述.复杂网络理论为描述博弈个体之间的博弈关系提供了方便的系统框架.网络上的节点表示博弈个体,边代表与其邻居的博弈关系.这样一来,就可以利用复杂网络拓扑关系,来研究一些复杂的博弈关系下的博弈.比如,以前的博弈理论中的混合均匀(well2mixed)假设就可以看成是在全连通图上进行的博弈.在空间二维格子(lattice)或一维格子(ring)上博弈即可转化为规则网络上的博弈.然而,真实世界的网络是异质的(heterogeneous),大部分节点的邻居数目存在差异,甚至成幂率分布.因此,研究接触网络(network of contact s)的异质性对其上的博弈动力学的影响是非常有意义的.在演化博弈研究中,一个重要的方向就是研究理性的博弈者之间如何涌现出合作行为.比如,在囚徒困境博弈(Prisoner’s Dilemma)中,每个纯策略的个体都有2种选择:合作(cooperation,C)与作弊(defection,D).D策略个体利用C策略个体,获得T收益,而C获得S.双方都合作获得R,都作弊获得P,其中T>R>P>S,2R>T+S.在单轮博弈情况下,无论对手采取何种策略,个体的最佳策略总是作弊(defect).然而,在双方都采取合作(cooperate)策略的情况下,二者总的收益才是最大的.这一现象说明了社会两难(social dilemma)问题的实质.当囚徒困境博弈在2个个体之间进行多次时,每个个体都可以根据上次博弈的结果选择进行下次博弈的策略(即迭代囚徒困境博弈)(iterated prisoner’s di2 lemma game).在20世纪70年代末的Axelrod锦标赛(Axelrod tournament)中,英国数学家、生物学家Rapoport提出的Tit2for2Tat(TF T)策略脱颖而出,打败了其他策略.所谓TF T是一个偏向合作的策略,第一步采取合作,然后重复其对手上一步的策略.但是TF T在有环境干扰时表现并不好,此时・2・智 能 系 统 学 报 第2卷Pavlov策略就能打败TF T.Pavlov策略是属于更一般的Win2Stay2Lo se2Shift(WSL S)策略类型. WSL S策略是指个体如果现在的策略获得的收益大于某个期望水平(aspiration level),那么下一步就保持这个策略不变,否则就切换到另外一个策略.在演化博弈中使用较多的另外一个范例是雪堆博弈(snowdrift game).假设合作的收益为b,成本为c(b>c),两个个体都选择合作则得到收益b-c/2,如果都作弊则收益为0.合作者遇到作弊者,则收益为b-c,作弊者则得到收益b.由于在雪堆博弈中,选择合作总比选择作弊要好,Nash均衡为混合策略(合作的频率为x3=(b-c)/(b-c/2).因此雪堆博弈被广泛地用于研究生物之间的合作行为.TF T策略和WSL S策略是建立合作和作弊策略基础上的宏策略(meta2st rategy).一般在博弈中只考虑最简单的策略(合作或作弊),如果囚徒困境博弈在相同的多个个体之间进行多次,其中个体可以通过记忆或学习、或者对作弊者进行惩罚,那么在合适的内在机制之下,合作行为将会涌现并逐渐占据优势.对合作机制的研究,特别是在复杂网络上的演化博弈背景中,是目前演化博弈研究的一个热点.2 演化稳定策略与复制动力学演化稳定策略(evolutio narily stable st rategy, ESS)相关概念最早由英国学者Maynard Smit h提出[16].策略I是ESS,必须满足条件:如果几乎所有的个体(pop ulation)都采取策略I,那么这些I策略的个体的适应度要比任何可能的变异策略要大.否则变异策略可以入侵种群并且I将不稳定.有了ESS的概念,就可以判断策略的稳定性.由于经典博弈中最重要的概念是收益矩阵(payoff mat rix)和收益,因此可以把经典博弈中的想法应用到ESS中来.假设生物的适应度跟收益成正比(或是收益的函数),或就等于收益,并且经典博弈中参与者理性(rationality)选择的策略就对应于ESS.与传统的Nash均衡相比,ESS这个概念要更加严格一些,因此可用于平衡点选择.因为所有的ESS必定是Nash均衡,但只有严格对称Nash均衡才是ESS.值得一提的是,这里的ESS是一个“静态”的概念,其假设只要求表现更好的策略具有更快的复制(增长)速率,并不涉及具体的博弈动力学.复制动力学(replicator dynamics)在1978年由Taylor和Jonker引进[17].其主要假设为给定的策略类型的单位复制率 ρiρi 正比于适应度之差:ρiρi=fit ness of type i-average fit ness.(1) 复制动力学是关于博弈动力学(策略更新)的连续确定性方程,从而可以赋予前面介绍的ESS这一静态的概念以动力学含义.复制方程在不动点附近的稳定性将对应于策略的稳定性(ESS).复制动力学与演化稳定性的关系可以总结如下[18-19]:1)ESS对应于吸引子;2)内部ESS对应于全局吸引子;3)对势博弈(potential game)而言,某个不动点是ESS当且仅当它是吸引子;4)对2×2矩阵博弈而言,某个不动点是ESS当且仅当它是吸引子.3 有限人口上的演化博弈动力学以往复制动力学及ESS的概念均假设人口为无限且混合均匀.但更实际一点,往往需要考虑人口非无限情形,此时演化动力学将受到有限人口因素的影响而满足随机动力学基本性质(Markov过程).2004年Nowak等人在Nat ure上发表文章指出在有限人口的情形下,采用依赖于频率的Moran过程(birt h2deat h process),经典的ESS的判据需要做修改,并提出了在弱选择下的“1/3规则”[20].假设种群由N个混合均匀的策略为A或B的个体组成,收益矩阵为A BA a bB c d假设有i个A策略的个体,那么策略A和B的适应度分别为f i=1-w+w[a(i-1)+b(N-i)]/[N-1],g i=1-w+w[ci+d(N-i-1)]/[N-1].(2) 这里适应度由个体原有的基线(baseline)1加上通过博弈获得的收益经过加权得到.w∈[0,1],表示自然选择的强度,即博弈收益对适应度贡献的大小.在每一时间步长,按照正比于适应度的概率选择一个个体进行复制,并替代一个随机选取的种群中个体.A类型的个体可能增加一个,减少一个或保持不变.因此Markov过程的转移矩阵为三对角矩阵(t ri2diagonal mat rix),矩阵元素为P i,i+1=if ii f i+(N-i)g iN-iN,P i,i-1=(N-i)g ii f i+(N-i)g iiN,(3)・3・第2期 王 龙,等:复杂网络上的演化博弈P i,i=1-P i,i+1-P i,i-1,其他元素为零.这个随机过程具有2个吸收态(ab2 sorbing state)i=0和i=N.如果种群达到这2个吸收态之一的话,系统将永远保持状态不变.以x i表示种群从i个A个体开始演化到i=N终态的概率,即固定概率(fixation p robability),那么有以下关于x i的递归方程(recursive equation)[20-22]:x i=P i,i+1x i+1+P i,i x i+P i,i-1x i-1,(4)边界条件为x0=0和x N=1.方程的解由Karlin和Taylor在1975年给出[23]:x i=1+∑i-1j=1∏jk=1g kf k1+∑N-1j=1∏jk=1g kf k,(5)考虑单个A个体能入侵并占据所有的B个体的概率:ρA=x1=11+∑N-1j=1∏jk=1g kf k,(6)对于中立博弈(neut ral game)来说,此时w=0,x1= 1/N.若ρA>1/N,那么自然选择偏向于A取代B.在有限人口N的情况下,B策略是ESS,记作ESS N,如果以下条件满足[20]:1)选择不利于A入侵B,这意味着B种群中的一个变异A具有较低的适应度;2)选择不利于A取代B,这意味着固定概率ρA<1/N.值得一提的是,不像在无限人口中2种策略有可能共存的情况,在有限人口中,某种策略最终会被固定下来(即最终不存在2种策略共存的情况),但达到固定的时间有可能很长,此时讨论固定概率就没有多少意义了.因此固定时间(fixation time)从另一个方面反映了自然选择如何影响种群进化的速度.一般讨论条件平均固定时间(conditional mean fixation time).在文献[22]、[24]中,发现系统从状态i=1演化到i=N,或从i=N-1到i=0的条件平均固定时间是相等的.进一步地,这一结果跟收益矩阵没有关系,即无论是在A对B是占优的情况下,还是在A和B都是对自己的最好反应等情况下,条件平均固定时间的均值和方差都是相等的.这是一个相当有趣的结果.文献[24]还发现,这一结果对于Wright2Fisher过程或同时有多个变异存在的情况并不成立.对于有限人口,演化动力学是一个随机过程,那么在人口N趋于无穷大的情况下,二者有没有联系呢?Traulsen等人发现[25],若采用标准的Moran 更新过程,在N→∞时,人口演化的随机动力学将对应于调整复制方程(adjusted replicator equation )或Maynard Smit h形式的复制方程.如果采用对比较(pair comparison)更新方式,在N→∞时,人口演化的随机动力学形式上将对应于标准复制方程.如果记x=i/N,以ρ(x,t)表示人口在t时刻处于x 状态的概率密度,那么ρ(x,t)满足Fokker2Planck 方程(FPE)[25-26]:dd xρ(x,t)=-dd x[a(x)ρ(x,t)]+12d2d x2[b2(x)ρ(x,t)].(7)式中:T+(x)=f ix f i+(1-x)g ix(1-x),T-(x)=g ix f i+(1-x)g ix(1-x),a(x)=T+(x)-T-(x),b(x)=(1/N)[T+(x)+T-(x)],使用Ito积分,式(7)FPE方程变成Langevin方程:x=a(x)+b(x)ξ,(8)式中:ξ为非相关高斯噪声.在N→∞时,b(x)→0,式(8)方程由随机微分方程变成了确定性的复制方程.文献[26]推广了Nowak的有限人口时弱选择下ESS N的充分条件:当N wν1时,“1/3规则”是有效的;对w固定且Nµ1时,传统的ESS判定条件成立.有限人口因素对人口策略演化的影响是当前研究的一个热点问题.更详细的内容可以参考文献[27-30].4 复杂网络上的演化博弈上面所讨论的混合均匀的有限人口中的博弈动力学,相当于在全连通图上的演化博弈问题.复杂网络或图为描述博弈关系提供了方便的框架:顶点表示博弈个体,边表示博弈关系.在每一时间步长,节点与其所有邻居进行博弈,累积博弈获得的收益,然后根据更新规则进行策略更新,如此这样重复迭代下去.近年来,复杂网络上演化博弈问题,尤其是对合作行为产生的机制的探索,引起了学术界广泛的注意和兴趣[31-33].尽管对合作行为提出了一些可行的机制,但合作行为的本质和真正内在机理,仍然是一个尚未解决的问题[34-35].复杂网络上的演化博弈研究主要可分为2种:一种是研究网络拓扑对合作的影响,主要是静态(static)网络的拓扑性质对合作水平的影响;另外一种是网络拓扑和博弈动力学的共演化(co2evolution),主要是自适应(adaptive)网・4・智 能 系 统 学 报 第2卷络上博弈动力学,即网络拓扑调整受博弈动力学影响.Nowak等人首先研究了空间二维格子上的囚徒困境博弈,即每个博弈个体跟邻近的4个或8个邻居进行博弈.在此基础上发现了美妙的空间混沌[36-37],并发现了对于囚徒困境博弈,博弈个体的空间分布会加强合作(spatial cooperation).但是, Hauert等人发现对于雪堆博弈,博弈个体的空间分布结构往往会削弱合作水平[38].Szabó等人利用平均场(mean2field)、对估计(pair2app roximation)等方法,系统地研究了二维平面各种规则格子上的演化博弈问题[39-41].由于社会网络具有小世界和无标度等特性,因此研究拓扑特性对合作的影响是十分有意义的.小世界网络上的空间纯策略博弈主要分为2类:一类是基于环的小世界网络;另一类是基于方格的小世界网络.Santo s等人研究了同质(homogeneo us)和异质(heterogeneous)的小世界网络上的演化博弈问题[42-44].异质小世界网络是由规则网络演化而来:由一个具有N个节点的环开始,环上每一个节点与两侧各有m条边相连.对每条边以概率p随机进行重连(自我连接和重边除外).重连以后,如果保持网络的平均度不变,此时的网络就为异质小世界网络;而同质小世界网络也是由规则网络演化而来:由一个具有N个节点、平均度为z的规则网络开始,其边数为E=N・z/2.以概率p进行交叉换边重连(同样避免重复连边).这样重连以后不改变节点的度的网络就为同质的小世界网络(此时每个节点的度相等,亦称之为规则随机图(regular random grap h).对于上述2种小世界网络,当概率p=0时,相应的网络为规则网络,而当概率p=1时,相应的网络为随机网络.Santo s等仿真了环型小世界网络上的“弱”囚徒困境的博弈情形.他们发现平衡态时异质小世界网络上的合作策略比例比同质小世界网络上的要大.在异质小世界网络上,当概率p不断增大时,平衡态时合作策略比例也不断增强[42,45].而在同质小世界网络上,对于囚徒困境博弈,存在一个临界作弊收益值b c,当b<b c时,随着概率p不断增大,对应平衡态时合作反而不断降低;当b>b c 时,随着概率p不断增大,对应平衡态时合作不断增强[42].Ren[46]等发现在均匀小世界网络上,同时也存在一个临界概率p c,当概率p<p c时,平衡态时合作水平不断增强;当概率p>p c时,平衡态时合作水平反而不断降低.这说明p c为最优概率值,能保证合作最强.大部分工作采取策略演化更新规则:w Sx←Sy=11+exp[(M x-M y)/T].(9)式中:w Sx←Sy表示节点x模仿邻居节点y策略的概率,M x、M y表示节点x、y的累积收益,T表示节点的理性程度.当T=0时,表示完全理性选择;当T→∞时,表示完全随机选择.适当的T也可以加强合作,即存在一个最优的能使博弈合作程度达到最强[46].Szabó等人也研究了方格小世界网络上的带有loner的囚徒困境博弈问题(即带有志愿者参加(volunteering participation)的囚徒困境博弈),发现重连概率大于一定的阈值时,相图会发生振荡[47].有趣的是,若分别用优先选择邻居和随机选择邻居的演化规则,在方格小世界上会发现优先选择邻居能促进合作[48-49].Tomassini等仿真研究了方格小世界网络上的鹰鸽博弈(hawk2dove game,数学上等价于前面所提到的雪堆博弈),发现平衡态的合作与演化规则、收益比(gain2to2cost)r以及重连概率p相关[50].Santo s和Pacheco等采用同步更新的策略模仿(st rategy imitation)更新方法对无标度网络上的空间纯策略博弈行为进行了较系统的研究[43,51-53],发现与规则网络、随机网络相比,无标度网络更有利于合作行为的产生.因此网络拓扑的异质性(度分布为幂率分布)是提升合作水平的一个重要因素.Ren等采用“优先学习”方法,即优先选择邻居来进行模仿演化,数值仿真显示平衡态时合作水平得到加强[54].类似于亲缘选择中的合作判据Hamilton规则[55],Oht suki等人发现在网络上合作行为产生的一个充分性判据:b/c>k,其中b、c分别为合作行为的收益和代价,k为网络的平均度[56].这一合作行为简单判定规则适用于二维格子、随机网络和无标度社会网络.考虑在网络上的入侵和固定动力学(dy2 namics of invasion and fixation),即一个变异A入侵种群B的固定概率,Antal等人发现在度不相关无标度网络上的一个变异的固定概率跟它发生的节点的度相关,且发现对投票模型(voter model),固定概率正比于度,对生灭(birt h2deat h)过程,固定概率反比于度[57].除了网络的异质性对合作行为有影响外,网络的平均度也是影响合作涌现的重要因素之一.文献[58]研究了随机图、小世界、无标度3种网络中平均度对合作水平的影响,发现对于每种网络均存在适当的平均度使得合作水平最优.另一方面,博弈动力学与网络拓扑共演化的问题也得到一些关注和研究.网络拓扑影响博弈结果,而博弈结果反过来作用于网络拓扑,调整网络拓扑・5・第2期 王 龙,等:复杂网络上的演化博弈(或社会关系),这种情形更符合实际.Zimmermann 等人认为个体可以依据博弈结果调整与邻居的边来实现合作者与合作者之间的联合,从而有利于合作行为的涌现和维持[59-60].Santo s等人考虑了网络拓扑调整与博弈演化之间的时间尺度的关系,并假设不满意博弈结果的节点以一定概率断开与邻居中作弊者的边,并随机重连到作弊者的邻居,发现存在时间尺度之比的临界值,一旦超过这个临界值,合作将会占上风[61].Pacheco等人考虑了简化的情形,提出了活跃连接(active linking)的假设,在一定条件下,自然选择将偏向于合作[62].目前文献中关于这方面的结果比较少,但这个问题又为大家所关注,因此这个问题将是今后研究的一个重点.5 演化囚徒困境博弈中的合作涌现真实社会的网络拓扑除了具有小世界、无标度等性质外,还具有社团结构(community st ruct ure)这一重要的性质.社团结构是指整个网络是由若干个“群(gro up)”或“团(cluster)”构成的.每个群内部的节点之间的连接相对比较紧密,但是各个群之间的连接却比较稀疏.因此,研究社团结构对合作水平的影响是很有意义的.笔者研究了具有社团结构的无标度网络上的囚徒困境博弈问题[63].不失囚徒困境博弈的一般特性,博弈矩阵M取为[36]M=10b0.(10)式中:1<b<2.采用文献[64]中具有社团结构的无标度网络模型,生成节点总数N=6000、具有3个相同大小群的社团结构的博弈关系网络.用二维向量表示个体的策略类型:合作(C)与作弊(D):C=1,D=1.个体x的收益为他跟所有邻居博弈一次的收益的总和:P x=∑y∈Ωxs T x Ms y,其中s x、s y表示节点的状态(策略),Ωx表示x的所有邻居.采用同步更新规则(synchronous up date rule),在每一时间步长,节点x从其邻居中随机选取节点y进行策略更新,若P y>P x,则以概率W sx ←xy=P y-P xbk>.(11)采用节点y所用的策略s y,其中k>为节点x和y的度中的较大值.初始时刻,合作者与作弊者等比例随机分布在网络顶点上.系统演化10000时间步长后,再取1000步时间步长上合作者比例的平均数,得到平衡态时合作者的比例.每个数据点对应于40次不同的网络实现和初始分布条件下合作者比例的平均值.图1显示了相同网络规模,但不同平均度m+n及不同社团内外连接数之比m/n时的合作频率对参数b的变化情况.可以发现,在具有社团结构无标度网络上,随着平均度m+n的增加,合作水平也相应地减小.同时,在保持平均度m+n不变,改变内外连接数之比m/n时,合作水平随着m/n减小而降低.另外,在没有外部连接时(对应于n=0),合作水平总是最优的.此时对应于3个Barabasi2Al2 bert(BA)无标度网络,而无标度网络是利于合作的涌现的[51],因此此时合作水平最高.随着外部连接数的增加、内部连接的较少,网络结构中的一些hub (网络中度较大的节点)并不直接相连,并且网络中回路(loop)减少了,这些因素影响了合作水平[63].图1 对应于不同m+n与m/n时合作频率对参数的变化情况Fig.1 Frequency of cooperators vs.b corresponding todifferent m+n and m/n文献[51-53]指出复杂网络的异质性是影响合作水平的重要因素.但复杂网络的异质程度大小会对合作水平产生什么影响呢?考虑了异质New2 man2Watt s小世界网络上的演化囚徒困境博弈问题[65].与Watt s2St rogatz小世界模型中断边重连机制不同[5],本文采用改进的Newman2Watt s小世界模型,即在低维规则环上添加m条长程边形成小世界网络.首先随机地从N个节点中选出N h个节点・6・智 能 系 统 学 报 第2卷。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对称的(
2 2 )演化博弈
• 给出参与人的期望收益函数:
f s11 ( z (t ))
az (t ) b( M z (t )) , M
f s12 ( z (t ))
cz (t ) d ( M z (t )) . M
2 2
定义参与人选择其第一类策略的转移率为:
11 12
模型描述:
参与人只具有两个纯策略,则两个群体的策略集分别为:
S1 {s11 , s12 } 和:S2 {s21 , s22 }
两个互相独立的群体P1、P2,人口规模分别为M, N. 设每一个
群体P1、P2 内部的博弈方式是“随机匹配”,阶段博弈矩阵
为:
a b a A1 1 1 , A2 2 c1 d1 c2
为了解决经典博弈论的以上三种缺陷, 从二十世纪九十年代发展了演化博弈 论的研究工作。
方法缺陷
假设缺陷
演化博弈论的产生背景
• 假设缺陷:完全理性假设,即假定参与人完全了解其对手 的策略集合以及使用每个策略的概率,同时也了解博弈规 则与收益结构。参与人也具有通过精确计算推理得到最优 策略的能力。但现实中的参与人只具有有限理性(Bounded Rationality)。
严格占优策略:任意给定其他博弈参与人的纯策略选择组合,如果某 一个特定的纯策略满足如下条件,则称这个纯策略为严格占优策略:
si , si' si* , ui (si* , si ) ui (si' , si )
演化博弈论的产生背景
实证缺陷
经典博弈论
二十世纪八十年代之后,研究工作围 绕着修正经典博弈论中的完全理性假 设展开研究,并试图为纳什均衡的概 念寻找动态结构下的解释。研究表明: 经典博弈论在应用中遇到困难,主要 是存在三种缺陷:假设缺陷、方法缺 陷、实证缺陷。
虚拟行动。
对称的(
• 假设前提:
2 2 )演化博弈
假设1:参与人采用近似最优反应机制规定的决策模式,即参与人对市场的认
知程度是有局限性的;
识;
假设2:参与人的决策是“近视”的,其决策基于参与人对当前市场结构的认 假设3:参与人的决策具有不确定性,统称为“变异”。
模型描述:
参与人只具有两个纯策略,则两个群体的策略集分别为:
S1 {s11 , s12 } 和:S2 {s21 , s22 }
两个互相独立的群体P1、P2,人口规模分别为M, N. 设每一个
群体P1、P2 内部的博弈方式是“随机匹配”,阶段博弈矩阵
为:
a b a c A1 , A 2 b d c d
其中:
1 (m) 1 ( m ) m , A0 ( ) 1 ( m )
1 (n) 1 ( n ) n . A2 ( ) 1 ( n )
相关研究的文献综述
• 探讨演化稳定策略的定义和求解方法,以及演化 稳定策略与纳什均衡策略之间关系: Friedman(1991,1998); Hofbauer和Sigmund(1988, 1998); Samuelson(1997); Weibull(1995).
Nash 均衡 ESS
• 演化博弈和学习机制的交叉研究:Fudenberg和 Levine(1997); Foster和Young(2003); Milgrom和 Robert(1991); Young(1998, 2000,2 002).
Quan-Lin Li
Constructive Computation in Stochastic Models with Applications: The RG-Factorizations
Springer
Chapter 11 Sensitivity Analysis and Evolutionary Games
随机演化博弈的算法研究 及其在复杂网络中的应用
汇报提纲
• 进化博弈的基本内容 • 我们的研究工作 • 随机进化博弈所面临的理论困难 • 在计算机网络中的应用 • 在复杂网络中的应用 • 我们的未来研究工作
2
演化博弈论的产生背景
• 1944, J. von. Neumann和Oskar. Morgenstern奠定了经典博弈理论的基础。
0 , 1 , 2 ,, N ;
* k lim k .
0
两个独立群体的演化博弈
• 假设前提:
假设 1:参与人采用近似最优反应机制规定的决策模式,即参
与人对市场的认知程度是有局限性的; 假设 2:参与人的决策是“近视”的,其决策基于参与人对当 前市场结构的认识; 假设3:参与人的决策具有不确定性,统称为“变异”。
0 A0 ( ) 1 A1 ( ) 2 A2 ( ) 1 A0 ( )
A12 ( )
A02 ( ) A2M 2 ( ) A1M 2 ( ) A2M 1 ( ) A0M 2 ( ) A1M 1 ( ) A2M ( )
. A0M 1 ( ) A1M ( )
两个独立群体的演化博弈
a1 (k , 0) 2 (0) 2 2 (1) a ( k ,1) (1) 1 2 2 (2) a1 (k , 2) (2) A1k ( ) , 2 2 ( N 1) a1 (k , N 1) ( N 1) 2 ( N ) a ( k , N ) 1
• 方法缺陷:经典博弈论关注的重点是如何求解博弈的平衡 结构,但不能解释博弈的各参与方是如何通过参与博弈而 趋向于这些均衡状态的(H.P. Young)。
• 实证缺陷:多数解析型博弈论的预测都是基于理想的假设 和精确的数学推导,需要实证的经验规律来充实经典博弈 论(Colin Camerer)。
演化博弈论的研究意义
• 演化博弈研究具有普遍意义的有限理性的参与人:惰性、近 视、遗传、突变、变异。Kandori, Mailath和Rob (1993) • 演化博弈不仅关注博弈的稳定结构,还通过引入不同的动态 机制研究博弈系统的稳定结构和演化过程之间的关系; • 演化博弈模型可以和个人学习机制相结合,可以探讨微观层 面上参与人的互动和宏观层面上群体的均衡现象之间的关系; • 演化博弈的假设条件与建模方法更加有利于进行模拟实验来 获得实证数据。
(i) max{ fs (i) f s (i),0}, i {0,1,...M 1}.
(i) max{ fs (i) f s (i),0}, i {1, 2,...M}.
12 11
* 0 1 * 1 Q N *
1944
1950-1951
1950-1951, J. Nash提出了非合作博弈的纳 什均衡的概念。
1980-1990 1990-Present
二十世纪八十年代,博弈论成为经济学领 域当中的通用理论工具,例如:分析不同 厂商的合作、联盟、竞争与冲突;工业组 织的形成;经济契约的签订;拍卖机制的 设计;不对称信息的市场分析等等。
12 11
2 ( j) 2 max{ fs2 ( j) f s2 ( j),0}, j {0,1,...N 1}.
21 22
2 ( j) 2 max{ fs2 ( j) fs2 ( j),0}, j {1, 2,...N}.
22 21
定义拟生灭过程的状态空间为:
b2 d2
两个独立群体的演化博弈
• 给出参与人的期望收益函数:
f s1 ( z (t )) 11
f s2 ( z (t )) 21
a1 z1 (t ) b1 ( M z1 (t )) , M
a2 z2 (t ) b2 ( N z2 (t )) ; N
f s1 ( z (t )) 12 f s2 ( z (t )) 22
{(0,0),(0,1),...(0, N );(1,0),(1,1),...(1, N );...;(M ,0),(M ,1),...(M , N )}
两个独立群体的演化博弈
• 拟生灭过程的无穷小生成元为:
A10 ( ) 1 A2 ( ) Q
演化博弈的基本要素
1
有限人口-无限人
2
同质群体的对称二
3
自然选择机制(复
口:
离散的策略-连续
人博弈;
不同质群体的非对
制子动态);
模仿机制;
强化学习机制; 最优反应机制; 几种机制的混合:
的策略:
参与人的匹配方式:
称二人博弈。
单对模型、总体统 计模型、随机匹配 模型
相关研究的文献综述
• 确定性的演化博弈模型(微分方程): Friedman(1991,1998); Hofbauer和Sigmund(1988, 1998); Weibull(1995). • 随机性的演化博弈模型: 扰动的生灭过程:Fudenberg和Imhof(2006); Fudenberg等人(2006)。 扰动的拟生灭过程:Tadja和Touzene(2003); Q.L. Li(2008)。 扰动图的马氏链:Young(1993)
个体相互作用内涵的转变
策略内涵的转变
均衡内涵的转变
演化稳定策略(ESS)
用J(p, q)来表示一个物种的策略p遇到策略q时 的收益函数。
策略p* 被称为是一个ESS,如果
J(p*, p* ) 〉 J(p, p* )Fra bibliotek微分方程的稳定性