用于社群结构探测的小世界特征遗传算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第25卷第1期2010年2月 系 统 工 程 学 报

J OURNAL OF SYSTE M S ENG I N EER ING

V o.l25N o.1

F eb.2010

do:i10.3969/.j issn.1000-5781.2010.01.020

用于社群结构探测的小世界特征遗传算法

陈盈晖1,3,杜海峰2,李树茁2,3

(1.西安交通大学管理学院,陕西西安710049;2.西安交通大学公共管理与复杂性科学研究

中心,陕西西安710049;3.西安交通大学人口与发展研究所,陕西西安710049)

摘要:针对网络社群结构探测问题,探讨一种小世界特征遗传算法.受小世界现象搜索机理和网络结构特征

启发,构造一种社群结构局部搜索算子;进而将该算子引入遗传算法基本框架,提出一种小世界特征遗传算

法.典型网络的社群结构探测的结果表明,与G irvan N e wman算法和模拟退火算法相比,小世界特征遗传算法

探测到的社群结构具有更大的模块性值,从而证明该算法是可用且有效的.

关键词:社群结构;模块性;遗传算法;小世界现象

中图分类号:T P18 文献标识码:A 文章编号:1000-5781(2010)01-0116-07

A geneti c algorith m w ith s m all world characteristic used for

co mm unity structure detection

CHEN Y ing hui1,3,DU H ai feng2,LI Shu zhuo2,3

(1.Schoo l o fM anage m en,t X i an Jiao tong Un iversity,X i an710049,Chi n a;2.Center for

Ad m i n i s trati o n and Co m plex ity Sc ience,X i an Jiaotong Un i v ersity,X i an710049,Ch i n a;

3.I nstitute for Populati o n and Develop m ent Studies,X i an Jiaotong Un i v ersity,X i an710049,Ch i n a)

A bstract:I n o r der to detecti n g t h e co mmun ity str ucture for the net w ork,a genetic algo rithm w ith

s m all w orld characteristic is explored.I nspired the search i n g m echan is m s o f s m a ll wo rl d pheno m ena

and t h e con j u nctional properties of the net w ork,a local search operator i s put for w ard firstly.Ac

cor d i n gly,a genetic algorith m w it h s m all w orl d characteristic is put f o r w ard based on the basic

fra m e work of the genetic algo rithm and the loca l search operato r.The resu lts of co mm un ity detecti o n

for so m e c lassic net w or ks i n d icate that the genetic a l g orit h m w it h s m all w orld characteristic ach ieves

h i g her m odu lar ity than the G irvan Ne wm an algorithm and the si m u lated annealing a l g orit h m.It

m eans that the genetic algorithm w ith s m all w orld characteristic is useful and e ffective.

K ey words:co mm un ity str ucture;modularity;genetic a l g orit h m;s m all w orl d pheno m ena

收稿日期:2008-10-17;修订日期:2009-11-05.

基金项目:教育部新世纪优秀人才支持计划资助项目(NCET-08-0451);!长江学者∀奖励计划资助项目;教育部长江学者和创新团队发展计划资助项目(I RT0855);国家自然科学基金资助项目(70671083);美国S anta Fe I n stitute国际项目基金、斯坦福大学联

合资助项目.

0 引 言

对异构网络的社群结构(co mm un ity str uc ture)研究逐渐成为复杂网络的主要发展方向之一[1],已被广泛地被用于社会学、生物学以及计算机科学的网络分析[2].社群结构探测是网络社群结构研究的前提和核心,但是,社群结构探测是一个典型的NP难问题[3],对于一个有n个节点

的网络,其可能的社群结构有#n k=11k!#k j=1k j j n 种[4],理论上很难获得最优解.N e wm an模块性(m odu lar ity)指标的提出,是社群结构研究和应用的重要里程碑.模块性指标使得社群结构探测方法开始由传统的计算机科学方法和社会学方法向以模块性指标为评价基础的现代方法转变,通过对模块性指标优化获得社群结构是多数现代方法的基本策略[5].以模拟退火算法为代表的拟物算法和以遗传算法为代表的仿生算法等智能优化策略具有解决复杂优化问题的潜力,因此也逐渐受到社群结构研究者的注意[6-7].事实上,作为一个复杂的演化系统,人类社会本身也蕴藏了许多可以用于优化问题求解的机理,小世界现象就是其中之一.

小世界现象源于M ilg ra m20世纪60年代有关!追踪美国社交网络中的最短路径∀的研究[1],相关结果表明社会网络中存在高效的信息传递路径;在W atts等小世界网络模型[8]的基础上, K le i n berg进一步构造二维小世界网格模型,并指出小世界现象中高效的信息搜索性主要是依靠局部连接和少数随机长连接发现网络最短路径,是一种有效的搜索策略[9],其搜索机理不同于遗传算法.遗传算法强调全局搜索(交叉算子)而非局部搜索(变异算子)[10],虽然具有并行、随机搜索、问题依赖弱、计算效率高等突出优点,但是也存在早熟收敛等缺陷,而小世界搜索机理却可以在一定程度上克服这些问题.

为了更好地解决网络社群结构探测问题,本文探讨一种受小世界现象启发的遗传算法.该算法在遗传算法的基本框架下,基于小世界现象搜索机理和网络结构特征构造一种社群结构局部搜索算子,以改善遗传算法的局部搜索能力.本文在介绍模块性指标定义的基础上,指出社群结构探测是典型的组合优化问题,为遗传算法社群结构探测提供理论依据;在构造交叉、变异和局部搜索算子的基础上,探讨带有小世界特征的改进遗传算法的基本流程与实现;通过典型网络的社群结构探测,对比本文提出的小世界特征遗传算法和其它算法的性能,验证其可用性和有效性.

1 模块性与社群结构探测

对于有n个节点的网络G(V,A),其中V= {v1,v2,∃,v n}表示节点(网络成员)集合,邻接矩阵A=(a i,j),i,j=1,2,∃,n,如果节点i与j相连,则a i,j=1,否则a i,j=0.一般认为节点不存在自身连接,所以a i,i=0,i=1,2,∃,n.社群结构探测就是将网络G的节点集合V,通过操作 划分为m个互不重叠的子集,即 (V)={V1,V2,∃,

V m},V i V,V i% ,i=1,2,∃,m,且&

m

i=1

V i=V, V i∋V j= ,i%j,每个子集V i代表一个社群;社群内节点的关系紧密,而社群间节点的关系稀疏.对于邻接矩阵A而言,记A p,q=(a i,j),i(V p,j( V q为社群V p和V q间的关系矩阵.记N=)A)= #n

i=1

#n

j=1

a i,j,因此当p%q时,)A p,q)=#i(V p#j(V q a i,j为子集V p和V q间关系数量,而p=q时,)A p,p)= #

i(V p

#

j(V p

a i,j为子集V P内部关系的数量.社群结构探测没有改变网络本身基本特征,只是对原网络G(V,A)按社群结构探测结果进行重新表达.

N e wm an等定义模块性指标Q来综合考虑网络社群内和社群间的关系[2-3]

Q=#m p=1[e p,p-(#m q=1e p,q)2](1)其中e p,q=

)A p,q)

)A),e p,p=

)A p,p)

)A).

#m

p=1

e p,p反映社群内部节点的连接情况, #m

p=1

(

#m

q=1

e p,q)

2

则体现社群间节点的连接情况. #m

p=1

e p,p越大,#m p=1(#m q=1e p,q)2越小,则Q越大,表明社群内网络密度高而社群间节点的连接少.不同的社群结构划分 (V),可能会产生不同的模块性

117

第1期 陈盈晖等:用于社群结构探测的小世界特征遗传算法

相关文档
最新文档