复杂网络的局部社团结构挖掘算法

第40卷第5期自动化学报Vol.40,No.5 2014年5月ACTA AUTOMATICA SINICA May,2014

复杂网络的局部社团结构挖掘算法

袁超1柴毅1,2

摘要挖掘复杂网络的社团结构对研究复杂系统具有重要的理论和实践意义.其中,相较于全局社团,局部社团的挖掘难度更大,相关文献更少.现有的局部社团挖掘算法大都精度较低、稳定性较差.本文提出了一个有效的局部社团挖掘算法,称为内外夹推法(Shell interception and core expansion,SICE).算法有两个创新之处:1)将节点相似度模型引入到局部社团挖掘算法中(节点相似度模型在局部社团挖掘中较难应用),并提出了“一次一个子图”的社团扩展模式;2)提出了一种“内外夹推”的思想.这两个创新使SICE算法摆脱了缺乏网络全局信息的困扰,并解决了以往算法的一个致命缺陷,从而使算法具有很高的精度和稳定性.通过理论分析和实验比较,证明SICE算法要远好于当前的同类算法,甚至不逊色于性能较好的全局社团挖掘算法.

关键词复杂网络,局部社团,数据挖掘,聚类

引用格式袁超,柴毅.复杂网络的局部社团结构挖掘算法.自动化学报,2014,40(5):921?934

DOI10.3724/SP.J.1004.2014.00921

Method for Local Community Mining in the Complex Networks

YUAN Chao1CHAI Yi1,2

Abstract Community structure detection bears both theoretical and practical signi?cance for the study of complex sys-tems.Generally speaking,the local community detection is relatively a more di?cult problem than the global community detection.So up to now,the related researches are still slow progress.And there are many defects existing in the previous local community detection algorithms,such as low precision and poor stability.In this paper,a local community detection algorithm,which is called shell interception and core expansion(SICE),has been proposed.There are two innovations in this algorithm:1)A node similarity model is introduced into this algorithm,and a community expansion mode“one sub-graph at a time”is proposed;2)An e?ective method which is named“shell interception and core expansion”is proposed. By these two innovations,the SICE algorithm has solved the problem of missing global network information,and avoided a fatal weakness of the previous algorithms.Theoretical analysis and experiments all illustrate that the SICE algorithm has high precision and stability,and it outperforms the previous algorithms.

Key words Complex network,local community structure,data mining,clustering

Citation Yuan Chao,Chai Yi.Method for local community mining in the complex networks.Acta Automatica Sinica, 2014,40(5):921?934

复杂网络分析是当前最重要的多学科交叉研究领域之一[1].社团结构挖掘则是复杂网络研究中的重要内容,对网络的结构特性和动力学特性分析具有重要帮助.此外,社团结构挖掘在许多工程领域中也有重要的应用,如图像分割领域[2?3]、互联网领域[4]等.近年来,不同领域的学者提出了许多有效的社团挖掘算法.如传统的全局社团挖掘算法

收稿日期2013-03-26录用日期2013-08-13

Manuscript received March26,2013;accepted August13,2013国家自然科学基金(61374135)资助

Supported by National Natural Science Foundation of China (61374135)

本文责任编委吕金虎

Recommended by Associate Editor LV Jin-Hu

1.重庆大学自动化学院重庆400044

2.重庆大学输配电装备及系统安全与新技术国家重点实验室重庆400044

1.School of Automation,Chongqing University,Chongqing 400044

2.State Key Laboratory of Power Transmission Equip-ment and System Security and New Technology,Chongqing Uni-versity,Chongqing400044(包括非重叠社团挖掘算法[5?9]和重叠社团挖掘算法[10?11])、演化网络的社团挖掘算法[12?13]以及局部社团挖掘算法[14?18]等.

现实世界中,对于像互联网这样的大规模复杂网络,通常只能获取其局部信息,很难获取其全局信息.这样,许多传统的全局社团挖掘算法就很难在这些网络上应用.另外,许多情况下我们也只需要挖掘某个或者某些节点所属的社团结构,并不需要探测整个网络的社团结构.因此,有必要设计出高效的局部社团挖掘算法.然而,由于只能得到网络的局部信息,局部社团的挖掘难度比全局社团的挖掘难度更大.目前,这方面的典型算法并不是很多.其中,Clauset提出了一个基于R值的局部社团挖掘算法[14].该算法首先定义了一个局部模块度R,然后,采用贪婪算法的思想,迭代地添加使R值增加最大的邻居节点,直到局部社团达到预先定义的规模.其中,局部模块度R值的定义如下:

相关主题
相关文档
最新文档