一种基于完全子图与标签传播的重叠社区检测算法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一种基于完全子图与标签传播的重叠社区检测算法
桂琼;邓锐;程小辉;吕永军
【摘要】提出了一种基于完全子图和标签传播的重叠社区检测CLPOA算法.该算法首先搜寻完全子图,并为每个子图分配唯一标签,实现快速标签预处理;然后根据每个节点的邻接节点标签来更新该节点的标签,同时提出接触频数优化标签选择策略降低标签随机传播概率;最后,通过网络标签分布情况进行社区划分.选取两个小规模标准数据集和两个大规模网络数据集进行实验,结果表明CLPOA算法能保持和COPRA算法相同社区划分质量,同时具有更好的算法稳定性和时间性能.
【期刊名称】《桂林理工大学学报》
【年(卷),期】2018(038)003
【总页数】9页(P561-569)
【关键词】复杂网络;社区发现;完全子图;标签传播
【作者】桂琼;邓锐;程小辉;吕永军
【作者单位】桂林理工大学信息科学与工程学院,广西桂林 541004;桂林理工大学广西嵌入式技术与智能系统重点实验室,广西桂林 541004;武汉理工大学信息工程学院,武汉 430070;桂林理工大学信息科学与工程学院,广西桂林 541004;桂林理工大学信息科学与工程学院,广西桂林 541004;桂林理工大学广西嵌入式技术与智能系统重点实验室,广西桂林 541004;桂林理工大学信息科学与工程学院,广西桂林541004
【正文语种】中文
【中图分类】TP311
0 引言
随着互联网和通信技术迅速发展,网络规模不断扩大,节点间关系越来越复杂,从而形成大量复杂网络。

近年来,复杂网络研究引起众多学者广泛关注,涉及系统科学、统
计物理学、社会科学、生物学等多个领域,大多复杂网络都存在社区结构这一特性[1]。

社区结构是指网络中每个社区内部节点相互连接紧密,而不同社区间节点连接相对稀疏。

社区结构发现能在一定程度上反映出真实网络的拓扑关系,同时可以挖
掘网络中隐藏信息,帮助人们更好地利用和改造网络。

然而,许多复杂网络社区存在
重叠现象,重叠节点同时属于多个社区,重叠社区的出现对社区发现领域提出新的挑战。

目前,许多重叠社区检测算法已被相继提出,大多算法处理无定向、无加权边的不可
分割网络,采用模块度优化、去除高介边、检测密集子图与统计推断等技术,这些算
法在性能和速度上各有优劣。

随着网络数据集的增大,对重叠社区检测算法时间性
能要求越来越严格,算法需要在合理的时间内处理数百万乃至数千万个顶点的网络。

Girvan和Newman作为社区发现领域的奠基人, 在2000年首次提出社区结构的概念, 提出一种社区检测方法, 该方法建立在利用中心指数来寻找社区边界的思想
基础上。

随后,进一步提出了经典的GN算法(Girvan & Newman, GN)[1-2];该算法引入边介数(betweenness)的概念, 采用聚类分析, 将边介数作为节点间连接是否紧密的度量, 依次删除网络中边介数高的边, 并最终将网络划分成若干个社区。

此算法能够完成社区检测的任务, 但在边介数的计算过程中性能损耗太大, 只能应
用在一些中小型规模网络上。

2003年,Palla等[3]提出派系过滤算法(clipue percolate method, CPM), 分析重叠群体相互交织集合的主要统计特征方法, 通过检测网络中派系来实现社区发现。

Newman等[4]提出一种基于贪心的快速社区
发现算法,该算法首次引入模块度的概念, 将网络中的每个顶点视为一个单独的社区, 然后筛选出模块度增值最大的社区, 对其进行合并,当网络中的顶点都被合并到
一个社区中时, 算法终止。

Gregory在2007年提出了基于GN算法进行改进的CONGA算法用来检测重叠社区(cluster-overlap newman girvan algorithm, CONGA)[5]。

不同于文献[2]的模块度和边介数思想,Zhu等[6]在2002年提出了LPA算法(label propagation algorithm, 基于图的半监督学习方法),该算法首次将标签传播技术
运用到社区检测领域当中。

Raghavan等[7]提出了RAK(Raghavan & Albert & Kumara), 该算法基于LPA算法进行了改进, 具有接近线性的时间复杂度, 算法流程简单, 没有参数, 但它与LPA算法一样, 只能用于检测非重叠社区,而且这两种算
法是基于标签传播实现, 由于标签传播过程有较强的随机性, 运行结果存在不稳定。

对此, Gregory[8]在2010年基于RAK算法进行改进,更新原来标签结构,同时优化
了算法的循环结束条件,提出COPRA算法(community overlap propagation algorithm)。

COPRA算法仍采用RAK算法和LPA算法的标签传播思想, 并没有
克服标签传播方法所存在的随机性强, 划分结果不稳定。

因此,许多社区领域专家在标签传播基础上进行了不断探索,提出了许多改进算法,如基于标签传播概率[9]、局部扩展标签[10]、leaderRank多标签[11]、模块度优化[12]等的社区发现算法,这
些算法和研究成果都具有宝贵的科研和参考价值。

基于COPRA算法,本文提出一种基于完全子图和标签传播的重叠社区检测算法(complete subgraph & label propagation overlap algorithm, CLPOA)。

该算法结合完全子图和标签传播等理论,优化初始标签预处理过程,改善标签传播,提高运行的时间效率和稳定性。

1 算法简介
1.1 COPRA算法
COPRA算法基本思想是给出一个算法初始参数v, 它表示一个节点最多可以同时
属于v个社区, 同时规定一个阈值(1/v), 在每一次标签传播的过程中, 所有经过计算更新后的标签都需要与阈值进行比较, 小于阈值的标签将会被丢弃, 从而达到了限
定同时归属社区数量最大为v的目的。

算法中允许一个节点可以同时被赋予多个
标签, 将原来单独的社区标识符c改成了(c, b)的结构, 其中c是社区标识符, b是归属系数, b的值越大, 表示该节点归属于该社区的可能性就越大。

COPRA算法的执行步骤:
①算法初始化, 对任意的节点x分配一个唯一的标签(cx,1)。

②遍历所有节点,根据每个节点的所有邻接节点在上一次迭代中的标签来更新当前
节点的标签
(1)
其中: S(x)表示节点x的邻接节点集合; |S(x)|则表示邻接节点个数; t表示迭代次数。

③比较bt(c, x)与阈值的大小,如果小于阈值,则舍弃该标签。

④ 当网络中的标签传播达到稳定,算法结束。

将具有相同社区标签的节点划分到同一个社区。

因为标签在传播过程中不断被舍弃,标签的数量随着传播的进行也在不断减
少,Gregory由此提出了新的算法终止条件:当网络中社区的个数不再减少,且所有标签个数的最小值在前后两次迭代中没有发生变化时,循环结束。

1.2 CLPOA算法
本文提出的CLPOA算法是一种基于完全子图与标签传播的重叠社区检测算法,采
用新标签预处理方案,通过查找完全子图简化标签预处理过程,提升算法的时间性能,并引入接触频数优化标签选择策略,减少随机选择的概率,提高社区发现结果的稳定
性。

1.2.1 完全子图与新标签预处理方案 COPRA算法在初始阶段给网络中的所有节点分配唯一的标签,此后标签会不断更新,网络规模越大,更新标签所需要的资源消耗就越大。

CLPOA算法的标签预处理方案借鉴CPM算法中提出的派系思想,其核心思想是采用完全子图来代替大量的节点。

社区内部节点间连接密切,边密度高,形成完全子图,而社区与社区之间却几乎不可能形成完全子图。

对于同一个社区,一般每个节点都可以找到同一个社区中的其他点形成一个完全子图[13]。

因此,只需对每个完全子图分配标签,通过找出网络中的完全子图来发现社区。

在无定向、无加权网络中,判定完全子图的主要依据就是两个节点之间最短路径所需要经过的边数,边数越小,这两个节点同属一个完全子图的概率越大。

搜索完全子图的思想:首先依次遍历网络中的所有节点,若节点的度数为0,则将它划分为一个独立的完全子图;如果度数不为0,则继续遍历它的邻接节点,将其所有邻接节点加入进来,形成一个初始完全子图。

假设每条边的长度都为1,那么一个节点和它的所有邻接节点之间的距离都为1。

判断两个已经构成完全子图的节点a和b能与第3个节点c继续构成完全子图的依据是:节点a和b之间存在一条长度为2的路径(距离仅次于最短路径)且节点c就是这条路径上唯一要经过的节点。

综上所述,改进后新标签预处理算法步骤为:
① 遍历网络中的节点,对度数等于0的节点进行标记并单独视为一个完全子图。

对于所有度数不为0的节点,也视为一个完全子图,标记它们的邻接节点并将其加入进去。

② 继续遍历它们的邻接节点,通过不断遍历,将所有满足构成完全子图的新节点标记并加入进来,直到没有符合条件的节点剩余为止。

③ 重复上述步骤继续搜索网络中其他的完全子图,直到网络中所有节点都被标记完毕,结束搜索。

④ 为每个完全子图单独分配唯一的标签。

该算法可以快速对网络中的节点进行一次划分,找出网络中的所有完全子图,从而生成若干个初始社区结构,初始社区结构的形成将简化后续的标签传播步骤,减少算法的迭代过程。

1.2.2 接触频数与标签选择策略 COPRA算法在比较归属系数与算法阈值时丢弃不符合条件标签过程为:在每个传播步骤中,根据式(1)计算出当前所有待选标签的新归属系数后,将它们与阈值进行比较,删除所有归属系数小于阈值的标签。

对于同一个节点,该节点所拥有的所有标签的归属系数和应当等于1,即
(2)
其中,E(x)表示该节点x所拥有的所有社区标识符集合。

由于删除部分标签后,节点所有标签的归属系数和会小于1,要让保留下来的所有标签系数乘以一个常数m,才能使它们的和重新等于1,这样可能会导致问题:在一个顶点的待选标签中,可能所有标签的归属系数全都小于阈值,这意味着,该顶点将在本次迭代后失去所有标签,而这是算法本身所不允许的。

Gregory发现这种特殊情况并在COPRA算法中采用相应的处理方法:当一个顶点所有待选标签的归属系数全都小于阈值时,保留归属系数最大的那个标签,如果存在多个具有相同的最大归属系数且低于阈值的标签,则由算法随机选取其中一个保留。

这种随机选择使算法具有较强的不确定性。

本文定义了接触频数概念,优化CLPOA算法随机选择策略。

接触频数d(c, x)表示标签c被保留作为节点x的标签的累积次数。

d的初始值为0, 从第一次迭代开始, 每次迭代后进行记录, 若标签c被保留作为节点x的标签,则d(c, x)的值加1。

d(c, x)的值越大, 那么可以认为节点x和标签c的联系度越高。

在随机选择执行之前, 首先比较待选标签与当前节点的接触频数成为可行的方法。

由于小规模网络数据集在执行算法时的迭代次数太少, 单纯比较待选标签的接触频数效果不好。

因此, 本文选取的比较策略是计算每个待选标签对当前节点的所有邻接节点的接触频数总和dsum, 然后比较dsum的大小, 最后保留dsum值更大的
那个标签。

(3)
通过比较dsum的值来决定要保留的标签,理论上适应范围更广,降低随机选择策
略执行的概率。

图1是模拟CLPOA算法在一个简单的节点网络中一次完整的标签传播过程(v=2)。

在迭代次数t=3次执行后, 网络中的社区数量没有继续减少, 整个网络被划分成了
两个社区: 社区c和社区e, 两个社区包含的节点个数最小值也没有改变, 故标签传
播终止, 社区划分完成。

其中社区c包含节点a、 b、 c、 d, 社区e包含节点a、
e、 f、 g, 两个社区在节点a处重叠, 节点a同时属于两个社区。

1.2.3 算法描述 CLPOA算法思想:首先,通过搜寻网络中的完全子图实现对节点的快速划分并赋予每个完全子图单独的标签;然后, 开始进行标签传播,循环遍历网
络中的所有节点并更新标签队列,当网络中社区的个数不再减少且所有标签个数的最小值在前后两次迭代中没有发生变化时,结束标签传播步骤;最后,统计网络中
的标签分布情况,具有相同标签的节点被划分到同一个社区,最终得到完整的社区结构。

CLPOA算法描述如图2所示。

图1 CLPOA算法的标签传播过程Fig.1 Label propagation process of CLPOA algorithm
图2 CLPOA算法伪代码Fig.2 Pseudocode of CLPOA algorithm
1.2.4 算法时间复杂度分析设网络中节点数量为n, 边数为m, m/n为节点平均邻
接节点数, d为网络中完全子图数量, CLPOA算法的时间复杂度分析如下。

算法在遍历网络中节点的执行时间为O(n),遍历网络中某一节点中邻接节点, 将所有满足构成该完全子图的新节点标记并加入的平均执行次数为m/n次, 所以
T(n)=m/n+1, 执行时间是O(m/n), 重复遍历网络中节点搜索其他完全子图的执行时间为O(m); 每个完全子图分配唯一标签所需要的次数为d, 执行时间为O(d); 在每一轮迭代中, 网络中节点会更新标签队列, 更新标签的执行时间为O(dm/n)。

由于d的值一般较小, 所以COPLA算法的总的执行时间为
O(n)+O(m/n)+O(m)+O(d)+O(dm/n)=O(m)。

由此可见, n<m, COPLA算法的时间复杂度为O(m); 而由于COPRA算法需要查找社区中节点, 并更新每个标签,其算法时间复杂度为O(vmlog(vm/n)), 其中v为每个节点的最大社区数量。

实验发现两个算法在真实社区网络中都可以实现快速收敛, 由于CLPOA算法提前进行了社区完全子图的划分, 降低了社区节点在进行标签传播时的随机性, 使得社区划分的结果更加稳定和准确。

1.3 社区发现评价标准
本文选取重叠模块度EQ作为社区发现结果的评价标准。

早在2004年,Newman 等[2]就探讨了社区发现标准问题并提出了模块度Q作为社区发现评价标准。

但是后来有一些学者[14-15]指出,模块化的优化有一个根本的缺点,即存在一个分辨率的极限,模块度Q的评价标准无法适应社区重叠的情形。

于是,Shen等在2008年正式提出了EAGLE算法,并首次引入了重叠模块度EQ[16]作为重叠社区的划分评判标准:
(4)
式中, Avw是网络邻接矩阵中元素(本文考虑无定向、无加权网络), 如果在顶点v 和w之间存在一条边, 则Avw取值为1, 否则为0; m是网络中所有边的总数;kv是顶点v的度数; Ov是顶点v所属社区的数量。

EQ的取值范围为0~1, EQ
的值越大,代表划分出来的社区结构越明显,社区质量也更高。

2 实验结果与分析
2.1 标准数据集上实验结果与分析
本文选用的实验测试标准数据集为海豚社区网络数据集(dolphins)和美国大学橄榄球联赛数据集(football)。

海豚社区网络数据集记录了62只海豚的社交关系,网络中的每个节点表示一只海豚,边表示两只海豚之间接触频繁。

美国大学橄榄球联赛数据集来自于2000年秋季的美国大学生橄榄球常规赛阶段的115支球队之间的赛事情况,其中每个节点表示一支球队,节点之间的边表示两支球队的赛事情况,如图3、图4所示。

图3 Dolphins网络Fig.3 Dolphins network
图4 Football网络Fig.4 Football network
随机选取连续的20次实验的对比数据来展示CLPOA算法带来的变化效果。

算法初始参数v预设为2。

实验数据如表1、表2所示。

表1 Dolphins数据集实验数据Table 1 Experimental results on dolphins dataset实验次数社区个数CLPOACOPRA运行时间/msCLPOACOPRAEQ值CLPOACOPRA16712120.390.2523412120.530.233429120.580.8243617110. 870.2853511140.600.386346120.640.317417120.360.828336100.710.42931 6110.790.8210
36690.610.41113210120.790.6812326110.720.741332890.700.8214515110. 450.82156411110.380.38164310100.580.5317319100.530.821833990.850.6 419329100.620.6320317110.610.82
表2 Football数据集实验数据Table 2 Experimental results on football dataset实验次数社区个数CLPOACOPRA运行时间/msCLPOACOPRAEQ值CLPOACOPRA191021290.320.3129732240.320.3139919230.330.314910252
50.320.31591118240.320.31691018240.320.2979919310.330.3189817270.3 20.2999818240.320.3110
101121210.320.311191021220.320.29129918270.320.32139816260.330.301 49923220.320.321591216240.320.301691121250.320.31179817260.320.311 810926240.320.31199918220.320.312010917230.320.31
可见,社区划分的质量与社区个数并非呈线性关系,这是因为即便前后两次划分的社区个数相同,但社区内节点的分布却并非完全一样,标签传播的随机性决定了只有极小的概率会出现两次完全相同的划分结果,而随着网络数据集规模不断扩大,这种概率也越来越低。

图5是CLPOA算法与COPRA算法在实验划分出社区个数上的对比,通过对表1、表2数据进行计算得到:在dolphins数据集中CLPOA算法20次划分社区个数的离散系数为0.281 3,而COPRA的离散系数为0.645 8;而在football数据集中CLPOA算法的离散系数为0.040 0,COPRA的离散系数为0.135 6,离散系数越小数据变化越稳定,故综合来看CLPOA算法的社区划分结果更加稳定。

COPRA算法的结果波动幅度较大,峰值与最小值存在较大差距,算法不稳定。

而CLPOA算法波动幅度明显较小,在50%以上的时间段内都保持平稳状态,证明了CLPOA算法的稳定性更好。

图6为两个算法的运行时间对比。

可以看到, CLPOA算法的运行时间函数线几乎一直保持在COPRA算法的运行时间函数线下, 节省大约20%~30%的时间开销,可见CLPOA算法比COPRA算法在时间性能有提高。

图5 Dolphins(a)与football数据集(b)社区划分稳定性对比Fig.5 Community division stability comparison of algorithms on dolphins dataset(a) and football dataset(b)
图6 Dolphins(a)与football数据集(b)算法运行时间对比Fig.6 Time efficiency
comparison of algorithms on dolphins dataset(a) and football dataset(b) 图7 Dolphins(a)与football数据集(b)社区划分质量EQ对比Fig.7 EQ value comparison of algorithms on dolphins dataset(a)and football dataset(b) 比较两个算法在20次实验中的的社区划分质量(图7)。

在海豚(dolphins)社区网络数据集的实验中,CLPOA算法与COPRA算法的EQ值差距不大,函数图像交错密集,可以看出两个算法的社区划分质量几乎一致。

而在美国橄榄球联赛(footbau)数据集的实验结果中,可以看出CLPOA算法的EQ值优于COPRA算法。

2.2 大规模网络数据集上实验结果与分析
为了进一步测试CLPOA算法在大规模数据集上的运行效果,增加实验结果的可信度,选取两个大规模网络数据集对两个算法进一步进行对比实验,以测试CLPOA算法在处理大规模复杂网络时是否具备同样良好的稳定性和时间性能。

这两个数据集分别是包含有10 680个节点、24 430条边的PGP信任网络和拥有27 519个节点、116 181条边的cond-mat-2003社区网络,已被多位研究者选用作为大型网络社区发现算法的测试平台。

本文随机选取了连续20次实验结果进行记录,得到的结果见表3和表4。

表3 PGP网络数据集实验数据Table 3 Experimental results on PGP dataset实验次数社区个数CLPOACOPRA运行时间/sCLPOACOPRAEQ值CLPOACOPRA123725914.015.80.430.45225926214.516.60.440.4632592591 2.817.20.430.42425925913.314.30.440.43525923614.216.00.440.466259236 14.415.10.430.46725924114.815.50.440.40825925915.014.90.440.41925925 913.918.30.440.4310
23028914.516.00.440.431125928915.017.70.420.401225925912.914.40.430. 451327726216.214.80.430.451425924314.118.10.440.421525925915.617.90 .440.461625925915.216.20.440.451723026214.314.60.440.391825926214.8
18.20.430.431925926515.014.50.440.402025925914.115.00.420.45
表4 cond-mat-2003数据集实验数据Table 4 Experimental results on cond-mat-2003 dataset实验次数社区个数CLPOACOPRA运行时间
/sCLPOACOPRAEQ值CLPOACOPRA11 8081 86668.265.50.680.6921 7591 85164.070.20.680.6731 7811 75954.664.30.680.6941 7591
95168.379.10.680.6851 7591 75958.573.20.680.6561 7591
66353.558.80.680.6971 7591 75956.861.30.680.6981 8081
85150.964.60.680.6991 7591 75960.161.80.680.6410 1 7591
75965.569.60.670.66111 6771 85160.759.00.670.67121 7591
75961.267.20.680.69131 7591 75954.781.10.680.69141 7871
75961.561.90.670.67151 7591 75957.468.20.680.62161 8081
75956.267.60.660.70171 7591 75966.169.00.670.66181 7591
75958.077.10.670.67191 7591 85160.773.00.670.70201 7591
75969.065.50.680.69
在PGP信任网络中运行CLPOA算法20次社区划分结果的离散系数是0.043 0, COPRA算法的离散系数是0.052 5。

在cond-mat-2003数据集中CLPOA算法的离散系数仅有0.015 7, 而COPRA算法达到了0.035 2。

在PGP信任网络中CLPOA算法的平均运行时间和EQ平均值分别为14.43 s和0.43,而在cond-mat-2003数据集中分别为60.29 s和0.68; COPRA在PGP中算法平均运行时间和EQ平均值分别为16.06 s和0.43, 在cond-mat-2003数据集中分别为67.89 s和0.69。

通过以上的数据对比与分析可以很直观地得出CLPOA算法的时间性能比COPRA算法更好,两者的社区划分质量几乎一致。

从图8可看出, CLPOA算法和COPRA算法在PGP信任网络和cond-mat-2003社区网络上运行结果依然保持良好的社区划分质量。

PGP信任网络中,两个算法对
于社区个数的划分都较为理想,但CLPOA算法对于社区划分个数则更为稳定。

cond-mat-2003社区网络中,COPRA算法的社区划分个数最大振幅达到了近200个社区数量的差值,而CLPOA算法的最大振幅未超过100个社区数量。

根据图9时间效率的对比也能看出CLPOA算法的运行时间整体更优于COPRA算法。

在EQ值对比图10中同样可以得出两个算法的社区划分质量整体差异不大。

图8 PGP(a)与cond-mat-2003数据集(b)社区划分稳定性对比Fig.8 Community division stability comparison of algorithms on PGP dataset(a)and cond-mat-2003 dataset(b)
图9 PGP(a)与cond-mat-2003数据集(b)算法运行时间对比Fig.9 Time efficiency comparison of algorithms on PGP dataset(a)and cond-mat-2003 dataset(b)
综上所述, CLPOA算法比COPRA算法更加稳定,算法运行的时间效率也更好, 同时在社区划分质量上, CLPOA算法和COPRA算法也几乎保持一致。

图10 PGP(a)与cond-mat-2003数据集(b)社区划分质量EQ对比Fig.10 EQ value comparison of algorithms on PGP dataset(a) cond-mat-2003 dataset(b)
3 结束语
本文提出了基于完全子图和标签传播的重叠社区检测CLPOA算法。

利用完全子图与社区相似性,改进COPRA算法的标签预处理过程,并且通过搜寻完全子图快速生成初始社区结构,降低后续处理的开销,提升算法的时间性能。

另外,用提出的接触频数概念来判定节点与标签的关联度,在标签选择的过程中优化标签选择策略。

实验结果表明,CLPOA算法具有和COPRA算法同样良好的社区划分质量,同时具有比COPRA算法更好的算法稳定性和时间性能。

参考文献:
【相关文献】
[1]Girvan M, Newman M E J. Community structure in social and biological networks[J]. P Natl Acad Sci USA,2002,99(12):7821-7826.
[2]Newman M E J, Girvan M. Finding and evaluating community structure in networks[J]. Physical Review E, 2004,69(2):026113.
[3]Palla G, Derényi I, Farkas I, et al. Uncovering the overlapping community structure of complex networks in nature and society[J]. Nature, 2005,435:814.
[4]Newman M E J. Fast algorithm for detecting community structure in networks[J]. Physical Review E Statistical Nonlinear & Soft Matter Physics, 2003,69(6Pt2):066133. [5]Gregory S. Finding Overlapping Communities Using Disjoint Community Detection Algorithms[M]//Complex Networks. Springer, Berlin, Heidelberg, 2009:47-61.
[6]Zhu X J, Ghahramani Z. Learning from Labeled and Unlabeled Data. Lecture Notes in Computer Science. 2002,3175(2004):237-244.
[7]Raghavan U N, Albert R, Kumara S. Near linear time algorithm to detect community structures in large-scale networks[J]. Physical Review E,2007,76(3):036106.
[8]Gregory S. Finding overlapping communities in networks by label propagation[J]. New Journal of Physics, 2009,12(10):2011-2024.
[9]刘世超, 朱福喜, 甘琳. 基于标签传播概率的重叠社区发现算法[J]. 计算机学报, 2016, 39(4):717-729.
[10]李有红,战荫伟,王学军,等.局部扩展的标签传播蚁群优化重叠社区发现[J].计算机应用研
究,2018(7):2071-2074.
[11]龚宇,张智,顾进广.基于LeaderRank的标签传播社区发现算法[J].计算机应
用,2015,35(6):1738-1741,1746.
[12]李磊,倪林.基于模块度优化的标签传播社区发现算法[J].计算机系统应用,2016,25(9):212-215.
[13]骆挺,钟才明,陈辉.基于完全子图的社区发现算法[J].计算机工程,2011,37(18):41-43.
[14]Fortunato S, Barthélemy M. Resolution limit in community detection[J]. Proceedings of the National Academy of Sciences of the United States of America, 2006, 104(1):36. [15]Kumpula J M,Saramäki J,Kaski K,et al.Limited resolution in complex network community detection with Potts model approach[J].European Physical Journal
B,2007,56(1):41-45.
[16]Shen H W, Cheng X Q, Cai K, et al. Detect overlapping and hierarchical community structure in networks[J]. Physica A Statistical Mechanics & Its Applications, 2008,
388(8):1706-1712.
[17]Zhang Z, Gong Y, Wang K D,et al.A survey of overlapping community detection based on multi-label propagation[C]// IEEE Conference on Industrial Electronics and Applications (ICIEA),2017:995-999.
[18]Liu G S, Meng K, Guo H Y,et al.Automatic Threshold Calculation Based Label Propagation Algorithm for Overlapping Community[J]. IEEE First International Conference on Data Science in Cyberspace (DSC),2016:382-287.
[19]Qiao Y C, Wang H X, Wang D S.Parallelizing and optimizing overlapping community detection with speaker-listener Label Propagation Algorithm on multi-core architecture[C]// IEEE 2nd International Conference on Cloud Computing and Big Data Analysis (ICCCBDA), 2017:439-443.
[20]Chen N Y, Liu Y ,Chen H Q,et al.Detecting communities in social networks using label propagation with information entropy[J].PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS,2017,471:788-798.
[21]Sattari M, Zamanifar K.A spreading activation-based label propagation algorithm for overlapping community detection in dynamic social networks[J].DATA & KNOWLEDGE ENGINEERING,2018,113:155-170.。

相关文档
最新文档