基于连边相似度的重叠社区发现算法研究

合集下载

基于节点相似度的社团发现算法研究

基于节点相似度的社团发现算法研究

基于节点相似度的社团发现算法研究张若昕;柴丹炜;熊小峰;刘建生;乐光学【期刊名称】《电脑知识与技术》【年(卷),期】2015(000)008【摘要】Community detection is one of the effective methods for analyzing the structure of complex network. In this paper, the node similarity and topology of network is analyzed, a new community detection algorithm in complex network based on node simi⁃larity is proposed. The modularity density and normalized mutual information are chosen to be the evaluation parameters to detect the community structure. Experimental results on both artificial network and real world networks show the algorithm can detect the structure of community complex networks.%社团发现算法是分析研究复杂网络结构的有效方法之一,针对该问题,在分析节点相似度和网络拓扑结构的基础上,提出了一种基于节点相似度复杂网络社团发现算法,算法以模块密度函数和标准互信息作为社团的评价参数对复杂网络实施有效划分。

人工网络和真实网络上的实验结果表明,算法能够准确的发现复杂网络中的社区结构。

【总页数】3页(P42-44)【作者】张若昕;柴丹炜;熊小峰;刘建生;乐光学【作者单位】江西理工大学理学院,江西赣州341000; 嘉兴学院数理与信息工程学院,浙江嘉兴314000;江西理工大学理学院,江西赣州341000; 嘉兴学院数理与信息工程学院,浙江嘉兴314000;江西理工大学理学院,江西赣州341000;江西理工大学理学院,江西赣州341000;江西理工大学理学院,江西赣州341000; 嘉兴学院数理与信息工程学院,浙江嘉兴314000【正文语种】中文【中图分类】TP311【相关文献】1.基于节点相似度的容错网格作业调度算法研究 [J], 叶建伟;方滨兴;田志宏;张宏莉2.基于节点相似度的社团发现算法 [J], 程泽凯;张佳玉3.基于节点相似度的网络社团检测算法研究 [J], 姜雅文;贾彩燕;于剑4.一种基于Jaccard相似度的社团发现方法 [J], 孙宇;5.基于节点间影响力的重叠社团发现算法 [J], 王夏夏;李玲娟因版权原因,仅展示原文概要,查看原文内容请购买。

基于节点重要性与相似性的重叠社区发现算法

基于节点重要性与相似性的重叠社区发现算法

基于节点重要性与相似性的重叠社区发现算法
付饶;孟凡荣;邢艳
【期刊名称】《计算机工程》
【年(卷),期】2018(044)009
【摘要】在复杂网络中进行重叠社区发现时,现有模糊C均值算法(FCM)采用随机策略导致社区划分结果不一致.为此,提出一种新的重叠社区发现算法.引入节点重要性来量化复杂网络中节点的重要程度,根据节点重要性排序和节点间最短路径选取若干核心节点作为FCM初始的聚类中心节点,从而提高FCM的不稳定性.利用基于s-跳最短路径的节点相似度量方法得到信息更丰富的相似矩阵,以提高算法的准确率.采用谱聚类对相似矩阵处理得到节点的隶属度矩阵,并依据阈值分配各节点的社区归属.实验结果表明,该算法能够得到唯一的社区划分结果,且在Karate、Dolphins数据集上的NMI指标比GCE、INFOMAP和GOPRA等算法高8%以上.
【总页数】7页(P192-198)
【作者】付饶;孟凡荣;邢艳
【作者单位】中国矿业大学计算机科学与技术学院,江苏徐州221116;中国矿业大学计算机科学与技术学院,江苏徐州221116;中国矿业大学计算机科学与技术学院,江苏徐州221116
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.一种基于局部相似性的社区发现算法 [J], 吴钟刚;吕钊
2.基于Node2Vec的重叠社区发现算法 [J], 陈卓;姜鹏;袁玺明
3.基于节点重要性和局部扩展的重叠社区发现算法 [J], 郭峰;尤凯丽;李昕泽
4.基于SLPA优化的重叠社区发现算法 [J], 陈界全;王占全;李真;汤敏伟
5.基于节点重要性与相似性的标签传播算法 [J], 林天森;孙飞翔
因版权原因,仅展示原文概要,查看原文内容请购买。

基于相似度聚类的二分网络社区发现算法

基于相似度聚类的二分网络社区发现算法

基于相似度聚类的二分网络社区发现算法张晓琴;刘莉楠【摘要】针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity' clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果.【期刊名称】《云南民族大学学报(自然科学版)》【年(卷),期】2018(027)004【总页数】8页(P307-314)【关键词】二分网络;社区发现;相似度;归一化互信息;模块度【作者】张晓琴;刘莉楠【作者单位】山西大学数学科学学院,山西太原030006;山西大学数学科学学院,山西太原030006【正文语种】中文【中图分类】TP393随着Internet和移动通信技术应用的迅速发展,复杂系统已经在多个领域中被应用. 事实上,真实世界中存在的大量复杂系统都可以利用网络来刻画. 网络[1]是由许多节点与连接2个节点之间的一些边组成,其中节点用来代表真实系统中不同的个体,而边则用来表示个体间的关系,如果2个节点之间具有某种特定的关系则连边,反之则不连边.目前社区发现[2]是研究复杂网络的热门之一. 社区发现是将网络划分为若干子网络,在这些子网络内部节点联系紧密,子网络之间联系相对稀疏. 社区发现能够帮助人们深入理解网络的拓扑结构,发现隐含的信息等.单模网络[3]和二分网络分别作为复杂网络的一种普遍而且重要的表现形式. 在现实社会中许多网络都呈现出二分结构,例如:科学家-论文合作网络[4-5],俱乐部会员-活动网络[6],电影-演员合作网络[7],疾病-基因网络[8],P2P中终端计算-交互数据网络[9]等等.近年来对二分网络社区发现的研究,一方面是将二分网络投影成单模网络,用单模网络已有的结论来研究二分网络,这样做的确是十分方便,但会造成大量的数据缺失,无法展现出二分网络一些内在性质,会使得最后划分的社区效果不好. 另一方面是直接对二分网络进行研究,Guimera等[10]设计了二分模块度,提出了每次只针对一种类型顶点划分算法. Barber[11]拓展了Newman[12]的单模网络模块度,重新定义了二分模块度,并提出最大化二分模块度的BRIM算法. Raghavan等[13]提出了标号传播的方法(LPA)来进行社区发现. Wu等[14]在Zhou[15]提出资源分配的基础上,提出了一种基于资源分布矩阵的二分网络社区发现方法,该方法经二分网络的邻接矩阵提出了资源分布矩阵,用模糊聚类的方法进行聚类,最后利用F统计量来得到最优的社区发现结果. Zhang等[16]给出了边集聚系数的二分网络社区发现算法,计算网络中的每一条边的集聚系数,从小到大排列依次去掉,直到计算出的模块度小于上一次计算的模块度时停止.随着对二分网络社区发现算法不断深入的研究,现有的算法仍然有很多不足之处需要改进. 例如:需要提前预知社区个数和参数取值如何确定等问题,为此提出了相似度聚类的二分网络社区发现算法.1 相关知识1.1 二分网络的基本概念1.1.1 二分网络二分网络包含两种不同类型的节点,同类型节点之间没有连边,不同类型的节点之间才有连边. 图1给出了一个比较简单的二分网络示意图.1.1.2 二分网络符号表示二分网络[17]可以用图论中二部图G(U,V,E)来表示,其中U和V分别表示2种不同类型的节点集合,E为G边的集合. 在节点集合U(或V)内部不存在连边,对E中所有的边(ui,vj)有ui∈U,vj∈V.假设U类节点有m个,V类节点有n个,则二分网络的邻接矩阵可表示为:(1)其中0m×m与0n×n分别是m阶和n阶的零矩阵,Am×n=(aij)m×n,且若U类节点ui与V类节点vj有连边则aij=1,否则aij=0. 由于二分网络邻接矩阵A0是对称矩阵,因此通常用Am×n来表示二分网络,称为关系矩阵,Am×n的每行代表U类一个节点连边情况,每列代表V类一个节点连边情况.1.2 二分网络社区划分评价指标1.2.1 归一化互信息设X和Y分别是二分网络两种不同的社区结构,归一化互信息[18](normalized mutual information,NMI)计算公式为:(2)其中x是X的社区个数,y是Y的社区个数,N是二分网络中所有节点的总数,xi是指X的第i个社区,yj是指Y的第j个社区,Nxi是xi中的节点个数,Nyj是yj中的节点个数,Nxiyj是xi和yj中公共节点的个数. NMI的值越大就表示算法得到的网络社区结构与标准状况下越匹配,社区发现的结果越好.1.2.2 模块度Barber在单模网络的基础上给出了二分网络的模块度,其计算公式如下:(3)其中m表示U类节点个数; n表示V类节点个数; M表示网络的总边数.表示节点ui和节点vj间随机连边概率的期望值,kui表示节点ui的度,kvj表示节点的度,2 相似度聚类算法2.1 相关定义定义1 如果二分网络G(U,V,E)中U类节点ui满足条件:N(ui)={vj|vj∈V,(ui,vj)∈E},(4)那么将vj称为ui的邻居节点[19],N(ui)称为ui的邻居节点集合.定义2 给定任意的二分网络G(U,V,E),U类节点ui和节点uj的相似度定义为:(5)其中kui与kuj分别是节点ui与节点uj的度.节点的度是指与该节点连接的边的数将相似度进行标准化定义为:(6)相似度标准化是为了使得取值范围在[0,1]之间. 相似度越大,说明ui和uj联系越紧密,越有可能被划分到同一个社区.定义3 如果G(Us,Vs,Es),Us⊂U,Vs⊂V,对于任意的节点ui⊂Us,vj⊂Vs都满足(ui,vj)∈Es⊂E,则称G(Us,Vs,Es)是G(U,V,E)的一个子网络.定义4 将二分网络划分成若干子网络,若子网络内部节点连边紧密,子网络间连边稀疏,那么就称子网络为社区.定义5 给定任意的二分网络G(U,V,E),V类节点vj划分到子网络Gs中的交互度[20](interaction degree,IND)定义:(7)其中s是Gs中包含两类节点对应的标号,As是Gs关系矩阵,s′=s∪j,|Us|是集合Us 内节点个数,表示Gs中所包含的V类节点个数.定义6 α-邻域:给定二分网络G(U,V,E),对于ui∈U,其α-邻域为U类节点中与节点ui通过公式(5),(6)计算之后的相似度不小于参数α的节点,即Nα(ui)={uj∈N(ui)|S(ui,uj)≥α}.定义7 若节点ui的α-邻域中至少包含t个节点,即|Nα(ui)|≥t,那么称节点ui为核心节点.2.2 算法设计相似度聚类算法(similarity clustering algorithm,简称SCA)是将α-邻域近邻指派算法进行了改进推广到二分网络进行社区发现的一种算法. 具体思想是:根据给定的参数α和t找出U类节点中所有的核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点利用交互度分配到已有的U类节点相似度聚类后的社区中,这样就得到了完整的社区发现结果.SCA算法如下:步骤1 确定核心节点集O输入G(U,V,E),α,t输出核心节点集OStep 1 ∀ui,uj∈U,根据公式(4),(5),(6),计算S(ui,uj);Step 2 求出每一个节点所有的α-邻域Nα(ui),若Nα(ui)中所含节点的个数不小于t,那么ui就是所要选取的核心节点;Step 3 重复Step 2, 直到遍历完所有的U类节点,从而得到核心节点集O.步骤2 相似度聚类划分U类节点得到社区输入G(U,V,E),核心节点集O输出U类节点划分后的社区C1,C2,…Ck初始化社区个数:k=0;初始化未访问的节点集合:Ω=Uwhile O非空 do从O中随机选取一个核心节点记为o,o在Ω中的α-邻域所含节点集合记为Q Ω=Ω\{o}For Q中的每一个节点qIf |Nα(q)|≥tΛ=q∪oEnd ifEnd forIf |Λ|≥2k=k+1,生成聚类后的社区Ck=Λ;Ω=Ω\Ck,O=O\Ck;ElseΛ中的节点放入集合A中; Ω=Ω\Λ,O=O\Λ;End ifEnd whileIf Ω∪A非空集For each bi∈Ω∪A计算N(bi)分别与社区{C1,…,Ck}中所含节点的连边数If 存在连边数>0bi加入到连边数最多的社区中,并且更新当前的社区;Elsek=k+1,bi为孤立点,单独放入一个社区记为CkEnd ifEnd forEnd if步骤3 V类节点划分到已有的U类节点的社区中输入G(U,V,E),C1,C2,…Ck输出最终聚类社区G1,G2,…,Gk对于∀vj∈V,令将vj加入到Cq,更新为Gq; If q≥2先不加入任何一个Cq,将其余节点加入后,通过公式(7)计算交互度,选择将节点vj加入社区Gp.2.3 算法的时间复杂度U类节点两两之间求相似度,那么所需计算的时间复杂度为确定核心节点集的时间复杂度为划分U类节点得到社区计算时间复杂度是O(m),社区数目为k,最后将V 节点划分到已有的U类节点的社区中时间复杂度是O(2nk),所以SCA算法的时间复杂度为3 实验分析为了测试算法的有效性和可行性,将算法运用到8个人工数据和1个真实数据上进行社区发现的实验,并且对SCA算法的参数α和t进行实验分析.3.1 人工二分网络人工二分网络见图2,由计算机模拟生成128个节点构成,将这128个节点平均分成不同的两类,每种类型节点各有64个节点,把二分网络平均分成4个社区,每个社区所包含的节点数目是32个,其中每一种类型的节点数目是16个. 该网络中每一个节点的度k都是16,k=kin+kout,其中kin是该节点在所属的社区的连边数目,kout 是该节点在不所属的社区连边数目.实验选取BRIM算法,基于资源分布矩阵算法和基于边集聚系数算法与SCA算法进行对比. 因为人工二分网络社区划分的结构已知,所以分别计算这4种算法在kout=0,1,…,7下的社区划分结果与实际社区结果的NMI值,结果见图3. 从图3中可以清晰地看到,SCA算法明显比其他3种算法划分社区正确率要高. 当kout≤2时,社区结构比较明显,SCA算法准确性一直是1. 除了边集聚系数算法之外,另外的2种算法划分正确率也都比较高. 伴随着kout值的不断增大,当kout≥3时,4种算法划分社区的正确率不断降低,这是因为社区内部节点连边数不断减少,而社区之间连边数不断增大,使得社区结构越来越模糊,但SCA算法还是比其他算法具有更高的划分正确率,说明SCA算法划分结构更加接近于真实网络.3.2 真实网络为了验证SCA算法的准确性,对Southern Women Data数据集进行实验. 选择模块度Q作为评价指标来评价划分社区的好坏.Southern Women Data是在对二分网络研究中比较经典的真实网络. 见图4,数据集是由18位妇女和14种活动构成的二分网络,其中圆形表示妇女,正方形表示活动,假设其中的某个妇女参加14类活动中的某一个活动,那么就连边,否则不连边. 见图5,SCA算法把该网络划分为2个社区:{妇女1~9;活动1~8}和{妇女10~18;活动9~14}. 划分后计算出的模块度Q=0.333 2.将本文算法与上述6种算法分别在Southern Women Data数据集上进行社区划分,并计算出对应的最大模块度值,图6展示了不同算法之间通过计算模块度值进行对比,从图中可以清晰地看到,本文算法的模块度值明显高于其余6种算法,BRIM算法必须提前设定社区个数,而本文算法在不需要提前预知所要划分的社区个数时还获得较高的模块度值. 本文算法比LPA算法,基于资源分布算法,基于边集聚系数算法和Davis2提出的算法划分效果要好. 本文算法与Davis1提出的算法关于妇女的划分结果相同,而本文算法所获得的模块度值比Davis1的高,说明本文算法划分效果越好.综上所述,本文算法在不需要提前预知社区个数的前提下,得到了较高的模块度值,具有比较好的划分效果.3.3 参数取值SCA算法中包含两个参数:α和t. 为了了解各参数对SCA产生的影响,在Southern Women Data数据集上通过控制参数,来获得SCA算法随参数变化的模块度值.参数α控制SCA算法挖掘核心节点的数量,若α过大,获得的核心节点数量少,导致一些节点无法划分到社区中; 若α过小,则相反,所以在图7的(a),(b),(c),(d),(e)中分别给出了在控制t不变的情况下,当参数α在取值区间为[0.2,0.7]时所对应的模块度值.(f)图是将(a),(b),(c),(d),(e)合并到一张图中,从(f)图中可以清楚地看到,不管参数t取何值,当参数α取值范围在[0.4,0.5]之间时,模块度的取值最大,说明当α∈[0.4,0.5]时,社区的划分质量最好.之后又在控制α不变的情况下研究了参数t的取值区间在[2,6]时所对应的模块度值,见图8.(a),(b),(c),(d),(e),(f)图中分别给出了在控制参数α不变的情况下,当参数t=2,3,4,5,6时所对应的模块度值,除了图(a)和图(b),其余的图(c),(d),(e),(f)都是随着参数t取值的不断增大,对应的模块度值呈现出了先增大后又减小的趋势. 图(g)是将图(a),(b),(c),(d),(e),(f)合并到一张图中,从图(g)中可以看到,不管参数α取何值,当参数t=4或者5时所对应的模块度值最大,说明当t=4或者5时,社区的划分质量最优.4 结语二分网络进行社区发现是目前研究的热点.基于相似度聚类的二分网络社区发现算法(SCA),首先获得对U类节点进行聚类后的社区,然后通过计算交互度把V类节点划分到已有的社区中从而得到完整的社区划分结构. 实验结果表明,该算法不需要提前预知所划分的社区数目,可以获得比较好的划分效果,发现更为真实的社区结构,从而可以在复杂网络中实现“物以类聚,人以群分”.参考文献:【相关文献】[1] NEWMAN M E J. The structure and function of complex networks[J]. SIAM Review,2003 ,45(2):167-256.[2] NEWMAN M E J. Detecting community structure in networks[J]. The European Physical Journal B,2004,38(2):321-330.[3] YAN B,GREGORY S. Finding missing edges in networks based on their community struc -ture[J]. Physical Review E,2012,85(5):056112.[4] NEWMAN M E J. Scientific collaboration networks. I. Network construction and fundam ental results[J]. Physical Review E,2001,64(1):016131.[5] NEWMAN M E J. Scientific collaboration networks. II. Shortest paths,weighted network s,and centrality[J]. Physical Review E,2001,64(1):016132.[6] ERGÜN G. Human sexual contact network as a bipartite graph[J]. Physica A:Statistical Me-chanics and its Applications,2002,308(1-4):483-488.[7] LIU A F,FU C H,ZHANG Z,et al. An empirical statistical investigation on Chinese mainland movie network[J]. Complex Systems and Complexity Science,2007,4(3):10-16.[8] CHEN W Q,LU J A,LIANG J. Research in disease-gene network based on bipartite network projection[J]. Complex Systems and Complexity Science,2009,6(1):13-19.[9] LE BLOND S,GUILLAUME J L,LATAPY M. Clustering in p2p exchanges and conse-quences on performances[C]// International Workshop on Peer-to-Peer Systems. Springer,Berlin,Heidelberg,2005:193-204.[10] GUIMERA R,SALES-PARDO M,AMARAL L A N. Module identification in bipartite and di-rected networks[J]. Physical Review E,2007,76(3):036102.[11] BARBER M J. Modularity and community detection in bipartite networks[J]. Physical R eview E,2007,76(6):066102.[12] NEWMAN M E J. Modularity and community structure in networks[J]. Proceedings of the national academy of sciences,2006,103(23):8577-8582.[13] RAGHAVAN U N,ALBERT R,KUMARA S. Near linear time algorithm to detect commu-nity structures in large-scale networks[J]. Physical Review E,2007,76(3):036106.[14] 吴亚晶,狄增如,樊瑛. 基于资源分布矩阵的二分网聚类方法[J]. 北京师范大学学报(自然科学版),2010,46(5):643-646.[15] ZHOU T,REN J,MEDO M,et al. Bipartite network projection and personal recommenda -tion[J]. Physical Review E,2007,76(4):046115.[16] ZHANG P,WANG J,LI X,et al. Clustering coefficient and community structure of biparti te networks[J]. Physica A:Statistical Mechanics and Its Applications,2008,387(27):6869-6875.[17] XU Y,CHEN L,LI B. Density-based modularity for evaluating community structure in bi-partite networks[J]. Information Sciences,2015,317:278-294.[18] DANON L,DIAZ-GUILERA A,DUCH J,et al. Comparing community structure identifica-tion[J]. Journal of Statistical Mechanics:Theory and Experiment,2005,2005(09):P09008. [19] WANG X,QIN X. Asymmetric intimacy and algorithm for detecting communities in bip artite networks[J]. Physica A:Statistical Mechanics and Its Applications,2016,462:569-578.[20] 郭改改,钱宇华,张晓琴,等. 自主确定社区个数的二模网络社区发现算法[J]. 模式识别与人工智能,2015,28(11):969-975.。

基于边图的线性流重叠社区发现算法

基于边图的线性流重叠社区发现算法

基于边图的线性流重叠社区发现算法王斌;李强;盛津芳;孙泽军【摘要】重叠网络的社区发现是复杂网络研究中的重要问题.为了提高网络中重叠社区发现的时间效率,提出一种基于边图的线性流重叠社区发现算法LBSA.算法首先对于边图网络中的边进行随机的依次处理,完成节点的初步社区划分,再将其中重叠小社区合并到相似度最大的其他大社区中得到最终的社区.通过以上步骤,算法能够以接近线性的时间复杂度得到网络的重叠结构.从最终的实验结果来看,与其他算法相比,该算法能够在更短的时间有质量地发现网络中的重叠社区.【期刊名称】《计算机工程与应用》【年(卷),期】2019(055)002【总页数】7页(P60-66)【关键词】流式图;重叠社区发现;边聚类系数;边图;社区相似度【作者】王斌;李强;盛津芳;孙泽军【作者单位】中南大学信息科学与工程学院,长沙 410083;中南大学信息科学与工程学院,长沙 410083;中南大学信息科学与工程学院,长沙 410083;中南大学信息科学与工程学院,长沙 410083【正文语种】中文【中图分类】TP3911 引言在生物学,社会学以及网络分析等领域中,各复杂系统都可以抽象成为复杂网络[1-3]。

近些年对复杂网络研究中发现,它们普遍存在有稠密的节点聚集,也就是社区结构。

网络中的社区并没有严格的定义,一般认为社区内部节点连接更紧密,社区间节点连接更稀疏。

网络中的社区的发现,不仅对了解网络结构,分析网络特征,挖掘网络信息具有重要意义[4],而且具有广泛的应用前景[5]。

社区发现研究已经成为现代网络科学中最热门的课题之一[6]。

在传统的社区发现中,大多数研究关注于每个节点属于一个社区,而随着对更多网络如“Family”,“Foot-ball”等的研究过程中发现,每个节点可能属于多个社区,也就是网络中的社区存在有重叠结构。

目前提出了许多具有代表性的重叠社区发现算法,如基于节点的派系过滤算法(Clique Percolation Method,CPM)算法[7-9],通过定义派系k先发现网络中的全耦合网络,再将多个相互连通的小全耦合网络构成更大社团,该算法适合用于连接稠密的网络,但因需提前定义派系大小,并不适合用于现实网络中;基于边划分[10-12]的重叠社区发现算法,将原始网络转换为边图,原始网络中的边作为转换后边图中的节点,基于边图的社区划分使其边上的节点也划分到相应的社区,因每个节点有多条边,重叠的社区结构就可以被发现出来,但这类算法对于不同密度网络表现不同,同时这类算法会产生许多重叠小社区碎片;基于动力学的算法通过动态的过程发现网络中的社区结构,如基于标签传播的算法[13-14],基于同步的方法[15-16],基于距离动力学的方法[5]等,这类算法一般在不同的网络中都有较好的划分结果,但因为动态迭代过程其时间复杂度普遍较高。

基于节点重要性与相似性的重叠社区发现算法

基于节点重要性与相似性的重叠社区发现算法
第 !! 卷"第 # 期 " !"#$!!" %"$# "
人工智能及识别技术
计算机工程 ""
&"'()*+,-./0.++,0./
$%&' 年 # 月 1+(*+'2+,$%&'
文 章 编 号 !"""#$%&'&"!'"(#"!(&#"O) ) ) 文 献 标 志 码 *) ) ) 中 图 分 类 号 +,$"!-.
中文引用格式付"饶&孟凡荣&邢 " 艳$基 于 节 点 重 要 性 与 相 似 性 的 重 叠 社 区 发 现 算 法 ( 9) $计 算 机 工 程&$%&'& !!!#" *&#$6&#'$ 英文引用格式 QG I?"& 3-%4 Q?.,"./& UF%4 <?.$@C+,#?((0./ 8"'').0*> B0H8"C+,> ?#/",0*=' 2?H+B ". ."B+ 0'(",*?.8+?.B H0'0#?,0*>( 9) $&"'()*+,-./0.++,0./&$%&'&!!!#" *&#$6&#'$

基于节点相似度的网络社区发现算法

基于节点相似度的网络社区发现算法

基于节点相似度的网络社区发现算法
徐熊飞
【期刊名称】《电脑编程技巧与维护》
【年(卷),期】2024()2
【摘要】现实生活和自然界系统中都存在着各种各样的联系,这些系统都可以类比为不同的复杂网络,近年来,由于技术的快速发展,社区结构作为复杂网络重要的拓扑性质,被广泛应用于推荐系统、智能广告、定向市场营销、公共卫生系统等,具有强烈的现实意义,引起了国内外大量学者的广泛研究,由此产生了大量社区发现算法。

基于节点离心率定义新的节点相似度,针对现有大多数社区发现算法划分社区的质量较低、社区数量较多的问题,改进了一种基于节点相似度的社区发现算法,该方法用于未加权的网络检测社区结构,充分利用了网络的局部与全局信息,最终得到较好的社区结构,具有重要的现实意义。

【总页数】5页(P53-56)
【作者】徐熊飞
【作者单位】贵州财经大学
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于多层节点相似度的社区发现方法
2.基于LeaderRank和节点相似度的复杂网络重要节点排序算法
3.基于共邻节点相似度的加权网络社区发现方法
4.基于相似
度聚类的二分网络社区发现算法5.基于节点相似性和网络嵌入的复杂网络社区发现算法
因版权原因,仅展示原文概要,查看原文内容请购买。

一种新的基于标签传播的重叠社区发现算法

一种新的基于标签传播的重叠社区发现算法

一种新的基于标签传播的重叠社区发现算法摘要摘要:发现高质量的社区是社区网络问题的研究热点。

目前,社区发现算法大多针对非重叠社区,重叠社区发现算法较少。

基于标签传播的算法是现有重叠社区发现算法中的一类,其中COPRA为典型算法。

尽管该算法具有接近线性的时间复杂度,但存在随机因素,结果不稳定,产生的社区结构存在一定差异。

为此,提出一种新的基于标签传播的社区发现算法,实验表明该算法在复杂度相近的情况下能明显提高所发现社区的质量,且具有较好的稳定性。

关键词关键词:社区发现;重叠社区;标签传播;稳定性DOIDOI:10.11907/rjdk.1431038中图分类号:TP312文献标识码:A文章编号文章编号:16727800(2015)0040059041重叠社区及其发现算法近年来,复杂网络研究受到广泛关注,主要涉及系统科学、统计物理学、社会科学、生物学等多个领域[1]。

随着通信和互联网技术的快速发展,人们发现众多网络都存在社区结构[2]这一特征。

所谓社区结构,简单来说,就是网络中的节点存在分组,一般组内的边连接比较稠密,而组间的边连接比较稀疏。

社区结构在一定程度上可以反映出真实网络的拓扑关系。

社区发现可以帮助更好地理解网络拓扑结构及其功能,从而更好地利用和改造网络,例如挖掘网络中的未知功能、控制疾病传播等。

社区发现在某些特定应用环境中也有现实意义,例如发现恐怖分子、寻找犯罪团体等。

然而,真实网络存在一些同时属于多个社区的节点,这些节点叫作“重叠节点”,与其它社区存在重叠节点的社区就叫作“重叠社区”。

例如在社会关系网络中,小王既参加了台球俱乐部,又参加了乒乓球俱乐部,那么小王就是这两个社区的重叠节点,台球俱乐部和乒乓球俱乐部是两个重叠社区。

重叠社区较之非重叠社区具有更好的现实意义:一方面,重叠节点是网络中关键点,重叠社区因此而产生联系;另一方面,重叠社区反映了更加真实的网络结构。

因此,研究重叠社区更符合真实网络的结构。

基于连边相似度的重叠社区发现算法研究施伟

基于连边相似度的重叠社区发现算法研究施伟

之间相似度的基础上提出了连边之间相似度的计算方法; 再按照相似度由小到大对边图删除边,构建出边图的
树状图。树状图的每一层对应网络的一个划分,采用划分密度函数来衡量划分的质量,以此寻找最优的划分。
最后将算法应用到 Zachary 空手道俱乐部网络中,并与 GN 算法进行对比,实验结果表明 EGN 算法能够很好地发
现实世界中许多复杂的系统都可以抽象为网络,如人际关 系网[1]、科学家合 作 网[2]、流 行 病 传 播 网[3]、蛋 白 质 相 互 合 作 网[4]等。这些网络具有复杂的内部结构,因此称为复杂网络。 通常复杂网络中用节点来表示个体,节点之间的连边表示个体 之间的关系。对于人际关系网来说,研究不同的人在社会上的 交际圈,可以概括出社会的组成,对社会的发展提供强有力的 参照。对于疾病传播网来说,研究疾病如何进行传播以及网络 结构本身具有的内在性质,对于控制疾病的传播具有很重要的 作用。因此复杂网络研究具有很重要的现实意义。近年来对 众多实际网络的研究发现,它们存在一个共同的特征,称为社 区结构。它是指网络由若干个群或团组成,每个群的内部节点 之间连接相 对 紧 密,而 不 同 群 之 间 节 点 的 连 接 比 较 稀 疏[5]。 社区发现近年来成为研究者所关注的焦点,发现社区的不同结 构,对于了解网络结构和分析网络特征具有重要意义。
现重叠社区。
关键词: 社区发现; 重叠社区; 相似度; 划分密度
中图分类号: TP393; TP301. 6
文献标志码: A
Hale Waihona Puke 文章编号: 1001-3695( 2013) 01-0221-03
doi: 10. 3969 / j. issn. 1001-3695. 2013. 01. 056

基于节点局部相似性的两阶段密度峰值重叠社区发现方法

基于节点局部相似性的两阶段密度峰值重叠社区发现方法

基于节点局部相似性的两阶段密度峰值重叠社区发现方法段小虎;曹付元
【期刊名称】《计算机科学》
【年(卷),期】2022(49)12
【摘要】为了有效地发现复杂网络中的重叠社区结构,引入了密度峰值聚类算法,但将此算法应用于社区发现还存在如何度量节点间距离、如何产生重叠划分结果等问题。

为此提出了一种基于节点局部相似性的两阶段密度峰值重叠社区发现方法(Node Local Similarity Based Two-stage Density Peaks Algorithm for Overlapping Community Detection,LSDPC)。

该方法结合大度节点有利指标和连接贡献度定义了一种新的节点局部相似性指标,首先通过节点局部相似性度量节点距离;然后通过节点的局部密度和最小距离计算节点中心值,利用切比雪夫不等式筛选出社区中心节点;最后经过初次划分与重叠划分两阶段得到最终的重叠社区划分结果。

在真实网络数据集与合成网络数据集上的实验结果表明,所提算法可以有效发现重叠社区结构,且结果优于其他对比算法。

【总页数】8页(P170-177)
【作者】段小虎;曹付元
【作者单位】山西大学计算机与信息技术学院;山西大学计算智能与中文信息处理教育部重点实验室
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于节点重要性与相似性的重叠社区发现算法
2.基于拓扑结构的密度峰值重叠社区发现算法
3.一种基于粗糙集和密度峰值的重叠社区发现方法
4.基于节点重要性和局部扩展的重叠社区发现算法
因版权原因,仅展示原文概要,查看原文内容请购买。

一种基于节点分裂的重叠社区发现算法

一种基于节点分裂的重叠社区发现算法
第 2 章 相关理论和主要技术................................................................................................ 7 2.1 复杂网络 ..................................................................................................................... 7 2.1.1 复杂网络基本理论 .......................................................................................... 7 2.1.2 复杂网络演化 .................................................................................................. 9 2.2 社区结构 ................................................................................................................... 13 2.2.1 社区结构基本定义 ........................................................................................ 13 2.2.2 社区结构发现算法 ........................................................................................ 16 2.3 本章小结 ................................................................................................................... 20

基于边图的重叠社团检测研究

基于边图的重叠社团检测研究
Abstract:Communitydetectionhasattractedmuchattentioninthepastyears.Overlapandhierarchicalstructureareusually closelylinkedinrealnetworks.Previousmethodsinvestigatethesetwopropertiesofcommunitystructureseparately.In2010, AhnetalpublishedanarticleonNatureindicatedthatoverlapandhierarchystructurewerethetwoaspectsofthesamephe nomenon.ThispaperproposedanewmethodforcommunitydetectionnamedasSAEG(spectralanalysisofedgegraph)toa chieveabalancebetweenoverlapandhierarchybyapplyingspectralanalysistoedgecommunitydetection.Itusedtworealso cialnetworkstocomparetheproposedalgorithmwithAhnetal’sandCPM algorithms.TheresultsofSAEGalgorithmaresat isfactory. Keywords:communitydetection;edgegraph;spectralanalysis;angledistance
2004年 Donetti等人[5]将谱分析与层次结构划分结合提 出一种新算法。谱聚类通过使用一个矩阵的特征向量将数据 进行聚类,使用 特 征 向 量 使 得 原 始 数 据 集 的 聚 类 属 性 更 为 明 显。该方法优于传统的聚类算法如 K均值算法。迄今为止, 谱聚类中使用最多的矩阵是拉普拉斯矩阵。拉普拉斯矩阵的 最小非平凡特征向量的每个因子对应网络中的每个元素,可以

基于链接相似性聚类的重叠社区识别

基于链接相似性聚类的重叠社区识别

基于链接相似性聚类的重叠社区识别
张桂杰;张健沛;杨静;辛宇
【期刊名称】《电子学报》
【年(卷),期】2015(043)007
【摘要】社区结构是社会网络最普遍和重要的拓扑属性之一,提出一种基于链接相似性聚类的重叠社区识别算法.该算法首先根据相邻链接的度分布状态,提出链接间的相似性度量方法;其次以链接相似性矩阵为输入,以链接社区的最优划分为目标,建立链接局部相似性聚类算法,实现了重叠社区的有效识别;然后对链接社区进行优化,解决了可能出现的过度重叠及孤立社区问题;最后在真实网络及人工合成网络上的实验验证了算法的高效性.
【总页数】7页(P1329-1335)
【作者】张桂杰;张健沛;杨静;辛宇
【作者单位】哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001;吉林师范大学计算机科学与技术学院,吉林四平136000;哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001;哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001;哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001【正文语种】中文
【中图分类】TP301
【相关文献】
1.基于相似性传播聚类与主成分分析的断层识别方法 [J], 陈雷;肖创柏;禹晶;王真理;李学良
2.基于链接密度聚类的重叠社区发现算法 [J], 朱牧;孟凡荣;周勇
3.视频人脸识别中基于聚类中心LLE的特征相似性融合方法 [J], 贾海龙
4.基于节点相似性和链接次数组合时间序列的链接预测 [J], 魏晓辉;许国威;王兴旺;徐海啸
5.基于节点重要性与相似性的重叠社区发现算法 [J], 付饶;孟凡荣;邢艳
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
现 重 叠社 区。
关键词 :社 区发现 ; 重 叠社 区 ; 相 似度 ; 划分 密度 中图分 类号 : T P 3 9 3 ; T P 3 0 1 . 6 文献标 志码 :A 文章编 号 :1 0 0 1 . 3 6 9 5 ( 2 0 1 3 ) 0 1 . 0 2 2 1 . 0 3
v e r l a p p i n g c o mmu n i t y i n n e t w o r k s a t l a s t .L i n e g r a p h w o u l d b e c o n s t r u c t e d b e f o e u s i n g EGN lg a o r i t h m w h i c h b a s e d o n t h e r e - l a t i o n s h i p o f n o d e s i n n e t wo r k . An d a f t e r t h a t ,t h e lg a o r i t h m c a l c u l a t e d he t s i mi l a r i t y o f e d g e s i n n e t w o r k .I t p r o p o s e d he t me t h o d o f c a l c u l a t i o n o f e d g e s i mi l a i r t y w h i c h b a s e d o n t h e s i mi l a r i t y o f n o d e ,a n d t h e n c o n s t uc r t e d d e n d r o ra g m o f l i n e ra g p h
d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 1 . 3 6 9 5 . 2 0 1 3 . 0 1 . 0 5 6
O v e r l a p p i n g c o mmu n i t i e s d e t e c t i n g b a s e d o n s i mi l a r i t y o f e d g e
t i o n e d t o a l l i n d e p e n d e n t c o mmu n i t y ,c o n s e q u e n l t y n o d e s c o u l d b e p a r t i t i o n e d t o mu l t i p l e c o mmu n i t i e s .I t c o u l d d e t e c t t h e O -
第3 0卷 第 1期
2 0 1 3年 1月
计 算 机 应 用 研 究
Ap p l i c a t i o n Re s e a r c h o f C o mp u t e r s
Vo 1 . 3 0 No . 1
J a n .2 01 3
基 于 连 边 相 似 度 的重 叠社 区发 现 算 法研 究 木
S HI We i ,F U He - g a n g ,Z HANG C h e n g
( C o t l e g  ̄ o fC o m p u t e r S c i e n c e , C h o n g q i n g U n i v e r s i t y , C h o n g q i r t g 4 0 0 0 4 4 , C h i n a )


伟, 傅鹤 岗 , 张

( 重庆大学 计算机学院, 重庆 4 0 0 0 4 4 ) 要 :针对 G N算法在发现重叠社区时存在的不足, 以及为 了降低算法时间复杂度, 提 出一种基于网络 图中
连边相似度划分连边集的重叠社区发现算法 E G N。算法依据网络 图的连边集进行划分 , 每一条边被划分到某个 特定的社 区, 而一个节点可以关联 多条连边 , 因此节点可以被划分到不同的社区, 从而发现重叠社 区。E G N算法
首 先 需要 构造 网络 节 点之 间连 边 关 系的边 图; 然后根 据 边 图 中节 点的 关 系计 算 网络 图 中连 边 的相 似度 , 在节点
之间相似度的基础上提 出了连边之间相似度的计算方法; 再按 照相似度 由小到大对边图删除边 , 构建 出边图的 树状 图。树状图的每一层对应 网络的一个划分, 采用划分密度函数 来衡量划分的质量, 以此寻找 最优的划分。 最后将算法应 用到 Z a c h a r y空手道俱乐部网络中, 并与 G N算法进行对比, 实验结果表明 E G N算法能够很好地发
c a l l e d E G N w h i c h b a s e d o n he t p a r t i t i o n o f e d g e s i n n e t w o r k .A c c o r d i n g t o t h e p a r t i t i o n o f e d g e s , e a c h e d g e w o u l d b e p a r t i —
Ab s t r a c t :T o v o i d GN lo a r i t h m’ S p r o b l e m nd a r e d u c e t h e c o mp u t a t i o n a l c o mp l e x i t y ,t h i s p a p e r p r o p o s e d a n e w a l g o r i t h m
相关文档
最新文档