基于共享最近邻探测社团结构的算法
基于最近共享邻居节点的K—means聚类算法
me n ae n h h rd a s b sd o te S ae Ners ih o ( NN) i e in d K NN fn s h oe n d s f te aa t e h n mb r o ae tNeg b r KS ,s sg e . S d te c r o e o h d t o g tte u e f d i
E—ma ls m @ sud n . ut duC i: s t e tdl . .B e
S A S imi , U Ho gZ H N h— n Y n , HAN Y -i— h n ,ta. me n ae n sae ers n ih o .o ue n iern G e j e e g e 1 a K— a sb sd o h rd n aet e b rC mp t EK- a s mu t b gv n h n mb r o l se a d t o ms l c l c n e g n e e sl .o a n w c u trn ag r h , n n . me n s e ie t e u e f c u t r n i r o a o v r e c a i S e l se g lo t m K— s f y i i
关键 词 : 类分 析 ; — as最 近 共 享 邻居 聚 K men ; 文 章编 号 :0 2 8 3 ( 0 8 0 — 18 0 文献 标识 码 : 中 图 分 类 号 :P 1 10 — 3 12 0 )6 0 7 — 4 A T 3
1 引言
聚类分析广泛地应用于文本搜 索 、 模式 识别 、 人工智能和 互联 网搜索等领域 常用聚类方法包括统 计方法 、 1 。 机器学 习方
集 中搜 索中心点 , 依据 中心点查找数据 集个数 , K m a s 为 — en 聚类提供 参数 。从 而克服 了 K m a s — en 需要人 工设定聚类个数 的问题 , 同时具有较好的全局收敛性。实验证明 K N S N算法比 K m a s粒子群 K men(s) - en 、 - aspo 以及 多中心聚类算法( A) MC 有更好 的聚类效果。
共享最近邻聚类算法流程
共享最近邻聚类算法流程Recently, the k-nearest neighbors (KNN) clustering algorithm has gained popularity in the data science community. It is a type of unsupervised learning algorithm that groups similar data points together based on their similarity to one another. This algorithm is particularly useful in situations where the data points do not belong to predetermined classes and need to be clustered based on their similarities.最近,K-最近邻(KNN)聚类算法在数据科学领域越来越受到关注。
这是一种无监督学习算法,根据数据点彼此之间的相似性将相似的数据点分组在一起。
这种算法在数据点不属于预定类别,需要根据它们的相似性进行聚类的情况下特别有用。
One of the popular variations of the KNN algorithm is the Shared Nearest Neighbor (SNN) clustering algorithm, which leverages the idea that points share closest neighbors. This algorithm assigns points to clusters based on their shared proximity to other data points in the dataset. By focusing on shared nearest neighbors, theSNN algorithm can produce more accurate and reliable clustering results compared to traditional KNN clustering algorithms.KNN算法的一种流行变体是共享最近邻(SNN)聚类算法,该算法利用了点共享最接近邻居的想法。
共享最近邻聚类算法流程
共享最近邻聚类算法流程
共享最近邻(Shared Nearest Neighbor, SNN)聚类算法是一种基于密度的聚类方法,其流程概要如下:
1. 计算样本间的距离,构建邻近矩阵,统计每个样本与其他样本的共享最近邻数目。
2. 根据预先设定的阈值,判断样本间的共享最近邻数量,若超过阈值则认为两者属于同一密度相连区域。
3. 逐步扩展密度相连区域,将紧密相连的样本聚为一类,形成聚类簇。
4. 在这个过程中不断更新邻近信息,直至所有样本都被分配至相应的聚类簇中。
该算法利用样本间的共享最近邻关系来发现数据集中的自然聚类结构,适用于发现任意形状和大小的聚类,但因其时间复杂度较高,不太适合大规模数据集。
基于共享邻居数的社团结构发现算法
基于共享邻居数的社团结构发现算法刘微;张大为;嵇敏;谢福鼎【期刊名称】《计算机工程》【年(卷),期】2011(037)006【摘要】To partition complex networks into groups fast and correctly, this paper proposes an algorithm for detecting community structures in complex networks based on shared neighbors and local modularity. By looking for the numbers of shared neighbors between nodes one by one, the node connected closely with the community is found, and the local modularity is used to decide whether this found node is added into the community. Three typical complex networks are used to test the performance of the algorithm. Experimental results show that it is viable and effective.%为了快速准确地找到复杂网络的社团结构,提出一种基于共享邻居数和局部模块度的社团结构发现算法.该方法通过不断寻找节点之间的共享邻居数找出与社团连接性最强的节点,并以局部模块度为衡量标准,判断是否将该节点加入到社团中.对3个典型复杂网络的划分结果表明,该算法是可行和有效的.【总页数】3页(P172-174)【作者】刘微;张大为;嵇敏;谢福鼎【作者单位】辽宁师范大学计算机与信息技术学院,辽宁,大连,116081;辽宁师范大学计算机与信息技术学院,辽宁,大连,116081;辽宁师范大学计算机与信息技术学院,辽宁,大连,116081;辽宁师范大学计算机与信息技术学院,辽宁,大连,116081【正文语种】中文【中图分类】TP311【相关文献】1.基于节点依赖度和相似社团融合的社团结构发现算法 [J], 聂祥林;张玉梅;吴晓军;吴霞2.一个基于多维特征向量的复杂网络社团结构发现算法 [J], 孙亚红;肖淑苹3.基于发现矩阵的邻居发现算法:Swift [J], 李旭;袁平;殷锋4.基于贪婪算法的符号网络中社团结构快速发现算法 [J], 周斌;程慧;杨立志;裴国庆5.基于发现矩阵的邻居发现算法:Swift [J], 李旭;袁平;殷锋因版权原因,仅展示原文概要,查看原文内容请购买。
基于最大节点接近度的局部社团结构探测算法
基于最大节点接近度的局部社团结构探测算法随着社交网络和大数据的快速发展,社区探测在图论和网络分析等领域变得越来越重要。
而在社区探测中,局部社团结构的分析和挖掘也变得非常关键。
本文将介绍一种基于最大节点接近度的局部社团结构探测算法,该算法可以帮助我们更好地理解和挖掘网络中的局部社团结构。
一、引言社区探测是指在一个大规模网络中寻找由具有相似特征的节点所组成的紧密联系的子集。
而局部社团结构则是指在这些子集中局部组织的模式。
对于探测和分析社区结构,可以帮助我们了解社交网络中的人际关系、信息传播路径等重要的网络特征。
局部社团结构的研究,可以帮助我们挖掘出更精细的社区,对于理解和分析社交网络的微观机制具有重要意义。
二、最大节点接近度最大节点接近度是一种度量节点之间接近程度的指标。
它定义了节点与其邻居节点的相似度,即两个节点在相似度上越接近,则它们之间的最大节点接近度越大。
最大节点接近度可以用来描述节点在网络中的集聚度,能够反映网络中的节点之间的关系紧密程度。
在社区探测中,最大节点接近度可以帮助我们从全局视角划定社区的边界,并找到局部社团结构的核心节点。
三、局部社团结构探测算法基于最大节点接近度的局部社团结构探测算法主要分为以下几个步骤:1.计算节点的最大节点接近度:对于给定的网络,首先需要计算每个节点的最大节点接近度。
这可以通过计算节点与其邻居节点的相似度得到。
节点与邻居节点的相似度可以使用余弦相似度等指标进行度量。
2.局部社团结构的发现:在计算完节点的最大节点接近度后,可以通过设定一个阈值,根据最大节点接近度来划分社区。
当节点的最大节点接近度超过设定的阈值时,将它们划定为同一个社区。
3.核心节点的识别:在每个社区中,通过比较节点的最大节点接近度,可以找到核心节点。
核心节点是社区内部连接最紧密的节点,对于社区的结构和功能起到关键作用。
4.社区边界的确定:在社区内部可以根据节点的最大节点接近度进行进一步划分,以确定社区内部的子社区。
社团检测算法python
社团检测算法python
社团检测算法是一种用于社交网络分析的方法,通过分析社交网
络中的节点之间的联系,识别出社团(即一个社区)中较为密集的联系。
本文将介绍一个基于Python编写的社团检测算法。
算法基本思路是通过模拟社区内人员之间的连通性,找出那些紧
密联系在一起的人,并尽可能将它们分到不同的社团中。
算法的实现
分为以下几个步骤:
1. 构建社交网络模型:以图的形式记录每个人和他们之间的关系。
可以通过读入已有的社交网络数据或者在线获取数据来构建模型。
2. 计算节点的度(degree):节点的度是指与该节点相连的边
的数量。
可以用度来表示节点在社区中的重要性。
3. 计算社区内节点之间的连接性:可以通过构建邻接矩阵来表
示社区内所有人之间的联系,也可以使用其他图论算法计算节点之间
的距离。
4. 计算社团节点的紧密度:使用各种紧密度算法(如介数中心性、特征向量中心性等)来计算节点之间的紧密关系。
5. 划分社团:根据紧密度计算结果,将社区分为若干社团。
可
以通过阈值来控制社团的大小和数量。
整个算法可以使用Python相关的图论库(如networkx、igraph 等)来实现。
通过对社交网络进行分析,我们可以更好地理解社区的
结构和组成,并且为我们的实际决策提供参考。
复杂网络中的社团发现算法综述
复杂网络中的社团发现算法综述随着社会网络的日益发达,社交网络成为了现代社会的重要组成部分。
然而,这些网络往往都是由大量的节点和边构成,而且具有非常复杂的拓扑结构。
对于这样的复杂网络,如何有效地发现其中的社团结构一直是研究的热点之一。
社团结构是指在网络中存在一些密度较高、连通性较强的子图,其中节点之间的联系比较紧密,而与其他社团的节点则联系较松散。
社团结构的发现可以帮助我们了解网络中的相互作用关系,为社交网络的数据挖掘和信息推荐提供基础理论和方法。
社团发现算法按照算法思想的不同,可以分为基于模型的方法、基于聚类的方法和基于图分割的方法。
其中,基于模型的方法是使用概率模型描述网络,然后利用统计学方法推导出社团结构;基于聚类的方法是将网络中的节点聚类成若干个社团,每个社团内节点之间的相似性要求较高;基于图分割的方法则是将网络切分为若干个部分,使得每个部分内的节点之间的连通性要求较强。
下面将分别介绍一些经典的社团发现算法:1. 基于模型的方法(1) 随机游走社团发现算法(Random Walk Community Detection Algorithm,RWCD)RWCD是基于随机游走模型的社团发现算法,它将节点的相似性定义为它们之间的转移概率,然后使用PageRank算法迭代计算各节点的权值,在一定阈值下将权值较高的节点聚合成社团。
RWCD算法可以充分利用网络中的拓扑结构,对大型网络具有较好的扩展性。
(2) 右奇社团发现算法(Modularity Optimization Algorithm,MOA)MOA算法是一种基于模块度优化的社团发现算法,它将社团内节点的连接强度与所有节点的连接强度相比较,然后计算模块度值,寻找最大模块度值时的节点聚类。
MOA算法的思想简单易懂,但需要耗费大量的计算资源。
2. 基于聚类的方法(1) K-means社团发现算法K-means算法是一种常用的聚类算法,它将网络中的节点分成K个组,每个组是一个社团。
基于k NN发现社团主干的社团检测算法
基于 kNN发现社团主干的社团检测算法
李 明,陈 梅,张 梅
(兰州交通大学 电子与信息工程学院,兰州 730070)
摘要:随着复杂网络规模和种类的日渐增加,如何检测任意结构,任意规模的社团成为了社团检测的一个难点.为 了解决该问题,提出了一种可以通过 k最近邻发现社团主干的社团检测算法 DCCB(detectioncommunitybasedon kNNtodiscovercommunitybackbone).该算法首先遍历所有节点,将两个互为 k近邻的相似节点及它们的共同邻居 聚集到一个社团主干中;接着,在遍历过程中,若不在主干中的节点与某个社团主干内任何节点存在互近邻关系, 那么该节点也会被吸引到这个社团主干中;然后,该算法检测出社团主干中的异常节点,并将其标记为无类标节 点;最后,该算法利用影响力分配无类标节点,得到最终的社团结构.该算法简单且时间复杂度较低.通过 4个不同 结构真实网络以及 3个不同规模的人工合成网络的综合测试表明:DCCB算法能检测出任意结构与任意规模的社 团,且发现的社团质量高于所用的 5个基准算法. 关键词:复杂网络;社团检测;k最近邻;社团主干 中图分类号:TP301.6 文献标志码:A
复杂网络中社团结构的快速探测方法
3 . J i n z h o n g Te a c h e s r C o l l e g e ,J i n z h o n g 0 3 0 6 0 0 , Ch i n a )
Ab s t r a c t : De t e c t i n g c o mmu n i t y s t r u c t u r e i n c o mp l e x n e t w o r k s h a s s i g n i i f c a n t i mp l i c a t i o n s f o r b o t h t h e o r e t i c a l r e s e a r c h e s a n d p r a c t i c a l a p p l i c a t i o n s ,a n d c a n b e u s e d t o a n ly a z e t h e t o p o l o g i c a l s t r u c t u r e s ,u n d e  ̄t a n d t h e f u n c t i o n s . I t p r o p o s e d a f a s t s p l i t t i n g lg a o r i t h m b a s e d o n e d g e l i n k i n g c o e f i c i e n t a n d c o mmu n i t y s t r e n g t } 1 .T h e r e s u l t s s h o w t h a t i t d o e s n o t r e q u i r e a n y p r i o r i k n o wl e d g e a b o u t t h e n u mb e r o r t h e o r i g i n l a d i v i s i o n o f t h e c o mmu n i t i e s . I t h a s b e t t e r p a r t i t i o n i n g a b i l i t y a n d l o w e r t i me c o mp l e x i t y t h a n t h e p r o p o s e d p a t r i t i o n i n g c o mmu n i t y s t r u c t u r e lg a o it r h ms . Ke y wo r d s : c o mp l e x n e t wo r k s ; c o mmu n i t y s t r u c t u r e ; mo d u l a r i t y ; e d g e l i n k i n g c o e f i f c i e n t
复杂网络中的社团结构探测和应用研究
复杂网络中的社团结构探测和应用研究随着人类社会的发展和科技的进步,人类之间的联系变得越来越复杂,网络的出现更是让人类社会变得紧密而复杂。
在网络中,每个节点代表着一个实体,节点之间的联系则代表着这些实体的关系。
如何解析这些关系并揭示网络中的规律,就成为了网络科学的一个重要研究课题。
社团结构探测是网络科学中的一个重要研究方向,它研究的是如何将一个大的网络划分为若干个较小的群体(即社团),每个社团内部的节点之间联系紧密,而不同社团之间节点之间联系相对松散。
社团结构探测在生物学、社交网络、传播学及其他领域都有重要应用。
一、社团结构探测算法在网络中,一个节点的度数代表着与该节点直接相连的节点数。
一个社团则可以定义为一个节点集合,该集合中的节点之间具有密集的联系,而这种联系则表现为社团内部节点的度数较大。
社团结构探测算法的目的就是找到这些社团,并将它们划分出来。
社团结构探测算法可以分为基于聚类的算法、基于模型的算法和基于优化的算法等几类。
1. 基于聚类的算法基于聚类的算法通常采用类似于K-Means的方法来划分社团。
最简单的算法是一种贪心算法,即从一个起始点出发,沿着连接的边逐步地把最邻近的节点加入社团中,直到一个社团被完全发现。
然后,在不同的起始点上重复这一过程,以便找到尽可能多的不同社团。
这种方法的缺陷在于其聚类的结果往往非常依赖于起始节点的选择,可能存在很大的随机性。
2. 基于模型的算法基于模型的算法则采用概率模型来对节点之间的联系进行描述,并根据模型来划分社团。
一个经典的基于模型的算法是层次化贝叶斯方法。
该方法首先假设网络中所有节点都分属于若干个社团之中,然后结合模型选择算法,寻找最优划分,将各个节点排成一颗树状结构。
最终,可以通过剪枝来决定社团的数量。
3. 基于优化的算法基于优化的算法则将社团划分问题转化为一个优化问题,并将寻找最优解的过程表示为一个涉及分割的图形优化问题。
经典的基于优化的算法包括模拟退火算法、遗传算法、贪心算法等。
复杂网络中的社团检测问题研究
复杂网络中的社团检测问题研究社团检测问题是指在网络分析中研究社团结构的一种重要方法。
社团指的是网络中的一个子图,其内部节点之间的连边密度高于与其它社团的节点之间的连边密度。
复杂网络是指网络中节点之间具有复杂的关联结构,而不是简单的规则或随机结构。
在复杂网络中,社团的检测问题成为了一个热点研究领域,许多研究者已经提出了许多有效的方法来解决这个问题。
社团检测方法的主要思想是在网络中寻找密度较高的子图,也就是社团。
社团有许多特征,例如:它们往往在空间上很稠密,节点之间的联系很紧密,同时节点之间的连边权重也很高。
为了找到这些社团,社团检测算法依靠网络结构的某些属性,如共同的邻居、小世界性、网络中心性等。
在过去的几十年里,许多算法和方法被提出来用于解决社团检测问题,其中最常用的方法是基于模块度的方法。
这种方法通过最大化网络的模块度来寻找社团,模块度是指网络内部的连边密度与网络外部的连边密度之差的度量。
具体来讲,一个好的社团应该有高模块度,即社团内部的连接要尽量密集,而社团与其它社团之间的连接应保持较少。
除了模块度方法外,还有很多其它方法也被应用于社团检测问题中,如光谱聚类、层次聚类、标签传播、深度学习等。
这些方法各有千秋,具体应用需要根据具体问题和数据情况进行选择。
不过需要注意的是,在实际应用中,社团检测问题通常是一个NP难问题,需要运用高效的算法和数据结构来解决。
随着科技的不断发展,随着数据规模的不断增大,社团检测问题的研究变得越来越重要。
在实际应用中,社团检测问题已经成功应用于社交网络、生物网络、交通网络等领域。
例如,社团检测可以用来研究社交网络中的亲密度、交流模式、兴趣组等问题;在生物网络中,社团结构可以揭示基因互作网络、蛋白质交互网络等问题。
因此,社团检测是一个广泛应用的研究领域,很有前途。
综上所述,社团检测问题是复杂网络研究中的一个重要组成部分。
通过寻找网络中密度较高的子图,社团检测可以帮助我们深入了解网络内部的结构和关系,发现隐藏的规律和特征,为解决实际问题提供了新的思路和方法。
基于发现社团核心的社团检测算法研究
基于发现社团核心的社团检测算法研究基于发现社团核心的社团检测算法研究摘要:社团检测是社交网络分析中一个重要的研究领域,通过揭示社交网络中的社团结构,可以帮助我们理解社会关系、发现潜在的潜在关键人物以及进行精确的社区发展规划。
本文提出了一种基于发现社团核心的社团检测算法,以便更好地揭示社交网络中的社团结构。
该算法首先提取社交网络中的节点特征,然后采用聚类算法对节点进行聚类,最后根据社团的紧密性和连接程度评估社团的核心性。
实验结果表明,该算法能够高效地检测社交网络中的社团,并且对于不同类型的社交网络有较好的适应性。
1. 引言社团检测作为社交网络分析中的一个关键任务,被广泛应用于社会学、计算机科学以及其他领域。
通过社团检测,我们可以了解社交网络的组织结构,发现隐藏的社交关系,并且可以为社区发展和社交网络分析提供有价值的见解。
在过去的几年里,许多社团检测算法已经被提出,但是大多数算法只能发现社团的整体结构,缺乏对社团核心的详细揭示。
2. 相关工作许多传统的社团检测算法主要基于图划分或聚类的方法。
例如,Girvan-Newman算法使用图的边介数作为社团检测的度量。
Louvain算法则使用模块度作为社团检测的优化目标。
尽管这些算法在一些情况下表现良好,但是它们通常无法揭示社团的核心结构。
3. 方法本文提出了一种基于发现社团核心的社团检测算法。
算法的主要步骤如下:(1)节点特征提取:我们首先对社交网络中的节点进行特征提取,包括节点的度中心性、介数中心性、连通度等。
(2)节点聚类:基于节点特征,我们采用聚类算法将节点划分为不同的社团。
在聚类过程中,我们使用了一种改进的K-means算法,该算法考虑了节点的相似性和差异性,并将相似的节点放置在同一个社团中。
(3)社团核心评估:为了评估社团的核心性,我们引入了紧密性和连接程度两个指标。
紧密性表示社团内节点之间的紧密程度,连接程度表示社团与其他社团的连接强度。
通过综合考虑这两个指标,我们可以判断社团是否为核心社团。
基于边链接权重的局部社团探测算法
基于边链接权重的局部社团探测算法
王晓芳
【期刊名称】《农业网络信息》
【年(卷),期】2012(000)012
【摘要】针对大规模复杂网络社团挖掘的效率较低问题,提出一种基于边链接权重的局部社团探测算法.该算法以边两端节点所共有的邻居占其邻居的比值作为该边的链接权重,从某一节点出发通过给定的阈值进行遍历,由此得到该节点所在的局部社团.实验结果表明,算法发现的局部社团能够获得满意的结果,而且时间复杂度趋于线性时间复杂度.
【总页数】3页(P32-33,36)
【作者】王晓芳
【作者单位】晋中师范高等专科学校,山西晋中030600
【正文语种】中文
【中图分类】TP311
【相关文献】
1.基于网络权重的多社团网络结构划分算法 [J], 段晓东;王存睿;刘向东;张庆灵
2.基于标签权重系数的社团发现算法 [J], 滕彬;李玲娟
3.基于最大节点接近度的局部社团结构探测算法 [J], 王立敏;高学东;马红权
4.基于主题划分和链接划分的社团发现算法 [J], 欧阳骥;周宪政;卓晓燕;黄翰
5.改进的基于模块度最大化二分图权重网络社团挖掘算法 [J], 李文娟
因版权原因,仅展示原文概要,查看原文内容请购买。
基于改进相邻节点相似度的社团划分算法
基于改进相邻节点相似度的社团划分算法卢鹏丽;赵玲艳;魏柏舟【摘要】目前复杂网络中的社团划分算法很多,其中大多数是在社团数目已知的前提下进行的.通过定义社团强度和计算相邻节点的邻居集合,提出改进的相邻节点相似度矩阵.然后通过不断地删除矩阵中相似度最小值对应的连边,在社团数目未知的前提下,符合已定义的社团强度的社团就可以产生.实验结果表明,该算法在社团数目未知的前提下,不仅时间复杂度较低,而且又能够准确地识别网络中的社团.【期刊名称】《兰州理工大学学报》【年(卷),期】2015(041)006【总页数】5页(P104-108)【关键词】复杂网络;社团划分;社团强度;节点相似度矩阵【作者】卢鹏丽;赵玲艳;魏柏舟【作者单位】兰州理工大学计算机与通信学院,甘肃兰州730050;兰州理工大学计算机与通信学院,甘肃兰州730050;甘肃机电职业技术学院,甘肃天水741001【正文语种】中文【中图分类】TP311人们对于复杂系统的研究始于20世纪80年代,由于当前该领域研究的新进展,以及在学术界和产业界越来越浓厚的兴趣,创造了研究复杂系统的新动力.在现实世界中,许多复杂系统都可以用复杂网络的模型进行描述[1],因此,复杂网络的研究也成为人们研究的重要领域之一.复杂系统是由多个交互的单元组成,对应在复杂网络中的点,相互作用在网络中则表现为点之间的连边.从学者们研究的方向不难看出,大多数关于复杂网络的研究都是针对复杂网络的局部特性进行的,这些局部特性主要有社团结构[2]、度分布[3]和相关系数[4]等,其中社团结构是复杂网络最显著的特征[5].随着对网络特性的进一步研究,许多复杂网络拥有模块结构或社团结构,而这些结构大多是与复杂系统的某些模块相对应.复杂网络中的一个社团可以看作一个子网,在这个子网络内部,节点与节点之间的连边比较密集,而子网内部的点与子网外部的点连边比较稀疏[6].尽管社团结构不是复杂网络结构的唯一特征,但是它对复杂网络的研究起着至关重要的作用.发现网络社团结构也称作复杂网络社团的划分,它不仅帮助理解大规模网络的拓扑结构,还能反应其对应在现实世界复杂系统中模块的功能.在过去的几年里,许多社团划分算法相继出现.分割算法(如Kernighan-Lin 算法[7])使用启发式算法,通过优化社团内总边数与社团间总边数的差值,得到最终网络的一个社团划分.另一类是层次聚类方法(如谱平分算法[8]),主要是计算网络拉普拉斯矩阵的特征向量,通过特征向量值的关系进行聚类,得到复杂网络的社团结构.以上两种算法都是经典的图谱理论划分算法,然而这两种方法都是需要提前知道社团的数目,才能获得相应的社团划分.对于许多结构复杂、节点数目较多的网络,社团数目无法提前获得,这就需要新的社团划分算法,以便将网络进行正确的划分.有的学者是从节点重要性角度,不需要知道社团数目,只需要局部信息得到中心社团即可[9],而有的学者则是直接不需要已知社团数目就能将网络进行准确的社团划分.2005年,Newman and Leicht 提出网络中点相似度的概念[10],两个点的相似度即这两个点的相似程度,但是两个点相似可以表达多种意思.例如,在社交网络中,如果两个人有相似的职业、兴趣或者教育背景,则可以认为他们是相似的.这里所说的点相似度是能够反映复杂网络中有用的信息.复杂网络中基于点相似度的社团划分算法一直受到研究学者的关注.Pan Y 等人在2010年提出了一种基于点相似度的社团划分算法[11],虽然不需要提前知道社团数目,但是该算法初始节点的选取比较粗糙.2011年,姜雅文等人基于网络拓扑结构信息构造相似度[12],进而提出社团划分算法,其算法中设置的参数直接影响网络划分的优劣.本文算法是提前给定社团强度定义,通过不断删除连边获得符合要求的社团,不需要提前给定社团数目,也不需要设置参数,避免了参数对算法的影响.G(V,E)表示一个无向简单图,既没有环路且两个点之间没有多重边直接相连.其中,V={1,2,3,…,n}表示G中节点的集合;}是G中边的集合,且=m.A是图G的邻接矩阵,该矩阵是一个n×n的方阵,其元素Aij定义如下:在图G中,ki表示点i的度,即ki表示点i的邻居的个数,有.例如,在图 1中2号节点有5个邻居节点(1、3、5、6、7),所以2号节点的度为5.如果将一个简单图划分成几个子图,点i的度ki将被分成两部分:内度和外度是指点i与其所属的子图内点的连边总数,而是指点i与其所属社团外节点的连边总数.若B=(V′,E′)是图G的一个子图,V′是子图B节点的集合,E′是边的集合,则子图B中节点i的度可表示如下:其中若图1分成两个子图:G1=(V1,E1),G2=(V2,E2),且有V1={2,3,4},V2={1,5,6,7},则模块度函数Q能够评价划分社团后的网络的划分质量,本文通过计算模块函数Q来评价算法的准确性.假设P是简单图G的一个划分,即P=G1(V1,E1),…,Gc(Vc,Ec),其中Vi(i∈{1,2,…,c})是子图Gi的节点集合,Ei是子图Gi的边的集合.模块度函数Q(P)可定义如下[13]:其中L(V,V)=2m模块度函数Q值的范围为0.3~0.7,并且Q值越接近0.7,说明算法划分出的社团越好.截至目前,社团的定义有很多种[14],下面给出两种社团的定义.如果子图满足给定的社团定义,那该子图就称为一个社团,否则子图不能称为社团.本文算法得到的社团都是满足强社团定义的.假设B=(V′,E′)是图G=(V,E)的一个子图.定义1(强社团) 如果子图B满足:则子图B为强社团.定义2(弱社团) 如果子图B满足:则子图B为弱社团.由定义1和定义2可以得到,强社团中每个点与其所属社团内部点连接边数要多于与其他社团点连接的边数,而弱社团中所有点的内度之和要大于所有点的外度之和.显然,如果一个社团是强社团,那它一定是弱社团,但是反之就不一定是对的. 在复杂网络的研究领域中,点相似度的研究并不是一个新的研究方向.下面是点相似度定义及学者们提出的一些标准化方法[10]:假设Ni={j|Aij=1}表示图G中节点i的邻居集合,即在图中与节点i有边直接相连的点的集合.而则表示节点i和节点j 拥有的共同邻居的个数,其中的值等于节点i的度.θij是判断两个节点相似度的最基本的方法,但是从定义能看出,它并不能满足全部的要求.有时两个节点有很少的共同邻居,他们的相似度的值也可能很大,因此需要将其标准化.下面是将其标准化的一些方法:其中是节点i与节点j的所有邻居的个数.这一节主要介绍改进的相邻节点相似度(INS). 图G中INS是一个n×n的方阵,其元素INS(i,j)定义如下:其中:sij=∑Akw,k∈Ni,w∈Nj,kw∈E;sij表示节点i的邻居集合和节点j的邻居集合之间存在的连边数.这也是INS与θjaccard的主要区别之处.例1 在图1中,N1={2,3,4},N2={1,3,5,6,7},由此能计算出N1和N2之间的连边数s12=9,这些连边分别是:{1-2,1-3,1-4,2-3,2-5,2-6,2-7,4-5,3-7}.根据s12和式(1),也可以计算INS(1,2):通过观察可以发现:复杂网络模型中大多数边界节点的度都比其内部节点的度要小.按照以往的一些通过删除连边得到社团的算法,都是将这样的点划成独立的社团,这样的做法对社团的划分结果影响很大,因此在本文中定义如下规则避免这类现象的发生.规则1(归并规则) 如果图G中节点i的度为1,就将INS(i,j)和INS(j,i)都置为无穷大(infinite).可以这样理解:若节点i的度为1,同时它的邻居节点为j,则节点i 和节点j一定属于同一个社团.例2 在图1中,节点6的度为1且其邻居节点为2,应用规则1,节点2与节点6属于同一个社团.对于一个简单无向图G=(V,E),A对应其邻接矩阵,INS是改进的点相似度矩阵,具体算法描述如下:1) 计算Ni、Nj和sij,然后根据公式(1)计算INS.2) 删除INS中值最小的那一项INS(i,j)对应的那条边,节点i与节点j的度均大于1才进行删除操作.3) 更新INS(i,Ni)和INS(j,Nj).4) 判断有无子图产生,如果无新子图产生,返回步骤2),如果有子图产生则转向步骤5).5) 首先判断图Ga是否满足强社团定义.如果Ga满足强社团定义,让Gi=Ga,i=(1,2,…,c),然后让G′=G-Ga;如果Ga不满足,让G=G′∪Ga,返回步骤2). 6) 返回步骤2),直至没有可以删除的边为止.通过观察可知,计算INS的时间复杂度为O(m2),最坏的情况下,删除连边的和更新INS的时间复杂度为O(m2),其中m是网络中的连边数.因此,该算法时间复杂度是O(m2).将算法应用到人工网络和三个经典的现实网络中,然后通过计算模块度Q的值,查看算法的准确性.算法使用MATLAB 7.8.0、NETDRAW进行试验及仿真.三社团网络包括18个点、53条边,本文算法将网络分成三个社团.如图2所示,这三个社团分别使用三种不同的形状标记出来,同时该算法划分出的社团结果与已知的社团划分结果[15]相同.空手道俱乐部网络是由Zachary花费两年的时间完成的,主要是关于美国一所大学里空手道俱乐部里俱乐部成员之间关系的网络.该网络拥有34个点和78条边,点代表俱乐部的成员,而边代表俱乐部成员间的关系.在研究中发现,由于俱乐部管理员John A(node 34)和俱乐部教练Mr. Hi(node 1)之间产生分歧,俱乐部被分成两个团体.如图3所示,左边节点代表支持管理员的成员,右边节点代表支持教练的成员.该算法分别将这两个社团进一步划分成两个更小的社团,左边支持管理员的社团分为方形和三角形两个社团,而右边支持教练的社团则分成圆形和菱形两个社团.该算法不仅能将网络划分成符合产生分歧时形成的社团[16],还将网络进一步细划分.通过计算,该网络模块度Q(P)=0.41,而现实网络的模块度值为0.37.表1是本文算法与其他算法相比较得到的结果.美国大学足球队网络是由Girvan and Newman共同完成的,该网络包括115个节点和613条边.网络中的点代表参加比赛的足球队,网络中的边代表球队间的常规赛,整个网络表示在单个赛季内美国大学足球队之间的比赛安排.由于网络分成多个组,在组内进行的比赛次数大于组间进行比赛的次数.如图4所示,本文算法将该网络被划分成12个社团,社团之间用不同的形状加以区分,与已有的划分结果一致[17].最后,计算出该网络的模块度值Q(P)=0.58,这也比网络实际模块度0.51大.表2为本文算法与其他算法的比较结果.海豚社会网络主要是描述一群生活在新西兰神奇海峡里的海豚之间频繁联系的网络,该网络是由D. Lusseau在新西兰通过观察得到的.海豚社会网络由62个点和159条边组成,点代表海豚,而边则代表海豚之间的联系.在观察期间,随着一只海豚的离开,该网络被分成左右两个社团[18],如图5所示,与已有的划分结果一致[19].而本文的算法将这两个网络进一步细分,划分的社团分别用不同的形状加以区分,但是有3个节点划分错误,即图5中最右边3个三角形节点.本文是将社团强度和改进相邻节点相似度相结合,利用分裂算法的思想,进而提出的社团划分算法.本文算法不需要提前知道社团数目,通过计算改进的相邻节点相似度矩阵,不断地删除符合要求的边,最后得到符合要求的社团.不仅时间复杂度有所降低,而且划分的社团相对准确.通过对网络上实验的结果分析,本文算法是可行、高效的.【相关文献】[1] BARABSI A L,ALBERT R.Emergence of scaling in random networks [J].Science,1999,286(5439):509-512. [2] WATTS D J,STROGATZ S H.Collective dynamics of “small-world” networks [J].Nature,1998,393(6684):440-442.[3] AMARAL L A N,SCALA A,BARTHELEMY M,et al.Classes of small-world networks [J].Proceedings of the National Academy of Sciences,2000,97(21):11149-11152.[4]NEWMAN M E J.Assortative mixing in networks [J].Physical Review Letters,2002,89(20):208 701.[5] FORTUNATO munity detection in graphs [J].Physics Reports,2010,486(3):75-174.[6]NEWMAN M E J.Detecting community structure in networks [J].The European Physical Jou rnal B-Condensed Matter and Complex Systems,2004,38(2):321-330.[7]KERNIGHAN B W,LIN S.An efficient heuristic procedure for partitioning graphs [J].Bell Syst em Technical Journal,1970,49(2):291-307.[8]FIEDLER M.Algebraic connectivity of graphs [J].Czechoslovak Mathematical Journal,1973,2 3(2):298-305.[9] 卢鹏丽,贾春旭.基于中心度发现的中心社团 [J].兰州理工大学学报,2012,38(6):82-87.[10]LEICHT E A,HOLME P,NEWMAN M E J.Vertex similarity in networks [J].Physical Review E,20 06,73(2):026120.[11]PAN Y,LI D H,LIU J G,et al.Detecting community structure in complex networks via node si milarity [J].Physica A:Statistical Mechanics and its Applications,2010,389(14):2849-2857.[12] 姜雅文,贾彩燕,于剑.基于节点相似度的网络社团检测算法 [J].计算机科学,2011,38(7):185-189.[13]NEMAN M E J,GIRVAN M.Finding and evaluating community structure in networks [J].Phys ical Review E,2004,69(2):026113.[14]WASSERMAN S.Social network analysis [M].Cambridge:Cambridge University Press,1994.[15] 贾宗维,崔军,王晓芳.复杂网络中社团结构的快速探测方法 [J].科技通报,2013,29(1):132-135.[16]ZACHARY W W.An information flow model for conflict and fission in small groups [J].Jour nal of Anthropological Research,1977,33:452-473.[17]GIRVAN M,NEWMAN M E munity structure in social and biological networks [J].Proc eedings of the National Academy of Sciences,2002,99(12):7821-7826.[18]LUSSEAU D,SCHNEIDER K,BOISSEAU O J,et al.The bottlenose dolphin community of Doub tful Sound features a large proportion of long-lasting associations [J].Behavioral Ecology and Sociobiology,2003,54(4):396-405.[19] 崔立君,任芳,嵇敏,等.复杂网络社团划分的新算法 [J].辽宁师范大学学报:自然科学版,2010,33(2):175-178.。
一种基于节点相似度的社团探测算法
一种基于节点相似度的社团探测算法王小雨;宋苗苗【期刊名称】《信息安全与技术》【年(卷),期】2012(003)008【摘要】This paper proposed a similarity between node-based structuresof the complex network of community detection algorithm (BSTN) in view of node density and other properties .It uses karate club network (karate network) and the American University Football Club Network (Football Network) validating in real networks. The experimental results were compared with the Newman algorithm and indicating that the proposed algorithm has less number of iterations and the approximate value of modularity and is effective; The experimental results may reasonable explanation the community structure ,that shows the result is in line with reality and are reasonable.%文章借鉴节点密度等性质,提出了一种基于节点间相似度的复杂网络社团结构探测算法(BSTN)。
在实际网络中进行验证,本文使用的是空手道俱乐部网络(Karate网络)和美国大学足球俱乐部网络(Football网络),实验结果与Newman算法进行了比较。
基于邻居节点相异性的社团发现新算法
基于邻居节点相异性的社团发现新算法张思源;覃森;张智丰【摘要】基于网络节点的邻居节点相异性和朴素的划分思想,提出了一种社团发现新算法.算法通过循环迭代移除网络中相异性最高的边获得新的社团结构,同时计算出社团结构的模块度.进而,寻求划分后网络模块度的最大值,得到社团结构的划分结果与最优社团数量.对计算机模拟网络和一些真实网络进行社团发现,结果表明,该算法能够有效地发现复杂网络的社团结构,且具有较高的模块度.【期刊名称】《杭州电子科技大学学报》【年(卷),期】2018(038)005【总页数】5页(P98-102)【关键词】社团发现算法;相异性;模块度【作者】张思源;覃森;张智丰【作者单位】杭州电子科技大学理学院 ,浙江杭州310018;杭州电子科技大学理学院 ,浙江杭州310018;杭州电子科技大学理学院 ,浙江杭州310018【正文语种】中文【中图分类】O157.50 引言2002年,M.Girvan和M.E.J.Newman[1]提出复杂网络的社团结构概念,并通过GN算法来检测社会和生物网络中的社团结构,标志着复杂网络社团发现问题的研究进入了一个新的阶段。
复杂网络社团发现在认识网络的拓扑结构、发现复杂网络的独有特征、理解网络的动力学及演化机制等方面具有重要的理论意义。
社团(网络内一些节点构成的集合)中的节点彼此间的连接相对紧密,但各个社团之间则为稀疏的连接。
比如,万维网能够当作是许多的网站社团构成的集合,同一社团里面包含许多网页,这些网页一般而言属于同一个网站[2]。
在各种复杂网络中,研究者均可以按照节点的特性把它们划分为不同的社团[3-4]。
社团结构分析在过去几十年内得到了多个学科领域的普遍关注和深入研究,在社会学和生物学中均有实际的应用[1,5]。
图分割算法是一种经典的社团结构检测算法,研究者还相继提出了迭代二分法、谱二分法、Kernighan-Lin算法等重要的社团结构检测方法[6]。
分级聚类(层次聚类)算法[7]按照网络内节点彼此相似程度的高低,将网络分成不同的社区。
基于自然最近邻居的社团检测算法
基于自然最近邻居的社团检测算法
朱庆生;蒋天弘;周明强
【期刊名称】《计算机应用研究》
【年(卷),期】2014(031)012
【摘要】针对传统社团检测算法无法判断网络中特殊节点和SCAN算法对于参数依赖性太大的缺点,提出了一种基于自然最近邻居概念的社团检测算法CD3N.算法利用自然最近邻居无参的特性,首先以结构相似度为基准,计算出网络节点的自然最近邻居,并依此构造小值最近邻域图;然后取邻域图中邻居数最多的节点为核心节点,根据可达关系,构造关于核心节点的社团;重复选取核心节点并构造社团的过程,直到没有可归入社团的节点.将算法应用到空手道俱乐部网络和海豚网络中,并与SCAN 算法进行对比.实验结果表明,CD3N算法有效解决了参数敏感性问题,能够很好地进行社团检测.
【总页数】4页(P3560-3563)
【作者】朱庆生;蒋天弘;周明强
【作者单位】重庆大学计算机学院软件理论与技术重庆市重点实验室,重庆400044;重庆大学计算机学院软件理论与技术重庆市重点实验室,重庆400044;重庆大学计算机学院软件理论与技术重庆市重点实验室,重庆400044
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.一种基于自然最近邻的离群检测算法 [J], 朱庆生;唐汇;冯骥
2.基于自然邻居邻域图的无参数离群检测算法 [J], 冯骥;冉瑞生;魏延
3.教育大数据下基于离群检测的教学预警模型探讨——评《基于自然邻居的聚类分析和离群检测算法研究》 [J], 朱震
4.教育大数据下基于离群检测的教学预警模型探讨——评《基于自然邻居的聚类分析和离群检测算法研究》 [J], 朱震
5.基于邻居聚类的近似最近邻搜索 [J], 赵增;李明勇;胡航飞
因版权原因,仅展示原文概要,查看原文内容请购买。
基于相邻节点聚类的社团划分算法
基于相邻节点聚类的社团划分算法马静;马英红【期刊名称】《山东师范大学学报(自然科学版)》【年(卷),期】2011(026)001【摘要】Community structure is one of properties of complex network. Nodes within the same community are tight,and loose connections with different community. Basing on the property and the distance of adjacent nodes in the network ,we propose a division algorithm of Societies. The basic concept and the implementation process of the algorithm are described and the results of applying to some instances indicate the feasibility of the algorithm.%社团结构是复杂网络中的拓扑属性之一,具有同一社团内的节点连接紧密而不同社团的节点连接疏松的性质.作者基于复杂网络中的社团结构的性质并根据网络中相邻节点的距离关系,提出了一种社团划分算法--基于相邻节点聚类的社团划分算法.笔者对算法的基本概念以及实现进行了详细的描述,通过应用在实例上所得结果说明算法的可行性.【总页数】3页(P10-12)【作者】马静;马英红【作者单位】山东师范大学管理与经济学院,250014,济南;山东师范大学管理与经济学院,250014,济南【正文语种】中文【中图分类】TP393【相关文献】1.基于节点动态连接度的网络社团划分算法 [J], 贾珺;胡晓峰;贺筱媛2.一种基于节点重要度的社团划分算法 [J], 吴卫江;周静;李国和3.基于改进相邻节点相似度的社团划分算法 [J], 卢鹏丽;赵玲艳;魏柏舟4.基于节点向量表达的复杂网络社团划分算法 [J], 韩忠明;刘雯;李梦琪;郑晨烨;谭旭升;段大高5.基于节点多属性相似性聚类的社团划分算法 [J], 邱少明;於涛;杜秀丽;陈波因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(6)
式中:DLE(Ci)和DLE(Cj)分别表示社团G和Q与外界相连边的列表,ⅣⅣ(G)和NN(Cj)分别
为社团Q和0的邻居节点的列表,SIZE(Ci)和SIZE(cj)分别表示社团G和社团Q的规模,即社团
内部节点数.
’
定义7(社团的最近邻)对于任意给定的社团C,它的最近邻定义为与该社团相连的社团中,社团相似度
义为P的节点近邻与q的节点近邻中相同节点的数目;否则它们的相似性度量定义为零.
下面给出任意两个节点P,q之间相似性度量的公式表示:
VS(p,q):{竺ze‘,Ⅳp)nⅣⅣ国”,讧∞川)∈E
(2)
L u'
else
式中:size(A)表示集合A的大小.
定义3(节点的最近邻)对于任意给定的节点P,它的最近邻定义为该节点的近邻中与它相似性度量最
关键词复杂网络;共享最近邻;社团结构
中图分类号TP393
文献标志码A
Detecting community structure based on shared nearest neighbor
GAO Xue-don91,WANG Li—minl,一,MA Hong-quan3,WU Senl
(1.School of Economics and Management,University of Science and Technology Beijing,Beijing 100083,China; 2.Management Center of China Education Economy Information Net,University of Science and TechnologyrBeijing,Beijing 100083,China;3.China Iron&Steel Research Institute Group,Beijing 100081,China)
存在k个节点与核心点e相连.由于k>d,这与核心点e的度数为d相矛盾.故证毕.
定义9只是把具有相同最近邻的节点合并在一起,形成核心社团,而核心点的最近邻并不在该核心社团
中,因此核心点还要与它的最近邻进行合并,下面给出了最近邻社团的定义.
定义10(最近邻社团)对于任意给定的两个核心社团el(al,62,…,ak),e2(bl,62,…,6。),k≤n,m≤礼,
图1两个分离的社团
图2两个互相重叠的社团
2基于共享最近邻的相似性度量
2.1节点相似性度量 共享最近邻(Shared nearest neighbor)的概念是由Ertoz[is】提出的.共享最近邻的核心思想是根据共
享的最近邻来定义两个对象之间的相似性.本文研究的是无方向、无权重的网络图,结合网络自身的特点对
度量影响的重要程度.显然Ol<1.
定义6(社团相似性度量)对于任意给定的两个社团G和o,它们之间的相似性度量的计算公式表示
如下:
s砑ize广(NN—(C—i)N—NN一(Cj)) cs(ct,G)=~—size—(D—LE—(Ci)—N D_LE五8(lCZ砑ej())L厅五+o)忑十L,SIlczelUil
大的节点的集合,公式表示为:
MⅣⅣ◇)={口I max{vs0,口)},P∈V q∈ⅣⅣp)}
(3)
如果节点A的最近邻为B,则表示为B(A).显然,节点的最近邻是单方向的,即如果A是B的最近
邻,则B不一定是A的最近邻.在现实生活中也是如此,例如A认为B是自己的密友,可是B却认为C是
他的密友.
万方数据
(4)
定义5(社团与外界相连边)对于任意给定的社团C,它与外界相连边定义为该社团内的节点直接与它 的邻居节点之间相连的边的集合,公式表示为:
DLE(C)={p,q)I p,q)∈E,P∈G q隹c)
(5)
通过观察社团之间的连接情况,我们得到影响社团相似度的三个主要因素.它们分别是:第一,社团之间 具有共享的邻居节点数;第二,社团之间具有共享的社团与外界相连边的数目;第三,社团内的节点数目.社 团之间共享的邻居节点可以看作社团之间的间接连接;社团之间共享的社团与外界相连边看作是社团之间的 直接连接.社团之间的直接连接对社团相似性度量产生的作用必然要大于间接连接.因此综合考虑这三方面 对社团相似性度量的影响,引入一个权重Ol,n表示社团之间的间接连接相对于直接连接来说对社团相似性
收稿日期:2008-05-30 资助项目:国家自然科学基金(70771007);2005年度新世纪优秀人才支持计划(NECT-05-0097). 作者简介:高学东(1963-),男,博士乍导师,教授,从事管理过程优化的研究;王立敏(1971一),女,博士研究生,从事复杂网络 社团结构的研究,E-mail:bj_wlm@sina.corn.cn:马红权(1973_),硕士,工程师,从事数据分析与处理方法的研究;武森(1971一), 女,硕士生导师,教授,从事数据挖掘,数据仓库的研究.
第29卷第10期 2009年10月
系统工程理论与实践 Systems Engineering—Theory&Practice
文章编号:1000-6788(2009)10-0102—08
V01.29,No.10 Oct..2009
基于共享最近邻探测社团结构的算法
高学东·,王立敏·,一,马红权。,武森·
共享最近邻的概念进行了改进.给定图G(K E),y表示图中的节点集合,E表示图中的边.下面给出了节点 近邻、相似性度量以及最近邻的概念.
定义1(节点近邻)对于任意给定的节点P,它的近邻定义为与该节点直接相连的节点的集合,公式表示 为:
ⅣⅣ函)={ql∞,q)∈E,P∈y)
(1)
定义2(节点相似性度量)对于任意给定的两个节点P和q,如果它们相连,则它们之间的相似性度量定
万方数据
第10期
高学东,等:基于共享最近邻探测社团结构的算法
103
社团结构的发现对于理解和利用网络结构与功能的属性至关重要.到目前为止,网络社团结构的研究主 要有两类:社会学中的分级聚类[8--10】和计算机科学中的图形分割[11--12】,其中典型的包括GN 161算法和基 于模块化指标的分级聚类算法【9,13】.之后研究者们又提出了一些新的算法[14--151.这些算法绝大多数都是将 网络划分成为若干个相互分离的社团.但是现实中许多网络并不存在绝对的彼此独立的社团结构.相反,它 们是由许多彼此重叠相互关联的社团构成.2005年,Palla[18】等人提出了一种派系过滤算法来分析这种相互 重叠的社团结构.由于派系这个概念太严格,算法的时间复杂度为a∥ln(川,其中Q和p为常数,因此在对 实际网络进行分析时可能没有多大用途,计算时间复杂度也比较高.2007年,Xu[17】等人提出了一种探测网 络社团结构算法,并把网络中的hub和outlier两类节点找出.网络还存在一类节点(称为“桥点”),即连接 两个或多个社团,并与每个社团仅有一条边相连.可以说,桥点在社团之间起着“中介”的作用.在实际中对 于桥点的识别具有重要的意义,如:对于流行病(如:SAS疾病)的传播网络,桥点是社团之间疾病传播的一 条重要途径,把桥点找出来,可以很好地切断疾病的传播途径,有效地控制疾病的传播.
(1.北京科技大学经济管理学院,北京100083;2.北京科技大学中国教育经济信息网管理中心,北京100083; 3.中国钢研集团,北京100081)
摘要针对经典重叠社团结构发现的派系过滤算法中派系定义过于严格、算法缺乏实用性、时间复 杂度高等问题,提出了一种基于共享最近邻的社团结构发现算法.该算法不仅可以对网络进行社团 结构的划分,而且可以很好地把网络中的桥点找出,算法的时间复杂度约为O(nhk),其中佗为网络中 的节点数,h为核心社团的数目,k为网络中节点的最大节点度.为了验证该算法的正确率和性能,把 该算法应用到计算机生成网络和真实网络中,并与著名的社团探测算法一GN算法和NF快速算法 进行了比较.实验的结果表明所提出的算法是有效可行的.
Keywords complex networks;shared nearest neighbor;community structure
1引言
最近几年复杂网络的研究已经引起了人们的普遍关注.随着对网络拓扑结构和动力学特征的深入研究, 人们发现了复杂网络具有的一些新特征[1--5】,其中社团结构被认为是在复杂网络的功能特性中起到核心作用 的特征【6—7】.Newman等人提出将网络节点划分成若干簇,使得簇内节点之间的连接比较稠密,而不同簇之 间节点的连接相对比较稀少的结构称之为“社团”.
本文提出了一种基于共享最近邻探测网络社团结构的算法(Detecting community structure based on shared nearest neighbor,简称“SNN”).本算法可以根据网络的结构特征把它划分为互相分离的社团或者相 互重叠的社团,而且能识别出网络中的桥点.如对于图1由于没有桥点就划分为两个单独分离的社团;而图
络中的节点数,那么我们把节点a。,a2,…,n知和e合并为—个社团,该社团称为核心社团,记作e(al,a2,…,ak).
定义9中的节点既可以指网络中的节点,也可以指网络中的社团.
性质1 核心社团中核心成员的数目一定不大于核心点的度数.
反证法:假如存在一个核心社团e(al,a2,…,ak),核心点e的度数为d,且k>d.根据节点的最近邻的 定义可知,如果节点a,,a2,…,a七的最近邻都是节点e,那么节点al,a2,…,ak一定都和e相连.这就说明
104
系统工程理论与实践
第29卷
2.2社团相似性度量 为了更准确地衡量社团之间的相似性,下面给出与社团相似性度量有关的几个概念.
定义4(社团的邻居节点)对于任意给定的社团C,它的邻居节点定义为与该社团内节点直接相连的该 社团外节点的集合,公式表示为:
NN(C)={口10,q)∈E,P∈G q隹C)
最大的社团的集合.