一个基于中心度的社团结构发现新算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本文针对 G N算法节点 边介数 计算 开销大 的 问题 提出一 种基于 中心 度 的启 发 式 G 改进 算 法 ( N 简称 D G C N算 法 ) 。
DG C N算 法基本思想是根据节点 中心度 ( erecn ai ) dge et t 以及 r y l
节点之问的最 短路径确定不 同社 团结构 中心节点 , 然后 以社团 中心节点之 间最短路径需经过的节点作为源节点计算边 介数 , 逐步删 除最大边 介数 的连边 , 到全 部成 员节点 完成 社 团划 直 分 。D G C N算法避免 了计算网络 中所有节点 的边介 数 , 而降 从
f a i l y a d e fci e s . e sbit n fe tv ne s i
Ke y wor s: c mm u iy sr cu e;d g e e taiy;GN lo t m ;DCGN l oihm d o n t tu tr e r ec n r l t ag r h i a g rt
( 。 ) 其 中 n为节点数 , 为节点连 边数。Tlr mn , m ye 等人 提出
0 引言
社 团结构发现 对理 解复 杂 网络 结构 特征 属性 至关 重要 。 目前社 团结构发现方法主要分为两大类 , 即计算机科 学中的图 分割算法和社会学领域的层级 聚类 算法… 。针对 图分割算法
o) d 估算 出部分连接 的近似边介 数 , 而不是计 算出全部连 接的
精确边介数 。显然 , 这种 方法计算速度 的提高是 以牺牲聚类精
度为代价 的。考虑到 G N算法效 率低是 因为 边介数 计算开销
过 大 , aici 人 提 出 了 连 接 聚 类 系 数 (ikc s r gc— R dch 等 1 l t n o n ue i
o o ei , ei 10 8 ,C i 2 Istt o nfcuen ut ee p et N nh n n kn nvrt, ac ag3 0 6 nl yB i g B in 0 0 3 hn ; .ntu g j n jg a i e fMauatr Id syD vl m n , aca gHagog U i sy N nhn 30 3, r o e i
g n r td rnd ml y c m p tr,a d t e o a e h m . Ex e m e tr s t h wst e p o o e lo t m s a a a ei e e ae a o y b o u e n h n c mp r d te pr i n e ul s o h r p s d a g r h ha dv ntg n s i
中N P难 问 题 , 型 局 部 搜 索 策 略算 法 是 基 于 L pae图 特 征 典 al c 值 的 谱 平 分 法 和 K ri a-i 法 ( 称 K e g nLn算 nh 简 L算 法 ) 。
一
种近似 G N算法 , 该算法用蒙特卡罗方法 ( n al me ・ Mot C r t e o h
nwG l rh ae ndge et ly D G .A cri oedge e t i n eso et aha og hm, e N a oi m bsdo er cnr i ( C N) codn t nd e e nr t a d h r spt m n e g t e at go r c ay l t ht t
di1 .9 9 ji n 10 — 6 5 2 1 .8 0 0 o:0 3 6 /.s .0 13 9 .0 1 0 .3 s
Ne ag rt m fd t c i g c mmu i tu t r a e n d g e e ta i w l o i h o e e tn o n t sr c u e b s d o e r e c n r lt y y
戴爱 明h ,高学东h,王立敏
(. 1北京科技 大 学 a经 济管理 学院 ; . . b 中国教 育 经济信 息网管理 中心 , 北京 10 8 ; . 003 2 南昌航 空 大学 制造 业发
展研 究所 ,南 昌 3来自百度文库0 6 ) 303
摘
要 :针对 c N算法在社 团结构 发现 中时 间复杂度 高等 问题 , 出一 种基 于 中心度 的 G 提 N改进 算 法( C N) DG 。
DAIAimi g — n . GAO e do ,W ANG imi Xu . ng L— n
( . . colfE oo i 1n Sho o cnmc s&Maa e et b Maa e et et C iaE uai cn m fr tnN t nvrt o Si c Tc— ngm n, . ngm n ne o hn dct nE oo yI omai e,U i syf c ne& eh C r f o n o e i e
te ag r h f s c n r d t ec mmu i t cu ec nr l o e ,t e eee d e i eb g e t ewe n e sa n e h lo i m i t o f me o t r i h nt sr t r e t d s h n d ltd e g sw t t ig s b t e n s mo g t y u an hh h
hr a y网络及 计算机 随机 生成 网络 中并进 行 了比较 。 实验 结果 表 明 , 所提 出的 D G 算法在 运 行 效 率和效 果 方 CN
面较之 G N算 法均 具有 一定的优 势 。 关键 词 :社 团结构 ;节 点 中心度 ; N 算法 ; C N算 法 G DG
中图分类号 :T 3 3 P 9 文献标 志码 :A 文章 编号 :10 —6 5 2 1 ) 8 2 0 — 3 0 1 3 9 ( 0 1 0 —9 9 0
C Ⅱ)
Ab tac s r t: Usn ig GN l o t ag r hm odee tt o i t tc he c mmu t tu t r ni sr c u e,t e e wilbehih tme c m pe iy Th spa rp o o e y h r l g i o lxt . i pe r p s d a
作者简介:戴爱明( 95 ) 男, 17 一 , 江西南丰人, 副教授 , 博士研究生 , 主要研 究方 向为复 杂网络 ( amn 7 5 ao.o .o ; d iig19 @yho cr c ) 高学东(9 3 ) n 16 . ,
男, 河北 唐 山 人 , 院长 , 授 , 导 , 副 教 博 主要 研 究方 向 为 管理 过 程 优 化 .
m 算法( n a 简称 G N算法 ) 。G j N算 法 引入边 介 数 ( deb. eg—e
ten es 概念 , w ens) 其基本思 想是 网络 中边介数 最大 的边 有可 能 是社 团之 间的 连边 , 边介 数 可 以通过 最短路 径 来进 行计 算 。 G N算 法 由于边 介 数 计算 开 销 过大 而 导致 时 间 复 杂性 为 0
给定无 向连通图 G=( , , n m和 h分别表示 G中的 VE) 用 、 节点 、 连边和社 团划分数量 。该算法本质是网络由第一个社团 中心节点开始不断向外扩展 , 到找到满足社团结构数的中心 直
收 稿 日期 :2 1 - 1 0 0 l0 —6;修 回 1 期 :2 1 —2 2 3 0 10 — 8
(0 9 G 6 2 ) 20 Z 5 0 2
基 金 项 目 : 国 家 自然 科 学 基 金 资 助 项 目 (0 6 0 8 ; 家 航 空科 学 基 金 资 助 项 目 79 2 0 ) 国
rm t a uan hnuigG loi m, h grh ni t e0(m )w e w s o s n, a te u br f a e r l lt g e s N a rh tea oi m r m c n hnc a cnt t nw sh m e ecc i w n g t l t a ni a a n o
该算 法根 据 节点 中心 度 以及 节点之 间的 最短路 径首 先确 定社 团结构 中心 节点集 , 然后 逐步删 除社 团结构 中心 节 点之 间的 最大边介数 连边 , 完成 社 团结构 划分。D G C N算法避 免 了 G 算法边介 数计 算开销 大的 问题 , N 算法 的时 间复 杂度 约为 O(mn , 中 c为常数 , 网络成 员数 , 为 网络 连 边数 。将 D G 和 G 算法 同 时应用 到 z c )其 n为 m CN N a
c m mu iy sr cu e c nta o e y se o nt t t r e r ln d sb tp,t ns h o mu iy sr cu e dv d n .Thi g rt m o d o ih c s fp — u o f ih t e c m i n t t tr ii i g u sa o ih g t fhg o to a l i r
n t o k me e ,m s h u e f e w r d e p l d b t hsa g r h a d GN ag rtm oZ c ay n t n h e ew r mb r wa e n mb r t o k e g .A pi oh t i l o t m n l o h t a h r e d t e n t t on e i i a
谱平分法最坏情况 下时间复杂度 为 0( , L算 法的时间复 n)K 杂性是 0(n) 其 中 n表示 网络节 点数 , 表示 迭代 次数。谱 t , t 平分法和 K L算法均需 要事先知 道该 网络的两社 团特征 , 否则 可能得不 到正 确结 果 。层级 聚类 典 型算 法 是 Gra, e . i nN w v
e c n) i e f i t取代 G N算 法的边介数 , 这一算 法的时 间复杂性 为 0 ( / 。对于稀疏 网络 , m4n ) 算法 时间复 杂度为 O( , n ) 该算法
的 最 大 局 限 性 是 不 适 合 处 理 短 回路 很 少 甚 至没 有 的复 杂 网络 。
第2 8卷第 8期
2 1 年 8月 01
计 算 机 应 用 研 究
Ap l a in Re e rh o mp t r p i t s a c fCo u e s c o
Vo _ . l28 No 8 Au .2 1 g 01
一
个 基 于 中心度 的社 团结构 发 现 新 算 法 冰
・
21 9 0・
计 算 机 应 用 研 究
第2 8卷
低了G N算法的时间复杂度 。
长度。考虑到 c 和 d ,计量单 位的不 同, cv ) 在实际计算过
程 中需 作 标 准 化 处 理 。
1 相关定 义及算 法提 出
复杂网络节点度是指 网络 中任意节点 与此节点连接 边的 数 量。节点 中心度是描述 网络局部特性 的基本参数 , 可以反映 网络的宏观统计特征 , 而节 点最短路径具 有重要几何 性质 , 对 衡量节点之 间的跨度 比较 有实 际意义 。为 了简便起 见 , 本文研