复杂网络链路预测研究现状与展望
基于复杂网络拓扑结构的链路预测方法研究
基于复杂网络拓扑结构的链路预测方法研究基于复杂网络拓扑结构的链路预测方法研究摘要:链路预测是复杂网络研究中的重要问题之一。
在许多实际应用中,了解网络中未来可能出现的链接对是非常有用的,它可以帮助我们了解网络的演化趋势、发现新的社交关系、预测可能的传播路径等。
本文通过研究复杂网络的拓扑结构,提出了一种基于复杂网络拓扑结构的链路预测方法,该方法可以有效地预测网络中新的链接对。
1.引言随着互联网的迅猛发展和各种社交网络的兴起,复杂网络的研究引起了广泛关注。
复杂网络不仅具有丰富的结构特征,而且具有快速演化、高效传播等特点。
链路预测作为复杂网络研究中的一个重要问题,已经成为许多领域的研究热点。
链路预测可以帮助我们预测网络中未来可能出现的链接对,从而帮助我们了解网络的演化机理、发现新的社交关系等。
2.相关工作在链路预测方面,已经有很多方法被提出,并取得了一定的成果。
这些方法可以分为基于相似度和基于结构的方法。
基于相似度的方法通过计算节点之间的相似度,来预测节点之间的链接。
基于结构的方法则利用网络的拓扑结构信息来预测链接的出现。
然而,这些方法存在一些问题,比如无法处理复杂网络中的高度非线性关系、无法考虑到网络中的动态变化等。
3.基于复杂网络拓扑结构的链路预测方法在本文中,我们提出了一种基于复杂网络拓扑结构的链路预测方法。
该方法首先分析网络中节点的度分布、聚集系数等拓扑特征,并据此构建网络的邻接矩阵。
然后,我们利用SVM(支持向量机)算法来训练链路预测模型。
在训练过程中,我们将网络中一部分已知的链接对作为正样本,将网络中不存在的链接对作为负样本。
通过不断调整模型的参数,我们可以得到一个最佳的链路预测模型。
4.实验结果与分析为了验证我们的方法的有效性,我们在多个真实复杂网络数据集上进行了实验。
实验结果表明,我们的方法能够有效地预测复杂网络中的新链接对。
与其他方法相比,我们的方法具有较高的准确率和较低的误判率。
此外,我们的方法还能够很好地适应网络的动态变化,具有一定的鲁棒性。
复杂网络的链接分析及预测研究
复杂网络的链接分析及预测研究现实世界中,有许多科技、商业、经济和生物的数据可用复杂网络来表示,例如电力网格、电话交互网、社交网络、万维网以及科学家的合著关系和引用网络;在生物学领域,有流行病学网络、细胞与新陈代谢网络和食物网络;在人际关系中,公司内部的E-mail信息交互、新闻组、聊天室、朋友联系都是网络数据的例子。
现在,链接预测问题在社会学、人类学、信息科学以及计算机科学等各个领域都受到了广泛的关注。
当前,对网络数据进行链接预测的方法主要有基于相似度的、基于似然分析的和基于概率模型的方法等。
本文对当前网络链接预测的现状进行了分析,针对当前预测算法中存在的一些问题进行了研究,提出了相应的有效的算法。
本文的主要工作如下:(1)提出了直接优化AUC的链接预测算法。
快速扩展的互联网形成了具有高维、稀疏和冗余特性的复杂网络。
因此需要有效的链接预测技术来提高链接预测的精度。
考虑到AUC指标是衡量链接预测结果质量的主要标准,提出了直接优化AUC的链接预测算法。
在该算法中,将链接预测问题看成是二值分类问题,将AUC最大化作为优化的目标,使用hinge函数作为损失函数,使用随机次梯度下降算法迭代权重向量。
实验结果表明,本算法与其他算法的结果相比,不但在AUC指标上有较大的提高,在其他指标上也超过其他算法,可以实现更高质量的预测。
(2)提出了针对节点带有属性的网络的链接预测算法。
在很多领域,比如社会学、人类学、信息科学、计算机科学中,网络节点所代表的实体往往具有自己的属性。
这些属性的取值为链接预测提供了很有价值的信息。
如何应用这些信息进行链接预测的问题已经吸引了相当多的关注。
本文提出了利用模块度测度反映网络社区结构信息链接预测算法。
基于同一个社区中的节点对之间的链接的可能性比在不同的社区中大这一事实,提出了模块度贡献的概念。
基于模块度贡献的概念,将网络的节点映射到一个低维的欧氏空间。
在这个低维空间中,在同一个社区内的节点的将处于相邻的位置。
复杂网络的链路预测算法及其应用研究
复杂网络的链路预测算法及其应用研究复杂网络的链路预测算法及其应用研究随着信息化时代的到来和互联网的广泛应用,网络结构日益复杂。
网络的复杂性使得链路预测成为了一个重要而复杂的问题。
链路预测是指通过已知网络的拓扑结构,预测出未知节点之间潜在的连接关系。
在现实生活中,链路预测算法在社交网络、信任网络、交通网络、生物网络等领域都有着重要的应用。
本文将重点介绍复杂网络的链路预测算法及其应用研究。
首先,我们需要了解什么是复杂网络。
复杂网络是由大量节点和节点之间的连接构成的,节点之间的连接关系可以用图形化的方式表示出来。
其中,节点代表网络中的实体,连接代表节点之间的关系。
复杂网络的拓扑结构既有规则性也有随机性,在真实网络中都能体现出来。
复杂网络的特点包括小世界性、无标度性、社区结构以及同配性等。
链路预测算法在复杂网络研究中具有重要的作用。
链路预测算法可以帮助我们预测网络中不存在的连接关系,并帮助我们更好地理解网络的结构和动态变化。
链路预测算法主要分为基于相似性的方法、基于机器学习的方法和基于传播模型的方法等。
基于相似性的链路预测方法主要利用已知连接关系的相似性来预测未知连接关系。
其中,常用的相似性度量方法包括共同邻居法、Jaccard系数、Katz相似性指数等。
共同邻居法指出,节点A和节点B的共同邻居越多,节点A和节点B之间存在连接的概率就越大。
Jaccard系数是用于计算两个节点之间共同邻居的比例,比例越大,两个节点之间存在连接的概率也越大。
Katz相似度指数则考虑了共同邻居的多度传递作用,加权考虑了接近距离的节点和达到距离的节点之间的连接概率。
基于机器学习的链路预测方法利用机器学习算法构建预测模型,从而预测未知连接关系。
通常,该方法首先提取网络中节点的特征,并将其作为输入特征。
然后,利用训练集的已知连接关系和节点特征进行特征学习和模型训练。
最后,通过预测模型,对未知连接进行预测。
常用的机器学习算法包括支持向量机(SVM)、决策树(Decision Tree)、随机森林(Random Forest)等。
复杂网络理论研究的现状与未来
复杂网络理论研究的现状与未来网络已经成为了人们生活中不可或缺的一部分。
无论是个人的社交网络还是全球的互联网,网络连接了我们的生活,也改变了我们的生活方式。
随着互联网的不断发展,网络已经从简单的连接工具演变成了复杂的系统。
因此,复杂网络理论的研究成为了当前的热点之一。
本文将探讨复杂网络理论的现状和未来发展方向。
一、复杂网络理论的概念和基本特征复杂网络是指由大量节点和边构成,具有复杂结构、多样性、非线性、动力学特征、自组织性、鲁棒性和鲜明的小世界效应、无标度特性等基本特征的网络。
通常情况下,复杂网络分为三类:随机网络、小世界网络和无标度网络。
随机网络是指所有节点的度数都差不多的网络,其中每个节点与其他节点随机连接。
小世界网络是指带有高度聚集性的连通性网络,即绝大部分节点都连接在一起,少数节点之间存在着远距离的联系。
无标度网络是指网络中有少部分节点拥有大量边缘连接的特性,即一小部分节点拥有着绝大部分的节点连接。
二、复杂网络理论的研究现状复杂网络理论的研究已经成为了跨学科研究的重要领域,包括数学、物理、计算机科学、生物学等。
近年来,随着人们对网络数据的深入研究,社交网络、生物网络、交通运输网络等越来越多的网络数据被发现,这些网络的存在和演变规律与我们生活中的许多重要问题相关。
比如,在社交网络中,人们如何形成朋友圈,如何通过朋友圈传播信息;在生物网络中,多种生物体之间的相互作用方式及其对生物群落演化的影响等等。
在复杂网络理论的研究中,目前主要的研究方向包括网络结构的建模和分析、网络中的动态演化过程、网络的鲁棒性和动力学过程。
在网络结构的建模和分析方面,研究者们主要从拓扑结构及其参数、形成机理、应用场景等方面展开探索。
在动态演化过程的研究中,主要探索网络中的复杂动态行为以及动态行为的建模。
在网络鲁棒性的研究中,主要探讨网络的鲁棒性如何改进和优化。
最后,在网络的动力学过程的研究中,主要是探讨网络的动态演化行为如何对网络中的元素产生影响,以及如何对网络整体产生作用。
基于复杂网络的链路预测研究
基于复杂网络的链路预测研究随着全球信息化进程的不断推进,互联网已经成为人们获取信息及交流的重要平台。
在这个互联网时代,复杂网络已经成为了网络关系研究的一个重要方向,其中链路预测是一个极具潜力的研究领域。
复杂网络是由众多的节点和链接组成的,它的网络结构非常复杂,难以直接进行分析。
因此,链路预测是一项关键的任务,它可以用来预测节点之间未来可能存在的连接。
这一任务的重要性在于,通过链路预测,我们可以识别出潜在的社交群体、网络犯罪团伙等,从而防止社交事件、打击犯罪活动。
在实践中,基于复杂网络的链路预测通常分为两种方法:基于相似性和基于机器学习的方法。
基于相似性的方法在网络中寻找相似的节点,然后将它们连接起来。
而基于机器学习的方法则是通过训练模型,例如神经网络、支持向量机(SVM)等,来预测未来可能的链接。
这两种方法各有优缺点,其应用范围也不同。
在基于相似性的方法中,常用的算法包括常用邻居方法(common neighbor)、资源分配指数(resource allocation index)、优先接近度指数(preferential attachment index)等。
这些算法都是基于节点之间的共同特征进行链路预测的。
例如,常用邻居方法是利用节点之间的共同邻居数量,认为节点之间邻居数量越多,则它们之间的连边越可能存在。
资源分配指数则根据节点间的资源分配情况来判断它们连边的可能性。
而优先接近度指数则是依据节点度数的大小来进行链路预测的。
与相似性方法相比,基于机器学习的方法更重视节点属性的多样性。
这种方法不仅考虑了节点之间的共同特征,还从节点属性、网络拓扑结构等方面综合分析,利用机器学习算法预测链路。
常用的机器学习算法包括逻辑回归、决策树、朴素贝叶斯等。
这些机器学习算法所需要的节点属性数据可以通过网络中的节点特征进行获取,例如节点的度数、介数中心性、紧密度等。
在链路预测的实践中,需要注意一些问题。
首先,节点的属性特征应该充分考虑,尽可能多地提取网络中的隐性信息。
复杂网络链路预测算法研究
复杂网络链路预测算法研究复杂网络链路预测算法研究随着社交网络、互联网和大数据的快速发展,复杂网络链路预测算法成为了一个研究热点。
复杂网络链路预测的目标是利用网络中已有的信息,通过算法预测现有的链接以及未来可能的链接。
该研究对于社交关系分析、推荐系统、信息传播以及网络安全等领域具有重要的意义。
复杂网络链路预测算法的研究可以从传统的基于拓扑结构的算法和基于机器学习的算法两个方面展开。
基于拓扑结构的链路预测算法主要利用网络的拓扑结构进行预测。
其中一个经典的算法是“共享邻居算法(Common Neighbors)”,它认为两个节点间的共享邻居越多,它们之间的链接就越可能存在。
然而,这种算法在处理大规模网络时存在效率低下的问题,因为它需要遍历整个网络来计算共享邻居的数量。
针对以上问题,研究者提出了一种改进算法,“加权共享邻居算法 (Weighted Common Neighbors)”。
该算法认为,不同的共享邻居对于链路预测的贡献度是不一样的,因此对邻居节点进行权重分配。
该算法首先通过计算节点之间的权重矩阵,然后利用该矩阵进行链路预测。
实验证明,与传统的共享邻居算法相比,加权共享邻居算法能够提高预测准确性。
除了基于拓扑结构的算法外,基于机器学习的链路预测算法在复杂网络中也被广泛应用。
这些算法主要通过学习网络中节点和链接的特征来进行预测。
其中一个常用的算法是“随机游走算法(Random Walk)”。
该算法通过在网络中进行随机游走,来学习节点间的潜在联系。
另一个算法是“支持向量机算法(Support Vector Machine, SVM)”。
该算法通过构建分类器来预测链接的存在与否。
它通过训练数据集,学习分类器的参数,从而实现链路预测。
然而,基于机器学习的链路预测算法需要依赖大量的训练数据,且对特征选择十分敏感。
因此,在实际应用中,构建合适的训练集和选择有效的特征是非常关键的。
同时,基于机器学习的算法在处理大规模复杂网络时也存在计算复杂度高的问题。
复杂网络链路预测研究现状与展望
复杂网络链路预测研究现状与展望复杂网络链路预测是指通过对已知网络拓扑结构和节点属性进行分析,预测未来可能形成的新的网络连接。
这项研究对于理解网络的演化规律、预测新的信任关系、推荐新的社交关系等具有重要意义。
本文将对复杂网络链路预测的研究现状和展望进行讨论。
首先,基于拓扑结构的链路预测方法。
这类方法主要从网络的拓扑结构入手,通过分析节点之间的连接模式,预测未来可能形成的新的连接。
其中,基于邻居节点的方法利用节点的邻居节点信息,如共同邻居数、邻居距离等,来判断节点之间是否存在潜在的连接。
而基于网络结构的方法则通过挖掘网络的结构特征,如聚类系数、度分布等,来预测节点之间的连接。
其次,基于节点属性的链路预测方法。
这类方法主要利用节点的属性信息,如性别、年龄、兴趣等,来预测节点之间的连接。
其中,基于相似性的方法通过计算节点之间的属性相似度,来判断节点之间是否存在连接。
而基于概率模型的方法则通过对节点属性的概率分布进行建模,从而预测节点之间的连接。
此外,还有一些集成了网络拓扑结构和节点属性的混合方法。
这类方法将网络拓扑结构和节点属性信息进行综合分析,从而提高链路预测的准确性。
例如,可以通过构建二部图模型,同时考虑节点的邻居节点和节点属性信息,来预测节点之间的连接。
未来,复杂网络链路预测的研究将面临以下几个挑战和展望。
首先,需要发展更加有效的特征提取方法。
当前的链路预测方法主要依赖于特征工程,即从现有的网络拓扑结构和节点属性中提取有效的特征。
然而,如何自动地提取有意义的特征仍然是一个挑战。
因此,需要研究更加高效的特征提取方法,以提高链路预测的准确性和效率。
其次,需要考虑网络的演化动态性。
当前的链路预测方法主要基于静态的网络拓扑结构和节点属性,很难适应网络的演化过程。
然而,真实的网络是动态演化的,节点之间的连接会随着时间不断变化。
因此,需要研究如何考虑网络的演化动态性,从而提高链路预测的准确性。
最后,需要解决大规模网络链路预测问题。
复杂网络中的链路预测算法研究与应用
复杂网络中的链路预测算法研究与应用随着信息时代的到来,社交网络、生物网络、交通网络等复杂网络的规模和复杂性不断增加。
在这些网络中,链路(边)的预测成为一项重要的任务,旨在通过已有的网络结构信息,预测未来可能存在的链路,从而洞察网络的演化规律、探索网络的隐含关系。
一、链路预测算法的研究进展近年来,学术界和工业界都对链路预测算法进行了广泛的研究和探索。
传统的链路预测算法主要基于相似性原理,通过计算节点对之间的相似性指标(如共同邻居、Jaccard系数、Adamic/Adar指数等),来衡量节点对之间可能存在的链接。
然而,由于复杂网络的特殊性,传统的相似性原理算法在链路预测任务中存在诸多问题,例如无法处理高度稀疏网络、忽视了节点之间的联系强度等。
为了克服传统算法的局限性,研究者们提出了各种新的链路预测算法。
其中一类常见的方法是基于机器学习的算法,如支持向量机(SVM)、神经网络(NN)、随机森林(RF)等。
这些算法通过学习已知链路属性与节点特征之间的关系,在预测未知链路时进行推断。
此外,还有一些基于社区结构、网络结构等特征的算法被提出,如基于社区信息的算法、基于路径的算法等。
二、链路预测算法的应用领域链路预测算法在各个领域都有广泛的应用。
以下是几个典型的应用领域:1. 社交网络:社交网络中的链路预测可以帮助我们发现可能有潜在关系的人物,为社交平台的推荐系统提供更准确、个性化的推荐结果。
例如,在微博平台上,可以通过预测两个用户之间是否存在链接,提供更精准的用户推荐、好友推荐等服务。
2. 生物网络:在生物网络中,链路预测可以帮助我们理解蛋白质相互作用网络、基因调控网络等生物过程中的关键因素和相互关系。
通过预测蛋白质之间的相互作用,有助于研究疾病的发生机制、药物研发等领域。
3. 交通网络:链路预测在交通网络中的应用可用于预测城市道路的流量、拥堵情况和交通状况。
基于链路预测的交通优化算法可以帮助城市规划者和交通管理部门制定更合理的交通规划和交通流管理策略,提高城市交通效率和安全性。
复杂网络中链路预测问题的研究与实证
复杂网络中链路预测问题的研究与实证复杂网络中的链路预测问题是指预测网络中未来可能存在的链路,这是网络科学和机器学习领域中的一个热门研究课题。
随着信息技术的飞速发展,复杂网络越来越多地应用于社交网络、生物网络和交通网络等领域,链路预测问题也日益受到广泛关注。
复杂网络在社交网络中应用广泛,社交网络中的链路预测问题在实际应用中得到广泛关注。
例如,当我们在社交网站上添加朋友或关注某人时,这个问题就出现了。
我们需要尽可能准确地预测新的朋友或关注对象,以更好地利用社交网络的资源。
为了解决链路预测问题,研究者们提出了多种方法,其中包括基于共同邻居度量的方法、基于随机游走的方法、基于机器学习的方法和基于深度学习的方法等。
直觉上,共同邻居度量是一种简单但有效的链路预测方法。
该方法基于思想是,如果两个节点拥有很多共同邻居,则它们之间的链路可能比较强。
随机游走是一种常见的复杂网络分析方法,也常用于链路预测问题。
该方法尝试从网络中随机选择一个节点,并通过定义特定的转移概率,沿着网络中的节点跳转。
通常情况下,从一个节点开始,随机游走器通过遍历网络中的节点来生成路径。
在这个过程中,随机游走器收集到的数据可以用于链路预测,在预测中给定两个节点,预测它们之间是否存在链路。
除了基于共同邻居度量和基于随机游走的方法外,还有基于机器学习和深度学习的方法。
通常,机器学习算法使用历史数据来识别新的链路,其中根据某些自定义特征和参数进行计算。
分类算法是预测链路存在/不存在的常见类别。
在实证方面,链路预测已在真实网络和人工合成网络中广泛应用。
真实网络数据通常是社交网络、生物网络、脑网络等。
人工合成网络被广泛使用测试算法性能,例如,随机网络、小世界网络、无标度网络等。
总的来说,复杂网络中的链路预测问题是一个活跃研究领域。
尽管已经发展出各种链路预测算法,但这个问题仍然有很大的挑战和机会。
随着社交网络、生物网络和交通网络的飞速发展,链路预测的研究仍将保持活力,在实际应用中发挥重要作用。
复杂网络结构分析与链路预测
复杂网络结构分析与链路预测随着社交网络的普及以及数据科学技术的不断发展,人们对于复杂网络结构分析与链路预测的需求也越来越高。
复杂网络具有大规模、异质性和动态性等特点,不仅涉及到社交网络、生物网络、信息网络等多个领域的研究,而且对于企业和政府部门的决策也有较大的影响。
本文将介绍复杂网络结构分析与链路预测技术的相关内容。
一、复杂网络结构分析1. 基本概念复杂网络是指由大量节点和相互之间的多重联系构成的网络,节点可以表示一些物体或事物,联系可以表示物体之间的关系,比如社交网络中的关注关系、生物网络中的代谢反应等。
复杂网络的结构可以用多种方法进行分析,主要包括以下几种:节点中心性、社区结构、网络度分布、小世界网络和无标度网络。
2. 节点中心性节点中心性是指网络中某些节点相对于其他节点的重要性程度。
在社交网络中,有些用户拥有更多的粉丝和关注者,他们的影响力也相对更大。
在生物网络中,某些物种可能在生态系统中的地位更高,也更容易成为关键物种。
常见的节点中心性包括度中心性、介数中心性和接近中心性等。
3. 社区结构社区结构是指网络中呈现出的一种模块化结构。
简单来说,社区结构是将节点分为不同的群组,使得同一群组内的节点更加紧密联系,而不同群组的节点之间联系则较疏松。
社区结构可以在多种领域中应用,比如在社交网络中,可以将联系紧密的用户分为一个群组,便于进行精准的推荐和广告投放。
4. 网络度分布网络度分布是指网络节点度数的概率分布。
度数是指节点上连接的边数,网络度分布可以反映网络节点度数的分布情况。
一般来说,网络度分布都呈现出长尾分布,即少数节点度数很大,而多数节点度数很小。
这种分布特点也是无标度网络的一个特征。
5. 小世界网络和无标度网络小世界网络指的是网络中节点之间不仅有严格的邻接关系,也存在着长距离的关联。
这种网络可以更好地模拟人类现实中的社交网络结构,具有短路径、高聚类等特点。
无标度网络则是指网络中存在少数节点度数非常高的情况,即大部分节点的度数相对较小,只有少数节点的度数非常大。
复杂网络链路预测的研究现状及展望
复杂网络链路预测的研究现状及展望吕琳媛前言:做链路预测这个方向有一年多的时间了,有一些收获和体会。
一直想写一个综述进行总结,总是希望这个综述尽可能的包括更多更全面的信息,但是新的思想和结果源源不断的涌现,所谓的综述也就无限期的搁置了下来。
前不久刚刚和伟平合作发表了一篇关于利用网络局部随机游走进行链路预测的文章,借此文发表之动力,总结一下链路预测这个方向的研究进展以及展望。
希望该文能对那些正奋战在这个方向上和希望在此领域有所建树的科研工作者有所帮助和启迪。
(本文中所提到的具体的技术方法以及实验结果将在另一篇中文综述中详细介绍。
)1.链路预测及其研究意义网络中的链路预测(Link Prediction)是指如何通过已知的网络节点以及网络结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性[1]。
这种预测既包含了对未知链接(exist yet unknown links)的预测也包含了对未来链接(future links)的预测。
该问题的研究在理论和应用两个方面都具有重要的意义和价值。
近年来,随着网络科学的快速发展,其理论上的成果为链路预测搭建了一个研究的平台,使得链路预测的研究与网络的结构与演化紧密联系起来。
因此,对于预测的结果更能够从理论的角度进行解释。
这也是我们相比计算机专业的人研究链路预测的优势所在。
与此同时,链路预测的研究也可以从理论上帮助我们认识复杂网络演化的机制。
针对同一个或者同一类网络,很多模型都提供了可能的网络演化机制[2, 3]。
由于刻画网络结构特征的统计量非常多,很难比较不同的机制孰优孰劣。
链路预测机制有望为演化网络提供一个简单统一且较为公平的比较平台,从而大大推动复杂网络演化模型的理论研究。
另外,如何刻画网络中节点的相似性也是一个重大的理论问题[4],这个问题和网络聚类等应用息息相关[5]。
类似地,相似性的度量指标数不胜数,只有能够快速准确地评估某种相似性定义是否能够很好刻画一个给定网络节点间的关系,才能进一步研究网络特征对相似性指标选择的影响。
复杂网络链路预测研究现状与展望
复杂网络链路预测研究现状与展望复杂网络链路预测研究已经成为网络科学的热点领域之一、在复杂网络中,链路预测是指通过已知网络的一部分链接信息,来推测未知链接的过程。
链路预测技术对于社交网络、生物信息学、蛋白质网络等领域具有重要意义。
本文将介绍复杂网络链路预测的研究现状和展望。
目前,链路预测的研究已经取得了一些成果。
最早的链路预测方法是基于网络的拓扑结构,通过计算节点之间的相似度来进行预测。
其中,最经典的方法是基于共同邻居的链路预测方法。
该方法认为,如果两个节点有很多共同的邻居节点,那么它们之间的链接的可能性就很高。
除了共同邻居方法外,还有许多其他基于拓扑结构的链路预测方法,如Adamic-Adar指数、Jaccard系数等。
然而,基于拓扑结构的链路预测方法并不能很好地处理复杂网络中存在的动态变化和噪声干扰等问题。
因此,研究者们提出了一系列新的链路预测方法。
例如,基于图嵌入的链路预测方法可以将网络的结构信息映射到低维空间中,从而更好地捕捉网络的特征。
此外,一些基于机器学习的方法,如支持向量机、随机森林等,也被应用于链路预测,取得了不错的效果。
除了方法的创新,研究者们还提出了一些新的评价指标来评估链路预测的效果。
最常用的指标是精确率、召回率和F1值。
此外,还有一些基于信息论的指标,如平均相对信息增益和信息熵等。
这些指标可以帮助研究者更准确地评估链路预测方法的性能。
未来,复杂网络链路预测仍然存在一些挑战和机遇。
首先,复杂网络往往具有重叠社区结构,即节点可能同时属于多个社区。
如何在这种网络中进行准确的链路预测是一个有待解决的问题。
其次,目前大多数链路预测方法还是基于静态网络的,缺乏对网络动态变化的建模能力。
因此,如何将链路预测方法与动态网络模型结合起来,将是未来的研究方向。
此外,由于现实网络中存在大量的噪声和缺失数据,如何处理噪声和缺失数据对链路预测的影响也是一个重要的研究方向。
总之,复杂网络链路预测研究已经取得了一些重要的进展,但仍然存在一些挑战和机遇。
复杂网络及其在国内研究进展的综述
复杂网络及其在国内研究进展的综述一、本文概述随着信息技术的飞速发展,复杂网络作为一种描述现实世界中复杂系统的有效工具,正逐渐受到学术界的广泛关注。
复杂网络广泛存在于我们的生活中,包括社交网络、生物网络、互联网、交通网络等,它们以复杂而多样的方式连接着世界的各个角落。
因此,对复杂网络的研究不仅具有理论价值,也具有深远的现实意义。
本文旨在全面综述复杂网络的基本理论、研究方法以及在国内的研究进展。
我们将对复杂网络的基本概念和特性进行介绍,包括网络的拓扑结构、节点间的连接关系、网络的动态演化等。
然后,我们将重点介绍复杂网络研究中的一些重要理论和方法,如网络模型、网络动力学、网络演化、网络同步等。
在此基础上,我们将对国内复杂网络研究的现状进行梳理和评价,包括研究成果、研究热点、存在问题以及未来发展趋势等。
通过对复杂网络及其在国内研究进展的综述,我们希望能够为相关领域的研究者提供一个全面的参考,推动复杂网络研究的深入发展,同时也为我国在该领域的创新研究提供有益的借鉴和启示。
二、复杂网络的基本理论复杂网络,作为一种描述现实世界中各种复杂系统的有力工具,其基本理论涵盖了图论、统计物理、非线性科学等多个学科。
其基本构成元素包括节点(Node)和边(Edge),节点通常代表系统中的个体,而边则代表个体之间的联系或相互作用。
网络中的节点和边的组合方式以及它们所承载的信息,决定了网络的复杂性和多样性。
在复杂网络理论中,有几个核心的概念和度量指标。
首先是网络的度分布(Degree Distribution),它描述了网络中节点连接数的分布情况,对于理解网络的拓扑结构和动力学行为至关重要。
其次是网络的聚类系数(Clustering Coefficient),它反映了网络中节点的聚集程度,即一个节点的邻居节点之间也成为邻居的可能性。
网络的路径长度(Path Length)和介数中心性(Betweenness Centrality)等也是重要的度量指标,它们分别描述了网络中信息传播的效率和节点在网络中的影响力。
复杂网络研究进展综述
复杂网络研究进展综述复杂网络研究是指通过网络分析方法对互联关系的研究,涉及到数学、物理、计算机等多个学科领域。
近年来,随着信息技术和互联网的不断发展,网络数据已经成为了各个领域研究的重要资源,许多重大问题的解决也需要多角度、多领域的协同研究。
因此,对于复杂网络的研究也越来越重要。
一、复杂网络的基本结构首先,我们需要了解复杂网络的基本结构。
在复杂网络研究中,主要涉及到以下几类常见的网络结构。
1. 随机网络:随机网络是最简单的网络模型之一,由完全随机地连接节点而成,没有任何规律。
这种网络结构有利于对网络的一些基本特性进行基础分析,如网络规模、度分布等。
2. 小世界网络:在小世界网络中,节点与随机连接产生一定的无序性。
同时,该网络结构也同时具备了较短的平均路径长度和较高的聚类系数的性质。
常见的小世界网络模型包括Watts-Strogatz模型和Newman-Watts模型。
3. 尺度自相似网络:尺度自相似网络中,网络的度分布服从幂律分布,这也是尺度自相似网络最为重要的性质之一。
例如常见的无标度网络就是一种尺度自相似网络。
以上三种网络结构模型可以为我们研究其他领域的复杂网络提供一定的参考。
而在实际的应用过程中,我们还需要考虑到网络的动态性和异质性等方面的问题。
二、复杂网络的应用研究在实际应用中,复杂网络已经成为了各个领域的研究对象。
下面,我们将重点介绍一下目前较为热门的几个应用领域。
1. 社交网络社交网络是指一个以人际关系为基础的网络,由于社交网络的崛起,大量的社交网络数据被收集,这些数据包括人员之间的联系以及个人信息。
基于复杂网络理论,我们可以从这些数据中分析出统计规律,从而揭示其中的信息本质。
目前,社交网络研究的热点包括网络演化、社交网络中的信息扩散等问题。
例如,利用局部信息来推断节点的社交角色,或者利用结构化的社交网络分析来预测个人的行为和个性。
2. 交通网络另一个重要的领域是交通网络。
道路、铁路、航空运输等交通网络已经成为现代社会高效运行的重要组成部分。
复杂网络研究现状展望
狄增如 北京师范大学管理学院系统科学系 北京师范大学复杂性研究中心
北京大学---2007.11
关于复杂性
关于复杂性
我们所关心的问题:
– 大量个体(更典型的是具有适应性的主体) 所组成的复杂系统,在没有中心控制、非 完全信息、仅仅存在局域相互作用的条件 下,通过个体之间的非线性相互作用,可 以在宏观层次上涌现出一定的结构和功能。
信息网络:WWW,专利使用,论文引用,计 算机共享
技术网络:电力网,Internet,电话线路网, 交通运输网:航线网,铁路网,公路网,自
然河流网
复杂网络
A Unified Approach towards the
Connection Topology
of various Complex Systems
P(k) e pN ( pN )k ek k k
k!
k!
10000个顶点
p=0.0015
度分布
幂律分布——Power Law
P(k) k =-3
ln P(k) ln k
World Wide Web
Nodes: WWW documents Links: URL links 800 million documents (S. Lawrence, 1999)
A food web
网络研究的历史
1736,欧拉:哥尼斯堡七桥
1950,Erdos, Renyi: 随机图论
1998,Strogatz, Barabasi: 小世界和无 标度网络
为什么现在才开始研究复杂网络?
计算机技术的发展:
– 使我们拥有各种网络的数据库,并有可能对大规模的网络进 行实证研究
基于复杂网络的识别与预测技术研究
基于复杂网络的识别与预测技术研究复杂网络是由许多节点与联系组成的一种大型网络结构。
这种网络结构主要应用于社会、经济、生物、物理和计算机等领域。
随着大数据的不断涌现和快速发展,复杂网络的识别与预测技术也越来越受到研究者的关注,成为了目前热门的研究方向之一。
一、复杂网络的特点及应用复杂网络的特点是其节点之间的联系不是简单的线性结构,而是非线性结构所组成。
在现实应用中,复杂网络可以用来研究社交网络、金融市场等众多领域,尤其在疫情、自然灾害等方面也可以发挥重要的作用。
例如,在疫情爆发的时候,复杂网络可以用来分析病毒传播链,预测未来疫情走向,并提出针对性的疫情防控措施。
二、复杂网络的识别技术复杂网络的识别技术是指在大规模网络结构中,通过分析节点和联系之间的关系,来确定网络结构的一种方法。
复杂网络的识别技术主要包括以下几种:1. 社区识别社区识别是指在网络中,将节点按照某种标准划分成若干个社区的方法。
社区为网络中具有一定互相联系的节点集合。
社区识别可以帮助我们了解网络中不同社区的特征,从而更好地分析和理解网络结构。
2. 中心节点识别中心节点识别是指在复杂网络中,识别出拥有更多的联系、更多的影响力和关键性的节点。
中心节点通常具有更大的度数和更短的平均路径长度。
中心节点的识别可以帮助我们了解网络中最重要的节点,为设计优化网络结构提供帮助。
3. 强连通分量识别强连通分量是指在网络中,任意两个节点之间都存在一条路径,即这两个节点是相互可达的。
强连通分量识别可以帮助我们了解强连通分量的结构和性质,从而更好地研究网络中的信息流动和传播规律。
三、复杂网络的预测技术复杂网络的预测技术是指通过分析网络结构的演化规律和节点间的关系,来预测网络在未来的发展趋势。
复杂网络的预测技术主要包括以下几种:1. 基于时间序列预测的方法基于时间序列预测的方法是指通过对网络数据的历史发展趋势进行观察和分析,来预测未来的网络演化趋势和结构变化。
复杂网络重构、链路预测算法研究及应用
复杂网络重构、链路预测算法研究及应用复杂网络重构、链路预测算法研究及应用摘要:复杂网络是研究各种现实系统中相互联系的元素及其关系的一种重要工具,而复杂网络的重构与链路预测算法则是在网络拓扑结构变化的情况下,通过已有的网络信息对缺失的或未来可能出现的网络链接进行预测的关键技术。
本文将重点探讨复杂网络重构的基本方法、链路预测算法的主要原理及其在实际问题中的应用情况。
一、引言复杂网络的研究是近年来网络科学领域的热点之一。
随着计算机技术和数据采集技术的快速发展,人们日益关注各种实际系统中的网络结构。
复杂网络常常涉及到大量的节点和链接,并且其拓扑结构与随机网络和规则网络存在显著差异。
复杂网络的重构和链路预测算法是对复杂网络进行深入研究的重要方法,不仅可以帮助我们更好地理解网络的内在规律,还可以应用于实际问题中,如社交网络分析、疾病传播预测等。
二、复杂网络的重构方法复杂网络的重构方法主要有两种:结构重构和动态重构。
1. 结构重构结构重构主要是通过已知的网络信息来还原或生成网络的拓扑结构。
常用的方法包括:(1)节点相似性方法:基于节点间的相似性度量,通过计算节点之间的相似性指标,来预测节点之间的链接关系。
这种方法适用于生物信息学、社交网络等领域。
(2)基于邻居信息的方法:基于节点的邻居信息,通过邻居关系的传递性质来预测节点之间的链接关系。
这种方法适用于多层次网络和社交网络。
(3)概率模型方法:通过构建概率模型来预测节点之间的链接关系。
例如,随机图模型、混合概率模型等。
2. 动态重构动态重构主要是针对网络结构不断变化的情况下,通过现有的网络信息来预测未来可能出现的链接关系。
常见的方法有:(1)基于时间序列分析的方法:通过对网络的历史演化过程进行时间序列分析,来预测未来可能出现的链接关系。
例如,ARIMA模型、GARCH模型等。
(2)基于机器学习的方法:通过已知的网络信息构建机器学习模型,来预测未来可能出现的链接关系。
复杂网络现象研究及分析方法
复杂网络现象研究及分析方法复杂网络是由大量节点和相互连接的边构成的网络系统,其结构和行为具有复杂性和非线性特征。
在各个领域中,复杂网络都广泛存在,并包含着丰富的信息和规律。
研究复杂网络现象和分析其特征可以帮助我们更好地理解和解释现实世界中的复杂系统,如社交网络、生物网络、物流网络等。
本文将介绍复杂网络现象的研究内容和分析方法。
一、复杂网络现象的研究内容1. 结构特征分析复杂网络的结构特征是指网络中节点之间连接的方式和模式。
研究网络的结构特征可以揭示网络的整体性质和发展规律。
其中最基本的结构特征是度分布,即节点连接的数量分布情况。
例如,某些网络中存在少数节点连接数非常高,而大多数节点连接数较低的现象,被称为幂律分布。
其他常见的结构特征还包括聚类系数、平均路径长度等。
2. 动力学分析复杂网络的动力学特征是指网络系统随时间演化和变化的行为。
动力学分析可以研究网络中节点的演化规律、信息传播模式和系统的稳定性等。
例如,研究在网络中引入节点或删除节点的效果,可以探究网络系统的鲁棒性和脆弱性。
此外,通过分析网络中信息传播的路径和速度,可以预测疾病传播、舆论演化等现象。
3. 同步现象研究复杂网络中的同步现象是指网络节点之间在时间上出现一致演化的现象。
同步现象广泛存在于自然界和社会系统中,如心脏的跳动、脑区的激活等。
研究同步现象可以揭示网络系统中节点之间的相互作用和调控机制。
例如,通过构建耦合节点的模型,可以发现节点之间的同步阈值和同步模式。
二、复杂网络分析方法1. 大数据处理复杂网络研究中常常涉及到大规模数据集的处理和分析。
大数据处理方法可以帮助整理和提取网络中的信息,并准确计算各种指标和特征。
例如,常用的大数据处理技术包括图算法、机器学习、数据挖掘等。
这些方法能够快速处理大量数据,并发现隐藏的规律和模式。
2. 网络建模与仿真复杂网络的建模和仿真是研究网络现象和分析方法的重要手段。
通过构建合适的数学模型和复杂网络的拓扑结构,可以模拟网络中的行为和动态过程。
复杂网络研究及其应用前景
复杂网络研究及其应用前景近年来,复杂网络研究成为了一个备受关注的学科领域。
从社会网络到物理网络,从生物网络到信息网络,这个领域呈现出了非凡的活力和发展潜力。
在这篇文章中,我们将讨论复杂网络的基本概念、研究方法以及其应用前景,以期能对大家形成一个全面的认知。
什么是复杂网络?首先,我们需要明确什么是复杂网络。
复杂网络是一种由许多节点(点)和边(线)组成的系统,节点和边之间的联系应该是不规则的、非线性的、杂乱无序的。
一个复杂的网络体系可以是人类社会、生物生态系统、天气模式或交通流网络,总之任何一个系统内部有许多因素之间有复杂关系的地方,都可以看做是一个复杂网络。
研究复杂网络的意义在哪里?研究复杂网络的内容主要包括了以下几个方面:网络模型、网络动力学、网络结构、复杂网络控制以及复杂网络在各个领域的应用。
这些研究对于我们很多领域都有着重要的意义,特别是对于社会、经济、心理等方面。
比如,社交网络领域的研究,通过对网络中的节点和边进行分析,可以直接了解社会和人际关系的发展趋势,从而预测社会、商业和政治方面的变化。
在经济学领域,复杂网络的研究可以帮助我们识别和评估市场影响因素,推进市场分析和预测技术的发展。
同时,还可帮助我们探究一些经济问题,如金融风险投资,购物消费趋势等等,从而优化我们的决策。
如何研究复杂网络?现代复杂网络研究采用的是多学科交叉的研究思路,方法主要包括数学建模、计算机模拟、实验观测及数据挖掘等多种手段。
在网络模型研究方面,我们通常会采用大量的数据,根据节点之间的联系,通过模型的构建和计算机模拟,然后寻找模型的一些特性和规律。
同时,对于实验研究,较常用的手段是利用工具箱和其他专门处理网络数据的软件,如igraph 和gedit,我们可以利用这些软件分析网络的度分布、小世界性、网络社团划分等特征。
相比较而言,数学建模在复杂网络研究中的地位更加重要。
其主要的手段是图论、复杂系统理论等,我们利用这些工具来刻画网络内各种各样的特征,识别系统内部的模式,预测未来的变化趋势。
基于复杂网络的社交网络分析与预测研究
基于复杂网络的社交网络分析与预测研究社交网络是指由一群人相互关联并以某种形式共享信息的网络。
随着互联网的发展,社交网络已经成为了人们日常生活中不可或缺的一部分。
人们通过社交媒体的互动与分享,交流信息和观点,并建立起了崭新的社交关系网络。
如何在这个网络中进行有效的分析与预测已成为当前复杂网络领域的研究热点。
本文将从复杂网络的角度出发,探讨社交网络的分析与预测,并介绍目前研究的成果和未来的发展方向。
一、社交网络的复杂性社交网络具有随机性、异质性、动态性和尺度性等复杂性特点。
在社交网络中,节点数目众多,节点的连接方式也复杂多样。
因此,社交网络的复杂性使得研究者在进行分析与预测时既充满挑战也具有广泛的应用前景。
二、社交网络的分析方法社交网络的分析方法一般包括以下几个方面:(1)社区发现。
社群是指在社交网络中互相联系的人群集合体,社群内的关系紧密而社群之间的联系相对较弱,而社区发现则是寻找社群内的联系和边界,从而揭示社交网络的内在结构。
(2)影响力分析。
影响力是指在社交网络中有一定影响力的节点,通过对某个节点的影响程度的评估,可以理解社交网络中消息的传播规律,从而优化社交网络的信息传播过程。
(3)用户行为分析。
用户行为分析利用用户的行为数据,并借用数据挖掘算法去揭示出社交网络中用户的行为和性格等信息,为社交网络中的应用提供数据支持。
三、社交网络的预测方法通过对社交网络的分析,可以得到网络的结构信息和节点特征信息,进而可以进行预测。
社交网络的预测方法主要分为以下几个方面:(1)节点连接预测。
节点连接预测是指对于没有连边的节点预测与其到同一个社区的节点之间的连边。
基于相似性匹配、概率模型等方法,可以对这种连边进行预测,从而更好地理解社交网络的形成过程和演化规律。
(2)信息传播预测。
信息传播预测是指预测某条信息在社交网络中的传播效果,包括传播范围、传播时间和传播强度等。
利用传播模型和机器学习等技术,对信息传播进行深入研究,可为营销和推广等提供重要依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复杂网络链路预测的研究现状及展望吕琳媛前言:做链路预测这个方向有一年多的时间了,有一些收获和体会。
一直想写一个综述进行总结,总是希望这个综述尽可能的包括更多更全面的信息,但是新的思想和结果源源不断的涌现,所谓的综述也就无限期的搁置了下来。
前不久刚刚和伟平合作发表了一篇关于利用网络局部随机游走进行链路预测的文章,借此文发表之动力,总结一下链路预测这个方向的研究进展以及展望。
希望该文能对那些正奋战在这个方向上和希望在此领域有所建树的科研工作者有所帮助和启迪。
(本文中所提到的具体的技术方法以及实验结果将在另一篇中文综述中详细介绍。
)1.链路预测及其研究意义网络中的链路预测(Link Prediction)是指如何通过已知的网络节点以及网络结构等信息预测网络中尚未产生连边的两个节点之间产生链接的可能性[1]。
这种预测既包含了对未知链接(exist yet unknown links)的预测也包含了对未来链接(future links)的预测。
该问题的研究在理论和应用两个方面都具有重要的意义和价值。
近年来,随着网络科学的快速发展,其理论上的成果为链路预测搭建了一个研究的平台,使得链路预测的研究与网络的结构与演化紧密联系起来。
因此,对于预测的结果更能够从理论的角度进行解释。
这也是我们相比计算机专业的人研究链路预测的优势所在。
与此同时,链路预测的研究也可以从理论上帮助我们认识复杂网络演化的机制。
针对同一个或者同一类网络,很多模型都提供了可能的网络演化机制[2, 3]。
由于刻画网络结构特征的统计量非常多,很难比较不同的机制孰优孰劣。
链路预测机制有望为演化网络提供一个简单统一且较为公平的比较平台,从而大大推动复杂网络演化模型的理论研究。
另外,如何刻画网络中节点的相似性也是一个重大的理论问题[4],这个问题和网络聚类等应用息息相关[5]。
类似地,相似性的度量指标数不胜数,只有能够快速准确地评估某种相似性定义是否能够很好刻画一个给定网络节点间的关系,才能进一步研究网络特征对相似性指标选择的影响。
在这个方面,链路预测可以起到核心技术的作用。
链路预测问题本身也带来了有趣且有重要价值的理论问题,也就是通过构造网络系综并藉此利用最大似然估计的方法进行链路预测的可能性和可行性研究。
这方面的研究对于链路预测本身以及复杂网络研究的理论基础的建立和完善,可以起到推动和借鉴的作用。
链路预测研究不仅具有如上所述的理论价值,其更重要的意义还是体现在应用方面。
很多生物网络,例如蛋白质相互作用网络和新陈代谢网络,节点之间是否存在链接,或者说是否存在相互作用关系,是需要通过大量实验结果进行推断的。
我们已知的实验结果仅仅揭示了巨大网络的冰山一角。
仅以蛋白质相互作用网络为例,酵母菌蛋白质之间80%的相互作用不为我们所知[6],而对于人类自身,我们知道的仅有可怜的0.3%[7,8]。
由于揭示这类网络中隐而未现的链接需要耗费高额的实验成本。
那么如果能够事先在已知网络结构的基础上设计出足够精确的链路预测算法,再利用预测的结果指导试验,就有可能提高实验的成功率从而降低试验成本并加快揭开这类网络真实面目的步伐!实际上,社会网络分析中也会遇到数据不全的问题,这时候链路预测同样可以作为准确分析社会网络结构的有力的辅助工具[9,10]。
除了帮助分析数据缺失的网络,链路预测算法还可以用于分析演化网络,即对未来的预测。
举例来说,近几年在线社交网络发展非常迅速[11],链路预测可以基于当前的网络结构去预测哪些现在尚未结交的用户“应该是朋友”,并将此结果作为“朋友推荐”发送给用户:如果预测足够准确,显然有助于提高相关网站在用户心目中的地位,从而提高用户对该网站的忠诚度。
另外,链路预测的思想和方法,还可以用于在已知部分节点类型的网络(partially labeled的类型[12]或者判断一个手机用户是否产生了切换运营商(例如从移动到联通)的念头[13]。
最近在一篇关于链路预测的工作中提到了不仅可以预测所谓的缺失链接还可以预测网络中的错误链接[14],这对于网络重组和结构功能优化有重要的应用价值。
例如在很多构建生物网络的实验中存在暧昧不清甚至自相矛盾的数据[15],我们就有可能应用链路预测的方法对其进行纠正。
2.研究现状链路预测作为数据挖掘领域的研究方向之一在计算机领域已有一些早期的研究。
他们的研究思路和方法主要基于马尔科夫链和机器学习。
Sarukkai[16]应用马尔科夫链进行网络的链路预测和路径分析。
之后Zhu等人[17]将基于马尔科夫链的预测方法扩展到了自适应性网站(adaptive web sites)的预测中。
此外,Popescul和Ungar[18]提出一个回归模型在文献引用网络中预测科学文献的引用关系。
他们的方法不仅用到了引文网络的信息还有作者信息,期刊信息以及文章内容等外部信息。
应用节点属性的预测方法还有很多,例如O’Madadhain等人[19]利用网络的拓扑结构信息以及节点的属性建立了一个局部的条件概率模型来进行预测。
Lin[20]基于节点的属性定义了节点间的相似性,可以直接用来进行链路预测。
虽然应用节点属性等外部信息的确可以得到很好的预测效果,但是很多情况下这些信息的获得是非常困难的,甚至是不可能的。
比如很多在线系统的用户信息都是保密的。
另外即使获得了节点的属性信息也很难保证信息的可靠性,即这些属性是否反映了节点的真实情况,例如在线社交网络中很多用户的注册信息都是虚假的。
更进一步,在能够得到节点属性的精确信息的情况下,如何鉴别出哪些信息对网络的链路预测是有用的,哪些信息是没用的仍然是个问题。
因此与节点属性信息相比较,已观察到的网络结构或者用户的历史信息更容易获得也是更可靠的。
近几年,基于节点相似性的链路预测方法受到了广泛的关注。
此方法的一个重要前提假设就是两个节点之间相似性(或者相近性)越大,它们之间存在链接的可能性就越大。
因此如何定义节点的相似性就成为该方法的一个核心问题。
尽管这个框架非常简单,但是相似性定义本身内涵丰富,它既可以是非常简单的共同邻居的个数,也可以是包含了复杂数学物理内容的诸如随机游走的平均通讯时间[21]或者是基于图论的矩阵森林方法 [22]。
因此这个简单的框架事实上提供了无穷无尽的可能性。
Liben-Nowell和Kleinberg[23]提出了基于网络拓扑结构的相似性定义方法,并将这些指标分为基于节点和基于路径的两类,并分析了若干指标对社会合作网络中链路预测的效果。
他们发现,在仅考虑节点邻居信息的若干指标中,Adamic-Adar参数[24]表现最好。
周涛、吕琳媛和张翼成[25]在6种不同网络中比较了9种已知的基于局部信息的相似性指标在链路预测中的效果,并提出了两种新指标:资源分配指标(resource allocation index)和局部路径指标(local path index)。
研究发现,新提出来的这两种指标具有明显好于包括Adamic-Adar参数在内的9中已知指标的预测能力。
最近其他小组的研究结果显示,新提出来的相似性指标在进行群落划分[5]和含权网络权重设置[26]的时候也比原有指标好。
吕琳媛、金慈航和周涛[27]进一步在噪音强度以及网络密度可控的网络模型中细致分析了局部路径指标的性能,发现这个指标在网络的平均最短路径较小的时候具有与依赖于网络全局结构信息的指标,例如Katz参数[28],可匹敌的预测能力,甚至在噪声较大的情况下可以比Katz参数预测的更加准确。
另外,由于局部路径指标仅仅考虑了网络的局部信息,其计算量远远小于基于全局信息的指标,特别是在网络规模较大且稀疏的情况下,局部路径指标在计算复杂度上的优势更加明显,因此其应用前景相当可观。
最近,刘伟平和吕琳媛[29]提出了两种基于网络局部随机游走的相似性指标,通过与其他五种相似性指标的比较,发现有限步的随机游走可以给出比全局收敛后的预测精度更好的结果,而最优的游走步数受到网络平均距离的强烈影响。
此外,在五种网络上的比较结果显示该方法比08年Nature[31]上提出的基于网络层次结构的预测方法准确度更高。
另外,Huang 等人的实验结果显示[30],在得到节点间的直接相似性后,利用协同过滤技术对相似性指标进行一轮加权处理,一般而言可以得到更好的结果。
这一方法已广泛应用于推荐算法的设计上,并得到了成功。
实际上,个性化推荐可以看作是链路预测的一个子问题。
链路预测另一类方法是基于最大似然估计的。
Clauset, Moore和Newman[31]认为很多网络的连接可以看作某种内在的层次结构的反映,基于此,他们提出了一种最大似然估计的算法进行链路预测,这种方法在处理具有明显层次组织的网络,如恐怖袭击网络和草原食物链,具有较好的精确度。
但是,由于每次预测要生成很多个样本网络,因此其计算复杂度非和Sales-Pardo[14]假设我们观察到的网络是一个随机分块模型(Stochastic Block Model)[32]的一次实现,在该模型中节点被分为若干集合,两个节点间连接的概率只和相应的集合有关。
他们所提出的基于随机分块模型的链路预测方法,可以得到比Clauset, Moore和Newman更好的结果。
以此同时,该方法不仅可以预测缺失边,还可以预测网络的错误链接,例如纠正蛋白质相互作用网络中的错误链接。
另外一个需要特别注意的趋势,是随着一些原来从事复杂网络研究的学者对链路预测问题的关注,很多复杂网络,特别是社会网络分析中遇到的理论与方法被应用到链路预测中。
例如吕琳媛和周涛[33]发现在针对某些含权网络进行链路预测的时候,权重很小的边反而起到了比高权重边更大的作用,这与社会网络研究中广为人知的“弱连接理论”[34]有深刻的关联。
Leskovec, Huttenlocher和Kleinberg[35]则注意到了近期“社交平衡理论”的定量化研究成果[36,37],并在此启发下设计了可以预测网络中的正负(友敌)链接的算法。
链路预测最近两年受到了比较多的关注,很可能得益于Clauset, Moore和Newman在08年发表的《自然》论文[31],以及Redner在《自然》上的评论文章[38]。
弗里堡小组较早地认识到链路预测问题的重要价值,并开展了一系列的工作。
同时,通过大力的宣传国内对这个方向已经开始有一些关注。
湘潭大学胡柯小组[40]利用链路预测方法预测人类蛋白质相互作用网络中的致病基因,也得到了不错的精度。
最近胡柯小组及青岛理工大学许小可与弗里堡小组就有向网络的链路预测问题和社会平衡理论应用于链路预测的问题展开了紧密合作。
3.前沿趋势分析及展望我们注意到一方面受阻于网络节点外在属性在获取上的难度,另一方面受益于复杂网络研究的快速发展,链路预测问题的主要研究热点逐渐从依赖于节点属性的方法转移到只利用网络结构信息的方法上[23]。