自然基金成功范本复杂网络链路预测的理论、算法和应用研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自然基金成功范本--复杂网络链路预测的理论、算法和
应用研究
国家自然科学基金
申请书
2 0 1 0 版
资助类别:面上项目
亚类说明:
附注说明:
项目名称:复杂网络链路预测的理论、算法和应用研究
国家自然科学基金申请书2010 版
经费申请表(金额单位:万元)
科目申请经费备注(计
算依据与说明)
一.研究经费 26.0000
1.科研业务费 16.0000
(1)测试/计算/分析费 4.0000 开发测试平台,购买计算时间,购买商业数据
(2)能源/动力费
(3)会议费/差旅费 5.0000 协办会议1万,国内参会或访问20人次 4 万
(4)出版物/文献/信息传播费 7.0000 国内论文出版费2万,PNAS/PLoS/NJP论文费5万
(5)其他
2.实验材料费
3.0000
(1)原材料/试剂/药品购置费 3.0000 项目开展中的各种耗材
(2)其他
3.仪器设备费 7.0000
(1)购置 7.0000 购买电脑10台,和其它研究用设备
(2)试制
4.实验室改装费
5.协作费
二.国际合作与交流费 5.2000
1.项目组成员出国合作交流 3.2000 项目组成员出国交流访问及参加学术会议4人次
2.境外专家来华合作交流 2.0000 境外专家来华访问2人次
三.劳务费 5.8500 学生助研费
四.管理费 1.9500 项目管理费
合计 39.0000
国家其他计划资助经费
与本项目相关的
其他经费资助(含部门匹配)
其他经费来源
其他经费来源合计0.0000
第 4 页版本
国家自然科学基金申请书2010 版
报告正文
(一)立项依据与研究内容
1.项目的立项依据
1.1 问题的提出
链路预测 Link Prediction 问题是指通过对已知网络结构的分析,包括一些可能的节点的其他信
息,来评估尚不相连的两个点之间产生链接的可能性,进而实现预测[1]。该问题具有重要的应用价
值,并且可以对网络科学的理论研究,特别是网络演化规则和节点相似性指标的评判问题,起到重
要的贡献。下面我们从实际应用和理论意义两个方面叙述。
很多生物网络,例如蛋白质相互作用网络和新陈代谢网络,节点之间是否存在链路,或者说是
否存在相互作用,是需要通过大量实验结果进行推断。我们已知的实验结果仅仅揭示了巨大网络的
冰山一角。仅以蛋白质相互作用网络为例,酵母菌蛋白质之间 80%的相互作用不为我们所知[2] ,而
对于人类自身,我们知道的仅有可怜的 0.3%[3,4]。由于揭示这类网络中隐而未现的链接需要耗费高
额的实验成本,如果能够在已知结构的基础上设计出足够精确的链路预测算法,再利用预测的结果
指导试验,就有可能非常明显地降低试验成本并加快揭开这类网络真实面目的步伐!实际上,社会
网络分析中也会遇到数据不全的问题,这时候链路预测同样可以作为准确分析社会网络结构的有力
的辅助工具[5,6]。除了帮助分析数据缺失的网络,链路预测算法还可以用于分析演化网络。举例来
说,近几年在线社会网络发展非常迅速[7] ,链路预测可以基于当前的网络结构去预测哪些现在尚未
结交的用户“应该是朋友”,并将此结果作为“朋友推荐”发送给用户:如果预测足够准确,显然有
助于提高相关网站在用户心目中的地位。另外,链路预测的思想和方法,还可以用于在已知部分节
点类型的网络 partially labeled networks 中预测未标签节点的类型――这可以用于判断一篇学术论文
的类型[8]或者判断一个手机用户是否产生了切换运营商例如从移动到联通的念头[9] ;以及用于纠
正观察到的网络结构中可能存在的错误[10] ,因为很多构建生物网络的实验中存在暧昧不清甚至自相
矛盾的数据[11]。
链路预测的研究可以从理论上帮助认识复杂网络演化的机制。针对同一个或者同一类网络,很
多模型都提供了可能的网络演化机制[12,13]。由于刻画网络结构特征的统计量非常多,很难比较不
同的机制孰优孰劣。链路预测机制有望为演化网络提供一个简单统一且较为公平的比较平台,从而
大大推动复杂网络演化模型的理论研究。另外,如何刻画网络中节点的相似性也是一个重大的理论
问题[14] ,这个问题和网络聚类等应用息息相关[15]。类似地,相似性的度量指标数不胜数,只有能
够快速准确地评估某种相似性定义是否能够很好刻画一个给定网络节点间的关系,才能进一步研究
网络特征对相似性指标选择的影响。在这个方面,链路预测可以起到核心技术的作用。链路预测问
题本身也带来了有趣且有重要价值的理论问题,也就是通过构造网络系综并藉此利用最大似然估计
的方法进行链路预测的可能性和可行性研究。这方面的研究对于链路预测本身以及复杂网络研究的
理论基础的建立和完善,可以起到推动和借鉴的作用。
1.2 研究进展
链路预测作为数据挖掘的方向之一在计算机领域已有一些早期的研究。他们的研究思路和方法
主要基于马尔科夫链和机器学习。Sarukkai[16]应用马尔科夫链进行网络的链路预测和路径分析。之
第 5 页
国家自然科学基金申请书2010 版
后 Zhu 等人[17]将基于马尔科夫链的预测方法扩展到了自适应性网站(adaptive web sites)的预测