一种融合节点文本属性信息的网络表示学习算法
(完整版)信息融合算法

信息融合算法1 概述信息融合又称数据融合,是对多种信息的获取、表示及其内在联系进行综合处理和优化的技术。
经过融合后的传感器信息具有以下特征:信息冗余性、信息互补性、信息实时性、信息获取的低成本性。
1、组合:由多个传感器组合成平行或互补方式来获得多组数据输出的一种处理方法,是一种最基本的方式,涉及的问题有输出方式的协调、综合以及传感器的选择。
在硬件这一级上应用。
2、综合:信息优化处理中的一种获得明确信息的有效方法。
例:在虚拟现实技术中,使用两个分开设置的摄像机同时拍摄到一个物体的不同侧面的两幅图像,综合这两幅图像可以复原出一个准确的有立体感的物体的图像。
3、融合:当将传感器数据组之间进行相关或将传感器数据与系统内部的知识模型进行相关,而产生信息的一个新的表达式。
4、相关:通过处理传感器信息获得某些结果,不仅需要单项信息处理,而且需要通过相关来进行处理,获悉传感器数据组之间的关系,从而得到正确信息,剔除无用和错误的信息。
相关处理的目的:对识别、预测、学习和记忆等过程的信息进行综合和优化。
2 技术发展现状信息融合技术的方法,概括起来分为下面几种:1)组合:由多个传感器组合成平行或互补方式来获得多组数据输出的一种处理方法,是一种最基本的方式,涉及的问题有输出方式的协调、综合以及传感器的选择。
在硬件这一级上应用。
2)综合:信息优化处理中的一种获得明确信息的有效方法。
例:在虚拟现实技术中,使用两个分开设置的摄像机同时拍摄到一个物体的不同侧面的两幅图像,综合这两幅图像可以复原出一个准确的有立体感的物体的图像。
3)融合:当将传感器数据组之间进行相关或将传感器数据与系统内部的知识模型进行相关,而产生信息的一个新的表达式。
4)相关:通过处理传感器信息获得某些结果,不仅需要单项信息处理,而且需要通过相关来进行处理,获悉传感器数据组之间的关系,从而得到正确信息,剔除无用和错误的信息。
相关处理的目的:对识别、预测、学习和记忆等过程的信息进行综合和优化。
collnet算法

CollNet算法简介CollNet算法是一种用于社会网络分析的算法,旨在识别社交网络中的社区结构和关键节点。
该算法结合了社区发现和节点重要性评估的方法,能够帮助研究人员深入理解社交网络的组织结构和关键节点的作用。
社交网络是由一组节点和边组成的图形结构,节点代表个体,边代表节点之间的关系。
在社交网络中,节点可以是人、组织、网页等,边可以是朋友关系、合作关系、引用关系等。
社交网络的分析对于理解信息传播、社会影响力、组织结构等方面具有重要意义。
CollNet算法的核心思想是将社交网络划分为不同的社区,并识别出关键节点。
社区是指网络中紧密相连的节点群体,而关键节点是对网络结构和信息传播具有重要影响力的节点。
通过识别社区和关键节点,我们可以更好地理解社交网络的组织结构和信息传播的机制。
算法流程CollNet算法主要包括以下几个步骤:1.构建网络:根据社交网络的数据,构建节点和边的图形结构。
可以使用现有的网络分析工具或编程语言来实现。
2.社区发现:使用社区发现算法将网络划分为多个社区。
常用的社区发现算法包括Louvain算法、GN算法、Label Propagation算法等。
这些算法通常基于节点之间的连接模式来划分社区。
3.社区评估:对于每个社区,可以使用一些指标来评估其质量。
常用的社区评估指标包括模块度、归一化互信息等。
这些指标可以帮助我们判断社区的紧密程度和内部结构的一致性。
4.关键节点识别:通过计算节点的重要性指标,可以识别出关键节点。
常用的节点重要性指标包括度中心性、介数中心性、特征向量中心性等。
这些指标可以帮助我们找到对网络结构和信息传播具有重要影响力的节点。
5.结果分析:根据社区和关键节点的识别结果,可以进行进一步的分析。
可以对社区进行比较、关键节点进行排序等,以深入理解社交网络的组织结构和关键节点的作用。
应用场景CollNet算法在社会网络分析中具有广泛的应用场景,包括但不限于以下几个方面:1.社交媒体分析:社交媒体平台如Twitter、Facebook等是人们交流和分享信息的重要场所。
知识图谱解决方案

知识图谱解决方案1. 引言随着信息技术的不断发展,海量的数据被生成和积累。
为了更好地利用这些数据,知识图谱作为一种高效的知识表示和推理方法,被广泛应用于各个领域,如语义搜索、智能问答、推荐系统等。
本文将介绍知识图谱的概念、构建方法以及解决方案的设计和实施过程。
2. 知识图谱概述知识图谱是一种结构化的知识表示方法,通过将实体、属性和关系组织为图形结构来描述现实世界中的知识。
图谱中的实体表示为节点,属性表示为节点的属性,关系表示为节点之间的边。
知识图谱能够帮助我们更好地理解和利用知识,发现知识之间的关联和模式。
3. 知识图谱的构建方法知识图谱的构建方法主要包括实体抽取、属性抽取、关系抽取和图谱融合。
3.1 实体抽取实体抽取是指从文本中识别和提取出具体的实体,例如人物、地点、组织等。
常用的实体抽取方法包括基于规则的匹配方法和基于机器学习的方法。
基于规则的匹配方法依赖于预先定义的规则,通过模式匹配的方式识别实体。
基于机器学习的方法则使用训练好的模型,通过对文本进行特征提取和分类来识别实体。
3.2 属性抽取属性抽取是指从文本中提取实体的属性信息,例如实体的特征、属性值等。
常用的属性抽取方法包括文本挖掘和自然语言处理技术。
文本挖掘技术可以用于识别和提取文本中的关键词和特征,从中获取实体的属性信息。
自然语言处理技术则可以通过分析文本语义和上下文信息,提取实体的属性值。
3.3 关系抽取关系抽取是指从文本中提取实体之间的关系信息,例如人物之间的关系、事件和实体之间的关系等。
常用的关系抽取方法包括依存句法分析、实体对齐和关系抽取算法。
依存句法分析可以通过分析句子的语法结构,提取实体之间的依存关系。
实体对齐技术则可以通过匹配和对齐实体在不同文本中的出现,识别实体之间的关系。
关系抽取算法则可以通过深度学习和图神经网络等方法,从文本中识别和提取出实体之间的关系。
3.4 图谱融合图谱融合是指将多个知识图谱进行合并和整合,形成一个更全面、更准确的知识图谱。
融合拓扑势的有向社交网络关键节点识别模型

定义3.有向拓扑势.设有向加权网络G = ( V,E,W),V
为节点集,E为有向边集,W为有向边的权重集合,节点V.的 入度拓扑势列>.(%)和出度拓扑势久°,(片)分别定义为:
0m(v,j =
卩。u<(%)=
其中,dw»为在有向边的权重影响下节点间的最短距离,勺为
10 B
9 8 7 6 5 4 3 2 1 0D
A
n区
I区
IV区
m区
■1
1 L. C
3
4
5
6
7
入度拓扑势
图1二维拓扑势图
Fig. 1 2D topological potential distribution map
项常用的节点重要度指标(中心性指标、PageRank等)间的相关性,并采用极大连通系数与网络效率评估网络的动态攻击效果.结
果表明本文所提模型能有效识别有向社交网络中的关键节点和用户角色,并在合理区分重要度相当的节点时具有一定优势.
关键词:社交网络;拓扑势;关键节点;角色识别
中图分类号:TP301
文献标识码:A
上述算法大多从网络拓扑结构的角度衡量节点重要度, 忽略了每个节点的自身特性和节点之间的相互影响.但 Fowler和Christakis提出的三度影响力原则认为节点既对其 直接相连的邻居节点产生直接影响,还对三度以内的邻居节 点产生间接影响因此,本文采用节点的有向拓扑势,综合 考虑节点的属性以及节点与其近邻节点之间的相互影响力, 提出一个新的节点重要度指标一拓扑势距离(Topological Po tential Distance,TPD),并将其应用于关键节点识别;进而提 出了基于二维有向拓扑势的用户角色识别算法.在真实网络 中的对比实验结果表明:与度中心性、介数中心性、接近中心 性、PageRank .HITS等相比,拓扑势距离能有效识别有向加权 网络中的关键节点,合理区分重要度相当的节点,并识别网络 中的用户角色.
知识图谱在装备智能维护中的应用研究

第29卷第3期 2021年6月Vol.29 No.3Jun. 2021电脑与信息技术Computer and Information Technology文章编号:1005-1228(2021)03-0001-03知识图谱在装备智能维护中的应用研究易小芹,彭望龙,杨 颖,房冬丽(中国电子科技集团公司第三十研究所 四川 成都 610041)摘 要:随着部队装备持续升级改进,装备功能、性能均飞速提升,与此同时,装备的维护也越来越复杂,依靠传统的以人工经验为主的方式来做装备维护,已经难以满足维护要求。
文章针对当前装备维护的问题,研究装备智能化维护技术,探索知识图谱在装备智能维护领域的应用,介绍了装备维护知识图谱构建的方法,包括装备知识体系建立、装备知识抽取、装备知识表示、装备知识融合、装备知识图谱推理的方法。
关键词:装备智能维护;知识图谱;深度学习中图分类号:TP182 文献标识码:AApplication of Knowledge Map in IntelligentMaintenance of Weapon EquipmentYI Xiao-qin, PENG Wang-long, YANG Ying, FANG Dong-li(The 30th Research Institute of China Electronics Technology Group Corporation, Chengdu, 610041, China)Abstract:with the continuous improvement of military equipment, the functionand performance of weapon equipment are improved rapidly. At the same time,the maintenance of weapon equipment is becoming more and more complex. Itis difficult to meet the maintenance requirements by relying on the traditional manual experience. Aiming at the current problems of weapon equipment maintenance, this paper studies the intelligent maintenance technology of weapon equipment, and explores the application of knowledge map in the field of equipment intelligent maintenance. this paper introduces the construction methods of weapon equipment maintenance knowledge map, including the establishment of equipment knowledge system, equipment knowledge extraction, equipment knowledge representation, equipment knowledge fusion and equipment knowledge map reasoning.Key words: intelligent maintenance of weapon equipment; knowledge map; deep learning.收稿日期:2020-11-05作者简介:易小芹(1986-),女,硕士,工程师,主要研究方向为应用软件研发(态势系统方向、人工智能方向);彭望龙(1985-),男,硕士,工程师,主要研究方向为应用软件研发(态势系统方向、人工智能方向);杨颖(1991-),女,硕士,工程师,主要研究方向为应用软件研发(态势系统方向、人工智能方向);房冬丽(1990-),女,硕士,工程师,主要研究方向为应用软件研发(态势系统方向、人工智能方向)。
基于贝叶斯网络的信息融合方法研究

基于贝叶斯网络的信息融合方法研究贝叶斯网络是一种用于模拟概率推理的图模型,它在信息融合领域中具有广泛的应用。
信息融合是指将来自不同源头的信息进行整合和分析,以获得更准确和完整的信息。
在本文中,我们将探讨基于贝叶斯网络的信息融合方法,并研究其在不同领域中的应用。
首先,我们将介绍贝叶斯网络及其基本原理。
贝叶斯网络是一种有向无环图(Directed Acyclic Graph, DAG),它由节点和有向边组成。
节点表示随机变量,有向边表示变量之间的依赖关系。
贝叶斯网络通过条件概率表来描述变量之间的依赖关系,并使用贝叶斯定理进行推理。
在信息融合中,我们通常面临着多源数据、不确定性和冲突等问题。
基于贝叶斯网络的方法可以有效地解决这些问题。
首先,我们可以使用多个节点表示不同源头的数据,并通过有向边表示它们之间的关系。
这样一来,在进行推理时可以考虑到多个数据源之间可能存在的依赖关系。
其次,在处理不确定性时,贝叶斯网络可以使用概率来表示不同变量的不确定性程度。
通过观察已知变量的取值,可以更新其他变量的概率分布,从而获得更准确的结果。
这种基于概率的推理方法可以有效地处理不确定性,并提供更可靠的信息融合结果。
另外,贝叶斯网络还可以处理冲突信息。
当不同数据源提供了相互矛盾的信息时,贝叶斯网络可以通过比较不同假设下观察到数据的可能性来进行冲突分辨。
通过计算后验概率,我们可以得到每个假设下观察到数据的可能性,并选择后验概率最高的假设作为最终结果。
基于贝叶斯网络的信息融合方法在许多领域中都有广泛应用。
例如,在智能交通系统中,我们可以使用贝叶斯网络来融合来自交通摄像头、雷达和车载传感器等多个数据源的信息,从而实现交通流量预测和拥堵检测等功能。
在医疗领域中,我们可以使用贝叶斯网络来整合医疗记录、实验室检查和影像学检查等多种医疗数据,并进行疾病诊断和治疗方案选择等决策支持。
此外,贝叶斯网络还可以应用于军事情报分析、金融风险评估、环境监测等领域。
网络数据建模、分析与应用研究综述

网络数据建模、分析与应用研究综述一、网络数据建模随着互联网的快速发展,网络数据已经成为了研究和应用的重要领域。
网络数据建模是指通过对网络结构和属性进行抽象描述,构建出能够反映网络特征的数据模型。
网络数据建模的目的是为了更好地理解网络的结构、功能和动态变化,为网络分析、管理和决策提供理论依据和技术支持。
图论建模:图论是研究图(Graph)结构及其性质的数学分支。
在网络数据建模中,图论建模主要关注如何用图的形式表示网络结构,以及如何利用图论方法对网络进行分析。
常用的图论建模方法有邻接矩阵法、邻接表法、边权法等。
社会网络建模:社会网络是一种特殊的网络结构,由具有关联关系的人或组织组成。
社会网络建模主要研究如何用图的形式表示社会网络结构,以及如何利用图论方法对社会网络进行分析。
常用的社会网络建模方法有无向图法、有向图法、贝叶斯网络法等。
复杂网络建模:复杂网络是由大量相互连接的节点和边组成的网络结构。
复杂网络建模主要研究如何用图的形式表示复杂网络结构,以及如何利用图论方法对复杂网络进行分析。
常用的复杂网络建模方法有随机游走模型、小世界模型、斑图模型等。
动态网络建模:动态网络是指网络结构和属性随时间发生变化的网络。
动态网络建模主要研究如何用图的形式表示动态网络结构,以及如何利用图论方法对动态网络进行分析。
常用的动态网络建模方法有马尔可夫链模型、随机过程模型等。
多模态网络建模:多模态网络是指具有多种不同类型的信息载体的网络。
多模态网络建模主要研究如何用图的形式表示多模态网络结构,以及如何利用图论方法对多模态网络进行分析。
常用的多模态网络建模方法有多模态图模型、多模态贝叶斯网络模型等。
网络数据建模是一个涉及多个领域的交叉学科,其研究内容和技术方法不断丰富和发展。
随着大数据时代的到来,网络数据建模将继续发挥重要作用,为网络分析、管理和决策提供更多有价值的理论和实践支持。
1. 网络数据的基本概念和特点随着互联网的普及和发展,网络数据已经成为了当今社会中不可或缺的一部分。
融合高阶信息的社交网络重要节点识别算法

2019年10月Journal on Communications October 2019 第40卷第10期通信学报V ol.40No.10融合高阶信息的社交网络重要节点识别算法闫光辉,张萌,罗浩,李世魁,刘婷(兰州交通大学电子与信息工程学院,甘肃兰州 730070)摘 要:识别重要节点是复杂网络研究的基础性问题。
现有理论框架主要以“点−边”这种低阶结构为基本单元,往往忽略了多个节点之间可能存在的交互性、传递性等重要因素。
为了更加精确地识别重要节点,对网络中以模体为基本单元的高阶结构进行了研究,首先,提出了节点高阶度的概念,进一步引入证据理论融合了节点的高阶结构和低阶结构信息,设计了一种融合节点高阶信息的半局部重要节点识别方法。
在3个真实社交网络上的实验结果表明,相较于只关注低阶结构的已有方法,所提出的算法能够更加精确地识别网络中的重要节点。
关键词:重要节点;模体;高阶网络;证据理论;社交网络中图分类号:TP181,TP391文献标识码:Adoi: 10.11959/j.issn.1000−436x.2019198Identifying vital nodes algorithm in social networksfusing higher-order informationYAN Guanghui, ZHANG Meng, LUO Hao, LI Shikui, LIU TingSchool of Electronic and Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China Abstract: Identifying vital nodes is a basic problem in complex network research. The existing theoretical framework, mainly considered from the lower-order structure of node-based and edge-based relations often ignores important factors such as interactivity and transitivity between multiple nodes. To identify vital nodes more accurately, the motif, the high-er-order structure of the network, was studied as the basic unit. Firstly, a notion of higher-order degree of nodes in a com-plex network was proposed. Then, the higher-order structure and lower-order structure of nodes were fused into ev-idence theory. A semi-local identifying vital nodes algorithm fusing higher-order information of nodes was designed. The results of experiments on three real social networks show that the proposed algorithm can identify vital nodes more accu-rately in the network than the existing methods which only focus on the low-order structure.Key words: vital node, motif, higher-order network, evidence theory, social network1引言信息技术的多元化发展,使人们日常交流、互动的形式趋于多样化,由此产生了海量的社交网络数据[1]。
ocrnet原理

ocrnet原理OCRNet是一种用于光学字符识别(Optical Character Recognition,OCR)的深度学习模型,它是基于深度卷积神经网络(Convolutional Neural Network,CNN)的端到端模型,具有高效且精确的识别能力。
OCRNet的设计灵感来自FPN (Feature Pyramid Network)和CRAFT(Character-Region Awareness For Text detection)等结构。
OCRNet的核心思想是将输入图像映射为字符序列,通过逐像素地对字符进行分类,实现字符识别。
模型的整体架构包括两个部分:文本检测和字符识别。
文本检测部分使用CRAFT算法,通过提取图像中的文本区域,将其转化为字符序列的图像级别表示。
字符识别部分是一个基于FPN的分类器网络,用于识别检测到的每个字符。
模型通过不断迭代训练,优化损失函数,最终实现准确的字符识别。
OCRNet中文本检测部分的CRAFT算法是基于像素级别的文本区域感知技术。
该算法的输入是一张图像,经过一系列的卷积和池化层后,生成的特征图可以表示图像中每个像素属于文本区域的概率。
然后,通过阈值处理和非极大抑制等方法,将特征图转换为字符序列的图像级别表示。
在字符识别部分,OCRNet使用了FPN结构。
FPN是一种经典的多尺度特征融合网络,可以有效地提取图像中不同尺度的特征。
在OCRNet中,FPN被用于将文本检测部分输出的字符序列的图像级别表示转化为字符级别的特征表示。
通过一系列卷积和池化层,模型可以学习到字符的形状、纹理等特征,从而实现字符的分类。
为了进一步提高OCRNet的性能,模型使用了双向长短时记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)作为特征提取器。
BiLSTM可以捕捉图像中字符之间的上下文信息,提高字符识别的准确性。
贝叶斯网络学习方法在知识图谱推理中的应用

贝叶斯网络学习方法在知识图谱推理中的应用知识图谱是一种以图形结构表示知识的技术,他能够将现实世界中的实体、关系和属性等信息以图的形式进行组织和展示。
在知识图谱中,如何进行推理和推断对于进一步挖掘和应用知识具有重要的作用。
贝叶斯网络作为一种常用的概率图模型,具有表达不确定性以及推理能力的优势,近年来在知识图谱推理中得到了广泛应用。
一、贝叶斯网络简介贝叶斯网络是一种基于概率的图模型,用于描述变量之间的依赖关系。
它由一组节点和有向边组成,节点表示变量,有向边表示变量之间的依赖关系。
每个节点都与一个条件概率表(Conditional Probability Table,CPT)相关联,用于描述该节点在给定其父节点状态下的条件概率分布。
贝叶斯网络通过联合概率分布来表示整个系统的不确定性。
二、贝叶斯网络在知识图谱推理中的优势1. 概率推理能力:贝叶斯网络能够通过利用已知的先验知识和观察数据,根据贝叶斯公式进行后验推理,从而对未知变量进行预测和推断。
2. 知识表示灵活:贝叶斯网络以图的形式表示实体和关系之间的知识,能够灵活地描述复杂的知识结构和关联性。
3. 不确定性建模:贝叶斯网络能够有效地处理不确定性问题,根据已有数据和先验知识进行概率推理,从而减少了因缺乏数据而无法进行推理的情况。
4. 适应大规模知识图谱:贝叶斯网络的推理算法具有良好的可扩展性,能够应对大规模知识图谱的推理需求。
三、贝叶斯网络在知识图谱推理中的应用场景1. 实体关系推断:利用贝叶斯网络可以推断两个实体之间的关系,例如推断两个人之间的亲属关系或者两个商品之间的相似性。
2. 属性预测:根据已知属性和观察数据,利用贝叶斯网络可以预测实体的未知属性,例如根据用户的购买记录预测其偏好属性。
3. 缺失数据填补:在知识图谱中,往往存在一些缺失数据,利用贝叶斯网络可以通过已有数据进行推理填补缺失值,从而完善知识图谱的完整性。
4. 推荐系统:贝叶斯网络可以有效地组织和分析用户行为和偏好数据,根据用户的历史行为和观察数据,进行个性化的推荐。
面向复杂网络的异构网络表示学习综述

面向复杂网络的异构网络表示学习综述颜铭江,董一鸿,苏江军,陈华辉,钱江波(宁波大学信息科学与工程学院,浙江宁波 315211)摘 要:异构信息网络包含丰富的节点信息和链接信息,具有复杂异质性、高稀疏性、属性高维性等特性,这些特性给网络表示学习任务带来了巨大的挑战。
异构网络表示学习通过在嵌入过程中将多样化的异质信息和结构信息进行有效融合,学习得到更有利于下游机器学习任务的低维特征向量。
从异构网络表示学习方法的研究粒度出发,对近年的研究现状进行了比较全面的分析和讨论。
首先探讨网络表示学习的产生动机,阐述了近年的异构网络表示学习的研究历程;然后对具有代表性的算法模型进行分类讨论,归纳其主要的研究内容和所使用的嵌入技巧。
最后给出了未来工作中异构网络表示学习可能的研究方向和比较有价值的研究内容。
关键字:网络表示学习;异构信息网络;图嵌入;图神经网络;异质信息中图分类号:TP391文献标识码:Adoi: 10.11959/j.issn.1000−0801.2021013A survey of heterogeneous network representationlearning for complex networksYAN Mingjiang, DONG Yihong, SU Jiangjun, CHEN Huahui, QIAN JiangboFaculty of Electrical Engineering and Computer Science, Ningbo University, Ningbo 315211, China Abstract: Heterogeneous information networks contain rich information about node and link, and have some charac-teristics, such as complex heterogeneity, high sparsity, high-dimensionality of attributes, etc, which brings huge chal-lenges to network representation learning tasks. The heterogeneous network representation learning learns low-dimensional feature vectors that are more conducive to downstream machine learning tasks by effectively inte-grating diverse heterogeneous information and structural information in the embedding process. It conducts a rela-tively comprehensive analysis and discussion of the research status in recent years, starting from the research granu-larity of the heterogeneous network representation learning method. Firstly, the motivation of network representation learning and the research history of heterogeneous information network representation learning in recent years was discussed. Then some representative algorithm models were classified, followed by the summary of their main re-search contents and embedding skills. Finally, some possible directions and valuable contents of heterogeneous in-收稿日期:2020−04−26;修回日期:2020−12−10通信作者:董一鸿,******************.cn基金项目:浙江省自然科学基金资助项目(No.LY20F020009,No.LZ20F020001);国家自然科学基金资助项目(No.61572266);宁波市自然科学基金资助项目(No.202003N4086)Foundation Items: The Natural Science Foundation of Zhejiang Province (No.LY20F020009, No.LZ20F020001), The National NaturalScience Foundation of China (No.61572266), Ningbo Natural Science Foundation (No.202003N4086)综述·2·formation network representation learning research in future work were listed.Key words: network representation learning, heterogeneous information network, graph embedding, graph neural network, heterogeneous information1 引言互联网基础建设的快速发展使各种线下信息数字化,导致可利用信息呈爆炸式增长。
基于矩阵分解的属性网络表示学习

2020年10月October 2020第46卷第10期Vol. 46 No. 10计算机工程Computer Engineering•人工智能与模式识别•文章编号:1000-3428(2020) 10-0067-07文献标志码:A中图分类号:TP181基于矩阵分解的属性网络表示学习张 潘V,卢光跃V,吕少卿1,2,赵雪莉1,2(1.西安邮电大学通信与信息工程学院,西安710121; 2.陕西省信息通信网络及安全重点实验室,西安710121)摘要:为融合网络拓扑结构与节点属性信息以提高网络表示学习质量,提出一种新的属性网络表示学习算法 (ANEMF)。
引入余弦相似性概念,定义网络二阶结构相似度矩阵和属性相似度矩阵,通过对网络结构相似度和属 性相似度损失函数进行联合优化学习,并利用矩阵分解的形式实现网络拓扑结构与节点属性信息的融合,同时应 用乘法更新规则计算得到节点表示向量。
在3个公开数据集上的实验结果表明,与DeepWalk 和TADW 算法相 比,ANEMF 算法得到的节点表示向量能够保留网络拓扑结构与节点属性信息,有效提升其在节点分类任务中的综 合性能。
关键词:机器学习;网络分析;数据挖掘;网络表示学习;矩阵分解;网络嵌入开放科学(资源服务)标志码(OSID):中文引用格式:张潘,卢光跃,吕少卿,等.基于矩阵分解的属性网络表示学习[J].计算机工程,2020,46(10) :67-73,英文引用格式:ZHANG Pan , LU Guangyue , LU Shaoqing , et al. Attributed network representation learning based onmatrix factorization [ J ]. Computer Engineering ,2020,46(10) :67-73.Attributed Network Representation Learning Based on Matrix FactorizationZHANG Pan 1'2, LU Guangyue 1'2,^ Shaoqing 1'2 ,ZHAO Xueli 1,2(1. School of Communications and Information Engineering , Xi 1 an University of Posts and Telecommunications , Xi * an 710121, China ;2. Shaanxi Provincial Key Laboratory of Information Communication Network and Security , Xi J an 710121, China)[Abstract] To combine the information of network topological structure and node attribute to improve the quality ofnetwork representation learning , this paper proposes a new attributed network representation learning algorithm , namedANEMF. The algorithm introduces the idea of cosine similarity to define the second-order structural similarity matrix andthe attribute similarity matrix of the network. Through the cooperative optimized learning of network structure similarityand attribute similarity functions , the information of network topological structure and node attribute is fused in the fonn of matrix factorization. Finally , the node representation vectors are obtained through the multiplication update rules.Experimental results on three public datasets show that compared with DeepWalk and TADW algorithms , the proposedalgorithm can keep the information of network topological structure and node attribute in obtained node representationvectors. It can significantly improve the overall performance in the node classification tasks.[Key words] machine learning ; network analysis ; data mining ; network representation learning ; matrix factorization ;network embeddingDOI : 10.19678/j. issn. 1000-3428. 00557640概述随着互联网络科技的快速发展,网络已成为人 们获取信息、互动交流的重要途径。
结合属性信息的二分网络表示学习

结合属性信息的二分网络表示学习赵雪莉1,2,卢光跃1,2,吕少卿1,2+,张潘1,21.西安邮电大学通信与信息工程学院,西安7101212.西安邮电大学陕西省信息通信网络及安全重点实验室,西安710121+通信作者E-mail:*****************.cn 摘要:现有的网络表示学习算法主要是针对同质网络或异质网络设计的,而忽略了在推荐系统、搜索引擎和问答系统等领域出现的二分网络的特殊特征以及这类网络所携带着的非常丰富的属性信息。
为了解决上述问题,提出了一种结合属性信息的二分网络表示学习方法(ABNE )。
该方法首先将连边分解成邻居节点间的间接关系集,嵌入显式关系,接着通过余弦相似性引入并定义节点的属性相似度矩阵,并将其作为权重矩阵的一部分指导有偏随机游走,从而嵌入隐式关系和属性信息。
最后通过一个联合优化框架得到同时携带网络结构信息和属性信息的节点表示向量。
在四个真实公开数据集上进行了推荐任务,并与其他现有方法进行比较,实验结果表明该算法的优越性和合理性。
关键词:二分网络;网络表示学习;随机游走;属性网络;机器学习文献标志码:A中图分类号:TP391Attributed Bipartite Network Representation LearningZHAO Xueli 1,2,LU Guangyue 1,2,LV Shaoqing 1,2+,ZHANG Pan 1,21.School of Communications &Information Engineering,Xi an University of Posts and Telecommunications,Xi an 710121,China2.Shaanxi Key Laboratory of Information Communication Network and Security,Xi an University of Posts and Tele-communications,Xi an 710121,ChinaAbstract:Existing network embedding models are mostly designed for homogeneous networks or heterogeneous networks,but ignore the special features of bipartite network which arise in recommender systems,search engines,question answering systems and so on.Meanwhile bipartite networks mostly include rich attribute information.To address the above challenging issues,this paper proposes ABNE (attributed bipartite network embedding).Specifically,ABNE first preserves the explicit relations in the bipartite network by decomposing edges into sets of indirect relationships between neighborhood nodes.Then it calculates attribute similarity matrix by cosine similarity and as part of the weight matrix to guide the biased random walk to embed implicit relations and attribute information.Finally,ABNE introduces an optimization framework to obtain the node representation vector which carries both structure information and attribute information.Several tasks have been conducted on four public datasets and compared with other state-of-the-art embedding models.The experimental results show superiority and rationality of ABNE model.计算机科学与探索1673-9418/2021/15(03)-0495-11doi:10.3778/j.issn.1673-9418.2004034基金项目:陕西省教育厅科研计划项目(17JK0703)。
视觉和文本领域的跨模态算法

视觉和文本领域的跨模态算法全文共四篇示例,供读者参考第一篇示例:视觉和文本领域的跨模态算法是近年来人工智能领域中备受关注的一个课题。
随着计算机视觉和自然语言处理技术的不断发展,研究者们开始探索将这两个领域结合起来,通过跨模态算法实现视觉与文本之间的有效交互与融合。
跨模态算法的发展为许多领域提供了新的可能性,如图像标注、图像检索、视频内容分析等。
在本文中,我们将详细介绍视觉和文本领域的跨模态算法的原理、方法和应用。
一、跨模态算法的基本概念跨模态算法是指将不同领域的信息进行融合和交互,实现跨模态数据之间的有效转换和学习。
在视觉和文本领域中,跨模态算法可以实现图像和文本之间的相互关联和推理,从而为未来智能系统的发展提供技术支持。
在跨模态算法中,通常会涉及到视觉和文本之间的特征提取、表示学习、匹配与融合等过程。
1. 特征提取:在跨模态算法中,视觉和文本数据通常会通过特征提取的方式将数据转换为机器可识别的表示形式。
对于视觉数据,可以通过卷积神经网络(CNN)等深度学习方法提取图像的特征;对于文本数据,可以采用词袋模型(Bag of Words)等方法进行文本特征的提取。
2. 表示学习:得到数据的特征表示后,跨模态算法会尝试学习不同数据模态之间的关联和共享信息。
通过表示学习的过程,算法可以发现图像和文本之间的相关性和相似性,为后续的任务提供支持。
3. 匹配与融合:跨模态算法会通过匹配与融合的方式将不同数据模态之间的信息进行整合。
通过匹配和融合的过程,算法可以实现视觉与文本之间的内容对齐、情感融合等任务,为图像标注、图像检索等应用提供支持。
二、视觉和文本领域的跨模态算法1. 图像标注:图像标注是指通过文本描述的方式为图像内容添加语义标签。
跨模态算法可以将图像的视觉信息与文本的语义信息进行融合,实现图像标注的自动化过程。
在图像标注任务中,跨模态算法可以通过图像特征与文本特征的匹配与融合,将图像与对应的语义标签进行关联。
人工智能机器学习中的自我学习算法

人工智能机器学习中的自我学习算法随着现代科学技术的不断发展,人工智能机器学习在信息社会中已经成为了越来越重要的一项技术。
其中,自我学习算法是人工智能机器学习领域的一项重要技术,通过模拟人类神经系统,实现对外部环境的感知和学习,能够自主进行调整和优化,提升人工智能技术的效率和准确度。
一、自我学习算法的概念自我学习算法是一种通过神经网络学习和结合人工神经元组成的神经网络,模仿人脑神经网络的方式实现对机器的学习和优化。
自我学习算法的核心在于其能够自动调整神经网络的结构,并根据数据的变化自主更新模型参数,从而实现对复杂问题的智能化解决。
二、自我学习算法的特点自我学习算法具有以下几个特点:1. 适应性强:自我学习算法具有自动调整神经网络结构和更新模型参数的能力,可以自主适应外部环境的变化,提升算法的效率和准确度。
2. 学习能力强:自我学习算法能够在众多数据中学习和总结出规律,并将其应用于实际问题中,能够有效提升人工智能机器学习的水平。
3. 可解释性强:自我学习算法会将学习到的数据存储在内部,并通过可视化的方式展示给用户,帮助用户了解每个决策节点的工作机制,从而增强人工智能机器学习的可解释性。
三、自我学习算法的应用自我学习算法在人工智能领域中应用广泛,如语音识别、自然语言处理、图像识别、机器人技术和智能制造等多个领域。
以下是自我学习算法在几个领域的具体应用:1. 语音识别:自我学习算法可以通过学习语言模型和声学模型对语音进行识别,并不断优化模型根据声音的变化更新字符。
2. 图像识别:自我学习算法可以通过学习神经网络和卷积神经网络的结构和参数来实现图像分类和目标检测,例如在自动驾驶、无人机、嵌入式设备、智能家居等领域中得到广泛应用。
3. 智能制造:自我学习算法可以实现更高效的生产线调整,不断学习和自主调整生产线的难点,提高制造的生产效率和产品质量。
四、自我学习算法的挑战随着人工智能机器学习的深入发展,自我学习算法也面临着一些挑战。
基于语义网络的归纳推理算法

基于语义网络的归纳推理算法摘要:语义网络是一种用于表示和推理知识的有效工具。
基于语义网络的归纳推理算法是一种利用语义网络进行自动推理和知识发现的方法。
本文将介绍基于语义网络的归纳推理算法的原理、方法和应用,并探讨其在人工智能领域中的潜在应用价值。
1. 引言人工智能领域中,自动推理和知识发现是重要研究方向。
传统方法主要依赖于逻辑推理和统计模型,但这些方法在处理复杂问题时存在局限性。
为了克服这些局限性,研究者们提出了基于语义网络的归纳推理算法。
2. 基本原理基于语义网络的归纳推理算法主要利用图论中图结构表示知识,并通过图上节点之间关系进行自动推断。
具体来说,该算法首先构建一个包含实体、关系和属性等元素节点的图结构,然后通过节点之间关系进行信息传递和知识发现。
3. 算法步骤(1)构建初始图结构:根据问题或领域特定需求,将相关实体、关系和属性等元素节点添加到图中,构建初始图结构。
(2)节点关系建立:通过分析节点之间的关系,建立节点之间的连接关系,形成一个完整的语义网络。
(3)信息传递:通过图上的边和节点之间的连接关系,将信息从一个节点传递到另一个节点,实现知识的自动推理和发现。
(4)知识发现:根据问题或领域特定需求,在语义网络中发现新的知识,并将其添加到图中。
4. 算法应用基于语义网络的归纳推理算法在人工智能领域具有广泛应用价值。
以下是该算法在不同领域中的应用案例:(1)智能问答系统:基于语义网络的归纳推理算法可以帮助智能问答系统实现自动问题解答和知识发现,提高系统对用户问题的准确性和完整性。
(2)文本挖掘:该算法可以帮助文本挖掘系统从大量文本数据中提取有用信息,并进行自动分类、聚类等操作。
(3)智能推荐系统:基于语义网络的归纳推理算法可以分析用户兴趣、行为等信息,并根据这些信息进行个性化推荐,提高推荐系统的准确性和用户满意度。
(4)知识图谱构建:该算法可以帮助构建知识图谱,将大量的知识和信息进行结构化表示,为其他应用提供基础支持。
Trans_isA

D O I :10.3969/j.i s s n .1001-5337.2022.2.071 *收稿日期:2021-06-23基金项目:山东省自然科学基金(Z R 2020M F 149).第一作者:李天宇,女,1996-,硕士研究生;研究方向:知识图谱;E -m a i l :t yl i 0214@163.c o m.通信作者:周子力,男,1973-,博士,副教授;研究方向:知识图谱;E -m a i l :z l z h o u 999@163.c o m.T r a n s _i s A :一种基于实体属性和语义层次的表示学习方法*李天宇, 王艳娜, 周子力, 赵晓函(曲阜师范大学网络空间安全学院,273165,山东省曲阜市) 摘要:传统的表示学习方法将三元组按照独立的个体进行表示,使得实体和关系的表示向量缺乏语义层次信息.同一关系(如i s_A 关系)链接的两个实体,其自身属性以及语义范畴都可能是不相同的,因此在对i s _A 关系三元组进行表示学习时,要将头实体和尾实体区分开,以不同的方法进行编码.为此,首先将i s _A 关系下的实体编码为一个球体,球体间相对位置表示为实体间关系;然后在实体属性的基础上,利用二元关系的传递性判定条件对实体间语义层次进行建模,将其命名为T r a n s _i s A 模型.在WN 18R R 数据集上对T r a n s _i s A 进行了链接预测和三元组分类实验,验证了模型的有效性.关键词:知识图谱;表示学习;实体属性;语义层次中图分类号:T P 391 文献标识码:A 文章编号:1001-5337(2022)02-0071-080 引 言知识图谱本质上是一个大规模的语义网络,旨在通过实体间的关系描述客观世界中的事实,其中将实体(如人名㊁地名㊁机构名㊁概念等)表示为网络中的节点,将相邻实体间关系表示为网络中的连边[1].因此,大多数的知识图谱都是以(h ,r ,t )这种三元组的形式存储和表示数据,不同的三元组描述不同的客观事实.表示学习是指将知识图谱中的中文词语或英文单词以及用来链接词语或单词的关系在统一的向量空间中进行表示,使知识图谱由离散的符号化表示转变为连续的向量,便于后续任务的完成.近年来,研究学者提出了很多关于面向知识图谱的表示学习算法.本文主要针对翻译模型展开研究,这类模型简单且高效,如T r a n s E [2]㊁T r a n s H [3]㊁T r a n s R /C T r a n s R [4]㊁T r a n s M [5]㊁T r a n s G [6]等.这些模型从向量空间㊁模型复杂度㊁复杂关系等几个角度对之前的模型优化,但它们在学习过程中仍是将三元组作为独立个体进行向量表示,忽略了实体本身就是一个具有综合属性的个体.此外,独立学习三元组及进行向量表示图1 一个关于知识图谱推理的示例破坏了知识图谱中原有的语义层次结构,不利于后续的推理工作.如图1中三元组(H e d ge ,i s A ,F e n c e )和(F e n c e ,i s A ,B a r r i e r),在进行知识推理时如果将这两个三元组看作独立的个体,则不会产生新的三元组,构不成足够多的推理路径.实际上依据二元关系的传递性可以从图1这两个三元组中得到一个新的三元组,即(H e d ge ,i s A ,B a r r i -e r ).因此,如果在对知识图谱进行表示学习时保留了其中原有的语义层次结构,那么就会由此产 第48卷 第2期2022年4月 曲阜师范大学学报J o u r n a l o f Q u f u N o r m a l U n i v e r s i t yV o l .48 N o .2A p r .2022 Copyright ©博看网. All Rights Reserved.27曲阜师范大学学报(自然科学版)2022年生新的㊁正确的知识,最终提高知识图谱推理的质量.针对这个问题,本文提出了基于实体属性和语义层次的表示学习模型 T r a n s_i s A.1相关工作目前的研究可以分为两类:一类是基于翻译的表示学习方法,另一类是其他的表示学习方法.T r a n s E[2]模型是将知识图谱中的关系r表示为头实体h到尾实体t之间的翻译.对于每个正确三元组(h,r,t),T r a n s E需要满足h+rʈt,表明t应该是h+r的最近邻.因此,T r a n s E的得分函数定义为f r(h, t)= h+r-t 22.T r a n s H[3]用于解决T r a n s E在对具有自反性㊁1-N㊁N-1㊁N-N这些关系建模时存在的一些问题.它的基本思想为:对于一个三元组(h,r,t),首先将头实体h和尾实体t投影到以w r为法向量的超平面d r上,表示为hʅ和tʅ,然后通过d r连接起来.因此,T r a n s H的得分函数为f r(h,t)= hʅ+d r-tʅ 22.T r a n s R[4]的主要思想为:对于每个三元组(h,r,t),将实体和关系分别表示到两个不同的向量空间,为每个关系r设置一个投影矩阵M r,将实体从实体空间投影到关系空间得到h r和t r,使h r+rʈt r.M r下的实体向量h r,t r表示为h r=h M r,t r=t M r,相应的得分函数定义为f r(h,t)= h r+r-t r 22.随着深度学习的不断发展与成熟,一些研究学者在知识图谱表示学习中引入了卷积神经网络(c o n v o l u-t i o n a l n e u r a l n e t w o r k,C N N),如C o n v E[7]算法和C o n v K B[8]算法.2017年图卷积神经网络(g r a p hc o n v o l u-t i o nn e t w o r k,G C N)被提出,在2018年被应用于关系图神经网络模型R-G C N[9].此外,Věl i c k o v i等人提出了图注意力网络(g r a p ha t t e n t i o n n e t w o r k,G A T)[10],D e e p a k等人提出了一种知识图谱注意力网络K B G A T[11].2 T r a n s_i s A模型2.1问题描述T r a n s C[12]㊁J E C I++[13]等方法通过区分实体中的概念和实例来改进现有的基于翻译的表示学习方法,但它们在进行表示学习时仍忽略了实体的属性信息,主要体现在P a r t O f关系中.通过对P a r t O f关系三元组中头实体及尾实体的分析,可知同一关系链接的2个实体可能具有不同的语义类型,并且头实体与尾实体中含有的语义类型数量存在差异.现有的大多数模型忽视了这种差异,将同一关系中的头尾实体不加区分地表示为相同空间的特征向量,这样则会导致有些实体的语义信息表示较少,从而降低语义表示的准确性.此外,许多现有的表示学习方法无法在知识图谱中对语义层次进行建模,而语义层次结构是知识图谱中普遍存在的属性[14].语义层次结构中最重要的关系就是层级关系,它主要描述的是知识图谱中两个不同实体间的隶属关系.图2描述了知识图谱中一个关于语义层次的示例.其中,图2(a)展示了现有模型的表示学习形式,三元组在T r a n s E或者T r a n s H中训练时是独立且统一的,忽略了实体自身含义的表示范畴以及i s A关系的传递性.图2(b)则展示了T r a n s_i s A模型的训练形式,在训练过程中将头㊁尾实体的范畴大小作为训练依据,即分别训练上位实体和下位实体,并且保留头㊁尾实体间i s A关系的传递性.针对以上分析的问题,将实体属性和语义层次进行融合,进而提出一个新的模型 T r a n s_i s A.该模型既可以保留T r a n s E简单高效这一特点,又可以通过学习层级关系保留实体间的语义层次.这里给出一些常用的符号表示:知识图谱由实体集合㊁关系集合以及三元组集合构成,用符号表示为: K G={E,R,S}.其中E=HɣPɣC㊁R=R HɣR PɣR C㊁S=S HɣS PɣS C,H表示具有语义层次关系的实体,P表示具有整体㊁部分属性的实体,C表示其它实体;R H表示i s A关系,R P表示P a r t O f关系,R C表示其它关系;S H表示i s A关系三元组,S P表示P a r t O f关系三元组,S C表示其他关系三元组.Copyright©博看网. All Rights Reserved.图2 一个关于语义层次的示例T r a n s _i s A 模型对于给定知识图谱K G ,进行如下表示学习:e ңe ɪR K ,∀e ɪE ,同时r ңr ɪR K ,∀r ɪR .对于每个e ɪE ,建模为球体Q 1(ε,μ)㊁Q 2(p ,σ),其中ε,p ɪR K表示球心,μ,σ为半径.2.2 模型设计图3中展示了模型的整体架构.图3 T r a n s _i s A 模型架构图i s A 关系类:对于任意给定的实体对(x ,y ),如果y 的语义范畴比x 的语义范畴更广,就称y 是x 的上位词,x 是y 的下位词,称这个实体对(x ,y )为i s A 关系元组.传递性关系的定义为:令R 是A 上的二元关系,对于A 中任意的x ,y ,z ,若<x ,y >ɪR ,且<y ,z >ɪR ,则<x ,z >ɪR ,则称R 具有传递性.根据i s A 关系这一特性,设计了新的得分函数.对于每个实体εi ɪH ,学习一个球体Q (ε,μ),εɪR K 表示球心,μ表示半径.则i s A 关系的传递性为(ε1,r h ,ε2)ɪS H ɡ(ε2,r h ,ε3)ɪS H ң(ε1,r h ,ε3)ɪS H .37第2期 李天宇,等:T r a n s _i s A :一种基于实体属性和语义层次的表示学习方法 Copyright ©博看网. All Rights Reserved.P a r t O f 关系类:对于任意给定的实体对(a ,b ),如果a 的语义表示的是部分属性,b 的语义表示的是整体属性,就称a 是b 的组成部分,b 是由a 组成的整体,称这个实体对(a ,b )为P a r t O f 关系元组.图4展示了P a r t O f 关系下两个实体对应的球体之间的相对位置关系,模型将头㊁尾实体分别编码为球体S i (pi ,σi )和球体S j (p j ,σj ),其中p i ㊁p j 表示球心,σi ㊁σj 表示半径.S i 和S j 之间的相对位置关系表示Pa r t O f 关系,模型的目标就是图4(a)所示的球体相对位置关系.图4 P a r t O f 关系类相对位置关系示意图其它关系类:对于知识图谱中包含的其它关系事实,表示为S C ={(h ,r ,t )K }N CK =1.其中r ɪR C ,N C 表示S C 的大小.根据不同关系类型的特征属性定义不同的得分函数对知识图谱K G 中的实体(e n t i t y)和关系(r e l a t i o n )进行训练,具体如下:i s A 关系类型的得分函数为d = εi -εj 2,f H (εi ,εj )=d +μi -μj (d ȡ|μi -μj |).{P a r t O f 关系类型的得分函数为d = p i -p j 2,f p (p i ,p j )=d -σi -σj (d <|σi +σj |).{其它关系类型的得分函数为f C (h ,r ,t )= h +r -t 22.损失函数中的得分函数与上述3类关系类型相对应.2.3 训练过程及目标表1中,算法1描述了T r a n s _i s A 模型的具体训练过程:首先,K G 中包含的所有实体和关系都被随机初始化为维度100的向量.步骤3~步骤8为其它关系类的迭代过程,步骤3㊁步骤4表示产生与正三元组对应的负三元组.经过步骤5㊁步骤6得分函数的学习之后更新向量,并对其进行归一化.步骤9~步骤18为i s A 关系类的迭代过程,当两个实体间的距离满足条件时,通过目标函数进行梯度更新并归一化.反之,进行步骤15一直训练更新实体向量,直到满足目标要求.步骤19~步骤28为P a r t O f 关系类的具体迭代过程,其过程与i s A 关系类相似.表1 T r a n s _i s A 算法算法1 T r a n s _i s A输入:训练集S H =(εi ,εj ),S P =(p i ,p j ),S C =(h ,r ,t ),边际参数r C ㊁r H ㊁r P ,e m b e d d i n g d i m K ,l e a r n r a t e λ,s p h e r e s Q 1(H i ,μi )㊁Q 2(p i ,σi )输出:向量εi ,εj ,p i ,p j ,h ,r ,t ɪR K ,半径μ,σ47 曲阜师范大学学报(自然科学版) 2022年Copyright ©博看网. All Rights Reserved.续表1 T r a n s _i s A 算法算法1 T r a n s _i s A1:I n i t i a l i z a t i o n εi ,εj ,p i ,p j ,h ,r ,t ,μ,σʊ初始化各向量及参数2:l o o p3:f o r e a c h (h ,r ,t )ɪS C d o ʊ其它关系类训练集迭代更新过程4:s a m p l e a c o r r u p t e d t r i p l e t s (h ',r ,t ')ɪS 'C ʊ负采样过程5:f C (h ,r ,t )= h +r -t 226:U p d a t e e m b e d d i n g h ,r ,t ʊ更新实体㊁关系向量7:N o r m a l i z e h ,r ,t ʊ归一化实体㊁关系向量8:e n d f o r9:f o r e a c h (εi ,εj )ɪS H d o ʊi s A 关系类训练集迭代更新过程10:s a m p l e a c o r r u p t e d t r i p l e t s (ε'i ,ε'j )ɪS 'H ʊ负采样过程11:d = εi -εj 212:i f (d <|μi -μj |)13:U p d a t e e m b e d d i n g εi ,εj ʊ更新实体向量14:e l s e15:f H (εi ,εj )=d +μi -μj 16:U p d a t e e m b e d d i n g εi ,εj ʊ更新实体向量17:N o r m a l i z e εi ,εj ʊ归一化实体向量18:e n d f o r19:f o r e a c h (p i ,p j )ɪS P d o ʊP a r t O f 关系类训练集迭代更新过程20:s a m p l e a c o r r u p t e d t r i p l e t s (p 'i ,p 'j )ɪS 'P ʊ负采样过程21:d = p i -p j 222:i f (d ȡ|μi -μj |)23:U p d a t e e m b e d d i n g p i ,p j ʊ更新实体向量24:e l s e25:f P (p i ,p j )=d -σi -σj26:U p d a t e e m b e d d i n g p i ,p j ʊ更新实体向量27:N o r m a l i z e p i ,p j ʊ归一化实体向量28:e n d f o r 29:e n d l o o p基于翻译的表示学习模型通常是最小化基于边际的成对损失函数,所以T r a n s _i s A 模型也沿用此方法,具体定义为L C =ð(h ,r ,t )ɪS C ð(h ',r ,t ')ɪS 'C [γC +f C (h ,r ,t )-f C (h ',r ,t ')]+L H =ð(εi ,εj )ɪS H ð(ε'i ,ε'j)ɪS 'H [γH +f H (εi ,εj )-f H (ε'i ,ε'j )]+L P =ð(p i ,p j )ɪS P ð(p 'i ,p 'j)ɪS 'P [γP +f P (p i ,p j )-f P (p 'i ,p 'j )]+ìîíïïïïïï(1) T r a n s _i s A 的训练目标为:通过随机梯度下降方法,不断更新优化相关参数及向量,从而使式(1)中的L C ㊁L H ㊁L P 均取得最小值.在训练过程中,将同时获得正三元组和负三元组的得分函数值.得分函数f 表示的是三元组的语义相似性,即三元组为真的概率.为了使训练目标最小化,首先要使正确三元组的得分函数值低于对应的错误三元组得分函数值,其次还要使两者之间的差值至少高于一个正常数,即边际参数γC ㊁γH ㊁γP .通过随机替换正确三元组的头实体或尾实体对生成的错误三元组进行采样.替换规则为S '={(h ',r ,t )|h 'ɪE ,(h ',r ,t )∉S }ɣ{(h ,r ,t ')|t 'ɪE ,(h ,r ,t ')∉S }.57第2期 李天宇,等:T r a n s _i s A :一种基于实体属性和语义层次的表示学习方法 Copyright ©博看网. All Rights Reserved.3 实验及结果分析本节使用了最新提出的公开数据集WN 18R R ,分别在链接预测和三元组分类任务上进行了实验验证.3.1 数据集大多数先前的研究使用两个基准数据集WN 18和F B 15K 评估表示学习模型的性能,这些数据集中的语义重复性㊁语义相关性或者数据不完整性,导致数据集中此类关系表现出很高的数据冗余性,这就使得数据集存在过度数据泄露的情况[15].因此D e t t m e r s 等人通过删除WN 18中反向三元组创建了WN 18R R.本文中的链接预测任务以及三元组分类任务将在WN 18R R 这一基准数据集上进行,WN 18R R 数据集的基本统计信息如表2所示.表2 WN 18R R 数据集类别数量D a t a#E n t i t i e s 40943#R e l a t i o n s11T r i pl e #T r a i n 86835#V a l i d 3034#T e s t31343.2 链接预测实验分析链接预测任务是知识图谱表示学习的标准评估任务,其目的是预测三元组中缺失的头实体㊁尾实体或者关系.根据现有的表示学习模型的评估标准,选用以下3个标准评估模型在链接预测任务上的性能:(1)M R R (正确实体的平均排序的倒数);(2)H i t s @10(正确实体排在前10的百分比);(3)H i t s @1(正确实体排名第一的百分比),这3个标准的值越大,模型的性能越好.T r a n s _i s A 模型的实验参数设置为:从{0.1,0.3,0.6,1,2}中选择边际参数γH ㊁γP ㊁γC 的值,从{20,50,100}中选择向量表示维度K 的值,从{0.1,0.01,0.001}中选择梯度下降学习率λ的值.根据验证集中链接预测的结果,得到了最优的参数配置:γH =0.1㊁γP =0.3㊁γC =2,K =100,λ=0.001,最大迭代次数为1000,同时采用L 1范式.表3展示了T r a n s _i s A 模型在WN 18R R 上的链接预测结果,可以看出:(1)表中所列模型的链接预测结果普遍较低,这是因为WN 18R R 数据集中去除了冗余数据,训练集中的数据重复率降低,使链接预测的结果更接近现实情况.(2)在H i t s @1指标上,模型取得了最优结果,而在M R R 和H i t s @10这两个指标上,T r a n s R 和T r a n s E 分别取得了比较高的结果.这是因为模型的重心放在了实体的层次结构以及实体属性表示中,在对其它关系类数据集训练时沿用了T r a n s E 的目标函数,使得本模型在处理复杂关系时没有表现出较为明显的性能提升.表3 WN 18R R 数据集上链接预测结果模 型M R R H i t s @N/%101T r a n s E R a w 0.19662.90.7F i l t e r 0.26264.20.8T r a n s H R a w 0.13745.21.0F i l t e r 0.17947.01.0T r a n s R R a w 0.20163.01.0F i l t e r 0.26564.51.2T r a n s _i s A (u n i f )R a w 0.18460.10.6F i l t e r 0.24062.70.7T r a n s _i s A (b e r n)R a w0.18961.11.0F i l t e r0.24563.71.267 曲阜师范大学学报(自然科学版) 2022年Copyright ©博看网. All Rights Reserved.3.3 三元组分类实验分析三元组分类的目的是判断给定三元组(h ,r ,t )的真假.对于∀(h ,r ,t )ɪS (V a l i d )/S (T e s t ),都有对应的(h ',r ,t )/(h ,r ,t ')ɪS '(V a l i d )/S '(T e s t),其中h ',t 'ɪE .在这个任务中,其评估指标为:准确率(A c c u r a c y )㊁精确率(P r e c i s i o n )㊁召回率(R e c a l l )和调和分数F 1-S c o r e .最优参数组合设定为:γH =0.1㊁γP =0.3㊁γC =2,K =100,λ=0.001.表4 WN 18R R 数据集上i s A 关系三元组的分类实验结果 单位:%模型A c c u r a c y P r e c i s i o n R e c a l l F 1-S c o r eT r a n s E49.549.661.755.0T r a n s H 50.150.061.555.2T r a n s R49.549.661.755.0T r a n s _i s A (u n i f)65.263.969.966.8T r a n s _i s A (b e r n)65.562.577.469.2表4展示了T r a n s _i s A 模型在i s A 关系三元组分类任务中的结果,可以得出:T r a n s _i s A 的4个指标数值均达到了60%以上,模型的召回率(R e c a l l )达到了77.4%,高出其他3个基准模型10个百分点左右,这充分说明了T r a n s _i s A 模型训练之后的实体和关系向量带有明显的语义层次信息,符合模型的预期.表5展示了T r a n s _i s A 模型在其它关系三元组分类任务中的结果,可得出如下结论:(1)在数据集WN 18R R 上,T r a n s _i s A 在A c c u r a c y㊁R e c a l l 和F 1-S c o r e 这3个指标上都高于T r a n s E ㊁T r a n s H 和T r a n -s R ,这说明模型整体的三元组分类能力是比较强的.但是在P r e c i s i o n 这一指标上略低于T r a n s R ,这是因为T r a n s _i s A 模型在进行知识表示学习时虽然考虑了实体间的语义层次,但还是将实体和关系放在同一空间中学习,这样就导致部分实体属性单一,从而使得模型精确率(P r e c i s i o n )略低于T r a n s R.(2)T r a n s _i s A 使用b e r n 采样方法时,模型的准确率(A c c u r a c y )高于使用u n i f 采样方法时的准确率,这说明b e r n 采样方法在本模型上的有效性.表5 WN 18R R 数据集上其他关系三元组的分类实验结果 单位:%模型A c c u r a c y P r e c i s i o n R e c a l l F 1-S c o r eT r a n s E86.787.28686.6T r a n s H 84.184.883.183.9T r a n s R86.990.882.186.2T r a n s _i s A (u n i f)87.688.686.287.4T r a n s _i s A (b e r n)88.087.788.3884 结束语本文提出了一种基于实体属性和语义层次的表示学习算法,并将其命名为T r a n s _i s A.首先介绍了该方法的研究问题及思路,利用知识图谱中实体本身的属性特征和实体间的语义层次对其进行表示学习.然后,详细的介绍了如何利用实体属性以及语义层次中的层级关系特性建模.在对知识图谱中三元组建模时,充分考虑了头㊁尾实体的语义范畴,以及实体自身属性信息.再根据不同类型的关系和不同属性的实体分别设计其得分函数.最后,在链接预测和三元组分类这两个经典任务中验证了模型的有效性.根据实体在不同的三元组中具有不同的表示,下一步考虑在不同的向量空间中对实体间关系建模,利用更加灵活的度量标准来设计损失函数,提高表示学习算法的性能.参考文献:[1]刘知远,孙茂松,林衍凯,等.知识表示学习研究进展[J ].计算机研究与发展,2016,53(2):247-261.[2]B o r d e sA ,U s u n i e rN ,G a r c i a -D u r a nA ,e t a l .T r a n s l a t i n g e m b e d d i n g s f o rm o d e l i n g mu l t i -r e l a t i o n a l d a t a [C ].N e u r a l I n f o r -77第2期 李天宇,等:T r a n s _i s A :一种基于实体属性和语义层次的表示学习方法 Copyright ©博看网. All Rights Reserved.87曲阜师范大学学报(自然科学版)2022年m a t i o nP r o c e s s i n g S y s t e m s(N I P S),2013:1-9.[3]W a n g Z,Z h a n g J,F e n g J,e t a l.K n o w l e d g e g r a p he m b e d d i n g b y t r a n s l a t i n g o nh y p e r p l a n e s[C].P r o c e e d i n g so f t h eA A A IC o n f e r e n c e o nA r t i f i c i a l I n t e l l i g e n c e,2014:1112-1119.[4]L i nY,L i uZ,S u nM,e t a l.L e a r n i n g e n t i t y a n d r e l a t i o n e m b e d d i n g s f o r k n o w l e d g e g r a p h c o m p l e t i o n[C].P r o c e e d i n g s o f t h eA A A IC o n f e r e n c e o nA r t i f i c i a l I n t e l l i g e n c e,2015:2181-2187.[5]F a n M,Z h o uQ,C h a n g E,e t a l.T r a n s i t i o n-b a s e dk n o w l e d g e g r a p h e m b e d d i n g w i t h r e l a t i o n a lm a p p i n gp r o p e r t i e s[C].P r o-c e ed i n g s o f t h e28t hP a c i f i cA s i a c o n fe r e n c e o n l a n g u a g e,i nf o r m a t i o na n d c o m p u t i n g,2014:328-337.[6]X i a oH,H u a n g M,H a oY,e t a l.T r a n s G:A g e n e r a t i v em i x t u r em o d e l f o rk n o w l e d g e g r a p he m b e d d i n g[J].a r X i v p r e p r i n ta r X i v,2015:1509.05488.[7]D e t t m e r sT,M i n e r v i n i P,S t e n e t o r p P,e t a l.C o n v o l u t i o n a l2dk n o w l e d g e g r a p he m b e d d i n g s[C].P r o c e e d i n g so f t h eA A A IC o n f e r e n c e o nA r t i f i c i a l I n t e l l i g e n c e,2018:1811-1818.[8]N g u y e nDQ,N g u y e nTD,N g u y e nDQ,e t a l.An o v e l e m b e d d i n g m o d e l f o r k n o w l e d g e b a s e c o m p l e t i o nb a s e d o n c o n v o l u-t i o n a l n e u r a l n e t w o r k[C].N A A C L-H L T,2018:327-333.[9]S c h l i c h t k r u l lM,K i p fT N,B l o e m P,e t a l.M o d e l i n g r e l a t i o n a l d a t aw i t h g r a p hc o n v o l u t i o n a l n e t w o r k s[C].E u r o p e a ns e-m a n t i cw e b c o n f e r e n c e,S p r i n g e r,C h a m,2018:593-607.[10]V e l i k o v i P,C u c u r u l lG,C a s a n o v aA,e t a l.G r a p ha t t e n t i o nn e t w o r k s[C].I C L R(P o s t e r),2018.[11]N a t h a n i D,C h a u h a n J,S h a r m aC,e t a l.L e a r n i n g a t t e n t i o n-b a s e de m b e d d i n g s f o r r e l a t i o n p r e d i c t i o n i nk n o w l e d g e g r a p h s[C].A C L,2019:4710-4723.[12]L vX,H o uL,L i J,e t a l.D i f f e r e n t i a t i n g c o n c e p t sa n d i n s t a n c e s f o rk n o w l e d g e g r a p he m b e d d i n g[C].P r o c e e d i n g so f t h eC o n f e r e n c e o nE m p i r i c a lM e t h o d s i nN a t u r a l L a n g u a g eP r o c e s s i n g,2018:1971-1979.[13]W a n g P,Z h o u J.J E C I++:A m o d i f i e d j o i n t k n o w l e d g e g r a p he m b e d d i n g m o d e l f o r c o n c e p t s a n d i n s t a n c e s[J].B i g D a t aR e s e a r c h,2020:100160.[14]Z h a n g Z,C a i J,Z h a n g Y,e t a l.L e a r n i n g h i e r a r c h y-a w a r e k n o w l e d g e g r a p h e m b e d d i n g s f o r l i n k p r e d i c t i o n[J].P r o c e e d i n g so f t h eA A A IC o n f e r e n c e o nA r t i f i c i a l I n t e l l i g e n c e,2020,34(3):3065-3072.[15]S u nZ,V a s h i s h t hS,S a n y a l S,e t a l.Ar e-e v a l u a t i o no f k n o w l e d g e g r a p hc o m p l e t i o nm e t h o d s[C].A C L,2020:5516-5522.T r a n s_i s A:a r e p r e s e n t a t i o n l e a r n i n g m e t h o db a s e do n e n t i t y a t t r i b u t e s a n d s e m a n t i c l e v e l sL IT i a n y u,WA N GY a n n a,Z H O UZ i l i,Z HA O X i a o h a n(S c h o o l o fC y b e r S c i e n c e a n dE n g i n e e r i n g,Q u f uN o r m a lU n i v e r s i t y,273165,Q u f u,S h a n d o n g,P R C)A b s t r a c t:T r a d i t i o n a lr e p r e s e n t a t i o nl e a r n i n g m e t h o d sr e p r e s e n tt r i p l e sa si n d e p e n d e n ti n d i v i d u a l s, w h i c hm a k e s t h e r e p r e s e n t a t i o nv e c t o r s o f e n t i t i e s a n d r e l a t i o n s h i p s l a c ks e m a n t i c l e v e l i n f o r m a t i o n.T w o e n t i t i e s l i n k e db y t h e s a m e r e l a t i o n s h i p(s u c ha s i s_Ar e l a t i o n s h i p)m a y h a v ed i f f e r e n t a t t r i b u t e s a n ds e-m a n t i c c a t e g o r i e s.T h e r e f o r e,w e p r o p o s e t h eT r a n s_i s A m o d e l.S p e c i f i c a l l y,f i r s t e n c o d e t h ee n t i t y u n d e r t h e i s_Ar e l a t i o n s h i p a s a s p h e r e,a n d t h e r e l a t i v e p o s i t i o n b e t w e e n t h e s p h e r e s i s e x p r e s s e d a s a n i n t e r-e n t i-t y r e l a t i o n s h i p;t h e n,o n t h e b a s i s o f e n t i t y a t t r i b u t e s,t h e s e m a n t i c h i e r a r c h y b e t w e e n e n t i t i e s i s c o n s t r u c t e d u s i n g t h e t r a n s i t i v e j u d g m e n t c o n d i t i o n s o f t h e b i n a r y r e l a t i o n s h i p.T h e l i n k p r e d i c t i o n a n d t r i p l e c l a s s i f i c a-t i o ne x p e r i m e n t s o fT r a n s_i s Aa r e c a r r i e do u t o n WN18R Rd a t a s e d t ov e r i f y t h e v a l i d i t y o f t h em o d e l.K e y w o r d s:k n o w l e d g e g r a p h;r e p r e s e n t a t i o n l e a r n i n g;e n t i t y a t t r i b u t e;s e m a n t i c l e v e lCopyright©博看网. All Rights Reserved.。
异质信息网络中融合多源信息的推荐算法研究

异质信息网络中融合多源信息的推荐算法研究异质信息网络中融合多源信息的推荐算法研究引言:随着互联网的快速发展,人们对个性化推荐的需求也越来越大。
然而,在日常生活中,我们需要面对的不仅是搜索引擎中的文本信息,还有社交网络、电子商务平台、音乐、视频等多种类型的信息。
而这些信息源的异质性使得推荐系统面临着许多挑战。
因此,融合异质信息网络中多源信息的推荐算法研究变得尤为重要。
1. 异质信息网络的特点异质信息网络中存在着多种不同类型的节点和边。
例如,在社交网络中,用户节点和好友关系边的存在;在电子商务平台中,用户节点和产品关系边的存在。
这种异质性使网络具备复杂的结构和多样性的信息。
2. 多源信息融合的挑战融合多源信息进行推荐有以下挑战:(1)异质信息网络的复杂性:不同类型的节点和边的存在使得信息网络的结构复杂多样,如何有效地表征和建模这种复杂性是一个关键问题。
(2)数据稀疏性和冷启动问题:在异质信息网络中,很少有用户与物品之间的交互行为,导致推荐算法面临数据稀疏性和冷启动问题,即如何对新用户和新物品进行准确的推荐。
(3)跨域推荐问题:在异质信息网络中,不同类型的节点之间存在着不同的域和特征。
如何对不同域和特征的信息进行有效融合,实现跨域推荐,是一个挑战。
3. 异质信息网络中融合多源信息的推荐算法为了解决异质信息网络中的推荐问题,一种可行的方法是采用基于图的推荐算法。
图模型能够有效地表征异质信息网络中的节点和边,同时结合了网络的拓扑结构和节点的属性信息。
具体而言,可以采用以下步骤进行多源信息融合的推荐算法研究:(1)构建异质信息网络:根据不同的信息源,构建异质信息网络,并将各个信息源中的节点和边进行连接。
(2)图表示学习:通过图表示学习方法,将节点和边映射到低维向量空间中,表示网络的拓扑结构和节点的属性信息。
(3)信息融合:将不同域和特征的信息进行融合,生成综合的节点表示,以实现跨域推荐。
(4)推荐模型构建:基于融合后的节点表示,构建推荐模型,从而实现个性化推荐。
知识图谱 Embedding 在大规模数据建模中的应用

知识图谱 Embedding 在大规模数据建模中的应用知识图谱是一种用于表示知识和关系的数据结构,它将实体、属性和关系组织成一个经过形式化建模的网络。
知识图谱嵌入(Knowledge Graph Embedding)是指将这些结构化知识映射到连续向量空间的技术,以便于机器学习算法在大规模数据建模中进行应用。
本文将介绍知识图谱嵌入在大规模数据建模中的应用,并探讨其优势和挑战。
一、知识图谱嵌入的概念知识图谱是一种语义网络,通过实体、属性和关系之间的联系来表达现实世界中的知识。
知识图谱嵌入是将这些知识转换为向量表示的过程。
通过将实体、属性和关系映射到低维向量空间中的点和向量,我们可以使用计算机算法对知识图谱进行分析和推理。
二、知识图谱嵌入的应用领域1. 信息检索和问答系统知识图谱嵌入可以帮助机器理解用户的查询意图,并从海量的知识图谱中检索相关的信息。
此外,通过将问题和答案映射到低维向量空间中,我们可以使用相似度计算来找到最相关的答案。
2. 推荐系统知识图谱嵌入可以用于推荐系统中的用户建模和物品建模。
通过将用户和物品映射到向量空间,我们可以计算用户和物品之间的相似度,并生成个性化的推荐结果。
3. 自然语言处理知识图谱嵌入可以被用于自然语言处理任务中,如命名实体识别、实体关系抽取等。
通过将文本中的实体和关系映射到向量空间,我们可以使用机器学习算法对文本进行分析和理解。
4. 数据挖掘和图分析知识图谱嵌入可以将大规模的图数据进行压缩和表示。
通过将图节点和边映射到向量空间,我们可以使用传统的数据挖掘和图分析算法来处理这些数据,从而发现隐藏的模式和规律。
三、知识图谱嵌入的优势1. 结构化表示知识图谱嵌入能够将知识以结构化的方式进行表示,这使得机器能够更好地理解和处理这些知识。
2. 上下文关联知识图谱嵌入可以利用实体和关系之间的上下文关系。
通过捕捉实体之间的关联性,我们可以更准确地表示和分析知识图谱中的数据。
3. 灵活性和可扩展性知识图谱嵌入可以根据不同的应用需求进行灵活和可扩展的设计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
+ *9G=50?=, MH++N0<*0./ .+*6",: ,+(,+<+.*7*0". #+7,.0./ 7#/",0*H'<'70.#E G"8)<". H"6 *" ,+(,+<+.**H+.+*6",: <*,)8*),+0.G",'7*0".% 7.F 0/.",+ *H+ 72).F7.**+N*)7#7**,02)*+ 0.G",'7*0". "G."F+<0. ,+7#.+*6",:$I. ",F+,*" 0.8",(",7*+.+*6",: <*,)8*),+0.G",'7*0". 7.F ."F+<6 *+N*)7#7**,02)*+0.G",'7*0".% *H0<(7(+,(,+<+.*<7."1+#.+*6",: ,+(,+<+.*7*0". #+7,.0./ 7#/",0*H' 0.8",(",7*0./ 60*H ."F+<6 *+N*)7#7**,02)*+0.G",'7*0".$?<*" 78H0+1+')*)7#,+<*,70.*"G *H+*6" (7,*"G.+*6",: 0.G",'7*0". F),0./ *H+*,70.0./ (,"8+<<% *H0<7#/",0*H' 8".<*,)8*<78")(#+F .+),7#.+*6",: *,70.0./ '"F+#27<+F ". (7,7'+*+,<H7,0./ <*,7*7/+'$I*7((#0+<"(*0'0U7*0". <*,7*+/E 27<+F ". .+/7*01+<7'(#+7.F <*"8H7<*08/,7F0+.*F+<8+.**" 78H0+1+,7(0F 8".1+,/+.8+"G*H+*,70.0./ (,"8+<<%7.F (+,G",'<7. +N(+,0'+.*7#+17#)7*0". "G."F+8#7<<0G087*0".$-N(+,0'+.*7#,+<)#*<F+'".<*,7*+*H7*8"'(7,+F 60*H 3"8$!+87#/",0*H'% 3++(>7#: 7#/",0*H'% 3> 03$! 7#/",0*H' 7.F M?3> 7#/",0*H'%*H+8#7<<0G087*0". (+,G",'7.8+"G*H+(,"("<+F 7#/",0*H' 0<2+**+,$ + H<8 I@5:G, 8"'(#+N .+*6",:' .+*6",: ,+(,+<+.*7*0". #+7,.0./' 0.G",'7*0". G)<0".' *+N*)7#7**,02)*+ 0.G",'7*0".' .+),7#.+*6",: JKL*#%$#)'*& OP$0<<.$#%%%5(!$&$%%,%*'%
中文引用格式刘正铭%马"宏%刘 树 新% 等$一 种 融 合 节 点 文 本 属 性 信 息 的 网 络 表 示 学 习 算 法 ( =) $计 算 机 工 程% $%#&%!!!##" *#',5#*#$ 英文引用格式AIC 4H+./'0./%J? D"./%AIC 9H)N0.%+*7#$? .+*6",: ,+(,+<+.*7*0". #+7,.0./ 7#/",0*H' G)<0./ 60*H *+N*)7#7**,02)*+0.G",'7*0". "G."F+<( =) $&"'()*+,-./0.++,0./%$%#&%!!!##" *#',5#*#$
一种融合节点文本属性信息的网络表示学习算法
刘正铭马"宏刘树新杨奕卓李"星
! 国家数字交换系统工程技术研究中心%郑州 !,%%%$"
摘"要 现有网络表示学习算法主要针对网络结构信息进行表示学习%而忽略现实网络中丰富的节点文本属性信 息# 为有效融合网络结构信息和节点文本属性信息进行表示学习%提出一种新的网络表示学习算法# 为实现两方 面信 息 在 训 练 过 程 中 的 相 互 约 束 %建 立 基 于 参பைடு நூலகம்数 共 享 的 共 耦 神 经 网 络 训 练 模 型 %并 利 用 负 采 样 和 随 机 梯 度 下 降 的 优化策略实现训练过程的快 速 收 敛# 实 验 结 果 表 明%与 3"8$!+8算 法&3++(>7#: 算 法&3> 03$!算 法 和 M?3> 算法相比%该算法的分类性能更好# 关键词 复杂网络'网络表示学习'信息融合'文本属性信息'神经网络
第 !! 卷"第 ## 期 " !"#$!!" %"$## "
人工智能及识别技术
计算机工程 ""
&"'()*+,-./0.++,0./
$%#& 年 ## 月 %"1+'2+,$%#&
文 章 编 号 !"""#$%&'&"!'!!#"!(N#"O) ) ) 文 献 标 志 码 *) ) ) 中 图 分 类 号 +,$"!M(
* Z<=I@56P<45<G<A=0=1@AR<05A1AT *2T@51=C/ ;>G1AT I1=C +<X=>02*==519>=<LAD@5/0=1@A@DZ@:<G
AIC 4H+./'0./%J? D"./%AIC 9H)N0.%B?%@ B0UH)"%AIV0./
! %7*0".7#30/0*7#960*8H0./ 9E<*+' -./0.++,0./ 7.F M+8H."#"/087#SW3 &+.*+,%4H+./UH") !,%%%$%&H0.7"
")概述
近年来%随着以智能终 端和社 交媒 体为代表 的 各种信息渠道的出现%大数据分析技术越来越受到 人们的重视(#) # 社交网络&科学引文网络等复杂网 络的规模不断扩大%网络数据类型复杂多样# 现实 网 络 数 据 的 高 维 性 &稀 疏 性 和 异 质 性 等 特 点 %对 现 有 网络分析技术带来严重挑战%这使得对于网络数据 的表示学习研究具有重要意义#
网络表示学习旨在将每个网络节点映射为一个 低维空间的稠密向量%使得相似的网络节点在低维 空间距离较近# 网络表示学习通过对网络数据形式 进行变换%一 方 面 使 其 包 含 的 数 据 信 息 能 够 更 加 容 易提取和分析%即由人为的特征工程转化为机器的 自动特征提取%另一方面有效缓解了网络数据表示 的高维性&稀疏性等问题#