非对称的异质信息网络推荐算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
*The National Natural Science Foundation of China under Grant No.61876103(国家自然科学基金);the Projects of Key Research and Development Plan of Shanxi Province under Grant No.201903D121162(山西省重点研发计划项目);the 1331Engineering Project of Shanxi Province (山西省1331工程项目).Received 2019-04-25,Accepted 2019-06-28.
CNKI 网络出版:2019-07-12,https:///KCMS/detail/11.5602.TP.20190709.1108.010.html
计算机科学与探索
Journal of Frontiers of Computer Science and Technology
非对称的异质信息网络推荐算法*
赵
传1,2,3,张凯涵1,2,3,梁吉业1,2,3+
1.山西大学计算机与信息技术学院,太原030006
2.山西大学计算智能与中文信息处理教育部重点实验室,太原030006
3.山西大学智能信息处理研究所,太原030006+通信作者E-mail:***********.cn 摘
要:异质信息网络作为一个新的研究方向,近年来在推荐系统领域引起了广泛的关注。
目前基于异质信
息网络的大部分相似度计算方法认为用户的相似关系是对称的,但是在实际中由于不同用户评分的物品数量不同,有时会导致相似关系出现非对称情况。
为了能够更好地度量用户之间的相似关系,首先在均方差相似度公式的基础上,引入非对称系数刻画相似度的非对称性;然后根据元路径的特征赋予不同元路径权重,并将不同元路径的相似度结果进行加权以提高用户相似度的准确性;最后通过在矩阵分解模型中融合相似度信息与评分信息实现基于异质信息网络的评分预测推荐。
在数据集上的实验结果表明,该算法在平均绝对误差和均方根误差两个评价指标上优于传统算法。
关键词:异质信息网络;元路径;相似度;矩阵分解文献标志码:A
中图分类号:TP391
赵传,张凯涵,梁吉业.非对称的异质信息网络推荐算法[J].计算机科学与探索,2020,14(6):939-946.
ZHAO C,ZHANG K H,LIANG J Y .Asymmetric recommendation algorithm in heterogeneous information network[J].Journal of Frontiers of Computer Science and Technology,2020,14(6):939-946.
Asymmetric Recommendation Algorithm in Heterogeneous Information Network
ZHAO Chuan 1,2,3,ZHANG Kaihan 1,2,3,LIANG Jiye 1,2,3+
1.School of Computer and Information Technology,Shanxi University,Taiyuan 030006,China
2.Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education,Shanxi University,Taiyuan 030006,China
3.Institute of Intelligent Information Processing,Shanxi University,Taiyuan 030006,China
Abstract:In recent years,as a new research direction,heterogeneous information networks have attracted a lot of attention in recommendation system.Most similarity measures based on heterogeneous information networks follow that the relationship between users is symmetrical,but in real life,due to the number of items rated by different users are various,it sometimes makes the relationship asymmetrical.In order to measure the relationship more
1673-9418/2020/14(6)-0939-08
doi:10.3778/j.issn.1673-9418.1905089
Journal of Frontiers of Computer Science and Technology计算机科学与探索2020,14(6)
1引言
推荐系统是大数据时代解决信息过载问题的重要手段之一[1]。
在众多关于推荐系统的研究工作中,异质信息网络作为一种有效的信息建模方法[2],逐渐受到人们的关注。
异质信息网络可以通过构建多种类型的实体以及实体之间的联系[3]表示各种数据信息,将多种不同的数据信息利用到推荐任务中可以带来更好的推荐效果[4-5],因此有越来越多的推荐工作利用异质信息网络解决[6-7]。
基于元路径进行相似性度量是最重要和基础的一个方向。
目前基于元路径已经开展了大量的研究工作。
例如,Sun等人[8]通过抽取两个用户之间对称的元路径度量用户之间的相似性,提出PathSim算法;Shi等人[9]提出基于元路径的双向随机游走算法HeteSim度量网络中任意节点之间的相关性;Lao等人[10]利用在元路径上的随机游走度量网络里任意实体之间的相似性。
上述基于元路径计算用户相似度的算法均假设用户之间的相似度满足对称性,而在实际中利用对称性相似度计算方法有时会导致用户相似度存在误差,比如当用户u与用户v对物品的评分向量分别为(2,5,4,5,4,1)和(2,-,-,-,-,1)时(“-”表示用户未对物品进行评分),传统的对称性相似度计算方法根据共同评分项会得出用户u与用户v具有高相似度的结果,但用户v对于其他未评分物品的兴趣程度不一定会与用户u相同。
因此,在这种情况下,用户间的相似度是非对称的[11]。
另外,基于元路径度量用户相似度时,多条不同的元路径会得到不同的相似度[12],元路径从不同的角度反映了用户之间的联系,因此为了统一用户之间的相似程度,有必要对不同的元路径赋予不同的权重,通过权重融合不同元路径的相似度结果,能够更加准确地体现用户之间的关系。
为此,本文在计算用户间相似度时,一方面考虑用户间相似度的非对称性;另一方面考虑用户间不同元路径的权重,以准确度量用户间的相似度。
首先利用用户的评分信息和物品的属性信息构建异质信息网络,通过考虑用户之间共同评分项在已评分项中占的比例,即非对称系数,计算用户间的非对称相似度;然后根据元路径的特征计算不同元路径的权重,权重用于融合不同元路径的相似度结果,得到用户总的相似度矩阵;最后利用矩阵分解模型将评分矩阵和相似度矩阵进行联合分解,计算用户和物品的潜在特征向量,预测未知评分。
在数据集MovieLens的三个不同规模的数据集上进行实验比较,结果显示本文所提算法在评价指标均方根误差和平均绝对误差上优于已有算法。
2相关概念
2.1加权异质信息网络
给定一个有向图G=(V,E,W)。
G里每一个对象v∈V是一个特殊的对象类型φ(v)∈A,A是对象类型的集合;每一个连边e∈E是一个特殊的链接类型ψ(e)∈R,R是链接类型的集合;每一个属性值w∈W 是一个特殊的属性值集合θ(w)∈W。
如果对象类型数量|A|>1或者关系类型数量|R|>1,该网络叫作异质信息网络[13],如果权重数量|W|>1,该网络叫作加权异质信息网络[14]。
图1为一个包含用户、电影、电影类型、导演的加权异质信息网络。
网络模式是异质信息网络的模板[15]。
用δ=(A, R)来表示网络模式。
图2为图1的网络模式图。
元路径是异质信息网络最重要的概念,它定义在网络模式上,用来描述异质信息网络中任意两节点间的不同路径类型[16]。
它可以表示为P=A1→A2→…→A l→A l+1,A1,A2,…,A l+1表示节点类型。
accurately between users,first of all,the asymmetric coefficient is employed to characterize the asymmetry of similarity based on the mean square deviation formula.Then according to the characteristics of meta-paths,different weights of meta-paths are given,and the similarity results are weighted to improve accuracy.Finally,the recommendation for rating prediction based on heterogeneous information network is implemented combined with similarity information and rating information in matrix factorization model.The experimental results on dataset demonstrate that the proposed algorithm is superior to the traditional algorithms in the evaluation of mean absolute error and root mean square error.
Key words:heterogeneous information network;meta-path;similarity;matrix factorization
940
赵传等:非对称的异质信息网络推荐算法
P -1=A l +1→A l →…→A 2→A 1代表相反的元路径。
在两条元路径P 1=A 1→A 2→…→A l →A l +1和P 2=
A ′1→A ′2→…→A ′l →A ′l +1中,如果A l +1=A ′1,则两条
元路径可以合并为一条元路径,表示为P =P 1P 2,比如元路径User →Movie 和元路径Movie →User 连接
成元路径User →Movie →User 。
用户之间可以通过不同的元路径连接,不同的元路径包含不同的语义[17-18]。
在图1的加权异质信息网络中,元路径User →Movie →
User 和元路径User →Movie →Type →Movie →User 所连
接的用户之间具有不同的语义关系,前者将看过相同电影的用户连接起来,后者将看过相同电影类型的用户连接起来。
2.2矩阵分解模型
在推荐系统里,矩阵分解模型的基本思想是将
用户-物品的评分矩阵R 分解成两个低维潜在特征矩阵U 和V ,通过U 和V 的点积可以得到一个拟合评
分矩阵,从而实现评分预测。
矩阵分解模型是通过最小化目标函数L (R ,U ,V )得到低维特征矩阵:
L (R ,U ,V )=12∑i =1n
∑j =1
m
I ij (R ij -U i V T j )2+λU 2||U ||2F +λV
2
||V ||2F
(1)式中,I ij 是一个指示函数,如果用户i 对物品j 有过评分,为1,否则为0。
U ∈ℝn ×d ,
V ∈ℝm ×d ,d 是用户和物品的潜在特征维度,d ≪min(n ,m ),λU 和λV 是
正则化系数,通过随机梯度下降可以对目标函数进行求解。
3基于异质信息网络的推荐算法
本文融合评分信息与物品属性信息,综合考虑
元路径的权重与非对称相似性这两个因素对用户相似度的影响,提出一种基于异质信息网络的推荐算法。
通过计算用户和物品的潜在特征表示,从而预测未知评分。
本章将重点分析以下3个问题:(1)如何基于元路径计算用户之间的非对称相似度;(2)如何度量不同元路径的权重;(3)如何利用评分信息与用户相似度信息预测未知评分。
图3为本文的算法流程图,表1
为本文使用的主要符号。
Fig.3Flow chart of algorithm 图3
算法流程图
3.1用户之间非对称相似度的确定
本文首先利用均方差(mean squared difference ,
MSD )[19]相似度公式计算用户之间的对称相似度;然
后根据非对称系数,计算用户之间的非对称相似
度。
具体包含以下两步:
Fig.1
Diagram of weighted heterogeneous
information network 图1
加权异质信息网络图
Fig.2Network schema 图2
网络模式图
941
Journal of Frontiers of Computer Science and Technology 计算机科学与探索2020,14(6)
(1)由于用户之间在不同的物品上存在评分差异,评分差异的大小反映了用户之间的相似程度,因此本文利用均方差相似度公式通过用户之间的评分差异来计算用户相似度,在给定元路径P 的基础上
(P =P l P -1l ,P l =A 1→A 2→…→A l →A l +1),计算用户u 和用户v 之间的对称相似度:
sim (u ,v |P )=1-∑
k ∈I uv
(M uk -M vk )
2
(M uk )2+(M vk )2
(2)
其中,M =W A 1
A 2
W A 2
A 3
…W A l
A l +1
,
W A i
A j
代表类型节点A i 到类型节点A j 的邻接矩阵,M ij 代表对象i 和对象j 在矩阵M 上对应的取值。
I uv ={k |M uk >0∧M vk >0}代表用户u 和v 的共同评分项。
(2)本文把共同评分项在用户已评分项中占的比例定义为非对称系数,该系数反映了上述对称相似度对于用户的参考程度。
用户u 对v 在元路径P 上的非对称系数为:
asy (u ,v |P )=|I uv
|
|I u |
(3)
其中,
I u 代表用户u 的评分项。
根据非对称系数,用户u 对v 的非对称相似度:asim (u ,v |P )=asy (u ,v |P )*sim (u ,v |P )
(4)
3.2元路径权重的确定
由于从不同元路径角度计算得到的用户相似度
不同,为了相似度结果的统一,本文从元路径的特点出发,赋予各个元路径不同的权重。
针对权重的确定,本文从两个角度进行分析:
(1)元路径的长度。
元路径的长度指的是该条元路径的边数。
直观上说,短的元路径比长的元路径具有更高的权重,因为短的元路径使对象之间关系更加直接,元路径应该被赋予更高的权重。
具体用公式表示为:
w P
1=
1/len (P )∑P ′∈L
1/len (P ′)
(5)
其中,L 代表所有的元路径的集合,
len (P )代表元路径P 的长度。
(2)元路径的路径数。
元路径的路径数指的是在异质信息网络内满足该条元路径条件的路径数量。
路径数多的元路径代表对象之间的联系更密切,元路径权重应该更高。
用公式表示为:
w P
2=
num (P )∑P ′∈L
num (P ′)
(6)
其中,
num (P )代表元路径P 的路径数。
根据以上两方面,利用下式计算元路径P 的权重:
w P =12
(w P 1+w P
2)(7)
结合不同的元路径权重和不同元路径计算的相似度结果,计算用户之间的相似度:
S uv =∑P ∈L
w P asim (u ,v |P )
(8)
3.3利用矩阵分解模型预测未知评分
已知用户-物品的评分信息和用户-用户的相似度信息,本文算法利用矩阵分解模型,同时将评分矩阵R 和相似度矩阵S 进行分解,得到用户特征矩阵U 、物品特征矩阵V 、用户相似特征矩阵Z 。
模型的
目标函数为:
L (R ,S ,U ,V ,Z )=12∑i =1n
∑j =1
m
I R ij (g (U i V T j )-R ij )2+λS 2∑i =1n ∑k =1
n I S
ik (g (U i Z T k )-S ik )2+λU 2||U ||2F +λV 2||V ||2F +λZ
2
||Z ||2F
(9)由于评分信息的取值范围为[1,5],相似度信息
的取值范围为[0,1],为了统一评分信息和相似度信息的取值范围,本文利用函数f (x )将评分信息限制在[0,1]之间,f (x )=(x -1)/(R max -1)。
为了与上述取值范围统一,利用函数g (x )约束U i V T j 和U i Z T k 在[0,1]之间,g (x )=1/(1+exp(-x ))。
λS 是平衡评分信息和相似度信息的系数,若λS =0,表示矩阵分解模型只
Table 1
Main symbols used in this paper 表1
本文用到的主要符号
942
赵传等:非对称的异质信息网络推荐算法
利用评分信息,若λS >0,表示矩阵分解模型同时考虑评分信息和相似度信息。
对目标函数进行求导,分别得到U 、V 、Z 的梯度:ìíîïïïïïïïïïïïïïïïï∂L ∂U i =∑j =1m I R ij g ′(U i V T j )(g (U i V T
j )-R ij )V j +λS ∑k =1
n I S ik g ′(U i Z T k )(g (U i Z T k )-S ik )Z k +λU U i ∂L ∂V j =∑i =1n
I R ij g ′(U i V T j )(g (U i V T j )-R ij )U i +λV V j ∂L ∂Z
k
=λS ∑i =1n I S ik g ′(U i Z T k )(g (U i Z T k )-S ik )U i +λZ Z k (10)其中,g ′(x )=exp(x )/(1+exp(x ))2,代表g (x )的导函数。
用随机梯度下降方法对U 、
V 、Z 进行迭代更新。
经过有限次数迭代后,利用已经更新的用户潜在特征矩阵U 和物品潜在特征矩阵V 预测用户u 对物品i 的预测评分:
R ui =(R max -1)g (U u V T i )+1
(11)
3.4算法流程
基于以上对算法的介绍,本文所提算法描述如下:输入:用户-物品评分矩阵R ,评分矩阵和相似度矩阵的平衡因子λS ,特征维度d ,随机梯度下降学习率α,正则项系数λU 、λV 、λZ 。
输出:预测评分值R ui。
步骤1利用式(2)~式(4)计算不同元路径下用户之间的非对称相似度。
步骤2根据式(5)~式(7)计算每条元路径的权重。
步骤3利用式(8)结合不同元路径的相似度信息,得到用户之间总的相似度矩阵。
步骤4根据式(9)、式(10),利用随机梯度下降法对用户潜在特征矩阵U 和物品潜在特征矩阵V 进行迭代更新。
步骤5利用式(11)预测评分R ui 。
4实验及结果分析
为验证本文所提算法的有效性,在数据集Movie-
Lens100K 、MovieLens1M 和MovieLens10M 上进行实验,并与其他推荐算法进行比较分析,最后通过实验结果分析本文所提算法中参数的选取对实验性能的影响。
4.1数据集
本文用到的数据集都包括用户-电影评分信息,
以及用户和电影的属性信息,包括用户性别、用户年龄、用户职业、电影名称、电影类别、上映时间等,评分值在1到5之间,且每个用户至少评分过20部电影。
MovieLens100K 数据集包含了943位用户对1682部电影的100000条评分信息,MovieLens1M 数据集中包含6040位用户对3900部电影的1000209条评分数据。
MovieLens10M 数据集包含71567位用户对10681部电影的10000054条评分,本文从中随机抽取10000名用户对10681个物品的评分记录作为训练集和测试集的数据。
表2统计这3个数据集的相关信息。
Table 2
Statistic information of 3datasets 表2
3
个数据集的统计信息
4.2评价指标
本文在衡量推荐性能时,为体现预测评分的准
确度,采用推荐系统中广泛使用的平均绝对误差(mean absolute error ,MAE )和均方根误差(root mean squared error ,RMSE )两个评价指标。
这两个评价指标的值越小表示预测效果越好。
MAE 的定义如下:
MAE =1|R test |∑R ui
∈R
test
|R ui -R ui |
(12)
其中,
|R test |表示测试集中的评分数量。
RMSE 的定义如下:RMSE
=
(13)
4.3实验设置
为了验证本文算法的有效性,在MAE 、RMSE 两
个指标上,同以下算法进行比较:
(1)基于用户的协同过滤推荐算法(user-based collaborative filtering ,UCF )。
通过预先定义的相似度度量方法计算用户的相似用户集合,根据相似用户,计算出目标用户对目标物品的预测评分。
(2)基于物品的协同过滤推荐算法(item-based collaborative filtering ,ICF )。
与UCF 类似,根据预先定义的相似度度量方法计算物品之间的相似度,通
943
Journal of Frontiers of Computer Science and Technology 计算机科学与探索2020,14(6)
过用户已评分的物品和目标物品的相似关系,预测用户对目标物品的评分。
(3)基于概率矩阵分解的推荐算法(probabilistic
matrix factorization ,PMF )[20]。
它是以用户-项目评分
矩阵为基准,利用矩阵分解模型计算用户和项目的潜在特征表示,通过这两个潜在特征表示的点积,可以得到对原始评分矩阵的一个拟合矩阵,从而对未知的评分进行预测。
(4)基于语义路径的个性化推荐算法(semantic path based recommendation ,SemRec [4])。
该方法在利用PathSim 计算用户相似性的基础上,考虑不同元路径的权重对评分结果的影响,通过学习权重,得到不同元路径对用户评分影响的权值,最后预测评分。
本文选取其中利用单条元路径计算用户相似度的算法SemRec Sgl 和针对所有用户的统一权重学习算法SemRec All 进行比较。
本文算法中,用户和项目的潜在特征维度d 设置
为5,λS 值设置为15。
λU =λV =λZ =0.001,随机梯度下降的学习率α=0.001。
实验采用五折交叉验证
方法,将数据集随机分为5份,每次取其中1份作为测试集,剩余4份作为训练集,最终结果为5次实验结果的平均值。
本文选取的元路径是User →Movie →User 和User →Movie →Type →Movie →User 。
4.4实验结果
实验结果如表3~表5所示。
参数λS 的不同取值
对评价指标MAE 和RMSE 的影响如图4、图5所示。
4.5实验分析
由表3~表5可以看到,基于异质信息网络的
SemRec All 算法和SemRec Sgl 算法以及本文算法在各
数据集上的表现均优于传统的协同过滤算法和概率矩阵分解算法,说明通过引入额外的属性信息确实
有利于推荐算法准确性的提升。
而且,对比基于单条元路径的异质信息网络算法(SemRec Sgl 算法)、基
Table 3
Experimental results on dataset MovieLens100K 表3
在数据集MovieLens100K
上的实验结果
Table 4
Experimental results on dataset MovieLens1M 表4
在数据集MovieLens1M
上的实验结果
Table 5
Experimental results on dataset MovieLens10M 表5
在数据集MovieLens10M
上的实验结果
Fig.4Influence of λS on MAE 图4
λS 的取值对MAE
的影响
Fig.5Influence of λS on RMSE 图5
λS 的取值对RMSE 的影响
944
赵传等:非对称的异质信息网络推荐算法
于多条元路径的异质信息网络算法(SemRec
All
算法和本文算法)在各个数据集上都有比较好的表现。
另外对比SemRec
All
算法,由于在计算用户相似度时,本文算法考虑到用户之间的非对称情况,可以更加
客观地反映用户之间的相似关系;而且与SemRec
All 算法不同,本文算法将不同的元路径考虑为不同的权重,体现出不同元路径对于用户相似度的影响程度,使得融合不同元路径的相似度结果更加全面。
在评价指标MAE和RMSE上要小于SemRec
All
算法。
从图4、图5可以看到,λ
S=0时表示只利用评分信息。
随着用户相似关系的引入,λ
S>0时,推荐效果逐渐提升,但在λ
S>15后推荐效果有所下降,说明适当引入相似度信息有利于推荐效果的提升,因此本文选取15作为λ
S
的取值。
5结束语
本文提出了一种基于异质信息网络的推荐算法,该算法通过不同的元路径计算用户的非对称相似度,并且考虑将不同元路径的相似度结果加权融合,得到用户之间总的相似度信息。
最后利用矩阵分解方法融合评分信息和相似度信息,计算用户对未评分物品的预测评分。
实验结果表明,利用非对称性处理用户相似关系并且将相似度结果加权融合有助于推荐效果的提升。
未来工作中,将考虑针对不同的用户引入不同的元路径权重,从用户角度进一步提升相似度的准确性。
References:
[1]Adomavicius G,Tuzhilin A.Toward the next generation of
recommender systems:a survey of the state-of-the-art and possible extensions[J].IEEE Transactions on Knowledge and Data Engineering,2005,17(6):734-749.
[2]Shi C,Hu B B,Zhao W X,et al.Heterogeneous information
network embedding for recommendation[J].IEEE Transac-tions on Knowledge and Data Engineering,2017,31(2): 357-370.
[3]Sun Y Z,Han J W,Yan X F,et al.Mining knowledge from
interconnected data:a heterogeneous information network analysis approach[J].Proceedings of the VLDB Endow-ment,2012,5(12):2022-2023.
[4]Shi C,Zhang Z Q,Luo P,et al.Semantic path based persona-
lized recommendation on weighted heterogeneous informa-
tion networks[C]//Proceedings of the24th ACM Interna-tional Conference on Information and Knowledge Manage-ment,Melbourne,Oct19-23,2015.New York:ACM,2015: 453-462.
[5]Y ang B,Lei Y,Liu J M,et al.Social collaborative filtering
by trust[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(8):1633-1647.
[6]L i L N,Wang L J,Jiang X Q,et al.A new algorithm for lit-
erature recommendation based on a bibliographic heteroge-neous information network[J].Chinese Journal of Electronics, 2018,27(4):99-105.
[7]X ie F F,Chen L,Ye Y J,et al.Factorization machine based
service recommendation on heterogeneous information net-works[C]//Proceeding of the13th IEEE International Con-ference on Web Services,San Francisco,Jul2-7,2018.Pis-cataway:IEEE,2018:115-122.
[8]Sun Y Z,Han J W,Yan X F,et al.Pathsim:meta path-based
top-k similarity search in heterogeneous information net-works[J].Proceedings of the VLDB Endowment,2011,4(11): 992-1003.
[9]S hi C,Kong X N,Huang Y,et al.HeteSim:a general frame-
work for relevance measure in heterogeneous networks[J].
IEEE Transactions on Knowledge and Data Engineering, 2014,26(10):2479-2492.
[10]Lao N,Cohen W W.Fast query execution for retrieval models
based on path constrained random walks[C]//Proceedings of the16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Washington,Jul 25-28,2010.New York:ACM,2010:881-888.
[11]Wang Y,Deng J Z,Gao J,et al.A hybrid user similarity
model for collaborative filtering[J].Information Sciences, 2017,418:102-108.
[12]Zheng Y Y,Wang M S,Shi C,et al.Research on metapath-
based community discovery algorithms in heterogeneous information networks[J].Journal of Chinese Information Processing,2018,32(9):132-142.
[13]Zheng J,Liu J,Shi C,et al.Recommendation in heteroge-
neous information network via dual similarity regularization [J].International Journal of Data Science and Analytics, 2017,3(1):35-48.
[14]S hi C,Li Y T,Zhang J W,et al.A survey of heterogeneous
information network analysis[J].IEEE Transactions on Knowledge and Data Engineering,2015,29(1):17-37. [15]Zhang M X,Hu H,He Z Y,et al.Top-k similarity search in
heterogeneous information networks with x-star network
945
Journal of Frontiers of Computer Science and Technology 计算机科学与探索2020,14(6)
schema[J].Expert Systems with Applications,2015,42(2):699-712.
[16]C ao J X,Dong Y,Yang P W,et al.Recommendation of
interest points based on metapath in LBSN[J].Chinese Journal of Computers,2016,39(4):675-684.
[17]Huang L W,Li D Y,Ma Y T,et al.A link prediction model
for heterogeneous information networks based on metapath [J].Chinese Journal of Computers,2014,37(4):848-858.[18]Z heng Y Y,Tian Y,Shi C.An entity set extension method
based on frequent patterns under metapath[J].Journal of Software,2018,29(10):23-38.
[19]L iu H F,Hu Z,Mian A,et al.A new user similarity model to
improve the accuracy of collaborative filtering[J].Knowledge-Based Systems,2014,56(1):156-166.
[20]M ohsen J,Martin E.A matrix factorization technique with
trust propagation for recommendation in social networks [C]//Proceedings of the 2010ACM Conference on Recom-mender Systems,Barcelona,Sep 26-30,2010.New York:ACM,2010:135-142.
附中文参考文献:
[12]郑玉艳,王明省,石川,等.异质信息网络中基于元路径的
社团发现算法研究[J].中文信息学报,2018,32(9):132-142.[16]曹玖新,董羿,杨鹏伟,等.LBSN 中基于元路径的兴趣点
推荐[J].计算机学报,2016,39(4):675-684.
[17]黄立威,李德毅,马于涛,等.一种基于元路径的异质信息
网络链路预测模型[J].计算机学报,2014,37(4):848-858.[18]郑玉艳,田莹,石川.一种元路径下基于频繁模式的实体
集扩展方法[J].软件学报,2018,29(10):23-38.
ZHAO Chuan was born in 1994.He is an M.S.candidate at School of Computer and Information Technology,Shanxi University.His research interests include data mining and machine learning.
赵传(1994—),男,山西长治人,山西大学计算机与信息技术学院硕士研究生,主要研究领域为数据挖掘,机器学习。
ZHANG Kaihan was born in 1994.She is a Ph.D.candidate at School of Computer and Information Technology,Shanxi University.Her research interests include data mining and machine learning.
张凯涵(1994—),女,山西临汾人,山西大学计算机与信息技术学院博士研究生,主要研究领域为数据挖掘,机器学习。
LIANG Jiye was born in 1962.He is a professor and Ph.D.supervisor at School of Computer and Information Technology,Shanxi University,and CCF Fellow.His research interests include granular computing,data mining and machine learning.
梁吉业(1962—),男,山西晋城人,山西大学计算机与信息技术学院教授、博士生导师,CCF 会士,主要研究领域为粒计算,数据挖掘,
机器学习。
946。