LBSN中基于聚类的二分图网络推荐算法
LBSN中基于聚类的二分图网络推荐算法
LBSN中基于聚类的二分图网络推荐算法随着位置服务的发展,LBSN(Location-based Social Networks)已逐渐成为重要的社交媒体形式,吸引了越来越多的用户。
在LBSN中,用户可以分享位置信息、评论、照片等,从而与其他用户交流和分享。
然而,由于用户的兴趣和活动习惯存在很大的差异,如何精准地为每个用户推荐个性化的地点成为了一个重要的问题。
因为传统的社交网络推荐算法往往没有充分考虑到地理位置和用户之间的关系。
为了解决这个问题,研究人员们提出了许多基于LBSN的推荐算法。
其中,基于聚类的二分图网络推荐算法是一种常见的方法,它可以用于预测用户对未知地点的兴趣度。
本文将对这种算法进行详细的介绍和分析。
一、算法思想该算法基于用户-位置二分图,将用户和位置看作顶点,将用户与位置间的交互看作边,构成二分图。
在二分图中,每个位置的质量被表示为其被访问的次数。
算法的目标是通过挖掘用户-位置交互信息,预测用户对未知位置的兴趣度,并且根据用户交互来聚类用户,根据位置交互来聚类位置。
具体的,为了预测用户u对位置p的兴趣度,算法采用基于交叉验证的局部加权线性回归(Local Weighted Linear Regression,LWLR)模型,将用户u的历史兴趣度与其他用户对位置p的兴趣度加权累加起来作为预测值。
此外,算法还通过谱聚类算法(Spectral Clustering)实现对用户和位置的聚类。
算法先基于用户-位置二分图将其表示为邻接矩阵,然后对邻接矩阵进行归一化处理,得到对称的Laplace矩阵,再利用谱聚类算法将其聚类。
二、算法流程1. 构造二分图根据用户与位置的交互数据,构造用户-位置二分图。
2. 分别聚类用户和位置基于谱聚类算法,将用户和位置分别聚类。
3. 预测用户对未知位置的兴趣度4. 评估推荐效果采用RMSE(均方根误差)和MAE(平均绝对误差)两种指标来评估推荐效果。
三、实验结果研究人员对该算法进行了实验,并将其与其他经典算法进行了对比。
基于聚类与二分图匹配的语义web服务发现
基于聚类与二分图匹配的语义web服务发现摘要:为高效准确地查找语义web服务,引入聚类与二分图匹配技术,提出一种新的语义web服务发现方法。
根据服务描述信息将相似服务聚集到一起,采用空间向量模型表示服务,针对标准K-Means算法的缺陷设计基于k值优化和粒子群优化的K-Means聚类算法对服务进行聚类。
借鉴了带权二分图最优匹配思想对服务的功能属性进行匹配,设计基于WordNet 的概念间语义相似度计算方法用于计算二分图的权值,并针对如何构建满足最优匹配条件的带权二分图问题给出解决方案。
实验结果表明,该方法在查全率和匹配效率上均优于OWLS-MX方法。
关键词:服务发现;k值优化;粒子群优化算法;K-Means算法;概念相似度;二分图匹配Semantic Web Service Discovery Based on Clustering and Bipartite Graph Matching[Abstract] Inorder to efficiently and accurately locate semantic Web service, a new semantic Web service discovery method is proposed based on clustering and bipartite graph matching. In this method, services are clustered according to the service description information, in which Vector Space Model (VSM) is adopted to indicate the service. The K-Means algorithm based on k value optimization and Particle Swarm Optimization (PSO) optimization is proposed to resolve thetwo major defects of standard K-Means algorithm. Then the attributes of serv ices’ functions are matched by optimal matching of weighted bipartite graph, and a method based on WordNet is proposed to calculate the similarity between concepts which is the weight of bipartite graphs. A new solution is proposed to build the weighted bipartite graph whichmeets the optimal matching criteria. Experimental results show that the proposed method is superior to OWLS-MXmethod on the recall and matching efficiency[Keywords] service discovery;k value optimization;Particle Swarm Optimization(PSO)algorithm;K-Means algorithm; concept similarity; bipartite graph matching1.概述随着Internet的快速发展,Web服务的数量和种类也得到了快速增长,如何准确、快速地搜索到满足用户需求的Web服务已经成为当前研究的重点。
LBSN中基于聚类的二分图网络推荐算法
LBSN中基于聚类的二分图网络推荐算法基于位置的社交网络(LBSN)是一种融合了地理位置信息和社交网络的新型网络形式。
用户可以通过移动设备上传自己的位置信息,并与周围的朋友,商家和其他用户交流。
在这样的网络中,推荐算法起着至关重要的作用,它能够帮助用户发现附近的好友和商家,提高用户体验。
在LBSN中,基于聚类的二分图网络推荐算法是一种有效的推荐方法,能够为用户提供准确的推荐结果。
LBSN中的用户和地点可以被看作是一个二分图网络,通过用户和地点之间的交互行为来生成推荐结果。
用户可以通过签到、评论、点赞等方式与地点进行交互,从而产生用户-地点关系。
在这种交互行为下,用户与地点之间的关系可以被建模成一个二分图网络,其中用户和地点分别作为网络的节点,用户-地点的交互行为作为网络的边。
基于聚类的二分图网络推荐算法利用了用户和地点之间的交互行为,以及二分图网络的拓扑结构,通过对用户和地点进行聚类,然后在聚类之间进行交互推荐。
其主要步骤包括:用户聚类、地点聚类、用户-地点关系建模、二分图网络构建及推荐结果生成。
对用户进行聚类,将具有相似兴趣和行为模式的用户归为一类。
可以采用基于用户的地理位置信息、签到行为、评论行为等特征进行聚类。
然后,对地点进行聚类,将相似类型和特征的地点进行归类。
地点的特征可以包括地理位置、类别、受欢迎程度等。
基于构建的二分图网络,利用推荐算法为用户生成推荐结果。
可以采用基于二分图网络的推荐算法,比如基于随机游走、基于相似度的推荐算法等,根据用户所在的聚类和地点的聚类进行交互推荐。
通过分析用户所在的聚类和地点的聚类,推荐算法可以找到用户可能感兴趣的地点,从而为用户提供准确的推荐结果。
基于聚类的二分图网络推荐算法在LBSN中具有很好的适用性和效果。
通过充分利用用户和地点之间的交互行为和二分图网络的结构,能够为用户提供个性化和准确的推荐结果,提高了用户体验和满意度。
未来,可以结合更多的用户行为数据和地点特征数据,进一步优化推荐算法,提高推荐的精准度和覆盖度。
LBSN中基于聚类的二分图网络推荐算法
LBSN中基于聚类的二分图网络推荐算法随着移动互联网的发展,位置基于社交网络(LBSN)已经成为了一种新兴的社交网络形式。
LBSN结合了位置信息和社交网络,使其用户可以便捷地获取周围的信息和与附近的朋友进行交流。
人们可以通过LBSN获取附近的商家、餐馆、景点等信息,并能够与周围的朋友进行即时的互动。
在这样的背景下,LBSN的推荐系统也成为了研究的热点之一。
LBSN中的推荐系统使用了位置信息和社交网络信息来为用户推荐感兴趣的内容或信息,比如商家、餐馆、景点等。
基于聚类的二分图网络推荐算法是一种常见的推荐算法之一。
本文将重点介绍LBSN中基于聚类的二分图网络推荐算法的原理和应用。
1. 二分图网络在LBSN的推荐系统中,用户和内容(如商家、餐馆、景点等)可以被看作是一个二分图网络,其中用户和内容构成了两类节点。
用户节点与内容节点之间的边表示了用户对该内容的兴趣或者评价。
而二分图网络推荐算法的目标就是为了预测用户对于某个内容的兴趣程度。
2. 聚类算法为了提高推荐的准确性和效果,通常需要将用户和内容进行聚类。
聚类算法可以将用户和内容的属性进行相似度计算,然后将相似的用户或内容进行归类操作。
常见的聚类算法有K-means、DBSCAN等。
基于聚类的二分图网络推荐算法主要是通过预测用户对内容的兴趣程度来进行推荐。
算法的核心思想是将用户和内容节点投影到一个低维的特征空间中,然后通过计算用户节点和内容节点之间的相似度来进行推荐。
具体的推荐过程包括以下几个步骤:(1)用户和内容的特征提取:通过聚类算法将用户和内容进行分组,并提取它们的特征向量。
(2)用户和内容的相似度计算:通过计算用户节点和内容节点在特征空间中的相似度来预测用户对内容的兴趣程度。
(3)推荐结果生成:将预测出的用户对内容的兴趣程度进行排序,选取兴趣程度最高的内容进行推荐。
二、基于聚类的二分图网络推荐算法应用在LBSN中基于聚类的二分图网络推荐算法已经被广泛应用。
LBSN中融合类别信息的混合推荐模型
LBSN中融合类别信息的混合推荐模型张岐山;李可;林小榕【摘要】针对基于位置的社交网络(Location-Based Social Network,LBSN)中用户签到数据的高稀疏性问题及用户隐私问题,提出了一种混合推荐模型(SoGeoCat).首先,通过用户潜在兴趣点数据模型,学习用户的潜在兴趣点;其次,将用户的潜在兴趣点纳入融合类别信息的矩阵分解模型中并优化;最后,根据用户特征矩阵、兴趣点特征矩阵,提出推荐策略.基于Foursquare真实数据集,实验结果表明:(1)相比于其他几个推荐模型,该算法将用户的潜在兴趣点填充至用户-兴趣点矩阵中,可以有效地缓解数据稀疏性的影响;(2)该算法可保护用户家庭信息;(3)在推荐模型中纳入类别信息的影响能提高推荐效果.【期刊名称】《计算机系统应用》【年(卷),期】2019(028)001【总页数】7页(P200-206)【关键词】位置社交网络;地理位置信息;类别信息;矩阵分解;兴趣点推荐【作者】张岐山;李可;林小榕【作者单位】福州大学经济与管理学院,福州350108;福州大学经济与管理学院,福州350108;北京交通大学下一代互联网互联设备国家工程实验室,北京100044【正文语种】中文近年来,基于位置的社交网络服务(Location-Based Social Network, LBSN)得到迅速发展,如 Loopt、Yelp、Foursquare、Whrrl等[1]. 在这些 LBSNs中,用户访问线下的兴趣点 (Point-Of-Interest, POI),如: 餐馆、电影院、博物馆等,在线上进行“签到”活动,并分享他们访问兴趣点时丰富的建议与经历[2]. 兴趣点推荐可以减少用户的搜寻时间,为商家提供精准营销策略. 所以如何利用这些信息,为目标用户推荐正确的兴趣点集是一个很有前途、很有趣的研究问题. 目前,有很多学者运用协同过滤、矩阵分解、LDA模型等技术于兴趣点推荐之中,但是普遍存在以下几个问题:(1) 数据稀疏问题. 在LBSNs中兴趣点推荐研究遭遇到了严重的数据稀疏问题. 通常情况下,一个用户访问的兴趣点的数量仅仅是兴趣点总数当中很小的一部分. 例如, Netflix电影推荐的数据密度是1.2%,而兴趣点推荐研究实验中使用的数据密度通常在0.1%左右[3]. Ye等人[4]提出了融合地理位置、用户偏好和社会影响的统一协同过滤模型, Lian等人[5]提出了加权矩阵分解模型,均容易受到数据稀疏性的影响. 协同过滤算法利用用户之间的相似性进行有效地推荐,很容易受到数据稀疏性的影响. 而且该算法只考虑到了签到数据的显式反馈,不能有效地融合异构数据源[6]. 矩阵分解算法可缓解数据稀疏性的影响,但是其忽略了用户之间的相似性.(2) 隐私问题. 很多保护隐私意识比较强的用户,他们在LBSNs中不会透露家庭住址、公司地址等有效信息. Li等人[7]考虑了用户“家”的地理位置,认为单考虑地理位置影响则家与兴趣点之间的距离同其访问该兴趣点的概率呈幂律分布. 但在这些信息不完全甚至是没有这些信息的情况下,如何进行有效的兴趣点推荐是我们要研究的问题之一.(3) 类别信息. 每个兴趣点都会有其类别信息,如:饭店、电影院、博物馆等. 从历史签到记录来看,每个用户都会偏向于访问类别相同或者相似的兴趣点[7]. 因此,如何利用兴趣点的类别信息提高兴趣点推荐的准确率是我们研究内容的重点.本文针对上述的问题,提出了SoGeoCat(Social-Geography-Category,SoGeoCat)模型,主要贡献如下:(1) SoGeoCat模型结合了协同过滤算法和矩阵分解算法的优点,首先根据用户行为相似性发现目标用户的潜在兴趣点,然后将潜在兴趣点纳入矩阵分解模型当中,克服了单纯协同过滤和矩阵分解算法的不足,即考虑了用户相似度又很大程度上缓解了数据稀疏性的问题.(2) 本文利用贝叶斯规则,根据目标用户的历史签到轨迹来判断拟推荐兴趣点在地理位置因素上对目标用户的影响.(3) 本文将兴趣点的类别标签纳入矩阵分解模型中,提高SoGeoCat模型的推荐效率.1 相关工作协同过滤和矩阵分解是兴趣点推荐研究中主流的两种算法.(1) 基于协同过滤算法的推荐. 协同过滤的主要思想是: 分析用户之间的关系和项目之间的相互依赖关系,以识别新的用户—项目关联[8-10].Ye等人[4]提出了融合地理位置、用户偏好和社会影响的统一协同过滤方法. 采用幂律概率模型捕捉兴趣点之间的地理位置影响,通过朴素贝叶斯方法实现基于地理影响的兴趣点协同推荐. Yuan等人[11]在统一的协同过滤框架上纳入了时间信息的影响,利用时间感知进行兴趣点推荐. 但该算法很容易受到数据稀疏性的影响,也不能很好地实现对隐式反馈数据集的挖掘.(2) 基于矩阵分解算法的推荐. 矩阵分解法的核心是训练出用户和兴趣点的特征向量,并以此来预测用户对于某一特定兴趣点的偏好. 其不仅可以缓解数据稀疏性的影响还可以融合异构数据源,考虑隐式反馈数据集[5,12-14].Lian等人[5]将地理位置影响纳入加权矩阵分解框架当中,根据签到记录的空间聚集现象,提出了GeoMF模型,模拟用户活动区域与地理位置之间的影响关系.高榕等人[14]在经典的矩阵分解模型的基础上,融合异构数据,提出了GeoSoRev 模型,采用基于矩阵分解的主题模型来发现评论中的隐藏“主题”. 矩阵分解算法虽然缓解了数据的稀疏性,也融合不同的异构数据,但它没有考虑到用户之间的相似性.(3) 混合算法推荐. 为了克服两种算法的不足之处,有一些学者提出了混合算法. Li 等人[7]提出了“两步走”的框架. 第一步设计基于线性聚集和基于随机游走两种方法,为每个用户学习一组他们可能感兴趣的潜在兴趣点. 在第二步骤中,用基于平方误差的损失函数和基于排名误差的损失函数来模拟这三种签到.文献[5]中认为用户的签到概率和从家到相应位置的距离遵循幂律分布. 一方面,家的位置信息较难获得,很多用户隐私保护意识越来越强,不愿意透露家庭位置信息;另一方面,用户签到过的兴趣点可能会聚集在某两个距离比较远的区域,如家和公司附近. 因此,本文针对上述问题,在文献[5]的基础上继续研究,提出了 SoGeoCat (Social-Geography-Category)模型,用朴素贝叶斯方法计算地理位置因素对于用户决策的影响,保护用户家庭位置信息,并将签到信息、朋友信息、地理位置信息和类别信息纳入混合模型中,即考虑了用户相似性又缓解了数据稀疏问题,提高了模型的推荐效果.2 用户潜在兴趣点数据模型2.1 问题描述本文主要研究的问题与传统的基于协同过滤的推荐模型或基于矩阵分解的推荐模型不同,而是采用了“两步走”的框架模型SoGeoCat: 首先,建立用户潜在兴趣点数据模型,利用用户的签到信息、朋友信息、地理位置信息对用户的签到信息进行有效地扩充;然后,建立一个融合类别标签的矩阵分解模型,训练出用户特征矩阵和兴趣点特征矩阵;最后考虑用户特征、兴趣点特征的影响,估算出目标用户对于某一特定的兴趣点的访问概率,进而推荐有效的兴趣点集.假设ui为目标用户, lj为拟推荐兴趣点. U为用户集,即 U={u1,u2,… ,un},L 为兴趣点集,即L={l1,l2,…,lm}. 运用 SoGeoCat模型计算出 ui访问每一个未访问过的POI的概率,选取Top S作为ui的拟推荐兴趣点集.2.2 基于签到行为相似度建模用户在LBSNs中有大量的签到信息,签到信息包括用户ID,兴趣点ID和访问次数. 访问次数越多,则说明用户对该兴趣点的偏好越强. 用户i与用户u已签到过的共同的兴趣点越多,则他们的签到行为越相似,即签到行为相似度Sim(ui,uu)越高,本文采用余弦相似度来度量两用户之间的签到行为相似度,建模如下:其中, r i ,z 表示ui在兴趣点lz的签到次数, r u ,z表示uu在兴趣点lz的签到次数表示ui访问过的兴趣点的集合表示uu访问过的兴趣点的集合.注意: 这里的uu曾经在兴趣点lj处有签到行为.2.3 基于朋友相似度建模用户在LBSNs上有一些相互关注的好友,这些好友关系也反映了该用户在现实生活中的朋友圈. 现实中,你朋友的推荐会激发你对某些兴趣点的兴趣,在LBSNs中亦是如此. 所以, uf(ui的朋友)的签到记录很有可能是ui想要访问的潜在兴趣点. 但是ui有很多好友,不一定每一个好友签到过的兴趣点, ui都会感兴趣.对此,提出了朋友相似度 Sim(ui, uf),朋友相似度越高,其历史签到记录越有参考价值,建模如下:其中, r i ,z 表示ui在兴趣点lz的签到次数, r f,z表示uf在兴趣点lz的签到次数,表示ui访问过的兴趣点的集合,表示uf访问过的兴趣点的集合.注意: 这里的uf曾经在兴趣点lj处有签到行为.2.4 基于地理位置相似度建模人们往往喜欢访问地理位置离自己近的兴趣点,单考虑地理位置影响因素,用户访问兴趣点的概率同其距离遵循幂率分布,模型[5]如下:其中, d表示用户同兴趣点之间的距离, a和b均为幂律分布的参数.但是,在本文中只有用户历史签到记录信息,没有用户的实时地理位置信息,所以,不能算出用户与某一兴趣点之间的准确距离. 为了解决此问题,且又能保护用户的家庭住址或公司地址等常驻地址信息,本文采用了基于朴素贝叶斯规则的模型,计算地理位置相似度已知 ui 的全部历史签到记录 Lu,我们计算作为每个候选兴趣点 lj的排名分数,然后向用户推荐排名前S个的兴趣点,建模如下:注意: 这里假定中的兴趣点的签到概率彼此独立.2.5 相似度的线性聚集综合考虑上述三个因素的影响,对签到行为相似度、朋友相似度和地理位置相似度进行线性聚合. 但是,它们是通过不同的方法来衡量的,具有不同的价值范围. 因此,我们采用最小-最大归一化进行处理,然后再进行聚集.同时,签到次数也能侧面地反映用户的偏好. 根据公式(8)计算出ui对于拟推荐兴趣点lj的分数,选取分数高的前S个兴趣点作为ui的潜在兴趣点.其中, U表示与ui访问过相同兴趣点的用户及ui的朋友的集合且表示用户 ui对拟推荐兴趣点lj的聚集相似度. 是调整参数.3 SoGeoCat模型3.1 SoGeoCat模型用户ui对于兴趣点lj的偏好程度受用户潜在特征和兴趣点潜在特征影响. 令用户特征矩阵为U,兴趣点特征矩阵为 V,偏好矩阵为 P,则:用值来估计值. 为了缓解数据稀疏问题,我们从用户潜在兴趣点数据模型中挖掘到了用户的潜在兴趣点,并用于扩充偏好矩阵. 但是用户对于潜在兴趣点和已签到过的兴趣点的偏好是有不同的,对于这一现象,本文将二元偏好变量Pij扩充为三元值,公式为:其中,表示目标用户ui访问过的兴趣点集,表示目标用户ui的潜在兴趣点集.在LBSNs的兴趣点推荐中,其类别信息发挥着重要的作用. 从历史签到记录来看,每个用户都会偏向于访问类别相同或相似的兴趣点,如: ui之前经常访问饭店,但几乎没去过电影院,此时如果给他推荐电影院,则其访问的可能性就会大大降低. 设表示ui对于lj对应的类别c的偏好程度, Q表示类别特征矩阵. 将类别信息纳入矩阵分解模型中,模型为:其中为调整参数.损失函数为:其中,、、为正则化常数, W为权重矩阵, wij表示ui访问lj的重要度量,考虑用户的签到次数的影响,本文采用平方根的方法计算W,如下:其中,为调整参数.3.2 SoGeoCat模型优化本文采用变更最小二乘(ALS)优化损失函数,训练出特征矩阵U,V和类别特征矩阵Q. U,V,Q的更新公式如下:其中, Ik为k维单位矩阵, Nc为类别为c的兴趣点的集合.4 实验4.1 实验数据集本实验的数据来自Foursquare真实数据集[13],采集的是2009年12月至2013年6月期间在加利福尼亚的签到数据,包括用户ID、朋友信息、兴趣点ID、兴趣点经纬度及其类别信息. 数据集中一共含有2551名用户, 13 474个兴趣点及124 933条签到记录. 用户-兴趣点矩阵密度为0.002 91. 由于LBSNs中存在严重的数据稀疏性,所以LBSNs背景下的推荐模型准确率和召回率普遍较低. 数据集的相关内容详见表1.为了验证SoGeoCat模型的准确性,对Foursquare数据集做了如下的处理.表1 实验数据集数据集 Foursquare用户数 2551兴趣点数 13 474类别数 10签到记录 124 933测试集 100 033训练集 24 900矩阵密度 0.002 911) 剔除访问少于10个兴趣点的用户.2) 剔除少于10个用户访问的兴趣点.3) 采用数据集中的80%的数据作为训练集,剩余的20%作为测试集.4.2 评价指标本文采用准确率(Precision)和召回率(Recall)来评估推荐算法的性能,计算公式如下:其中表示当向目标用户推荐前k个兴趣点时的准确率表示当向目标用户推荐前k个兴趣点时的召回率, N为用户数表示在测试集中ui访问过的兴趣点表示在推荐的k个兴趣点中击中的兴趣点.实验中,我们将 k 设置为: 5, 8, 10, 12, 15, 20.4.3 推荐模型对比为了评估SoGeoCat模型的性能,本文选取三个经典模型同本模型进行对比: IRenMF[15]采用了融合地理位置信息的矩阵分解模型,根据地理特征将领域分为实例级别领域和区域级别领域这两个层次,利用领域的特征进行个性化推荐;USG[4]采用了统一的协同过滤框架,综合考虑了用户偏好、朋友信息和地理位置信息对兴趣点推荐的影响;ASMF-LA[13]采用了“两步走”框架,融合用户偏好、朋友信息、地理位置信息和类别信息对兴趣点推荐的影响.参考文献[13],实验的相关参数设置如下:特征矩阵维度l设置为12;用于调整用户偏好与地理位置影响之间的权重,设置为0.4;为潜在兴趣点的偏好常量,设置为 0.1;调整参数为 0.1;正则化常数、分别用于调整用户特征矩阵和兴趣点特征矩阵的权重,均设置为0.01;用于调整类别特征矩阵的权重,设置为 1;为 10.4.4 实验结果分析为了评估SoGeoCat模型的性能,本节从推荐模型(USG、IRenMF、ASMF-LA、SoGeoCat)之间比较、SoGeoCat模型中各要素影响和用户潜在兴趣点数据模型影响这三个方面进行分析,具体内容如下.4.4.1 推荐模型的比较与分析在 k=5, 8, 10, 12, 15, 20 的条件下准确率和召回率分别用P@k、R@k表示,各模型的准确率和召回率见表2.表2 各模型在Foursquare数据集中的性能Precision P@5 P@8 P@10P@12P@*******************.04870.04520.04180.03690.0322 USG 0.0518 0.0424 0.0396 0.0361 0.0342 0.0297 ASMF-LA 0.0621 0.0508 0.0458 0.0427 0.0401 0.0342 SoGeoCat 0.0657 0.0529 0.0484 0.0442 0.0409 0.0363RecallR@5R@8R@10R@12R@******************0.0448 0.0500 0.0545 0.0612 0.0711 USG 0.0308 0.0403 0.0475 0.05340.0601 0.0693 ASMF-LA 0.0389 0.0495 0.0533 0.0582 0.0683 0.0761 SoGeoCat 0.0391 0.0502 0.0548 0.0601 0.0698 0.0775图1 基于Foursquare数据集各模型的准确率对比图2 基于Foursquare数据集各模型的召回率对比从表2中可以看出:(1) IRenMF采用了加权矩阵分解模型,对于实例级别领域和区域级别领域分别采用兴趣点相似性和用户相似性进行个性化推荐,但由于没考虑朋友信息和类别信息,因此相对于ASMF-LA和SoGeoCat而言表现出了更差的推荐效果,如表三所示, IRenMF表现出了第3好的推荐效果;(2) USG是采用了融合用户偏好、朋友信息和地理位置信息的统一协同过滤模型,但由于其没有考虑类别信息,且各要素的影响只是进行简单的线性加权组合,忽略了要素之间的相互作用,再者,协同过滤算法很容易受到数据稀疏性的影响.所以, USG模型表现出最差的推荐效果;(3) ASMF-LA采用了“两步走”框架,考虑了直接朋友、邻居朋友、位置朋友和类别信息对兴趣点推荐的影响,表现出了不错的推荐效果. 但是在获取邻居朋友和计算地理位置因素对兴趣点推荐的影响时,都需要用到用户“家”的信息. 实际上,越来越多的用户不愿意公开自己“家”的位置等隐私信息,而且,并非用户只愿意访问离家近的兴趣点,如: 白领小A,他家和公司相离10公里,他经常访问的兴趣点就容易集中在以家和公司为圆心的两个领域当中. 所以, ASMF-LA表现出了第2好的推荐效果;(4) SoGeoCat同样采用了“两步走”框架,既考虑到了用户之间的相似性,又缓解了数据稀疏性,融合了签到信息、朋友信息、地理位置信息和类别信息对兴趣点推荐的影响. 而且,本模型中,改进了地理位置对兴趣点推荐的影响,根据用户的历史签到足迹来估计地理位置因素对目标用户的影响,保护了用户的隐私信息,表现出了最好的推荐效果.4.4.2 要素影响分析从图3、图4中我们可以看出: (1)三个要素对于兴趣点推荐都发挥着重要作用,且融合三个要素时推荐效果最好; (2)朋友信息、地理位置信息对兴趣点推荐的影响大于类别信息对于推荐的影响. 分析其原因,主要在于用户在选择兴趣点时受到了多个方面的影响,如朋友的介绍、距离的远近和自己的爱好等等,所以我们不能片面地根据某一影响因素进行建模. 在SoGeoCat模型的第二步中运用了矩阵分解算法,在矩阵分解算法中训练出的用户特征向量和矩阵特征向量中也有考虑到社会关系、地理位置等因素的影响,但是在特征矩阵中没有具体地说明.图3 基于Foursquare数据集各要素间的准确率对比图4 基于Foursquare数据集各要素间的召回率对比4.4.3 用户潜在兴趣点数据模型影响分析在这个部分中,我们比较纳入用户潜在兴趣点数据模型的推荐模型和未纳入用户潜在兴趣点数据模型的推荐模型的推荐效果,图5、图6结果表明,纳入用户潜在兴趣点数据模型的推荐效果优于未纳入用户潜在兴趣点数据模型的推荐效果. 分析其原因,主要有两点: (1)虽然矩阵分解算法中已经将朋友信息、类别信息和地理位置信息考虑在特征矩阵之中,但是不能确切地说明. 我们通过用户潜在兴趣点数据模型,单独考虑了朋友信息和地理位置信息的影响,利于发挥其对推荐效果的影响; (2)用户潜在兴趣点数据模型不仅考虑了这三个要素,它还为偏好矩阵填充了大量的潜在兴趣点的签到信息,缓解了数据稀疏性.还有一个有趣的发现,表2中只考虑类别信息的模型的推荐效果低于未纳入用户潜在兴趣点数据模型的的推荐模型的推荐效果. 因为前者在计算用户潜在兴趣点数据模型时,没有考虑朋友信息和地理位置信息,使得计算出来的潜在兴趣点与实际用户偏好有较大的出入,于是将其带入矩阵分解算法中的时候产生了噪声,影响推荐效果.5 结论与展望SoGeoCat模型采用了混合算法,融合了两种算法的优点,既考虑了用户之间的相似性又缓解了数据稀疏问题. SoGeoCat模型还融合了类别标签,保护了用户的常驻位置信息. 通过对真实的Foursquare数据集进行实验,实验结果表明,SoGeoCat模型相对于其他三个对比模型而言在Precision和Recall上都表现出较好的推荐效果.图5 基于Foursquare数据集是否纳入潜在兴趣点模型的准确率对比图6 基于Foursquare数据集是否纳入潜在兴趣点模型的召回率对比未来,希望在此模型的基础上,纳入“时间信息”和“评论信息”等上下文信息,进一步地提高推荐算法的精确度和召回率.参考文献【相关文献】1 曹玖新,董羿,杨鹏伟,等. LBSN 中基于元路径的兴趣点推荐. 计算机学报, 2016, 39(4): 675-684.2 余永红. 融合多源信息的推荐算法研究[博士学位论文]. 南京: 南京大学, 2017.3 Bell RM, Koren Y. Lessons from the Netflix prize challenge.ACM SIGKDD Explorations,2007, 9(2): 75-79. [doi:10.1145/1345448]4 Ye M, Yin PF, Lee WC, et al. Exploiting geographical influence for collaborativepoint-of-interest recommendation.Proceedings of the 34th International ACM SIGIR Conference on Research and development in Information Retrieval. Beijing, China. 2011. 325-334.5 Lian DF, Zhao C, Xie X, et al. GeoMF: Joint geographical modeling and matrix factorization for point-of-interest recommendation. Proceedings of the 20th ACM SIGKDDInternational Conference on Knowledge Discovery and Data Mining. New York, NY,USA. 2014. 831-840.6 Liu YD, Pham TAN, Cong G, et al. An experimental evaluation of point-of-interest recommendation in locationbased social networks. Proceedings of the VLDB Endowment,2017, 10(10): 1010-1021. [doi: 10.14778/3115404]7 Li HY, Ge Y, Hong RC, et al. Point-of-interest recommendations: Learning potential check-ins from friends.Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, CA, USA. 2016. 975-984.8 杨志文,刘波. 基于Hadoop平台协同过滤推荐算法. 计算机系统应用, 2013, 22(7):108-112. [doi: 10.3969/j.issn.1003-3254.2013.07.024]9 冯晓敏. 基于项目综合相似度和因子分析的协同过滤算法研究[硕士学位论文]. 青岛: 中国石油大学(华东), 2013.10 范波,程久军. 用户间多相似度协同过滤推荐算法. 计算机科学, 2012, 39(1): 23-26. [doi:10.3969/j.issn.1002-137X.2012.01.005]11 Yuan Q, Cong G, Ma ZY, et al. Time-aware point-of-interest recommendation. Proceedings of the 36th International ACM SIGIR Conference on Research and Development in Information Retrieval. Dublin, Ireland. 2013. 363-372.12 Zheng N, Jin XM, Li LH. Cross-region collaborative filtering for new point-of-interest recommendation. Proceedings of the 22nd International Conference on World Wide Web. Rio de Janeiro, Brazil. 2013. 45-46.13 Li XT, Cong G, Li XL, et al. Rank-GeoFM: A ranking based geographical factorization method for point of interest recommendation. Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval. Santiago, Chile. 2015. 433-442.14 高榕,李晶,杜博,等. 一种融合情景和评论信息的位置社交网络兴趣点推荐模型. 计算机研究与发展, 2016, 53(4):752-763.15 Liu Y, Wei W, Sun AX, et al. Exploiting geographical neighborhood characteristics for location recommendation.Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management.Shanghai, China. 2014. 739-748.。
使用二分图网络提高协同推荐的准确性
使用二分图网络提高协同推荐的准确性冷亚军;陆青;张俊岭【期刊名称】《计算机科学》【年(卷),期】2015(042)003【摘要】协同过滤是推荐系统中广泛使用的最成功的推荐技术,但却面临着严峻的稀疏性问题.评分数据稀疏性使得最近邻搜寻不够准确,导致推荐质量较差.使用二分图网络缓解协同过滤推荐系统中的稀疏性问题,即将用户和项目抽象为二分图网络中的节点,重新分配项目资源并计算项目间资源贴近度,据此填充用户未评分项目,将稀疏评分矩阵转化为完全矩阵.采用近邻传播聚类对评分矩阵进行聚类,提高算法的可扩展性.最后提出了两种不同的在线推荐策略:(1)通过加权目标用户所在类的邻居用户评分产生推荐(BNAPC1);(2)通过各个类的总体偏好产生推荐(BNAPC2).在MovieLens和Netflix数据集上进行了实验,结果表明BNAPC1的预测精度优于BNAPC2,且与其他几种常用的推荐算法相比仍具有一定优势.【总页数】5页(P256-260)【作者】冷亚军;陆青;张俊岭【作者单位】上海电力学院经济与管理学院上海201300;上海电力学院经济与管理学院上海201300;浙江师范大学经济与管理学院金华321004【正文语种】中文【中图分类】TP311【相关文献】1.基于用户聚类的二分图网络协同推荐算法 [J], 郑怀宇2.使用负压可控式吸痰管可提高痰检准确性 [J], 李丽琼3.Caprini和Rogers风险评估模型联合使用可以提高胸外科术后患者筛选静脉血栓栓塞症的准确性 [J], 田博;李彤;胡滨;侯生才;宋春凤;李辉;傅毅立;张文谦;胡晓星;陈其瑞;游宾;陈硕4.Caprini和Rogers风险评估模型联合使用可以提高胸外科术后患者筛选静脉血栓栓塞症的准确性 [J], 田博;宋春凤;李辉;傅毅立;张文谦;胡晓星;陈其瑞;游宾;陈硕;李彤;胡滨;侯生才;5.使用隐式数据中的聚类和关联规则挖掘提高协同\r 过滤建议的准确性 [J], 王斯锋;朱玉佳;祝永志因版权原因,仅展示原文概要,查看原文内容请购买。
基于聚类与二分图匹配的语义Web服务发现
基于聚类与二分图匹配的语义Web服务发现
刘一松;朱丹
【期刊名称】《计算机工程》
【年(卷),期】2016(042)002
【摘要】为高效准确地查找语义Web服务,引入聚类与二分图匹配技术,提出一种新的语义Web服务发现方法.根据服务描述信息将相似服务聚集到一起,采用空间向量模型表示服务,针对标准K-Means算法的缺陷设计基于k值优化和粒子群优化的K-Means聚类算法对服务进行聚类.借鉴带权二分图最优匹配思想对服务的功能属性进行匹配,设计基于WordNet的概念间语义相似度计算方法用于计算二分图的权值,并针对如何构建满足最优匹配条件的带权二分图问题给出解决方案.实验结果表明,该方法在查全率和匹配效率上均优于OWLS-MX方法.
【总页数】7页(P157-163)
【作者】刘一松;朱丹
【作者单位】江苏大学计算机科学与通信工程学院,江苏镇江212013;江苏大学计算机科学与通信工程学院,江苏镇江212013
【正文语种】中文
【中图分类】TP393
【相关文献】
1.基于核Batch SOM聚类优化的语义Web服务发现机制研究 [J], 陈蕾;杨庚;张迎周;陈燕俐
2.基于模糊聚类优化的语义Web服务发现 [J], 王永明;张英俊;谢斌红;潘理虎;陈立潮
3.基于文本聚类和概念相似度的语义Web服务发现 [J], 刘一松;杨玉成
4.基于二分图匹配的语义Web服务发现方法 [J], 邓水光;尹建伟;李莹;吴健;吴朝晖
5.基于聚类的QoS语义Web服务发现研究 [J], 武彩红;李蜀瑜
因版权原因,仅展示原文概要,查看原文内容请购买。
二次聚类图像分割算法
二次聚类图像分割算法李申燕【期刊名称】《山西电子技术》【年(卷),期】2014(000)003【摘要】图像分割技术在各个领域中应用广泛,简单描述了模糊C均值聚类算法,在此基础上利用图像( l,α,β)颜色空间分离,将亮度空间进行二次聚类,根据像素点到第二次聚类中心的隶属度所得整幅图像的聚类域。
能有效的将灰度图像或彩色图像中相似区域聚集分类,为图像预处理提供很大帮助。
通过实验验证了算法的有效性。
%Image segmentation technology is applied widely in various fields .This article simply describes the fuzzy c -means clustering algorithm.Based on this, the brightness space is two times clustered with the separation of (l,α,β) color space, and the whole image clustering is obtained according to the membership that the pixel points to the clustering center of the second cluster .The similar area in the gray-scale image or color image is effectively clustered and provides great help for image preprocessing .The effec-tiveness of the algorithm is verified by experiment .【总页数】2页(P50-51)【作者】李申燕【作者单位】广州飒特红外股份有限公司,广东广州510730【正文语种】中文【中图分类】TP391.41;TP301.6【相关文献】1.基于减法聚类和K均值聚类的彩色图像分割算法 [J], 汪彦;何建新2.多分辨率图像锥的FCM聚类图像分割算法 [J], 王原丽;李艳红3.基于小波图像融合算法和改进FCM聚类的MR脑部图像分割算法 [J], 耿艳萍;郭小英;王华夏;陈磊;李雪梅4.颅脑MRI图像模糊聚类分割算法中模糊聚类数的讨论 [J], 楚存坤;李月卿;王昌元;王世刚5.基于二次分水岭和近邻传播聚类的彩色图像分割算法研究与实现 [J], 施成湘因版权原因,仅展示原文概要,查看原文内容请购买。
基于二分图的自适应推荐算法
基于二分图的自适应推荐算法
刘友林
【期刊名称】《中国电子商务》
【年(卷),期】2012(000)001
【摘要】本文提出了一种基于赋权二分图的网络结构推荐算法,将归一化后的用户对物品的评分赋值给用户-物品的连边,构建一个用户-物品赋权二分图。
提出了一个物品的度调整因子,减少度大的流行物品对其他物品的分类影响。
同时,考虑到要减少大量使用流行物品的用户的推荐权重,提高使用非流行物品的用户的推荐权重,提出了用户度调整因子,提高大度用户的推荐能力,因为他们较多选择了非流行物品。
测试表明,通过引入用户和物品的自适应度调整因子,提高了推荐算法的精确性。
【总页数】2页(P73-73,76)
【作者】刘友林
【作者单位】东华大学信息科学与技术学院,上海201620
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于用户聚类的二分图网络协同推荐算法 [J], 郑怀宇
2.基于二分图网络的总体多样性增强推荐算法 [J], 张骏;丁艳辉;金连旭;赵文朋
3.基于二分图划分联合聚类的协同过滤推荐算法 [J], 黄乐乐; 马慧芳; 李宁; 余丽
4.LBSN中基于聚类的二分图网络推荐算法 [J], 贺开明; 王赜
5.基于二分图卷积表示的推荐算法 [J], 熊旭东;杜圣东;夏琬钧;李天瑞
因版权原因,仅展示原文概要,查看原文内容请购买。
基于蚁群聚类的二部图网络推荐算法
基于蚁群聚类的二部图网络推荐算法
葛志鹏;严广乐;张国亮
【期刊名称】《信息技术》
【年(卷),期】2016(40)3
【摘要】二部图网络推荐算法是近几年研究较多的推荐算法,但在进行资源分配时都是基于全部用户的资源,大量不相干的用户使得用户间的耦合度下降,影响推荐质量.针对该问题,文中利用蚁群聚类算法基于用户进行聚类,后根据项目一定半径内的项目集合进行二部图网络推荐,实验结果显示在一定条件下该算法相比原来算法有较好的推荐性能,表明该算法在一定的条件下能降低耦合度过低的影响.
【总页数】5页(P57-61)
【作者】葛志鹏;严广乐;张国亮
【作者单位】上海理工大学管理学院,上海200093;上海理工大学管理学院,上海200093;西安电子科技大学计算机学院,西安710071
【正文语种】中文
【中图分类】TP311
【相关文献】
1.基于云填充和蚁群聚类的协同过滤图书推荐算法 [J], 毛志勇;赵盼盼
2.改进的基于二部图网络结构的推荐算法 [J], 关雲菲
3.一种改进的基于二部图网络结构的推荐算法 [J], 王茜;段双艳
4.基于增强二部图网络结构的推荐算法 [J], 张岐山;文闯
5.基于差异路径权重的二部图网络推荐算法 [J], 高长元;段文彬;张树臣
因版权原因,仅展示原文概要,查看原文内容请购买。
基于用户聚类的二分图网络协同推荐算法
基于用户聚类的二分图网络协同推荐算法
郑怀宇
【期刊名称】《沈阳工业大学学报》
【年(卷),期】2018(040)003
【摘要】针对协同过滤推荐系统应用中存在的数据稀疏、可扩展性受限等问题,提出了一种基于用户聚类的二分图网络协同推荐算法.该算法在用户聚类阶段对二分图网络进行用户中心聚类,并获取用户聚类中心及其所在的群组,基于用户群组的评价信息为目标用户提供更广泛的推荐数据;在协同推荐阶段,围绕聚类中心及其所在群组为未评分项目完成预测评分,为用户推荐综合评分最高的Top-n项目.结果表明,该算法能够提升目标用户推荐的准确度,并能改善协同推荐的多样性.
【总页数】6页(P316-321)
【作者】郑怀宇
【作者单位】福建中医药大学现代教育技术中心,福州350122
【正文语种】中文
【中图分类】TP311
【相关文献】
1.一种改进的基于用户聚类的协同过滤推荐算法 [J], 刘璐;王志谦
2.基于项目属性的用户聚类协同过滤推荐算法 [J], 黄国言;李有超;高建培;常旭亮
3.基于用户聚类与Slope One填充的协同推荐算法 [J], 龚敏;邓珍荣;黄文明
4.基于用户聚类的图书协同推荐算法研究 [J], 杨彦荣; 张莹
5.基于FCM用户聚类的协同过滤推荐算法 [J], 赵学健;张雨豪;陈昊;刘旭;李朋起
因版权原因,仅展示原文概要,查看原文内容请购买。
基于聚类分析的二分网络社区挖掘
基于聚类分析的二分网络社区挖掘
张嫱嫱;黄廷磊;张银明
【期刊名称】《计算机应用》
【年(卷),期】2015(035)012
【摘要】针对二分网络中社区挖掘的准确性不高、对额外参数的依赖较大的问题,基于谱聚类算法的思想,从二分网络的拓扑结构展开,提出了一种改进的社区挖掘算法.该算法将二分网络映射到单一网络进行社区挖掘,采用资源分布矩阵替代传统的邻接矩阵,挖掘出同类节点间的隐含信息,有效地保证了原图的信息,改进了谱聚类算法的输入,提高了社区挖掘的准确性;将模块度函数概念应用到聚类分析中,用模块度衡量社区挖掘的质量,有效解决了自动确定聚类数目的问题.在实际网络和人造网络上进行实验,与蚁群优化算法、边集聚系数算法等算法进行对比,实验结果表明,所提算法不但能较准确地获得二分网络的社区数目,且在不需要任何额外参数的情况下,能获得很好的划分效果,可以应用于深入理解二分网络,进行推荐、影响力分析等.【总页数】4页(P3511-3514)
【作者】张嫱嫱;黄廷磊;张银明
【作者单位】桂林电子科技大学计算机科学与工程学院,广西桂林541004;中国科学院电子学研究所,北京100190;桂林电子科技大学计算机科学与工程学院,广西桂林541004
【正文语种】中文
【中图分类】TP393
【相关文献】
1.基于模块度增量的二分网络社区挖掘算法 [J], 戴彩艳;陈崚;胡孔法
2.基于广义后缀树的二分网络社区挖掘算法 [J], 邹凌君;陈崚;戴彩艳
3.基于蚁群优化的二分网络社区挖掘 [J], 徐永成;陈崚
4.基于矩阵分解的二分网络社区挖掘算法 [J], 陈伯伦;陈崚;邹盛荣;徐秀莲
5.基于谱聚类的二分网络社区发现算法 [J], 张晓琴;安晓丹;曹付元
因版权原因,仅展示原文概要,查看原文内容请购买。
超密集小区中基于二分图优先级的资源分配算法
超密集小区中基于二分图优先级的资源分配算法黄俊伟;杨志明【摘要】由于在超密集网络中小基站密集的部署,用户数据量空前增加,对数据速率的要求不断提高,所以在有限的资源下如何高效地将资源分配给用户尤为重要.提出了一种小区分簇算法,根据小区簇的通信业务、通信负载量等条件将各个小区分为不同的优先级,引入二分图,以小区簇的优先级为依据建立频谱资源与小区簇之间的匹配关系,并提出一种低复杂度的贪婪算法.仿真结果表明所提算法能够有效提高系统性能,并且有效完成频谱资源的分配.【期刊名称】《电讯技术》【年(卷),期】2019(059)008【总页数】8页(P930-937)【关键词】5G;超密集网络;频谱资源分配;二分图;贪婪算法【作者】黄俊伟;杨志明【作者单位】重庆邮电大学通信与信息工程学院通信核心芯片、协议及系统应用创新团队,重庆400065;重庆邮电大学通信与信息工程学院通信核心芯片、协议及系统应用创新团队,重庆400065【正文语种】中文【中图分类】TN929.51 引言在第五代通信系统(5G)中超密集网络作为关键技术之一[1-2],能够有效提高系统容量,以满足5G通信时代急剧增加的海量通信数据;其通过更加密集化地部署无线网络基础设施,实现单位面积数据传输速度指数级提升。
这种部署方式具有很多优势:可以为热点区域分流,弥补宏小区覆盖盲区,实现用户无缝连接;超密集网络缓解了宏基站的数据流量压力,可以最大程度提升系统容量。
然而在超密集组网中,密集的基站部署,小小区间将会产生严重干扰,虽然基站与终端的路径损耗有所降低[3],但是也会进一步增加小小区频谱资源分配的难度。
当前国内外学者对超密集网络中频谱资源分配等相关问题进行了研究和论证[4-13]。
文献[4]中提出了一种基于集合规划的数学方法,把集中式的子载波分配转化为分布式的最优子载波分配和功率分配。
该算法实现了分布式的资源分配,减少了宏基站的信令开销,考虑了小区之间的干扰分析,也充分考虑到用户的服务质量,加入了实验的约束条件,保障了用户体验。
一种基于二部分图的推荐算法
一种基于二部分图的推荐算法宋中山;王晓华【期刊名称】《中南民族大学学报(自然科学版)》【年(卷),期】2015(000)001【摘要】在对基于二部分图网络结构的推荐算法NBI和基于Pearson系数的协同过滤推荐算法CF,以及当前广泛应用的完全排序算法GRM进行详细分析的基础上,针对这些算法的局限性,提出了一种基于二部分图的推荐算法。
采用Movielens数据库对NBI、CF和GRM以及文中所提算法用2个不同的参数进行了比较。
实验结果表明:除了当向每个用户推荐50个电影这一种情况外,文中给出算法的推荐准确率均高于其他3种推荐方法。
%The foundation of this paper is the recommendation algorithm based on bipartite graph network structure, the collaborative filtering recommendation algorithm ( CF ) based on Pearson coefficients, and the fully sorting algorithm ( CRM) that is most widely used.After the detailed analysis of these algorithms, in consideration of their limitations, a new recommendation algorithm based on bipartite graph is proposed.Movielens database is drawn upon to compare NBI, CF, GRM and the proposed algorithm with two parameters.The results show that the accuracy of the recommendation produced by the proposed algorithm is higher than that of the other three algorithms except when recommending 50 movies to users.【总页数】5页(P103-107)【作者】宋中山;王晓华【作者单位】中南民族大学计算机科学学院,武汉430074;中南民族大学计算机科学学院,武汉430074【正文语种】中文【中图分类】TP399【相关文献】1.AttentionRank+:一种基于关注关系与多用户行为的图推荐算法 [J], 刘梦娟;王巍;李杨曦;罗绪成;秦志光2.一种改进的基于二部图网络结构的推荐算法 [J], 王茜;段双艳3.一种基于时间特性的二部图推荐算法 [J], 周俊临;傅彦;孔祥迎;丁建勇4.一种结合遗忘机制与加权二部图的推荐算法 [J], 刘晓光;谢晓尧5.基于差异化资源分配的二部图推荐算法 [J], 张功国;江洋;成振华;刘颖因版权原因,仅展示原文概要,查看原文内容请购买。
二分网络中基于谱聚类的协同推荐
二分网络中基于谱聚类的协同推荐张思明;游天童【期刊名称】《微型机与应用》【年(卷),期】2012(031)022【摘要】This paper proposes an approach based on spectral clustering for collaborative recommendation.Firstly,we conduct user-user similarity matnx from item-user bipartite network through one-mode projection. Then we apply spectral clustering method to cluster users into k clusters from the user-user similarity matrix for data smoothing and neighborhood seleetion.At last,we make recommendation for target user based on the rating behavior of nearest neighbors set.Experiment result on MovieLens shows that our proposed approach is better than traditional collaborative filtering algorithm.%提出一种基于谱聚类的协同推荐算法(SCBCF)。
首先从用户——项目二分网络的单顶点投影中得到用户之间的相似矩阵,然后对该矩阵应用谱聚类算法,将用户聚成k类,并将得到的聚类结果用于数据平滑和邻居结点的选择,最后基于最近邻居集评分行为,对目标用户产生推荐。
在Movie-Lens 上的实验结果证明本文方法比传统的协同过滤算法能更好地应用于二分网络的协同推荐。
基于偏好的二分图网络模型Top-N推荐
基于偏好的二分图网络模型Top-N推荐陈添辉;林世平;郭昆;廖寿福【期刊名称】《计算机系统应用》【年(卷),期】2015(000)004【摘要】In view of the bipartite graph method of network-based inference (NBI) only considered whether users evaluated the project or not, but not given their scores, the thesis proposed a preferential network-based inference (PNBI) recommended method. Based on inference network, the method takes into account that user’s rating values for the program reflects his degree of preference. In the “User-Item” resource allocation process, the method allocates resources to the item that gets a higher score, this method can overcome the NBI algorithm’s disadvantage of failing to use low score value. Considering the sparsity of data, the method uses inverted list to discrese the number of calculation to accelerate the algorithm. Experiments on MovieLens dataset show that, PNBI bipartite graph recommended algorithm outperforms NBI bipartite graph recommended algorithm in accuracy, coverage and recall.%针对推断网络(NBI)的二分图方法中只是考虑用户是否评价过项目,却没有利用用户评分高低这一局限性,提出基于偏好的推断网络(PNBI)推荐方法。
基于二分 K-means的协同过滤推荐算法
基于二分 K-means的协同过滤推荐算法
吴金李;张建明
【期刊名称】《软件导刊》
【年(卷),期】2017(016)001
【摘要】针对传统协同过滤推荐算法中存在的数据稀疏性问题,提出了一种基于二分 K-means 的协同过滤推荐算法。
该算法在K-means算法的基础上,为了降低初始质点选择对聚类结果的影响,在运行中逐个添加质点。
首先初始化评分数据并将其作为初始簇,然后选择合适的簇随机产生两个质点将簇分裂为两个簇,重复上述步骤,直到聚类完成。
最后为了降低不同用户评分标准差异,将用户评分的平均值和用户同簇内相互间的相似度相结合,计算预测评分矩阵,生成推荐结果。
实验结果表明,改进后的算法较好地解决了数据稀疏问题,提高了推荐质量。
【总页数】4页(P26-28,29)
【作者】吴金李;张建明
【作者单位】江苏大学计算机科学与通信工程学院,江苏镇江 212013;江苏大学计算机科学与通信工程学院,江苏镇江 212013
【正文语种】中文
【中图分类】TP312
【相关文献】
1.基于蜂群K-means聚类模型的协同过滤推荐算法 [J], 李艳娟;牛梦婷;李林辉
2.基于二分图划分联合聚类的协同过滤推荐算法 [J], 黄乐乐; 马慧芳; 李宁; 余丽
3.基于NKL和K-means聚类的协同过滤推荐算法 [J], 李顺勇; 张钰嘉; 张海玉
4.基于二分K-means的协同过滤推荐算法 [J], 吴金李;张建明
5.基于K-means的语义协同过滤推荐算法 [J], 印国成
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
LBSN中基于聚类的二分图网络推荐算法
摘要:兴趣点推荐是基于位置的社交网络(Location Based Social Network,LBSN)的重要服务,近年来关于兴趣点推荐的算法深受学者关注,然而由于多方面的原因,许多推荐算法仍存在一些不足。
该文提出的是在用户聚类的基础上利用二分图网络进行推荐的算法。
实验表明,该算法取得了比较良好的推荐效果。
关键词:基于位置的社交网络聚类二分图网络兴趣点推荐
近年来随着移动互联网技术的飞速发展,基于位置的社交网络(Location Based Social Network,LBSN)也得到迅猛发展[1],如Foursquare、Gowalla、微博等,与传统社交网络最大的区别就是有了地理位置信息,用户可以对自己访问过的兴趣点进行签到,并且可以随时分享给好友。
LBSN的服务宗旨就是要为用户推荐一些新兴趣点,帮助用户更好地发现生活乐趣,同时还能促进兴趣点相关的商业发展,具有重要的意义。
个性化的推荐技术在不同应用领域也受到广泛关注,然而用户面对生活中庞大的信息量做选择时还是有些迷茫,用户所想要的是可以根据其所处的状态信息给出一些个性化的兴趣点推荐,但是LBSN中的签到密度通常较为稀疏,给兴趣点推荐带来了困难。
因此兴趣点推荐的研究仍需要进一步探索。
1 相关工作
基于位置的社交网络推荐技术发展至今已经有了不少进展。
高榕等人[2]在矩阵分解的基础上利用兴趣点的评论信息、用户社会关系以及地理信息这3种因素推荐兴趣点。
LIU等人认为用户属性、兴趣点属性以及兴趣点间距离共同决定着用户评分,因此构建了贝叶斯图模型给用户推荐他们可能喜欢的兴趣点[3]。
以上的这些研究整体上来说都是在所有用户签到信息的基础上利用各种签到信息进行推荐。
有学者研究表明聚类方法可以降低推荐算法的计算复杂度[4],同时有研究表明用户签到的兴趣点类型与时间有一定的关联度[5],利用二分图网络模型的相关算法[6]可以很好地把签到信息中的用户、兴趣点、时间这3个重要信息很好地联合起来,对于研究在特定时间给用户推荐兴趣点有重要意义。
2 基于用户聚类的二分图兴趣点推荐
2.1 基本定义
在LBSN中,u是用户集合U中的一个用户,l是兴趣点集合L中的一个兴趣点,cui=1表示用户签到过(或者是访问过)兴趣点l,cui=0表示没有签到。
t 是时间集合T中的一个时间段,可以划分为几个连续时间的时间段,以时间段作为时间单位。
因为在实际生活中,很少有用户在一天的0:00到6:00这个时间段有簽到活动,所以该文只考虑从6点开始到晚上24:00的这段时间。
定义1 用户相似度:用户相似度是由常用的余弦相似度cos(u,v)和用户之间本身存在的好友关系trust(u,v)结合起来由α平衡两者的权重影响从而计算得到的:
Sim(u,v)=α*trust(u,v)+(1-α)*cos(u,v)(1)其中
(2)
trust(u,v)是用户之间的好友关系值
,u和v是好友关系(3)
,u和v不是好友关系
定义2 用户-兴趣点二分图网络:令G(U,L,E)表示一个二分图网络,其中U代表用户节点集,L为兴趣点节点集,E为用户-兴趣点二分图边集,每一条边表示用户签到过此兴趣点。
假设用户节点数|U|=m,兴趣点节点数|L|=n,则节点总数为r=m+n。
定义3 时间-兴趣点二分图网络:令G(T,L,E)表示一个二分图网络,其中T代表时间节点集,L为兴趣点节点集,E为时间-兴趣点二分图边集,每一条边表示在该时间段有用户签到过此兴趣点。
2.2 用户聚类
为了提高推荐结果国的有效性和准确性,首先需要用户聚类,从中找出聚类结果中的有用信息,为下一步的联合推荐奠定基础。
为了保证比较好的聚类结果,我们借鉴k-means算法的思想,提出了比较有效的聚类算法。
该聚类算法的具体步骤如下。
(1)基于定义1计算出来的用户相似度,按照从大到小选出和其他用户相。