基于随机游走算法的社会化标签的用户推荐_王海雷
基于随机游走的改进标签传播算法
2020⁃12⁃10计算机应用,Journal of Computer Applications2020,40(12):3423-3429ISSN 1001⁃9081CODEN JYIIDU http ://基于随机游走的改进标签传播算法郑文萍1,2*,岳香豆1,2,杨贵1,2(1.山西大学计算机与信息技术学院,太原030006;2.计算智能与中文信息处理教育部重点实验室(山西大学),太原030006)(∗通信作者电子邮箱wpzheng@ )摘要:社区发现是挖掘社交网络隐藏信息的一个有用的工具,而标签传播算法(LPA )是社区发现算法中的一种常见算法,不需要任何的先验知识,且运行速度快。
针对标签传播算法有很强的随机性而导致的社区发现算法结果不稳定的问题,提出了一种基于随机游走的改进标签传播算法(LPARW )。
首先,根据在网络上进行随机游走确定了节点重要性的排序,从而得到节点的更新顺序;然后,遍历节点的更新序列,对每个节点将其与排序在其之前的节点进行相似性计算,若该节点与排序在其之前的节点是邻居节点且它们之间的相似性大于阈值,则将排序在其之前的节点选为种子节点;最后,将种子节点的标签传播给其余的节点,得到社区的最终划分结果。
将所提算法与一些经典的标签传播算法在4个有标签的网络和5个无标签的真实网络上进行比较分析,实验结果表明所提算法在标准互信息(NMI )、调整兰德系数(ARI )和模块度等经典的评价指标上的性能均优于其余对比算法,可见该算法具有很好的社区划分效果。
关键词:复杂网络;社区发现;标签传播算法;随机游走;种子扩展策略中图分类号:TP391.1文献标志码:AImproved label propagation algorithm based on random walkZHENG Wenping 1,2*,YUE Xiangdou 1,2,YANG Gui 1,2(1.School of Computer and Information Technology ,Shanxi University ,Taiyuan Shanxi 030006,China ;2.Key Laboratory of Computational Intelligence and Chinese Information Processing ,Ministry of Education(Shanxi University ),Taiyuan Shanxi 030006,China )Abstract:Community detection is a useful tool for mining hidden information in social networks.And LabelPropagation Algorithm (LPA )is a common algorithm in the community detection algorithm ,which does not require any prior knowledge and runs fast.Aiming at the problem of the instability of community detection algorithm results caused by the strong randomness of label propagation algorithm ,an improved Label Propagation Algorithm based on Random Walk(LPARW )was proposed.Firstly ,according to the random walk on the network ,the importance order of nodes was determined ,so as to obtain the update order of nodes.Secondly ,the update sequence of nodes was traversed ,and thesimilarity calculation between each node and the node before it was performed.If the node and the node before it were neighbor nodes and the similarity between them was greater than the threshold ,then the node before it was selected as the seed node.Finally ,the label of the seed node was propagated to the rest of the nodes in order to obtain the final division result of the communities.The proposed algorithm was comparatively analyzed with some classic label propagation algorithms on 4labeled networks and 5unlabeled real networks.Experimental results show that the proposed algorithm is better than other comparison algorithms on classic evaluation indicators such as Normalized Mutual Information (NMI ),Adjusted RandIndex (ARI )and modularity.It can be seen that the proposed algorithm has the good community division effect.Key words:complex network;community detection;Label Propagation Algorithm (LPA);random walk;seedexpansion strategy引言在现实生活中,网络无处不在。
一种多标签分类的手机应用推荐系统及其方法[发明专利]
专利名称:一种多标签分类的手机应用推荐系统及其方法专利类型:发明专利
发明人:徐光侠,陶荆朝,代小龙,常光辉
申请号:CN201710756590.4
申请日:20170829
公开号:CN107609063A
公开日:
20180119
专利内容由知识产权出版社提供
摘要:本发明属于大数据和数据挖掘推荐系统技术领域,尤其是一种多标签分类的手机应用推荐系统及其方法。
本发明的系统包括:数据获取模块、数据处理模块、数据存储模块、业务逻辑模块、显示模块等五个模块。
提出了一种基于随机游走算法的多标签分类算法,将多标签数据映射成为多标签随机游走图。
当输入一个未分类数据时,建立一个多标签随机游走图系列。
而后对图系列中的每个节点随机游走,得到遍历每个顶点的概率分布,并将这个点概率分布转化成每个标签的概率分布。
本发明解决用户兴趣多样性推荐的问题以及用户兴趣不断变化带来的推荐运算复杂度增长的问题,得到较传统的推荐技术更加灵活的推荐技术,提高了推荐质量。
申请人:重庆邮电大学
地址:400065 重庆市南岸区南山街道崇文路2号
国籍:CN
代理机构:重庆市恒信知识产权代理有限公司
代理人:李金蓉
更多信息请下载全文后查看。
一种基于随机游走的歌曲推荐算法
一种基于随机游走的歌曲推荐算法吴雪君; 米红娟; 李欣【期刊名称】《《微型机与应用》》【年(卷),期】2019(038)010【总页数】5页(P35-39)【关键词】推荐算法; 协同过滤; 随机游走; 场论【作者】吴雪君; 米红娟; 李欣【作者单位】兰州财经大学信息工程学院甘肃兰州730020【正文语种】中文【中图分类】TP3910 引言互联网的快速发展使得用户在面对呈指数级增长的信息量时很难挖掘出有用的资源。
推荐算法的出现在一定程度上为用户缓解了这个难题。
推荐算法主要通过历史数据中用户对项目的行为操作,利用相应算法计算相似度,为用户推荐他可能感兴趣的项目。
现在已经有许多实际的应用,如Netflix的电影推荐,亚马逊网站的图书、CD推荐等。
常见的主流音乐推荐算法可以分为三种:基于内容的推荐算法、协同过滤推荐算法、混合推荐算法。
基于内容的推荐算法[1]易于实现,它只需要用户个人的历史数据,分析用户曾经喜欢过的歌曲的属性信息,计算所用歌曲间的相似度,为用户推荐相似的未收听过的歌曲。
但是推荐结果缺乏多样性,且特征提取的方法受到技术的限制。
协同过滤推荐算法[2-3]是根据历史数据中用户对歌曲的评分(评分数据可以是用户对项目的各种操作),计算相似度,发现偏好相同的用户,根据相似用户的偏好预测目标用户对其他歌曲的喜好程度,不足之处是存在冷启动问题和数据稀疏性问题。
混合推荐算法将上述两种算法互补组合进行推荐,比如Stanford大学推出的Fab系统,将两种算法结合为用户提供个性化推荐[4]。
有学者也提出了新的推荐算法,例如基于图结构进行推荐。
传统的随机游走(Random Walk,RW)[5]是一种理想的数学模型,它从所处的节点出发,以相同的几率游走到其某一个邻居节点,可以将它假设成马尔科夫链。
随着研究的发展,随机游走模型也被应用在推荐系统中,实现对用户的个性化推荐。
YILDIRIM H等人[6]提出了一种基于随机游走模型的面向项目的协同过滤推荐算法,使用项目间的余弦相似度和修正的余弦相似度来初始化状态转移概率,该模型能在稀疏数据下增强相似性矩阵。
一种基于随机游走的软子空间聚类集成方法
一种基于随机游走的软子空间聚类集成方法
李嫚;王立宏
【期刊名称】《烟台大学学报:自然科学与工程版》
【年(卷),期】2022(35)3
【摘要】聚类集成旨在将多个基聚类进行组合,以获得性能更佳、鲁棒性更强的共识结果。
本文提出了一种基于随机游走的聚类集成方法CERW(Clustering Ensemble based on Random Walk)。
该方法以hedonic games(享乐博弈)生成的簇为图节点,簇之间的社会福利值为边权重构造簇级相似图。
为了探索相似图中节点之间的结构信息,定义一个转移概率矩阵,并在此基础上进行随机游走,通过分析不同节点的随机游走轨迹来发现博弈簇之间的潜在关系。
在多个数据集上的实验结果证明了所提方法的有效性。
【总页数】9页(P343-350)
【作者】李嫚;王立宏
【作者单位】烟台大学计算机与控制工程学院
【正文语种】中文
【中图分类】TP181
【相关文献】
1.一种基于抗原软子空间聚类的否定选择算法
2.一种基于数据流的软子空间聚类算法
3.一种基于海量高维数据的软子空间聚类改进算法
4.一种基于带核随机子空间的聚类集成算法
5.基于随机分块的稀疏子空间聚类方法
因版权原因,仅展示原文概要,查看原文内容请购买。
基于随机游走的就业推荐系统研究与实现
0 引言
近 年来 随 着高 我 国经 济带 来 的 不利 影 响 , 校 毕业 生 的就 高 业形 势 日趋严 峻 。各 高校 的就 业 网更 多是 提供 企业 招聘 信 息发 布 的功 能 。本文 基于 对大 连 理工 大学 毕业
于随机游 走模型的 P gR n a e a k算 法 获 得 的 各 个 企 业 的 “ 职 指 数 ” 将 招 聘 企 业 排 序 后 推 荐 给 每 一 名 毕 业 生 。 求 , 通 过 测 试 , 系 统 功 能 上 符 合 设 计 初 衷 , 够 向毕 业 生 推 荐 适 合 的 企 业 , 以 提 升 毕 业 生 求 职 的 针 对 性 和 目 的 本 能 可 性 , 大 大 减 少其 在 获 取 招 聘 信 息上 的 时 问 投 入 。 并
针 对 现有就 业 推荐 过程 中存在 的缺 陷 , 同时 结合 高 校毕业 生 求职 和 企业 校 园招聘 的特 点 , 们设计 了 我
“ 高校 毕业 生就 业推 荐 系统 ” 。主要 技术 特 点是 提 出 了一种 基 于 P g R n a e a k算 法计 算 企业 “ 职 指数 ” 求 的方 法 。主 要 思路是 如 果将 企业 视 为 网页 , 基于 企 业基 本特 征 的相似 关 系视 为 网页之 间的链 接 , 么可 以根 将 那 据 随机 游 走 的思想 利 用 P g rn a ea k算法 计算 网页热 度 的 方法 得 到 企业 的“ 度 ”80, 热 [1 在这 里 我 们将 “ -] 热度 ”
基于用户属性和生成对抗网络的推荐系统
基于用户属性和生成对抗网络的推荐系统
王永强;陈徐洪;张壮壮;董云泉
【期刊名称】《计算机工程与设计》
【年(卷),期】2024(45)1
【摘要】为提升推荐精度,解决传统推荐算法在用户评分向量中存在的未评分项语义模糊造成的推荐精度下降问题,提出一种基于用户属性的条件生成对抗网络的推荐方法。
将用户的属性特征进行提取和编码,并作为生成对抗网络的条件,通过这种明确信号指导用户偏好的生成并进行推荐。
在两个公开的电影评分数据集上进行实验,实验结果表明,所提方法可以有效改善推荐精度,在各评价指标上均优于现有方法,具有一定实用价值。
【总页数】7页(P275-281)
【作者】王永强;陈徐洪;张壮壮;董云泉
【作者单位】南京信息工程大学电子与信息工程学院;国家开发银行重庆市分行【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于对抗式生成网络的电力用户意图文本生成
2.基于用户偏好挖掘生成对抗网络的推荐系统
3.基于生成对抗网络的人脸属性图像生成
4.基于生成对抗网络的多属性人脸图像生成
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于社会化标注的查询扩展研究
一种基于社会化标注的查询扩展研究
董华磊;王健;林鸿飞;王浩
【期刊名称】《计算机研究与发展》
【年(卷),期】2015(52)11
【摘要】采用社会化标签可以提高检索质量,但真实的标注系统往往比较稀疏,并且标签存在无序性、不规范性和低效性等特点,因此单纯使用传统的SimRank等相似度算法难以奏效.为此,在SimRank算法基础上融入Jaccard系数计算,提出一种改进的社会化标签的相似度计算方法,称作Jaccard SimRank(JSR)算法,更加直观地描述社会化标签之间的相似度,在用户标注网络资源时自动对标签集进行扩展,增加标注密度,并在检索时对标签集进行扩展,因而能够更充分利用社会化标注系统的信息实现有效检索.实验结果表明,与传统的相似度算法相比,JSR方法有效提高了查询扩展系统的性能.
【总页数】8页(P2488-2495)
【作者】董华磊;王健;林鸿飞;王浩
【作者单位】大连理工大学计算机科学与技术学院辽宁大连 116024;大连理工大学计算机科学与技术学院辽宁大连 116024;大连理工大学计算机科学与技术学院辽宁大连 116024;大连理工大学计算机科学与技术学院辽宁大连 116024
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种基于社会化标注的查询扩展方法 [J], 王健;李志斌;林鸿飞
2.一种基于社会化标注的网页检索方法 [J], 王健;李志斌;林鸿飞
3.一种基于视觉词典优化和查询扩展的图像检索方法 [J], 柯圣财;李弼程;陈刚;赵永威;魏晗
4.一种基于影视素材本体的关键词查询扩展方法研究 [J], 沈熠;赵琳
5.一种基于词向量的模糊查询扩展方法 [J], 陈淑巧;邱东;江海欢
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于随机游走算法的复杂网络生成
关 键 词
中 图分 类 号
复 杂 网络 网 络 生成 随机 游走 算 法
T P 3 9 9 文献标识码 A
度 分 布 聚 类 系 数
D O I : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 0 — 3 8 6 x . 2 0 1 5 . 0 2 . 0 3 0
第3 2卷 第 2期
2 0 1 5年 2月
计算机 应 用与软 件
Co mp u t e r App l i c a t i o n s a n d S o f t wa r e
Vo 1 .3 2 No . 2
Fe b.2 01 5
基于拉普拉斯机制的随机游走知识发现系统的优化研究
基于拉普拉斯机制的随机游走知识发现系统的优化研究作者:刘爱琴贾一帆来源:《新世纪图书馆》2021年第12期摘要文本聚類与知识获取所产生的知识发现系统需要更加快速、更加准确的算法支持,以满足用户知识需求准确性和关联性的不断增长。
论文基于随机游走知识发现系统,融合网络爬虫技术和学术资源网站结构化数据的特征,通过应用拉普拉斯机制,将所有图书馆文献通过关键词函数的设定和游走过程的通量化,确定图论下的拉普拉斯算子,对原有遍历所有文献节点并反复迭代完成聚类的运作模式添加游走终点判定,对其进行算法的优化,有效解决了随机游走知识发现系统的时间、空间复杂度过大的问题,增加了随机游走聚类的准确性。
关键词拉普拉斯机制随机游走模型知识发现系统分类号 G250.74DOI 10.16810/ki.1672-514X.2021.12.007Abstract With the increasing demand of user’s knowledge, the requirement of accuracy and relevance is higher and higher, the knowledge discovery system for text clustering and knowledge acquisition needs more fast and accurate algorithm support. Based on the random walk knowledge discovery system, this paper optimizes its algorithm: by using Laplace mechanism, all library documents are quantified by keyword function setting and walk process, the Laplace operator under graph theory is determined, and the accuracy of random walk clustering is increased by adding run end point judgment to the original operation mode of traversing all document nodes and increase the accuracy of random walk clustering.Keywords Laplace mechanism. Random walk model. Knowledge discovery system.0 引言用户知识需求的不断增加,要求获取信息的准确性和关联性越来越高,知识发现系统需要用高效的知识提取手段来解决用户的特定问题和满足用户日益增长的个性需求。
基于随机游走的服务查询和标签推荐方法研究
Keywords: tag, API service, ranking, random walk, search, recommendation 1 引言
近年来, 标签对于网上资源的分类和索引起到 了很大的推动作用。标签与普通文本既有联系,又 有一定的区别 。标签一般是由简短的、富于描述 性的文本构成,具有可读性。但是由于其主要用途 是管理和共享资源,故通常极富概念性,并且经常 使用普通文的缩写、简写和连写等形式。因此,与 普通文本相比,标种人工标注的关于资源的 元信息。这些信息在总体上比资源生产者所提供的 信息更为可靠。 标签的推荐方法主要包括: 1) 基于 资源内容的方法;2) 基于协同过滤的方法;3) 基 于链接分析的方法。 基于资源内容的方法一般选择能够最好的描 述资源内容的标签进行推荐。 Chirita 等人提出的 P-TAG 算法[8]同时利用标签与目标资源和在用户主 机上的相关文档的相关性来推荐标签。 Krestel 等人
务,那么他们之间就存在一条连边。 例如, 如果节 点i和节点j之间有一条边相连, 那么Wij存储的就是 这两个tag之间的相似度。 我们使用 Jacard 相似度系数
[15]
4.2 在 TTN 上的随机游走 随机游走方法在机器学习和信息检索领域应 用十分广泛,我们采用在 tag 共现网上执行随机游 走的方法来计算标签的普遍性[16,17,18]。 ①游走到邻居节点的概率 ②游走到 tag 共现网中任一节点概率 1 ③邻接矩阵 P , 它的元素 p ij 代表从节点 i 到节
一种基于随机游走的迭代加权子图查询算法
一种基于随机游走的迭代加权子图查询算法张小驰;于华;宫秀军【摘要】Nowadays ,technological development in measuring molecular interactions has led to an increasing number of large‐scale biological molecular networks . Identifying conserved and stable functional modules from such networks helps not only to disclose the function of inner components , but also to understand their relationships systematically in complex systems .As one of classical NP‐complete problems , the sub‐graph query problem is gaining research efforts in analyzing such behaviors from the fields of social networks , biological networks , and so on . Calculating node similarities and reducing the sizes of target graphs are two common means for improving query precisions and reducing computational complexity in th e study of sub‐graph algorithms . For the problem of querying sub‐graphs among complex protein interaction networks ,this paper presents a sub‐graph query algorithm based on semi‐Markov random walk model .A comprehensive similarity measurement based on sem i‐Markov random walk model is designed to integrate the similarities of nodes ,structures and their neighbors .Meanwhile ,an iterative procedure is applied to reduce the size of targeted graph by removing nodes in a cluster with lower similarities by calculating the global correspondence score .The experimental results on multiple real protein query networks demonstrate that the proposed algorithm improves its performance in both query precisions and computational complexity .%作为经典的NP完全问题之一,子图查询算法近年来在社交网络、生物分子网络等复杂系统分析中引起研究人员的极大关注。
推荐系统中的随机游走问题研究与改进
推荐系统中的随机游走问题研究与改进推荐系统在现代信息时代中扮演着重要的角色,帮助人们从庞杂的信息中找到个性化的、符合自身需求的内容。
随机游走算法是推荐系统中常用的算法之一,通过模拟用户在用户-物品图上进行随机游走,从而获取物品之间的关联性。
本文将对推荐系统中随机游走问题进行研究与改进,并提出一种基于深度学习的改进方法。
一、问题定义在推荐系统中,我们需要根据用户历史行为数据来为其推荐合适的物品。
通常情况下,我们可以将用户历史行为数据表示成一个稀疏矩阵R,其中R(i,j)表示用户i对物品j的评分情况。
而随机游走算法则是通过模拟用户在一个由用户-物品图表示的网络上进行随机游走来获取物品之间关联性。
传统的随机游走算法通常基于马尔可夫链模型,并通过计算马尔可夫链上各个状态之间转移概率来衡量状态之间关联度。
然而,在实际应用中,传统方法往往面临着数据稀疏性、冷启动问题等挑战。
因此,我们需要对随机游走算法进行改进,以提高推荐系统的性能。
二、改进方法2.1 数据预处理在进行随机游走算法之前,我们需要对原始的用户历史行为数据进行预处理。
首先,我们可以通过数据清洗的方法去除异常值和噪声。
其次,对于稀疏矩阵R中的缺失值,可以使用填充方法来补全。
2.2 基于深度学习的随机游走算法为了克服传统随机游走算法中面临的挑战,我们提出了一种基于深度学习的改进方法。
具体来说,我们使用图卷积神经网络(GraphConvolutional Network, GCN)来学习用户-物品图中节点之间的关联性。
首先,我们将用户历史行为数据转化为一个二部图(bipartite graph),其中用户和物品分别作为两个节点集合。
然后,在这个二部图上构建一个邻接矩阵A,并将其作为GCN模型的输入。
GCN模型通过多层卷积操作来学习节点之间的关联性,并将学习到的节点表示作为输入传递给后续模型。
接下来,我们使用随机游走算法来模拟用户在用户-物品图上的行为。
【CN109885758A】一种基于二部图的新型随机游走的推荐方法【专利】
2
CN 109885758 A
此时,步骤3中的
权 利 要 求 书
2/2 页
3
CN 109885758 A
说 明 书
1/7 页
一种基于二部图的新型随机游走的推荐方法
技术领域 [0001] 本发明属协同过滤推荐系统技术领域,具体涉及一种基于二部图的新型随机游走 的推荐方法。
阵 ,D3为矩阵
的度矩阵 ,D4为矩阵
的度矩阵 ,Im为大小为m×m的单位矩
阵, 为大小为n×n的对角矩阵,其对角元素为α, 为大小为n×n的对角矩阵,其对角元
素为β; 将推荐矩阵Fm的每一行元素按照从大到小排序,并剔除用户已经评价过的产品,即为最
终的推荐结果。 2 .如权利要求1所述的一种基于二部图的新型随机游走推荐方法,其特征在于:步骤2
其中, 是矩阵 的度矩阵; 然后,按下式构造得到具有停止条件的转移矩阵
其中 ,Iα和Iβ是对角矩阵 ,Iα的对角线元素αi满足 :
Iβ0 ,1),α=1-β; 步骤3:按下式计算得到推荐矩阵Fm:
其中 ,
D1为矩阵R的 度矩阵 ,D2为矩阵RT的 度矩
其中 ,下标表示矩阵的大小 ,R为评分矩阵 ,其矩阵元素Rij表示 用户i对产品j的评分 ,i =1 ,… ,m,j=1 ,… ,n;
然后,按下式对相似度矩阵W进行拉普拉斯正则化,得到正则化的相似度矩阵
其中 ,D是相似度矩阵W的度矩阵 ; 步骤2:将正则化的相似度矩阵 按行归一化,得到转移矩阵P,即:
代理人 常威威
(51)Int .Cl . G06F 16/9535(2019 .01) G06Q 30/06(2012 .01)
(10)申请公布号 CN 109885758 A (43)申请公布日 2019.06.14
一种基于局部随机游走的标签传播算法
一种基于局部随机游走的标签传播算法刘扬;郑文萍;张川;王文剑【期刊名称】《计算机科学》【年(卷),期】2022(49)10【摘要】社区结构是复杂网络的重要特征之一,识别网络中不同功能的社区对理解复杂网络特性具有重要作用。
基于标签传播的社区发现算法通常以节点的直接邻居作为邻域更新标签,可能无法准确发现社区结构或导致得到的社区划分结果不稳定。
针对此问题,提出了一种基于局部随机游走的标签传播算法(Local Random Walk Based Label Propagation Algorithm, LRW-LPA),利用节点的k步邻域内局部重要性指标选择重要性最低的节点作为起始节点,进行带重启的局部随机游走以确定起始节点的局部邻域;选择此局部邻域范围内出现次数最多且影响值最大的标签来更新起始节点标签。
LRW-LPA采用带重启的局部随机游走过程能更准确地确定节点的合适邻域范围,提高了算法的稳定性。
与LPA,BGLL,Infomap, Leiden, Walktrap等经典社区发现算法在12个真实网络和12个人工构造网络上的比较实验表明,LRW-LPA算法在标准互信息(NMI)、调整兰德系数(ARI)和模块度(Q)等方面表现良好。
【总页数】8页(P103-110)【作者】刘扬;郑文萍;张川;王文剑【作者单位】山西大学计算机与信息技术学院;山西大学计算智能与中文信息处理教育部重点实验室【正文语种】中文【中图分类】TP391【相关文献】1.一种基于随机游走模型的多标签分类算法2.基于随机游走相似度矩阵的改进标签传播算法3.一种基于局部回路的标签传播改进算法4.一种基于节点局部相似度的标签传播算法5.基于随机游走的改进标签传播算法因版权原因,仅展示原文概要,查看原文内容请购买。
基于随机游走模型的查询日志中命名实体挖掘
基于随机游走模型的查询日志中命名实体挖掘伍大勇;刘挺【摘要】提出了一种弱指导的方法从搜索引擎查询日志中挖掘命名实体.该方法中采用人工选择的少量命名实体名称作为种子,使用随机游走模型从查询日志中获得大量的命名实体.其中采用了查询日志中的实体上下文模板,用户点击URL和候选命名实体构建三分图,根据在该图上的随机游走计算候选命名实体属于指定目标实体类别的概率,从而在查询日志中获取该类别的命名实体.在真实的查询日志上对7个实体类别进行的实验,实验结果显示本文方法在各个类别上均获得较好的命名实体挖掘效果.【期刊名称】《智能计算机与应用》【年(卷),期】2012(002)004【总页数】6页(P22-26,30)【关键词】命名实体;查询;随机游走【作者】伍大勇;刘挺【作者单位】哈尔滨工业大学计算机科学与技术学院,哈尔滨150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨150001【正文语种】中文【中图分类】TP391.30 引言搜索引擎的查询日志是一个包含大量命名实体的数据资源。
在用户输入到搜索引擎的查询中,经常包含有命名实体,根据Guo等对搜索引擎查询日志进行统计,发现近70%的查询中包含命名实体[1]。
从搜索引擎日志中挖掘出的命名实体,能够更好地反映用户的检索兴趣,例如,在用户查询中经常出现一些非正式的命名实体名称,如歌手名“春春”、“笔畅”,游戏名“仙3”等等,这些命名实体在正规的文档中很少出现,但是却反应了用户的真实检索习惯,所以从查询日志中挖掘出的命名实体能够帮助搜索引擎对查询进行处理分析,以及用于查询推荐、在线广告推送等搜索引擎相关应用中。
尽管在搜索引擎查询日志中包含有大量的命名实体,但是由于用户查询往往长度较短,并且经常不具有规范的语法形式,所以一些传统的在文档中利用句子上下文信息或句法信息等特征进行命名实体识别的方法,不能很好地应用在查询日志的实体挖掘上。
近年来,基于查询日志具有的一些特殊性质,一些研究者开展了在查询日志中挖掘命名实体的研究。
一种基于图的多模态随机游走重排序算法
一种基于图的多模态随机游走重排序算法赵鹏;陈浩;刘慧婷;姚晟【期刊名称】《哈尔滨工程大学学报》【年(卷),期】2016(037)010【摘要】为了提高图像检索中的重排序效果,提出了一种基于图的多模态随机游走重排序算法。
不同于现有的重排序算法根据检索返回的图像顺序设置图像列表得分序列初值,该算法将多模态融合应用于随机游走算法,避免单一模态获取图像内容的片面性,并利用多模态随机游走方法对返回图像列表得分序列进行初始化,然后利用多模态重排序算法最优化目标函数,对相关参数和得分列表进行迭代更新,从而获得最终重排序后的图像序列。
实验显示了所提出的算法具有良好的重排序效果。
【总页数】7页(P1387-1393)【作者】赵鹏;陈浩;刘慧婷;姚晟【作者单位】安徽大学计算智能与信号处理教育部重点实验室,安徽合肥230039; 安徽大学计算机科学与技术学院,安徽合肥230601;安徽大学计算机科学与技术学院,安徽合肥230601;安徽大学计算智能与信号处理教育部重点实验室,安徽合肥 230039; 安徽大学计算机科学与技术学院,安徽合肥230601;安徽大学计算智能与信号处理教育部重点实验室,安徽合肥 230039; 安徽大学计算机科学与技术学院,安徽合肥230601【正文语种】中文【中图分类】TP391【相关文献】1.一种基于随机游走的A*算法 [J], 刘浩翰;郭晶晶;李建伏;冯梅;贺怀清2.一种基于Opinosis图和马尔科夫随机游走模型的多文本情感摘要框架 [J], 康世泽;马宏;黄瑞阳3.一种基于随机游走的歌曲推荐算法 [J], 吴雪君; 米红娟; 李欣4.一种基于随机游走的歌曲推荐算法 [J], 吴雪君; 米红娟; 李欣5.一种基于MH改进的重启随机游走链路预测算法 [J], 吕亮;何敏;易灿因版权原因,仅展示原文概要,查看原文内容请购买。
基于随机游走算法的社会化标签的用户推荐
基于随机游走算法的社会化标签的用户推荐王海雷;俞学宁【期刊名称】《计算机工程与设计》【年(卷),期】2013(34)7【摘要】利用来自Delicious的数据集,结合内容相似度的挖掘和语义关系处理,对社会化标签系统的用户推荐的算法进行了研究.具体工作为:利用标签和书签的语义关系,定义用户的内容信息,从而计算内容相似度;建立内容相似度与社会网络的用户链接关系,通过可重启的随机游走算法(RWR)结合来达成理想的效果.实验评测显示,无论是精确度还是召回率,该算法的效果都要明显优于baseline的算法.%By combining the similarity of contents and the semantic relation,the algorithms of user recommendation in social tagging system are studied by using the dataset derived from delicious,which is the world's leading social bookmarking service.This work mainly includes twoaspects.Firstly,the similarity of contents is calculated by using the semantic relation between the tags and bookmarks; Secondly,random walk with restarts (RWR) algorithm is used to combine the similarity of contents with user links in social networks to achieve the desired effect.Experiments conducted on real datasets from delicious demonstrate that this method outperforms other temporal models and state-of-the-art prediction methods both from precision and recall.【总页数】4页(P2388-2391)【作者】王海雷;俞学宁【作者单位】北京大学光华管理学院,北京100871;中国民生银行博士后工作站,北京100031;中国民生银行科研培训学院,北京100084【正文语种】中文【中图分类】TP393【相关文献】1.一种基于社会化标签的协同过滤推荐算法 [J], 王宝林;韩帅帅;张德海2.适应用户兴趣变化的社会化标签推荐算法研究 [J], 张艳梅;王璐3.结合社会化标签的基于内容的推荐算法 [J], 江周峰;杨俊;鄂海红4.基于用户相似度的随机游走社交网络事件推荐算法 [J], 马铁民; 周福才; 王爽5.基于改进鱼群算法与张量分解的社会化标签推荐模型 [J], 张浩;何杰;李慧宗因版权原因,仅展示原文概要,查看原文内容请购买。
基于主题分组与随机游走的App推荐算法
基于主题分组与随机游走的App推荐算法
赵海燕;张健;曹健
【期刊名称】《计算机应用研究》
【年(卷),期】2018(035)008
【摘要】近年来,App的数量呈爆炸式地增长,在庞大数量的手机App中找到合适的App给用户带来了困难.传统的推荐系统方法运用到App推荐上时有很多的局限性,如难以解决冷启动和用户对不同类别的应用具有不同的选择偏好等问题.提出了一种基于主题分组和随机游走的个性化推荐算法TGRW.TGRW针对用户对每类App需要的数量、偏好的程度各不一样的特点,根据用户的App使用记录,构造了user-App组-App的三元图模型,通过对不同的用户在不同的推荐组上设置不同的权重,再利用随机游走算法计算出用户对每个App的偏好概率,从而形成推荐列表.在真实用户数据集上的实验表明,该方法比其他方法在推荐效果上得到了明显提升.【总页数】4页(P2277-2280)
【作者】赵海燕;张健;曹健
【作者单位】上海理工大学光电信息与计算机工程学院,上海200093;上海理工大学光电信息与计算机工程学院,上海200093;上海交通大学计算机科学与技术系,上海200030
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.基于APP使用历史主题分析的个性化推荐算法 [J], 赵海燕;张健;曹健
2.基于组合类别空间的随机游走推荐算法 [J], 樊玮;谢聪;肖春景;曹淑燕
3.基于深度随机游走的协同过滤推荐算法 [J], 刘靖凯
4.基于深度随机游走的协同过滤推荐算法 [J], 刘靖凯
5.基于随机游走的网络表示学习推荐算法 [J], 刘峰;王宝亮;邹荣宇;赵浩淳
因版权原因,仅展示原文概要,查看原文内容请购买。
基于用户影响力游走模型的社会化推荐算法
基于用户影响力游走模型的社会化推荐算法柳玲;马艺;文俊浩;王喜宾【期刊名称】《计算机工程与应用》【年(卷),期】2017(000)010【摘要】社会化推荐在一定程度上缓解了推荐中的数据稀疏性问题,但是通常仅考虑了社交网络中用户间的局部影响关系.综合考虑用户的局部影响力和全局影响力,提出了基于用户影响力游走模型的社会化推荐算法,该算法根据用户信任关系和历史行为分析用户的局部影响力,通过评估用户的评分质量研究用户的全局影响力,然后将二者有机结合计算随机游走模型中各节点之间的转移概率.通过与以往的算法在均方根误差、覆盖率和F-Measure等指标的实验结果表明,提出的算法在一定程度上提高了推荐的性能.%Social recommendation alleviates the data sparse problem in recommendation to some extent, while it usually only involves the local influence between neighbors. Taking full account of local and global influence, this paper proposes a social recommendation algorithm based on a user influence walk model. The algorithm first calculates the local influence based on neighbors'trust relations and users'historic behaviors, and explores the global influence by measuring users' quality of rating. Then, exploit local and global influence together to compute the transition probability between each node in the random walk model. A lot of experiments is done based on RMSE(Root Mean Squared Error), coverage rate and F-Measure, the results show that the proposed algorithm improves performance for recommendation in some degree.【总页数】7页(P61-67)【作者】柳玲;马艺;文俊浩;王喜宾【作者单位】重庆大学软件学院,重庆 401331;重庆大学软件学院,重庆 401331;重庆大学软件学院,重庆 401331;重庆大学软件学院,重庆 401331【正文语种】中文【中图分类】TP311【相关文献】1.基于随机游走模型的关键词推荐算法 [J], 郭世龙;王晨升;杨光;刘丰;钟兴志2.基于用户影响力和个性的协同过滤推荐算法 [J], 周国强;金礼仁;张文聪3.基于用户相似度的随机游走社交网络事件推荐算法 [J], 马铁民; 周福才; 王爽4.基于链路预测的有向互动影响力和用户信任的推荐算法 [J], 魏映婷; 倪静5.基于监督随机游走的有影响力用户发现算法 [J], 唐明伟;高振伟;王彦婷;王镇;邓加钰;陈晓亮因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3 4卷 第7期
王 海 雷 , 俞 学 宁 : 基于 随 机 游走 算法的 社 会 化 标签 的 用户 推 荐
·2 3 8 9·
其后成为电子商务中很重要的一环 。 、f 、G 在社交 网 站 方 面 , 诸 如 d e l i c i o u s l i c k r r o u l e n等 p 用户给相应的内 容 打 标 签 的 网 站 的 兴 起 , 由 于 要 标 记 的 资 源内容过于繁杂 或 者 内 容 不 能 直 接 获 取 文 本 , 因 此 出 现 了 用户给资源标记 标 签 的 系 统 , 给 予 用 户 所 打 标 签 的 推 荐 系 统也应运而 生 。 其 作 用 是 依 据 了 用 户 的 个 人 喜 好 , 让 用 户 迅速找到相应的 词 语 来 描 述 , 另 外 也 可 以 侧 面 找 到 最 贴 近 资源的描述 标 签 , 这 一 过 程 借 用 了 人 的 主 观 能 动 性 , 增 加 了系统体现 出 来 的 社 会 文 化 。 在 社 交 网 络 中 , 朋 友 之 间 可 以相互 发 布 感 兴 趣 的 话 题 、 最 近 的 照 片 、 有 意 思 的 视 频 、 交流思想 、 传 播 新 闻 …… 所 以 在 这 个 社 会 网 络 中 , 人 人 都 是一个有潜力的 传 播 者 和 接 收 者 , 正 因 为 这 个 平 台 的 无 所 不包的特性在于其充分利用了社会 网 络 中 草 根 人 群 的 特 点 , 朋友和朋友之间的 信 任 往 往 比 远 离 一 般 群 众 的 新 闻 媒 体 的 影响来得大 , 来 得 广 。 而 作 为 社 会 网 络 中 最 基 础 的 用 户 构 成社交网络中最 核 心 的 部 分 , 对 于 一 个 在 社 会 网 络 中 朋 友 较少的用户 来 说 , 所 能 接 触 到 的 信 息 是 有 限 的 , 所 以 扩 展 有 朋友圈便是非常重要 的 需 求 , 因 此 社 交 网 站 一 般 通 过 “ 可能认识的人 ” 一栏向 用 户 推 荐 朋 友 。 而 这 个 推 荐 系 统 往 往成为用户找到朋友的重要渠道 。
摘 要 : 利用 来 自 D e l i c i o u s的 数 据 集 , 结合 内 容 相 似度 的 挖掘 和 语 义关系 处 理 , 对 社 会 化 标签 系统 的 用 户 推 荐 的 算 法 进 行 了 研究 。 具 体工作 为 : 利用 标签 和 书 签 的 语 义关系 , 定义 用户 的 内 容 信 息 , 从 而 计 算 内 容 相 似 度 ; 建 立 内 容 相 似 度 与 社 会 网络 的 用户 链 接 关系 , 通过 可 重 启 的 随 机 游走 算法 ( RWR) 结合 来 达 成 理 想 的 效 果 。 实验 评 测 显 示 , 无 论 是 精 确 度 还 是 召 回 率 , 该 算法的 效 果都要明 显 优 于 b a s e l i n e的算法 。 关键词 : 社 会 化 标签 ; 用户 ; 资 源 ; 标签 ; 推 荐 )0 中图法分类号 :T P 3 9 3 文献标识号 :A 文章编号 : 1 0 0 0 7 0 2 4( 2 0 1 3 7 2 3 8 8 0 4 - - -
源推荐 、 标签 推 荐 、 用 户 推 荐 。 这 个 3 个 推 荐 方 向 是 现 在
; 修订日期 :2 收稿日期 :2 0 1 2 1 1 1 5 0 1 3 0 2 0 5 - - - - ) ; 教育部科技发展中心网络时代的科技论文快速共享专项研究资助课题基金项目 ( ) 基金项目 : 自然科学基金项目 ( 6 1 2 7 2 3 4 3 2 0 1 1 1 1 0 , 男 , 河北廊坊人 , 博士后 , 研究方向为语义网 、 文本挖 掘 和 知 识 管 理 ; 俞 学 宁 ( ,男,北 京 人,本 作者简介 : 王海雷 ( 1 9 8 1- ) 1 9 5 6- ) : 科 , 高级经济师 , 研究方向为数字教育 、 数据挖掘和知识管理 。E-m a i l h a i l e i 6 0 8@1 2 6 . c o m
U s e r r e c o mm e n d a t i o n i n s o c i a l t a i n b a s e d o n r a n d o m w a l k a l o r i t h m g g g g
12 3 WANG H a i l e i YU X u e n i n - , - g ,
基于随机游走算法的社会化标签的用户推荐
2 ,俞 学 宁3 王 海 雷1,
( 1. 北京 大学 光 华 管 理 学 院 , 北京 1 0 0 8 7 1;2. 中 国 民 生 银 行 博 士 后 工作 站 , 北京 1 0 0 0 3 1; ) 3. 中 国 民 生 银 行 科研 培 训 学 院 , 北京 1 0 0 0 8 4
2 0 1 3年7月 第3 4卷 第7期
计算机工程与设计
C OMP UT E R E NG I N E E R I NG AN D D E S I GN
J u l 2 0 1 3 y V o l . 3 4 N o . 7
[ ] 1 2 - 。 目前的推荐系统涉及 到 个 主 要 的 方 面 , 分 别 是 资 t e m)
3] 。 几乎所有个性化推荐系统中必不可少的部分 [
社会化标签 系 统 在 电 子 商 务 系 统 、 知 识 管 理 系 统 以 及 社交网络中都有 着 重 要 的 经 济 价 值 和 广 泛 的 应 用 前 景 。 在 电子商务方 面 , 最 著 名 的 电 子 商 务 网 站 , 如 亚 马 逊 网 络 书 、淘 宝 网 ( 、当当网上书 城 店 ( Am a z o n . c o m) t a o b a o . c o m) 等等都具有资源 推 荐 功 能 , 顾 客 选 择 一 本 自 己 感 兴 趣 的 书 籍 , 马上会在底下 看 到 系 统 推 荐 的 喜 欢 此 商 品 的 顾 客 还 喜 欢的商品 , 此 项 功 能 是 首 先 在 亚 马 逊 网 站 上 面 提 出 来 的 , 此举也成为 被 用 户 津 津 乐 道 一 项 服 务 。 此 后 , 还 可 以 根 据 某顾客以往的购买 行 为 以 及 根 据 具 有 相 似 购 买 行 为 的 顾 客 ,也就 群的购买行为去推荐这个顾客其 “ 可能喜欢的品项” 是借由社群的喜好提供个人化的 资 讯 、 商 品 等 的 推 荐 服 务 ,
0 引 言
社会化标签 系 统 的 出 现 为 用 户 提 供 了 便 利 , 但 也 提 出 了新的问题 : 由全 体 用 户 产 生 的 数 据 太 多 太 乱 且 一 直 呈 指 数式爆炸性增长 , 一 个 用 户 往 往 难 以 轻 易 找 到 与 自 己 相 似 的其他 用 户 或 者 自 己 喜 欢 的 资 源 , 对 资 源 的 概 括 性 描 述 — — — 标签也需要费力思考 。 在这种背景下 , 推 荐 系 统 ( r e c - o mm e n d e r s s t e m) 应运而生 , 它可 以 根 据 用 户 的 特 征 , 比 y 如兴趣爱好 , 推荐 满 足 用 户 要 求 的 对 象 并 可 以 实 时 更 新 推 荐,也称 个 性 化 推 荐 系 统 ( r e c o mm e n d e r s s e r s o n a l i z e d - p y