基于加权二部图的个性化推荐算法_张新猛
基于加权二部图的个性化推荐算法
基于加权二部图的个性化推荐算法张新猛;蒋盛益【期刊名称】《计算机应用》【年(卷),期】2012(32)3【摘要】针对网络推断(NBI)算法的二部图实现算法忽略二部图权重而导致实际评分值高的项目没有得到优先推荐这一问题,提出加权网络推断(WNBI)算法的加权二部图实现算法.该算法以项目的评分作为二部图中用户与项目的边权,按照用户-项目间边权占该节点权重和的比例分配资源,从而实现评分值高的项目得到优先推荐.通过在数据集MovieLens上的实验表明,相比NBI算法,WNBI算法命中高评分值项目数目增多,同时在推荐列表长度小于20的情况下,命中项目的数量和命中高评分项目数量均有明显增加.%In Network-Based Inference (NBI) algorithm, the weight of edge between user and item is ignored; therefore, the items with high rating have not got the priority to be recommended. In order to solve the problem, a Weigted Network-Based Inference (WNBI) algorithm was proposed. The edge between user and item was weighted with item's rating by proposed algorithm, the resources were allocated according to the ratio of the edge's weight to total edges' weight of the node, so that high rating items could be recommended with priority. The experimental results on data set MovieLens demonstrate that the number of hit high rating items by WNBI increases obviously in contrast with NBI, especially when the length of recommendation list is shorter than 20, the numbers of hit items and hit high rating items both increase.【总页数】5页(P654-657,678)【作者】张新猛;蒋盛益【作者单位】广东外语外贸大学思科信息学院,广州510006;广东外语外贸大学思科信息学院,广州510006【正文语种】中文【中图分类】TP181;TP301.6【相关文献】1.基于增加相似度系数的加权二部图推荐算法 [J], 李镇东;罗琦;施力力2.基于随机森林修正的加权二部图推荐算法 [J], 李玲;李晋宏3.基于改进加权二部图和用户信任度的协同过滤推荐算法 [J], 邓小燕;张晓彬4.基于加权二部图的个性化方案推荐 [J], 杨珍;耿秀丽5.基于加权二部图的Slope One推荐算法 [J], 王冉;徐怡;胡善忠;何明慧因版权原因,仅展示原文概要,查看原文内容请购买。
基于改进加权二部图和用户信任度的协同过滤推荐算法
Collaborative Filtering Recommendation System Based on Improved Bipartite Graph and User Reliability
① 收稿时间: 2018-11-06; 修改时间: 2018-11-23; 采用时间: 2018-11-27; csa 在线出版时间: 2019-05-01
Software Technique•Algorith
2019 年 第 28 卷 第 5 期
基于改进加权二部图和用户信任度的协同 过滤推荐算法①
邓小燕1, 张晓彬2
1(重庆医药高等专科学校 医学技术学院, 重庆 401331) 2(重庆农村商业银行 科技信息部, 重庆 400023) 通讯作者: 张晓彬, E-mail: 175075043@
摘 要: 基于复杂网络物质扩散原理的二部图理论在协同过滤推荐领域的应用受到越来越多学者的关注, 现有算法 计算邻居用户时主要考察用户对项目的正向评价, 未充分考虑用户的负向评价. 为进一步提高推荐算法的准确度, 提出了改进算法, 将用户正向评价和负向评价量化成二部图上的路径权重, 控制用户能量的分配, 并在邻居用户预 测评分阶段考虑用户的信任度, 推荐结果更加准确. 采用 MovieLens 和 Eachmovie 数据集对改进算法以及现有算法 进行对比实验分析, 证明改进算法具有更低的平均绝对偏差. 关键词: 协同过滤; 二部图; 信任度; 平均绝对偏差
即获取到准确的邻居用户, 预测评分更加准确, 已经成 为协同过滤领域研究的一个新方向[6], 不断有学者在此 基础上研究新的改进措施来进一步提高推荐的准确度. 文献[7]提出了一种基于随机森林修正的加权二部图推 荐算法, 首先建立评分权重矩阵, 再用二部图做能量分 配, 获取到初始推荐结果, 最后采用随机森林对推荐结 果进行再次修正, 提高了推荐的准确度; 文献[8]提出了 一种利用差异路径权重控制能量传递的二部图算法, 该算法在第一阶段能量传递时采用用户相似性作为路 径权重, 使与目标用户相似的用户节点获得更多的能 量; 在第二阶段采用项目属性的相似性作为路径权重, 使与目标用户已购项目具有相似属性的项目获得更多 的能量, 达到了提高推荐结果多样性的目标; 文献[9,10] 综合考虑项目度、用户评分标准信息和时间动态因素, 对二部图上的用户-项目关联关系做了加权处理, 推荐 列表的平均绝对偏差和均方根误差都有明显下降.
二部图理论
基于二部图(Bipartite Network)的推荐算法不必考虑用户和项目的内容信息,它是一种结合物质扩散(Massive Diffusion)理论的推荐算法。
周涛[1]等人研究了一些物理学的知识,比如热传导理论以及物质扩散理论等,并将它们应用在推荐算法中,提出了这种基于二部图的推荐算法。
二部图是一种特殊的网络,它包含有两类不同类型节点,并且仅允许不同类型的节点之间可以有连线。
自然界许多问题可以利用二部图进行解决,比如性别关系、边着色问题等。
在二部图的应用中,同一类型节点之间的合作相互关系成为了研究领域的热点。
比如,可以利用由演员节点和演出剧目节点组成的二部图来研究演员之间在演出中的合作关系。
在一个具体的推荐系统中,可以把用户看作是一类节点,把项目看作是另一类节点。
通过由用户节点和项目节点组成的二部图,我们可以利用相邻的用户为目标用户推荐可能感兴趣的项目。
物质扩散类似于在复杂网络中的随机游走的概念。
它假设在一个系统中有着固定数量的“物质”在传递,并且在传递的过程中这些“物质”的总量始终保持守恒。
最后系统稳定状态的结果与节点的度数成正比。
在推荐系统中,我们认为目标用户所选择过的项目能够提供一定的推荐能力信息。
在操作过程中,首先为每个项目赋予初始资源1。
根据物质扩散的理论,物质的传递过程分两步走。
第一步,每个项目将自己的资源通过二部图的边均匀地分配给选择过该项目的每个用户,这样资源就从项目节点传递到了用户节点。
第二步,每个用户再将自己分配到的资源通过二部图的边平均分配给他选择过的项目,这样资源又传回到了项目节点。
虽然资源的总量在传递过程中是守恒的,但通过两次传递,每个项目所具有资源的分配状态发生了改变。
系统最后可以根据项目所拥有的资源的分布状态来计算它们之间的相似度,并确定最近邻集。
(引入具体的公式,并将改进的论文附上)文献[2]将物质扩散理论运用到了Item-based协同过滤推荐算法。
算法将选选项目的资源初始值都设为1,用稳定状态时两个项目的资源传递总量来表示它们之间的相似程度,最后利用这个相似度来计算目标用户的预测评分,并把评分较高的项目推荐给他。
基于项目属性与数据权重的协同过滤推荐算法
基于项目属性与数据权重的协同过滤推荐算法
张新猛;李松
【期刊名称】《自动化与仪表》
【年(卷),期】2016(031)009
【摘要】传统的基于项目的协同过滤(IBCF)算法存在相似性计算方法忽略项目属性在相似性度量中的重要参考价值和不能反映用户意向的变化的不足.基于以上不足该文提出了一种新的基于项目的协同过滤算法.此种算法分别基于评分与项目属性因素度量项目相似性,最后通过自适应平衡因子协调处理两方面的相似性结果来度量项目相似,并结合反映项目与用户意向相关程度的数据权重进行预测与推荐.试验结果表明,改进后的算法,对传统算法中存在的2个弊端进行了改善,在推荐准确度上有所提高.
【总页数】5页(P69-73)
【作者】张新猛;李松
【作者单位】天津市体育彩票管理中心,天津300074;河北工业大学计算机科学与软件学院,天津300401
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于用户项目属性偏好的协同过滤推荐算法 [J], 吕成戍
2.基于项目属性权重的协同过滤推荐算法 [J], 李转运;孙翠敏
3.基于矩阵分解和项目权重的协同过滤推荐算法 [J], 许吴宁; 梁燕
4.基于项目属性权重的协同过滤推荐算法 [J], 李转运[1];孙翠敏[1]
5.基于项目权重的协同过滤推荐算法研究 [J], 王保
因版权原因,仅展示原文概要,查看原文内容请购买。
动态电能质量治理装置实时相位补偿
电子技术与软件工程Electronic Technology & Software Engineering电力电子Power Electronic 动态电能质量治理装置实时相位补偿虞坚阳(国网江苏省电力有限公司常州供电分公司江苏省常州市213000 )摘 要:本文分析了电能质量治理装置在跟踪指令波形存在的相位延迟问题,分别采用了固定相位校正和实时相位两种方法进行分析,通过仿真和试验对比了两种方法的补偿效果。
关键词:电能质量治理装置;固定补偿;实时补偿随着配网智能化水平的快速提升,大量电能质量治理装置得到了广泛的应用,以有源电力滤波器(APF)、静止无功补偿装置(SVG)为代表的电能治理设备基本原理是通过检测系统或负载电流中的待 补偿成份,控制全控型开关器件(IGBT)实时产生所需的反向补 偿电流并注入电网,以控制系统电流功率因数或谐波畸变率。
在实时补偿中,装置实际发出电流与指令电流(或负载等治理电流)之间的误差将决定最终的补偿效果,而在实时跟踪过程中,具体表现 为补偿电流能否准确跟踪指令电流。
通过大量的工程实际发现,补 偿电流与指令电流间往往存在一定的相位延迟,这导致了设备的电能质量治理能力达不到设计要求。
1电能质量治理设备工作原理1APF/SVGAPFSFG图1:电能质量治理装置基本补偿原理1. 1基本原理通用型电能质量治理装置(APF/SVG)的系统接入与补偿原理程图,可以将推荐算法建模过程分成两个部分:用户-商品关系建模和推荐实现建模,在用户•商品关系建模过程中,首先釆集用户- 商品的评分数据,分别构建用户和商品的二部图拓扑结构,建立用户■商品分类模型,然后搭建用户■商品二部图模型;在推荐系统建模过程中,首先根据二部图模块函数计算用户和商品间的相似值,构建用户-商品相似矩阵,应用改进的协同过滤推荐算法生成推荐 列表,将预测得到的商品评分值进行从高到低排序,并对邻居用户推荐商品评分最高的商品,完成商品个性化推荐。
基于二部图的推荐算法研究综述
科技与创新┃Science and Technology&Innovation ·92·2021年第20期文章编号:2095-6835(2021)20-0092-02基于二部图的推荐算法研究综述高迎,刘正(首都经济贸易大学,北京100070)摘要:随者互联网的不断发展,如何对网络上海量的信息数据进行分析,已经成为一个热点问题。
推荐系统能够在用户没有明确的需求时也能够为其进行商品与服务的个性化推荐,因此如何在大数据背景下准确预测用户偏好是值得研究的。
推荐系统中用户和项目二者之间的关系可以构成明显的二部图网络结构,研究表明,通过复杂网络结构和推荐算法的融合可以有效改善个性化推荐过程中存在的问题。
首先对推荐算法进行简单概述,总结了推荐算法与二部图推荐算法的发展历程,最后对相关领域未来的发展方向进行简述。
关键词:个性化推荐;协同过滤;网络结构;信息过载中图分类号:TP391.3文献标志码:A DOI:10.15913/ki.kjycx.2021.20.040当今时代是信息网络时代,因此不同行业产生的数据信息数量已经达到ZB级别,这为企业带来了很多挑战。
互联网用户数量以一种十分迅猛的趋势发展,对于各企业来说,庞大的信息数据量为其提出了难题,他们难以很快确定哪些信息与特定的用户是相关的,即产生了“信息过载”的问题。
各界学者逐渐开始研究个性化推荐这一先进的技术手段以改善这一问题,而其中协同过滤已被广泛应用在各种类型的企业中。
由于该算法仅通过用户评分信息预测用户偏好,推荐效果有待提高。
图是一种表达节点及其关系的基本结构,而二部图以直观的方式表达了用户及项目之间的关系,因此学者逐渐将复杂网络的方法与推荐算法进行结合。
随者相关领域研究的不断发展,对于网络结构与推荐算法的研究仍存在许多挑战需要探索。
因此,本文对相关领域的理论、研究现状和关键技术进行总结与分析,希望能帮助其他学者了解该领域的研究进展与发展方向。
个性化推荐算法的研究和使用教程
个性化推荐算法的研究和使用教程随着互联网信息爆炸式增长,用户面对海量的数据和内容,如何找到适合自己的信息成为一个重要的问题。
个性化推荐算法应运而生,它能根据用户的兴趣和偏好,为用户提供个性化的推荐内容,提高用户的满意度和体验。
本文将介绍个性化推荐算法的研究和使用教程。
一、个性化推荐算法的研究1. 协同过滤算法协同过滤算法是最经典的个性化推荐算法之一。
它通过分析用户行为数据,找到与目标用户兴趣相似的其他用户,推荐这些用户喜欢的物品给目标用户。
常见的协同过滤算法有基于用户的协同过滤和基于物品的协同过滤。
基于用户的协同过滤算法通过比较用户之间的相似度,找到相似兴趣用户,并根据这些用户的喜好推荐给目标用户。
基于物品的协同过滤算法则是通过分析物品之间的关联性,找到目标用户喜好的物品。
2. 内容过滤算法内容过滤算法是根据物品的属性和用户的偏好进行匹配推荐的算法。
它通过分析物品的属性,比如标题、标签、关键词等,和用户的兴趣偏好进行匹配,从而得到个性化的推荐结果。
常见的内容过滤算法有基于关键词的匹配和基于推荐系统的主题模型。
3. 混合算法混合算法是将多种推荐算法结合起来使用的方法。
它可以充分利用多个算法的优势,提高推荐的准确性和多样性。
常见的混合算法有基于模型的混合、基于规则的混合和基于加权的混合等。
二、个性化推荐算法的使用教程1. 数据收集个性化推荐算法需要大量的用户行为数据作为基础,因此首先需要收集用户的行为数据。
可以通过用户注册信息、访问记录、购买记录等方式来获取用户的行为数据。
2. 数据预处理在进行个性化推荐算法之前,需要对数据进行预处理。
包括数据清洗、数据转换、数据融合等步骤。
清洗数据是为了删除噪声数据和无效数据,提高数据的质量。
数据转换是将原始数据转换为个性化推荐算法所需的格式。
数据融合是将不同来源的数据进行整合,形成更完整的用户行为数据。
3. 算法选择根据具体的推荐需求和数据情况,选择合适的个性化推荐算法。
基于知识图谱的个性化推荐算法研究
基于知识图谱的个性化推荐算法研究随着互联网的普及和应用场景的增多,人们在日常生活中接收到的信息量越来越大,选择的复杂度也越来越高。
在这种情况下,推荐算法逐渐成为了解决选择困难和信息过载的有效手段。
在推荐算法中,个性化推荐算法是最为常见的一种,因为它可以针对用户的历史行为和偏好,为用户推送个性化的信息和内容。
而知识图谱则是推荐算法的重要基石,它能够将海量的数据节点有机地连接起来,形成一个庞大而丰富的知识网络,帮助推荐算法更好地理解和挖掘用户真正的需求。
一、个性化推荐算法的基本思路个性化推荐算法的基本思路是利用用户的历史行为、偏好和相关信息,通过特定算法模型挖掘和分析这些数据,进而为用户推荐最匹配的信息和内容。
具体来说,个性化推荐算法可以分为基于内容和基于协同过滤两大类。
基于内容的推荐算法是通过分析用户对某些内容的兴趣特征,根据这些特征来推荐相似的内容给用户,适用于新闻、电影等纯内容型的推荐场景。
而基于协同过滤的推荐算法则是通过分析用户和物品之间的关系,从而预测用户对物品的偏好,适用于商品、音乐等物品型的推荐场景。
二、基于知识图谱的个性化推荐算法基于知识图谱的个性化推荐算法是将知识图谱的知识结构和用户历史行为结合起来,从而更准确地了解用户需求和兴趣,提供更具针对性和个性化的推荐服务。
具体来说,这种算法可以分为三个部分:知识图谱的构建、实体推荐和关系推荐。
首先,知识图谱的构建是算法的第一步。
知识图谱是一个庞大而复杂的数据结构,它可以包含各种类型的实体和关系,包括人、地、物、事等。
为了构建一个完整而准确的知识图谱,需要结合多种数据源和知识库,如百度百科、维基百科、Freebase等。
在构建过程中,需要将每个实体和关系进行标识和规范化,以确保整个知识图谱的可靠性和一致性。
其次,实体推荐是知识图谱推荐算法的核心部分。
在实体推荐中,算法会通过用户的历史行为和知识图谱中实体之间的关系,对用户的兴趣和需求进行深入把握,挖掘用户可能感兴趣的实体,然后将这些实体推荐给用户。
基于差异路径权重的二部图网络推荐算法
荐,提出了一种利用差异路径权重改变资源传递的二部图网络结构算法。利用用户相似性构造路径权重改变第一阶段 资源传递规则,使资源较多地流向与目标用户相似的用户节点。通过物品属性相似的构造路径权重,使第二阶段资源 更多地流向与目标用户已购物品具有相似属性的物品。实验结果表明,本算法相对于其他流行网络结构算法提高了推 荐的综合性能,并且更好地解决推荐中的相关问题。 关键词:二部图网络结构;差异路径权重;推荐算法;用户相似性;物品属性 中图分类号:TP301.6 doi: 10.3969/j.issn.1001-3695.2017.09.0905
其中: k (oi ) 为物品节点 oi 的度,即物品 oi 被选择的数量。第二阶 段资源会由用户层的每个用户节点经过选择关系流向物品层, 则物品节点 o j 的资源量为
f (o j )
l 1 n
alj f (ul ) k m
n
m ali wij k (ul ) k (oi ) i1
0
引言
随着互联网的快速发展,社会和企业信息化的逐步成熟,
越来越多的数据通过多种终端产生并服务于人们的生活之中。 海量的数据随之而来引发了 “信息过载” 问题[1], 致使能满足用 户需求的推荐系统迅速发展。推荐算法是推荐系统中极为重要 的一个模块,主要负责选择符合用户兴趣的信息或者物品并推 荐给用户,目前主流的推荐算法有协同过滤推荐算法 (collaborative filtering recommendation algorithms, CFRA ) 、基 于 内 容 的 推 荐 算 法 (content-based recommendation algorithms,
对于物品属性首先对每个属性确定其分类个数n确定该属性的编码位数对于一个物品的不同属性值进行格雷编码并且连接成格雷编码串nom对两物品间的nom进行海明距离差异比较得出不同物品的属性差异量hmhmnominomj0101000000nomi1100010100nomj同等的效果对不同物品属性的海明距离值进行归一化处理并且去除差异纲量影响得到物品属性差异函数如下
基于随机森林修正的加权二部图推荐算法
二分图个性化推荐算法的改进及应用的开题报告
二分图个性化推荐算法的改进及应用的开题报告一、研究背景和意义随着互联网技术的发展,个性化推荐在各种应用场景中得到了广泛的应用。
传统的个性化推荐算法主要是基于用户对物品的评价数据进行推荐。
然而,在一些特定场景中,用户的评价可能并不容易获取,此时如何进行个性化推荐就成为了一个难题。
二分图模型被广泛应用在推荐系统中,其中用户和物品分别构成一个二分图的两个部分,用户和物品之间存在边,表示用户对物品的偏好关系。
传统的二分图模型使用了基于相似度的方法进行推荐,即通过计算用户与物品之间的相似度来得到推荐结果。
然而,在一些特定场景中,如音乐推荐、电影推荐等领域中,这种方法往往效果不佳,因为用户与物品之间的相似度难以计算。
因此,本研究将探索基于二分图的个性化推荐算法的改进及应用。
通过研究二分图的结构特征和用户行为特征,提出一些新的推荐算法,使得推荐结果更加准确和个性化。
同时,将该算法应用于音乐推荐系统中,验证算法的效果和可行性。
二、研究内容和方法1. 研究基于二分图的个性化推荐算法的优缺点,分析现有算法的局限性和不足之处。
2. 分析二分图的结构特征和用户行为特征,探索新的推荐算法。
如通过引入社交网络信息,利用用户间的关系构建二分图,解决传统二分图推荐算法中的冷启动问题。
3. 针对音乐推荐领域中存在的较大的音乐库和稀疏的用户评价问题,提出基于二分图的音乐推荐算法与处理方法。
4. 通过实验证明新算法在准确度和个性化上的优势,并结合案例探讨算法的实际应用问题。
5. 结合实验结果和用户反馈优化算法,使其更加符合用户需求。
三、研究基础和条件本研究所需的基础知识包括机器学习、推荐系统、图论等。
需要运用Python等编程语言进行算法实现与实验。
研究所需的设备和软件条件:计算机、较大的音乐库。
四、预期结果通过本次研究,预期得到以下成果:1. 提出一种基于二分图的新型个性化推荐算法,并分析其在准确度和个性化上的优劣。
2. 将改进后的算法应用于音乐推荐系统中,验证其效果和可行性。
一种结合遗忘机制与加权二部图的推荐算法
一种结合遗忘机制与加权二部图的推荐算法刘晓光;谢晓尧【摘要】为了解决因用户兴趣漂移而导致推荐质量下降的问题,本文引入了用户对产品的遗忘因子.通过分析用户的浏览记录和打分情况,建立用户的动态兴趣模型;并计算用户对产品的遗忘因子,利用遗忘因子作为加权二部图的权值,通过二部图的资源分配方法产生用户的推荐列表.在数据集MovieLens上的实验表明:该算法能有效地处理用户兴趣漂移的问题,提高推荐列表的推荐质量.【期刊名称】《河南科技大学学报(自然科学版)》【年(卷),期】2015(036)003【总页数】6页(P48-53)【关键词】兴趣漂移;遗忘机制;加权二部图;资源分配;推荐算法【作者】刘晓光;谢晓尧【作者单位】贵州大学计算机科学与技术学院,贵州贵阳550000;贵州师范大学信息与计算科学重点实验室,贵州贵阳550000;贵州师范大学信息与计算科学重点实验室,贵州贵阳550000【正文语种】中文【中图分类】TP3随着现代电子商务和网络技术的快速发展,互联网的规模不断扩大,信息不断膨胀,世界上的信息处于大爆炸的状态,用户所面对的信息数量大、质量差、信息价值低,给用户带来了信息超载的问题。
为了解决信息超载问题,推荐系统应运而生[1]。
随着Web2.0技术趋于成熟,推荐系统在网络上的应用也迅速发展,如TaoBao、Amazon、Youtube等网站,它们都拥有自己的推荐系统。
在实际的应用中,用户的数量庞大,产品资源的数量巨大,用户很少能一次就找到自己想要的信息。
设计一个准确高效的推荐系统不仅可以发现用户潜在的兴趣对象,还可以针对不同用户提供个性化的服务[2],以帮助用户更好地获取想要的信息。
2012年,文献[3]提出了加权网络推断算法(WNBI),即加权二部图推荐算法,该推荐算法解决了高评分值的产品不能优先推荐的问题,提高了推荐质量。
但是在现实生活中,随着新的产品(选择)的出现,产品的感知和受欢迎程度不断发生变化,同样,用户的倾向也是不断变化的,这种用户偏好随着时间变化的情况,称为用户“兴趣漂移”问题[4]。
基于增强二部图网络结构的推荐算法
基于增强二部图网络结构的推荐算法张岐山;文闯【摘要】协同过滤推荐算法的数据稀疏性与冷启动问题影响和制约了推荐的质量.基于用户-项目二部图的信任计算可以有效的利用用户间的潜在联系提高推荐性能.提出一种融合基于二部图的增强繁殖信任与JMSD相关系数的推荐方法,包括对改进的加权用户-项目自适应繁殖信任度的计算,在此基础上融合用户偏好的增强信任度机制,以及线性加权JMSD相关系数,两组数据集下的对比实验表明,与三种基准算法对比改进的算法模型具有更低的平均绝对误差(MAE),更高的召回率(Recall),提高了推荐质量.【期刊名称】《计算机系统应用》【年(卷),期】2019(028)004【总页数】6页(P151-156)【关键词】协同过滤;稀疏性;冷启动;信任;二部图网络;用户偏好【作者】张岐山;文闯【作者单位】福州大学经济与管理学院,福州 350108;福州大学经济与管理学院,福州 350108【正文语种】中文引言人工智能时代背景下产生了许多信息过载[1]问题,协同过滤算法是当今电子商务以及各种个性化推荐中应用最广泛的推荐技术,协同过滤算法存在冷启动问题,同时算法存在需要获取大量用户历史数据,存在稀疏性等问题.为解决以上问题,国内外许多专家学者提出并完善了基于信任的推荐系统[2],Guo[3]根据信任的来源将信任分为显性信任(Explicit Trust 和隐性信任(Implicit Trust),显性信任是指用户网络之中主体之间的直接交互,主动表达的信任关系,隐性信任是指根据用户网络中主体之间的直接交互关系挖掘出信任关系,根据用户的某些行为(如评分)来推测用户之间的信任关系,显性信任具有很强可靠性和准确性,而隐性信任更好的区分信任度,能显著提高覆盖率,缓解冷启动问题.Massa 等人[4,5]提出一种使用显示信任的推荐系统,用信任权重代替传统推荐系统的相似度进行推荐,相比传统算法,提高了精度,增加了覆盖范围,可预测的评分总数,同时也能规避恶意用户虚假评分降低推荐质量的隐患.Jamali[6]也考虑了信任问题,采取随机游走的方法利用显性信息,在用户网络中随机选取信任邻居,把用户看成网络中的节点,连接的边即为信任关系,其强度代表了两个用户间信任度.文献[7]引入了全局变量,融合用户间局部信任度和全局信任度,从海量用户历史数据中,挖掘出用户潜在的信任关系,缓解了数据的稀疏性问题,提高了推荐的准确性.Ray 等[8]设定了相似性阈值,提出了当用户间相似度低于设定阈值则舍去,重构信任网络之后再预测评分,此法提高了算法精确度,但是牺牲了数据的覆盖率,也无从缓解冷启动问题.Moradi 等[9]提出了RTCE 模型,该模型首先基于显性信任机制为目标项目进行打分,同时设定信任阈值,对于评分可靠性低于阈值的用户,通过综合考虑积极因子,消极因子重构信任度.文献[10]创建了用户间信任繁殖算法以此拓宽信任网络,通过信任繁殖得到了更多有效邻居用户,提高了算法的覆盖率,缓解了推荐算法中的数据稀疏性和冷启动问题.Zhou 等[11]利用动力学传播原理构建用户-项目二部图网络结构,用户将自己的资源均衡分配给关注的项目,从而计算用户与用户的资源相关信任值,该算法提高了推荐预测精度,减少了算法的复杂度.针对推荐算法的相关问题,本文在已有的研究成果上聚焦于用户显性信任关系以及通过设定阈值衍生繁殖隐性信任关系,充分考虑了信任关系的主观性,非对称性,传播性,弱传递性,以及适应性,同时融合用户偏好,依据评分相似性选择目标用户的最优近邻集合,从而进行预测.本文的主要创新点主要体现在以下方面:1)在基于加权用户项目二部图[12]的信任繁殖[13]模型过程中加入对直接信任的阈值筛选控制,降低了推荐系统的噪声,同时构建用户信任与用户偏好关系融合的强化模型,具有一定现实合理性,最后设计与不融合用户偏好的算法模型进行自身对比,对比结果证明了融合用户偏好信任的优越性.2)计算得到的信任度最后融合实验下表现更加优异的基于MSD 和Jaccard 相似性的JMSD 相似系数[14],在Movielens 数据集和Last.FM 数据集下的实验表明与基准算法相比较,本文提出基于二部图的增强繁殖信任推荐算法模型以下简称BTUCF 算法模型,缓解了了推荐算法的数据稀疏性和冷启动问题,提高了算法结果召回率,降低了算法的平均绝对误差.下一节本文对传统协同过滤以及传统加权二部图推荐算法性能特点及局限性进行分析,第二节对本文提出增强的自适应繁殖信任模型进行描述,第三节讨论分析了本文得到实验模型结果.1 相关工作1.1 传统协同过滤基于用户的协同过滤算法基础流程如下:1)基于用户的协同过滤算法,输入数据集为用户-项目的评分矩阵,记为Rum,用户u 对项目m 的评分记为rum,未评分项目即rum=0,用户-项目评分矩阵共有m 行n 列,每一行都分别代表用户u 依次对各项目的评分,每一列都分别代表某个项目受到各用户的评分数据,形式如下:协同过滤算法主要通过构建相似度矩阵来预测目标用户对该项目的喜好程度,相似度计算方法是协同过滤算法推荐的关键因素,相似度的度量方法主要分为四种:修正的Pearson 相关系数,均方偏差(MSD),Jaccard 相似度和斯皮尔曼等级相关(Spearman’s rank correlation).显式用户评分矩阵非常稀疏,相比其它相似度量本文采用的Jaccard 相似度能一定程度的从全局角度利用用户间的交互关系,但是缺少了用户与用户之间的直接信任交互与间接信任用户间的交互信息,只考虑传统协同过滤缺少了对这些必要信息的有效补充.1.2 传统加权二部图推荐算法二部图中定义用户集合U ={u1,u2,u3,···,ui} 定义项目集合为 O={m1,m2,m3,···,mj}将i 个用户节点和j 个项目的关系转化为一种选择关系,当用户Ui 评价过项目mj 就连接此用户与项目,对每一条用户与项目的连接线都赋予权重Wi,特别的当用户对项目的评分大于等于3 时Wi=1;当用户对项目的评分小于3 时Wi=β 通过实验证明当β=0.5 时推荐结果最优[13],本文中亦使用该最优值. 1)用户-项目关系图构造如图1所示.图中用户对项目的关注度如式(4)所示:其中,Aij 为项目mj 受到用户Ui 关注项目总数,len(ui)为用户ui 评价过的项目权重总和,eij 为用户ui 是否对项目mj 有评价的布尔类型,有即为1 没有即取0.2)项目-用户有向图类似于用户-项目有向网络图构建,将项目得到的用户关注度重新反馈给用户如图2所示.图1 用户—项目模型图2 用户—项目模型图中项目对用户的反馈表达式如式(3)所示:其中,f(ui)为项目反馈给用户ui 的关注度,len(mji)为用户ui 评价过项目mj 的项目权重总和,eji 为项目mj 是否对用户ui 有评价的布尔类型,有即为1 没有即取0,Aij 为项目mj 受到用户ui 关注项目总数.最后结合用户-项目,项目-用户的有向网络图,从而可以得到用户-用户的有向网络图,结合式(4)和(5)推导出用户与用户之间的推导信任,推导信任取值范围为0 与1 之间.0 表示无评价历史,无信任交互,信任值越大信任程度越高,如式(7)所示:Guo[3]阐述的衡量主体与主体之间的信任关系5 个重要特性:主观性:不同的主体有不同的兴趣偏好,判断标准,所以主体对于其他主体可能会有不同的信任值;非对称性:主体对主体的信任都是单方面的,一般是不对称的,在实际中A 对B 的信任度一般不等于B 对A 的信任值;弱传递性:信任是具有传递性的,在A 信任B,B 信任C 的前提下,t rustAB 和 t rustBC足够大时,A 对C 的信任值是有显著意义的;传播性:主体之间的直接信任关系以及其变化会影响其他主体之间的信任关系,特别是当一个主体的兴趣或者发生不诚信行为时,与其有信任关系的其余主体评估水平就会发生变化,这样通过该主体获得推荐的信任关系也会发生相应变化;适应性:主体之间的信任关系会随着时间函数的变化,上下文环境的变化而变化,由于信任的动态性,推荐系统中的信任建立之后,要根据系统内各种要素的变化不断调整调和参数.对比五种特性,传统加权二部图法在主观性上一分为二的权重考虑没有充分考虑用户偏好,没有在用户之间建立不对称的可适应性传递信任,没有充分挖掘非直接交互的用户间的潜在信任信息,同时没有设定阈值的广泛信任关系加入了不存在的信任关系,降低了系统的抵抗恶意攻击能力,增加了系统噪声.2 一种增强的自适应繁殖信任模型2.1 增强的二部图网络信任机制(1)传统加权二部图基础上的信任繁殖.利用传统加权二部图得到直接信任,但是直接信任只反映了有相互交互的用户之间的关注度程度,实际数据中许多用户之间并没有直接互动,根据信任的可传递性与传播性,用户A 信任B,用户B 信任用户C,则存在用户A 信任用户C,挖掘潜在的间接信任可以拓宽信任关系,信任繁殖可以极大的提高算法的覆盖率与算法精度.根据文献[13]创建的信任进行了拓展,同时设定阈值d,本文只对直接信任大于0.01 才计算ITrust 间接信任计算公式如下:(2)综合信任度.结合用户间直接信任DTrust 与间接信任ITrust,可计算用户间综合信任度,计算公式如下:自适应性因子∂ 表达式如下:(3)结合用户偏好的信任增强机制.增强的信任加权的二部图在用户-项目关系连接线上考虑了权重Wi 当评分大于3 时Wi=1,当评分小于3 时Wi=0.5,加入权重后的二部图模型具有较为明显的优势,但仍存在一个问题,加入权重的推荐系统降低了系统抵抗恶意攻击的能力,没有考虑用户的评分偏好问题,乐观用户偏向于打高分,消极用户偏向于打低分,传统加权二部图中假设三个用户对四个项目的评分值分别为(1,1,1,1),(2,2,2,2)和(1,2,2,3),计算得到的信任关系u1 与u2,u3 与u4 是相同的,这显然不符合不符合实际情况,根据信任特性u1 与u2 用户的信任度应该大于u1 与u3,用户针对此问题,本文提出了一种偏好的调整信任度,其公式为:基于以上,本文在第一种模型上提出一种新的偏好调整用户信任度度量方法构建第二种模型,增强信任公式表现如下:2.2 结合JMSD 相关系数推荐本文采用的是实验下性能更加优异的基于MSD 和JMSD 相似性的JMSD 系数,基于用户共同评分项的个数来度量的JMSD 系数中作为一种补充的全局信任信息结合二部图网络信任机制全面的挖掘了用户之间信任关系.均方偏差MSD 公式为:MSD 无法处理用户共同评分项过少这个问题,而Jaccard 相似度是基于用户共同评分项的个数来度量,其公式如下:JMSDuv 其公式如下:基于相似度与偏好调整信任度的研究,对于目标用户ui 的未知评分预测,给出综合相似系数Sim 如公式:(12)根据计算的相似系数Sim,对于用户未进行评分的项目,可采用如下预测公式预测:3 实验结果和分析3.1 实验数据集为检验算法的合理性,本文使用Grouplens 提供组供的Movielens 数据集和在线音乐系统Last.FM 提供的Last.FM 数据集对算法模型进行验证,Movielens 由美国Minnesota 大学计算机科学与工程学院的Grouplens项目组创办,本文选择其中的Ml100k 数据集,数据集包括了943 个用户的100 000 条评价数据,评分范围1-5,每个用户至少对20 部电影项目作出评价,分值越大喜好越大;Last.FM 数据集包含了1892 个用户对17 632 张音乐专辑的收听信息,实验中与基准对比算法一致将收听数量转化成收听评分用于对比.两个数据集均按照4:1 划分训练集和测试集,Movielens 数据集和Last.FM 数据集根据数据稀疏性定义计算分别为:3.2 度量标准本文采用推荐系统的度量标准是广泛应用于评价协同过滤推荐算法的平均绝对误差(MAE),以及召回率(Recall)定义如下:1)平均绝对误差和均方根误差通过训练集计算用户的预测评分和测试集的实际真实评分之间的偏差来度量算法的推荐准确性,所以MAE 和RMSE 越小,推荐的结果越准确.2)召回率(Recall)又叫查全率,主要指通过算法可以预测出来的评分数与所有待测分数之间的比值.其中m 表示通过算法模型得到的测试集预测评分数,n 表示测试集中待测评分数.3.3 算法推荐性能比较本文提出JMSDuv 相关系数与增强信任繁殖模型构建BTUCF 算法模型,在Python3.6 环境下,为了评价推荐算法的精度,对提出的模型算法进行试验验证,在相同的实验环境下,对不同数据集首先对算法模型进行敏感性分析,然后与三种基准算法进行实验对比和分析,参照的基准算法包括了主流的基于用户的协同过滤推荐TraCF 算法[15],基于信任模型的协同过滤推荐Tru_1CF 算法[16]以及一种改进的基于信任的改进算法Tru_2CF[17]. 第一种基准对比算法是基于用户推荐的经典推荐算法,第二种基准对比算法是经典的采用构建信任网络上的局部和全局信任构建信任矩阵引入信任模块和相似度模块不同权重推荐算法,第三种基准改进算法设置了通信信任,相似信任,和传递信任三个信任度构建信任矩阵.最后为了证实本文引入用户偏好的合理性,设置了JMSDuv 相关系数与信任繁殖模型构建算法模型,即没有融合用户偏好的算法模型(以下简称BTCF 算法模型)作为另外一组对比算法进行自身对照.3.3.1 敏感性分析敏感性实验主要分析在Movielens 数据集和Last.FM 数据集下参数λ 对本文提出的BTCF 和BYUCF 推荐精度MAE 的影响,实验结果分别如图3和图4.图3 Movielens 数据集下MAE 分析图4 Last.FM 数据集下MAE 分析从图3图4中中我们可以看到JMSD 系数和融合用户偏好的信任在推荐结果中的影响力是不一样的,Movielens 数据集下λ=0.8 时取得了最好的结果.Last.FM 数据集下中λ=0.8 时取得最优结果.基于二部图的自适应性繁殖信任推荐算法其评分预测结果主要来源于两个部分:评分相似系数和偏好信任系数,当λ=0.0 时表示在算法模型中融合用户偏好的信任对最后的推荐结果起唯一作用,当λ=1.0 时表示在算法模型中JMSD 系数对最后的推荐结果起唯一作用,相比于传统信任算法推荐,比较从λ=0.0 和λ=1.0的变化,采用用户之间的评分数据其推荐质量高于采用用户之间的融合用户偏好的信任,这表明在推荐模型中,信任必须来源于用户的评分,这符合信任的定义和特点,同时也表明了本文基于融合用户偏好的信任挖掘了用户之间的潜在信任联系,提高了推荐质量. 3.3.2 性能对比分析不同数据及下本文提出的BTUCF 算法模型与基于用户的协同过滤推荐TraCF 模型,基于信任模型的协同过滤推荐Tru_1CF 算法,一种改进的基于信任的改进算法Tru_2CF 以及本文提出的没有融合用户偏好BTCF 算法对比如下:表1 Movielens 数据集最佳点推荐精度比较指标 TraCF Tru_1CF Tru_2CF BTUCF MAE 0.805 0.778 0.774 0.768 Recall 0.112 0.190 0.250 0.797表1可知Movielens 数据集下BTUCF 算法模型有较大改进,对比试验结果,在参数K=7,λ=7 时(算法最佳点)具有更低的MAE 值和更高的召回率.表2 Last.FM 数据集最佳点推荐精度比较指标 TraCF Tru_1CF Tru_2CF BTUCF MAE 0.810 0.775 0.760 0.760 Recall 0.130 0.211 0.268 0.789由表2可知Last.FM 数据集下BTUCF 算法模型在MAE 指标表现上优于传统协同过滤算法和经典信任算法,但是与对比算法一种改进的基于信任的改进算法处于相同水平,召回率表现还是更加优异,MAE 在Movielens 数据下系统更加优秀是因为推荐系统采用的是在较小邻居域表现更好的JMSD 相似系数,Last.FM 数据集相比Movielens 数据集更加稀疏推荐系统的优势被相对稀释,进一步说明了本模型对数据稀疏性的反应程度.图5、图6给出了五种算法在不同数据集和不同邻居数量下的MAE 和Recall 值,我们可以直观的发现,结合JMSD 系数的推荐模型算法与结合皮尔逊以及改进的皮尔逊算法模型有较大差异,在K 较小的区间内结合JMSD 系数的推荐模型算法具有更好的表现.这也验证了文献[17]的结论和本文引入JMSD 系数的合理性,在算法结果对比下本文提出的BTUCF 算法模型在召回率的变现上更好,同时具由较低的平均绝对误差.图5 Movielens 数据集下的MAE 对比图图6 Movielens 数据集下的Recall 对比图同时对比BTCF 算法模型和TUCF 算法模型,前者因为算法模型引入了繁殖信任融合JMSD 系数,改进算法的同时也增加了数据噪声对推荐系统的影响,引入用户偏好的BTUCF 算法模型可以缓解噪声数据的影响,使得系统在K 较小值范围能更取得更低的MAE,但是作为引入用户偏好的模型也降低了系统的召回率.参考文献【相关文献】1 刘建国,周涛,汪秉宏.个性化推荐系统的研究进展.自然科学进展,2009,19(1):1-15.2 张富国,徐升华.基于信任的电子商务推荐多样性研究.情报学报,2010,29(2):350-355.3 Guo GB.Integrating trust and similarity to ameliorate the data sparsity and cold start for recommender systems.Proceedings of the 7th ACM Conference on Recommender Systems.Hong Kong,China.2013.451-454.4 Massa P,Avesani P.Trust-aware collaborative filtering for recommendersystems.Proceedings of OTM Confederated International Conferences on the Move to Meaningful Internet Systems.Agia Napa,Cyprus.2004.492-508.5 Massa P,Avesani P.Trust-aware bootstrapping of recommender systems.Proceedings of ECAI 2006 Workshop on Recommender Systems.Amsterdam.2006.29-33.6 Jamali M,Ester M.TrustWalker:A random walk model for combining trust-based and item-based recommendation.Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.Paris,France.2009.397-406.7 郭艳红,邓贵仕,雒春雨.基于信任因子的协同过滤推荐算法.计算机工程,2008,34(20):1-3.8 Ray S,Mahanti A.Improving prediction accuracy in trustaware recommender systems.Proceedings of the 2010 43rd Hawaii International Conference on System Sciences.Honolulu,HI,USA.2010.1-9.9 Moradi P,Ahmadian S.A reliability-based recommendation method to improve trust-aware recommender systems.Expert Systems with Applications,2015,42(21):7386-7398.10 Cao ZR,Tureli U,Yao YD.Deterministic multiuser carrierfrequency offset estimation for interleaved OFDMA uplink.IEEE Transactions on Communications,2004,52(9):1585-1594.11 Zhou T,Ren J,Medo M,et al.Bipartite network projection and personal recommendation.Physical Review E,2007,76(4):046115.12 王茜,段双艳.一种改进的基于二部图网络结构的推荐算法.计算机应用研究,2013,30(3):771-774.13 吴应良,姚怀栋,李成安.一种引入间接信任关系的改进协同过滤推荐算法.现代图书情报技术,2015,31(9):38-45.14 Bobadilla J,Serradilla F,Bernal J.A new collaborative filtering metric that improves the behavior of recommender systems.Knowledge-Based Systems,2010,23(6):520-528.15 Goldberg D,Nichols D,Oki BM,et ing collaborative filtering to weave an information munications of the ACM,1992,35(12):61-70.16 Massa P,Avesani P.Trust-aware recommender systems.Proceedings of 2007 ACMConference on Recommender Systems.Minneapolis,MN,USA.2007.17-24.17 郑孝遥,鲍煜,孙忠宝,等.一种基于信任的协同过滤推荐模型.计算机工程与应用,2016,52(5):50-54,56.。
基于增加相似度系数的加权二部图推荐算法
基于增加相似度系数的加权二部图推荐算法
李镇东;罗琦;施力力
【期刊名称】《计算机科学》
【年(卷),期】2016(043)007
【摘要】基于二部图的推荐算法是个性化推荐领域的一个研究热点,其中,如何科学地利用用户的评分资源,在评分数据不全的情况下对目标用户进行准确高效的推荐是研究难点,也因此受到众多学者的关注.因此,提出了一种以单调饱和函数为权,利用目标用户和其他项目共同评分个数相对用户总数均值的正切值作为传统相似度系数的推荐算法;同时,对调整系数后的相似度进行降序排列,利用前K个最近邻居集对目标用户进行推荐.实验结果表明,改进后的算法提高了推荐的准确性,降低了复杂度.【总页数】6页(P259-264)
【作者】李镇东;罗琦;施力力
【作者单位】南京信息工程大学信息与控制学院江苏省气象能源利用与控制工程技术研究中心南京210044;南京信息工程大学信息与控制学院江苏省大气环境与装备技术协同创新中心南京210044
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于加权二部图匹配的中文段落相似度计算 [J], 张绍阳;曹家波;王子凡;曲卫东
2.基于加权二部图的个性化推荐算法 [J], 张新猛;蒋盛益
3.基于随机森林修正的加权二部图推荐算法 [J], 李玲;李晋宏
4.基于改进加权二部图和用户信任度的协同过滤推荐算法 [J], 邓小燕;张晓彬
5.基于加权二部图的Slope One推荐算法 [J], 王冉;徐怡;胡善忠;何明慧
因版权原因,仅展示原文概要,查看原文内容请购买。
基于改进二部图与专家信任的混合推荐算法
基于改进二部图与专家信任的混合推荐算法黄熠姿;杨金鑫;孙维【期刊名称】《价值工程》【年(卷),期】2017(036)019【摘要】针对传统协同过滤算法出现的稀疏数据、用户冷启动等问题以及复杂网络结构的广泛应用,本文提出结合改进的二部图与改进的专家信任算法来提高推荐准确度.基于普通二部图算法,将用户对项目的评分作为节点之间的分配资源权重,不仅关注用户与项目之间的联系,同时体现用户对项目的喜好程度;其次,本文根据用户的评论数和与该用户对项目评分相同的数目来判断该用户的专家信任度,改进传统系统过滤算法.为了提高推荐准确度,改进缺点,我们将两者算法进行加权混合,加权因子根据实验中最小MAE值对应的权值来确定,形成混合推荐算法.最后针对基于用户的协同过滤、传统二部图以及本文提出的混合算法计算MAE值和平均Hamming距离,对比分析本文算法的推荐准确度与多样性,实验表明本文方法推荐效果较好,准确率高,个性化强,有研究和应用价值.%In view of the limitations like data sparseness, new users with little record of traditional collaborative filtering recommendation algorithm and the wide application of complex network structure, this paper argues to coalesce the recommendation algorithm based on expert trust and the modified bipartite graph recommendation algorithm. First of all, we proposed an improved recommendation algorithm based on weighted networks, not only pay attention to the connection between users and projects, but also reflect the users' preferences in projects. Secondly, the degree of expert trust isdetermined by user comments and project reviews. And in order to improve the accuracy of recommendation, we coalesce this two kinds of algorithm and give them weight. Finally, we determine the weights and calculate MAE and the average Hamming distance of the traditional collaborative filtering, the traditional bipartite graph and the hybrid recommendation algorithm through experiments, which shows that the hybrid recommendation algorithm has higher accuracy, stronger individuation, and more research and application value.【总页数】5页(P160-164)【作者】黄熠姿;杨金鑫;孙维【作者单位】东北大学工商管理学院,沈阳110169;东北大学工商管理学院,沈阳110169;东北大学工商管理学院,沈阳110169【正文语种】中文【中图分类】TP391.3【相关文献】1.改进的基于二部图网络结构的推荐算法 [J], 关雲菲2.融合信任关系和用户项目二部图的推荐算法 [J], 陈平华;杨凯3.一种改进的基于二部图网络结构的推荐算法 [J], 王茜;段双艳4.基于改进加权二部图和用户信任度的协同过滤推荐算法 [J], 邓小燕;张晓彬5.基于专家信任的协同过滤推荐算法改进研究 [J], 刘国丽; 白晓霞; 廉孟杰; 张斌因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3 期
张新猛等: 基于加权二部图的个性化推荐算法 , {0 1, xi yl E 其他
655
殊的网络, 它包含两类节点, 仅允许不同类的节点间相连, 许 [12 ] 多自然 界 系 统 可 被 描 述 为 二 部 图 : 如 性 别 关 系 二 部 图
[13 - 14 ] [15 ] 、 新陈代谢网化学物质与化学反应二部图 。 “用户 ” , 二部图包含两类节点: 一类节点是活动、 项目的
内容推荐的不足, 利用用户已有的信息计算用户之间的相似 性, 通过邻居用户对项目的评价来预测目标用户对项目的偏 好程度。CF 算法不受数据格式影响, 能够推荐如图片、 音乐 能挖掘用户新的兴趣点, 但也同时存 等难以处理的复杂数据, 在多个问题, 最典型是冷问题和稀疏问题 。 基于内容推荐与协同过滤推荐均有各自的局限性, 在实
用户行为建立项目之间的关联关系, 通过这种关联关系向用 户推荐其他项目。 该方法不需要领域知识能够发现新兴趣 点, 但规则抽取困难, 时间复杂度高, 个性化程度较低。 基于网络结构的推荐算法
[8 ]
根据用户喜爱的项目信息, 找出
不考虑用户和项目的内容
相似度最高的项目推荐给用户 。基于内容的推荐系统分别对 用户和项目建立配置文件, 分析已经购买 ( 或浏览) 过的项 目, 建立或更新用户的配置文件系统, 比较用户与项目配置文 并直接向用户推荐与其配置文件最相似的项目 。 件的相似度, 基于内容推荐只考虑用户的兴趣偏好, 推荐结果直观容易理 解, 但是对于机器难以理解的数据格式, 如音乐、 图像等往往 无法处理, 不能为tract: In NetworkBased Inference ( NBI) algorithm, the weight of edge between user and item is ignored; therefore, the items with high rating have not got the priority to be recommended. In order to solve the problem, a Weigted NetworkBased Inference ( WNBI) algorithm was proposed. The edge between user and item was weighted with item's rating by proposed algorithm, the resources were allocated according to the ratio of the edge's weight to total edges' weight of the node, so that high rating items could be recommended with priority. The experimental results on data set MovieLens demonstrate that the number of hit high rating items by WNBI increases obviously in contrast with NBI, especially when the length of recommendation list is shorter than 20, the numbers of hit items and hit high rating items both increase. Key words: bipartite network; weighted bipartite network; personalized recommendation
[3 - 4 ] 协同过滤( Collaborative Filtering,CF) 推荐 针对基于
特征, 而仅仅把它们看成抽象的节点, 所有算法利用的信息都 Wand 等[9] 利用社会网络 藏在用户和项目的选择关系之中, 分析方法推荐在线拍卖系统中可信赖的拍卖者 。 Zhou 等[10] 提出网络推断( NetworkBased Inference,NBI ) 算法, 利用二部图进行资源分配, 取得了比 CF 算法更好的效 果。本文 引 入 二 部 图 边 权 提 出 加 权 网 络 推 断 ( Weigted NetworkBased Inference,WNBI ) 算法, 以项目的评分值作为 二部图的边权, 按边权比例计算资源分配矩阵, 在没有增加时 间和空间开销的情况下, 提高了推荐精度。
0
引言
个性化推荐研究于 20 世纪 90 年代被作为一个独立的概
际应用中, 通常将多种推荐方法组合起来, 最常见的是将基于 用中比单独某一种推荐方式具有更高的准确率 荐必然增加时间和空间的开销 。 基于关联规则推荐
[6 - 7 ]
内容过滤推荐和协同过滤推荐进行组合, 混合推荐在实际应 [5 ] , 但混合推 关注用户行为的关联模式, 通过
m
{0x, y,
i l
xi yl E 其他
( 4)
u2 , …, 推荐系统包括用户和项目, 用户表示为 U = { u1 , um } , o2 , …, on } , 项目表示为 O = { o1 , 用户对项目的评分形成 一个 n × m 评分邻接矩阵 A = ( a il ) n ×m , 若用户 l 对项目 i 进行 a il 的值即 了评分, 若评分高于某值 r, 表示用户推荐该项目, 为评分值( 或进行适当的预处理) ; 否则 a il = 0 。 根据式( 3 ) 计 算项目之间资源分配矩阵 W, 用户 u l 没有选择项目 o i , 那么对 由于在利用 用户 u l 推荐项目 o i 的预测评分可用式( 5 ) 表示。 二部图进行资源分配过程中, 考虑到用户与项目间边的权重, 所以我们称这种算法为加权网络推断( WNBI) 算法。
图2
m
基于加权二部图的资源分配
wi j =
∑ k( x ) k( y )
l =1 j l
a il a jl
( 3)
图1
基于二部图的资源分配过程
其中: k( x j ) 表示项目 x j 连接所有用户边权之和; k( y l ) 表示用 户 y l 连接所有项目边权之和; a il 为 n × m 的加权邻接矩阵 A = ( a il ) n ×m 第 i 行第 l 列的值, 见式( 4 ) ; x i y l 表示二部图中项目 x i 与用户 y l 间 的 边 权。项 目 间 资 源 分 配 矩 阵 表 示 为 W = ( w i j ) n ×n 。 a il =
念提出来, 其目的是根据用户的喜好为用户推荐感兴趣的商 品或信息, 推荐算法的关键是如何提高推荐精度和效率, 对此 。 研究者提出了多种改进策略和算法 目前, 个性化推荐方法 主要有基于规则的推荐 、 协同过滤推荐、 基于内容的推荐、 混 合推荐系统以及基于网络的推荐等 。 基于内容推荐算法
[1 - 2 ]
3 个项目节点具有资源权重分别为 x、 y、 z。 在图 1 ( a) 中, 资源分配过程分两步: 第一步是从项目到用户, 将项目的资源 平均分配给每个用户, 分配结果见图 1 ( b) ; 第二步是从用户 返回到项目, 用户将所分得资源平均分配给所参与的项目, 结 果见图 1 ( c) 。 考虑一个由 n 个项目 m 个用户所构成的二部图( 例如用 户 图书, 观众 电影, 浏览者 网页等) , 二部图表示为 G( X, Y, E) , E 表示二部图的边, 即连接用户和项目的边, 项目节点 X 表示为 x1 , x2 , …, xn , y2 , …, ym 。 用户节点 Y 表示为 y1 , 在文 10]中, 献[ 最后任意项目 j 分配给项目 i 的资源权重计算公式 见式( 1 ) 。 wi j = 1 k( x j )
a il = 1. 2
( 2)
基于加权二部图推荐算法 10]中, 在文献[ 二部图是无权的, 项目之间资源分配计
例如科研人员、 演员等; 另一类节点是活动、 项目, 例如科研项 目、 论文、 电影等。二部图中同一类节点之间的合作相互关系 是研究领域的一个热点, 比如演员之间在演出的合作关系 、 科 研人员之间的写作论文的合作关系等 。 1. 1 基于二部图的推荐算法 10]提出一种基于二部图的推荐算法, 文献[ 将二部图向
同一类节点投影, 得到单模式图的新方法, 讨论在项目节点类 假设每个项目均有一定的资源, 定义 中节点之间的边权计算 。 边权 w i j 表示项目 j 通过二部图边分配给项目 i 的资源, 通常 w i j 和 w ji 是不相等的。 “观众 电影 ”的二部图中, 比如在一个 有两部电影 i 和 j, 如果一个观众已经观看了电影 j, 那么两部 “用户 ” 电影之间的边权 w i j 表示电影 j 推荐电影 i 的强度。 在 “项目”节点之间的边认为是无权的, 与 在资源分配过程中, 每个项目将自己所有的资源通过二部图的边平均分配给该项 每个用户又将自己所有分到的资源再 目的每个用户; 反过来, 次通过二部图的边平均分配给所参与的项目 。 图 1 为项目通 过二部图的边进行资源分配的过程 。
Personalized recommendation algorithm based on weighted bipartite network
ZHANG Xinmeng , JIANG Shengyi
( Cisco School of Informatics, Guangdong University of Foreign Studies, Guangzhou Guangdong 510006 ,China)
算过程中, 将项目资源平均分配给用户, 同时用户将分到的资 但在实际应用中, 用户与项目之间边权 源再平均分配给项目。 具有重要的意义, 比如在科研项目合作中, 资金按项目的重要 程度进行分配。 考虑用户 项目之间边的权重, 如图 2 所示, 用户和项目 4, 5 标注, 之间的边权分别用 3 , 项目将资源按照项目 用户之 间的边权与该项目边权之和的比分配给用户, 第二步按照同 样的方式按照用户 项目边权与该用户边权之和的比例将资 图 2 为加权资源分配过程, 任意项目 j 分配给 源返回给项目, 项目 i 的资源是通过所有与项目 i 和 j 都有边的用户进行的, 权重计算公式表示为式( 3 ) 。