基于加权二部图的个性化推荐算法_张新猛
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
算过程中, 将项目资源平均分配给用户, 同时用户将分到的资 但在实际应用中, 用户与项目之间边权 源再平均分配给项目。 具有重要的意义, 比如在科研项目合作中, 资金按项目的重要 程度进行分配。 考虑用户 项目之间边的权重, 如图 2 所示, 用户和项目 4, 5 标注, 之间的边权分别用 3 , 项目将资源按照项目 用户之 间的边权与该项目边权之和的比分配给用户, 第二步按照同 样的方式按照用户 项目边权与该用户边权之和的比例将资 图 2 为加权资源分配过程, 任意项目 j 分配给 源返回给项目, 项目 i 的资源是通过所有与项目 i 和 j 都有边的用户进行的, 权重计算公式表示为式( 3 ) 。
用户行为建立来自百度文库目之间的关联关系, 通过这种关联关系向用 户推荐其他项目。 该方法不需要领域知识能够发现新兴趣 点, 但规则抽取困难, 时间复杂度高, 个性化程度较低。 基于网络结构的推荐算法
[8 ]
根据用户喜爱的项目信息, 找出
不考虑用户和项目的内容
相似度最高的项目推荐给用户 。基于内容的推荐系统分别对 用户和项目建立配置文件, 分析已经购买 ( 或浏览) 过的项 目, 建立或更新用户的配置文件系统, 比较用户与项目配置文 并直接向用户推荐与其配置文件最相似的项目 。 件的相似度, 基于内容推荐只考虑用户的兴趣偏好, 推荐结果直观容易理 解, 但是对于机器难以理解的数据格式, 如音乐、 图像等往往 无法处理, 不能为用户发现新的兴趣点 。
*
Abstract: In NetworkBased Inference ( NBI) algorithm, the weight of edge between user and item is ignored; therefore, the items with high rating have not got the priority to be recommended. In order to solve the problem, a Weigted NetworkBased Inference ( WNBI) algorithm was proposed. The edge between user and item was weighted with item's rating by proposed algorithm, the resources were allocated according to the ratio of the edge's weight to total edges' weight of the node, so that high rating items could be recommended with priority. The experimental results on data set MovieLens demonstrate that the number of hit high rating items by WNBI increases obviously in contrast with NBI, especially when the length of recommendation list is shorter than 20, the numbers of hit items and hit high rating items both increase. Key words: bipartite network; weighted bipartite network; personalized recommendation
同一类节点投影, 得到单模式图的新方法, 讨论在项目节点类 假设每个项目均有一定的资源, 定义 中节点之间的边权计算 。 边权 w i j 表示项目 j 通过二部图边分配给项目 i 的资源, 通常 w i j 和 w ji 是不相等的。 “观众 电影 ”的二部图中, 比如在一个 有两部电影 i 和 j, 如果一个观众已经观看了电影 j, 那么两部 “用户 ” 电影之间的边权 w i j 表示电影 j 推荐电影 i 的强度。 在 “项目”节点之间的边认为是无权的, 与 在资源分配过程中, 每个项目将自己所有的资源通过二部图的边平均分配给该项 每个用户又将自己所有分到的资源再 目的每个用户; 反过来, 次通过二部图的边平均分配给所参与的项目 。 图 1 为项目通 过二部图的边进行资源分配的过程 。
a il = 1. 2
( 2)
基于加权二部图推荐算法 10]中, 在文献[ 二部图是无权的, 项目之间资源分配计
例如科研人员、 演员等; 另一类节点是活动、 项目, 例如科研项 目、 论文、 电影等。二部图中同一类节点之间的合作相互关系 是研究领域的一个热点, 比如演员之间在演出的合作关系 、 科 研人员之间的写作论文的合作关系等 。 1. 1 基于二部图的推荐算法 10]提出一种基于二部图的推荐算法, 文献[ 将二部图向
3 个项目节点具有资源权重分别为 x、 y、 z。 在图 1 ( a) 中, 资源分配过程分两步: 第一步是从项目到用户, 将项目的资源 平均分配给每个用户, 分配结果见图 1 ( b) ; 第二步是从用户 返回到项目, 用户将所分得资源平均分配给所参与的项目, 结 果见图 1 ( c) 。 考虑一个由 n 个项目 m 个用户所构成的二部图( 例如用 户 图书, 观众 电影, 浏览者 网页等) , 二部图表示为 G( X, Y, E) , E 表示二部图的边, 即连接用户和项目的边, 项目节点 X 表示为 x1 , x2 , …, xn , y2 , …, ym 。 用户节点 Y 表示为 y1 , 在文 10]中, 献[ 最后任意项目 j 分配给项目 i 的资源权重计算公式 见式( 1 ) 。 wi j = 1 k( x j )
Journal of Computer Applications 计算机应用,2012,32( 3) : 654 - 657,678 文章编号: 1001 - 9081 ( 2012 ) 03 - 0654 - 04
ISSN 1001-9081 CODEN JYIIDU
2012-03-01 http: / / www. joca. cn doi: 10. 3724 / SP. J. 1087. 2012. 00654
基于加权二部图的个性化推荐算法
张新猛 ,蒋盛益
( 广东外语外贸大学 思科信息学院, 广州 510006) ( * 通信作者电子邮箱 javad0902@ 163. com)
*
要: 针对网络推断( NBI) 算法的二部图实现算法忽略二部图权重而导致实际评分值高的项目没有得到优先 提出加权网络推断( WNBI) 算法的加权二部图实现算法 。 该算法以项目的评分作为二部图中用户与 推荐这一问题, 摘 项目的边权, 按照用户 项目间边权占该节点权重和的比例分配资源, 从而实现评分值高的项目得到优先推荐 。 通过 MovieLens NBI WNBI 在数据集 上的实验表明, 相比 算法, 算法命中高评分值项目数目增多, 同时在推荐列表长度小于 20 的情况下, 命中项目的数量和命中高评分项目数量均有明显增加 。 关键词: 二部图; 加权二部图; 个性化推荐 中图分类号: TP181 ; TP301. 6 文献标志码: A
1
二部图与推荐算法
近年来, 复杂网络得到广泛关注
[11 ]
, 越来越多关于网络
的研究成果被发掘并应用, 为人们深刻认识现实中的复杂系 统并对之进行控制或应用提供了有效帮助 。二部图是一种特
收稿日期: 2011-09-19 ; 修回日期: 2011-11-20 。 基金项目: 国家自然科学基金资助项目( 61070061 ) 。 CCF 会 作者简介: 张新猛( 1974 - ) , 男, 山东东明人, 讲师, 硕士, 主要研究方向: 数据挖掘; 蒋盛益( 1963 - ) , 男, 湖南隆回人, 教授, 博士, 员, 主要研究方向: 数据挖掘、 网络安全。
念提出来, 其目的是根据用户的喜好为用户推荐感兴趣的商 品或信息, 推荐算法的关键是如何提高推荐精度和效率, 对此 。 研究者提出了多种改进策略和算法 目前, 个性化推荐方法 主要有基于规则的推荐 、 协同过滤推荐、 基于内容的推荐、 混 合推荐系统以及基于网络的推荐等 。 基于内容推荐算法
[1 - 2 ]
m
{0x, y,
i l
xi yl E 其他
( 4)
u2 , …, 推荐系统包括用户和项目, 用户表示为 U = { u1 , um } , o2 , …, on } , 项目表示为 O = { o1 , 用户对项目的评分形成 一个 n × m 评分邻接矩阵 A = ( a il ) n ×m , 若用户 l 对项目 i 进行 a il 的值即 了评分, 若评分高于某值 r, 表示用户推荐该项目, 为评分值( 或进行适当的预处理) ; 否则 a il = 0 。 根据式( 3 ) 计 算项目之间资源分配矩阵 W, 用户 u l 没有选择项目 o i , 那么对 由于在利用 用户 u l 推荐项目 o i 的预测评分可用式( 5 ) 表示。 二部图进行资源分配过程中, 考虑到用户与项目间边的权重, 所以我们称这种算法为加权网络推断( WNBI) 算法。
第3 期
张新猛等: 基于加权二部图的个性化推荐算法 , {0 1, xi yl E 其他
655
殊的网络, 它包含两类节点, 仅允许不同类的节点间相连, 许 [12 ] 多自然 界 系 统 可 被 描 述 为 二 部 图 : 如 性 别 关 系 二 部 图
[13 - 14 ] [15 ] 、 新陈代谢网化学物质与化学反应二部图 。 “用户 ” , 二部图包含两类节点: 一类节点是活动、 项目的
内容推荐的不足, 利用用户已有的信息计算用户之间的相似 性, 通过邻居用户对项目的评价来预测目标用户对项目的偏 好程度。CF 算法不受数据格式影响, 能够推荐如图片、 音乐 能挖掘用户新的兴趣点, 但也同时存 等难以处理的复杂数据, 在多个问题, 最典型是冷问题和稀疏问题 。 基于内容推荐与协同过滤推荐均有各自的局限性, 在实
[3 - 4 ] 协同过滤( Collaborative Filtering,CF) 推荐 针对基于
特征, 而仅仅把它们看成抽象的节点, 所有算法利用的信息都 Wand 等[9] 利用社会网络 藏在用户和项目的选择关系之中, 分析方法推荐在线拍卖系统中可信赖的拍卖者 。 Zhou 等[10] 提出网络推断( NetworkBased Inference,NBI ) 算法, 利用二部图进行资源分配, 取得了比 CF 算法更好的效 果。本文 引 入 二 部 图 边 权 提 出 加 权 网 络 推 断 ( Weigted NetworkBased Inference,WNBI ) 算法, 以项目的评分值作为 二部图的边权, 按边权比例计算资源分配矩阵, 在没有增加时 间和空间开销的情况下, 提高了推荐精度。
Personalized recommendation algorithm based on weighted bipartite network
ZHANG Xinmeng , JIANG Shengyi
( Cisco School of Informatics, Guangdong University of Foreign Studies, Guangzhou Guangdong 510006 ,China)
图2
m
基于加权二部图的资源分配
wi j =
∑ k( x ) k( y )
l =1 j l
a il a jl
( 3)
图1
基于二部图的资源分配过程
其中: k( x j ) 表示项目 x j 连接所有用户边权之和; k( y l ) 表示用 户 y l 连接所有项目边权之和; a il 为 n × m 的加权邻接矩阵 A = ( a il ) n ×m 第 i 行第 l 列的值, 见式( 4 ) ; x i y l 表示二部图中项目 x i 与用户 y l 间 的 边 权。项 目 间 资 源 分 配 矩 阵 表 示 为 W = ( w i j ) n ×n 。 a il =
0
引言
个性化推荐研究于 20 世纪 90 年代被作为一个独立的概
际应用中, 通常将多种推荐方法组合起来, 最常见的是将基于 用中比单独某一种推荐方式具有更高的准确率 荐必然增加时间和空间的开销 。 基于关联规则推荐
[6 - 7 ]
内容过滤推荐和协同过滤推荐进行组合, 混合推荐在实际应 [5 ] , 但混合推 关注用户行为的关联模式, 通过