基于随机游走算法的社会化标签的用户推荐_王海雷
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[ ] 1 2 - 。 目前的推荐系统涉及 到 个 主 要 的 方 面 , 分 别 是 资 t e m)
3] 。 几乎所有个性化推荐系统中必不可少的部分 [
社会化标签 系 统 在 电 子 商 务 系 统 、 知 识 管 理 系 统 以 及 社交网络中都有 着 重 要 的 经 济 价 值 和 广 泛 的 应 用 前 景 。 在 电子商务方 面 , 最 著 名 的 电 子 商 务 网 站 , 如 亚 马 逊 网 络 书 、淘 宝 网 ( 、当当网上书 城 店 ( Am a z o n . c o m) t a o b a o . c o m) 等等都具有资源 推 荐 功 能 , 顾 客 选 择 一 本 自 己 感 兴 趣 的 书 籍 , 马上会在底下 看 到 系 统 推 荐 的 喜 欢 此 商 品 的 顾 客 还 喜 欢的商品 , 此 项 功 能 是 首 先 在 亚 马 逊 网 站 上 面 提 出 来 的 , 此举也成为 被 用 户 津 津 乐 道 一 项 服 务 。 此 后 , 还 可 以 根 据 某顾客以往的购买 行 为 以 及 根 据 具 有 相 似 购 买 行 为 的 顾 客 ,也就 群的购买行为去推荐这个顾客其 “ 可能喜欢的品项” 是借由社群的喜好提供个人化的 资 讯 、 商 品 等 的 推 荐 服 务 ,
摘 要 : 利用 来 自 D e l i c i o u s的 数 据 集 , 结合 内 容 相 似度 的 挖掘 和 语 义关系 处 理 , 对 社 会 化 标签 系统 的 用 户 推 荐 的 算 法 进 行 了 研究 。 具 体工作 为 : 利用 标签 和 书 签 的 语 义关系 , 定义 用户 的 内 容 信 息 , 从 而 计 算 内 容 相 似 度 ; 建 立 内 容 相 似 度 与 社 会 网络 的 用户 链 接 关系 , 通过 可 重 启 的 随 机 游走 算法 ( RWR) 结合 来 达 成 理 想 的 效 果 。 实验 评 测 显 示 , 无 论 是 精 确 度 还 是 召 回 率 , 该 算法的 效 果都要明 显 优 于 b a s e l i n e的算法 。 关键词 : 社 会 化 标签 ; 用户 ; 资 源 ; 标签 ; 推 荐 )0 中图法分类号 :T P 3 9 3 文献标识号 :A 文章编号 : 1 0 0 0 7 0 2 4( 2 0 1 3 7 2 3 8 8 0 4 - - -
第3 4卷 第7期
王 海 雷 , 俞 学 宁 : 基于 随 机 游走 算法的 社 会 化 标签 的 用户 推 荐
·2 3 8 9·
其后成为电子商务中很重要的一环 。 、f 、G 在社交 网 站 方 面 , 诸 如 d e l i c i o u s l i c k r r o u l e n等 p 用户给相应的内 容 打 标 签 的 网 站 的 兴 起 , 由 于 要 标 记 的 资 源内容过于繁杂 或 者 内 容 不 能 直 接 获 取 文 本 , 因 此 出 现 了 用户给资源标记 标 签 的 系 统 , 给 予 用 户 所 打 标 签 的 推 荐 系 统也应运而 生 。 其 作 用 是 依 据 了 用 户 的 个 人 喜 好 , 让 用 户 迅速找到相应的 词 语 来 描 述 , 另 外 也 可 以 侧 面 找 到 最 贴 近 资源的描述 标 签 , 这 一 过 程 借 用 了 人 的 主 观 能 动 性 , 增 加 了系统体现 出 来 的 社 会 文 化 。 在 社 交 网 络 中 , 朋 友 之 间 可 以相互 发 布 感 兴 趣 的 话 题 、 最 近 的 照 片 、 有 意 思 的 视 频 、 交流思想 、 传 播 新 闻 …… 所 以 在 这 个 社 会 网 络 中 , 人 人 都 是一个有潜力的 传 播 者 和 接 收 者 , 正 因 为 这 个 平 台 的 无 所 不包的特性在于其充分利用了社会 网 络 中 草 根 人 群 的 特 点 , 朋友和朋友之间的 信 任 往 往 比 远 离 一 般 群 众 的 新 闻 媒 体 的 影响来得大 , 来 得 广 。 而 作 为 社 会 网 络 中 最 基 础 的 用 户 构 成社交网络中最 核 心 的 部 分 , 对 于 一 个 在 社 会 网 络 中 朋 友 较少的用户 来 说 , 所 能 接 触 到 的 信 息 是 有 限 的 , 所 以 扩 展 有 朋友圈便是非常重要 的 需 求 , 因 此 社 交 网 站 一 般 通 过 “ 可能认识的人 ” 一栏向 用 户 推 荐 朋 友 。 而 这 个 推 荐 系 统 往 往成为用户找到朋友的重要渠道 。
源推荐 、 标签 推 荐 、 用 户 推 荐 。 这 个 3 个 推 荐 方 向 是 现 在
; 修订日期 :2 收稿日期 :2 0 1 2 1 1 1 5 0 1 3 0 2 0 5 - - - - ) ; 教育部科技发展中心网络时代的科技论文快速共享专项研究资助课题基金项目 ( ) 基金项目 : 自然科学基金项目 ( 6 1 2 7 2 3 4 3 2 0 1 1 1 1 0 , 男 , 河北廊坊人 , 博士后 , 研究方向为语义网 、 文本挖 掘 和 知 识 管 理 ; 俞 学 宁 ( ,男,北 京 人,本 作者简介 : 王海雷 ( 1 9 8 1- ) 1 9 5 6- ) : 科 , 高级经济师 , 研究方向为数字wk.baidu.com育 、 数据挖掘和知识管理 。E-m a i l h a i l e i 6 0 8@1 2 6 . c o m
:B , A b s t r a c t c o m b i n i n t h e s i m i l a r i t o f c o n t e n t s a n d t h e s e m a n t i c r e l a t i o n t h e a l o r i t h m s o f u s e r r e c o mm e n d a t i o n i n s o c i a l t a - y g y g g ,w i n s s t e m a r e s t u d i e d b u s i n t h e d a t a s e t d e r i v e d f r o m d e l i c i o u s h i c h i s t h e w o r l d’ s l e a d i n s o c i a l b o o k m a r k i n s e r v i c e . g g y y g g g , T h i s w o r k m a i n l i n c l u d e s t w o a s e c t s . F i r s t l t h e s i m i l a r i t o f c o n t e n t s i s c a l c u l a t e d b u s i n t h e s e m a n t i c r e l a t i o n b e t w e e n t h e y p y y y g ; , t a s a n d b o o k m a r k s S e c o n d l r a n d o m w a l k w i t h r e s t a r t s( RWR) a l o r i t h m i s u s e d t o c o m b i n e t h e s i m i l a r i t o f c o n t e n t s w i t h g y g y l i n k s i n s o c i a l n e t w o r k s t o a c h i e v e t h e d e s i r e d e f f e c t . E x e r i m e n t s c o n d u c t e d o n r e a l d a t a s e t s f r o m d e l i c i o u s d e m o n s t r a t e t h a t u s e r p t h i s m e t h o d o u t e r f o r m s o t h e r t e m o r a l m o d e l s a n d s t a t e o f t h e a r t m e t h o d s b o t h f r o m a n d r e c a l l . r e d i c t i o n r e c i s i o n - - - p p p p : ; ; ; ; K e w o r d s s o c i a l t a i n u s e r r e s o u r c e t a r e c o mm e n d a t i o n g g g g y
( , , ; , 1. G u a n h u a S c h o o l o f M a n a e m e n t P e k i n U n i v e r s i t B e i i n 1 0 0 8 7 1, C h i n a 2. P o s t d o c t o r a l W o r k s t a t i o n g g g y j g , ; C h i n a M i n s h e n B a n k i n C o r o r a t i o n L i m i t e d B e i i n 1 0 0 0 3 1, C h i n a 3.S c i e n t i f i c R e s e a r c h T r a i n i n g g p j g g , , ) C h i n a M i n s h e n B a n k i n C o r o r a t i o n L i m i t e d B e i i n 1 0 0 0 8 4, C h i n a A c a d e m g g p j g y
基于随机游走算法的社会化标签的用户推荐
2 ,俞 学 宁3 王 海 雷1,
( 1. 北京 大学 光 华 管 理 学 院 , 北京 1 0 0 8 7 1;2. 中 国 民 生 银 行 博 士 后 工作 站 , 北京 1 0 0 0 3 1; ) 3. 中 国 民 生 银 行 科研 培 训 学 院 , 北京 1 0 0 0 8 4
0 引 言
社会化标签 系 统 的 出 现 为 用 户 提 供 了 便 利 , 但 也 提 出 了新的问题 : 由全 体 用 户 产 生 的 数 据 太 多 太 乱 且 一 直 呈 指 数式爆炸性增长 , 一 个 用 户 往 往 难 以 轻 易 找 到 与 自 己 相 似 的其他 用 户 或 者 自 己 喜 欢 的 资 源 , 对 资 源 的 概 括 性 描 述 — — — 标签也需要费力思考 。 在这种背景下 , 推 荐 系 统 ( r e c - o mm e n d e r s s t e m) 应运而生 , 它可 以 根 据 用 户 的 特 征 , 比 y 如兴趣爱好 , 推荐 满 足 用 户 要 求 的 对 象 并 可 以 实 时 更 新 推 荐,也称 个 性 化 推 荐 系 统 ( r e c o mm e n d e r s s e r s o n a l i z e d - p y
2 0 1 3年7月 第3 4卷 第7期
计算机工程与设计
C OMP UT E R E NG I N E E R I NG AN D D E S I GN
J u l 2 0 1 3 y V o l . 3 4 N o . 7
U s e r r e c o mm e n d a t i o n i n s o c i a l t a i n b a s e d o n r a n d o m w a l k a l o r i t h m g g g g
12 3 WANG H a i l e i YU X u e n i n - , - g ,
3] 。 几乎所有个性化推荐系统中必不可少的部分 [
社会化标签 系 统 在 电 子 商 务 系 统 、 知 识 管 理 系 统 以 及 社交网络中都有 着 重 要 的 经 济 价 值 和 广 泛 的 应 用 前 景 。 在 电子商务方 面 , 最 著 名 的 电 子 商 务 网 站 , 如 亚 马 逊 网 络 书 、淘 宝 网 ( 、当当网上书 城 店 ( Am a z o n . c o m) t a o b a o . c o m) 等等都具有资源 推 荐 功 能 , 顾 客 选 择 一 本 自 己 感 兴 趣 的 书 籍 , 马上会在底下 看 到 系 统 推 荐 的 喜 欢 此 商 品 的 顾 客 还 喜 欢的商品 , 此 项 功 能 是 首 先 在 亚 马 逊 网 站 上 面 提 出 来 的 , 此举也成为 被 用 户 津 津 乐 道 一 项 服 务 。 此 后 , 还 可 以 根 据 某顾客以往的购买 行 为 以 及 根 据 具 有 相 似 购 买 行 为 的 顾 客 ,也就 群的购买行为去推荐这个顾客其 “ 可能喜欢的品项” 是借由社群的喜好提供个人化的 资 讯 、 商 品 等 的 推 荐 服 务 ,
摘 要 : 利用 来 自 D e l i c i o u s的 数 据 集 , 结合 内 容 相 似度 的 挖掘 和 语 义关系 处 理 , 对 社 会 化 标签 系统 的 用 户 推 荐 的 算 法 进 行 了 研究 。 具 体工作 为 : 利用 标签 和 书 签 的 语 义关系 , 定义 用户 的 内 容 信 息 , 从 而 计 算 内 容 相 似 度 ; 建 立 内 容 相 似 度 与 社 会 网络 的 用户 链 接 关系 , 通过 可 重 启 的 随 机 游走 算法 ( RWR) 结合 来 达 成 理 想 的 效 果 。 实验 评 测 显 示 , 无 论 是 精 确 度 还 是 召 回 率 , 该 算法的 效 果都要明 显 优 于 b a s e l i n e的算法 。 关键词 : 社 会 化 标签 ; 用户 ; 资 源 ; 标签 ; 推 荐 )0 中图法分类号 :T P 3 9 3 文献标识号 :A 文章编号 : 1 0 0 0 7 0 2 4( 2 0 1 3 7 2 3 8 8 0 4 - - -
第3 4卷 第7期
王 海 雷 , 俞 学 宁 : 基于 随 机 游走 算法的 社 会 化 标签 的 用户 推 荐
·2 3 8 9·
其后成为电子商务中很重要的一环 。 、f 、G 在社交 网 站 方 面 , 诸 如 d e l i c i o u s l i c k r r o u l e n等 p 用户给相应的内 容 打 标 签 的 网 站 的 兴 起 , 由 于 要 标 记 的 资 源内容过于繁杂 或 者 内 容 不 能 直 接 获 取 文 本 , 因 此 出 现 了 用户给资源标记 标 签 的 系 统 , 给 予 用 户 所 打 标 签 的 推 荐 系 统也应运而 生 。 其 作 用 是 依 据 了 用 户 的 个 人 喜 好 , 让 用 户 迅速找到相应的 词 语 来 描 述 , 另 外 也 可 以 侧 面 找 到 最 贴 近 资源的描述 标 签 , 这 一 过 程 借 用 了 人 的 主 观 能 动 性 , 增 加 了系统体现 出 来 的 社 会 文 化 。 在 社 交 网 络 中 , 朋 友 之 间 可 以相互 发 布 感 兴 趣 的 话 题 、 最 近 的 照 片 、 有 意 思 的 视 频 、 交流思想 、 传 播 新 闻 …… 所 以 在 这 个 社 会 网 络 中 , 人 人 都 是一个有潜力的 传 播 者 和 接 收 者 , 正 因 为 这 个 平 台 的 无 所 不包的特性在于其充分利用了社会 网 络 中 草 根 人 群 的 特 点 , 朋友和朋友之间的 信 任 往 往 比 远 离 一 般 群 众 的 新 闻 媒 体 的 影响来得大 , 来 得 广 。 而 作 为 社 会 网 络 中 最 基 础 的 用 户 构 成社交网络中最 核 心 的 部 分 , 对 于 一 个 在 社 会 网 络 中 朋 友 较少的用户 来 说 , 所 能 接 触 到 的 信 息 是 有 限 的 , 所 以 扩 展 有 朋友圈便是非常重要 的 需 求 , 因 此 社 交 网 站 一 般 通 过 “ 可能认识的人 ” 一栏向 用 户 推 荐 朋 友 。 而 这 个 推 荐 系 统 往 往成为用户找到朋友的重要渠道 。
源推荐 、 标签 推 荐 、 用 户 推 荐 。 这 个 3 个 推 荐 方 向 是 现 在
; 修订日期 :2 收稿日期 :2 0 1 2 1 1 1 5 0 1 3 0 2 0 5 - - - - ) ; 教育部科技发展中心网络时代的科技论文快速共享专项研究资助课题基金项目 ( ) 基金项目 : 自然科学基金项目 ( 6 1 2 7 2 3 4 3 2 0 1 1 1 1 0 , 男 , 河北廊坊人 , 博士后 , 研究方向为语义网 、 文本挖 掘 和 知 识 管 理 ; 俞 学 宁 ( ,男,北 京 人,本 作者简介 : 王海雷 ( 1 9 8 1- ) 1 9 5 6- ) : 科 , 高级经济师 , 研究方向为数字wk.baidu.com育 、 数据挖掘和知识管理 。E-m a i l h a i l e i 6 0 8@1 2 6 . c o m
:B , A b s t r a c t c o m b i n i n t h e s i m i l a r i t o f c o n t e n t s a n d t h e s e m a n t i c r e l a t i o n t h e a l o r i t h m s o f u s e r r e c o mm e n d a t i o n i n s o c i a l t a - y g y g g ,w i n s s t e m a r e s t u d i e d b u s i n t h e d a t a s e t d e r i v e d f r o m d e l i c i o u s h i c h i s t h e w o r l d’ s l e a d i n s o c i a l b o o k m a r k i n s e r v i c e . g g y y g g g , T h i s w o r k m a i n l i n c l u d e s t w o a s e c t s . F i r s t l t h e s i m i l a r i t o f c o n t e n t s i s c a l c u l a t e d b u s i n t h e s e m a n t i c r e l a t i o n b e t w e e n t h e y p y y y g ; , t a s a n d b o o k m a r k s S e c o n d l r a n d o m w a l k w i t h r e s t a r t s( RWR) a l o r i t h m i s u s e d t o c o m b i n e t h e s i m i l a r i t o f c o n t e n t s w i t h g y g y l i n k s i n s o c i a l n e t w o r k s t o a c h i e v e t h e d e s i r e d e f f e c t . E x e r i m e n t s c o n d u c t e d o n r e a l d a t a s e t s f r o m d e l i c i o u s d e m o n s t r a t e t h a t u s e r p t h i s m e t h o d o u t e r f o r m s o t h e r t e m o r a l m o d e l s a n d s t a t e o f t h e a r t m e t h o d s b o t h f r o m a n d r e c a l l . r e d i c t i o n r e c i s i o n - - - p p p p : ; ; ; ; K e w o r d s s o c i a l t a i n u s e r r e s o u r c e t a r e c o mm e n d a t i o n g g g g y
( , , ; , 1. G u a n h u a S c h o o l o f M a n a e m e n t P e k i n U n i v e r s i t B e i i n 1 0 0 8 7 1, C h i n a 2. P o s t d o c t o r a l W o r k s t a t i o n g g g y j g , ; C h i n a M i n s h e n B a n k i n C o r o r a t i o n L i m i t e d B e i i n 1 0 0 0 3 1, C h i n a 3.S c i e n t i f i c R e s e a r c h T r a i n i n g g p j g g , , ) C h i n a M i n s h e n B a n k i n C o r o r a t i o n L i m i t e d B e i i n 1 0 0 0 8 4, C h i n a A c a d e m g g p j g y
基于随机游走算法的社会化标签的用户推荐
2 ,俞 学 宁3 王 海 雷1,
( 1. 北京 大学 光 华 管 理 学 院 , 北京 1 0 0 8 7 1;2. 中 国 民 生 银 行 博 士 后 工作 站 , 北京 1 0 0 0 3 1; ) 3. 中 国 民 生 银 行 科研 培 训 学 院 , 北京 1 0 0 0 8 4
0 引 言
社会化标签 系 统 的 出 现 为 用 户 提 供 了 便 利 , 但 也 提 出 了新的问题 : 由全 体 用 户 产 生 的 数 据 太 多 太 乱 且 一 直 呈 指 数式爆炸性增长 , 一 个 用 户 往 往 难 以 轻 易 找 到 与 自 己 相 似 的其他 用 户 或 者 自 己 喜 欢 的 资 源 , 对 资 源 的 概 括 性 描 述 — — — 标签也需要费力思考 。 在这种背景下 , 推 荐 系 统 ( r e c - o mm e n d e r s s t e m) 应运而生 , 它可 以 根 据 用 户 的 特 征 , 比 y 如兴趣爱好 , 推荐 满 足 用 户 要 求 的 对 象 并 可 以 实 时 更 新 推 荐,也称 个 性 化 推 荐 系 统 ( r e c o mm e n d e r s s e r s o n a l i z e d - p y
2 0 1 3年7月 第3 4卷 第7期
计算机工程与设计
C OMP UT E R E NG I N E E R I NG AN D D E S I GN
J u l 2 0 1 3 y V o l . 3 4 N o . 7
U s e r r e c o mm e n d a t i o n i n s o c i a l t a i n b a s e d o n r a n d o m w a l k a l o r i t h m g g g g
12 3 WANG H a i l e i YU X u e n i n - , - g ,