个性化推荐系统研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
息的负担 , 从而降低 了信息 的使 用效率 。 推 荐系统 正是在这一 缺 少相关 的用户数据, 难 以被系统 中的规则发现, 从而得不到推
环境中诞生 的, 它是根据用户的信息需求、 兴趣等, 将用户感兴 荐, 并且 随着系 统项 目数量 的不断增 加, 规则 也会呈 出相应 的 趣的信息、 产品等推 荐给用户的个 性化信息推荐系 统。 增 长趋势, 使得规则 的管 理成本相应升高, 降低了系 统的运行效
软件 透 视 ・
个 性化推荐系统研究
顾 丽敏 ( 天津师范大 学, 天 津 3 0 0 3 8 7 )
摘 要 : 信 息技 术和 互联 网的迅 猛 发 展把 我们带 进了 信 息过载 的时代 。 海量信 息的同时呈现 , 一方面增 大了 用户发现 自己感兴趣 信息的难度 , 另一方面也 使得 大量 信息无 法被一 般 用户获取 。 个 性化 推 荐 系统是 目 前解 决信 息过 载 问题 最有效 的工具 。 本 文简单介 绍 了 推 荐 系统 的概念
Fra Baidu bibliotek问题 不 易处 理 。
2 推荐 技 术
推荐算法是整个推荐 系统 中核心的部分, 在很大程度 上决
定了推荐系统的质量。目 前主要的推荐技术 基本包括以下几种:
2 . 3协 同过滤推荐技术
基于协 同过滤推荐技 术是 当前主流 的, 应用最为广泛 的一 种推荐 技术 。 该 推荐技术可 以分为两种, 一种是基 于用户 的协 同过滤推 荐技术 ; 另一种是基 于项 目的协 同过滤推荐 技术 , 这
率。
1 推 荐 系统概 念 、 组 成要素
. 2基于内容的推荐技术 目前被 广泛 接受 的推荐 系统 的概 念和定 义是R e s n i c k 和 2 基于内容 的推荐 算法 重要的是建立项 目特征属性库 , 系统 V a r i a n 在1 9 9 7 年给出的:“ 它是利用 电子商务网站 向客户提供商 来 掌握 目 标用户兴趣 点, 依 品信 息和建议 , 帮助用户决 定应 该购 买什么产 品, 模 拟销售人 通过用户已关注项 目的特征属性值,
据项 目中找 出所有 的并发关 系, 这种 关系也称为关联 。 关联规 和他之前喜欢的物品相似 的物品。 . 3 . 1基于用户的协 同过滤推荐技术 则挖 掘的经典应用就是购物 篮数据分析 , 目的是找 出顾客在商 2
场( 或普通 店铺 ) 所选购商品之 间的关联 。
关联 规则可 以这 样表 述。 设I = ( j , j . . , j } 为所有 项的集
和 组 成要 素, 重点介 绍 了 几种 重要 的推 荐技 术和 个性化 推 荐 系统 的应 用领 域 。 关键 词 : 个性 化推 荐; 推 荐技 术 ; 关联 规 则; 协 同过滤
随着信息技术和互联 网的迅速 发展 , 人们逐渐从信息匮乏 关联规则, 可信关联规则是置信度大 于最小置信度 的规则 。 时代进入了信息过载时代。 这个时代, 对 于信息生产者而 言, 如 基于关联规则 的推荐技术其优 点是 : 简单直接, 领域 通用性 何让 自己生产 的信息脱 颖而出, 收到广大用户的关注是一件很 强 , 规 则的挖 掘可 以离线 进 可以保 证推荐 算法 的实时性 要 困难的事情。 对于用户而言, 信息量 的增大加重了找到感兴趣信 求。 其 缺点是 : 存在着严重 的 冷启动 问题 , 新加入 的项 目由于
则挖掘算法 , 在众 多算法中, 最著名的是A p r i o r i算法。
用户 员帮助客户完成购 买过程 ” 。 个性化 推荐系统 主要 由三个要素 据用户兴趣 点与待推 荐项 目属性值 的匹配程度进 行推荐。 兴趣 点的产生依 赖于系统所采用的机器 学习算法 , 如基于 向量 组 成, 分别是: 候选 对象 、 用户、 推荐 算法。 推荐系统 把用户模
文本挖掘 、 判别树、 神 经网络等 技术。 基于 内容 的推 荐 型中兴趣需求信息和推荐对 象模型中的特 征信息匹配,同时使 的表示、 结果直 观易理解 , 不 需要过多 的领域 知识 , 但是 需要有足够 数 用相应 的推荐算法 进行计算筛选 , 找到用户可能感 兴趣 的推荐 对象 , 然后推荐给用户。 据构造分类 器, 一些例如 稀疏 问题、 新用户问题 和复杂属性 等
基于关联 规则的推荐技术 , 基于 内容的推荐技 术, 协同过滤推
荐技术和混合推荐技 术。
2 . 1基于关联规则的推荐技术
两种协同过滤推荐技术 的不同之处在于两者针对的对象不同。
关联 规则是数据中所蕴含的一类重要规律 , 对关联规则进 基于用户的协同过滤推荐技术是给用户推荐和他有共同兴趣 的 基于项 目的协 同过滤 推荐技术是给用户推荐 行挖掘是数据挖 掘中的一项 根本任务, 关联规则挖掘 就是从数 用户喜欢 的物 品;
基于用户的协 同过滤 技术是 推荐 系统 中最古老 的算法 。
该算法 在1 9 9 2 年被 提 出, 并 应用 于邮件过 滤系 统 , 1 9 9 4 年 被
r o u p L e n s 应用 于新 闻过滤 。 该算法 主要包括两个 步骤: 第一 合, 事 务T 表示事务集合。 数据库D 为事务数 据库 。 关联规则形如 G 找到和 目标用户兴趣相似 的用户集合; 第二 步, 找到这个 集 x —Y 的蕴含式, 其中X 、 Y 均为项 目集 , 并且X 、 Y 没有交集。 关联规 步, 且目 标用户还 没有听说过 的物品, 将该物品推 则的强度 可以用支持度和 置信 度表 示。 支持度 为同时包含x 、 Y 合 中用户喜欢 的, 项集 的事务在数 据库D 中的百分 比。 置信度为包含x 的事务 同时 荐给 目标用户。 . 3 . 2基于项 目的协同过滤推荐技术 也包含Y 在数据库D 中的百分 比。 目前已有大 量文献提 出关 联规 2
相关文档
最新文档