个性化推荐系统的综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


用户对算法准确度的敏感度、算法对不同领域的普
适性、广义的质量评价方法等都是未来推荐系统性能评价
要进行研究的目标。
❖谢谢
基于代理的推荐系统
❖ 在这一结构中,用户信息的收集、用户建模和推 荐服务都在代理端实现。
基于代理的推荐系统中用户信息都 传给了代理,代理能获得所有用户 的资料而形成用户描述文件。但由 于用户信息都要传给代理端,所以 存在用户的信息泄露等隐私问题。
推荐系统的性能评价
❖ 评价推荐系统性能的好坏通常用推荐的精确度和 推荐效率两个指标进行衡量。
❖ 模型的数据输入类型:
❖ (1)用户属性。 ❖ (2)用户手工输入的信息。 ❖ (3)用户的浏览行为和浏览内容。 ❖ (4)推荐对象的属性特征。
❖ 获取模型输入数据的方式:
❖ (1)有显式获取。 ❖ (2)隐式获取。 ❖ (3)启发式获取
推荐对象建模
❖ 对推荐对象进行描述之前考虑以下几个问题:
个性化推荐系统综述
个性化推荐的基本简介
❖ 简介:个性化推荐是根据用户的兴趣特点和购买 行为,向用户推荐用户感兴趣的信息和商品。随 着电子商务规模的不断扩大,商品个数和种类快 速增长,顾客需要花费大量的时间才能找到自己 想买的商品。这种浏览大量无关的信息和产品过 程无疑会使淹没在信息过载问题中的消费者不断 流失。
基于客户端的推荐系统有如下优点: (1)由于用户的信息就在本地收集 和处理,因而不但能够获取丰富准 确的用户信息以构建高质量的用户 模型。 (2)少量甚至没有用户数据存放在 服务器上,Web 服务器不能访问和 控制用户的数据,能比较好地保护 用户的隐私。 (3)用户更愿意向推荐系统提供个 人信息,从而提高推荐系统的推荐 性能
❖ 准确率:推荐列表中用户喜欢的产品和所有被推 荐产品的比率,计算方法如式(17)所示:
❖其中Nrs 推荐列表中用户喜欢的产品个数,Nr 用 户喜欢的所有产品的个数,Ns 为所有被推荐产品 的个数。
❖ 召回率和精准率评价系统时的最大问题在于它们 必须一起使用才能全面评价算法的好坏,综合二 者提出了一个F指标,计算方法如式(18):
推荐系统的体系结构
❖ 推荐系统的体系结构研究的重要问题就是用户信 息收集和用户描述文件放在什么地方,服务器还 是客户机上,或者是处于二者之间的代理服务器 上。
❖ 推荐系统可分为3种: ❖ (1)基于服务器端的推荐系统 ❖ (2)基于客户端的推荐系统 ❖ (3)基于代理的推荐系统
基于服务器端的推荐系统
❖ 二、推荐冷门对象的能力
❖ 一个推荐系统推荐出用户喜欢的冷门对象,比推 荐出大众都喜欢的对象更有吸引力。而对象的受 欢迎程度依靠平均度<k>来衡量,单纯的平均度 是不能保证S 和I 也能取得较好效果,所以认为高 S 值,低I 值和低平均度的推荐算法就是较好的推 荐算法。
❖ 对推荐系统进行性能测试时,通常的做法是把数 据集分割为训练集和测试集。推荐算法的模型在 训练集上进行学习和参数调整,然后在测试集合 上计算精确度和运行效率,从而达到评测目的。
❖ 对对象Байду номын сангаас描述主要基于内容的方法和基于分类的方法两大 ❖ 类方法。
推荐算法模块
❖ 推荐算法(或叫推荐策略)是整个推荐系统中最 核心和关键的部分,在很大程度上决定了推荐系 统类型和性能的优劣。
❖ 推荐算法的分类:
❖ 1.基于内容的推荐 ❖ 2.协同过滤推荐 ❖ 3.基于社会网络分析的推荐 ❖ 4.基于网络结构的推荐 ❖ 5.混合推荐
(1)提取推荐对象的什么特征,如何提取,提取的特征用于什么目 的。 ❖ (2)对象的特征描述和用户文件描述之间有关联。 ❖ (3)提取到的每个对象特征对推荐结果会有什么影响。 ❖ (4)对象的特征描述文件能否自动更新。
❖ 推荐对象的领域包括,比如报纸、Usenet 新闻、科技文 档、Email,还有诸如音乐、电影等多媒体资源等等。
推荐系统研究的重点、难点及发展方向
❖ 推荐系统研究的热点问题: ❖ (1)用户兴趣偏好获取方法和推荐对象的特征提取方法
的研究 ❖ (2)推荐系统的安全性研究 ❖ (3)基于复杂网络理论及图方法的推荐系统研究 ❖ (4)推荐的多维度研究 ❖ (5)稀疏性和冷启动研究 ❖ (6)推荐系统性能评价指标的研究
推荐系统的模块
❖ 1.用户建模模块 ❖ 2.推荐对象建模模块 ❖ 3.推荐算法模块
用户建模模块
❖ 建立用户模型之前,需要考虑下面几个问题:
❖ (1)模型的输入数据有哪些,如何获取模型的输 入数据。 ❖ (2)如何考虑用户的兴趣及需求的变化。 ❖ (3)建模的对象是谁。 ❖ (4)清楚了上述内容后,怎么建模呢。 ❖ (5)模型的输出是什么。
衡量推荐算法的衡量指标
❖推荐多样性的衡量 推荐冷门对象的能力
❖ 一、推荐多样性的衡量
❖ 一个好的推荐系统应能够向用户推荐不同类型的 对象,而不是同类型的对象。其中平均加权距离S 作为衡量推荐列表的外部多样性指标,比如推荐 列表的长度为L,用户i 和用户j 的推荐类表中相同 项的数量为Q,则加权平均距离(Hamming distance)定义如式(22):
❖ 最初的推荐系统都是基于服务器端的推荐系统
基于服务器端的推荐系统存在以下几个问题: (1)个性化信息的收集完全由Web 服务器来完成,受到了Web服
务器功能的限制。 (2)增加了Web服务器的系统开销。 (3)对用户的隐私有极大威胁。
基于客户端的推荐系统
❖ 基于客户端的推荐系统中,用户信息的收集和建 模都在客户端完成。
❖ 把该值得平均作为衡量推荐类表外部多样性的指 标,如式(23):
❖其中m 为用户的数量。推荐系统的个性化越高, 该值就越大。
❖用户ul 推荐列表的内部相似性如式(24):
❖其中soij 是对象oi 和oj 之间的相似度。整个系统 的内部相似性定义如式(25):
❖ 该值越小说明推荐的多样性更好。
推荐系统的基本概念
❖ 概念:个性化推荐系统是建立在海量数据挖掘基 础上的一种高级商务智能平台,以帮助电子商务 网站为其顾客购物提供完全个性化的决策支持和 信息服务。购物网站的推荐系统为客户推荐商品, 自动完成个性化选择商品的过程,满足客户的个 性化需求,推荐基于:网站最热卖商品、客户所 处城市、客户过去的购买行为和购买记录,推测 客户将来可能的购买行为。
❖ (1)精确度的衡量最典型的指标是平均绝对误差 和平均平方误差以及标准平均误差
❖ (2)推荐效率为推荐列表中用户喜欢的产品与系 统中用户喜欢的所有产品的比率
❖ 精确度的衡量最典型的指标是平均绝对误差 (MeanAbsolute Error,MAE)和平均平方误差 (Mean Squared Error,MSE)以及标准平均误差 (Normalized Mean Absolute Error,NMAE)。它们 的计算形式分别如式(13)和(14)以及(15)所示。
❖其中n 为系统中用户i 打分产品的个数,pia 和ria 分别为预测打分和实际打分。ni 为系统中用户-产 品对的个数。rmin和rmax分别为用户打分区间的 最小值和最大值。
❖ 召回率(recall)和精确率(precision)也可以 用来衡量推荐的准确度。
❖ 召回率定义为推荐列表中用户喜欢的产品与系统 中用户喜欢的所有产品的比率。计算方法如式 (16)所示:
相关文档
最新文档