推荐系统综述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
协同过滤——--基于模型
? 实时性问题
? 可扩展性问题 ? 稀疏性问题
协同过滤——--基于模型
? 将建模技术运用到协同过滤算法中, 采用一 定方法训练相关历史数据建立模型,当用户 到达时,只需扫描一遍评分数据库就能确定 目标用户相对比较喜欢的项目,来实现在线 预测推荐。
? 线下:模型建立(数据挖掘技术) ? 模型具有滞后效应,需要周期性更新 ? 模型建立算法复杂,耗时,必须线下进行
? 线上:推荐
? 性能的优劣关键在于好的模型建立与否, 好 的模型相对原始数据集而言小得多却能挖掘
协同过滤——--基于模型
? 聚类
协同过滤——--基于模型
? 聚类 ? 一个集群一旦形成之后,在这个集群中的其
他用户的观点可以被加权地用来作为为个人 用户推荐的依据。
? 集群内部的相似性很高,而不同集群间的相 似度很低
基于内容的推荐
优点: ? 即使用户没有对新加入的项目做出评分,该算法也有能
力为用户做出推荐。 ? 如果不同的用户并不共享他们对于项目的评分信息,基
于内容的推荐算法也能应对自如 ? 如果用户的偏好发生了变化,它能够在极短的时间内做
出调整并完成推荐。 ? 给为用户做出的推荐列表做出合理的解释
组合推荐
? 基于用户
?基于项目
如果一些用户对某一类项目的打分比较接 如果大部分用户对一些项的评分比较相似, 近,则他们对其它类项目的打分也比较接 则当前用户对这些项的评分也比较相似 近。
协同过滤--------基于内存
表示
邻居
用户 推荐生成
形成
协同过滤--------基于内存
? 表示 ? 邻居用户形成 ? 推荐生成
开始
读入 用户评分
计算用户 相似性
根据用户相 似性排序选 择前K个邻居
结束
选择预测评分最 高的前N个项目 作为推荐列表
根据K近邻的
评分项目预 测用户评分
协同过滤--------基于内存
?
协同过滤--------基于内存
?
协同过滤--------基于内存
? 缺点:
? 稀疏性问题 ? 冷启动问题 ? 可扩展性问题 ? 实时性问题
? 某些聚类算法中,一个用户可以同时属于不 同的集群,只是所占的比不同,最后的推荐 结果通过用户所占不同集群的权重加权求和
基于内容的推荐
? 项目或对象通过相关特征的属性来定义,而用 户的兴趣通过用户所评价对象的特征来获取, 依据目标用户兴趣资料与待预测项目的匹配 程度进行推荐
? 在文本信息方面应用最为成功。 ? News Dude、LIBBR
? 原则:
? 通过组合后应能避免或弥补单独的推荐技术 各自的缺陷。
组合推荐
? 混合方式 ? 推荐结果混合:多种推荐方法各自产生
推荐结果,将推荐结果组合。(投票机 制) ? 推荐算法混合:以一种推荐方法为框架, 混合其他推荐方法。
?Thanks
推荐算法综述
16721499 徐泉华
推荐系统目的:
? 解决信息过载问题
宗旨:
? 为用户快速找到其所需Байду номын сангаас的信息
经典的推荐技术
推荐系统
基于内容的推荐
基于协同过滤的推 荐
基于混合的推荐
基于内存的推荐
基于模型的推荐
基于用户的推荐
基于项目的推荐
聚类技术、关联规 则挖掘、贝叶斯网 络、神经网络等等
协同过滤--------基于内存