基于协同过滤技术的个性化推荐算法研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Ringo(1995) MIT媒体实验室开 发的研究型协同过 滤推荐系统,用于 提供个性化音乐推 荐服务。
Video Recommender(1995) 由BellCore开发的 协同过滤系统,用 于电影推荐。VR 通过电子邮件的方 式收集用户对特定 电影的评分,提供 推荐服务。
MovieLens 美国的明尼苏达大 学在 1992 年开发 了一个用于新闻组 的协同过滤系统 GroupLens,之后 在此基础上利用协 同过滤的原理构建 了电影推荐网站 MovieLens。
个性化推荐系统广泛运用在商业 网站中(Amazon、eBay、淘宝 等) 准确高效的推荐系统可以挖掘用 户的潜在购买意向,为众多用户 提供个性化服务 帮助企业提升客户的忠诚度,为 企业带来更大的利润和价值
自强不息
2
2.1
个性化推荐系统概述
典型推荐系统发展概述
Tapestry(1992) 协同过滤的概念是 Goldberg等人在1992年 提出了,并将其成功的应 用于一个由他们开发的电 子邮件过滤系统Tapestry, Tapestry系统主要是让用 户自己确定系统中有与自 己兴趣爱好相似的用户, 然后系统根据相似用户的 兴趣对需要推荐信息的用 户做出推荐。
自强不息
2
2.4
个性化推荐系统概述
基于矩阵分解技术的协同过滤算法
矩阵分解模型是从数学上的SVD开始的,Deerwester首先提出使用奇异值分解(SVD) 方法发现文档中的潜在因子 2006年Netflix Prize开始后,Simon Funk在博客上公布了Funk-SVD算法 Koren提出了利用含蓄反馈信息的SVD++算法,TimeSVD++ Paterek 加入用户和项目偏差 项亮,时间因素对用户行为和物品流行度的影响,提出了基于矩阵分解的动态用户兴趣模 型(TRSVD)算法 交大在KDDCUP 2011的SVD-Feature 近些年社交网络的兴起,许多学者将社交网络信息和协同过滤算法结合起来提出了社会化 网络推荐
自强不息
2
2.1
领域 电子商务 网页 音乐 电影 新闻过滤
个性化推荐系统概述
主流个性化推荐算法应用系统案例
推荐系统 Amazon,eBay , EFOL , Levis , RIND , Taobao , Dangdang Fab,Foxtrot,ifWeb,SOAP,SurfLen CDNOW,CoCoA,Ringo CBCF , MovieLens , NetFlix , Moviefinder , Douban Google News,GroupLens,PHOAKS,P-Tango Tapestry Expertise Recommonder,Referral Web Facebook,Twitter,Weibo
自强不息
3
3.1
基于组合相似度的优化协同过滤算法
传统相似度计算方法
Cosine Correlation : sim(u, v)

iI uv
iIuv
Rui Rvi
Rui 2
Adjusted Cosine Correlation:sim(u, v)

iI u
iI uv
Rvi 2 ( Rui Ru )( Rvi Rv )
2
2.3
个性化推荐系统概述
基于模型的协同过滤算法

源自文库
贝叶斯信念网络协同过滤模型(BBN CF) 聚类模型(Clustering CF) 高斯混合模型(Gaussian Mixture Model) 潜在语义模型(Latent Semantic Model) 矩阵因子分解模型(Matrix Factorization)
电子商务日益发达需提 供个性化的产品推荐 推荐系统已经成为了许 多电子商务网站不可或 缺的一部分,个性化推 荐算法得到越来越多的 研究.
3
4
2
3
自强不息
1
背景及意义
应用和研究领域:电子商务、网络视 频、数字图书馆、在线学习、社会化 网络等 ACM-EC推荐系统论文比重增大, ACM自2007年组织RS国际会议 本文针对推荐系统存在的关键问题, 在对个性化推荐算法研究和分析的基 础上加以改进措施,提高算法的质量, 进而提升个性化推荐系统对用户的友 好性。
LOGO
基于协同过滤技术的个性化推荐算 法研究
姓 名 导 师
查九(12720589) 徐桂琼
自强不息
1 2 3
背景及意义 个性化推荐系统概述 优化协同过滤算法
4
5
基于用户近邻的MF 总结与展望
自强不息
1
背景及意义
1 2
“信息过载”,“信息迷 航”搜索时间成本增加
1 4
背景
传统搜索技术单一 无法提供用户偏好
A B D Items C E
Recommender System
Predict items that may be interested to a user
Users
自强不息
2
2.2
个性化推荐系统概述
基于内存的协同过滤算法
User-based CF
Item-based CF
Sarwar等在2001年提出基于项目的协同过滤算法,该算法用计算项目之间的相似度代替了用户之间 的相似度。 Yong等加入用户的属性信息,提出了一种新的相似度计算方法解决协同过滤算法中以下几个缺点: 相似度过度扩大、丢失用户之间属性信息、预测时不可性的推断。 在解决数据稀疏性问题上,邓爱林等提出基于项目预测评分的推荐算法,先利用项目之间的相似性 计算出缺省的用户评分分值,再计算用户之间的相似度。 在基于项目预测评分的基础上,周军锋等也提出了一种优化的协同过滤算法,采用修正的条件概率 方法计算项目相似性,提出一种优化的协同过滤推荐算法。 张忠平等提出一种综合的邻近度、影响力、有用性三个方面来计算项目之间的相似性。 自强不息
自强不息
电子邮件过滤 专门查找器 社交
2
2.2
个性化推荐系统概述
推荐系统算法简介
User-item Preferences data (rating, purchase,…)
User features (age, gender,…)
Item features (keywords, genre,…)
相关文档
最新文档