推荐算法ppt

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1)首先确定用户偏好模型 (2)选择合适的阈值进行过滤 (3)比较每一次的偏差 (4)根据偏差以及阈值调整公式算下一轮的阈值 (5)迭代直到取得合适的阈值
2 基于内容的推荐算法
3.自适应推荐
主题向量
正例文本 是
特征向量
特征 提取
偏好模板
非正例文本 否
训练集
相似度>阈值
阈值 调整
阈值
是否成立
3 基于图结构的推荐算法
基于项目(item-based)的推荐
2、基于模型的推荐
基于朴素贝叶斯分类的推荐 基于线性回归的推荐 基于马尔科夫决策过程的推荐
1.1 基于记忆的推荐
1.基于用户(user-based)的推荐
根据余弦相似度计算用户间相似度
根据计算出来的相似度估计用户评分:(2.5)
1.1 基于记忆的推荐
2.基于项目(item-based)的推荐
5 评价准则
3.查全率(recall) 用于度量推荐列表中是否包含了用户偏好的全部项目.
4.查准率(precision) 用于度量推荐列表中是否都是用户偏好的项目.
Li表示推荐算法为用户i产生的推荐列表, Ri表示测试集中用户i偏好的全部项目.
总结
推荐系统是帮助用户解决信息过载问题的有效工具,已被广泛 应用于包括电子商务在内的多个领域.协同过滤、基于内容推荐、 基于图结构推荐和混合推荐是目前较为常见的推荐方法.本文综述 了相关算法,分析了各自方法的优势与不足,总结了常被采用的推 荐算法评价准则.
现有的推荐算法仍面临诸多困难,其中数据稀疏、过拟合、可 扩展性和多媒体信息特征提取是主要问题。现有的技术和方法都不 能从根本上解决这些问题.
随着应用领域的不断拓展,推荐系统还会面临新的需求与问题. 针对以上问题的推荐方法研究仍是信息检索、数据挖掘和机器学习 等智能信息处理领域的研究热点.
Thank you for your attention!
基于模型的协同过滤算法能在一定程度上解决基于 记忆的推荐算法面临的主要困难,在推荐性能上更优,但 通常算法复杂,计算开销大.
2 基于内容的推荐算法
文本推荐方法 基于内容的推荐算法 基于潜在语义分析的推荐
自适应推荐
2 基于内容的推荐算法
1.文本推荐方法 根据历史信息构造用户偏好文档,计算推荐项目与
1.基于朴素贝叶斯分类的推荐 朴素贝叶斯分类方法的前提是假设样本的各个属性
相互独立
由朴素贝叶斯假设可得: =
1.2 基于模型的推荐
2.基于线性回归的推荐 线性预测模型:
u=(x1,x2,… ,xn)表示用户u对n个项目的评分 p=(a1,a2,… ,an)表示评分系数、 m表示偏差
wenku.baidu.com
1.2 基于模型的推荐

④根据最终资源分配从大到小产生除了用户已经偏好项目外的推荐. 对用户1推荐项目的排序是:3>1>4>2=5
4 混合推荐算法&其他推荐算法
混合推荐:为解决以上三种算法各自问题而提出的.
协同过滤& 基于内容
·两种方法单独进行将结果混合
·基于内容融合到协同过滤的方法中 ·协同过滤融合到基于内容方法中 ·混合到一个框架下产生新的推荐方法
其他推荐:基于关联规则(啤酒-尿布)和基于知识的推荐
5 评价准则
1.平均绝对误差(mean absolute error,MAE) 用于度量推荐算法的估计评分与真实值之间的差异.
2.均方根误差(root mean squared error,RMSE) RMSE是Netflix竞赛(电影推荐)采用的评价准则.RMSE值越小,算法 的准确度越高.
推荐算法综述
主要推荐算法
1、协同过滤推荐算法 2、基于内容的推荐 3、基于图结构的推荐 4、混合推荐&其他推荐算法 5、推荐系统的评价准则
1 协同过滤推荐算法
User-item rating matrix
用户-项目评分矩阵
1 协同过滤推荐算法
基于用户(user-based)的推荐 1、基于记忆的推荐
根据余弦相似度计算项目间相似度
根据计算出来的相似度估计评分
1.2 基于模型的推荐
采用统计学、机器学习、数据挖掘等方法,根据 用户历史数据建立模型,并产生合理推荐。
简单的评分模型:
1.2 基于模型的推荐
基于模型的推荐
基于朴素贝叶斯分类的推荐 基于线性回归的推荐 基于马尔科夫决策过程的推荐
1.2 基于模型的推荐
用户项目矩阵可建模为二部图,节点表示拥护和项目, 借鉴动态网络资源分配过程。该方法的推荐过程如下:
①建立推荐二部图. X1
X2
X3
X4
X5 m个项目
a53=1
y1
y2
y3 n个用户
②计算资源分配矩阵W.
3 基于图结构的推荐算法
③针对指定用户计算各项目的资源分配.
fi=(ai1,ai2,… ,aim)表示用户i的初始资源分配,由图可知用户y1的初 始资源分配: f′i表示用户i的最终资源分配,则有f′i= Wfi.用户1的最终资源分配为
文档的相似度,将最相似的项目推荐给用户.
采用TF-IDF方法:
Term Frequency: 词频 Inverse Document Frequency: 逆向文件频率 相似度计算公式:
2 基于内容的推荐算法
2.基于潜在语义分析的推荐(LSA和SVD) 关键词的同义和多义现象导致文档相似度不准确. 提
3.基于马尔科夫决策过程MDP的推荐
借鉴强化学习(reinforcement learning)的思想,把推荐过程建模为MDP 最优决策问题,即如何产生一个能最大用户收益的推荐项目列表.
将MDP模型定义为一个4元组(S,A,R,Pr) 推荐过程对应的MDP过程:
1
2
1.2 基于模型的推荐
除以上介绍的方法外,基于模型的协同过滤方法还 包括基于聚类的Gibbs抽样方法,概率相关方法和极大熵 方法等.
出了潜在语义分析方法(Latent Semantic Analysis,LSA). LSA方法基于SVD分解:
然后把Ʃ的r个对角元素的前k个保留(最大的k个), 后面最小的r-k个奇异值置0, 得到Ʃk;最后计算一个近似 的分解矩阵:
2 基于内容的推荐算法
3.自适应推荐
偏好文档是基于内容推荐的关键.用户的兴趣会随时 间动态变化,因此需要及时更新偏好文档. 采用更新用户 文档的自适应过滤方法:
相关文档
最新文档