(9)推荐系统
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推荐系统之 推荐算法初步
推荐系统之 推荐算法初步
推荐系统之 推荐算法初步
o 小例子
n 计算这本书和其余7本书的相似度,推荐最近的: n 这里的结果为:
rank 1:Data Mining Your Website rank 2:Accelerating Custom Relationships: Using CRM … rank 3:Mastering Data Mining: The Art and Science… 其余未推荐…
推荐系统之 推荐算法初步
o 相似度/距离定义
n 欧氏距离 n Jaccard相似度 n 余弦相似度 n Pearson相似度
o 对用户而言: n 找到好玩的东西 n 帮助决策 n 发现新鲜事物 n …
o 对商家而言: n 提供个性化服务,提高信任度和粘性 n 增加营收 n …
推荐系统之 系统结构
推荐系统之 评定标准
o 准确度:
打分系统 设 为用户u对物品i的实际评分, 为预测分
推荐系统之 评定标准
o 准确度:
推荐系统之 评定标准
o 新颖度:给用户surprise(推荐他们不知道的商品) o 惊喜度:推荐和用户历史兴趣不相似,却满意的 o 信任度:提供可靠的推荐理由 o 实时性:实时更新程度 o …
推荐系统之 NetFlix
o 6年时间,48w用户的1亿+打分和评论,17770部电影。 o 2700+队伍,准确率提升10%,100w美元奖励。
n 基于比对item内容进行推荐
推荐系统之 经典算法初步
o 基于内容的推荐 n 对于每个要推荐的内容,我们需要建立一份资料:
n 比如词kj在文件dj中的权重wij n 常用的方法比如TF-IDF
n 需要对用户也建立一份资料:
n 比如说定义一个权重向量(wc1,…,wck) n 其中wci表示第ki个词对用户c的重要度
推荐系统之 为什么
o 寻求解决信息过载的思路
o 思路变更
n 分类导航页 => 雅虎 n 搜索引擎 => 谷歌,必应,度娘
o But,人总是期望计算机尽量多地服务
n 我们不愿意去想搜索词 n 希望系统自动挖掘自己的兴趣点 n 希望系统能给我们surprise
o 今日头条,虾米音乐,电商猜你喜欢,豆瓣…
n 计算匹配度
n 比如用余弦距离公式
推荐系统之 推荐算法初步
o 小例子 n 基于书名进行书推荐
n 一个用户对《Building data mining applications for CRM 》这本书感兴趣
n 从以下书中进行推荐
Building data mining applications for CRM Accelerating Customer Relationships: Using CRM and Relationship Technologies Mastering Data Mining: The Art and Science of Customer Relationship Management Data Mining Your Website Introduction to marketing Consumer behavior marketing research, a handbook Customer knowledge manag
推荐系统之 经典算法初步
o 基于内容的推荐 n 基于用户喜欢的item的属性/内容进行推荐 n 需要分析内容,无需考虑其他用户的行为 n 通常使用在文本相关产品上进行推荐 n Item通过内容(比如关键词)关联:
l 电影题材:爱情/探险/动作/喜剧/悬疑 l 标志特征:黄晓明/王宝强… l 年代:1995,2016… l 关键词
推荐系统与应用
主要内容
n 互联网需求变更
1.推荐系统广泛应用 2.推荐系统需求 3.推荐系统结构与评估
n ቤተ መጻሕፍቲ ባይዱ荐算法初步
1.基于内容推荐 2.协同过滤
n 推荐算法进阶
1.矩阵分解与隐语义模型
n 推荐系统案例
推荐系统之 是什么
每天都在有意识无意识地接触
推荐系统之 是什么
o 数学定义如下:
n 设C为全体用户集合 n 设S为全部商品/推荐内容集合 n 设u是评判把si推荐ci的好坏评判函数 n 推荐是对于c∈C,找到s∈S,使得u最大,即
Top N推荐 设R(u)为根据训练建立的模型在测试集上的推荐,
T(u)为测试集上用户的选择。
推荐系统之 评定标准
o 覆盖率: n 表示对物品长尾的发掘能力(推荐系统希望消 除马太效应)
推荐系统之 评定标准
o 多样性: n 表示推荐列表中物品两两之间的不相似性。设 s(i,j)表示物品i和j之间的相似度
推荐系统之 是什么
o 说人话版本: n 根据用户的: a) 历史行为 b) 社交关系 c) 兴趣点 d) 所处上下文环境 e) … 去判断用户的当前需求/感兴趣的item
推荐系统之 为什么
o 互联网大爆炸 => 信息过载 n 我们 n 一天会看到20mb左右的文字信息 n 会听到600mb左右声音信息 n 每秒看到2mb左右图像信息 n 每天有10w左右的新闻报道 n 每秒钟优酷土豆爱奇艺搜狐腾讯B站会多出时 长几百小时的视频 n 淘宝京东亚马逊当当一天上架上百w商品 n …
推荐系统之 为什么
o 商家需要推荐系统吗?
n Netflix每年2/3的观看电影from推荐 n Google news推荐系统能带来额外38%的点击 n 亚马逊每年35%的销售额都来源于它的推荐 n 头条半数以上新闻和广告点击来源于推荐 n 京东一年推荐和广告带来几亿的营收 n …
推荐系统之 为什么
推荐系统之 推荐算法初步
o 协同过滤 n User-based CF
n 找到和用户最近的其他用户,找到他们看/买过但当 前用户没看/买过的item,根据距离加权打分
n 找得分最高的推荐
推荐系统之 推荐算法初步
o 协同过滤 n Item-based CF
n 根据用户对 商品/内容的行为, 计算item和item 相似度,找到和 当前item最近的 进行推荐。