电子商务推荐系统介绍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-8-3
电子商务推荐系统简介
推荐技术分类标准: 自动化程度(Degree of Automation):客户为了得到 推荐系统的推荐是否需要显式的输入信息 持久性程度(Degree of Persistence):推荐系统产生 推荐是基于客户当前的单个会话(Session)还是基于 客户的多个会话
2013-8-3
电子商务推荐系统技术介绍
电子商务推荐系统中的协同过滤技术一般采用最近邻 技术,利用客户的历史喜好信息计算客户之间的距离, 目标客户对特定商品的喜好程度由其最近邻居对商品 评价的加权平均值来计算 可以处理客户数据变化比较快的情况 在大型数据库中搜索最近邻居非常耗时,实时性不好
2013-8-3
电子商务推荐系统简介
电子商务推荐系统研究热点与方向: 对当前的电子商务推荐系统进行改进,以使得推荐 系统能产生更加精确的推荐 将数据挖掘技术及Web挖掘技术应用到电子商务推 荐系统中,产生完全自动化的推荐,使用户感受到 完全个性化的购物体验 将电子商务推荐系统由虚拟的销售人员转变为市场 分析工具 开发销售方的电子商务推荐系统,为商家的产品定 价、促销活动及交叉销售等提供推荐
2013-8-3
电子商务推荐系统简介
推荐技术分类 Non-Personalized Recommendation:推荐系统的推 荐主要基于其他客户对该产品的平均评价,这种推 荐系统独立于客户,所有的客户得到的推荐都是相 同的 (自动,瞬时) Attributed-Based Recommendation:推荐系统的推 荐主要基于产品的属性特征 (手工) Item-to-Item Correlation:推荐系统根据客户感兴 趣的产品推荐相关的产品 (瞬时) People-to-People Correlation:,又称协同过滤,推 荐系统根据客户与其他已经购买了商品的客户之间 的相关性进行推荐 (自动,持久)
2013-8-3
基于最近邻居的协同过滤算法
表示阶段:用m*n阶客户-商品矩阵表示 Ri, j = 1,如果第i个客户购买了第j件商品 Ri, j = 0,如果第i个客户没有购买第j件商品
2013-8-3
基于最近邻居的协同过滤算法
上述表示称为原始表示(Original Representation),这 种表示的主要问题有: 稀疏性(Sparsity):大部分的客户购买的商品不到全 部商品的1%,从而使得推荐精度很低 适应性(Scalability):计算代价随着客户数目和商品 数目的增加而增加,很难满足实时性要求 同义词问题(Synonymy):同一类商品的名字不一样
余弦相似性(Cosine):将客户a和客户b看作两个向量, 客户之间的相似性通过向量之间的于弦夹角来表示
2013-8-3
基于最近邻居的协同过滤算法
推荐产生阶段:由目标客户的邻居产生N件商品推荐,可以 采用如下两种不同方法产生推荐 最频繁项目推荐(Most-frequent Item Recommendation): 扫描目标客户每一个邻居的购买数据,对其购买的商品进 行计数,选择出现频率最高且目标客户没有购买的前N件 商品最为推荐结果 基于关联的推荐(Association Rule-based Recommendation): 类似于前面介绍的基于关联规则的推荐算法,只是将目标 客户的邻居作为算法的输入
2013-8-3
电子商务推荐系统技术介绍
电子商务推荐系统中的Bayesian网络技术利用训练集 创建相应的模型,模型用决策树表示,节点和边表示 客户信息。 模型的建立可以离线进行,一般需要数小时或数天, 得到的模型非常小,对模型的使用非常快 这种方法适合客户的兴趣爱好变化比较慢的场合 推荐精度和最近邻技术差不多
2013-8-3
基于最近邻居的协同过滤算法
通过奇异值分解(Singular Value Decomposition)将m*n 阶客户-商品矩阵变换为m*k阶矩阵,这种表示称为降 维表示(Reduced Dimensional Representation),可以部 分解决原始表示存在的稀疏性、缩放性和同义词问题
2013-8-3
电子商务推荐系统简介
电子商务推荐系统的输出: 建议(Suggestion) 单个建议(Single Item) 未排序建议列表(Unordered List) 排序建议列表(Ordered List) 预言(Prediction):系统对给定项目的总体评分 个体评分(Individual Rating):输出其他客户对商品 的个体评分 评论(Review):输出其他客户对商品的文本评价
2013-8-3
电子商务推荐系统技术介绍
协同过滤算法的主要挑战: 算法的适应能力:处理大规模的数据 推荐精度,使用如下两个指标来度量: False negatives:客户喜欢但推荐系统并没有推 荐的商品 False positive:推荐系统推荐但客户并不喜欢的 商品
2013-8-3
基于关联规则的推荐算法
关联规则的意义,支持度置信度等概念大家都很熟悉, 简单介绍一下 关联规则就是在一个交易数据库中统计购买了商品集 X的交易中有多大比例的交易同时购买了商品集Y,得 到的关联规则表示为:X=>Y[s%,c%] s表示关联规则的支持度,c表示关联规则的置信度 关联规则的发现算法很多,如Apriori,AprioriTid, DHP,FP-tree等
2013-8-3
基于最近邻居的协同过滤算法
算法分为三个主要的阶段: 表示(Representation):对客户已经购买的商品进行 建模 邻居形成(Neighborhood Formation):寻找目标客 户所对应的邻居 推荐产生(Recommendation Generation):从目标客 户的邻居中产生N项产品推荐
2013-8-3
基于关联规则的推荐算法
算法分析: 第一步关联规则的发现最耗时,是算法的瓶颈,但 可以离线进行 实时性比较好,因为后三步不会太耗时
2013-8-3
基于最近邻居的协同过滤算法
基本思想:使用统计技术寻找与目标客户有相同喜好 的邻居;然后根据目标客户多个邻居的观点产生向目 标客户的推荐
电子商务推荐系统介绍
报告人:邓爱林
2013-8-3
提纲
电子商务推荐系统简介 电子商务推荐系统技术介绍 基于关联规则的推荐算法 基于最近邻居的协同过滤算法 基于项目的协同过滤算法
2013-8-3
电子商务推荐系统简介
ቤተ መጻሕፍቲ ባይዱ
Harvard商学院的Joe Ping在大规模定制一文中认为现 代企业应该从大规模生产(以标准化的产品和均匀的市 场为特征)向大规模定制(为不同客户的不同需求提供 不同的商品)转化 电子商务推荐系统(Recommendation System)向客户提 供商品信息和建议,模拟销售人员帮助客户完成购买 过程
2013-8-3
电子商务推荐系统简介
电子商务推荐系统的输入: 客户输入(Targeted Customer Inputs) 隐式浏览输入(Implicit navigation):客户的浏览行为作 为推荐系统的输入,但客户并不知道这一点 显式浏览输入(Explicit navigation) :客户的浏览行为是 有目的向推荐系统提供自己的喜好 关键词和项目属性输入(Keywords and Item attributes): 客户输入关键词或项目的有关属性以得到推荐系统有价 值的推荐 用户购买历史(Purchase history):用户过去的购买纪录
2013-8-3
电子商务推荐系统简介
电子商务推荐系统的输入(续): 社团输入(Community Inputs) 项目属性(Item Attribute):社团对商品风格和类 别的集体评判 社团购买历史(Community Purchase History): 社团过去的购买纪录 文本评价(Text Comments):其他客户对商品的 文本评价,计算机并不知道评价是好是坏 评分(Rating):其他客户对商品的评分,计算机 可以对评分进行处理
2013-8-3
电子商务推荐系统技术介绍
电子商务推荐系统中的Horting图技术是一种基于图的 方法,节点代表客户,边代表两个客户之间的相似度。 在图中寻找近邻节点,然后综合近邻节点的观点形成 最后的推荐 Horting图技术可以跳过中间节点寻找最近邻居,考虑 了节点之间的传递相似关系 推荐精度优于最近邻技术
2013-8-3
基于最近邻居的协同过滤算法
邻居形成阶段:关键在于计算客户之间的相似性。 目标:对于每个客户u,找到它的l个邻居N = {N1, N2, …, Nl},使得sim(u, N1)最大, sim(u, N2)次 之,……。
2013-8-3
基于最近邻居的协同过滤算法
相似性度量方法: 相关性(Correlation):使用Pearson相关系数表示
2013-8-3
电子商务推荐系统技术介绍
电子商务推荐系统中的关联规则技术根据关联规则发 现算法和客户当前的购买行为向用户产生推荐 关联规则的发现也可以离线进行 推荐精度比最近邻技术略差 具体介绍见第三节
2013-8-3
电子商务推荐系统技术介绍
电子商务推荐系统中的聚类技术将具有相似爱好的客 户分配到相同的族中,聚类产生之后,根据族中其他 客户对某商品的评价就可以得到系统对该商品的评价 聚类过程可以离线进行 聚类产生之后,性能比较好 如果某客户处于一个聚类的边缘,则对该客户的推荐 精度比较低 推荐精度比最近邻技术略差
2013-8-3
电子商务推荐系统简介
电子商务推荐系统的界面表现形式分类(续): Average Rating:推荐系统向客户提供其他客户对 相应产品的等级评价 Top-N:推荐系统根据客户的喜好向客户推荐最可 能吸引客户的N件产品 Ordered Search Results:推荐系统列出所有的搜索 结果,并将搜索结果按照客户的兴趣降序排列
2013-8-3
电子商务推荐系统技术介绍
电子商务推荐系统使用的技术主要有: Bayesian网络(Bayesian Network) 关联规则(Association Rules) 聚类(Clustering) Horting图(Horting Graph) 协同过滤技术(Collaborative Filtering)
2013-8-3
电子商务推荐系统简介
电子商务推荐系统的界面表现形式分类: Browsing:客户提出对特定商品的查询要求,推荐 系统根据查询要求返回高质量的推荐 Similar Item:推荐系统根据客户购物篮中的商品 和客户可能感兴趣的商品推荐类似的商品 Email:推荐系统通过电子邮件的方式通知客户可 能感兴趣的商品信息 Text Comments:推荐系统向客户提供其他客户对 相应产品的评论信息
2013-8-3
电子商务推荐系统简介
电子商务推荐系统的作用: 将电子商务网站的浏览者转变为购买者(Converting Browsers into Buyers) 提高电子商务网站的交叉销售能力(Cross-Sell) 提高客户对电子商务网站的忠诚度(Building Loyalty)
2013-8-3
基于关联规则的推荐算法
算法过程: 使用关联规则发现算法找出所有满足最小支持度和 最小置信度的关联规则R 找出R中所有被客户支持的关联规则R1,即关联规 则左边的所有商品都被客户购买 找出被关联规则R1所预测并且没有被客户所购买的 所有商品P 根据P中商品在关联规则R1中的置信度排序,如果 某商品被多个规则预测,则取置信度最大者作为排 序依据,挑选前N个商品作为算法输出
2013-8-3
基于项目的协同过滤算法