个性化推荐系统的文献
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
个性化推荐系统的文献综述
个性化推荐系统在电子商务网站中的应用研究一、引言随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的
消费倾向,为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及个性化推荐系统能够为电子商务网站带来的价值。二、个性化推荐系统概述个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。1995年3月,卡内基?梅隆大学的Robert Armstrong等人在美国人工智能协会首次提出了个性化导航
系统Web-Watcher,斯坦福大学的Marko Balabanovic等人在同一次会议上推出了个性化推荐系统LIRA。同年8月,麻省理工学院的Henry Liberman在国际人工智能联合大会上提出了个性化导航智能体Letizia。这三个系统被公认为是个性化服务发展初期最近经典的系统,标志着个性化推荐服务的开始。2000年,我国正式开始了个性化推荐的研究,清华大学的陆海明等提出了基于Agent多混合智能实现个性化推荐;2001年清华大学的冯翱等人提出了基于Agent的个性化信息过滤系统Open Bookmark;南京大学的潘金贵等人设计并实现了个性化信息搜集智能体DOLTRL-Agent。近几年来,个性化信息推荐服务逐渐从理论走向实践,从探索走向完善,逐步成为商业界的焦点。
三、常用的个性化推荐系统算法分析下面对常用的个性化推荐系统的算法进行简要的分析。根据算法的不同,当前已有的个性化推荐系统大致可以分为以
下几类:基于规则的推荐系统;基于内容的推荐系统;协同过滤系统;基于用户-产品二部图网络结构的推荐系统;以及混合式推荐系统。1、基于规则的推荐系统关联规则挖掘是数据挖掘领域的一个重要分支。对于基于关联规则的推荐算法来说,其作用机理就是:首先统计得到挖掘出的规则前件,然后针对目标客户的历史购买行为,向顾客推荐规则后件。该算法的优点是容易理解,研究基础广泛且成熟,支持其实现的软件丰富,有较好的实践条件;缺点是随着事务的增多,规则的发现将非常耗时,并且规则难以解释。
2、基于内容的推荐系统基于内容的推荐起源于信息检索领域,它利用资源和用户兴趣的相似性来过滤信息。首先分析项目的内容,根据用户评价过的项目建立用户的兴趣模型,即用户描述文件。根据用户描述文件的不同又可以分为基于向量空间模型的推荐、基于关键词分类的推荐、基于领域分类的推荐
和基于潜在语义索引的推荐。基于内容的算法的优点是直接、简单,推荐结果易于解释。但也存在一定的局限:首先,特征提取能力有限,它仅适用于产品特征容易抽取的领域,当项目特征很难被一组关键词来清晰描述时,基于内容的推荐算法就显得苍白无力了。其次,推荐范围狭窄,这种算法只能推荐与用户已有偏好或购买记录相似的项目,不能为用户发现新的感兴趣项目。
3、协同过滤系统协同过滤是目前应用研究的最为广泛最成熟的个性化推荐技术。主要分为基于用户的协同过滤系统和基于项目的协同过滤系统。其核心思想是:首先,基于系统中已有评分数据,计算给定用户之间的相似性;然后根据计算得到的相似性,寻找目标用户的最近邻居集合;最后使用最近邻居集合中的用户的评分情况来预测目标用户对目标项目的评分值。协同过滤的推荐系统主要优点有:对内容信息不易抽取的项目能产生完全自动化的推
荐;能根据项目的质量和用户的品味产生推荐;能为用户发现新的兴趣。当然,协同过滤推荐系统也存在一些弊端:数据稀疏性问题,这也是协同过滤系统目前存在的最普遍的问题,大多数用户只是对一小部分项目进行了评分,原始的用户-评分矩阵非常稀疏,因此找到真正相似的用户是很难的,系统使用初期这个问题更加突出;冷启动问题,当一个新项目刚加入系统的时候,于没有任何用户对它进行过评分,该项目便无法得到推荐。同样,当一个用户刚加入系统时,系统也就无法从用户身上获取任何相关的评分信息,从而无法向该用户进行准确的推荐。同一性问题,对于名称不同本质相同的项目,协同过滤无法发现潜在的联系;扩展性问题,随着系统中项目和用户数量的增多数据库将变得非常庞大,为用户产生推荐的精度和实时性都因此而降低。4、基于用户-产品二部图网络结构的推荐系统基于网络结构的推荐算法不考虑用户和
产品的内容特征,而仅仅把它们看成抽象的节点,所有算法利用的信息都藏在用户和产品的选择关系之中.分别利用用户一产品用二部分图建立用户—产品关联关系,并据此就提出了基于网络结构的推荐算法。其中,提出了一种全新的基予资源分配的算法,通过在协同过滤算法中引入二部分图上的扩散动力学,部分解决了数据稀疏性的问题,进一步地,对两个实际推荐系统的用户一产品二部图进行了分析,发现这两个实证系统具有比随机图更大的平均距离和集聚系数。5、混合式推荐系统基于规则的、基于内容的以及协同过滤的推荐算法于自身的特点,在实际应用中都存在一些缺陷,因此就提出了把多种不同算法结合起来形成混合算法的解决方案。四、个性化推荐系统对电子商务网站的意义个性化推荐系统作为一种电子商务服务,是网络营销的重要手段。据VentureBeat统计,Amazon的推荐系统为其提供了35%的