数据挖掘技术在电子商务网站中的应用

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数据挖掘技术在电子商务网站中的应用

————————————————————————————————作者：————————————————————————————————日期：

2

数据挖掘技术在电子商务网站中的应用

发布时间:2010-03-15 来源:毕业论文网

当用户和电子商务的商家充分享受电子商务的快捷和方便时,他们同时面临着某些新的题目。一方面,用户面对网站上提供的琳琅满目的众多商品,他们只对其中的一部分商品感爱好。用户要实现一次的购买,就必须浏览很多不相关的网页,在众多的商品分类中找到自己所需要的商品;另一方面,商家面对众多的用户,不知道他们对商品的爱好和要求是什么。因此,电子商务的商家无法及时调整网站的页面结构,提供给所有的用户是千篇一律的界面。缺乏个性化服务己经成为制约电子商务发展的关键题目。基于Web数据挖掘技术的电子商务推荐系统提供了一种有效的解决方法。

推荐系统就是根据用户个人的喜好、习惯来向其推荐信息、商品的程序。电子商务推荐系统能够直接与用户交互,模拟商店销售职员向用户提供商品推荐,帮助用户找到所需商品,从而顺利完成购买过程。从用户角度来看,电子商务推荐系统通过对收集到的用户的访问行为、访问频度、访问内容等浏览信息进行挖掘,提取用户的特征,获取用户访问Web的模式,动态地调整页面结构,为用户实现主动推荐,提供个性化服务;从企业角度来看,企业希看能够获取用户的访问规律,以帮助企业确定顾客消费的生命周期,针对不同的产品制定相应的营销策略,进一步优化网站的组织结构和服务方式,以进步网站的效率。推荐系统在帮助了客户的同时也进步了顾客对商务活动的满足度,换来对商务网站的进一步支持。

一、推荐系统在电子商务活动中的作用

一般说来,推荐系统在电子商务活动中的作用可以回纳为以下几点:

(一)把浏览者转变成购买者

己有明确购物目标的客户也许可以借助检索系统找到自己需要的东西,但对于大多数只是四处走走看一看的冲浪者,或是对自己的需要比较模糊的购买者,很难有耐心在几十页长的商品目录逐项查找是否有自己感爱好的东西。而推荐系统通过合适的推荐,可以将一个浏览者变为购买者。

(二)进步电子商务系统的交叉销售能力

电子商务推荐系统在用户购买过程中向用户提供其它有价值的商品推荐,用户能够从提供的推荐列表中购买自己确实需要但在购买过程中没有想到的商品,从而有效进步电子商务系统的交叉销售。例如站点可以根据客户当前购物车中的物品向他们推荐一些和这些己选购的物品相关的物品。假如有一个比较好的推荐系统,则企业的均匀定购量就可能增加。

(三)进步客户对电子商务网站忠诚度。

与传统的商务模式相比,电子商务系统使得用户拥有越来越多的选择,用户更换商家及其方便,只需要一两次鼠标的点击就可以在不同电子商务系统之间跳转。电子商务推荐系统分析用户的购买习惯,根据用户需求向用户提供有价值的商品推荐。假如电子商务推荐系统的推荐质量很高,用户可以很轻易找到自己想要的商品,那么用户会再次访问这个网站,并会推荐给其他人,这对于网站来说是一个很大的上风。

二、数据挖掘技术在电子商务推荐系统的具体应用

数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型

数据库,发现先前未知的有用模式。电子商务推荐系统将数据挖掘技术运用到电子商务领域,以数据挖掘为基础衍生出很多算法。

(一)基于关联规则的推荐算法

关联规则是数据挖掘技术的一种,该技术挖掘发现大量数据中项集之间有趣的关联或相关联系。关联规则挖掘的一个典型例子就是购物篮分析。该过程通过发现顾客放进其购物篮中不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助商家制定营销策略。

关联规则的挖掘是一个两步过程:

首先,找出所有频繁项集。这些项集出现的频繁性至少和预定义的最小支持计数一样。其次,由频繁项集产生强关联规则。这些规则必须满足最小支持度和最小置信度。

关联规则挖掘算法的瓶颈出现在第一步。由于第一步需要反复扫描交易数据库,所以增加了系统的开销,降低了系统性能。例如:Aprior算法是一种最有影响的挖掘关联规则频繁项集的算法。该算法使用一种称为逐层搜索的迭代方法寻找频繁项集,它开创性地使用基于支持度的剪枝技术,系统地控制候选项集指数增长。它缺点就是由于数据库数据的增多,需要多次扫描数据库,这样便影响了系统的性能。

(二)基于内同的推荐算法

基于内容的推荐系统的产生根源于信息检索与信息过滤。其具体是根据项之间的相似性来进行推荐的,先用机器学习等技术分析用户已经评分的项的内容,建立用户档案,然后从项集中选择与用户档案相似的项,再从中根据评分选择一定的项推荐给用户,最后根据用户的反馈信息修正推荐。

基于内容得推荐技术具有一定的局限性。首先,资源内容必须以机器可以理解的格式表示,而很多信息例如图像、视频等多媒体信息是很难做到这一点的;其次,资源内容的分析范围比较小,不能提供较多的建议;再次,基于内容的推荐不能从质量、样式、审美等角度对项进行过滤。

(三)协同过滤推荐算法

协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户爱好,在用户群中找到指定用户的相似(爱好)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度猜测。

协同过滤推荐算法的缺点是:(1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不正确(即稀疏性题目)。(2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性题目)。(3)假如从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价题目)。

为了弥补各种推荐方法的缺点,在实际中常采用组合推荐。在组合推荐上,国外的有关学者提出了七种组合思路:

(1)加权:加权多种推荐技术结果。

(2)变换:根据题目背景和实际情况采用不同的推荐技术。

(3)混合:同时采用多种推荐技术给出多种推荐结果,为用户提供参考。

(4)特征组合:组合来自不同推荐数据源的特征被另一种推荐算法所采用。

(5)层叠:先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步做出更精确的推荐。

(6)特征扩充:一种技术产生附加的特征信息嵌进到另一种推荐技术的特征输进中。

(7)Metal-Level:一种推荐方法产生的模型作为另一种推荐方法的输进。