数据挖掘与算法作业

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

论文题目:数据挖掘算法在电子商务推荐系统的应用学科、专业名称:电子商务专业

考试科目:数据挖掘算法

数据挖掘算法在电子商务推荐系统中的应用摘要

在电子商务中,企业只有不断地扩张,才能在竞争中保持自己的优势。其中如何留住老顾客并不断吸引新顾客的加入是企业实现扩张和获取利润的一个重要方面。本文主要是针对电子商务企业中顾客的消费行为进行分析研究的基础上展开论述的。通过聚类算法,对具有不同消费行为的顾客进行分类,利用关联规则算法对顾客的购物篮进行分析,通过算法的组合提高推荐的精度和准确性,从而更好的为顾客服务,以达到留住老顾客和吸引新顾客的目的。

一、引言

电子商务规模的迅速增长在给用户带来更多选择机会的同时,也使得用户搜索所需商品的成本越来越高。电子商务推荐系统可以向用户提供商品推荐,帮助用户找到所需商品,满足用户个性化的需求,将用户从浏览者转变为购买者,通过网站与用户的互动提高了用户的忠诚度,从而增加企业的效益,同时将用户从繁重的搜索任务中解脱出来。目前几乎所有的大型电子商务网站都不同程度地使用电子商务推荐技术,比如Amazon、CDNow、ebay和dangdang等。

二、电子商务推荐系统概述

电子商务推荐系统的定义为:“利用电子商务网站向客户提供商品信息和建议, 帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。该定义现已被广泛引用[1]。1998 年7 月, 由美国AAAI 组织各学者在威斯康辛州专门召开了以推荐系统为主题的会议,集中讨论了推荐系统的发展问题。目前,推荐系统已广泛运用到各行业中,推荐对象包括书籍、音像、网页、文章和新闻等。推荐系统可以是根据其他客户的信息或是此客户的信息, 根据客户的购买频率、消费金额和购买模式预测未来的购买行为, 为客户提供个性化服务[2]。根据挖掘的客户行为模式和购买组合来获取新客户、保持老客户、细分客户和实现交叉销售。

电子商务推荐系统可以在网页的浏览者中发掘隐藏着的购买者,还可以促进消费,刺激浏览者的购买欲望,并分析购买者的购物习惯,产生推荐集合,留住客户。推荐系统是电子商务不可或缺的重要组成部分。它的个性化发展也直接对电子商务的发展产生影响[3]。至今在电子商务中研究个性化推荐系统也一直是数

据挖掘领域与电子商务领域研究的热点问题所在。

推荐系统在电子商务网站中的作用主要有三方面: ①将电子商务网站浏览者转变为购买者; ②提高电子商务网站交叉销售能力; ③提高顾客对电子商务网站忠诚度。应用数据挖掘技术使推荐系统更智能化, 学习能力更强, 推荐效果更好; 其实质是为终端用户和电子商务营销决策者提供相关个性化和智能化服务。

电子商务推荐系统, 根据数据源选取大致可以分为基于顾客评分/评价和基于顾客购买历史两类。基于用户评分/评价的推荐系统比较多, 如LIBRA, Item-Based Top- N recommendation 等。这类推荐系统缺乏通用性, 因为收集评分数据需要顾客一些额外配合, 这不是每个电子商务网站都能做到的; 其推荐结果也并不一定客观, 因为不能保证顾客评分能客观反映顾客购买兴趣。基于顾客购买历史的推荐系统则避免了上述不足, 具有良好的通用性。现在基于规则的推荐系统, 往往利用实际交易数据作为数据源, 它符合数据源通用性要求。基于关联规则的推荐系统特点是实现起来比较简洁、推荐效果良好, 并能动态地把客户兴趣变化反映到推荐结果中[4]。目前,国内在网上购物个性化推荐上的发展状况还基本停留在采用一些简单的推荐策略阶段,比如分类浏览、销售排行、热卖商品、热门新闻等等,并没有实现真正意义上的个性化智能推荐。因此,从某种程度而言,网上购物网站,特别是国内的各网上购物网站的效用并没有得到最大化的发挥,用户的购买潜力也没有得到全部地激发和挖掘。所以,推行网上购物中的个性化推荐技术和应用势在必行。个性化推荐系统是一个非常值得我们关注和研究的方向。各种数据挖掘方法如关联规则挖掘技术[5,6]、聚类挖掘技术[7,8]被广泛的应用于个性化推荐中以提高推荐精度。

三、数据挖掘的概述

商业智能的关键成员包括数据挖掘、联机分析处理(Online Analytical Processing)、企业报表和ETL(数据抽取、转换和加载)[6]。其中,作为关键成员之一的数据挖掘指的是分析数据,使用自动化或半自动化的工具来挖掘数据中隐含的模式。

企业在日常的运营过程中,需要借助一些商业软件来完成,经过这些软件的不断收集和积累,企业的数据库拥有了海量数据。具体来说,这些海量数据大部分来自金融应用程序、企业资源管理系统(ERP)、客户关系管理系统(CRM)

以及Web 日志等[7]。对企业的管理者来说,这些海量数据看似数据丰富,但在企业的具体应用中却显得知识贫乏。数据挖掘的目的正在于此:从已有数据中提取模式,从而提高已有数据的内在价值,并把数据进行提炼、转化,使之成为有助于企业进行商业智能管理的知识。

(一)数据挖掘解决的商业问题

数据挖掘可以应用于许多应用,能解决各种商业问题,为企业提供许多商业价值。下面就是数据挖掘技术能够解决的一些比较典型的商业问题:(1)客户流失分析:流失性分析可以帮助市场经理了解客户流失的主要原因,以此来改善企业与客户的关系,增加客户的忠诚度[8]。

(2)销售预测:在该购物网站,下个月能卖多少个移动硬盘?下个月的库存又是多少?数据挖掘预测技术可以帮助解决与时间相关的销售方面的问题。

(3)客户细分:哪些人是该购物网站的客户?客户细分能够帮助市场经理了解客户个人信息的区别,并基于此采取适当的市场策略[9]。

(4)购物篮分析:电子商务企业根据顾客购买的商品,推荐另外的相关商品,这些推荐的商品就来自于数据挖掘分析。如对销售结果进行分析来判断商品是否应该捆绑销售。可以使用数据挖掘的结果来创建一个在线指导系统,或者决定如何捆绑销售能将利润最大化。

(5)欺诈检测:这份保险存在欺诈吗?保险公司一天要处理成千上万个投诉,但是保险公司不可能对每一个投诉进行调查。数据挖掘技术能够帮助保险公司鉴别那些投诉可能具有欺诈性。

(6)广告定位:针对特定的用户应该使用什么样的广告标语?一些门户网站和Web 零售商希望为他们的客户个性化广告的内容。通过使用客户的导航模式或者在线购买模式,这些站点可以利用数据挖掘解决方案在客户的浏览器中显示个性化广告。

(7)风险管理:给某客户的一项贷款能批准吗?这是银行业极为常见的问题。数据挖掘技术能够用来评价客户的风险级别,帮助管理者对每一项贷款做出合适的决定。

(二)数据挖掘的任务

大量的商业问题可以采用数据挖掘技术得以解决。在划分数据挖掘的任务的

相关文档
最新文档