Web数据挖掘在电子商务中的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Web数据挖掘在电子商务中的应用
摘要:Web数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。

关键词:电子商务;Web数据挖掘;应用
随着网络技术和数据库技术的成熟,传统商务正经历一次重大变革,向电子商务全速挺进。

这种趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需求信息和购物行为特征的可能性。

一、电子商务中Web数据挖掘的数据源
在Web上可以用来作为数据挖掘分析的数据量比较大,而且类型众多,总结起来有以下几种类型的数据可用于Web数据挖掘技术产生各种知识模式。

1.服务器数据
客户访问站点时会在Web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。

一般包括severlogs, error logs, cookie logs[1]等。

这些日志文件一般都有通用的格式,以W3C的格式最为流行。

2.查询数据
它是电子商务站点在服务器上产生的一种典型数据。

例如,对于在线客户也许会搜索一些产品或某些广告信息,这些查询信息就通过cookie或是登记信息连接到服务器的访问日志上。

目前还没有一个标准的查询数据格式。

3.在线市场数据
这类数据主要是传统关系数据库里存储的有关电子商务站点信息、用户购买
信息、商品信息等数据。

4.Web页面
主要是指HTLM和XML页面的内容,包括文本、图片、语音、图像等。

5.Web页面超级链接关系
主要是指页面之间存在的超级链接关系,这也是一种重要的资源。

6.客户登记信息
客户登记信息是指客户通过Web页输入的、要提交给服务器的相关用户信息,这些信息通常是关于用户的人口特征。

在Web的数据挖掘中,客户登记信息需要和访问日志集成,以提高数据挖掘的准确度,使之能更进一步的了解客户。

二、面向电子商务的Web数据挖掘实现技术
1.统计分析
统计方法是从Web站点中抽取知识最常用的方法,对会话文件中的各个维度,例如浏览时间、路径长度,都可以进行频度、平均值的统计分析。

许多Web 浏览分析工具会定时提交统计分析报告,这些报告的内容通常包括最常访问页面、页面的平均浏览时间和平均路径长度,有些统计报告还提供了简单的错误分析功能,例如探测非法访问的次数、出错最多的URL。

尽管这种分析缺少深度,但仍有助于改进系统性能,增强系统安全性,便于站点修改,并能提供决策支持。

2.路径分析
路径分析可以用于判定在一个Web站点中最频繁访问的路径,利用这些信息可以改进站点的设计结构。

还有一些其他的有关路径的信息通过路径分析可以得出,例如:
⑴70 %的用户端在访问/company/product2时,是从/company开始,经过/company/new,/company/products,/company/productl。

⑵80 %的访问这个站点的客户是从/company/products开始的。

⑶65 %的客户在浏览4个或更少的页面后就离开了。

第一条规则在/Company/product2页面上有有用的信息,但因为客户对站点进行的是迂回绕行的访问,所以这个有用信息并不明显。

第二条规则说明了客户对站点的访问一般不是从主页开始的,而是从/company/products开始的,如果在这个页面上包含一些产品的目录类型的信息,将是一个不错的主意。

第三条规则说明了客户在网站上驻留的时间。

既然客户在这个网站上浏览一般不超过4个页面,就可以把重要的商品信息放在这些页面中。

3.关联分析
关联分析的目的就是为了挖掘出隐藏在数据间的关联规则。

在电子商务中关联分析也就是找到客户对网站上各种文件之间访问的相互联系,找出客户购买行为的各种关联。

进行Web上的数据挖掘,构建关联模型,我们可以更好地组织站点,减少用户过滤信息的负担,可以根据客户当前的购买行为给客户提供推荐。

关联分析在电子商务中的应用主要表现在两个方面:
第一,发现访问页面之间的关联规则。

也就是挖掘群体用户访问页面之间的关联关系,从而改进电子商务网站的设计。

第二,发现什么商品组或集合客户多半会一起购买,从而可以向客户提出推荐或者把相关的商品的链接放在一起。

其中把相关的商品的链接放在一起是一个典型的购物篮分析。

仍以上例为例利用关联分析,我们可以找到以下的相关性:
⑴40%的客户访问页面/company/productsl 时,也访问了company/products2。

⑵30%的客户在访问/company/special时,在/company/productsl进行了在线定购。

利用这些相关性,可以更好的组织站点,实施有效的市场策略。

4.分类规则的发现
分类发现就是给出识别一个特殊群体的公共属性的描述,这个描述可以用来分类新的项。

分类分析法的输入集是一组记录集合和几种标记,首先为每一个记录赋予一个标记,即按标记分类记录,然后检查这些标定的记录,描述出这些记
录的特征,这个特征可以用来对新添加到数据库里的数据项进行分类。

在Web挖掘中,分类技术可以根据用户的个人信息或共同的访问模式得出访问某一服务器文件的用户特征。

另外,通过用户的注册表、在线调查表也可以得到用户的一些特性。

比如,发现在线订购的客户中有60%是20-30岁生活在大中城市的年轻人,得到分类后,就可以针对这一类客户的特点展开商务活动,提供有针对性的个性化的信息服务。

5.聚类分析
聚类分析用于把有相似特性的用户、数据项集合到一起。

聚类分析法不同于分类规则,其输入集没有进行任何分类,是一组未标定的记录。

Web使用挖掘中通过聚类技术可以把具有相似浏览模式的用户集中起来,提供更适合、更令用户满意的服务。

在Web日志中,聚类顾客信息或数据项能够便于开发和执行未来的市场战略,包括自动给一个特定的顾客聚类发送销售邮件,为一个顾客聚类动态地改变一个特殊的站点等。

6.序列模式的发现
序列模式挖掘就是要挖掘出交易集之间有时间序列关系的模式。

在网站服务器日志里,用户的访问是以一段时间为单位记载的,经过数据净化和事件交易确认以后是一个间断的时间序列,这些序列反映出用户的行为。

序列模式挖掘侧重点在于分析数据间的前后或因果关系,在时间有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式。

发现序列模式能够便于进行电子商务的组织预测客户的访问模式,对客户开展有针对性的广告服务。

三、Web 数据挖掘在电子商务中的应用
在Internet电子商务中,对于一个特定的商务站点来说其拓扑结构是己知的。

虽然不同的用户在不同的时期会有不同的浏览模式,但其长期趋势应该是稳定的。

因此通过分析一定时期内站点上的用户的访问信息,便可以发现该商务站点的潜在客户群体、相关页面、聚类客户等,而这些信息对一个电子商务网站来说是非常有价值的。

1.潜在客户的发现
在对Web的客户访问信息的挖掘中,利用分类技术可以在Internet上找到未来的潜在客户,获得这些潜在的客户市场。

通常的策略是先对已经存在的访问者进行分类,一般分为三种: “no customer”、“visitor once”和“visitor regular”。

对于一个新的访问者,通过在Web上的分类发现,识别出这个客户与已经分类的老客户的一些公共的描述,然后从它的分类判断这个新客户是属于有利可图的客户群,还是属于无利可图的客户群,决定是否要把这个新客户作为潜在的客户来对待。

客户的类型确定后,就可以对客户动态地展示Web页面,页面的内容取决于客户与销售商提供的产品和服务之间的关联。

2.客户的驻留
对客户来说,传统客户与销售商之间的空间距离在电子商务中己经不存在了。

在网上,每一个销售商对于客户来说都是一样的,那么如何使客户在自己的销售站点上驻留更长的时间,对销售商来说将是一个挑战。

为了达到这一目的,就应该了解客户的浏览行为,知道客户的兴趣及需求所在,动态地调整Web页面,以满足客户的需要。

通过对客户访问信息的挖掘,就能知道客户的浏览行为,从而了解客户的兴趣及需求。

3.改进站点的设计
站点上页面内容的安排和连接就如超级市场中物品在货架上的摆设一样,把具有一定支持度和信任度的相关联的物品摆放在一起有助于销售,利用在Web 上的关联规则的发现,可以针对客户动态调整站点的结构,使客户访问的有关联的文件间的链接能够比较直接,让客户能够容易地访问到想访问的页面。

网站如果具有这样的便利性,能给客户留下较好的印象,增加了再次访问的机率。

4.聚类客户[2]
在电子商务中客户聚类是一个重要的方面。

通过分组具有相似浏览行为的客户,并分析组中客户的共同特征,可以帮助电子商务的组织者更好地了解自己的客户,向客户提供更适合、更面向客户的服务。

[2]例如,有一些客户都花了一段时间浏览“baby toys”“baby furniture”页面,经过分析这些客户被聚类成为一组。

销售商根据分析出来的聚类信息,就可以知道这是一组“expecting parents”客户,对他们所进行的业务活动当然也就不可能同于其他被聚类了的客户如“college students”、“office ladies”。

四、结束语
Web数据挖掘是当今世界上的热门研究领域,其研究具有广阔的应用前景和巨大的现实意义。

Web数据挖掘所带来的好处, 是与用户的需求及数据挖掘技术本身的发展相关的。

在充分了解客户的爱好、需求的基础上。

利用各种Web 挖掘技术,设计出能满足不同用户群体需要的个性化电子商务网站, 从而提供给客户更加满意的服务。

把数据挖掘技术与电子商务进行有机结合,选用适合电子商务数据的挖掘技术,提高数据挖掘的效率,从中发现有意义的规则或模式,无疑会给企业带来竞争上的某些优势。

参考文献:
[1] Jiawei Han,Micheline Kamber,范明,孟小峰(译),数据挖掘概念与技术[M].北京:机械工业出版社,2004:3-4.
[2]邹显春,谢中,周彦晖.电子商务与Web数据挖掘[J].计算机应用,2001,5:21-23.。

相关文档
最新文档