数据挖掘技术对电子商务平台的作用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘技术对电子商务平台的作用———以京东为例的数据挖掘应用分析

作者:***

班级:12计1

指导老师:***

完成时间:2015.1.3

第一章绪论

1.1背景资料分析 (3)

1.2数据挖掘应用对电子商务领域的意义 (4)

1.3数据挖掘过程 (4)

1.4数据挖掘主要方法 (5)

1.5数据挖掘系统体系结构 (7)

1.6数据挖掘在电子商务中的应用流程 (8)

第二章以京东为例的数据挖掘应用分析

2.1数据挖掘在电子商务中的应用分析——客户获得 (9)

2.11客户获得的定义 (9)

2.12数据挖掘可以对客户获得产生的作用 (9)

2.13客户获得的步骤 (9)

2.2数据挖掘在电子商务中的应用分析——客户流失预测 (11)

2.21客户细分的定义 (11)

2.22客户流失预测步骤 (13)

2.3数据挖掘在电子商务中的应用分析——客户消费特征 (14)

2.31 客户消费特征定义及背景 (14)

2.32 京东建立客户消费特征的过程 (14)

2.33 RSS技术在电子商务平台的应用 (16)

2.34 建立客户消费特征之后可应用的数据模块 (17)

结语 (18)

摘要:

在电子商务平台日益发展的今天,数据分析作为一种科学的手段,可以起到规范市场、节约成本、保护在线交易安全,而数据挖掘这门技术可以从大量繁杂数据中提取有用的信息,并发现特定的规律,为商家对客户的需求信息和行为预测提供可能性。

本篇报告是作者在对数据挖掘课本学习的前提下,以京东商城为例,从互联网上搜集各类数据并进行分析,从客户获得、客户流失预测、客户消费特征这三个方面进行分析,最后归纳出数据挖掘在电子商务应用上的必然性和重要性。

第一章绪论

1.1 背景资料分析

电子商务是指个人或企业通过Internet网络,采用数字化电子方式进行商务数据交换和开展商务业务活动。电子商务的发展促使公司内部收集了大量的数据,并且迫切需要将这些数据转换成有用的信息和知识,为公司创造更多潜在的利润。数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database, KDD),是从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘涉及的科学领域和方法很多,其核心技术经历了数十年的发展其中包括统计,近邻,聚类,决策树,神经网络和规则等

1.2数据挖掘应用对电子商务领域的意义

⑴数据挖掘有助于发现电子商务业务发展的趋势,帮助电子商务企业做出正确的决策,使企业处于更有利的竞争位置。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需求信息和购物行为特征的可能性。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。

⑵数据挖掘有助于客户关系管理,特别是对电子商务客户关系管理起着决定性的作用。数据挖掘主要是找寻隐藏在数据中的信息,例如发现趋势、特征及相关性的过程,也就是从数据中发掘出信息或知识。以此对客户需求进行深入分析以满足企业对个体细分市场的客户关系管理需求。从发现客户到客户分类再到客户管理,数据挖掘通过各种针对性技术为企业客户关系管理提供了强有力的保证。将数据挖掘技术应用于客户关系管理,能够帮助企业深入理解客户,得到更加准确的客户模型,从而改进营销决策和客户服务。

⑶数据挖掘可以促进电子商务平台的发展,加强企业电子商务平台应用的普及度。采用数据挖掘技术将电子商务中丰富的数据源信息进行有效组织利用对电子商务的具有巨大的应用价值。同时数据挖掘对于电子商务平台信息的挖掘分析可以帮助检验电子商务平台的性能,促进电子商务平台的智能化,帮助企业打造更具可操作性及吸引力的消费平台,为消费者提供更便利的消费环境。

⑷数据挖掘有利于企业资源优化,合理分配资源以实现资源价值最大化。数据挖掘进行有效的统计分析挖掘,可以指导营销的组织和分配,让企业在市场竞争中处于有利位置抢占先机。通过数据挖掘可以发现消费者的消费特性,从而帮助制定个性化服务,极大地吸引顾客,既避免资源浪费,又为企业带来巨大的价值。

1.3 数据挖掘过程

挖掘数据过程可以分为3个步骤:数据预处理、模式发现、模式分析。

A.数据预处理

实际系统中的数据一般都具有不完全性、冗余性和模糊性。因此,数据挖掘一般不对原始数据进行挖掘,要通过预处理提供准确、简洁的数据。预处理主要完成以下工作:包括合并数据,将多个文件或多个数据库中的数据进行合并处理;选择数据,提取出适合分析的数据集合;数据清洗、过滤,剔除一些无关记录,将文件、图形、图像及多媒体等文件转换成可便于数据挖掘的格式等。

B.模式发现

模式发现阶段就是利用挖掘算法挖掘出有效的、新颖的、潜在的、有用的以及最终可以理解的信息和知识。可用于Web的挖掘技术有路径选择、关联分析、分类规则、聚类分析、序列分析、依赖性建模等等。

C.模式分析

模式分析是从模式发现阶段获得的模式、规则中过滤掉不感兴趣的规则和模式。通过技术手段,对得到的模式进行数据分析,得出有意义的结论。常用的技术手段有:关联规则、分类、聚类、序列模式等。

1.4 数据挖掘主要方法

a.数据统计方法

使用这些方法一般首先建立一个数据模型或统计模型,然后根据这种模型提取有关的知识。例如,可由训练数据建立一个 Bayesian 网,然后,根据该网的一些参数及联系权重提取出相关的知识。

b.关联规则方法

关联规则是描述数据之间存在关系的规则, 形式为“A1 ∧A2 ∧⋯An →B1 ∧B2 ∧⋯Bn”。一般分为两个步骤: 第一步, 求出大数据项集。第二步, 用大数据项集产生关联规则数据库一组。运用关联规则的数据项往往存在某种潜在关联关系的规则。一找出所有类似的关联规则,对于企业确定生产销售、产品分类设计、市场分析等多方面是有价值的。

c.人工神经网络方法

人工神经网络是由大量的简单神经元,通过极其丰富和完善的连接而构成的自适应非线性动态系统,并具有分布存储、联想记忆、大规模并行处理、自组织、自学习、自适应等功能。人工神经网络是一种有效地预测模型,在聚类分析、奇异点分析、特征提取中可以得到。通过模拟人的神经元功能, 经过输入层、隐藏层、输出层等, 对数据

相关文档
最新文档