综述数据挖掘技术在物流领域中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综述数据挖掘技术在物流领域中的应用
2007级物流工程一班
200730611470欧阳家文
摘要:本文主要内容是综述数据挖掘技术在物流领域中的应用。文章首先对数据挖掘技术做一个简单的介绍,接着介绍数据挖掘在物流业中的应用过程,最后介绍物流中关于数据挖掘应用的管理问题。
关键词:数据挖掘数据仓库物流领域应用
1,应用背景
物流是现代商品流通系统的重要组成部分,物流业的发展程度,反映了一个国家和地区经济的综合配套能力与社会化服务程度,是其经济发展水平的集中体现。作为继劳动力和自然资源之后的“第三利润源泉”,现代物流产业的发展已经成为拉动我国经济发展的新增长点。与此同时,现代物流系统是一个庞大复杂的系统,特别是全程物流、包括运输、仓储,配送、搬运、包装和再加工等环节,每个环节的信息量非常大,使企业很难对这些数据进行有条理,有选择性的分析。如何将企业中积累的大量的原始客户数据转化成有用的信息为决策者提供决策支持,已经成为数据库研究中一个很有应用价值的新领域,数据挖掘技术由此应运而生。数据挖掘技术能帮助企业在物流信息管理系统中,及时、准确地搜集数据并对其进行分析。对客户的行为及市场趋势进行有效的分析,了解不同客户的爱好,从而为客户提供有针对性的产品和服务。提升企业的客户满意度,对公司的长远发展有着极大的促进作用。
2,什么是数据挖掘技术?
数据挖掘技术是利用人工智能(AI)和统计分析等技术,在海量数据中发现模型和数据间的关系,自动地帮助决策者分析历史数据和当前的数据,并做出归纳性的推理,从中挖掘出潜在的模式,从而预测客户的行为,帮助企业的决策者调整市场策略、减少风险、做出正确的决策。结合现代物流的特质和外部环境考虑,数据挖掘技术能够提供越来越强大的支持功能。从商业的角度考虑,由于在商业行为中存在着大量的信息,而这些信息并不是都是所需要的,也就是,它是有噪声的,模糊的,随机的数据,必须通过某种技术对这些隐含在其中的,人们不知道的,但又是潜在有用的信息和只是的过程。只有通过类似于数据挖掘的这样的技术对商业数据库进行抽取,转换,分析等操作,才可以让这些埋藏着的金子发光发亮。
3,数据挖掘技术的特点
数据挖掘技术具有以下特点:
( 1) 处理的数据规模十分庞大, 达到GB、TB 数据级, 甚至更大。
( 2) 查询一般是决策制定者提出的即时随
机查询, 往往不能形成精确的查询要求,
需要靠系统本身寻找其可能感兴趣的东西。( 3) 在一些应用中( 如商业投资等) , 由
于数据变化迅速,因此要求数据挖掘能快速
做出相应反应以随时提供决策支持。
( 4) 数据挖掘中, 规则的发现基于统计规律。因此, 所发现的规则不必适用于所有数据, 而是当达到某一临界值即认为有效。因此, 利用数据挖掘技术可能会发现大量的
规则。
( 5) 数据挖掘所发现的规则是动态的, 它
只找到了当前状态的数据库具有的规则,
随着不断地向数据库中加入新数据,需要随
时对其进行更新。
4,数据挖掘的一般过程
数据挖掘过程可以大体分为四个步骤:数据准备,数据挖掘,结果的解释和评价,用户界面。如图1:
图1 数据挖掘一般过程
步骤1:数据准备。
(1)数据选择。搜索所有与业务对象有关的内部和外部数据信息,并从中
选择出适用于数据挖掘的应用的数
据。以物流领域中的仓库管理为例,
仓库管理中通常会对货物进行一定
的分类,从而来有效利用平面,空
间利用率,同时让工作流程更加的
高效。在物流上,通常取用ABC分类
法(即按货物的价值与数量)进行
分类。而这些数据多从市场上搜集
得来,部分是直接从零售商处取得
的。在这种情况下,数据选择应选
择那些跟市场销售上有更多关联的
数据。
(2)数据的预处理。研究数据的质量,为进一步的分析做准备,并确定将
要进行的挖掘操作的类型。仍以上
述例子说明,通过各类市场搜集回
来的各种数据中存在有很多的噪音,
例如由于某些特别的原因,导致某
产品在特定的短时期内价格有所上
升,偏离平时情况。数据预处理则
是要先对这样的偏离的数据预先剔
走。
(3)数据的转换。将数据转换成一个分析模型。这个分析模型是针对挖掘
算法建成的,建立一个真正的适合
挖掘算法的分析模型是数据挖掘成
功的关键。
步骤2:数据挖掘。
对所得到的经过转换的数据进行挖
掘,除了进一步完善挖掘算法外,
其余一切工作都能自动完成。以下
一些情况可能影响数据挖掘的效果。
以上述例子为例如:出现填写错误
的订单;部分重复的订单数据;缺
少相应可以实施的功能;挖掘出来
的的结果缺乏充分的理由;耗时太
长等。
步骤3:结果的解释和评价。
解释并评估结果,其使用的分析方
法一般应视不同的数据挖掘操作而
定。根据最终用户的决策目的对提
取的信息进行分析,把最有价值的
信息区分出来,并且通过决策支持
工具提交给决策者。因此这一步骤
的任务不仅是把结果表达出来。还
要对信息进行过滤处理,如果不能
令决策者满意,需要重复以上数据
挖掘过程。
步骤4:用户界面。
将分析所得到的知识集成到业务信
息系统组织结构中去。
5,物流领域中的数据挖掘过程
(1)定义商业问题。每一个客户关系管理应用程序都有一个或多个商业目标,为此需要建立恰当的有针对性的模型。在数据挖掘之前,应从企业角度分析要达到的需求和目标,将物流目标转换成数据挖掘目标,给出数据挖掘问题的定义,并设计一个达到目标的初步计划。
(2)建立行销数据库。因为操作性数据库和共同的数据仓库常常没有提供所需格式的数据,因此需要建立一个行销数据库。建立行销数据库时,要对它进行净化。因为需要的数据可能在不同的数据库中,所以需要集成和合并数据到单一的行销数据库中,并协调来自多个数据源的数据在数值上的差异。
(3)为建模准备数据。根据已确定的挖掘目标,选择挖掘的数据源,一般包括企业客户数据库、业务数据库、外部数据库,对取得的各种数据源进行预处理,检查数据的完整性和一致性。