浅谈数据挖掘的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅谈数据挖掘的应用
摘要:数据挖掘又称为数据库中的知识发现,其目的是要在大量数据中“挖掘出有趣的可理解的知识”。近年来,数据挖掘引起了各界的极大关注,已经广泛应用于很多方面,并且取得了很好的成果。本文主要阐述了数据挖掘技术在工业生产、商业、网络、医药这四个方面的应用,并介绍了一些成功的应用案例。
Abstract: Data mining,also known as knowledge discovery in databases,aims to “dig out interesting understandable knowledge” in large amounts of data.In recent years,data mining has drawn much attention and has been widely used in many ways,and achieved good results. This article focuses on applications of data mining technology in industrial production,business,networking,medical areas,and introduces some successful application cases.
关键词:数据挖掘;知识发现;应用案例
Key words: data mining; knowledge discovery; applications cases
中图分类号:TP39 文献标识码:A文章编号:1006-4311(2010)36-0095-01
0引言
近年来,数据挖掘引起了各界的极大关注,其主要原因是存在大量数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理、生产控制、市场分析、工程设计和科学探索等。数据挖掘技术目前在很多领域都有成功的应用案例,具体包括:
1在工业生产方面
工程中丰富的数据资源为数据挖掘的应用提供了广阔的空间,具体应用可以概括为以下三个方面:①故障诊断。故障诊断是数据挖掘在工程领域应用非常活跃的一个方向。基本思路就是利用数据挖掘技术得到产生故障的特征数据、故障规则等,对故障进行检测和诊断。对机器故障进行诊断的过程,其实也就是模式获取及模式匹配的过程。②生产优化。生产优化可概括为:在满足必要约束的条件下,改变生产的工艺参数等,使某种与经济效益相关的目标函数达到极值。在生产优化实施中,对大量生产数据进行挖掘找到产品质量与工艺参数的模型关系,分析在多变量作用下的产品质量规律,帮助质检人员、工艺人员弄清影响产品质量的主次因素,提出相应的对策,进一步调整工艺参数,进行质量控制,为实现生产操作优化提供指导。另一方面也为研发新产品提供了数学模型,可以模拟在不同工艺参数下产品的性能特征。③丰富知识库和决策支持系统。工业生产过程的复杂性和生产企业对自身要求(提高资源利用率、降低成本、降低能耗)的进一步提高,使以计算机为工具的更为先进的智能的决策和控制手段得以推广。但智能的决策和控制通常必须要以知识库作为支持,此时仅仅依靠专家对知识的积累是远远不够的,数据挖掘这一有效的知识获取技术正好可以弥补这一缺失。数据挖掘技术可以将提取的潜在模式、规则评估检验后归入知识库,使得先进控制策略充分发挥作用,进一步提高整个生产过程的控制水平。
2在商业方面
2.1 客户盈利能力计算客户盈利能力有助于挖掘有价值客户,公司各个部门之间对客户盈利能力可能有不同理解。分析顾客的忠诚度,可以利用数据挖掘来挖掘忠诚度高的客户;通过数据挖掘技术可以有效计算客户盈利能力;还可以利用数据挖掘预测未来的客户盈利能力。
2.2 客户的保持和流失企业的增长和发展壮大需要不断获得新的客户并维持老的客户。不论企业希望得到的是哪类客户,数据挖掘都能帮助识别出这些潜在的客户群,并提高市场活动的回应率,做到有的放矢。现在各个行业的竞争都越来越激烈,企业获得新客户的成本正在
不断上升,因此建立客户流失预测模型,得出即将流失的客户,对他们采取有效措施进行挽留,从而有效减少客户流失就显得越来越重要,数据挖掘可以帮助发现打算离开的客户,以使企业采取适当的措施挽留这些客户。
2.3 客户获得在没有利用数据挖掘技术时,客户获取的传统方法就是选出一些感兴趣的人口调查其属性,获取这些人口的特征即可。但随着数据量的增大,传统的方法具有不可实现性。利用数据挖掘在扩展客户市场活动时,利用数据挖掘技术挖掘出潜在的客户名单,在客户名单上列出可能对某些产品感兴趣的客户信息,便可更方便的获取更多的客户。
2.4 交叉营销交叉营销是指在向现有客户提供新的产品和服务的营销过程。如那些购买了婴儿奶粉的客户会对你的其他婴儿产品感兴趣。交叉营销的升级形式为:升级营销,指向客户提供与他们已购买的服务相关的新服务。
3在网络方面
随着电子商务的普及,各大商务网站已经大规模使用数据挖掘技术,并且迅速从中取得商业价值。数据挖掘帮助产品经理们改善用户体验,在很多大的互联网公司,这实际上成为了辅佐公司战略的数字神经系统。
在网游业,数据挖掘最成功的应用就是盛大的“平台”战略。也就是把任意一款游戏拿到其从2004年就开始建立的一套“评测”体系去走流程,就可以知道这款游戏到底会不会受到玩家的欢迎。其根据,就来自于盛大在过去运营的上百款游戏的用户数据的记录、分析、关联、最后建立模型。基于这套评测流程,盛大就可以对一款新游戏做出判断,到底该不该运营、如何去改进、潜力有多大,都有了一套从数字出发的答案。
4在医药业方面
近年来,数据挖掘技术在医学领域中的应用越来越广泛。在疾病诊断、治疗、器官移植、基因研究、图像分析、康复、药物开发、科学研究等方面都获得了可喜的成果。南加州大学脊
椎病医院利用Information Discovery进行数据挖掘,该技术已应用到肿瘤学、肝脏病理学、肝炎的生存几率预测、泌尿学、甲状腺病例诊断、风湿病学、皮肤病诊断、心脏病学、神经心理学、妇科学、产科学等医学领域。MiroslavKubat等针对心电图、脑电图等医学推测信号的分析,提出使用决策树来初始化神经络,可以大大提高对测试样本的分类准确率。在国内,中南大学的陈爱斌、夏利民等利用boosting机器学习方法对人脸检测进行了研究。第四军医大的陈雪峰等利用数据库和数据挖掘技术建立的恶性血液病数据库分析系统,不仅可辅助医生做出初步诊断而且对数据具有强大挖掘和分析功能。
数据挖掘在医学上的应用有其自身的优势,因为医学上收集到的数据一般是真实可靠、不受其他因素影响的,而且数据集的稳定性较强。这些对挖掘结果的维护、不断提高挖掘模式的质量都是非常有利的条件。
数据挖掘被称为未来信息处理的骨干技术之一,它以一种全新的概念改变着人类利用数据的方式。未来数据挖掘技术将在更多的领域有更加广泛的应用。
感谢您的阅读!