数据挖掘与云计算简介

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据挖掘与云计算的发展和应用

目录

摘要 (2)

一.什么激发了数据挖掘,它是怎样诞生的 (3)

(一)数据时代的发展历程 (3)

(二)数据挖掘工具成为一种迫切的数据分析工具 (3)

(三)数据挖掘的发展阶段 (4)

1.电子邮件阶段 (4)

2.信息发布阶段 (4)

3.EC(Electronic Commerce),即电子商务阶段 (4)

4.全程电子商务阶段 (5)

二.数据挖掘的概述 (6)

(一)什么是数据挖掘 (6)

(二)数据挖掘的步骤 (6)

1.数据清理 (6)

2.数据集成 (7)

3.数据选择 (7)

4.数据交换 (7)

5.数据挖掘 (7)

6.模式评估 (7)

7.知识表示 (7)

(三)我们需要对何种数据进行数据挖掘 (7)

1.关系数据库 (7)

2.数据仓库 (8)

3.事务数据库 (8)

4.高级数据和信息系统与高级应用 (8)

三.数据挖掘的应用 (10)

(一)数据挖掘的应用领域 (10)

1.企业应用 (10)

2.科学研究。 (10)

3. 3.Web挖掘。 (11)

4.在医学上的应用。 (11)

5.在金融上的应用。 (12)

(二)数据挖掘在各个行业的应用 (13)

1.数据挖掘在电信领域的应用。 (13)

(1)电信业务概述 (13)

(2)数据挖掘在电信业中的应用背景 (14)

(3)数据挖掘应用于电信业中的实例 (14)

2.数据挖掘在游戏领域的应用。 (17)

(1)数据挖掘应用于游戏领域的背景 (17)

(2)Web挖掘在网页游戏开发及运营中的作用 (17)

(3)指导网页游戏的开发 (17)

(4)促进和帮助网页游戏的更新和升级 (18)

(5)帮助企业保有一定数量个客户群并挖掘潜在客户 (18)

(6)提高点击率增加广告收益 (19)

四.数据挖掘与云计算的发展趋势和前景 (20)

(一)数据挖掘的发展趋势和前景 (20)

1.改进数据挖掘算法。 (20)

2.数据挖掘原语。 (20)

3.OLAM。 (20)

4.可视化数据挖掘。 (21)

5.Web数据挖掘。 (21)

6.多媒体数据挖掘。 (21)

(二)云计算的发展趋势和前景 (22)

1.云计算的提出和概念 (22)

2.云计算的发展。 (22)

五.数据挖掘与云计算的关系 (24)

(一)基于云计算的数据挖掘分析 (24)

参考文献 (25)

摘要

数据挖掘是一项通用的知识发现技术。数据挖掘日益受到了人们的关注,并已成为当前计算机领域的一大热点。数据挖掘带来的了显著的经济效益,最先应用于金融和工商业领域。它们都在利用数据挖掘技术帮助管理客户生命周期的各个阶段,包括争取新的客户、在已有客户的身上赚更多的钱和保持好客户。当然电信也应用的相当广泛。电信业务的特点是数据量庞大,业务系统众多,所以积累了大量的数据资源可供挖掘。云计算是一种基于互联网的、大众参与的计算模式,其计算资源(计算能力、存储能力、交互能力)是动态、可伸缩、且被虚拟化的,而且以服务的方式提供。过去对海量数据的处理主要是通过高性能机或者更大规模的计算设备来实现,现在通过基于云计算的数据挖掘能更好地达到目的。采用云计算模式有许多好处,成本低廉、容错性强、计算速度快、程序开发便捷、节点的增加更容易。可以说云计算是数据挖掘中普遍适用较为理想的计算模式,也是我们从海量数据中找到有用、可理解的知识的技术手段。

关键字:数据挖掘,知识发现,信息处理,云计算,海量数据

一.什么激发了数据挖掘,它是怎样诞生的(一)数据时代的发展历程

柏拉图曾经说过一句话,需要是发明之母。今年来,数据挖掘引起了信息产业和整个社会的极大关注,其主要原因是存在可以广泛使用的大量数据,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括市场分析、欺诈检测、顾客保有、产品控制盒科学探索等。

在过去的30年里,计算机硬件技术稳步的、令人吃惊的进步导致了功能强大的和价格可以承受的计算机、数据收集设备和存储介质的大量供应。这些技术大大推动了数据库和信息产业的发展,使得大量数据库和信息储存库用于事务管理、信息检索和数据分析。(二)数据挖掘工具成为一种迫切的数据分析工具现在数据可以存储在很多不同类型的数据库和信息储存库中。最近出现的一种数据储存库的系统结构是数据仓库。这个是一种多个异构数据源在单个站点以统一的模式组织的储存库,以支持来管理决策。

数据丰富加上对强有力的数据分析工具的需求可描述为数据丰富,但信息匮乏。快速增长的海量数据收集、存放在大型和大量数据储存库中,没有强有力的工具,理解他们已经远远超出了人的能力。结果,收集在大型数据储存库中的数据变成了“数据坟墓”—难得在访问的数据档案。如果这样的话,那么一些重要的决策常常不是基于数据储存库中信息丰富的数据,而是基于决策者的直觉,因为决策者

缺乏从海量数据中提取有价值知识的工具。此外,当前的专家系统技术通常依赖用户或领域专家人工地将知识输入知识库中。遗憾的是,这一个过程常常有偏差和错误,并且耗时和费用高。

因此,对于处理海量的数据得到有用的知识,数据挖掘工具是一种极为迫切的需要。数据挖掘工具进行数据分析,可以发现重要的数据模式,对商务策略、知识库、科学和医学研究做出巨大贡献。正在扩大的数据和信息之间的裂口呼唤系统地开发数据挖掘工具,将数据坟墓转换成知识“金块”。

(三)数据挖掘的发展阶段

1.电子邮件阶段

这个阶段可以认为是从70年代开始,平均的通讯量以每年几倍的速度增长。

2.信息发布阶段

1995年起,以Web技术为代表的信息发布系统,爆炸式地成长起来,成为目前Internet的主要应用。中小企业如何把握好从“粗放型”到“精准型”营销时代的电子商务。

3.EC(Electronic Commerce),即电子商务阶段

EC在美国也才刚刚开始,之所以把EC列为一个划时代的东西,是因为Internet的最终主要商业用途,就是电子商务。同时反过来也可以说,若干年后的商业信息,主要是通过Internet传递。Internet即将成为我们这个商业信息社会的神经系统。1997年底在加拿大温哥华举行的第五次亚太经合组织非正式首脑会议(APEC)上

相关文档
最新文档