浅析数据挖掘技术的发展及应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键 词 : 据 挖 掘 ; b挖 掘 ; 用 ; 数 We 应 综述
律发现系统 B C N 经验公式发现系统 AO、 置。 数据挖掘在该铽域 的应用将使这 魁 ! 1 概述 极为可观的作用。 随着信息技术的高速发展, 数据库应用的规 3 . 4统计分析方法 利用统计学原理对数据库中的数据进行分 4 在生物与医学的应用 . 5 模、 范围和深度空前发展, 人们迫切需要一种自动 数据挖掘在生物信 息 中已经被广泛应用, 学 地和智自 将待处理的数据转化为有用的信息和 析, 幽 能得到各种不同的统计信息和知识, 它是一门 知识的方法, 从而达到为决策服务的目的。在这种 独立的学科 , 也作为数据挖掘的 一大类方法, 包括: 情况下, 数据挖掘技术应运而生。 数据挖掘是—个 常用统计 、 相关分析、 回归分析 、 差异分析、 聚类分 兴未艾。 网络彰 粥} 掘和生物信息学中传统的獭 据 判断分析。 挖掘相比, 有许多不同之处。 生物信息学中的数据 从大量有噪声、 不完整数据中提取出 有意义模式知 析、 识的过程。 所提取、 挖掘的数据对象可 以 是数据 库 3 模糊数学方法 - 5 试图找出 某种规律。而网络数据挖掘更多是利 或数据仓库内 , 容 也可以是其它数据源内 容。数据 模糊性是客观存在的 , 当系统的复杂性越高 , 析, 领域, 这其中主要涉 其精度的复杂性越高, 其精确化能力便越低, 这就 用网络技术、 网页源代码租— 些语青语义 学的知识 利用模糊集合理论进行数据挖 及: 数旧荤 系统、 数据仓 统计学、 库、 机器学习、 数据 意味着模糊性越强。 可观化 检索和奇睦能} { 算等。数据挖掘是一 掘的方法有 : 模糊模式识别、 模糊聚类、 模糊分类和 析 、 提炼、 , 挖掘 再返回给用户结果。 经过网络数据 这 其中主要 包 模 糊关联 规则等 。 挖掘处理过的结果 比 用户直接从网上查询得到的 数据 3 可视化技术 6 _ 结果更精练 , 更符合用户查询的要求。 可视化技术是—种图形显示技术。例如, 把数 5 数据挖掘的发展趋势 挖 、 潮 田 } S 出。 掘 椁萌 锕 【 蝴 { 未 2 数据挖掘的分类 据库中多维数据变成多种图形 , 这对于揭示数据中 曼 改进数据挖掘算法。 1 现有的 数据挖掘算法 在本质 以 及分布规律起到很强的作用。 对数据挖 由于历史原因 存在种种缺陷, 为了提高数据挖掘系 数据 挖掘可按数据库类型、 挖掘对象、 挖掘任 内 务、 挖掘方法与技术以及应用等 r I 介方面进行分类 掘过程可视化, 并进行人机交互可提高数据挖掘的 统舸 用性、 可扩展性、 高效性, 我们需要对—些数 四 效果。可视化方法有以下几种 :提取 n何图元、 l 绘 据挖掘算法进行改进, 需要探壕 的挖掘算法, 新 以 数据 挖掘最开始是从关系数据库中 挖掘知识 制、 显示和演放 。 适应新知识环境下的数据挖掘。 发展起来的, 数据库类型的不断增加, 随着 现有: 关 4数据挖掘的应用 5 b .We 挖掘。随着计算机硬件和软件的升 2 系数据挖掘、 模蝴数据挖掘、 历史数据挖掘、 空间数 数据挖掘研究具有广泛的应用前景 ,因为数 级 , b we 数据的结构也将会发生变化, 数据量将会 据挖掘产生的知识可以用于决策支持、信息管理、 更多更复 有关 we 内容挖掘、 b日 杂。 b We 志挖擗和 挖掘的对象分, 除了数据库数据挖掘外 , 还有文本 科学研究等许多领域。 数据挖掘技术与各个行业的 We 数据挖掘。 b 有机结合体现了其蓬勃的生命力, 而这种趋势正在 按挖掘任务分类有 : 关联规则挖掘、 序列模式 以前所未有的速度继续向前发展。 5 3数据挖掘中的隐私保护与信息安全。任何 挖掘、 聚类数据挖掘、 分类数据挖掘、 偏差数据挖掘 4 . 电信业 中的应用 I在 事情都有其两面性, 数据挖掘领域也不例外。 在挖 和预测数据挖掘等类型。 各类数据挖掘任务不同, 在激烈 的电信市场竞争和迅速的业务扩张 掘数据产生财富的同 , 时 随之产生的就是隐私 舞 世棼 中,可以利用数据挖掘技术的帮助来理解商业行 和信息安全问题 。 采用的方 法和技术也将会不同。 3数据挖掘方法 为、 确定电信模式、 捕捉盗用行为、 更好的利用资源 结束语 数据挖掘方法是由人工智能、机器学习的方 和提高 服务质 量。 数据挖掘技术 法发展而来 , 结合传统的统计分析法 、 模糊数学方 4 在金融 领域 中的应用 2 领域, 商业利益强大驱动力将会不停地促进它的发 法以及科学计算可视化技术、 以及数据库为研究对 多数银行和金融机构产生的金融数据通常比 展。每年都有新的数据挖掘方法和漠型问世, 人们 象, 形成数据挖掘的方法。 较完整、 靠, 可 这对 系统 对它的研究正日 益广泛和深 ^ 。尽管如此, 数据挖 l 纳学习方法 归 相当有利 。在具 体的应用 中 , 多维数据 分析来 掘技术仍然面I着许多问题和挑战: 采用 I 缶 如数据挖掘方 归纳学习方法是 目前重点研究的方向之一, 使 用 数据可视 化 、 分类 、 法的效率有待提高 研究成男 多。 从采用自 饨 E , 看 分为两大类: 信 聚类分析、 序列模式分析等工具侦破洗黑钱和其他 息论方法和集合论方法。 信息论方法是利用信息论 金 融犯罪行 为。 以解决异质数据集的!瞻 !} i 挖掘问 动态数揍乖 臼 题; }咖 4 在零 售业 中的应用 B 识的数据挖掘;网络与分布式环境下的数据挖掘 示形式是决策讨, 所以—般文献中 称它为决策树方 零售业是数据挖掘的主要应用领域 ,零售数 等; 今年来多媒体数据库发展很快, 面向多媒体数 法 该类 方法的实用效果好 , 较大。 影响 信息论方 据挖掘有助亏 分顾客群体, 使用分类技术和聚类 据库的挖掘技术和软件今后将成为研究开发的热 法中较有特色的方法有以下几种: 3等方法 、 技术 , I D I — 可以更精确地挑选出潜在的顾客 , 识别顾客 点。 B E方法、 L 集合论方法、 概念树方法、 粗糙集方法 、 的购 买行 为 , 顾客 购买模 式 和趋 势 , 关 联 发现 进行 参 考文献 覆盖正例排斥反例方法。 分析, 以便更好地进行货架摆没等等。 f旷海蓝. 1 】 基于粗糙基理论的数据挖掘算法研 ) 究口 l 3 仿生物技术 . 2 4 . 4在工业生 产的应用 长沙: 长沙理工大学,06 2 0. 仿生物技术典型的方法是神经网络方法和遗 工业生产领域是数据挖掘应用摄有潜力的应 [田苗苗. 2 】 数据挖掘之决策树方法概述口计算机与 l 传算法。 类 已 : 这两 磁 经形吲 的到 琳 系 片领域之一。在生产工业领域, 它 j 大部分工厂都积累 现代 化 ,o 4 2 o . 巨大的作用 , 我们将它们 了大量的实际生产数据,这些数据大多以数据库、 [胡永刚. 3 】 数据挖掘中可视化教术综述Ⅱ计算机与 l 归并为仿生物技术类。 2o (o . 数据文件、 生产记录等形式存在 , 它们蕴涵了与生 现在 化 .oa1) 3 3公式 发现 产设备、 生产过程卡 关的许多规律性知识和生产决 『( 韩家炜, H 4 加) J 堪博著, 范明, 峰泽数据挖掘 孟小 概 在工程和科学数据库中对若干数据项进行 策 、 操作人员 曝 作决策和控制经验。由于缺乏必 念 与技 术 ( 二 版 ) 第 ,北 京 :机 械 工 业 出 版社 .
, 、 。

算的相 应的数学公 式。 常见 的彳物理 定 要 数拊分析 和处理 工具 , 数据 中的大部分 闲 9 这些
2 70 . O0 . 3

6 4—

赵 芳
信息 科学 J l {
浅析数据挖掘 技术 的发展及 应用
马 玉磊
( 、 乡学 院 计 算 机 与信 息 工程 学院 , 南 新 乡 4 30 2 新 乡学院 继 续 教 育 学 院 , 南 新 乡 4 30 ) 1新 河 500 、 河 5 0 0
摘 要: 由于数据挖掘在各行业中的广泛应用, 因而该Baidu Nhomakorabea术 引起 了 们的普遍关注, 人 介绍 了 数据挖掘的分类方法和 目前采用较普遍的一些数据 挖掘方法. 、 分析 总结 了数据挖掘技 术在 商业、 b We 挖掘、 科学研 究等几个主要领域 的应用情况 , 综合论述 了数据挖掘 未来的发展趋 势。
相关文档
最新文档