论数据挖掘技术及应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

『 … … … 。 ¨ r






பைடு நூலகம்

L…
—— ..一一 - _… ’
— . .—一一 t
图 1 数 据 挖掘 过 程
1 数 据 挖 掘 概 述
数 据 挖 掘 就 是 从 大 型 数 据 集 ( 能 是 不 完 全 的 、 噪 声 可 有 的、 不确 定性 的、 种 存储 形 式 的) , 各 中 挖掘 隐 含在 其 中的 、 人 们 事 先 不 知 道 的 、 决 策 有 用 的 知 识 的 过 程 。数 据 挖 掘 对 的 目的是 为 了从 这 些 数 据 中 抽取 一 些 有 价 值 的 知识 或 信 息 , 高信息 利用率 。 提 数 据 挖 掘 主要 有 以下 对 象 : ( ) 系 型 数 据 库 、 务 型 数 据 库 、 向对 象 的 数 据 库 ; 1关 事 面 () 据 仓 库 / 维 数 据 库 ; 2数 多 ( ) 间 数 据 ( 地 图信 息 ) 3空 如 ; ( ) 程 数 据 ( 建 筑 、 成 电 路 的 信 息 ) 4工 如 集 ; ( ) 本 和 多 媒 体 数 据 ( 文 本 、 象 、 频 、 频 数 5文 如 图 音 视 据 ) ; 0 . . ( ) 间 相 关 的 数 据 ( 历 史 数 据 或 股 票 交 换 数 据 ) 6时 如 ; () 7 万维 网 ( 如半 结 构 化 的 HTML, 构 化 的 XML以 结 及 其 他 网络 信 息 ) 。 数 据 挖 掘 的 步 骤 一 般 会 因 不 同 的 实 际 应 用 情 况 而 有 所 变 化 , 过 程 就 是 用 一 定 的 数 据 挖 掘 算 法 从 给 定 的 数 据 库 其 中 提 取 模 型 , 及 围 绕 数 据 挖 掘 所 进 行 的 预 处 理 和 结 果 表 以 达 等一系列 的步骤 , 是一 个 需 要经 过 反 复 的多次 处 理 的过 程 。图 1 显示 的是数据 挖掘过程 , 主要 由以下步骤 组成 : () 据 清 理 ( 除 噪 音 或 不 一 致 数 据 ) 1数 消 ; () 据 集 成 ( 种 数 据 源 可 以 组 合 在 一 起 ) 2数 多 ; () 3 数据 选 择 ( 数 据 库 中 提取 与分 析 任 务 相 关 的数 从 据 ) ; () 据 变 换 ( 据 变 换 或 统 一 成 适 合 挖 掘 的形 式 ; 4数 数 如 通 过 汇 总 或 聚 集 操 作 ) ; () 据 挖 掘 ( 本 步 骤 , 用 智 能 方 法 提 取 数 据 模 5数 基 使
N o. 11, 01 2 2
现代商 贸工业 Mo enB s e rd d d r ui s T aeI n s n
2 1 第 1 期 0 2年 1
论数据挖掘技术及应用
张修 鹏 李捍 东 孙 航 白保 良
( 州大 学电气工程 学院 , 州 贵 阳 500) 贵 贵 5 0 3
摘 要 : 着 现 代 信 息 社 会 的 逐 步 发 展 , 据挖 掘 技 术 在 各 个 行 业得 到 了 广 泛 的 应 用 。在 介 绍 数 据 挖 掘 的 相 关 知 识 的 随 数 基 础 上 , 结 了数 据 挖 掘 常 采 用 的 技 术 方 法 , 且 对 数 据 挖 掘 的 应 用进 行 了 阐 述 。 总 并
3 数据 挖掘 的应 用
3 1 数 据 挖 掘 在 零 售 业 中 的 应 用 .
由于零售业 便于搜集 大量 的销售 数 据 、 顾客 购物 记 录 、 货物运 送 、 消费模式 和服务记 录等特 点 , 其成 为数 据 挖掘 使 的 主要 应 用 领 域 。 零售商们 采用数 据仓 库使他 们有 更好 的 机会 运用 数据 式 ) ; 挖 掘技术 。通过数据 挖掘 , 售商 们可 以了解销 售 全局 、 零 对 () 6 模式 评估 ( 根据 某 种 兴趣 度 度量 , 识别 提 供 知识 的 商 品 分 组 布 局 、 低 库 存 成 本 、 析 销 售 市 场 趋 势 , 而 更 降 分 从 真 正 有 趣 的模 式 ) ; 加 有 效 地 对 商 品 进 行 促 销 。大 型 的零 售 连 锁 店 和 杂 货 店 用 ( ) 识 表 示 ( 用 可 视 化 和 知 识 表 示 技 术 , 用 户 提 7知 使 向 大 量 的“ 息丰 富” 信 的销 售 数 据 , 过 数 据 挖 掘 揭 示 一 些 没 通
2 数 据挖 掘 的方 法
数 据 挖 掘 包 含 很 多算 法 , 图 2所 示 。 如
图 2 数 据 挖 掘 算 法 例如 , 用数 据挖掘算法 中 聚类分 析 的方法 , 以在城 应 可 市 规 划 的 过 程 中 , 据 类 型 、 格 、 理 位 置 等 来 划 分 不 同 根 价 地 类 型 的 住 宅 。具 体 使 用 哪 种 数 据 挖 掘 算 法 , 根 据 具 体 情 要 况 和 应 用 要 求 而 定 。 一 种 数 据 挖 掘 算 法 可 能 在 一 种 情 况 下 适用 , 在 另一种情况 下就不 适用 。在特 定 的应 用环境 下 , 而 应找 出最适用 的数据挖掘算法 , 加 以实施 。 并
关 键 词 : 据 挖 掘 ; 据 集 ; 据 挖 掘 算 法 数 数 数 中图分类号 : TB 文献标识码 : A
文 章 编 号 :6 23 9 (O 2 1- 1 40 1 7 —1 8 2 1 ) 10 7 -1
0 引 言
随 着 信 息科 技 的 进 步 以 及 电 子 化 时 代 的 到 来 , 代 信 现 息 社 会 中数 据 和 数 据 库 呈 现 爆 炸 式 增 长 。面 对 浩 瀚 的数 据 海 洋 , 何从 这 些 庞 大 的数 据 中找 出它 们 之 间 存在 的“ 如 潜 伏 ” 关 系 和 规 则 , 而 根 据 这 些 关 系 和 规 则 预 测 未 来 的 发 的 进 展趋 势 , 已经 成 为 二 十 一 世 纪 探 索 的 热 点 问 题 。 数 据 挖 掘 ( aaMiig 技 术 的 诞 生 , 解 决 这 一 问 题 D t nn ) 为 提 供 了 可 以参 考 的 方 法 , 开 发 信 息 资 源 的 一 种 新 的 数 据 是 处 理 技 术 。它 不 仅 能 对 过 去 的 数 据 进 行 查 询 , 且 能 够 找 而 出过 去数据之 间的潜在联 系 , 进行 更 高层次 的分 析 , 以便 更 好 地解决决策 、 测 等问题 。 预
相关文档
最新文档