浅析计算机领域的数据挖掘技术

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
等 多 项 技 术 集 成 的 系统 。
4、 间数 据 挖 掘 的 发 展 趋 势 空
( ) 间 数据 挖 掘 算 法 和 技 术 的研 究 。 间 关联 规 则挖 掘 算 I空 空 法 、 间序列 挖掘 技术 、 间同位 算 法 、 间 分类 技 术 、 间离 群算 时 空 空 空 法 等是 空 间数 据 挖 掘研 究 的 热 点 , 时提 高 空 间 数 据挖 掘 算 法 的 同 效率也很重要。 () 2 多源 空 间数 据 的 预 处理 。 间 数 据 内容 包 括 数 字 线 划 数 空 据、 影像 数 据 、 数字 高 程 模 型 和地 物 的 属 性 数 据 , 由于 其 本 身 的复 杂 性 与 数 据 采集 的 困难 , 间 数 据 中不 可 避 免地 存在 着 空缺 值 、 空 噪 声 数 据 及 不 一 致 数 据 , 源 空 间 数 据 的 预 处 理 就 显 得 格 外 重 多
此 , 不 断完 善和 发 展 空 间数 据 挖 掘 就 必 须 发 展 空 间数 据 挖掘 查 要 询语言。 为高 效 的 空 间数 据 挖 掘 奠 定 基 础 。 () 4 空间 数据挖 掘 知 识 发现 系 统 交互 性 不 强 , 知 识 发现 过 程 在 中很难 充 分 有效 地 利 用领 域 专 家 知 识 , 户 不 能 很 好 掌控 空 间数 用
5、 结 小
空 间数 据挖 掘可 从 大型 空 间数 据 库 中提 取感 兴趣 和规 律性 的 知识 , 用 于 理解 空 间数 据 、 可 发现 空 间数 据 与 非 空 间 数据 的关 系 、 建立 空 间知识 库 、 化 查 询 , 组 空 间数 据 库等 , 间数 据 挖 掘技 优 重 空 术在 广 度和 深度上 的不 断进 步 , 也将 使 G s 成系 统 朝着 智 能化 、 I集 网络化 、 全球 化 与 大众 化 的 方 向发 展 。 以 预 见 , 间 数据 挖 掘 不 可 空 仅 会 促 进 空 间科 学 、 算机 科学 的 发 展 , 且 必 将 增 强 人 类 认 识 计 而 世 界 、 造 世 界 的 能力 , 而 更 好 地 服 务 人 类 社 会 。 改 从

的 问题 , 而 能够 发 现 的 知 识 有 限 。 因 () 间数 据挖 掘与 其他 系统 的 集 成不 够 , 6空 忽视 了G S 空 间知 I在
识发 现 过 程 中的 作 用 。 一个 方 法 和 功 能 单 一 的 空 间数 据 挖 掘 系统 的适 用 范 围必 然 受 到很 多 限 制 , 目前 开 发 的 知 识 系 统 仅局 限 于数 据库领域 , 如果 要 在 更 广 阔 的 领 域 发 现 知 识 , 识 发 现 系 统 就 应 知 该 是 数据 库 、 识 库 、 家系 统 、 策 支持 系统 、 视化 工 具 、 知 专 决 可 网络
式 的 可能 性 和待 解 决 问题 的维 数 都 很 大 , 仅增 大 了 算法 的搜索 不 空 间 , 增加 了盲 目搜 索 的 可 能性 。 也 () 3 没有 公认 的 标准 化 空 间数 据 挖 掘 查询 语 言 。 据 库技 术 飞 数 速 发 展 的 原 因 之 一 就 是 数 据 库 查 询 语 言 的 不 断完 善 和 发 展 , 因
浅 析计算机领域 的数 据挖 掘技 术
孙 杰 河 北 联 合 大 学 唐 山 师 范 学 院 河 北 唐 山 O 5 0 6O O
【 摘 要 】 着 空 间 数据 采集技 术 的 飞速 发展 , 随 复杂 多样 的 空间 数据 日益 膨胀 , 切 需要 更新 数 据挖 掘 的知 识 和 方 法 迫 文 章 从 空 间 数据 挖 掘 的基 本概 念 出发 , 阐述 了空问 数据挖 掘 的类 型 与过 程 , 绍 了空问 数据 挖 掘 在Gs 介 l中的应 用 , 分析 了当前 空 问数据 挖 掘 面 临的 问题 ,
并 对 空间 数据 挖 来自百度文库 技 术 的 发展进 行 了展 望 。
【 关键词 】 空间数据挖掘 地理 信息 系统 研 究分析
中圈分类 号: 6 35 文 献标识码 : G 2 8 B文章编号 :0 94 6 (0 2 1 一0 - 1 l 0 -0 72 1 ) 6 l 60
随着 数 据采 集技 术 的成 熟和 普及 , 量 的空 间数 据 通过 遥 感 、 大 地理信息系统 、 多媒 体 系统 、 医学 和卫 星 图 像 等 多种 形 式汇 集 成 庞大 而 丰 富 的信 息 源 。 面对 庞 杂 、 多 的数 据类 型 , 间数 据 挖掘 繁 空 技 术 应运 而生 , 在 地理 信 息 系 统 、 感 勘 测 、 并 遥 图像 处理 、 通 管 交 理 、 境 研 究 等 领 域 得 到 广泛 应用 。 环
段。
2、 间 数 据挖 掘 在 GI 空 S中的 应 用
空 间数 据挖 掘技 术与 地理 信息 系统 ( I) GS的结 合 具有 非常 广 泛 的 应用 空 间 。 据挖 掘 与GI 集成 具 有三 种 模式 : 一 为松 散 耦 合 数 s 其 式, 也称 外部 空 间数 据挖 掘 模式 , 种 模式 基 本上 将GI 当作 一 个 这 S
() 3其他 各 种 空间 数据 挖 掘 及其 相 关技 术 研究 。 网 络环 境 下 如
的 空 间数 据 挖 掘 、 可视 化 数 据 挖 掘 、 栅格 矢量 一体 化 空 间数 据 挖 掘 、 景 知识 概 念树 的 自动生 成 、 于 空 间 不确 定性 ( 置 、 性 、 背 基 位 属
时 间等 ) 的数 据 挖掘 、 递增 式 数 据 挖 掘 、 多分 辨 率 及 多 层 次数 据 挖 掘、 并行 数 据挖 掘 、 感 图像 数据 库 的 数 据 挖 掘 、 遥 多媒 体 空 间数 据
库 的知 识 发 现 等 。
方 法 的 结合 , 即尽 可 能利 用GI 提供 的功 能 , 大 限度 的 减少 用 户 S 最 自行 开 发 的工 作 量 和难 度 , 又可 以保持 外部 空 间数 据挖 掘 模 式 的 灵 活 性 。 用 空 间数 据 挖 掘 技术 可 以 从空 间数 据 库 中 发 现如 下 几 利 种主 要 类 型 的知 识 : 遍 的 几 何知 识 、 间分 布 规律 、 间 关联 规 普 空 空 律 、 间聚 类 规 则 、 间特 征 规 则 、 间 区分规 则 , 间演 变 规 则 、 空 空 空 空 面 向对 象 的知 识 。
空 间数 据库 看待 , GS 境 外部 借助其 它 软件 或计 算机 语 言进 行 在 I环 空 间数 据 挖掘 , 与GI 之间 采用 数 据通 讯 的方 式联 系 。 二 为嵌 入 S 其 式, 又称 内部 空间 数 据挖 掘模 式 , 即在GI 中将 空 间 数据 挖 掘 技 术 s
融 合 到 空 间分 析 功 能 中 去 。 三 为 混 合型 空 间模 型 法 , 前 两种 第 是
参考文献
【】 1韩家炜. 数据挖掘概念与技术 【】北京: M. 机械工业出版社, o1 2 0. [】 ATRZ CM 数据挖掘: 2KNA DI . 概念、 模型、 方法和算法【] 闪四清, M. 陈茵, 程雁, 北京: 译. 清华大学出版社, 0 3 2 0. [】 3宋爱波.e 挖掘研究综述. Wb 计算机科学 … . 0 12 (1: 31. 2 0. 8 1) 1- 5
1、 间数 据 挖 掘 研 究 概 述 空
空 间数据 挖掘 ( ailD t nn , s t a a Mi ig 简称S M)是 指 从空 间 p a D , 数 据 库 中提 取 用 户 感 兴趣 的 空 间模 式 、 遍 关 系 、 据 特 征 的过 普 数 程 。 间 数 据 挖 掘 技 术综 合 数 据 挖 掘 技术 与 空 间 数 据 库 技 术 , 空 可 用 于对 空 间 数据 的理 解 、 间 关系 和 空 间 与非 空 间关 系 的 发 现 、 空
要。
致 数据 ) 数 据 集 成( 多种 数据 源 组 合在 一起 ) 数 据 选择 ( 、 将 、 根据 用 户的 要求 从空 间数据 库中提 取 与空 间数据 挖 掘相 关的 数据 )数 、
据 变换 ( 数 据 统一 成 适 合挖 掘 的形 式)空 间数 据 挖掘 ( 将 、 运用 选 定 的 知 识发 现 算法 , 从数据 中提 取用 户所 需 的知识 ) 模 式评 估 ( 据 、 根 某 种 兴 趣 度 度 量 并识 别表 示 知 识 的 真 正有 趣 的模 式 ) 知识 表 示 , ( 用 可 视化 技 术 和 知识 表 示 技 术 , 使 向用 户 提供 挖 掘 的 知 识 ) 阶 等
据挖掘过程。 ( ) 间数 据挖 掘方 法 和 任务 单 一 , 本 上 都 是针 对 某个 特 定 5空 基
空 间知 识 库 的 构造 以及空 间 数据 库 的 重组 和 查询 的优 化 等 , 根 其 本 目标 是 把 大量 的 原始 数 据 转换 成 有 价值 的 知 识 , 现 大量 的 地 发 学 信 息 中所 隐含 的规 则。 空间 数据 挖掘 一 般可 分成 空 间分 类 、 间聚 类 、 间趋 势分 析 空 空 和 空 间 关联 规 则 四 类 。 目前提 出的 空 间聚类 方 法 有基 于 分 割 的方 法 、 于层 次 的 方法 、 基 基于 密 度 的方 法和 基 于 棚格 的 方 法 。 间趋 空 势 分析 指离 开 一 个 给 定 的起 始对 象 时 非空 间 属性 的 变 化情 况 。 空 间数 据 挖掘 过 程 一 般 可分 为 数 据 筛选 ( 除原 始 数 据 的 噪声 或 不 消
3 空 间数 据挖 掘 面 临 的 问题 、
() 1 多数 空 间 数 据挖 掘 算 法是 由一 般 的数 据 挖 掘算 法 移 植 而 来 , 没有 考 虑 空 间数 据 存 储 、 并 处理 及 空 间数 据 本 身 的 特 点 。 间 空 数据 不 同于 关 系数 据 库 中 的数 据 , 有 其特 有 的 空 间数 据 访 问方 它 法, 因而 传 统 的数 据 挖 掘技 术 往 往不 能 很好 地 分析 复 杂 的 空 间现
象和空间对象。
( ) 间数 据 挖 掘算 法 的 效率 不 高 , 现 模 式 不精 练 。 2空 发 面对 海
量 的 数据 库 系 统 , 空 间数 据 挖 掘过 程 中 出现 不 确 定 性 、 误模 在 错
1 6 ’ 中 子商 . 0 2. 6 0 . 国电 务 I 1 1 2
相关文档
最新文档