空间数据挖掘方法综述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
次 聚类 的结 果 可 以用 一 个 谱 系 图 表示 。常见 的层
次聚类方法有 : AGNE c D ANAc 、 I CH[ S 、 I BR 引、 C URE 等 。 其 中 AGNE 和 D ANA 效 率 较 低 , S I
据 库 , 理信 息系统 ( S 是 空 间数 据 库发 展 的 基 地 GI ) 础, 因此 , 对空 间数 据 库 的研 究 是 随着 地 理 信 息 系 统 的发展 而不 断 深 入 的 。 目前 空 间 数 据 库 及其 挖 掘研 究 的重点 主要 集 中 在 空 问数 据 挖 掘 方 法 等方
面, 空问数 据挖 掘 和知 识 发 现 方 法 是 丰 富 多彩 的 。
收 稿 日期 : 0 O 0 ~ 6 2 l一 7 1 2 1 . / 球 定 位 系 统 00s全
不适 于大 数 据集 的 聚类 ; I C 虽 然 有 良好 的伸 BR H
缩性 但 只能处 理 数值 型数 据 , 且不支 持 任意形 状 并
于密 度 的聚类 。其 中许 多经 典 的 聚类 方 法 不 适 宜 在大 的空 间数 据 集下应 用 , 在大 数据集 情况 下其 存
在速 度慢 、 效率 低 等 问题 。 层 次 聚 类 方 法依 据 对 象 的相 似 性递 归 地 对对
象 进行 合并 或 者 分裂 , 到满 足 某 一终 止 条 件 , 直 层
,
) C c D 每 个 子集 形 成 一 个类 , 得 不 同类 , 使
的数据 尽可 能地 不 相 似 而 同 一类 中的 数 据尽 可能 地 相似 。如果 k 1或 k } , 称 为平 凡 聚 类 。 一 一 Dl则 按 照聚类 方法 的原 理 进 行 分 类 可分 为 : 次 聚类 、 层 划分 聚类 、 于 网 格 的聚 类 、 于模 型 的 聚类 和 基 基 基
针对 空 间数据 库 的特 点 , 可采用 下列 的空 间数据 挖 掘 与知识 发现 方 法 。
的积累正 在呈爆 炸性 的增 长 , 而其 中大量 的数 据都 与空 间有关 。由 于空 间数 据类 型复 杂 , 时效 性 强 ,
数据 量大 , 收集 到 的 数 据 远 远 超 过 人 脑 分 析 的能 力, 导致 了空 间数据 灾 难 且 空 间 知识 贫乏 , 于是 空 间数据 挖 掘技术 应运 而生 。 空 间数 据挖 掘 是 指从 空 间 数据 库 中提 取用 户
关 键 词 :空 间 数 据 挖 掘 ;知 识 发 现 ; 法 方
中图分 类号 : P 0 . 3 T 1 文献 标志 码 : T 3 91 , P 8 A
文章 编 号 :0 89 6 ( 0 0 0 —0 50 10 —2 8 2 1 ) 50 6 —5
0 引 言
随着 计算机 与网络通 信技 术 的飞速 发展 , 数据
果 。如 何 在 浩 瀚 的 空 间数 据 和 人 们 的 知 识 渴 求 之 间 建 立 一 个 桥 梁 的 确 是 一 个 巨大 的 挑 战 , 而
以聚 类 、 类等人 工 智能技 术 为 基 础 的 空 间数 据 挖 掘 为 迎接 这 个挑 战 提 供 了新 的 支撑技 术 。 分
总 结 了空间数据挖 掘 方 法的 国 内外研 究现 状 , 为深入研 究 空间数据 挖 掘方 法提供 参考 价值 。
感 兴 趣 的 空 间 模 式 与 特 征 、 间 与 非 空 间 数 据 的 关 空
l 基 于 聚 类 的方 法
聚wenku.baidu.com 分 析 方 法 按一 定 的距 离 或 相似 性 测 度将
数 据分 成一 系列 相互 区分 的组 , 由此来 发现数 据集 合 的整 个分 布 模 式 。它不 需 要 背景 知 识 而 直 接发 现一些 有 意义 的结 构与 模式 。 聚类 问题 可 以这 样 描述 : 给定 一数 据 集 D, 使 用某 种 相似 性度 量 , D 分成 k个 子集 :{ C , 把 C , 。
聚类 。
划 分 聚类 算法 把 聚类 问题转 化成 一个 组合 优
・
6 ・ 5
化 问题 , 一个初 始划 分或者 一个初 始 聚点集 合开 从 始 , 用迭代 控 制 策 略优 化 一个 定 制 目标 函数 , 利 导 致 其 收敛较 慢 , 可能 陷 入局 部 极 小 , 且 限制 了它 而
…
系及其 它一 些 隐 含在 数 据 库 中 的 知识 [ 。空 问 数 3 ]
据 库 与常规 的关 系数据 库有 许多 不 同 : 间数据 库 空 具 有丰 富 的数 据 类 型 , 有 拓扑 和 距 离 信 息 ; 间 带 空 数 据有很 强 的局 部相 关 性 ; 据 都 被 精 心 组织 , 数 以 多维 索 引作为 其存 取 方 法 ; 空 间 推 理 、 何 计算 有 几 及空 间知识 表 达 能力 。这 就使 得 空 间 数 据库 的挖 掘技 术不 同于关 系数据 库 , 特别 是 空间 中的 相似对 象趋 向于 地理 空 间上 的 聚集 , 空 间 自相 关 性 , 即 使 得 以对 象 间相互 独 立 为基 础 的关 系 数 据 库 的经 典 挖 掘 方法不再 适 用 , 有 研究 新 的理 论 、 术 和方 只 技 法 , 能从空 间数 据 库 中挖 掘 出新 颖 有 效 的 、 被 才 能 人理 解 的空间 知 识 。空 间 数 据库 是 一 类 特 殊 的 数
空 间数 据 挖 掘 方 法 综 述
谢 远 飞 , 洋 , 海 军 刘 李
( 国矿业大学, 京 108) 中 北 0 0 3
摘 要 :空 间数 据 挖掘 和 知 识发 现 是 空 间数 据 库技 术 、 间数据 荻 取技 术 、 算机 技 术 、 空 计 网络 通信技 术和 管理 决策 支持技 术 等发展 到一 定 阶段 的产 物 , 多学科 相 互 交融 和 相 互促进 是 的新 兴边缘 学科 , 集 了人 工 智能 、 式识 别 、 据 库 、 间信 息 学 、 汇 模 数 空 统计 学等各 学科技 术 的 成
次聚类方法有 : AGNE c D ANAc 、 I CH[ S 、 I BR 引、 C URE 等 。 其 中 AGNE 和 D ANA 效 率 较 低 , S I
据 库 , 理信 息系统 ( S 是 空 间数 据 库发 展 的 基 地 GI ) 础, 因此 , 对空 间数 据 库 的研 究 是 随着 地 理 信 息 系 统 的发展 而不 断 深 入 的 。 目前 空 间 数 据 库 及其 挖 掘研 究 的重点 主要 集 中 在 空 问数 据 挖 掘 方 法 等方
面, 空问数 据挖 掘 和知 识 发 现 方 法 是 丰 富 多彩 的 。
收 稿 日期 : 0 O 0 ~ 6 2 l一 7 1 2 1 . / 球 定 位 系 统 00s全
不适 于大 数 据集 的 聚类 ; I C 虽 然 有 良好 的伸 BR H
缩性 但 只能处 理 数值 型数 据 , 且不支 持 任意形 状 并
于密 度 的聚类 。其 中许 多经 典 的 聚类 方 法 不 适 宜 在大 的空 间数 据 集下应 用 , 在大 数据集 情况 下其 存
在速 度慢 、 效率 低 等 问题 。 层 次 聚 类 方 法依 据 对 象 的相 似 性递 归 地 对对
象 进行 合并 或 者 分裂 , 到满 足 某 一终 止 条 件 , 直 层
,
) C c D 每 个 子集 形 成 一 个类 , 得 不 同类 , 使
的数据 尽可 能地 不 相 似 而 同 一类 中的 数 据尽 可能 地 相似 。如果 k 1或 k } , 称 为平 凡 聚 类 。 一 一 Dl则 按 照聚类 方法 的原 理 进 行 分 类 可分 为 : 次 聚类 、 层 划分 聚类 、 于 网 格 的聚 类 、 于模 型 的 聚类 和 基 基 基
针对 空 间数据 库 的特 点 , 可采用 下列 的空 间数据 挖 掘 与知识 发现 方 法 。
的积累正 在呈爆 炸性 的增 长 , 而其 中大量 的数 据都 与空 间有关 。由 于空 间数 据类 型复 杂 , 时效 性 强 ,
数据 量大 , 收集 到 的 数 据 远 远 超 过 人 脑 分 析 的能 力, 导致 了空 间数据 灾 难 且 空 间 知识 贫乏 , 于是 空 间数据 挖 掘技术 应运 而生 。 空 间数 据挖 掘 是 指从 空 间 数据 库 中提 取用 户
关 键 词 :空 间 数 据 挖 掘 ;知 识 发 现 ; 法 方
中图分 类号 : P 0 . 3 T 1 文献 标志 码 : T 3 91 , P 8 A
文章 编 号 :0 89 6 ( 0 0 0 —0 50 10 —2 8 2 1 ) 50 6 —5
0 引 言
随着 计算机 与网络通 信技 术 的飞速 发展 , 数据
果 。如 何 在 浩 瀚 的 空 间数 据 和 人 们 的 知 识 渴 求 之 间 建 立 一 个 桥 梁 的 确 是 一 个 巨大 的 挑 战 , 而
以聚 类 、 类等人 工 智能技 术 为 基 础 的 空 间数 据 挖 掘 为 迎接 这 个挑 战 提 供 了新 的 支撑技 术 。 分
总 结 了空间数据挖 掘 方 法的 国 内外研 究现 状 , 为深入研 究 空间数据 挖 掘方 法提供 参考 价值 。
感 兴 趣 的 空 间 模 式 与 特 征 、 间 与 非 空 间 数 据 的 关 空
l 基 于 聚 类 的方 法
聚wenku.baidu.com 分 析 方 法 按一 定 的距 离 或 相似 性 测 度将
数 据分 成一 系列 相互 区分 的组 , 由此来 发现数 据集 合 的整 个分 布 模 式 。它不 需 要 背景 知 识 而 直 接发 现一些 有 意义 的结 构与 模式 。 聚类 问题 可 以这 样 描述 : 给定 一数 据 集 D, 使 用某 种 相似 性度 量 , D 分成 k个 子集 :{ C , 把 C , 。
聚类 。
划 分 聚类 算法 把 聚类 问题转 化成 一个 组合 优
・
6 ・ 5
化 问题 , 一个初 始划 分或者 一个初 始 聚点集 合开 从 始 , 用迭代 控 制 策 略优 化 一个 定 制 目标 函数 , 利 导 致 其 收敛较 慢 , 可能 陷 入局 部 极 小 , 且 限制 了它 而
…
系及其 它一 些 隐 含在 数 据 库 中 的 知识 [ 。空 问 数 3 ]
据 库 与常规 的关 系数据 库有 许多 不 同 : 间数据 库 空 具 有丰 富 的数 据 类 型 , 有 拓扑 和 距 离 信 息 ; 间 带 空 数 据有很 强 的局 部相 关 性 ; 据 都 被 精 心 组织 , 数 以 多维 索 引作为 其存 取 方 法 ; 空 间 推 理 、 何 计算 有 几 及空 间知识 表 达 能力 。这 就使 得 空 间 数 据库 的挖 掘技 术不 同于关 系数据 库 , 特别 是 空间 中的 相似对 象趋 向于 地理 空 间上 的 聚集 , 空 间 自相 关 性 , 即 使 得 以对 象 间相互 独 立 为基 础 的关 系 数 据 库 的经 典 挖 掘 方法不再 适 用 , 有 研究 新 的理 论 、 术 和方 只 技 法 , 能从空 间数 据 库 中挖 掘 出新 颖 有 效 的 、 被 才 能 人理 解 的空间 知 识 。空 间 数 据库 是 一 类 特 殊 的 数
空 间数 据 挖 掘 方 法 综 述
谢 远 飞 , 洋 , 海 军 刘 李
( 国矿业大学, 京 108) 中 北 0 0 3
摘 要 :空 间数 据 挖掘 和 知 识发 现 是 空 间数 据 库技 术 、 间数据 荻 取技 术 、 算机 技 术 、 空 计 网络 通信技 术和 管理 决策 支持技 术 等发展 到一 定 阶段 的产 物 , 多学科 相 互 交融 和 相 互促进 是 的新 兴边缘 学科 , 集 了人 工 智能 、 式识 别 、 据 库 、 间信 息 学 、 汇 模 数 空 统计 学等各 学科技 术 的 成