不确定性数据聚类挖掘研究综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
能够 显 著 影 响 数 据 挖 掘 应 用 的 结果 。
等 价 类 的 存储 和更 新 『 2 l
传感器 网络 、 卫星遥感 图像 、 医疗信息等应用 产生 的巨量数据 .仅仅靠数据管理及查询技术无 法发现数
据 间 的 内在 联 系 .也 无 法 发 现 数 据 模 式 及 潜 在 知识 规
★基 金 项 目:江 苏省 科 技 攻 关 项 目( . 2 0 3 7 NoBE 0 6 5 ) 收稿 日期 : 0 1 1 5 2 1 —0 —1 修 稿 日期 : 0 1 1 2 2 1 —0 — 3
和 O TC P IS等算 法 i 3 1 由于 不 确 定 性 数 据 中 “ 确 性 ” “ 糊 性 ” 存 不 及 模 的 在. 使得 在 聚类 挖 掘 中 . 不确 定 性 数据 对 象 间 的 距 离 也
作 者 简介 : 春 霞 ( 9 3 , , 西兴 平 人 , 士 , 金 1 7 一) 女 陕 硕 副教 授 , 究 方 向 为 计 算机 应 用 、 息 处理 、 据挖 掘 研 信 数
① 现 计 机 21. 代 算 012 0
具 有 不 确 定 性 .对 象 间 的 距 离 衡 量 方 式 必 须 有 别 于 传 统 聚类 距 离 函 数 。H.. r gl 设 计 了一 种 基 于 密 度 P Ki e等 e
近年 来 .随 着 技 术 的 进 步 和 人 们 对 数 据 采 集 和 处 理技 术 理解 的 不 断 深 入 .在许 多 现 实应 用 中 。例 如 经 济 、 事 、 流 、 融 、 信 等 领 域 , 确 定 性 数 据 普 遍 军 物 金 电 不 存在 . 扮 演 着 关 键 角 色 。 此 面 向 不 确 定性 数 据 的挖 且 为 掘算 法越 来 越 引起 人 们 的 关 注 .主要 研 究 内容 包 括 聚 类技术 、 类技术及频繁模式挖掘 。 分 而数 据 的 不 确 定 性
不确 定 性 数 据 聚 类挖 掘 研 究 综述
金 春 霞 . 周 海 岩
( 苏淮 阴工 学 院 计 算 机 T 程学 院 , 安 2 3 0 ) 江 淮 20 3


要 : 据 日前 数 据 挖 掘研 究 的 现 状 , 析 不确 定数 据 的 聚 类挖 掘 算 法 。针 对 不 确 定 数 据 聚 类 挖 根 分 掘 存 在 的 问题 . 出改 进 传 统 的 数 据 挖 掘 算 法 来适 合 不确 定数 据 的聚 类挖 掘 或 找 出新 的 聚 提 类挖 掘 算 法 。 来解 决不 确 定 数 据 聚 类挖 掘 问题 的新 思 路 。
则 把数 据 挖 掘 技 术 引 入 不 确定 数据 管 理 中 . 恰 可 以 恰 解 决 以上 问题
1 不确 定 性 数 据 管 理 现 状
针 对 不 确 定 性 数 据 的研 究 _ 作 已 经 有 几 十 年 历 史 T
2 不 确 定 性 数 据挖 掘 算 法分 析
近 年 来 .不 确 定 性 数 据 挖 掘 研 究 工 作 主 要 集 中 在 数 据 预 处 理 、 确 定 数 据 的挖 掘算 法 、 据 挖 掘 的 建 模 不 数 方 法 、 据 挖 掘 _具 等 , 中不 确 定 性 数据 的挖 掘 算 法 数 丁 其
是 焦 点 问 题
了 从 2 0世 纪 8 年 代 末 开 始 . 对 概 率 数据 库 的研 究 0 针 _ 就从 未 间 断过 这 类 研 究 工 作将 不 确 定性 引 人 到 丁作
关 系 数据 模 型 中 去 . 取得 了 较 大 进 展 。 近 年来 , 对 不 针 确定 性 数 据 的 研究 工 作 则 在 更 广 的范 围 内取 得 了更 大 的进 展 .即在 更 丰 富 的数 据类 型 上 处 理 更 多 种 类 的查 询 任 务
() 1 定性 数 据 的 聚类 挖 掘
数 据 聚 类 分 析 是 数 据 挖 掘 研 究 领 域 中一 个 非 常 活 跃 的研 究 课 题 聚类 分 析 源 于 包 括 数 据 挖 掘 、 计 学 、 统
以及 机 器 学 习等 诸 多 研 究 领 域 .是 一 个 富有 挑 战 性 的
研究领域 。 确定性数据的聚类 方法 主要有 K Men 、 - — asK
Me od 、 次 B RC C E 以及 基 于 密 度 的 DB C d is 层 I H、 UR S AN
Biblioteka Baidu
确定 性数 据 的存 储 和查 询 .它 的 属性 值 可 以 划 分 成 若
干个 等 价 类 . 性 值 是 这些 等价 类 的并 集 然 而 在 构 建 属 数据库时 . 不能一次性预测属性值的所有取值情况 . 并
关 键 词 :不确 定 性 数 据 :聚 类 挖 掘 ;数 据 挖 掘
O 引

而 是 在 实 践 中完 善 和补 充 .这 样 原 来 的等 价 类 需 要 不
断 地 更 新 、 态 地 改 变 等 价 类 。在 更 新 基 本 表 时 , 可 动 也 能 会 更 新 等 价 类 因此 在 数 据存 储 和更 新 时 . 考 虑 到 要
B T eea 人 将 R uh集 理 论 与 传 统 关 系 数 据 . hrs 等 og 库 模 型 相 结 合 .于 20 0 6年 提 出 了 粗 关 系 数 据 库 模 型
f u h R lt n lD tb s d l R M)主 要 处 理 不 Ro g ea o a aa ae Mo e。 RD , i
的 不 确 性 数 据 的 聚类 算 法 .提 出 了一 种 衡 量 不 确 定 性
界 限 的不 确 定 性 . 概 念 具 有 内 涵 分 明 、 延 不 明 确 的 其 外 特 性 。它 比随 机 性 有 更 基 本 、 稳 定 的不 确 定 性 。这 种 更
模 糊 不 确 定 性 不 能 用 概 率 分 布来 描 述 .而 是 使 用 隶 属 度 函数 来 描 述 不 确 定 数 据 属 于 模 糊 集 的程 度
相关文档
最新文档