数据流聚类算法分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
求 , 吸 引 了许 多研 究 人 员 的 注 意 , 而 数 据 流 也 因
的 分析 和 挖 掘 在 近 年 快 速 兴 起 且 已 发 展 成 一 个
参 数 的 领 域 知 识 最 小 化 和 数 据 记 录 敏 感 性 ,) 5 处 理 噪 声 数 据 的 能 力 , )高 维 性 , )可 解 释 性 和 6 7
聚 类 ( l s r g) 析 是 数 据 挖 掘 领 域 中 的 Cut i 分 en
一
穷 的 , 求 聚类 算 法应 是 增 量更新 的。 要
数据 流 中的数 据 到 达 时 间是 不 可控 制 的 、 随
个 重要 分 支 。所 谓 聚类 , 指 将 物理 wk.baidu.com 抽 象对 是 相 似 的 数 据 对 象 尽 可 能 处 在 同 一 个 簇 ( ls cu —
法 ( atinn to s) 层 次 方 法 ( irrhc l p rio igmeh d 、 t h eac ia
够 跟 上 流 的 速 度 并 抓 住 流 的 特 征 ,算 法 不 能 过 于
复 杂 ; 据流是 连 续 的 , 以对 数据流 聚类要 能随 数 所 时 间 而 不 断 地 演 化 放 映 流 数 据 结 构 的 变 化 ;数 据
可 用 性 2 数 据 流 处 理 模 型
全 新 的 研 究 领 域 。作 为 数 据 挖 掘 领 域 的 一 种 基 本
研究 方法 , 类 分 析 在 数 据 流挖 掘 中受 到广 泛 关 聚
注 和 研 究 。本 文 首 先 介 绍 数 据 流 聚 类 分 析 方 法 的 特 点 , 后 介 绍 现 有 的 ・ 些 流 聚 类 算 法 , 对 这 然 并 些算 法进 行分 析 和评价 。
近 年 来 , 着 微 传 感 器 技 术 和 计 算 机 网 络 技 随
术 的广 泛应 用 , 网络 监 控 、 票 交 易 分析 、 象 在 股 气 与 环境监 测 、 感器 网络 、e 传 w b应 用 等 领 域 产 生 的
一
类 新 的数 据对 象 一 一数 据 流 , 到 了越来 越 多 受
这 些 算 法 处 理 结 果 的 评 价 主 要 依 赖 于 不 同
的应 用 领 域 对 聚 类 不 同 的 考 察标 准 ,通 常这 些
人 的 关 注 。 这 些 数 据 的 共 同 点 就 是 数 据 规 模 巨 大 , 数 据 快 速 持续 到达 ; 据 通 常 只 能 被 读 取 且 数
1 传 统 的 聚 类 分 析 方 法
数 据 流模 型 假 设 数据 流 是 一个 实 时 的 、 续 连
的 、 在 无 界 的 、 序 的 数 据 项 的 序 列 圜。数 据 只 潜 有 能被 顺 序访 问 ;海量 数 据 通 常很 难 被 全部存 储 ,
因 此 数 据 仅 能 被 扫 描 一 遍 或 有 限 的 几 次 。数 据 流 相 对 于传 统 的数 据处理 对 象具 有 以下不 同 : 数 据流 中的 数 据在 线 持 续 到达 , 且潜 在无 并
黄 孝
( 京 航 空航 天 大 学 信 息科 学 与 技 术 学 院 , 苏 南 京 2 0 1 ; 南 江 10 6
池 州 学院 数 学与计 算机 科 学 系, 徽 池 州 2 7 0 ) 安 4 00
[ 要】 首先 比较 了数据流 聚类分析 与传统 的聚类分 析方法 的一些不 同点 , 目前 最新 的一些数据流聚类研 究成果 摘 对 进 行 了分析 , 最后对 数据 流聚类发展方 向进行 了展望。 【 关键词】数据流模型 ; 聚类分析 ; 据流聚类 数 【 中图分 类号】 P 1 T 31 【 文献标识 码】 A 【 文奄编 号】17 — 12 20 0 —0 1 - 3 6 4 1 0 ( 0 7) 5 0 10 meh d t o s)、 于 密 度 的 方 法 (d n i — a eme — 基 e st b s t y h o s)、 于 网 格 的 方 法 ( r ~ ae to s 、 d 基 g i b s dmeh d ) 基 d 于 模 型 的 方 法 ( d lb e to s) mo e— a dmeh d 。 s
象 的集 合 分 组 成 为 由类 似 的对 象 组 成 的多 个 类
[J 1
,
机 的 。对 数 据 流 中 的 数 据 的读 取 和 处 理 只 能 被 动
的依 据数 据 到 达 的次 序执 行 , 可能 通过 改变 数 不
据 的输人 次 序来 对 处理 的结果进 行 改进 。 数 据流 是快 速变 化 的 , 因而 , 聚 类 算 法 要 能 流
维普资讯 http://www.cqvip.com
第 2卷 第5 l 期
V0 . No 5 1 2l .
池 州 学 院 学 报
J u a o hz o olg o r l fC ih uC l e n e
20年 1 07 0月
oc. 0 7 t. 0 2
数 据流聚 类算 法分 析
一
标 准 包 括 : )可 伸 缩 性 , ) 理 不 同 类 型 属 性 的 1 2处
能 力 ,) 现 任 意 形 状 的聚 类 ,) 于决 定 输 入 3发 4 用
次 。数 据 流 作 为 一 种 新 兴 且 日益 主 流 的 数 据 形
式 , 何从 包 含大 量 数 据 的数据 流 中快 速 高效 提 如 取 有 价 值 的 信 息 , 成 为 众 多 应 用 领 域 的 客 观 需
tr 内 , 似 度 低 的数 据 对 象 处 在 不 同 的 簇 中 。 e) 相 在 传 统 的基 于数 据 库 应用 的模 式 下 , 据 不 同 的应 根
用 领 域 , 同 的 应 用 目标 , 生 了 众 多 的 聚 类 算 不 产 法 。 这 些 算 法 主 要 可 以 划 分 为 以 下 几 类 : 分 方 划
的 分析 和 挖 掘 在 近 年 快 速 兴 起 且 已 发 展 成 一 个
参 数 的 领 域 知 识 最 小 化 和 数 据 记 录 敏 感 性 ,) 5 处 理 噪 声 数 据 的 能 力 , )高 维 性 , )可 解 释 性 和 6 7
聚 类 ( l s r g) 析 是 数 据 挖 掘 领 域 中 的 Cut i 分 en
一
穷 的 , 求 聚类 算 法应 是 增 量更新 的。 要
数据 流 中的数 据 到 达 时 间是 不 可控 制 的 、 随
个 重要 分 支 。所 谓 聚类 , 指 将 物理 wk.baidu.com 抽 象对 是 相 似 的 数 据 对 象 尽 可 能 处 在 同 一 个 簇 ( ls cu —
法 ( atinn to s) 层 次 方 法 ( irrhc l p rio igmeh d 、 t h eac ia
够 跟 上 流 的 速 度 并 抓 住 流 的 特 征 ,算 法 不 能 过 于
复 杂 ; 据流是 连 续 的 , 以对 数据流 聚类要 能随 数 所 时 间 而 不 断 地 演 化 放 映 流 数 据 结 构 的 变 化 ;数 据
可 用 性 2 数 据 流 处 理 模 型
全 新 的 研 究 领 域 。作 为 数 据 挖 掘 领 域 的 一 种 基 本
研究 方法 , 类 分 析 在 数 据 流挖 掘 中受 到广 泛 关 聚
注 和 研 究 。本 文 首 先 介 绍 数 据 流 聚 类 分 析 方 法 的 特 点 , 后 介 绍 现 有 的 ・ 些 流 聚 类 算 法 , 对 这 然 并 些算 法进 行分 析 和评价 。
近 年 来 , 着 微 传 感 器 技 术 和 计 算 机 网 络 技 随
术 的广 泛应 用 , 网络 监 控 、 票 交 易 分析 、 象 在 股 气 与 环境监 测 、 感器 网络 、e 传 w b应 用 等 领 域 产 生 的
一
类 新 的数 据对 象 一 一数 据 流 , 到 了越来 越 多 受
这 些 算 法 处 理 结 果 的 评 价 主 要 依 赖 于 不 同
的应 用 领 域 对 聚 类 不 同 的 考 察标 准 ,通 常这 些
人 的 关 注 。 这 些 数 据 的 共 同 点 就 是 数 据 规 模 巨 大 , 数 据 快 速 持续 到达 ; 据 通 常 只 能 被 读 取 且 数
1 传 统 的 聚 类 分 析 方 法
数 据 流模 型 假 设 数据 流 是 一个 实 时 的 、 续 连
的 、 在 无 界 的 、 序 的 数 据 项 的 序 列 圜。数 据 只 潜 有 能被 顺 序访 问 ;海量 数 据 通 常很 难 被 全部存 储 ,
因 此 数 据 仅 能 被 扫 描 一 遍 或 有 限 的 几 次 。数 据 流 相 对 于传 统 的数 据处理 对 象具 有 以下不 同 : 数 据流 中的 数 据在 线 持 续 到达 , 且潜 在无 并
黄 孝
( 京 航 空航 天 大 学 信 息科 学 与 技 术 学 院 , 苏 南 京 2 0 1 ; 南 江 10 6
池 州 学院 数 学与计 算机 科 学 系, 徽 池 州 2 7 0 ) 安 4 00
[ 要】 首先 比较 了数据流 聚类分析 与传统 的聚类分 析方法 的一些不 同点 , 目前 最新 的一些数据流聚类研 究成果 摘 对 进 行 了分析 , 最后对 数据 流聚类发展方 向进行 了展望。 【 关键词】数据流模型 ; 聚类分析 ; 据流聚类 数 【 中图分 类号】 P 1 T 31 【 文献标识 码】 A 【 文奄编 号】17 — 12 20 0 —0 1 - 3 6 4 1 0 ( 0 7) 5 0 10 meh d t o s)、 于 密 度 的 方 法 (d n i — a eme — 基 e st b s t y h o s)、 于 网 格 的 方 法 ( r ~ ae to s 、 d 基 g i b s dmeh d ) 基 d 于 模 型 的 方 法 ( d lb e to s) mo e— a dmeh d 。 s
象 的集 合 分 组 成 为 由类 似 的对 象 组 成 的多 个 类
[J 1
,
机 的 。对 数 据 流 中 的 数 据 的读 取 和 处 理 只 能 被 动
的依 据数 据 到 达 的次 序执 行 , 可能 通过 改变 数 不
据 的输人 次 序来 对 处理 的结果进 行 改进 。 数 据流 是快 速变 化 的 , 因而 , 聚 类 算 法 要 能 流
维普资讯 http://www.cqvip.com
第 2卷 第5 l 期
V0 . No 5 1 2l .
池 州 学 院 学 报
J u a o hz o olg o r l fC ih uC l e n e
20年 1 07 0月
oc. 0 7 t. 0 2
数 据流聚 类算 法分 析
一
标 准 包 括 : )可 伸 缩 性 , ) 理 不 同 类 型 属 性 的 1 2处
能 力 ,) 现 任 意 形 状 的聚 类 ,) 于决 定 输 入 3发 4 用
次 。数 据 流 作 为 一 种 新 兴 且 日益 主 流 的 数 据 形
式 , 何从 包 含大 量 数 据 的数据 流 中快 速 高效 提 如 取 有 价 值 的 信 息 , 成 为 众 多 应 用 领 域 的 客 观 需
tr 内 , 似 度 低 的数 据 对 象 处 在 不 同 的 簇 中 。 e) 相 在 传 统 的基 于数 据 库 应用 的模 式 下 , 据 不 同 的应 根
用 领 域 , 同 的 应 用 目标 , 生 了 众 多 的 聚 类 算 不 产 法 。 这 些 算 法 主 要 可 以 划 分 为 以 下 几 类 : 分 方 划