频繁模式挖掘算法综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结 构 以及 设 置广 告 页 面 等 。 因此 挖 掘 邻 近 序 列 模 式 有 实 际 意 义 。
为 了 提 高 算 法 效 率 , 们 提 出 了 散 列 项 集 计 数 1 划 分I、 人 9 1 、 , 选 O l 目前 人 们 已 经 提 出 了许 多 邻 近 序 列 模式 挖 掘算 法 . 如 ail rw提 出 的 P M 算 法fI 算 法 先 把所 有 的 序 列 串 联 在 D 3. 0该 样 I和 动 态 项 集 1等 技 术 来 对 A r r算 法 进 行 优 化 。 但 这 些 算 D ne C o I U 1 2 l pi i o 起 组 成 一 个 长 字符 串 .然 后 通 过 在 长 字 符 串 中 删 除 低 阶 邻 近 法 都 是 在 A f r算 法 基 础 上 进 行 的 改 进 . 可 能 改 变 A f f算 p oi i 不 po ii
2 频 繁 项 集挖 掘 、
要 多 次 扫 描 数 据 库 . 致 算 法 性 能 不 佳 。算 法 F S a 导 me pn和 Pe r. i a f P n虽 然 不 用 多 次 扫描 数 据 库 .但 往 往 会 构 造 很 多 投 影 或 者 x
关 联 规 则 是 数 据 挖 掘 的 众 多 模式 中最 为 重 要 的 一 种 .它 主 伪 投 影 数 据 库 . 此算 法 的 效率 也 不 理想 Pi 对 We 日志 的 因 e针 b 要 用 来揭 示数 据库 中项 目或 属 性 之 间 的相 关 性 。 关 联 规 则 经 常 特 点设 计 了一 个 称 为 WA — n P Mie的 算 法 . 算 法 首 先 扫 描 两 该
算法 , 并指 出 了频 繁 模 式 未 来的 研 究 方 向 。
【 关键词】 频繁模式 数据挖掘 :
1 引 言 、
顺 序发生的 。 且是连续发生 的。 而
频 繁模 式 挖 掘 是 数 据 挖 掘 研 究 中的 一 个 重 要 课 题 .它 是 关
在 We b使 用 挖 掘 中 . 件 被 看 成 单 元 索 的 集 合 . 此 非 邻 事 因
例 而 对 候 选 集 进 行 筛 选 .因 此 该算 法 时 问 效 率 和 空 问 伸 缩 性 都 面 临 预 测 用 户 下 一 步 的 访 问请 求闯阿 . 且 还 可 以用 来 改 善 网站 挑战 。
因此 . 现 频 繁项 集 是关 联 规 则 挖 掘 中 的关 键 技 术 和 步 骤 。 发
联 规则 、 关 性分析 、 列模式 、 相 序 因果 关 系 、 节 片 段 、 部 周期 近 序 列 模 式 是 常 规 序 列 模 式 挖 掘 的 一 个 特 例 。常 规 的序 列 模 式 情 局
性 、 露 模式 等许 多 重 要 数 据 挖 掘 任 务 的 基 础 『 因此 . 繁模 式 挖 掘 算 法 Ap A 『、 S f FeS a l、r x pn' 都 可用 显 1 ] 。 频 J 儿l G P j 9 1 划、 rep n Pe S a [等 z 1 f i 3 有 着 很 广 泛 的 应 用 , 如 。 物 蓝 数 据 分 析 、 叉 购 物 、 页 预 于 从 We 日志 中 挖 掘 非 邻 近 序 列 模 式 。 但 算 法 A r r l 和 例 购 交 网 b pi i l oA S 取 、 性 化 网站 等 。根 据 挖 掘 对 象 的不 同 , 繁 模 式 挖 掘 方 法 可 G P在 生 成 非 邻 近 序 列 模 式 的 过 程 中 容 易 产 生 大 量 候 选 集 且 需 个 频 分 为 频 繁 项 集 挖 掘 、 繁 序 列 挖 掘 等1 频 2 - 1
被 婀 于 市 场 营 销 中 .从 交 易 数 据 库 中 可挖 掘 出 不 同 商 品 问 隐 含 遍 数 据库 . 把数 据 库 压缩 存 储 到 WA P树 中 . 后 递归 的构 造 条 件 然
的 销 售组 合信 息 . 将这 些 信 息用 在 营 销 策 略 上 . 高 商 品 销 售 WA 再 提 P树 来挖 掘非 邻 近 序列模 式 。Z a g 出 了 C - n 算 法叫. hn 提 Smie 该
量 . 又 称 为 购 物篮 分析 [ 关 联 规 则 不 仅 仅 局 限 于购 物 篮 分 析 . 算 法 通 过 加 入 检 测 函 数 来 对 WA — n 算 法 进 行 改 进 . 一 定 程 故 3 1 。 P mie
它还 有 着 广 泛 的应 用 领 域 . 医疗 [1 融l. b站 点优 化 : 度 上 提 高 了 算 法 效 率 CIE e e提 出 了对 WA 如 4. 1 金 aWe 5 1 等 . zi . f P树 编 码 的 思想 L P Mie 1 但 j 1 在 挖 掘关 联 规 则的 过 程 中 . 繁项 集 的 挖 掘 是 整 个 算 法 的 瓶 颈 。 和 一 个 挖 掘 非 邻 近 序 列 模 式 的 有 效 算 法 P WA — n 【. 频 P WA — n 算 法 主要 的 不 足 是 搜 索 空 间收 缩 太 慢 .遍 历 结 点 L P Mie 这 A r r算 法 f 一 种挖 掘频 繁项 集 的基 本 算 法 。 采 用逐 层 次 数 过 多 . 在 一 定 程 度 上 影 响 了算 法 的 效 率 。 pi i o a l 是 它 迭代 策略 产生 频 繁 项 集 , 后 利 用 频 繁 项 集 产 生 关 联 规 则 。 于 然 由 由于 用 户 访 问站 点 页 面 的连 续 性 . 因此 邻 近 序 列 模式 能 更 A r r算 法生 成规 模 巨大 候 选 集 .同 时 必 须 多 次 扫 描 数 据 库 来 好 表示 用 户 访 问 站 点 的语 义 信 息用 邻 近 序 列 模式 不仅 可 以用 来 pi i o 。
21 0 0年第 2期
福Leabharlann 建 电脑 3
频繁模式挖掘算 法综述
周常恩 ,林端 宜 ,杨雪梅 ,赖新梅 ,褚剑锋
(福 建 中 医 学 院信 息 管理 研 究 所 福 建 福 州 3 00 ) 503
【 摘 要】 对频繁模式技术进行 了综述 , : 阐述 了频繁模 式产生的背景 、 义和任务 , 定 介绍 了国 内外常用的频繁模 式挖掘
相关文档
最新文档