基于关联规则的数据挖掘技术综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘 要 : 阐述 在 数 据 挖 掘 领 域 中的 四 种 常 用 的 数 据 挖 掘 技 术 方 法 , 以数 据 挖 掘 技 术 中的 关 联 规 则挖 掘为基础. 阐述 关联 规 则 挖 掘 的 经 典 算 法 Apir 算 法 的 基 本 思 想 。通 过 关 联 规 则 挖 掘 算 法 r i o 实验 给 出该 算 法 的具 体 使 用 方 法 . 结 该 算 法 存 在 的 不 足 。 总
收 稿 日期 :0 1 3 0 2 1 —0 —1 修 稿 日期 :0 1 O —2 21一 3 0
作 者 简介 : 刘丽 (9 7 , , 汉 人 , 师 , 士 研 究 生 , 究 方 向 为 数 据 挖掘 技 术 1 7 一) 女 武 讲 硕 研
现代 机 21. 国 计算 014 0
\ \ \



Hale Waihona Puke 一据 项 集 计 算 每 个 候 选 数 据 项 发 生 的次 数 . 后 基 于 并 然
⑤ 为生 成频繁 3 项 集 ,执行 C= 2 L= { 3 一 3L l( l } 2 I ,
(,,}{,,】 III,III , 3s {,,】 根 据 III,III , 1 (,,){ II,III】 12 s l 4 {, } 2,4 I ’} 2 5 。 z 4 A f f性 质 1可 以确 定 后 5个 候 选 不 可 能 是 频 繁 的 。 po ii , 因此 , 用 算 法 中 的 剪 枝 步 , 它们 从 C 中 删 除 。 后 利 把 然
掘 的 问题
过 数 据 分 析 工 具 . 海 量 数 据 存 储 中 抽 取 模 式 、 出数 从 找 据变 化 的规 律 . 而 改变 “ 据 丰 富 、 息贫 乏 ” 从 数 信 的局 面f l l 。
数 据 挖 掘 技 术 正 是 在 上 述 应 用 要 求 下 产 生 的 数 据 挖 掘 也 称 从 数 据 库 中发 现 知 识 f n wld eDi O ey K o e g S V r C i aa a e 简 称 K n D tb s 。 DD) 它 是 指 从 大 量 的 数 据 中挖 掘 . 出 隐 含 的 、 知 的 、 户 可 能 感 兴 趣 的和 对 决 策 有 潜 在 未 用 价 值 的知 识 和 规 则嘲 关 联 规 则 挖 掘 ( scain R lsMiig 是 数 据 挖 Aso it ue nn ) o 掘 领 域 中 的一 个 重 要 分 支 关 联 规 则 挖 掘 是 指 在 事 务 数 据 库 中找 出满 足 用 户 给定 的最 小 支 持 度 和 最 小 可 信
砩 究 与 开 发
/ /
— — — — — — — — —

//
基 于 关 联 规 则 的数 据挖 掘 技 术 综 述
(. 沙 航 空 职 业 技 术 学 院计 算 机 与 信 息 工 程 系 , 沙 4 0 1 ; . 中科 技 大 学 计 算 机 学 院 , 汉 4 0 7 ) 1长 长 10 4 2 华 武 3 04
式 和 规 律 关 联 规 则 挖 掘 的 任 务 是 在 事 务 数 据 库 D 中
找 出满 足最 小 支 持 度 m nu isp和 最 小 可 信 度 m nof i n 两 e 个 阐值 的规 则 . 汰那 些 无 用 的 关联 规 则 。 淘 ( ) 经 网络 方 法 2神 模 拟 人 脑 神 经 网络 的某 些 功 能 . 过 输 入 层 、 藏 经 隐 层 、 I层 等 , 数 据 进 行 调 整 、 算 , 后 得 到 结 果 , 输咔 J 对 计 最 以完成分类 、 聚类 、 征 规 则 等 多 种 挖 掘 任 务 。神 经 网 特 络 由于 本 身 良好 的 鲁 棒 性 、 自组 织 自适 应 性 、并 行 处 理 、分 布 存 储 及 高 度 容 错 等 特 性 非 常 适 合 解 决 数 据 挖
度 的 用 户感 兴 趣 的 、 用 的关 联 规 则 。 有
1 数据 挖 掘 的方 法
数 据 挖 掘 技 术 基 础 是 人 工 智 能 ( IA t c lne— A . rf i t i aI l i
l e c ) 又不 仅 限于 此 数 据 挖 掘 领 域 中常 用 的技 术 i ne但 g
( ) 传 算 法 3遗 遗 传 算 法 是 一 种 基 于 生 物 自然 选 择 与遗 传 机 理 的
随机 搜 索 算 法 . 一 种模 拟 生 物 全 局 优 化 方 法 是
( ) 策 树 算 法 4决 决 策 树 是 一 种 以 实 际数 据 为 基 础 的 学 习 算 法 . 它
通 过 将 大 量 数 据 有 目的分 类 .从 中 找 到 一 些 有 价 值 的
方法有 :
潜 在 的信 息 。 决 策 树 算 法 主要 是 用 来 学 习离 散 变 量 作 属 性 类 型 的学 习 方 法
2 关 联 规 则 挖 掘 的经 典 算 法 Apir算 法 r i o
A r r算 法 是 一 种 最 有 影 响 的 挖 掘 布 尔 关 联 规 则 pi i o 频 繁 项 目集 的 算 法 。 关 联 规 则 在 分 类 上 属 于单 维 、 该 单 层、 布尔 关 联 规 则 。A r r算 法 的基 本 思 想 是 : pi i o 首先 , 过 扫 描 事 务 数 据库 . 生 一 个 大 的 候 选 数 通 产
( ) 联 规 则 ( so it nRue 1关 A scai l) o
关 联 规 则 挖 掘 是 一 种 简单 、 实用 的 分 析 规 则 . 要 主 用 于发 现 存 在 于 大 量 数 据 集 中 的 数 据 之 间关 联 性 或 相
关 性 .从 而 描 述 了一 个 事 物 中某 些 属 性 同 时 出现 的模
关 键 词 :数 据 挖 掘 :关联 规 则 ;频 繁 项 目集
0 引 言
随 着 信 息 技 术 的迅 速 发 展 .各 个 领 域 都 存 储 了 大 量 的数 据 人 们 并 没有 从 剧 增 的 数 据 中 获 得 隐 藏 在 数
据 之 中 、 层 次 的有 价 值 的重 要 信 息 。 因此 迫 切 希 望 通 深
相关文档
最新文档