PSO算法在关联规则挖掘中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P O 算 法在 关联 规 则挖 掘 中的应 用 S
刘 丛林 , 张 忠林 , 曾庆 飞
( 州交 通 大 学 电子 与 信 息 工程 学 院 , 兰 甘肃 兰州 707) 3 0 0
摘
要 : 出 了一种 新 的 大型 数 据 库 中关 联规 则挖 掘 策 略 , 用 P O 算 法 对 原 始 数 据 库 进 行 划 分 , 原 始 数 据 库 提 利 S 将
Ha n等提 出 了频 繁模 式增 长 ( P— o t ) 掘算 F Gr w h 挖
为 , 粒 i 微 的速 度为 V 一 (i,i … , )则其 i v ', . U 2
粒 子更新公 式 如下 :
Vd一 叫 * + y *C ( - od + *f ( 一 z / 1 】户 - T ) / l户 )
第 3期
刘丛林等 : S P O算法 在关联规则挖掘中的应用
生成 全 局 频 繁
的初 始 位置. 据 当前位 置 , 用适 用度 函数计 算公 根 利 式计 算 适应 值 b X) 设 置 当前 适应 值 为个 体 极值 o( ,
初 始 化 过 程 建 立 子 数据
P 3* " l ee
因此 , 本文将 P O 算 法[5应 用到 关 联 规则 挖 S 4_ _ 掘 中. 粒子 群算 法 具 有 实 现 简单 、 掘精 度 高 等 特 挖
点. 在进 行关 联规 则挖 掘 之前 , 先通 过 P O 算 法 首 S
其 中 : 为惯 性权重 ; 和 c 为加 速常数 ; 和 为 C
据库 进行划 分的步骤 :
对粒 子的位 置 采用 一维 1 6位 二进 制 编码 , 1 “”
是 对大型数据库 进行 着挖 掘时 , 方 法 明显 具有 更 该 好 的效率.
1 P O算法实现 的数据库划分 S
11 基本 粒子群算 法 (S . P O)
粒 子群算 法 ( S P O)是 当 前 比较 流 行 的 仿 生 类
两个 在[ ,] 围 内变 化的随机 函数. 01 范
1 2 利用 P O算法 实现 数据 库划分 . S
实现对大数 据库进行划 分E , 成多个 子数据 库 , 6形 ] 再 在子数据 库基础上 进行 局 部挖 掘 , 后 合并 各 个 局 最
部频繁项集 并生 成关 联 规则 . 验证 明 , P O算 实 用 S 法结合 F G o t 法对 数据 库进 行关 联规则 挖 P— r w h算 掘有效 的改善 了 F Grwt 挖 掘算 法的效 率 , P— o h 尤其
分为 个子数据库, 再使用 F G o h算法对每个子数据库进行 关联规则挖掘. P— rwt 实验证 明: 该方 法有 效的改善 了 F Go t P— rw h挖掘算法的效率, 尤其 是对 大型数据库进行着挖掘 时, 该方法相 比于其它算法具有更 高的效率.
关键词: 关联 规 则 ;S 聚 类 ;S 算 法 PO P0
() 1 — z d+ () 2
法 . P— o t F Grw h算法 不 产生候 选 频繁项 集 , 其有 着
更好的挖掘效率. F — rw h 但 P G o t 算法通过构造 F — P Tre e 来实 现关联挖 掘¨ , 3 这对 于大型 数 据库 显然 是 ]
不 现实的.
群体 经验 调 整 自己 的速度 . 第 i 微 粒 为 X 一 设 个 ( ,", , ) 其 经 历 过 的 最 好 位 置 为 P S … , t 一 ( , … , ) 群体 所有微 粒经 历 过 的最 好 位 置 户 P ,
Apir ̄算法 , 其在挖 掘过程 中需 要 产生 大量 候 r i] o[ 但 选 项集 , 重 影 响 了 算 法 效 率L.基 于 此 ,J we 严 2 ] i i a
中国 分类 号 : P 9 T 31
文献 标 志 码 : A
0 引言
关联 规则挖掘 就是挖 掘数据库 中存在 的一类 重
要 的规律 性 的 知识 . 联 规 则 挖 掘 的基 百度文库 算 法 是 关
能 等领域具 有很 好 的应用 前景 . S P O算 法 将 每个 个
体看 作 D维 搜索空 间中 的一 个 的粒 子 , 搜 索空 间 在 中以一定 的速度 飞行 , 飞行 过 程 中 根据 个 体 经验 和
基本关联规则挖掘算法虽然都不适合大型数据 库 中海量数据 的挖掘 , 是 在数 据 库 较小 的情 况 下 但 基 本算 法可 以具 有很好 的效率. 因此 , 文考 虑利用 本 粒 子群算 法对 大型数 据库 进 行划 分 , 在 子 数 据库 再
的基础上 应用 F — o h 法进 行关联 规则 挖掘 , P Grwt算 提 高挖掘效 率. 利用 粒 子群 算 法 进行 数 据 库划 分 在 的时 , 本文 引人 了 K一均值 聚类 的思想. 以下是 对数
第2 9卷 第 3 期 21 00年 6月
兰
州 交
通 大
学
学
报
Vo . 9 No 3 12 .
J un l f az o i tn iesy o ra o nh uJa o gUnv ri L o t
J n 0 0 u e2 1
文章 编 号 :0 1 3 32 1) 30 9 —4 1 0— 7 ( 00 0 —0 6 4 0
代表 了该 位 记录 属性 为 真 ,0 “ ”代 表 了该 位 记 录属
性为假 .
算法 , 该算 法在 函数 寻 优 、 聚类 、 侵 检 测 和人 工 智 人
1 )随机 产生 个聚类 中心 Z , o以 作为粒子
收 稿 日期 :0 91—2 2 0—0 1
基金项 目: 兰州市企业技术攻关计划资助 (0 914 2 0 ——) 作者简介 : . 4 1 8一 , , 刘. k 9 4) 男 山东青岛人 ,  ̄ ( 硕士生.