一种基于后缀树的简洁关联规则挖掘有效剪枝方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
l t o t n n o cs tms t n lsd r c l . d t n l i a od c n i go g n aa a e r - i l c s d mi e c n i i te a e e esa d r e i t Ad i o a y, v i ss a n n r i a d t b s e u e y i l t i l c ri ey a Байду номын сангаас a h e e o d p r r a c . x ei n a e u t s o i i n e e t e me h d f r o cs s u sv l n c iv sg o e o f m ne E p r me t l s l h w a f c i t o n ie a - r s ts v o c s c ai n r l n n n a o d s ai i t . o it u e mi i g a d h s g o c l l y o b i Ke r s a s ca in r l g n r t r d t n n e fc ie s a c p c r n n t o s f x t e y wo d : s o i t e; e e ao ; aa mi i g; f t e r h s a e p i g meh d; u i — e o u e v u r
V0 _ 6 No 3 l2 .
Jn 2 1 u . Ol
文章编 号 :04—17 (0 1 0 0 1 0 10 4 8 2 1 ) 3— 0 2— 6
一
种基于后缀 树的简洁关联规 则 挖掘 有效剪枝 方法
王秉政 , 苏晓珂 , 张素智
( 州轻工 业 学院 计算 机 与通信 工程 学 院 ,河 南 郑 州 4 00 ) 郑 50 2
a s ca t n u e i i a e o uf x-r e so i io r ls m n ng b s d n s f i te
W ANG B n — h n , S a - e Z i g z e g U Xio k , HANG S —h uzi
有大量 的研究工作 , 并且 出现 了一些挖掘全部频繁
第2 6卷 第 3期 2 1 年 6月 01
郑 州 轻 工 业 学 院 学 报 (自 然 科 学 版 )
JU N L FZ E G H UU IE S YO IH D S R { a r c ne O R A H N Z O NV R I F G T N U T Y Nt aSi c} O T L I ul e
( oeeo o p ad Cr. n . Z egh uU i o ih d, hnzo 5 0 2 C i ) C lg l fC m . n o E g, hnzo nv fL t n . egh u4 00 , hn n . g I Z a
Ab t a t F r i ms t s a c p c s t o h g h c n r a e o cs s o it n r l a e n c o e s r c : o e e e r h s a e i o u e w ih i ce s s c n i a s c ai u e b s d o l s d t e o i ms tc l u ai n a d d c e s s mi i g e ce c a n w s a c p c r n n t o a r p s d I t e ac lt n e r a e n n f i n y, e e h s a e p i g meh d w s p o o e . t e o i r u
epot sfxt el es u tr adjs k esa tea iifr t n I cnp n erhs aewt xli uf — e i t c e n t ep s il st lnoma o .t a r esac p c i s i r k r u u lt a i u h
成对项集搜 索空间进行剪枝. 实验表明, 比传统方法本方法更加有效 , 相 并对各种数据集具有较好 的
可规模 性 .
关 键词 : 关联 规 则 ; 闭模 式 ; 据挖 掘 ; 数 有效 剪枝 方 法 ; 缀树 后
中图分 类号 :' 9 r31 I P 文 献标 志码 : A
An e e t e s a c p c r n n t o o o cs f c i e r h s a e p u i g me h d f r c n ie v
0 引言
数据 挖掘 提 供 了可 以 分 析 大规 模 数 据 的方 法 , 然而随着数据量的逐渐变大 , 在某些应用 中 又会显得力不从心. 选择更加简洁高效 的数据表示 方法和挖掘方法 , 是解决大数据量挖掘任务的需要.
频繁 模式 的 挖 掘 是 关 联 规 则 、 列 模 式 、 关 序 相 分 析 等许 多重要 数 据 挖 掘 任 务 的 基 础 . 这 方 面 已 在
摘要 : 针对基于闭模 式简洁关联规则挖掘 中搜 索空间和计算量过大、 挖掘有效性 降低的问题 , 出一 提 种新 的 剪枝 和挖 掘 方 法. 方 法通过 充 分利 用挖 掘 数据 结 构 , 留尽 可能 少的挖掘 后 缀信 息 , 该 保 直接 挖
掘 简洁项 集并枚 举 简 洁关联 规 则 ; 需要 保 留大 量 中 间结构 和 重 复 扫描 数 据 库 , 不 可在 较 小代 价 下 完
V0 _ 6 No 3 l2 .
Jn 2 1 u . Ol
文章编 号 :04—17 (0 1 0 0 1 0 10 4 8 2 1 ) 3— 0 2— 6
一
种基于后缀 树的简洁关联规 则 挖掘 有效剪枝 方法
王秉政 , 苏晓珂 , 张素智
( 州轻工 业 学院 计算 机 与通信 工程 学 院 ,河 南 郑 州 4 00 ) 郑 50 2
a s ca t n u e i i a e o uf x-r e so i io r ls m n ng b s d n s f i te
W ANG B n — h n , S a - e Z i g z e g U Xio k , HANG S —h uzi
有大量 的研究工作 , 并且 出现 了一些挖掘全部频繁
第2 6卷 第 3期 2 1 年 6月 01
郑 州 轻 工 业 学 院 学 报 (自 然 科 学 版 )
JU N L FZ E G H UU IE S YO IH D S R { a r c ne O R A H N Z O NV R I F G T N U T Y Nt aSi c} O T L I ul e
( oeeo o p ad Cr. n . Z egh uU i o ih d, hnzo 5 0 2 C i ) C lg l fC m . n o E g, hnzo nv fL t n . egh u4 00 , hn n . g I Z a
Ab t a t F r i ms t s a c p c s t o h g h c n r a e o cs s o it n r l a e n c o e s r c : o e e e r h s a e i o u e w ih i ce s s c n i a s c ai u e b s d o l s d t e o i ms tc l u ai n a d d c e s s mi i g e ce c a n w s a c p c r n n t o a r p s d I t e ac lt n e r a e n n f i n y, e e h s a e p i g meh d w s p o o e . t e o i r u
epot sfxt el es u tr adjs k esa tea iifr t n I cnp n erhs aewt xli uf — e i t c e n t ep s il st lnoma o .t a r esac p c i s i r k r u u lt a i u h
成对项集搜 索空间进行剪枝. 实验表明, 比传统方法本方法更加有效 , 相 并对各种数据集具有较好 的
可规模 性 .
关 键词 : 关联 规 则 ; 闭模 式 ; 据挖 掘 ; 数 有效 剪枝 方 法 ; 缀树 后
中图分 类号 :' 9 r31 I P 文 献标 志码 : A
An e e t e s a c p c r n n t o o o cs f c i e r h s a e p u i g me h d f r c n ie v
0 引言
数据 挖掘 提 供 了可 以 分 析 大规 模 数 据 的方 法 , 然而随着数据量的逐渐变大 , 在某些应用 中 又会显得力不从心. 选择更加简洁高效 的数据表示 方法和挖掘方法 , 是解决大数据量挖掘任务的需要.
频繁 模式 的 挖 掘 是 关 联 规 则 、 列 模 式 、 关 序 相 分 析 等许 多重要 数 据 挖 掘 任 务 的 基 础 . 这 方 面 已 在
摘要 : 针对基于闭模 式简洁关联规则挖掘 中搜 索空间和计算量过大、 挖掘有效性 降低的问题 , 出一 提 种新 的 剪枝 和挖 掘 方 法. 方 法通过 充 分利 用挖 掘 数据 结 构 , 留尽 可能 少的挖掘 后 缀信 息 , 该 保 直接 挖
掘 简洁项 集并枚 举 简 洁关联 规 则 ; 需要 保 留大 量 中 间结构 和 重 复 扫描 数 据 库 , 不 可在 较 小代 价 下 完