Apriori算法的研究与改进

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最 为经典 的算 法 , 它首 先 通 过 最 小 支 持 度 获取 事 务
建两 个支 持度 矩 阵分别 挖掘频 繁 二项集 和最 大频 繁
项集 , 其时 间和 空 间代 价 较 大 ; 献 I ]在 由频 繁 k 文 - 6 项 集 连接 生成候 选 k+ 1项 集 时效 率较 低 且会 生 成 错误 频繁 项 。 文在 减少 扫描数 据 库次数 的基 础上 , 本
Ve . 0 No 3 12 .
S p. 201 e 1
21 0 1年 9月
I I1 . 9 9ii n 1 7—6 5 2 1 . 3 0 6 N) :0 3 6 /.s . 6 26 8 . 0 1 0 . 0 s
A roi 法 的研 究 与 改 进 p ir 算
陈 宜荣
( 徐州经 贸高等职业学校 信息系 , 江苏 徐州 2 10 ) 2 0 4


要 : 绍 关联规 则挖 掘 中的 经典 算 法—— Ap ir 算 法 的关键 思 想 。针 对 传 统 Ap ir 算 法 效 介 r i o r i o
率上 的不足 , 出改进 Apir 算 法 。该 算 法通 过 构 造辅 助表 , 少访 问表 中 的无 效 记 录 , 而 减 提 r i o 减 从 少每 次访 问数据 库 的次数 , 好地提 高 了效 率 。 实验 结果 表 明 , 较 改进 后 的算 法具有 较好 的有 效性 。 关 键词 : r r 算 法 ; Ap i i o 改进 ; 助表 ; 辅 仿真
t g f Ap i r a g rt m ,o r a g rt m e e a e i a l s t v i s l s a a n e u e a e o ro i l o ih u l o ih g n r t s ad t b e o a o d u e e s d t ,a d d d c s t e t s o a a a e v stn h i me fd t b s iii g,S ti o e e fce t c mp r d wih t e ta ii n lo e Ex e i O i s m r fii n o a e t h r d t a n . o p r — me trs l s o h tt en w l o i m u p ro mst e f r e n ,a d g t o d p a t ai . n e ut h ws t a h e ag r h o t e r h o m ro e n e sa g o r ci l y t f c t
中 图分类 号 : 3 1 6 TP 0 . 文献 标识 码 : A 文章编 号 : 6 26 8 ( 0 1 0 —0 30 1 7 —6 5 2 1 ) 30 2 —4
S u y a m pr v m e f Apr o iAl o ihm t d nd I o e nto i r g r t
第 2 O卷
第 3期
淮海工学院学报 ( 自然科学版)
J u n l fH ah i n tt t fTe h o 0 y Na u a S i c dt n r a o u i a s iu e o c n l g ( t rl c n eE i o ) o I e i
a s i ton r e n n s oca i uls mi i g,a op s s a i nd pr o e n mpr ve o d Apro i l ort m .I r s e tt hedia a i r g ih a n e p c O t s dv n—
Ke r :Apro ia g rt y wo ds i r l o ihm ;i mpr ve nt i a e;smu a i n o me ;a d t bl i l to
关 联分 析在 商业 、 电信 、 业 、 农 医学 、 教育 、 融 金 等领 域有 着广 泛 的应 用 。 r r算法 [ 是关 联 分析 Ap i i o 1
度 [ , Apir 算法 中 , 个 过 程需 频 繁扫 描 数 据 3在 ] r i o 这 库, 因此会 耗 费大量 时 间L 。 4 ]
数 , 而提 高挖 掘频 繁项 的效 率 。 从
本 文第 1 分介 绍 Apir算 法 , 2部 分详 细 部 r i o 第
介 绍 改进 的 Ap ir算 法 的 流程 , 以实 例说 明 。 r i o 且 第 3部分测 试新 算法 的性 能 , 4部分 给 出结论 。 第
通 过 生成 辅助 表减 少访 问数据 库表 中无 效记 录 的次
数据 库 中所有 频繁 项 , 后 再 通 过 最 小 置 信度 挖 掘 然
关 联 规则 [ , 频 繁 项 的获 取 是关 联 规 则 挖 掘 的关 2而 ]
键 , 计算 复 杂度决 定 了整 个 挖 掘 算 法 的 时 间复 杂 其
Ab t a t sr c :Th s p p r i t o u e h rn i l ft e Ap i r a g rt m ,t e c a sc l l o ih o i a e n r d c s t e p i cp e o h ro i l o i h h l s ia g rt m f a
CHEN — o Yir ng
( p .o n o main De t fIf r t ,Xu h uAd a cd Vo ain lS h o fEc n mi & Trdn 。Xu h u2 1 0 o z o v n e c t a c o l o o c o o a ig z o 2 0 4,Chn ) ia
相关文档
最新文档