数据挖掘中的关联规则和序列模式
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
( )称规则 —y在事务数 据库 D 中具 有大 小为 f的可信 度 , 3 如果 D 中支持 物 品集 x 的事务 中有 f 的事务 同时也支持物 品集 y . 1 3 有 关算法的讨论 . ( )找出所有具有超 出最 小支持度的支持度 的项集 ( e es , Ap i i 1 i mst) 由 t r r算法 实现. o ( )利用大 项集 ( tm es 产生 所需 的规 则 (ue )算法 的思 想在于 : 2 1 e st) i rl . s 如果 说 AB D C 和A B是大项 集 , 我们就可 以通过计 算 可信度 , 也就是 c n o f— s p otAB D)s p ot u p r( C /u p r ( B)并通过 e n'mii n 来确定规则 A -CD是否 确立 ( 规则 由于 A C A , of  ̄ n of c B-  ̄ 该 B D是大项
的规律的知识 模式. 更确 切的说 , 联规 则通过 来自百度文库 化的数字描 述物品 甲的出现对物品 乙的 关
出现 有 多 大 的 影 响 .
12 关联规则的形式 . 设 J i i’ ・ ) :{ , . , 是一 组物品集 ( . 一个商场 的物品可能有 上万种 )D 是 一组 事务集 , ( 之为事务数据库 )D 中的每个 事务 是一组 物品 , 称 , 显然满 足 , 称事务 支 持物 . 品集 X, 如果 X T. 联规则是 如下形 式的一种 蕴含 : 关 X y, 中 X Jy 其 , J 且 X[Y , T
喀 什师 范 学院 学报
一
.
第 2 卷 3
( )称物 品集 X 具有大小 为 s 1 的支持度 , 如果 D 中有 s/ 9的事务支持 物品集 X; 6 ( )称关联规则 2 的 支 持 度 为 s ; y在 事务数 据库 D 中具有大 小为 s 的支持度 , 如果物 品集 xuY
关键 词 : 关联 规 则 ; 序列 模式 ; 大项 集 中 图分类 号 : P 0 . T 3 16 文 献 标识 码 : A 文 章编 号 :0 64 2 (0 2 0 — 4 1 0 — 3 x 2 0 ) 30
O 前
言
数据挖掘 由一些大型零售机 构面 临“ 策支持” 决 问题 (eio p ot rbe 所激 dcs ns p r po l i u m) 发. 用条形 码技 术采集 的大量销售数 据成为挖掘的基础 . 应 通过对这些 数据进行数据挖掘
数据 挖 掘 中 的关 联 规 则和 序 列 模 式 ’
陈 智 罡
( 什师范 学 院 数 学 系 , 喀 新疆 喀什 8 4 0 ) 4 07
摘
要 : 数据 挖 掘 中 的关联 规 则和 序 列 模式 的概念 和 作用 进行 了探 讨 , 关 联规 则 中寻 找 对 对
大项 集 的部 分应 用 程序 加 以实 现 , 同时 对 两种 模 式 的实现 过 程用 程 序 流程 的方 式 加 以说 明 , 并讨 论 了几种 不 同的实 现 算法 .
收稿 日期 :O l1 — 3 2 O 一 12
・
作 者简 介 : 陈智  ̄ (9 2 , , 师 , 事 计 算机 软 件工 程 研 究及 教 学 , 在 西 北 大学 攻 读 计 算 17一)男 讲 从 现
机 软 件工程 在职 硕士 .
维普资讯 http://www.cqvip.com
维普资讯 http://www.cqvip.com
第2 3卷 第 3 期 20 0 2年 5月
喀什 师范 学 院学 报
J u n lo s g rTe c e sC lg o r a fKa h a a h r ole e
Vo12 . . 3 No 3
M a 0 2 y2 0
ed n
‘
厶 = {EC . o n  ̄mis p c kc c u t I nu }
ed n
An we — U^ ; S r 厶
a r r gn函数 以 厶一 ( 有大 k 1项集 ) 为输 入参 数 , 回所有 大 志项 集 的集 pi i e o— 。所 - 一 作 返 一
合 厶 , 下面两步实现 : 以
第一步 , 合. 联
我们可 以找到对 于商业销售 及生产极 为有效 的一些信 息 ( 些信 息通 过具体 的模 式得到 这 反 映) 从而 可以提高销售 和生产效 率 , , 降低成本 , 取得 最大 的商 业效 益 , 这就 是数 据挖掘
的意义所在.
1 关联 规 则
1 1 关联规则 的概念及 定义 . 考察一些涉及许 多物 品的事务 : 事务 1中出现 了物 品 甲, 事务 2中出现 了物 品乙 , 事 务 3中则同时出现了物品 甲和 乙 , 那么 , 品甲和 乙在事务 中的 出现相互 之间是否有规律 物 可循 呢? 在数据库 的数据挖 掘中 , 联规则就是描述这种 在—个事务 中物 品之间同时 出现 关
集故肯 定具有 最小支持度 ) . 下面 我们讨 论 () 1 中的 Apir算 法 . r i o 因为根 据此 算法 得到 的大项 集 , 在序 列模 式 阶 段是有 实际用处的. r r 算法如 下 : Api i o
Ll { re1i ms t } 一 l g - e es ; a t
f r k- 2; — ≠ ; + ) o b g n o ( - Lk l 五+ d e i
Ck - p ir- e Lk ); - a ro ig n( —1 f r l ta s c in D o b g n o a l r n a t st o E d e i G = s b e ( .); u s t Ck f f r l c n ia e E C o o al a dd ts c d cu t + ; o n+