关联规则在高校图书馆借阅数据挖掘中的应用

合集下载

数据挖掘在高校图书馆服务中的应用研究

数据挖掘在高校图书馆服务中的应用研究

数据挖掘在高校图书馆服务中的应用研究一、本文概述随着信息技术的迅猛发展和大数据时代的到来,数据挖掘技术已经广泛应用于各个领域,尤其在高校图书馆服务中,数据挖掘技术的应用逐渐成为研究的热点。

本文旨在探讨数据挖掘技术在高校图书馆服务中的应用及其效果,以期为提升图书馆服务质量和效率提供有益的参考。

本文首先介绍了数据挖掘技术的基本概念、原理及其在其他领域的应用情况,为后续研究奠定理论基础。

接着,分析了高校图书馆服务的现状及其面临的挑战,如用户需求多样化、信息资源海量化、服务效率要求高等。

在此基础上,本文深入探讨了数据挖掘技术在高校图书馆服务中的应用场景,如读者行为分析、图书推荐系统、学科服务等。

通过案例分析和实证研究,本文评估了数据挖掘技术在高校图书馆服务中的应用效果,并指出了存在的问题和不足。

本文提出了针对性的建议和改进措施,以期推动数据挖掘技术在高校图书馆服务中的更广泛应用和深入发展。

本文的研究不仅有助于提升高校图书馆的服务质量和效率,也有助于推动数据挖掘技术的进一步发展和完善。

二、数据挖掘技术基础数据挖掘(Data Mining)是从大量、不完全、有噪声、模糊、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

数据挖掘涉及的技术方法很多,主要有数据清理、数据集成、数据变换、数据挖掘过程模型、数据挖掘方法和知识评价等。

数据挖掘的主要功能包括分类、聚类、关联分析、序列模式挖掘、预测、时间序列分析和偏差分析等。

在高校图书馆服务中,数据挖掘技术的应用主要体现在以下几个方面:通过对读者的借阅记录、浏览行为等数据进行挖掘,可以分析出读者的阅读兴趣、习惯和需求,从而为读者提供更加精准、个性化的推荐服务;通过对图书馆藏书的利用情况、读者的借阅率等数据进行挖掘,可以评估图书馆的服务质量,发现存在的问题和不足,从而改进图书馆的管理和服务;数据挖掘技术还可以用于图书馆的决策支持,通过对大量的数据进行挖掘和分析,可以为图书馆的发展规划、资源配置等提供科学依据。

关联规则在数据挖掘中的应用

关联规则在数据挖掘中的应用
关联规则在数据挖 掘中的应用
-
1
2
目录
3
CONTENTS
4
5
引言 关联规则的定义 关联规则的挖掘过程 关联规则在数据挖掘中的应用
结论
1
引言
引言
关联规则是数据挖掘中的一种重要技术,主要 用于发现数据集中变量之间的有趣关系,如购
物篮分析中经常一起购买的商品组合
关联规则可以揭示数据集中变量之间的潜在关 联,从而帮助企业更好地理解客户需求、优化
5
结论
结论
关联规则在数据挖掘中 具有广泛的应用前景, 可以帮助企业更好地理 解客户需求、优化产品 组合、提高销售策略等
然而,关联规则挖掘也 存在一些挑战,如处理 大规模数据、处理高维 数据等
未来,随着技术的不断 发展,相信关联规则挖 掘将会在更多领域发挥 重要作用
-
谢谢观看
XXXXX
XXXXXX XXXXX
3
关联规则的挖掘过 程
关联规则的挖掘过程
关联规则的挖掘过程 通常包括以下步骤
关联规则的挖掘过程
数据准备
首先需要对数据进行预处理,包括数据清洗、数据转换等, 以便为后续的关联规则挖掘提供合适的数据格式和结构
关联规则生成
基于频繁项集,可以生成关联规则。这些规则可以表示为“如 果购买商品A,则购买商品B”的形式
商品或服务
03
金融欺诈检测
在金融领域,关联规 则可以用于检测欺诈 行为。通过对客户的 交易记录进行分析, 可以发现异常的交易 组合或模式,从而及
时发现欺诈行为
04
医疗诊断
在医疗领域,关联规 则可以用于辅助诊断。 通过对患者的症状和 病史进行分析,可以 发现疾病之间的关联 关系,从而为医生提

关联规则在高校图书馆管理的应用

关联规则在高校图书馆管理的应用
2 1 数 据 预 处 理 .
为读 者 提 供 及 时 有 效 的 资 源 服 务 是 图 书 馆 的一 项 重 要 工 作 。 者 来 到 图 书馆 . 往 被 浩 如 烟 海 的 资 料 所 读 往 淹 没 . 以高 效 获 得 图 书 . 图 书馆 对 于 读 者 需 求 不 清 难 而
型作为建立关联规则 的核心算法 。设 置最低条件支 持
为 8 最 低 规 则 置 信 度 为 6 % . 到 的 关 联 规 则 如 图 %. 0 得
4 5所 示 。 、
的检查 一Байду номын сангаас通过数据审核来 完成。进行数 据审核发现,
有效 字 段 为 34 27条 。
罔 4 R 模 型 没 置 图 G I 图 1 数 据 类 型 设 置
图书借 阅信息数据经过预处理 . 如图 1 所示 . 以中 图分类法 2 2大类为 主的数据形式 为 了配合数据挖掘
G I 联分 析算法 . 要把 2 R关 需 2类 图 书 变 量 类 型设 置 为
收 稿 日期 : 0 1 6 9 2 1 ~0 —0
修 稿 日期 :0 1 0 一O 21— 7 1

关联 规则在 高校 图书馆管理 的应 用
吴 旭 东 , . 柳 炳 祥 一
(. 西 陶 瓷 工 艺 美 术 职 业 技 术 学 院 ,景 德 镇 3 3 0 ; . 1江 3 0 0 2 景德 镇 陶 瓷学 院 , 德 镇 3 30 ) 景 3 4 3
/ / /

要 :在 收 集 图 书 流 通 数 据 并 对 收 集 数 据 进 行 预 处理 的 基 础 上 ,采 用 S S e n ie 件 的 关 P SCl me t 软 n 联 规 则模 型 , 图 书 流通 数 据 进 行 挖 掘 分 析 , 出读 者 与各 类 图 书 的 关 系 , 高校 图 书馆 提 对 找 为

关联规则在高校图书馆中的应用研究

关联规则在高校图书馆中的应用研究

摘 要 : 据 挖 掘 是 近 几年 发 展 起 来 的 一 种 对信 息 资 源进 行 开 发 和 数 据 处理 的 新技 术 。 关联 规 则是 数 据 挖 掘 的核 心技 术。 将 数 而 关联 规 则 应 用 于 图 书馆 的流 通数 据 , 以发 现 读 者在 借 阅文 献 的 过 程 中隐 舍 的 各 学科 之 间 的 关联 , 对提 高 图 书馆 资 源 的 利 用 可 这
7 . 4
为。第 三, 分析的侧重点在于找差距 。基于上述认识 , 我们 的 思 路与树” 业绩” 摆” , 成绩 ” 至为” 甚 晋升 ” 而策划” 科研 成果 ”
编辑/ 樊延南
关联规则在高校 图书馆 中的应用研究
邓 慧 , 思渝 , 颖 , 赖 杨 刘雪梅
( 北 医 学 院 , 川 南 充 67 0 ) 川 四 3 00
3结论

中文图书 中,04年后采选 的图书借阅率都较高 。借 阅频次 20
在前 5 以上 的图书 中,共有 7 9种是 2 0 以后 出版 , O位 6 0 0年
20 0 4年以来采选 的嘲 仅此一例 , 。 即可说 明对待基础工作 的态
度直接影响办馆效益 。 23 对 以往工作和本 次调研 的反思 .
次试验 性的 、 为改进工 作的探析 , 必能反 映我校 图 未
本次调研 是在我馆工作取得 了明显改进 的基础上 , 为了
明确方向 、 清差距 、 认 持续发展而做 的探析 。 以下方面值得 有 思考 、 讨论。
书馆工作全貌 , 却提示我们这 样做 很有价值。高教改革任 但
重道远 , 探索正未 有穷期 。归纳调查结 果正 于同行 , 尚祈方家
基于 以下 指导思想 : 以维 护读者权益 为宗 旨, 以持续提 高办 馆效益为 目标 , 以认清差距为着力点 。 维护读者权益 , 首先是

关联规则挖掘在高校图书馆借阅流通中的应用

关联规则挖掘在高校图书馆借阅流通中的应用
前 提和结论 。
其基 本原理可 以表述 为 : 规则 A= B在 事务集D中成立 , = > 具有
支 持 度 S S p ot和 置 信 度 C C nie c)其 中S D中事 务 包 含 ( u p r) ( o f ne , d 是 u B的 百 分 比 , PAu 。 以表 示 为 SpotAj 口 = ( uB , 即 ( )可 upr( ) p A )
的 联 系 , 据 此 联 系 进 行 商 品货 架设 计 、 存 安 排 等 。 根 货
Rd i4 Rd i5
梅科类、数学类,数学类 计算机类.数学类
根 据 韩 家炜 等观 点 , 联 规 则 定 义 为 : A是 一 个 项 集 , 务 T 关 设 事 () 2我们这里设定最小支持度为4%, 0 对原始 数据 库进行全局扫 包 含 A 当 且 仅 当 Ac T 。 联 规 则 是 形 如 A= B 的 蕴 涵 式 , 中 描 , 生 候 选 项 集 Cl如 表 ~ 所 示 。 关 = > 其 产 , 2 Ac Bc, 并且 AnB: 。 B分别称为关联规则 A_ I, , A, >B的 表 一 候 选项 集 C1 2
信 度 分 别 大 于 用 户事 先 给 定 的最 小 支 持 度 和 最 小 置 信 度 的 关 联 规 这 些 项 集 组 合 成 频 繁 项 集 L , 表 一 所 示 。 1如 3 则, 才算是强规则 , 即有用的规 则, 这也就是关联规则挖掘 的任务 。 表一 3频 繁 项 集 L 1 22关联规 则的 经典 算 法 Apir . r i o 书 目类别 支持度
应 用 研 究
。与 未 l应 执蛳 用
关联规则挖掘在高校图书馆借阅流通 中的应用
张 红 燕

关联规则技术在数据挖掘中的应用

关联规则技术在数据挖掘中的应用

关联规则技术在数据挖掘中的应用
关联规则技术在数据挖掘中有广泛的应用,常见的应用包括:
1. 购物篮分析:关联规则被广泛应用于购物篮分析,可以帮助商家识别商品之间的关联性,帮助商家制定促销策略和优化产品布局。

2. 电信行业:关联规则在电信行业中可以用于分析用户的通话模式,识别不同用户群体之间的通话习惯,从而为用户提供更好的服务。

3. 医疗行业:关联规则可以用于医疗数据的分析,帮助医生识别疾病之间的关联性,提高疾病的诊断和治疗准确性。

4. 营销和广告:关联规则可以帮助营销人员了解消费者的购买模式和偏好,从而制定针对性的广告和推销策略,提高营销效果。

5. 网络安全:关联规则可以用于网络安全领域的入侵检测和异常行为识别,帮助识别和预测潜在的网络攻击。

6. 人员定位:关联规则可以应用于人员定位系统中,帮助识别人员之间的关联关系和行为模式,为人员定位和监控提供支持。

总之,关联规则技术在数据挖掘中可以帮助我们挖掘数据之间的关联性和模式,从而为各个领域提供更好的决策支持和业务优化。

数据挖掘技术在图书管理中的应用

数据挖掘技术在图书管理中的应用

数据挖掘技术在图书管理中的应用摘要:大学图书馆在日常的图书流通中会产生大量的读者服务数据,这些流通数据能够客观反映不同读者阅读习惯、读书兴趣等方面的规律和特点。

数据挖掘技术中的关联规则、聚类分析、分类和预测分析等方法对发现和挖掘这些规律和模式有着独特的优势。

把这些技术应用在图书管理中,可以发现图书流通环节隐藏的潜在规律,提高图书流通效率。

同时为领导决策、馆藏图书配置以及文献结构体系建设提供科学的指导。

关键词:数据挖掘技术图书管理技术分析方法1 数据挖掘随着各行业事务处理的计算机化,我们产生和收集数据的能力正在迅速提高。

我们已经被各种数据所淹没,如科研数据、商业数据、气象数据、居民日常消费数据、图书借还历史数据……我们没有时间和精力把这些数据逐个查看。

用什么手段来处理和应付这些数据已经成为我们当前的兴趣所在,因此我们就必须找到一套行之有效的办法,来对这些数据实现自动分类、分析和汇总,自动地发现和描述数据中的规律和趋势,并发现和标记数据的异常情况。

数据挖掘技术的出现和发展,为我们提供了解决这一问题的有效方法。

数据挖掘是将隐含的、尚不为人所知的、同时又是潜在的信息从数据中提取出来,建立计算机程序,自动在数据库中扫描,以发现规律或者模式,即找出数据中的模式或规律的过程。

这个过程是自动的或半自动的,数据的总量通常是相当可观的,同时从中发现的模式或规律需要是有意义的,并且能产生一定的效益。

数据挖掘通常又称为数据中的知识发现,是方便地提取代表知识的模式或规律;这些模式或规律通常隐含或记录在各种数据库、数据库集、网页日志、应用软件或通信数据流中。

不能把数据挖掘看作是简单的数据库查询技术。

数据挖掘要求在海量数据中,挖掘出的信息是新颖的、潜在实用的、正确的和最终是可理解的、并且是非平凡性的;它不同于在电话本上查找电话号码和在搜索引擎上查找特定的网页内容。

数据挖掘技术可以通过分类和预测分析的方法对海量数据进行直接数据挖掘;也可以通过关联分析、聚类分析、描述和可视化分析,以及复杂数据类型,如信息网络、web、图形图像和音频视频等的分析来进行间接数据挖掘。

统计分析及关联挖掘在高校图书馆流通数据中的应用

统计分析及关联挖掘在高校图书馆流通数据中的应用
B称为规则结果 。
析,发现各类文献 间的关联规则或 比例关系, 为各学科
文 献的采访工作提供分析报告和预测 报告 ,优化信息
资源建 设或馆藏结构 ,也可 以为研 究学科相互渗透现
① 基 金项 目: 学 院校 科研 资 金(100 4 武夷 x2 1 1) 收 稿 时间 : 1-20 ; 到修 改稿 时 间:020 .0 2 11-9收 0 2 1.1 2 2 0 应用 技 术 A pi eh iu 1 p ldTcnqe e
的基本过程L如下 图 1所示 ,由于步骤() 2 】 2不需要到数 据库 中去读取信息 ,故它的计算量 不大,所 以关 联规
① 建立大类事务 数据库: 该课题相关 的属 性是 与
读者证号 、借 阅图书在 中图法中的分类,将借阅记录 数 据集 中的 图书 分类号信 息转化为二元 数据形式 【。
lyo t b o pu c a e , lb a y tf, ma p we , wo kn tme ra e n s i r lv t e o a u, o k rh s s i r r saf no r r ig i a rng me t gve ee a r c mm e d to s n n a in , r c mme e o kst epma et el r r r eo nd d b o oh l k h i ay wo k. b Ke r : a s ca in mii g ttsia n l i; e n i e a ro i d l ywo ds s o it n n ;sa itc l ayss Clme tn ; p i r o a mo e
失去其指导意义 。如何有效 的利用这些数据成为一个 问题,利用关联挖掘对读者 的借 阅 日志进行分析 ,发 现读者借 阅一类 图书时 的其他 借阅行为 ,可 以在读者 下次借 阅时推荐其他相关 的有价值 的相关文献 ,可 以

关联规则在图书馆管理信息系统中的应用

关联规则在图书馆管理信息系统中的应用

图1 图书与图书间的关联规则挖掘界面
点击“关联规则挖掘”后,显示节目如图2所示。

图2 图书与图书间的关联规则挖掘结果
5)挖掘结果分析。

可通过“查看挖掘结果说明”查看到详细的挖掘结果,如图3所示。

当最小支持度设为4%,最小可信度设为50%时,可以挖掘出关联规则1 889条。

在这1 732条规则中,最小可信50%,最大可信度为85.632%,最小支持度为4.089%
最大支持度为8.421%。

图书间的关联数代表关联强度,部分图书的关联强度如图3中的挖掘结果说明表,如借阅了I247.56/9图书的读者同时借阅了I247.57图书,并且同时借阅的次数为51次。

实验中将关联数大于30的设定为较活跃20~30的设定为活跃图书,10~20的设定为一般活跃图书,对于小于10的暂未考虑。

图3 图书与图书间的关联规则挖掘结果说明
从图3的挖掘结果表中可以看出,读者在借阅I247.56/9的同时,还会借阅I247.57/119、I247.56/8、I247.7/1382等图书。

6)决策建议。

根据上述的分析,给出的决策建议如下。

提供个性化特色服务。

读者在借某本图书时,图书馆管理信息系统就将和这本图书有强关联的图书推荐给这位读者,让读者感受到图书馆主动服务的热情。

如读者在借阅I247.56/9时,推荐I247.57/119、I247/45、I247/44、I247.56/6等图书。

图4 读者应用模块界面。

数据挖掘在高校图书馆读者管理中的应用

数据挖掘在高校图书馆读者管理中的应用
维普资讯
科技情报开发与经济
文 章编 号 :0 5 6 3 (0 6 0 — 0 7 0 10 — 03 2 0 )8 06 — 2
SIT C R TO E E O M N C— E HI ’ MA IND V L P E T&E O O NO C N MY
在高校 图书馆的读者管理 中. 以通过聚类 分析 . 可 把读者按 照相似
性和差异性分 为几个类别 .使属于同…类别的滨者的相似性尽可能大 . 不同类别『 的读者的相似性尽可能小 聚类模式挖掘可应用到凄者群体 { 1 的聚类 、 读者属性 和特征分析等工作环 节 2 回归分析应用于读者需求分析 . 3
访问更加频繁。 读者的年龄不同, 作性质和专业方向不同, : C 研究领域更 是差别很大, 图书馆提出了不少的个性化要求 。 给 如何 满足凄者 的需求 , 提高读耆的满意度 , 从而给读者更好的服务 , 是一个值得研究的问题。 图
分类模式用于提 取能代表群体的特征属性 在数据挖掘 中, 通过对
类参数( 如距离等 ) 进行 分解 、 合并。得到 的结果由领域专 家进行甄别 . 如
大数据集中快速高效地发现令人感兴趣的规则 数 据挖掘是数据库知识
发现 中的莺要技术 , 是数据 库研究的新领域 , 它通过对查询 内容进 行模
式的总结 和内在规律的搜索 ,帮助决策者分析历 史数据及当前数据 , 并 从 中发现隐藏 的关系和模 式 , 进而预测未来 可能发生的行为 。 从而 为决 策行为提供有利的支持。数 据挖掘技术还能够用于信 息管理 、 询处理 查
过程 I, 切需要应用 分类模 式 、 卡迫 l 聚类模 式 、 回归分析 、 序列 、 时 关联规 则、 序列模式 、 b We 挖掘等技术手段对信息进行 深加工 , 为图书馆 读者管

数据挖掘技术在高校图书馆中的应用

数据挖掘技术在高校图书馆中的应用
目前 , 国内的高校图书馆大都实现 了日常业务的 自动化集成管理 , 绝 大 多 数 图书馆 都 购 买 或建 立 了数 据 库管 理信 息 系 统 。 图书馆 集 成管 理 系统 每天都会产生大量的统计 数据和表单 , 它们对 图书馆了解读者 的借阅兴 趣、 图书采购、 信息咨询 等业务都有着很强的指导作用。 如何充分 利用这 些 日益 增 长 的海 量 数据 , 中找 到有 用 的 信 息 , 切 需 要 一种 强 有 力 的数 从 迫 据 分析 处 理 工具 介入 到 图 书馆 自动化 系 统 中来 , 图书馆 工 怍提 供 技术 和 为
数据 挖 掘 , 又称 数据库 中的 知识 发现 , 是从 大量 不完 全 的、 噪声 的 、 有 模糊的、 随机的数据集中, 提取隐含在其中的、 人们事先不知道的、 但又是
潜在的、 有用的信息和知识的过程 , 提取的知识表示为概念、 规则、 规律、 模 式等 形式 。 据挖 掘是 对 庞大 的数 据集 或 数据 库进 行分 析 , 数 目的是 发现 隐含 在其 中 的、 知 的 关系 , 以数据 拥有 者 可以理 解 的方 式将 挖掘 出的信 息用 未 并 于指 导决 策 。 挖掘 技 术 可以帮 助 人们 从数 据库 , 别是 数据 仓 阵 的相 关 数据 特 数据集中提取出感兴趣的知识、 规则或更高层次的信息 , 并可以帮助人们从 不同程度 上去分 析它 们 , 可 以更 加有效 地利 用数据库 或数据 仓库 的数据 。 从而 数据 挖 掘 与 传 统分 析 工具 不 同 , 数据 挖 掘 使用 的是 基于 发 现 的方 法 , 运 用模 式 匹配 和 其 它 算 法 决 定 数 据 之 间 的重 要 联 系 , 任 务 是 从 数 据 中 其 发现 模 式 。 据 挖 掘 主 要 致 力 于 知 识 的 自动 发现 , 知 识 发 现研 究 在 数 数 是 据库系统 中的延伸。 随着网络的发展 以及相关应 用需求的提 高 , 数据挖 掘技 术 也 呈现 出 其 发 展 趋 势 , 即可 伸 缩 的数 据 挖 掘方 法 、 据 挖 掘 系 统 数 和 We b数据 库系统的集成 , 可视化数据挖掘 , 复杂数据类型挖掘等 。

关联规则在图书管理中应用论文

关联规则在图书管理中应用论文

关联规则在图书管理中的应用探析【摘要】现代社会是知识经济的社会,信息的网络化正在逐步的改变着人们的生活。

网络图书馆、数字图书馆等现代科技应用在图书馆中,图书馆管理理念和组织结构都发生了巨大的改变。

为广大人民群众提供最便捷的服务,充分发挥图书馆的馆藏功能,是新时期图书馆的发展方向。

关联规则数据挖掘技术在图书馆的应用,就是网络图书馆、数字图书馆的具体体现。

【关键词】关联规则图书管理概念应用随着科技的进步,信息技术的飞速发展,图书馆也开始从传统化逐渐向数字化发展,传统的信息服务已经不能满足读者强烈的求知欲。

在图书馆中,每天都会有大量的图书流通数据,传统的图书管理系统已经不能满足现代社会的需求。

近年来发展起来的关联规则就是在这样的背景下逐渐产生的。

一、关联规则的相关概念。

关联规则是数据挖掘的主要技术之一,是数据挖掘中普遍关注的问题。

所谓的关联规则,简单的来说就是在数据库中数据项之间存在的有趣的关联,也就是数据项的属性和变量之间的关联规则。

利用关联规则,可以挖掘出大量的信息之间的相互联系、依赖关系。

举个简单的例子来分析一下:顾客在购买香烟的同时是否会买口香糖,使用关联规则挖掘技术,首先必须要设定最小支持度与最小信赖度两个基础值,在此假设最小支持度为6%,且最小信赖度为80%。

因此满足需求的关联规则将必须要同时满足以上两个的条件。

通过挖掘过程找到的关联规则「香烟,口香糖」,满足下列条件,则可接受「香烟,口香糖」的关联规则。

因此,今后如果有某消费者出现购买香烟的行为,超市可以推荐该消费者同时购买口香糖。

这个推荐的行为则是根据「香烟,口香糖」关联规则,因为超市的交易纪录表明了大部份购买香烟的交易,会同时购买口香糖。

按照正常的思维方式,香烟和口香糖不存在必然的联系,但是通过关联规则,这样的联系就体现出来了。

二、关联规则在图书管理的应用。

面对一个诺大的图书馆,读者怎么样才能快捷、方便的找到自己想要的图书,一直是人们不断关注的问题。

基于关联规则的高校图书信息数据挖掘

基于关联规则的高校图书信息数据挖掘

望通 过这种方法在 海量 数据 中查找相关数 据之间的联系 ,帮助 做 出决策 , 从 而提高效率 ,缩短工作 时间 , 增 强数 据利 用率 。
( 三 )Ap r i o r i 算法
《 机 械制图》( 自然类 ) t 高苷数学》( 自然类 )
《 曾 国藩传记》( H )
A p r i o r i 算 法是 一种经 典 的关 联规 则算 法 。它主要 是基 于
2 . 通 过 扫描 数 据库 中的所 有 数据 ,找 出所 有 的频 繁 l 项 集 ,该集 合记 做L 1 ; 3 . 然 后 利用 L l 找 频 繁2 项 集 的集 合 L : ,L 找L ,如此 下 去 ,直 到不能 再找到任何 频繁k 项集 。 4 . 最后 ,再 在所 有 的频繁集 中找 出强 规则 ,即产生 用户
近 年来 ,随着 专业设 置 的多元 化 以及科 学 技术 的高速 发 展 ,高 校不 得不 扩充 图书信 息资 源 。随着 图书信 息数 据量 的 增大 ,以及处 理 图书借 阅时 间 的突发性 ,使 得改 善高 校 图书 管理 系统 的问题 变得迫 在眉 睫 。我们希 望 图书信 息管 理 系统 可 以更加 高效 、智 能 。数据 挖掘技 术 的广泛 应用 使人们 认识
E DUC A T I ON F O R UM 教 育论坛
基子关联规则韵高校图书信息数据挖掘
◆王 娜 岳 俊 英
摘要 :随 着教 学水 平的提 高和科 学技术 的不 断发 展 ,高校 图书馆 的书本存储 量越 来越 多 ,学生对 书本 的需求 量和使 用量也 急剧增 高。这些现 实因素给 高校 图书管理 系统 带来很 大压 力 ,在 图书管理 系统 中使 用数据 挖掘技 术 变得 迫在 眉睫 。本文 以 高校 学 生借 阅图书为 研 究对 象 ,针对 高校 图 书管理 系统提 出A p r i o r i 算 法 ,对 图书 的摆 放 方式提 出相 关建议 ,从 而达到 方便 图书 管理 、便捷 学生借 阅的 目的。 关 健词 :数据挖 掘 ;关联规 则 ;A p r i o r i 算 法

图书馆管理中关联规则数据挖掘的应用

图书馆管理中关联规则数据挖掘的应用

ga a rw l 等人 于 1 9 年 提 出 . 93 目的是通 过对 商业 领 域 些规 则必 须满 足最小 支持 度和 最小 置信 度 。 中每天产 生 的大量 商 品交 易数 据 的分 析 .挖 掘 出 1 p o 算法 .A ff 2 ii 数 据库 中不 同商 品之 间 的联 系 .根 据此 联 系进行 A r r算法 是一种最 有 影 响 的挖掘 布尔关 联 pi i o 商 品货架 设计 、货 存安 排 以及 根据 购买模 式 对用 规则频 繁项 集 的算 法 其核 心是 基 于 两 阶段频 集 户进 行分 类 。 思想 的递推 算法 【 该 关联 规 则在 分类 上 属 于单 2 ] 设, i …, 是项 的集合 。设任 务相关 的数 维 、 _ , / 单层 、 布尔关 联规则 。 这 里 , 有支 持度 大于 在 所
21 0 2年 第 6期
福 建 电

13 4
图书馆 管理 中关联 规则数 据挖掘 的应用
郑 芸 芸 ,王 萍 ,游 强 华 ( . 北 医学院计 算机 数 学教 研 室 四 川 南充 6 7 0 1川 307
2川北 医学院 图书馆 四川 南充 6 7 0 ) . 3 0 7
【 摘 要 】 关联规 则 是数 据挖 掘 中的核 心技 术 。本 文从 关联 规 则 的定 义入 手 , 用 A r r : 利 pi i o 算法 , 对读 者借 阅 图书 的 关联 情 况 、 阅规 则进 行 了 实际挖 掘和 分 析 , 借 阐述 了关联 规 则数 据挖 掘
在 图书馆 中的应 用 。 【 关键词 】 图书馆 ; : 关联规 则 ; pir 算法 Ar i o 是数 据 库 事务 的集 合 . 中每个 事务T 其 是项 的 随着 信息 技术 的发 展 .图 书馆对 读者 的借 阅 据 D 信 息提 出了更 高的 要求 。读 者 已经不 满足 于 简单 集 合 , 得T I 使 。每一 个事 务有 一个标 识 符 。 作 称 的借 阅 . 他们 希望 能有 一些 智 能化 的服 务 . 如进 行 TD。设A是一个 项集 ,事务T I 包含A当且仅 当A

基于关联规则的图书借阅数据挖掘

基于关联规则的图书借阅数据挖掘
信 息产 业 j if
刘 琳

基于 关联规 则 的图 书借 阅数据 挖掘
( 华北科技 学院图 书馆 , 河北 三河 0 5 0 ) 6 2 1
摘 要: 利用关联规则算法对我院图书馆借 阅历史数据挖掘进行 了具体实现 , 并对挖掘 的结果给予解释 , 而能使图书馆的图书购置得到更有效、 从 合 理 的 分配 , 地提 高服 务 效 率和 质量 。 更好

91 —
算法 ,选择恰 当的支 持 度 与可 信度 是 挖 掘 有 效 关 联 规 则 的 关
键 。 由于 各个 学 院 学
0T —●■ t ∞ l
譬 i

供 工 : 理 有 的 一 叠 I宴 习 =观 有 的 > 桢 英 目 理解 2 0 2 0 ±新 版 题 = 砚 的 - 謇 2籍 08 >
关键 词 : 高校 图书馆 ; 据挖 掘 : 数 关联规 则
生的借阅信息之 间的 ● 0仰 混 土结构 设 = 一 力学 = 观: 拘 >结 现 的 拮 力 学 上 Ⅲ =观 的 ) 镕 构力 学 T册 : m 的 ■■——一 l g T 3 关联程度有很大 的不 拮构力学{ 试要点 髓 } 解 = l 瑰 的 一 结构力 =喱 ) 学 有的 1e 02 镕构 力 学 下 册 =嘎 韵 一>结 自 上 Ⅲ : 魂 的 ■—■■_ 1 4 土 丰 工程 施 工 :现 有 的 ) 结 构力 学 =啦 的 同 ,因 此本 系 统 中根 >建 ●●■■●—■l 202 金工实习 = 有的 一 筑环 学 :m有的 0 据学 生 所 属学 院 的不 鲍 一 擞热 I ; > 白 勺 ■●—■■—■● 1 2 盒工 实 : 3 9 面 } = 飒 的 >立 俸 成 = m 育的 钮戚 ●一 1B l0 同,支持度和可信度 图 1建筑 工程 系最底 支持度 1 , 0 概率 O3的规则 _ 也 各不 相 同 。 3数据挖掘 的结 果 和分 析 本 文所 采 用 的 数 据均来 自华北科技学 院图书馆 的数据库中 品的影 响 。 的原始资料 ,原始数 关 联规 则是 形如 A B 的 蕴含 式 , 中 据 包 括 3个 表 :流 通 其 ^ , ,, [, B[ 并且 A B= 。 规则 A B 在事 务 日志表 、读 者库 表 以 n 若 集 D中成立 ,则关联规则 A= B具有支持度 s 及 书 目库 表 。本 文 所 } 和置信度 c设事务数据库 D中有 s , %的事务 同时 选 取 数 据 为 20 04年 支持项集 A和 B, s %称为关联规则 A B的支持 到 20 08年 四 年 问 所 度 ,设事务数据库中支持项集 A的事务中有 c % 有借阅记录 , 共计 70 0 的事务也支持项集 B c ,%称为关联规则 A=B的 多万条 ,其属性 主要 } 置信度 , 数学表达为 : 有 :主键码、处理时 s cui = on( AuB / )D IJ× 10 0% 间、读者条码、条形 图 2 所 有 链接 c cuthUB) on( × 10 = on( / utA) c 0 % 码 、 人 号 、 作 类 型 登 操 4 结论 . 其 中,on( cu t AuB 是包含项集( ) AuB 的事 等 属性 。对 原 始数 据进 行 预处 理后 我 们 针对 学 生 ) O sv e— 务数 ,) 是数 据 库 D 中所 有 的事 务 数 , utA) 和教师的借书历史数据选用关联规则算法进行 了 本文首先简单关联规 则概念 ,利用 S L S r IJ 1 c n( o 是包 含项 集 A 的事 务数 。 挖掘。 e 05 r 0 数据挖掘工具对从我院图书馆取得的流通 2 关 联 规 则 的数 据 挖 掘 主要 目的是 在 数 据 库 以建筑工程系为例 : 新建挖掘结构 , 选择建筑 日 志表、 读者库 、 库 , 书目 进行表 的合并 , 数据的预 中 找 出支 持 用 户 指 定 的最 小 支持 度 s和 最 小 置 工 程系 表为 事 例表 , 通历 史 表 为嵌 套表 , 用关 处理 , 流 选 选取关联规则算法进行了数据挖掘 , 得出了 信度 c的关联规则 , 而指导人们 的一些管理决 联规则算法挖掘出各系读者的借书规则。在进行 从 些有用的借阅规则 ,这样既可以了解各系读者 策。目前, 关联规则的挖掘方法主要是找出数据库 数据挖掘时需要设置算法概率参数和重要性阈值 的特点和爱好 , 掌握一般借阅规律 , 从而可以为图 中的所有频繁项集,然后由频繁项集产生关联规 参数 。 这就需要设定最优的最低支持度和概率, 根 书馆的管理提供更好 、 更高效的服务方式。 则。 参 考文 献 据各系人数多少和借书的多少能得到大概 的参 2数据挖掘过程 数, 通过 比较 , 当最低支持度设 为 1 , 率设为 [] 0概 1于光 , 文峰. 李 数据挖掘技 术在 图书馆用 户管 数据挖掘的具体过程如下 : J 图书情报 工作 ,o 5 1,0 — 0 1 2 o ( )10 13 0 . 3时候最为适宜 , 得出的建筑工程系学生借 书关 理 中的应用【 . 数据准备 : 收集原始数据 , 熟悉要挖 掘的数 联 规 则如 图 1 。 【】 2朱根 义.国 内图书馆数据挖掘研 究『. J 现代情 1 据库 对象 。 20 ( )1 8 13 当一个建筑工程系学生借了 《 建筑环境学》 报 ,0 9 1 ,2 — 3 . , 数学预处理 :对原始数据进行加工处理 , 去 他就有 O73的概率会借《 . 3 金工实习》 重要性为 [】 , 3司徒 浩臻.数据挖掘技术在 图书馆 信息服 务 除不必要的属性, 保证数据 的完整性和一致性。 14 等。 .1 6 中的应 用[ . J 现代 图书情报 技术 ,0 5 (0 1— 】 2 0 , 1 )5 8. 确定数据挖掘的 目 : 标 根据用户的要求 , 确 当最低支持度为 1 , 0 概率为 03 _时得到的规 1 定发 现何 种类 型 的知识 。 则依赖关系网络图如图 2 ,图 2左侧 的指针是 可 J J 云 鹏 .数 据 挖 掘 技 术 在 图 书馆 中的 应 用 【. 4董 J 】 确定数据挖掘算法 :根据 目标所确定 的任 以滑动的, 2 0 , 1 )1 1 1 2 显示 的是重要性 的强弱。 当指针在最上 现代情报 ,0 6 ( 1:3 — 3 . 务, 选取合适的数据挖掘算法。 端时 , 显示的是所有符合要求的链接 , 从上到下越 【】 5梁循 . 据挖掘 算法 与应 用[ . 数 M1 北京: 北京 大 进行数据挖掘 : 运用所选算法 , 从数据库中 来越重要。滑动指针得到: 学出版社 ,0 6 20. 提取出用户所需要的知识 , 如规则等。 当指 针 滑到最 底 下 时 ,就 剩下 重要 性 最大 的 作者简介 : 刘琳 (9 1 )女 , 17 ~ , 北京工商大学 模式 解 释及 评价 : 发现 的模 式 进行 合 理性 链接 , 石春祯英语阅读理解 2 0篇 ,08全新 会计 系本科毕业 ,华北科技 学院图书馆技 术部 对 即《 2 20 解释, 并对 所发 现 的知识 进行 评 价 。 研 信 版题本》 出《 推 石春祯英语 阅读理解 2 0 , 0 馆 员 , 究方 向 : 息 技 术 。 2篇 2 8 0 本文 运 用 关联 规则 对 图 书馆 管 理 系统 中读 全 新 版解 析本 》 的重 要性 最 强 。 者的借阅信息进行数据挖掘 。 关联规则算法有很 对其他各系的借阅记录进行数据挖掘同样可 多 , 文 采用 S L Sre20 本 Q evr0 5自带 的 F 一树 频 集 以得到相应的借阅规则数据挖掘, P 在此省略。

高校图书馆借阅数据的关联规则挖掘研究

高校图书馆借阅数据的关联规则挖掘研究

作昌 ; (4), 合人 研馆 , 工院书参咨部任 京业学件程士 者羿 敏9一女 西浦 , 究员 西学图馆考询主 , 工大软工硕。 简 : --,广 介 2 1 5 戚 1) 6 0 副 广 北
维普资讯
广西工学院学报
第 1 卷 8
储的是读者专业类型和读者借阅书刊的中图分类号数据。 12 关联规则挖掘算法模块 . 数据挖掘引擎( 关联规则挖掘算法模块) 是关联规则挖掘系统最核心的部分 , 主要涉及 了数据挖掘的算 法。本系统运用关联规则对 图书馆管理系统 中读者 的借阅信息进行数据挖掘。A f f算法是关联规则 的 po ii 经典算法 , 当数据库中事务较多, 目集较大时, 项 扫描计算量大 , 该算法耗时多、 效率低【 。本 文采用的改进 2 ] 算法主要源于文献[ 该改进算法的主要思想是在精减候选集的同时, 3, 3 ] 精减事务集 , 及时去掉冗余事务 , 使 扫描数据库时计算量减少 , 从而提高效率 。 在候选集确定一个集合是否频繁 , 需要扫描整个数据库。如果 当前数据库 中有一些不必要的事务能够 事先删除, 则可减少扫描工作量。另外如果候选集中的元素能够尽量少 , 即在产生候选集前 , 把某属性先去 掉, 这样也能减少计算量。把两者结合起来一起考虑 , 即在产生 忌 一项频繁项集后 , 去掉一些非频繁项集, 以 免再次组合成候选项 。去掉某些特殊 的事务记录, 它们在产生 忌+1 一项频繁项集时不再被考虑计数问题。 简化的过程类似于在矩阵中逐步去掉行和列。
D c20 e .0 7
文章 编 号
1 0 —4 0 (0 7 40 7 .4 0 46 1 2 0 )0 —0 70
高 校 图书 馆 借 阅数 据 的关 联 规 则挖 掘研 究
戚 敏

关联规则分析在国内图书馆学领域的应用研究

关联规则分析在国内图书馆学领域的应用研究

3 20 ) 6 2 0
近 年 来 , 据 挖 掘 ( a nn , 称 知 识 发 现 ( n w e g 数 d t miig 也 a ko l e d dso ey i d tb s s 简 称 K D) 受 到 当 今 图 书 情 报 领 域 的 i v r n a aI J
关 联 规 则 分 析 在 国 内 图 书 馆 学 领 域 的 应 用 研 究
洪 碧 云
( 晋江 市 图书 馆 , 建 晋 江 福
摘 要 :关 联 规 则 分 析 是 当 前数 据挖 掘研 究 的 重 要 模 式 之 一 , 以 定量 地 处 理 图书馆 学领 域 中各 类优 化 问题 。 文 在 可 本 简要 介 绍 关 联 规 则 分 析 的基 础 上 , 流通 信 息 、 性 化 推 送 、 从 个 文献 计 量 、 信 息 检 索 等 方 面 总 结 了 关联 规 则 分 析 法在 国 内 图 书 馆 学 领 域 的 应 用 关键词 : 关联 规 则 分 析 数 据 挖 掘 数 字 图 书馆
广 泛 重 视 , 主要 目 的就 是 设 计 算 法 , 于从 海 量 数 据 中发 现 其 用 未 知 的 、 在 的 、 者 感兴 趣 的有 用 信 息 。关 联 规 则 是 数 据 挖 潜 读 掘 研 究 中的 一 个 重要 的研 究 课 题 。 1 联 分 析规 则 基 本 原 理 . 关 A rw l 人 (9 3 ) 最 先 发 现 了顾 客 交 易 数 据 库 中 的 ga a等 19 年 … 项 集 间存 在 关 联 规 则 ,其 核 心 方法 是 基 于频 集 理 论 的递 推 方 法 ,它 侧 重 于 确 定 数 据 中 不 同 属性 域 之 间 的联 系 找 出频 繁 的 数 据 属 性 域 之 间 的相 互 关 系 。定 义 为 : 设 I( , 一, ) 项 的集 合 , 务 数 据 库 D =T … … , =i i 1 i事 事 B { T T l其 中 的 每 个 事 物T 项 的 集 合 , , 是 T∈I并 且 每 个 事 物T 有 , 都 个 唯 一 的 标 识 符TD。如 果 X∈T. 称 x 一 个 项 集 , 果 X I 则 是 如 中有 k 元 素 , 称X为 是k 项 集 。关 联 规 则 是 形 如A B的蕴 个 则 一 涵式 , 中AEIB∈I且AnB 空 。规 则 A 其 , , 为 jB 事 物 数 据 库 在 D B中 的 支 持 度 (u p ̄)是 D spo , B中包 含 AuB的事 务 占事 务 总 数 的百 分 比 , 即概 率 P AuB 。一个 项 集 X ( ) 的支 持 度 一 般 用 sp u ( 表示 , 则A B D X) 规 在 B中的 可 信 度 (o f e c ) 是 在 D cn d ne , i B中 的那 些 包 含 A的事 务 中 ,也 同时 出现 的频 率 , B 即条 件 概 率 P B (I A) 。对 于 一个 项 集 x,如 果 其 支 持 度 ≥ 用 户 给 定 的 阈值 Mi n S p 则 称 X 频 繁 项集 ( I Fe u n e st 或频 繁 模 式 。 u, 为 F :rq e t t e ) I m 此 后 人 们 对 关 联 规 则 的 挖 掘 问 题进 行 了 大量 研 究 .包 括 对 A f f 法 优 化 、 层 次 关 联 规 则 算 法 、 值 属 性 关 联 po算 ii 多 3多 _

关联规则数据挖掘在图书馆个性化服务中的应用研究

关联规则数据挖掘在图书馆个性化服务中的应用研究

Ke r s a ami i g s o it n r l s e vc p l a in;h ma ie e ie; i rr y wo d :d t n n ;a s ca i u e ;s r ie a p i t o c o u nz ds r c l ay v b
数 据 挖 掘 是 一 门 广 义 的 交 叉 学 科 , 胎 于 计 算 机 , 然 脱 虽
(. 阳职 业 技 术 学 院 电子 信 息 系 , 西 成 阳 7 10 ; . 阳职 业 技 术 学 院 基 础 部 ,陕 西 成 阳 7 10 1成 陕 12 0 2 成 1 20; 3 成 阳华 兴 电子 有 限公 司 陕 西 成 阳 7 10 0 . 120 )
摘 要 :随 着 计 算 机技 术 、 网络 技 术 以 及 现 代 通 信 技 术 的 蓬 勃发 展 . 据 挖 掘 作 为信 息 技 术 飞速 发 展 的 衍 生 物 , 数 为数 字
知 识 资 源 的有 效 管 理提 供 了技 术 保 障 。文 章 通 过 对 关联 规 则数 据 挖 掘 技 术 以及 图 书馆 个性 化 服 务 相 关 内容 的 介 绍 。
探 讨 了关联 规 则 数 据 挖 掘 在 数 字 化 图 书馆 中 的应 用 , 明 关联 规 则 挖 掘 技 术 在 数 字 图 书馆 应 用 的必 要 性 . 说 以及 在 提
的 、 颖的 、 被 人理 解 的、 又是潜 在有用 的模 式的过 程 。 新 可 但 其 主 要 特 点 是 对 数 据 库 中 的 大 量 数 据 进 行 抽 取 、 换 、 析 转 分 和其 他 模 型 化 处 理 , 中 提 取 辅 助 决 策 的关 键 性 数 据 。 从
规 则 数 据 挖 掘 算 法 对 于 图 书 馆 完 成 个 性 化 、 性 化 的 服 务 具 人

基于MFP—Miner算法的图书借阅数据关联规则挖掘

基于MFP—Miner算法的图书借阅数据关联规则挖掘
得 到 了很 大的 提 高。
关键 词 :数 据 挖 掘 关 联 规 则 最 大频 繁 模 式 频 繁 模 式 树
1 引言
对高校 图书馆 图书历史借阅信 息进行关联规则挖
掘可 以发现一 些 比较 有趣 的规 律 , 如 , 近在信息 例 最 管理 系的借 阅记录 中得 到 : 3 % 的竞争情报 借 阅同 有 0
Bas d on M F — M i erAl e P - n gort ihm
吕志芳 王怀 阳 贾吉庆 ( 中国海洋大 学电子工程 系 山东青 岛 2 60 ) 61 0
摘 要 :本研 究利 用关联规则挖掘 的最大频繁模式 算法对 图 书馆 历史借 阅数 据进行 快速有效地挖 掘 , 以获取 隐 含在借 阅数据 中有用的关联信 息, 优化 图书馆馆藏 结构 , 发掘 学科 间的 隐性联 系和 学科动 向。 由于该 算 法在挖掘过程 中不需要 产生候选项 目集 , 因而节约 了对候 选项 目集进行计数 的时间 , 而使算 法的效率 从
们可 以制订 相应决 策 , 同时被 借阅 的书籍整理在 一 把 起, 以优化馆藏 结构 、 问分布 , 馆 这样不仅 可 以辅助 教
产生最大频繁候 选项 目集。即在进行 最大频繁项 目集 挖掘前 , 首先将 事务数据库 中的每 条事务所 包含 的频
繁项 目按照支持数降序压缩存储到频繁模式 树中。之
巨大 的借阅历史数据库信 息 , 针对此 问题 , 文提 出采 本 用最大频繁模式项集算法 ( MF Mi r 即 P— n 算法 ) e 对数目组 成集合 X; . o e— a 然后 , 过 N 通
的同名节 点 链 , 出节 点 链 中所 有 计 数 不 小 于 mi 找 n — cut o n 的同名节 点 ; 后 , 历每 条 以同名节 点 为后缀 最 遍 的路 径 P 检查 X是否存在于 P中 , , 一旦发现 了这样 的 路径, 则可 将在 当前 频繁模式 ( 或条件 频繁模 式 ) 中 树
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Ap pRc fo o a n fA ̄ o i fon i ca i Rul n e i Dat i i ude s b r wi g o r br r n Un ve st a M n ng ofSt nt ' or o n Bo ks fom Li a y i i r iy
摘 要 : 章 用数 据 挖 掘 中的 关联 规 则技 术 对 高校 图 书馆 学 生的 借 阅 数据 进 行 挖 掘 分析 , 而挖 掘 出读 者 的 阅读 兴 趣 , 现 书籍 借 阅 文 从 发
的 关联 规 则 , 学地 进 行 建议 借 阅和 图书推 荐 等 服 务 , 科 以提 高 图书馆 管理 效 率 。 关 键词 : 数据 挖 掘 : 关联 规 则 ; p o 算 法 : 书馆 ; 据库 Aff ii 图 数 中 图分 类 号 : P 1 T 31 文献标识码: A 文章 编 号 :0 9 3 4 (0 00 — 7 4 0 10 — 042 1)4 0 8 — 3
Ke r s d t nn ; so it n rl; p ir a oi m;i rr; aa ae ywo d : aamiig ascai e a r i l rh l a d tb s o u o g t b y
图书 馆 是 高 校进 行 教 学 和科 研 活 动 的 重要 支柱 , 素有 “ 学心 脏 ” 大 之称 。随 着 科 学技 术 的迅 猛 发 展 以及 网络化 、 息化 程 度 的 不 信
断 提高 。 们 对 图 书 馆 提供 信 息 的 能 力 、 务 的 广度 和 深 度 的要 求 也 随 之 提 高 。现 在 几 乎所 有 的高 校 都采 用 数 据 库 技 术对 图书 馆进 人 服
行 管理 . 主要 目的 是 为 了方 便 图 书 馆 对 图书 的采 购 、 目及 对 图书 的 流 通 进 行 快 速 、 效 的 管 理 。 在 图 书 的流 通 过 程 中产 生 了 大 其 编 有
l e yz d,S st so rt e dng i e etoft e desa nd t eae o e to fboo o ̄o n O a o di ve he ra i ntr s c he r a r nd f he rlt d c nn ci n o k b i wi g.Thst c o o a s d i e hn l g c n be u e y
量 的数 据 . 学 生 借 阅信 息是 其 中最 重 要 的数 据 之 一 。 而 如何 高效 地 找 出 有用 的 图书 是 图 书馆 数 据 挖 掘 中 主要 研 究 的 问题 。 文 研究 本
的 目标 就 是 从读 者 的大 量 借 阅信 息 中挖 掘 出各 学科 之 间 的关联 程 度 。
I SSN 1 0 - 0 4 0 9 3 4
E m i j @e e . t n — a :s c e e. l h n c
’ t /www. z .e .B ht / p: dn sn tC Te: 86 51 69 96 56 09 4 l+ —5 -5 0 3 9 6
C mp tr n we g n e h o g o u K o l ea dT c n l y电脑 知 识 与技术 e d o
1关 联 规 则 基 础 理 论
关 联 规 则 fsoi i ue) 概 念 首 先 由 R ga a 等于 19 A sc t n R ls ao 的 A rw l 93年 提 出 的 , 反 映 _个 事 物 与 其 他 事 物 之 间 来自 相 互 依 赖 性 或 相 是
互 关联 性 . 而达 到 认 识 事 物 客观 规 律 的 技术 方 法 。 从 11关 联 规则 .
KU AN G -l Li i
(c o lo mp tr& If r t n Hee ie i f c n lg , fi2 0 0 , ia S h o f Co ue no ma o , fi i Unv rt o h oo y Hee 3 0 9 Chn ) s y Te
t e v o ook c m m e da n nd s m e wor m pr vng t e m a g m e te ce y o brre . o s r ef rb o n do a o ki o i h na e n f inc fl ais i i
Ab t a t a e n t e as c t n r l e h o o y i aamii g d t o u e t b ro n o k r m b ay i n v r t a ea a s r c :B sd o h s i i ue t c n l g d t n n , aa fs d ns o r wi g b o s o l rr u ie s y c n b n — o ao n t f i n i
Vo . , . Fe r a y 2 1 P . 8 7 6, 1 1 No4, b u r 0 0, P 7 4— 8 8 3 6
关联 规则 在 高校 图 书馆借 阅数 据 挖掘 中 的应 用
 ̄4- 『 利 利 几 4 ̄ r4 r
( 合肥 工 业 大 学 计 算 机 与 信 息 学 院 , 安徽 合 肥 2 0 0 ) 3 0 9
设 I =
一i 为数 据 项 集 合 即项 集 ; 务 相 关 的 数 据 D是 数 据 库 事 务 的集 合 , 中 每 个 事务 T则 是项 的集 合 , 得 TCI每 个 ,} 任 其 使 _;
事 务 由事 务 符 T D标 识 ; A, I 若 B为 两 个项 集 , AfB 0, 且 7 = 则蕴 涵 式 A B称为 关 联 规 则 。 j
相关文档
最新文档