数据挖掘在高校图书馆的应用

合集下载

数据挖掘在高校图书馆服务中的应用研究

数据挖掘在高校图书馆服务中的应用研究

数据挖掘在高校图书馆服务中的应用研究一、本文概述随着信息技术的迅猛发展和大数据时代的到来,数据挖掘技术已经广泛应用于各个领域,尤其在高校图书馆服务中,数据挖掘技术的应用逐渐成为研究的热点。

本文旨在探讨数据挖掘技术在高校图书馆服务中的应用及其效果,以期为提升图书馆服务质量和效率提供有益的参考。

本文首先介绍了数据挖掘技术的基本概念、原理及其在其他领域的应用情况,为后续研究奠定理论基础。

接着,分析了高校图书馆服务的现状及其面临的挑战,如用户需求多样化、信息资源海量化、服务效率要求高等。

在此基础上,本文深入探讨了数据挖掘技术在高校图书馆服务中的应用场景,如读者行为分析、图书推荐系统、学科服务等。

通过案例分析和实证研究,本文评估了数据挖掘技术在高校图书馆服务中的应用效果,并指出了存在的问题和不足。

本文提出了针对性的建议和改进措施,以期推动数据挖掘技术在高校图书馆服务中的更广泛应用和深入发展。

本文的研究不仅有助于提升高校图书馆的服务质量和效率,也有助于推动数据挖掘技术的进一步发展和完善。

二、数据挖掘技术基础数据挖掘(Data Mining)是从大量、不完全、有噪声、模糊、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

数据挖掘涉及的技术方法很多,主要有数据清理、数据集成、数据变换、数据挖掘过程模型、数据挖掘方法和知识评价等。

数据挖掘的主要功能包括分类、聚类、关联分析、序列模式挖掘、预测、时间序列分析和偏差分析等。

在高校图书馆服务中,数据挖掘技术的应用主要体现在以下几个方面:通过对读者的借阅记录、浏览行为等数据进行挖掘,可以分析出读者的阅读兴趣、习惯和需求,从而为读者提供更加精准、个性化的推荐服务;通过对图书馆藏书的利用情况、读者的借阅率等数据进行挖掘,可以评估图书馆的服务质量,发现存在的问题和不足,从而改进图书馆的管理和服务;数据挖掘技术还可以用于图书馆的决策支持,通过对大量的数据进行挖掘和分析,可以为图书馆的发展规划、资源配置等提供科学依据。

数据挖掘技术在高校图书馆管理中的应用

数据挖掘技术在高校图书馆管理中的应用

术和 决策管理支持 , 同时也 为 图书管理 员准确把握 读者需求 , 提供 个性化的信息服务 。
关键词 : 据挖掘 ; 数 图书 馆 ; 息 服 务 信
中图分 类号 :24 9 文献标识码 : G 5 .1 C
文章编 号 :08 9 72 1 )2 0 5 2 10 —89 (0 10 —0 7 —0

分内部数据和外部信息汇集起来, 经过处理和转换 , 形 数 据挖掘 ( a ii , 称 D 是 指 从 大量 的 、 D t Mn g简 a n M) 不 成集 中统一 、 随时可用的决策信息, 防止 因信息不足造 完全 的 、 有噪 声 的 、 糊 的 、 模 随机 的数 据 中 , 取 隐 含 在 成 的错误决策 。 提
【 哲学 ・ 文化 】
数 据 挖 掘 技 术在 高 校 图 书馆 管理 中的应 用
白建伟
( 太原理工大学 计算机学院 , 山西 太原 002 ) 304

要: 数据挖掘技 术应用于 图书馆 管理 中, 有利 于分析和 处理 图书馆 的 日常 业务数据 , 图书馆 合理 分布馆 藏提供技 为
最需要的资源采购中, 以提高资源的利用效率。通过数 据挖掘系统 , 可以将图书借阅数据和文献采编数据结合
起来 进行分析 、 管理 。例如 , 在采 访过 程 中 , 通过 数据 挖 掘技术 分析 的理 论 , 以协助 采购 员根 据情 况对 各类 图 可
二、 数据挖掘在高校图书管理 中的应 用
3数据挖掘可以从历史数据 中找出潜在模式, . 并在 模式的基础上 自动作 出预测。这对启发 图书馆决策者
的创 新思维 , 对信息化社会 的挑 战具有重大 意义。 应 ( ) 据挖掘技 术在 图书资源管理 中的应 用 二 数 1对文献 采购和馆 藏建设进行合 理 的规划建议 . 在 高校 中, 每个机 构 或部 门都 有 固定 的经费 , 以 , 所 图书馆 的资源采 购要 考虑 到资 金 的利 用率 , 把资 金用 在

数据挖掘在高校图书馆用户行为分析中的应用——以山西大学图书馆为例

数据挖掘在高校图书馆用户行为分析中的应用——以山西大学图书馆为例

足 , 引导读 者进行 正确 学 习做 出指 导 , 挥 图 书馆 的教 育功 能 ; 为 发 同时还 可 以 为 图 书馆 科 学 管理提 供 事 实依
据, 丰富 图 书馆 的馆 藏 资源 , 高 图书馆 资源 利 用率。 提
关 键词 : 据挖 掘 ; 数 高校 图书馆 ; 用户行 为 分析 中 图分 类号 : 2 6 7 G 5 .
图 1 数 据 挖 掘 过 程
12 1 问题定 义 . . 采用 的具体 办 法 。
在 问题定 义过 程 中 , 须 明确 数 必
或无 关 的模式 , 时需 要将 其剔 除 ; 这 也有 可能模 式 不 满足 用户 要求 , 时 则需 要 整个 挖 掘 过 程 重 新选 取 这 数据 、 采用 新 的数 据变换 方 法 、 定新 的数 据挖 掘参 设 数值 , 至采用 其他 的挖 掘 算法 。 甚 13 数据挖 掘 算 法 简介 . 数 据挖 掘 常用 的算 法 主 要 有 以下 几 种 方 法 , 在 实 际应 用 中 , 根据 任 务 的需 要 采 用 合适 的数 据 挖 可 掘 算法 。 1 3 1 决 策树 算 法 决 策 树 方 法 是 目前应 用 最 广 . .
N . 2 1 (su o 13 o2,0 1 I eN . 2 ) s
其 主要应 用对 象是 事物 数 据 库 , 重 于确 定 数 据 中 侧
不 同数据项 之 间 的联 系 。在 利用 关 联 规则 方 面 , 已
挖掘 阶段 发现 出来 的模 式 , 经过 评价 , 可能 存在 冗余
o e) rls 的挖掘 是数 据挖 掘 ( M) D 中一个 重 要 的 问题 。
】 9
21 0 1年 3月 21 0 1年第 2期 ( 总第 13期 ) 2

数据挖掘技术及其在高校图书馆中的应用

数据挖掘技术及其在高校图书馆中的应用
第1 O期 总 第 2 2期 1
21 0 0年 5月
内 蒙 古 科 技 与 经 济
I n rM o g l ce c c n lg & Ec n my n e n o i S in eTe h oo y a oo
NO. 0,t 2 h is 1 he 21 t s ue Ma y201 0
对 读 者 提 出 的某 些 问 题 进 行 聚 类 分 析 产 生 一 个 特 殊 目 录 ,用 以 将 该 问 题 答 案 有 针 对 性 的 回 馈 给 相 应 的 读者 群 。
1 1 2 预 处 理 。 自动 化 管 理 系 统 中 各 个 模 块 的初 .. 将 始数据 进行 读- 、 辑 等工 作从 而得 到完整 的数据 。 N ' 编 113 .. 变 换 。 始 数 据 既 有 结 构 化 数 据 ,也 有 半 结 原 构 化 的 文 本 、 形 和 图像 影 音 数 据 , 此 要 将 各 种 数 图 因 据 转换 为统 一数据 编码 的更 易用 的格 式 。
务 的 重 要 组 成 部 分 ,自动 化 部 门 可 利 用 管 理 系 统 尽
模 型 , 个模 型对剩 余 的数据 进行 描述 。 这 1 2 1 1 分 类 。 先 从 数 据 中 选 出 已 经 分 好 类 的 训 . . . 首 练 集 ,在 该 训 练 集 上 运 用 数 据 挖 掘 分 类 的 技 术 ,建 立 分 类 模 型 ,对 于 没 有 分 类 的 数 据 进 行 分 类 。 例 如
关 键 词 : 据 挖 掘 ; 识 发 现 ; 校 图 书馆 数 知 高 中图分 类号 : TP3 1 1 1. 3 文 献标 识码 : A 文 章 编 号 :O 7 6 2 ( 0 O 1 — O 5 一 O 1 O— 9 1 2 1 ) O 13 2 1 21 .. 直 接 数 据 挖 掘 : 利 用 可 用 的 数 据 建 立 一 个 是

数据挖掘技术在高校图书馆中的应用

数据挖掘技术在高校图书馆中的应用
目前 , 国内的高校图书馆大都实现 了日常业务的 自动化集成管理 , 绝 大 多 数 图书馆 都 购 买 或建 立 了数 据 库管 理信 息 系 统 。 图书馆 集 成管 理 系统 每天都会产生大量的统计 数据和表单 , 它们对 图书馆了解读者 的借阅兴 趣、 图书采购、 信息咨询 等业务都有着很强的指导作用。 如何充分 利用这 些 日益 增 长 的海 量 数据 , 中找 到有 用 的 信 息 , 切 需 要 一种 强 有 力 的数 从 迫 据 分析 处 理 工具 介入 到 图 书馆 自动化 系 统 中来 , 图书馆 工 怍提 供 技术 和 为
数据 挖 掘 , 又称 数据库 中的 知识 发现 , 是从 大量 不完 全 的、 噪声 的 、 有 模糊的、 随机的数据集中, 提取隐含在其中的、 人们事先不知道的、 但又是
潜在的、 有用的信息和知识的过程 , 提取的知识表示为概念、 规则、 规律、 模 式等 形式 。 据挖 掘是 对 庞大 的数 据集 或 数据 库进 行分 析 , 数 目的是 发现 隐含 在其 中 的、 知 的 关系 , 以数据 拥有 者 可以理 解 的方 式将 挖掘 出的信 息用 未 并 于指 导决 策 。 挖掘 技 术 可以帮 助 人们 从数 据库 , 别是 数据 仓 阵 的相 关 数据 特 数据集中提取出感兴趣的知识、 规则或更高层次的信息 , 并可以帮助人们从 不同程度 上去分 析它 们 , 可 以更 加有效 地利 用数据库 或数据 仓库 的数据 。 从而 数据 挖 掘 与 传 统分 析 工具 不 同 , 数据 挖 掘 使用 的是 基于 发 现 的方 法 , 运 用模 式 匹配 和 其 它 算 法 决 定 数 据 之 间 的重 要 联 系 , 任 务 是 从 数 据 中 其 发现 模 式 。 据 挖 掘 主 要 致 力 于 知 识 的 自动 发现 , 知 识 发 现研 究 在 数 数 是 据库系统 中的延伸。 随着网络的发展 以及相关应 用需求的提 高 , 数据挖 掘技 术 也 呈现 出 其 发 展 趋 势 , 即可 伸 缩 的数 据 挖 掘方 法 、 据 挖 掘 系 统 数 和 We b数据 库系统的集成 , 可视化数据挖掘 , 复杂数据类型挖掘等 。

数据挖掘技术在高校图书馆管理系统中的应用研究

数据挖掘技术在高校图书馆管理系统中的应用研究

[ src] t e a i go t fh cl ada u t f nvr t ba ol t n n w cal g s ut e a e t bay Ab tat Wi t pd rw ho e a n mon iesyl r ycl c o , e hl n e sb cdwi l rr hh r t s e ou i i r ei e m f h i m ̄a e n .u et i n l irr n g me t nya t s h l o a t es re, c fr t nwa i l oe , dddn t g me t t h d o a l a ma a e n l c a e oe f n c v ev r B t r t b y o t r i i mu h i oma o s mpys r d n i o n i s t a

gt n ls duizt ni e t. nug n edt o ete e r eth t o k p l ai f aamiig Oa e a a i a ti i dphIi a ret e sl w po c a h w t maea api t no t nn , s o y sn lao n ts n o v hn j t o n c o d S t
o f Uni r iy Li r r ve st b a y
Y AN G Xue xi . a
( oee f oic dMaa e nS i c, ea om l nvri, ix n 50 7C i ) C lg P li a ngmetce eH n n r a i st Xni g4 30 , hn l o ts n n N U e y a a
关键词 : 数据挖掘 ; 高校 图书馆管理 系统 ; 性化1

数据挖掘技术在高校数字化图书馆中的应用

数据挖掘技术在高校数字化图书馆中的应用

Th p ia i n fDat i ng i Co lge Di i lLi ar e A plc to o a M ni n le gt br y a
GONG —h a XI Yu u , NG i s e g Na— h n
( e h oo yS ri s f ir y Un e i f h n h io c n ea dTeh oo y S a g a 2 0 9 , ia T c n lg e c b a. v e o L r , i rt o a g a fr i c n c n lg , h n h i 0 0 3 Ch ) v sy S Se n
s n i dsri e ir yb p ig a f igt h oo ya v n o a z v ei t b a ya l n t n n c n lg r g e . l e e c nh l r p y d ai n e ei
K e o ds aa m i n lb a y socai n r e i ay c sr t y w r :d t nig; ir r ;as ito ul;l r on tuci br on;p ro l e e vc e nai d s r ie s z
A bsr c :The e ae m a y d t h e o e t e c lci n n t iia y tm fc H g ir r ta t r r n aa oft e us rlgg d h ol to si he d gtls se o o e e lb ay.Thee d t i e m uc m po tnt e s aa h d hi ra if r ai n o m ton.Ac o dng O h a ay i,i a a c n o d be tr r a e evie .Ths ril i r uc s t i i g e h l y a c r i t t e n lss l r n a pr vie bri te e d r s r c s i atce ntod e daa m n n tc noog nd m eh t od ,a c se h a tc pa e a l fdaam i ng i c e e l a ,a iuse w O a pl aa mi n e h l y i nd diu sst e prc a s c nd vaue o t ni n o ̄ g i r i l bry nd dc s sho t p y d t nig tc noog n lg fa t lfta o n oH g i rr i hto cua u f n i c e e lb ay.And t n hepr e u e a eho i ho t pt i ehb a y c ns i i he t oc d r nd m t d Ol w o o i z r r o uuc on a o i e pe - m i f nd pr v d r

WEB数据挖掘技术在高校图书馆工作中的应用

WEB数据挖掘技术在高校图书馆工作中的应用

在计算 机和网络通信技术飞速发展 的强力 推动下 ,高校 图 书馆正朝着 自动化 、 数字化和信息化 的方 向发展 。同时 , 其主要 职能也相应地实 现了转型 : 了传统 的服务和教育职能外 , 除 还应
视频等形式 的数据 , 因此 We b内容挖掘可简单分 为文本挖掘和 多媒休挖掘。 1 .We 结构挖掘 .2 b 2
充分利用 先进 的科 学技 术为 图书采 访 和优化 馆 藏提供 科学 依
据; 为读者提 供个性化 的信 息服务 ; 学校 的决 策 、 为 管理及建 设 发展提供信息咨询与服务 。以上各种职能 的转变都需要一 个强 有力 的数据采集和处理技术 ,为分 析图书馆读者需求提供 技术 支持和决策管理支持 。WE B数据挖掘就是这样一种技术 。
挖 技 一 重 应 是 量 练 掘 术的 个 要 用,在大 训 样本的 上得 数 基础 ,到
信息提取 。 1 we 数据挖掘 的类型 . b 2
据对象间的内在 特性, 此为依据在网 并以 络资源中 进行有目 { 的的
r 磊 _- . =_ r __ _

l 竺 ’ 竺 l 竺! I l 兰
1 We b数 据挖 掘
1 we 数据挖掘概念 . b 1 在数据挖掘发展 的最初 阶段, 主要是对存放在数据库 中的数据进
行挖掘, K D( nweg Dsoey i D tb s) 即 D K o l e i vr n aaae 技术 。二 d c
网页链接和被链接的数量及对象来建立 W b自身的链接结构 e
模式 , 可用于 网页归类, 可 由此 获得有关 不同 网页 间相似度及 并 关联度 的信息, 有助于用户找到相关 主题 的权威站点 。
1 .we 使用模式挖掘 .3 b 2

数据挖掘技术在高校图书馆中的应用

数据挖掘技术在高校图书馆中的应用
据 集 合 , 括 书名 、 书 号 、 题 、 者 、 科 、 版 社 、 包 索 主 作 学 出
有 数 据 的 分 析 、 理 , 到 某 种 元 组 中 某 些 属 性 的 内 处 得
容 , 是 预 测 出 某 些 信 息 资 源 未 来 形 成 、 用 的 规 律 或 使
等。
常 用 的数 据 挖 掘 方 法 有 : 关 联 分 析 。 主 要 挖 掘 ①
后 ( 果 ) 系 。例 如 , 以通 过 分 析 读 者 在 借 阅 A 图 因 关 可
出 版 日期 等 。
2 .数 据 预 处 理
数 据 预 处 理 : 原 始 数 据 进 行 加 工 处 理 , 除 不 对 去
书 后 , 定 ( 大 部 分 情 况 下 ) 着 借 阅 B 图 书 , 发 必 或 随 来 现 读 者 潜 在 的 借 阅 模 式 。 ③ 分 类 分 析 。通 过 分 析 具
所 谓 数 据 挖 掘 ( t i ig 就 是 从 大 量 的 、 Da aM nn ) 不 完全 的、 噪声 的 、 糊 的 、 机 的实 际应 用数 据 中 , 有 模 随 提 取 隐 含 在 其 中 的 、 们 事 先 不 知 道 的 、 又 是 潜 在 人 但 有 用 的信息 和知识 的过程 数 据 挖 掘 通 常分 为 描 述 型 数 据 挖 掘 和 预 测 型 数 据 挖 掘 。描 述 型 数 据 挖 掘 一 般 是 对 数 据 中 存 在 的 规 则 做 出 描 述 , 常 通 过 对 现 有 数 据 的 概 括 、 炼 和 抽 象 通 精
必 要 的 “ 音 ”, 证 数 据 的 完 整 性 和 准 确 性 。 本 文 使 噪 保 用 的数 据 来 源 主 要 是 泰 州 职 业 技 术 学 院 图 书 馆 图 书

数据挖掘技术在高校图书馆中的应用研究

数据挖掘技术在高校图书馆中的应用研究

据挖掘技 术将 为图书馆的资源 组织和管理 、服 务质量 的提升和服 务范围的拓宽提供行之有 效的技 术支持.
2数 据 挖掘 的概 念『3 l 】
数据挖 掘 ( a nn ,D D t Miig M)是从存放在数 据库 、数据仓库或其他 信息库 中的大量数据 中发现 有趣 知识的 a 过程.这些 知识是隐含 的、事先未知 的、潜在的有用信 息,提 取的知识表示为概念 、规 则、规律 、模式等形式.
3 在个性化服 务中的应用 . 4 所 谓个性化服 务,就 是针对不 同读 者的特定 需求 ,主动地 向读 者提供经过 集成的、相对完 整的信 息集合 或知
识集合 . .
预测读者的信息 需求 ,挖掘数据 背后隐藏 的信 息,掌握读 者借阅规律 ,是 高校 图书馆 开展个性 化服务 的基础.
33优 化= 库 架管理 - 传
高校 图书馆是 高校文 献最集 中的Nf ,藏 基本囊 括 了学校 各专业领域及 相关专业 ,以便 于为全校师生 提供 - I
教学、 科研等服务. 由于藏书种类繁多, 科学的 架管理对于优化馆藏建设十分重要. 笔者认为优化书库:架管理 最重要 的是预测文献 的变化趋 势 ,预 留架 位 ,避免频繁 倒架 ,还 能及 时做好剔 旧更新的工作. 【 2
数据挖掘 的功能包括发现概念/ 类描述 、关联 、和相关 、分类 、预测、聚类 、趋势 分析 、离群点和 偏差分析 以
及卡 似性 分析 . H
3数 据 挖掘 技术 在图 书馆 中的 应 用
31指导采访工作 ,)J . J强信息资源建设 j 采访是 图书馆 各项业务中的重要环节 ,是 决定馆藏质量 的重要 因素,也是藏= 建设和文献 资源 局的首要 内 8 容.采访 人员的采购 信息 ‘ 过 }版社 、网络、= 商 日录等渠道获得 ,然后 由专 门采访 人员独 自确 定,或采 纳 般通 } { 学科专家 的意见,不可避免地 带有主观上 的因素:同时 ,图 书馆每年 的文 献采 购经 费是有 限的,为了使这些 经费 最好 的发挥效 益,需要对各学科之问的分配 、各种文 献载体形式 的采购量 做出周密的安排. 利用 数据挖 掘技术 从图 流通 数据 、图: 的历 史采购数据 以及 查询系 统的各 种查询 数据等进 行关联 性分 馆 析 、序列 分析 等挖掘 ,就可以找出文 献拒借集和频 繁借 阅集 ,分析 出文献 的利 用率 ,从而帮助我们及 时得到 需要 补充 的文献和需 要剔除 的文献 信息:为采购文献提 供科 学合理的各种 分析报告及 预测信息 ;指导采访 人员对购 : 岛

浅析数据挖掘在高校图书馆中的应用及优势

浅析数据挖掘在高校图书馆中的应用及优势

摘要 : 挖掘 技 术是一 种新 兴 的信 息处 理技 术 。文 章在论 述数 据挖掘 技 术的基 础上 , 讨 了数据 挖掘 在 高校 图书馆 的应用 和优 势。 数据 探
Absr c : Daa mii g e h oo y i a ne tc n lg fifr to r c s .Th atce i rdu e aa mii g tc n lg ,a d I hs b ss ta t t n n tc n lg s w e h oo o n omain p o e s y e ril nto c s d t n n e h oo y n O1 i a i t
王学 成 W a gXu c e g n eh n
( 陕西 国际商 贸职 业学 院 , 阳 7 2 4 ) 咸 1 0 6
S an i ntueo t n t n l rd ha x Is tt fI e ai a a e& C mmec , a yn 0 6, hn i nr o T o re Xi a g7 4 C ia) n 1 2
中图 分 类 号 :P 9 T 32
文 献标 识 码 : A

文 章 编号 :0 6 4 1 (0 0)5 0 4 — 2 10 — 3 12 1 3 — 12 0
1 数 据 挖 掘 的定 义 24概 念描 述 概 念 描 述 就 是 对 某 对 象 的 内涵 进行 描述 并概 括 . 数 据 挖 掘 ( a iig) 称 数 据 库 中 的 知 识 发 现 ( D 这类对象的有关特征 , D t M nn 也 a K D: 概念描述分 为特征性描述和 区别性 , 前者 汇 K o l g i oeyi D tbs )是指 从 大量 的 、 完 全 的 、 噪 声 总并描述称为 目标 类的数据集 , nwe eDs vr n a ae , d c a 不 有 而后者汇 总并将一个称作 目标 类的 的 、 糊 的 、 机 的 实 际 应用 数 据 中提 取 隐 含 在 其 中 的 , 们 事 先不 数据 集 与称 作 对 类 的其 他 数 据 集 相 区 分 , 述 不 同 类 对 象 之 间 的 区 模 随 人 描 知 道 的 , 又是 潜 在 有 用 的信 息 和 知 识 的 过 程 。 提取 的知 识 一 般 可 别 , 成 一 个 类特 征 性 描 述 只 涉 及该 类对 象 中所 有 对 象 的共 性 。 生 但 生 表 示 为 概 念 ( o cps、 则 ( ue )规 律 ( euaie )模 式 成 区 别性 描 述 的方 法 很 多 , 决 策树 方法 、 传 算 法 等 。 过 概 念 描 C n et) 规 Rl 、 s Rgl ts、 ri 如 遗 通 ( a en ) 形 式 。 数据 挖 掘 涉 及 机 器 学 习 、 式识 别 、 计 学 、 P t rs等 t 模 统 数据 述 , 以更 清楚 地 了解 读 者 , 可 了解 他 们 的特 点 , 分析 不 同 的群 体 借 阅 库 、 识 获 取 与表 达 、 家 系统 、 经 网 络 、 糊 数 学 、 传 算 法 等 多 量 , 而 有 针对 性 地 提 供 不 同 的服 务 , 高 图书 馆 的 服务 质 量 。 知 专 神 模 遗 从 提 个 领域 。通 过 数 据 挖 掘 , 以从 各 种 数据 库 ( 事 务 数 据 库 、 系数 可 如 关 3 数 据 挖掘 在 高 校 图 书 馆 中应 用 的优 势 据 库 、 象— — 关 系 数据 库 和 面 向 对 象 数 据 库 )数据 仓库 或其 他 信 对 、 数据 挖 掘 技 术 应 用 在高 校 图书 馆 中 , 为 图 书馆 的数 字 资 源 组 将 息存储 ( 空间的、时间相关 的、文本 的、多媒体 的数据库 以及 织和管理 、 如 服务质量提升和方式拓展等方面提供 了技术支持。 WWW ) 中提取有用 的知识 、 规律 或高层信 息 , 并可 以从不 同角度观 31加快信息获取速度 在信息化社会 中,信息技术带来 了信 . 察或浏览。知识发现过程包括数据清理 、 数据集成、 数据 变换 、 数据 息的爆炸式增长。在知识经济 时代, 解决好海量信息的存储开发与 挖 掘 、 式 评 估 和 知识 表 示 。 数 据 挖 掘 是 人 们 长 期对 数据 库 技 术进 利 用 , 高 校 图 书馆 面 对 的一 个 重 大 问题 。 电子 阅 览 室 中 , 模 是 在 为保 证 行 研 究 和开 发 的结 果 ,它 不 仅 能 对过 去 的 数据 进 行 查 询 和 遍 历 , 并 学 生 在 尽 可 能短 的时 间 内获 取所 需信 息 , 理 人 员 可 以 对学 生 每 次 管 且 能 够 找 出 过去 数 据 之 间 的潜 在 联 系 , 现 隐 含 于 海 量 数 据 之 中 的 阅 读 的 专 题集 合 作 为一 个 事 务 , 录 所 有 学 生 每 一 次 阅读 过 程 构 成 发 记 客 观 规 律 , 而 促 进 信 息 的利 用和 加 速 信 息 的传 递 。 从 事务库。对事务库 中阅读频率超过 某给定 阈值 的专题集 , 用关联 利 2 数据 挖 掘 在 高 校 图 书馆 中 的应 用 分析 得 到 专题 之 间 的 关 联 规 则 , 入 服 务 器 的 知 识 库 , 存 当学 生 浏 览 数 据 挖 掘 是 当前 数据 库 研 究 , 发和 应 用 最 广 泛 、 活 跃 的 一 开 最 某页 时 , 网络 代 理 根 据 规 则预 先 连 接 其 关 联 页 , 而 使 学 生 可 以快 从 个 分支 ,随着 高校 图 书馆 的 不 断 发展 , 自动 化 程 度 与 数 字 化程 度越 速 的获 得 信 息 。 来 越 高 , 书馆 要 处 理 和 提供 的信 息 越 来越 多 , 来越 复 杂 。 书馆 图 越 图 32优 化馆 藏 的 结构 高校 图书 馆 每 年 的文 献购 置费 是 有 限的 , . 如何 运 用 这 一 新 技术 挖 掘 丰 富 的 信 息 资 源 , 为学 生 服 务 和 科 学 管理 各 门学 科 之 间 如何 分配 、 各种 文 献载 体 形 式 如 何 均 衡 才 能 使 这 些 经 提供 可 靠 的 依 据 , 我 们 将 要 进行 研 究 的重 要 内 容。 是 费最 好 地 发 挥 效 益 , 是 一件 很难 决 策 的工 作 。可 以通 过 对 图 书馆 这 21聚 类 分 析 聚 类 是 把 一 组 个 体 按 照 相 似 性 归成 若 干 类 别 , . 借 阅、 流通 状 况 及馆 藏 书 目库 的分 析 、 掘 , 用 分 类 分 析 技 术对 流 挖 运 它反映同类事物共同性质 的特征 型知识和不同事物之 间的差 异性 通 记 录 、 索请 求 进 行 分 析 , 类 统 计 文 献 借 阅 率 , 以此 分 析 出 文 检 按 并 质 的特 征 型 知 识 通过 聚 类 , 数据 库 中 的记 录 可 被 划 分 为一 系列 有 意 献的利用率 , 发现各类文献间的关联规 则。为各学科文献的采编工 义 的子 集 聚 类 增 强 了 人们 对 客 观 现 实 的 认 识 , 概 念 描 述 和 类 分 析 是 作 提供科学、 合理 的分析报告和预测报告 , 提供必要的决策支持。 的 先决 条件 。 聚 类 分 析 , 以 把 学 生 或 教 师按 照相 似 性 和 差 异 性 分 可 33提供 个性 化服 务 网络 时 代 的 图书 馆 服 务 不 再 局 限 于 简 单 . 为 多 个 类 别 , 于 同 一 类 别 的学 生 或 教 师 的 相 似 性 尽 可 能 大 , 同 属 不 层 次 的 信 息 查 询 与 反 馈 , 是 转 向广 阔 的信 息 源 , 对 学 生 的 特 定 而 针 类 别 中 的学 生 或 教 师 的相 似 性 尽 可 能 小 , 类模 式 挖 掘 可 应 用 到 学 聚 需 求 主动 地 向学 生 提供 经过 集 成 的 、 对 完 整 的信 息集 合 或 知 识 集 相 生 群体 的聚 类 属 性和 特 征 分析 等 工 作 环 节 中 。 合 。传 统 的图 书馆 信 息 服 务 属 于 被动 服 务 模 式 。数 据 挖掘 技 术 的应 22 关 联 分 析 关 联 反 映 一 个 事 件 和 其 他 事 件 之 间 依 赖 联 系 . 利 的 , 果 在 事 件 中 两 项 或 多项 属 性 之 间 存 在 关 联 , 么其 中一 项 的 用 使 图 书馆 的信 息 服 务 由被 动转 向主 动 。 用 数据 挖 掘 发 现 学 生 的 如 那 使 用 模 式 , 据 学 生 的兴 趣 模 式 提 供 主 动 的 个 性 化 服 务 。 个性 化 服 根 属 性值 就 可 以依 据 其 他 属 性值 进 行 预 测 。 关 联 可 分为 简 单 关 联 、 时 发 及 学生 借 阅 序 关联 、 果 关联 。 关联 分 析 的 目的 就 是 找 出数 据库 中 隐 藏 的 关联 务 包 括 : 现 新 的相 关信 息或 书 目数 据 时 , 时 告 知 学 生 , 因 时, 发现学生 的最新需要 , 根据学生 的兴 趣 , 提供相应 的预测报告 、 网。在图书馆流通历史记录中找出有多大比例 的学生借阅 , 挖掘 出 动态分析等。 来 的规 则 可 为 图书 订 购 工 作 提供 科 学 的依 据 。 34在参考咨询 中的应用 �

数据挖掘技术在高校图书馆读者数据分析中的应用研究

数据挖掘技术在高校图书馆读者数据分析中的应用研究

随 着信 息技 术的 高速 发展 ,人们积
12大量的数据未被利用 . 随着数据库技术的迅速发展以及数据
库管理 系统 在图书馆的广泛应用 ,在图书
馆积 累了大量的读者 对资源 的历史访问数 据 、图书借 还数 据等。这些数据 中隐藏着 许 多重要的信息 ,人们希望能够对其进行
噪 声 的、模糊 的 、随 机的 实际应 用数 据 中 ,提 取隐 含在其 中 的 、人们事 先 不知 道 的 、但 又是 潜 在有用 的信 息和 知识 的
应 的 行 为 ,从 而 提 高 图书 馆 的竞 争 力 。
图书馆 自动 化 系统 中的借还 来自检索 查询 等数据就是读者积极满足个人信息需求的
行 为 , 也 是 读 者 使 用 图 书 馆 资 源 的 最 佳
证 据 。对 图书馆 的借 阅历 史记录进 行数 据 挖掘 和分析 ,变 图书馆 的被动 服 务为 主 动服 务 ,提 高 图书 馆在广 大读 者心 目 中的 整体 形 象 。
的记录 进行 了清除 ;同时对那 些 已经注 销 了 图 书 证 的 读 者 借 阅 信 息 , 也 进 行 了 清 理 。 根 据 上 述 清 理 后 的 数 据 表 ,进 行 借
在未 来 的数 字化 图书馆 中 ,人们 要
质服 务提 供 有 效 的 决 策 依据 , 据 挖 掘 工 数
目前的 图书馆管理系统无法发现这些 数据中存在的关 系和规则 ,无法预测读者 的信息需求 , 乏挖 掘数据中隐藏的知识 缺 的手 段 。在 图书馆 这样 一 个知识 的海 洋
c d 、书 名 tte 中图法编号 b o — oe il、 ok c d 、排架 号 s ef c d 、借阅者编号 、 oe h l— o e

数据挖掘技术在高校图书馆个性化书目推荐服务中的应用

数据挖掘技术在高校图书馆个性化书目推荐服务中的应用
阅信息处理等。
[关键词]数据挖掘技术
个性化服务
书目推荐
高校图书馆
[分类号]G252.1
随着数字化时代的到来,高校图书馆馆藏信息资源越来
越丰富,种类和形式日益多样化,面对这些海量的资源,读者
2
书目推荐服务中应用的必要性
在查询自己所要的信息时不仅要花费大量的时间,而且到最
后得到的信息也可能价值不大。对广大读者来说,目前的难
络、可视化等。
数据挖掘首先把数据库中的数据进行清洗并集成进入
到数据仓库中,数据清洗不仅可以清除噪声,还可以把与主
题无关的数据都清除出去;数据的集成是把组合多数据源的
相关数据有机地集中。进入数据仓库中的数据还要进行选
择和转换进入到特定的数据集中,这部分主要是转换数据的
存储形式,以便于数据挖掘的进行。其次,针对特定数据集
仅囊括了本所高校设置的专业领域资源,还涉及了其他相关
书馆服务的重点。
采用聚类分析或者关联分析的方法研究读者的历史借
的研究领域,有效帮助全校师生的教学和科研,并能提供给
阅数据时,利用数据挖掘技术有利于关联规则的发现,可对
师生个性化的推荐服务。高校图书馆有着种类繁多的馆藏
读者图书文献的借阅提供理论支持,简单地理解也就是不同
量减少书架上图书的倒架次数,做到旧文献及时剔除,新文
式,形成在图书馆馆藏资源基础上的图书推荐数据库,通过
献迅速上架。
上面所述馆藏书架的优化管理,可以通过数据挖掘技术
对读者借阅行为的分析,从数据库中推荐相对有用的图书介
绍给读者。例如,通过关联分析读者的借阅行为,关联性较
的引入来实现,首先针对图书馆的历史图书文献借阅日志,
1
只是数据资源的丰富和可视化效果要好,馆藏资源的数字化

数据挖掘在高校图书馆个性化推荐服务中的应用

数据挖掘在高校图书馆个性化推荐服务中的应用

数据挖掘在高校图书馆个性化推荐服务中的应用
随着科学技术与信息技术的不断发展,高校图书馆也面临着推进数字化服务、提升服务质量和满足用户需求的新挑战。

在这些挑战中,个性化推荐服务成为了图书馆中的重要发展方向之一。

为了提高个性化推荐服务的精度和效果,数据挖掘技术被引入到高校图书馆的个性化推荐服务中。

在高校图书馆个性化推荐服务中,数据挖掘技术可以通过分析用户行为、用户兴趣和图书馆资源等方面的数据,实现个性化推荐。

下面介绍几个具体应用:
1. 用户画像分析
通过采集用户的阅读记录、搜索记录和借阅记录等,利用数据挖掘技术进行分析,可以建立起用户画像。

根据用户画像,可以更好地理解用户的需求和兴趣,从而实现更为精准的个性化推荐服务。

2. 相似用户推荐
数据挖掘技术可以对用户的数据进行相似度计算,找出和当前用户兴趣相近的其他用户。

通过分析这些相似用户所感兴趣的图书、期刊等资源,可以向当前用户推荐相关资源。

3. 热门资源推荐
利用数据挖掘技术对图书馆资源的阅读、借阅等记录进行分析,可以发现用户借阅量较大、搜索量较多的资源,从而向其他用户推荐这些“热门资源”。

4. 模型预测推荐
通过对用户行为数据的建模,结合数据挖掘技术,可以预测用户对某一资源的兴趣程度,并向用户推荐最符合其需求的资源。

数据挖掘与知识发现技术在高校图书馆中的应用

数据挖掘与知识发现技术在高校图书馆中的应用

数据挖掘与知识发现技术在高校图书馆中的应用随着信息化时代的到来,高校图书馆的管理方式也发生了重大变化。

传统的图书馆管理方式已经不能满足用户需求,而数据挖掘与知识发现技术的应用,则能够为高校图书馆的运营和信息服务提供更好的支持。

本文将探讨数据挖掘与知识发现技术在高校图书馆中的应用。

一、数据挖掘技术在高校图书馆中的应用1. 数据挖掘基础数据挖掘是一种自动分析大型数据集的过程,旨在从数据中提取潜在的有用信息,并将其转换为可理解的结构。

数据挖掘技术可以帮助高校图书馆发现藏书的变化趋势,还可以对用户行为进行分析。

例如,利用数据挖掘技术,高校图书馆可以分析用户在馆内的借阅情况,可以根据用户的需求,将馆藏资源分门别类,提高资源利用率,也能让管理员更好地了解用户的需求和行为,从而调整资源的使用策略。

2. 相关技术手段在数据挖掘技术的应用中,需要运用各种技术手段来处理数据,例如数据清洗、数据预处理、数据挖掘、数据转换等。

高校图书馆可以利用这些技术手段,对馆藏书籍进行分析和排版,也可以对用户行为进行分析,发掘出有用的信息。

3. 数据挖掘技术在高校图书馆的主要应用通过数据挖掘技术,高校图书馆可以对用户进行分析,了解用户需求和使用习惯,例如某种类型的图书更受欢迎等;还可以分析馆藏资源的使用情况,针对馆藏资源不足的情况,可以调整资源采购策略,提高馆藏资源利用率。

二、知识发现技术在高校图书馆中的应用1. 知识发现基础知识发现是指从数据源中挖掘并识别出有意义、实用的知识或模型。

知识发现技术常用于研究数据特征、建立数据模型,从而获得实际价值。

2. 相关技术手段知识发现需要运用各种技术手段,例如数据挖掘、情报检索、自然语言处理、专家系统等。

高校图书馆可以无缝地将这些技术手段融合在成一个整体,从而提高知识发现的效率和准确性。

3. 知识发现技术在高校图书馆的主要应用知识发现技术可以发现馆册之间的相关性,从而对用户提供准确的搜索结果。

数据挖掘在高校图书管理信息化中的应用

数据挖掘在高校图书管理信息化中的应用

随着 数 据 库 技 术 的迅 速 发 展 。 人们 积 累 的数 据 越 来 越 多 。激 增 的 并 概 括 这 类对 象 与不 同类 对 象 之 间 的 区别 。 成 个 类 的 特征 性 描 述 只 生 如决 数 据 背 后 隐 藏 着许 多 重 要 信 息 , 们 希 望 能 够 对 其 进 行 更 高 层 次 的 分 涉 及 该类 对 象 中所 有 对 象 的共 性 。 生 成 区 别 性 描 述 的 方 法很 多 , 人 析, 以便 更 好地 利 用 这 些 数据 。 目前 的数 据 库 系 统 可 以 高 效 地 实 现 数 策 树方 法 、 传 算 法 等 。5偏 差 检 测 。 据 库 中 常 有一 些 带 偏 差 的 异常 遗 () 数 从 偏 如 据 的 录入 、 询 、 计 等 功 能 , 无 法 发 现 数 据 库 中 存 在 的关 系 和 规 记 录 , 数 据 库 中 检测 这 些 偏 差 很 有 意 义 。 差包 括 很 多 潜 在 知识 , 查 统 但 则 。 法 根 据 现 有 的 数 据 预 测 未 来 的 发展 趋 势 , 乏 挖 掘 数 据 背 后 隐 分类 中的 反 常 实 例 、 无 缺 不合 规 则 的 特 例 , 测 结 果 与模 型 预测 值 的偏 差 , 观 偏 藏的知识的手段。面对“ 数据爆炸但知识贫乏 ” 的挑战 , 基于人工智能 量 值 随 时 间 的 变化 等 。 差 检 测 的 基 本 方 法是 寻 找 观 测 结 果 与参 照 值 的 数 据 挖掘 和 知 识 发现 技 术 便 应 运 而 生 , 显 示 出强 大 的生 命 力 。 数 之 间 有 意 义 的差 别 。 并 据 挖 掘 作 为 当 前 数 据 库 研 究 、 发 和 应 用 最 活跃 的 分 支 之 一 . 起 了 开 引 2 高 校 图 书管 理 的 特 点 学术 界 和 产 业 界 的广 泛 关 注 。 图 书情 报 界 也 不 例 外 , 着 高 校 图 书 馆 随 自动化 程 度 与 数字 图 书馆 建 设 的不 断 发 展 , 图书 馆 要 处 理 和 提 供 的 信 21 高校 图书 馆 资 源 系 统特 点 分 析 . 息越 来 越 多 , 来 越 复 杂 。 图 书馆 如 何 运 用 这 一 新 技 术 挖 掘 丰 富 的信 越 高 校 图书 馆 在 各 种 载体 的资 源 积 累 过 程 中 , 视 资 源 组织 与 学科 重

数据挖掘技术在小型高校图书馆中的应用

数据挖掘技术在小型高校图书馆中的应用

[ ] 曹艳. 1 浅析如何提高高校图书馆 的地位 [] J. 科技情报开发与
经济 ,0 0 1 )2 — 5 2 1 ( 2 :4 2 .
[ ] 秦翠萍. 2 论校园文化建设 中高校 图书馆的地位和作 用[] J. 平 原大学学报 ,0 4 1 :0 — 0 . 20 ( ) 13 14 ( 实习编辑 : 薛 艳)
科技情报开发与经济
文章编 号:0 5 6 3 (0 0 - 0 8 0 10 — 0 3 2 1 )7 0 3 - 4 1
S IT C F R A IND V L P E T&E O O C—E H I O M TO E E O M N N C N MY
21年 第 2 卷 第 7 0 1 l 期
如何 使这些储藏的知识发挥 出巨大的效用 ,必 须对其进行深人 的挖 掘 ,而数据挖掘技术为高校 图书馆迈 向新 的台阶提供 了技 术基础和数据保障 。
1 高校 图书馆 数据 挖掘 技术 的 内涵
网络技术 的广泛应用 , 使大量信息不 断涌现 , 同时也伴随 但 着诸多问题的出现。首先是信息 的过量使人们难以消化 ; 二是在 身 的努力 , 图书馆是可 以改变不平等现状 的。而且 事实证 明, 图 书馆仍然是大学生 的第二课堂 , 是高校教育 中至关 重要 的一环 ; 而教育职能是 图书馆不可推卸 的责任 ,也是每一个 图书馆人 的 骄傲 , 我们要勇敢地承担起来 。
第一作者简介 : 李志强 , ,9 8年 1 男 16 0月生 ,9 2 19 年毕业 于
北京 大学图书馆 学专业 , 副研究 馆员 , 华北 电力 大学图 书馆 , 河
北省保定市永华北大街 ,7 0 3 0 10 .
Байду номын сангаас

数据挖掘技术及其在数字图书馆中的应用

数据挖掘技术及其在数字图书馆中的应用

数据挖掘技术及其在数字图书馆中的应用摘要:数据挖掘技术是信息市场竞争发展和信息经济竞争的产物。

随着信息市场竞争的深入发展和日趋激烈,数据挖掘技术在图书馆界和信息界的应用将越来越广泛。

对此进行了论述。

关键词:数据挖掘技术;数字图书馆;应用0引言数字化是当代图书馆的鲜明特征,数字图书馆是未来图书馆的存在形式。

在现代科学技术的推动下,高校图书馆正朝着自动化、数字化和信息化的方向发展。

数字图书馆替代传统图书馆已是大势所趋。

高校图书馆不仅是学校的文献信息中心,也是为教学和科研服务的教育学术性机构,在高校的教学、科研中扮演着重要的角色,高校图书馆因其信息量大、占用空间少、更新速度快、不受时空限制等特点越来越受到人们的关注,但人们在享受着数字图书馆所带来便捷的同时,也深受其庞大而形式多样的信息资源困扰。

对单个读者来说,不可能对数字图书馆的所有信息资源都需要,而同样的信息也不一定会满足所有的读者,造成了读者短时间内无法找到适合自己的有用资源。

因此目前的高校图书馆面临着愈来愈严重的挑战,亟需进行改进和提高。

1数据挖掘技术1.1数据挖掘概念广义的数据挖掘又称数据库中的知识发现(KnowledgeDiscoveryinDatabases),简称知识发现(KDD)。

它是从大量的、不完整的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的、但又是可信的、潜在的和有价值的信息和知识的过程。

狭义的数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据之间关系的过程,是知识发现过程中的一个步骤。

1.2数据挖掘技术及其特点在各个领域的应用中,最常用的数据挖掘技术主要有决策树、神经网络、关联规则、聚类分析、统计学习、模糊集和粗糙集等。

数据挖掘的特点可以归纳为:(1)海量性。

主要从数据中挖掘出规则,其数据必须是海量的、可以表示整个领域业务状况的。

数据挖掘所处理的数据源一般是多个数据库经过数据预处理后形成的。

(2)复杂性。

数据挖掘技术在图书馆领域的应用沙泓薇

数据挖掘技术在图书馆领域的应用沙泓薇
时代经 贸 2 1 0 0耳 4 月 中旬刊 总第1 6 6 期
数 据 挖 掘 技 术 在 图书 馆 领 域 的应 用 沙 泓 薇
沙泓薇
( 鸡西 市 图 书馆 ,黑龙 江
【 摘
鸡西
1 80 ) 5 10
要】本文介绍 了数据挖掘的定义、功能及常用技术方法, 简要介 绍了数据挖掘技术在图书馆领域的应用。 ・
【 关键词】数据挖掘;数据挖掘技术;图书馆
随着信息技 术的不断发 展,图书馆 的馆藏 内容以及服务对 象 、 范 围 、深 度 都 发 生 了深 刻 变 革 , 图 书 馆 的 角 色 也 从 单 一 的 为读 者提供书籍转 化为知识 、信 息的提供 者 。图书馆 传统 的服 务 已经不能满足读 者的需求 ,读者期望 图书馆根据其 各 自不 同 的需求 ,提供个性 化、 网络 化、集成化 的信息服 务。图书馆要 适应 这一变化 ,引入信息技术 ,改进服务 的方式 、手 段,帮助 读者 在海量 的信息 中找到有用 的知识 ,真 正提高 图书 馆的工作 效率,实现全社会 的信息资源共 享 。数据挖 掘技术 正是高校 图 书馆 实现智能转变 的应用技术之一 。 1数据挖掘技术简介 . l 1数据挖掘 的定义 _ 数据 挖 掘 (a a M n n ) 是 信 息 技 术 领 域 中 最 热 门 的话 Dt iig 题之 一。数据挖掘 就是从大量 的、不完全 的、有噪声 的、模糊 的、随机 的实 际应用数 据中提取 隐含在其 中的、人们事 先不知 道 、但 又 是 潜 在 有 用 的 信 息 和 知 识 的 过 程 。 从 广 义 上 理解 ,数 据 、信 息 也 是 知 识 的表 现 形 式 , 但 是 人 们 通 常 把 概 念 、 规 则 、 模式 、规律等看作 知识 ,而把数 据看作是形 成知识 的源 泉 。原 始数据可 以是结构化 的,如关系 数据库 中的数据 ;也可 以是半 结构化 的,如文本 、图形和 图像 数据;甚至 是分布在 网络 上的 异构 型数 据 。发现 知识的方法可 以是数学 的,也可 以是非数学 的 ;可 以 是 演 绎 的 , 也 可 以是 归 纳 的 。发 现 的 知 识 可 以被 用 于 信息管理 、查询优化 、决策支持和 过程控制等 ,还可 以用 于数 据 自身 的 维 护 。 因此 , 数 据 挖 掘 是 一 门 交 叉 学科 ,它 把 人 们 对 数据 的应 用从低层次 的简单查询提 升到从数据 中挖掘知识 ,汇 聚 了不 同 领域 的 研 究 者 , 尤 其 是 数 据 库 技 术 、人 工 智 能技 术 、 数理统计 、可视化技术 、并行计算等 方面的学者 和工程技 术人 针对 中小型行业企 业在I 整合方面 的问题 ,一些 国 内外知 T 名厂商展开 了全 面技术合作 ,在J v 基础 上推 出了面 向业务 的 aa 体 系架 构 B A ( u i e s r e t d r h t c u e O B s n s O in eA c ie t r ), 为 中小 行 业 企业的信息整合提 出了解决方案——B A O ,顾名思义,就是 0 。B A B sn s+ O 。简单地讲,可理解为在S A u ie sSA O 技术的基础之上融入行 业经验,利用传统技术和S A O 技术来实现对业务系统通用构件 的对 接、部署,使得S A O 与行业个性化应用得 以融合。相 比SA O 架 0 ,B A 构整合 了大量的本土企业用户的应用经验 ,使得软件的开发 、部 署更加贴近国内中小企业的个性、通用化需求,能更好地满足 中 国 日益 膨 胀 的 “ 业 支 撑 平 台 ” 的需 求 ,成 为 解决 I整 合 、面 向 行 T 服 务架 构 的 一个 新 主 流 。 结合 S a 的主 要 特 点 及 在 企业 信 息 化 中 aS 的初步应用实践,在此基础上B A O 如果与Sa 相结合可 以为中小企 aS 业信息化提供 了一个 比较切合实际的实现思路 。 3 2 2 s§ 对 中 小 企 业信 息化 的 影 响 . . a S S a 软 件即服务 )的应用为 中小企业信息化提 供 了更 为 a S( 有 效 的 捷 径 ;更 为 低 廉 的 费用 以 及 灵 活 的 付 费 方 式 , 减 轻 了 中 小企业的资金压力 ; 日益完善 的网络环境和 技术保证 了信 息化 的有效性和安全性 ;专业 的服 务提供商保 证了服务 的可靠性 , 同时又节省 了中小 企业在I 人 员上的投入 。毫无疑 问,S a 可 T aS 以帮助 中小企业 以最少 的投入最快地实现信 息化应用 。 S a 模式 的实质 是将 一 部分 I 业 务外包 给专 门的软 件服 aS T 务商。企业往往会将 非核心 的业 务选择S a 模式 ,使 自己更专 aS 注 于核心业务 。这 无疑是适合 中小企业信 息化需求 的方式 。对 中 小 企 业 来 说 ,S a 的优 点 更 加 突 出 , 主 要 表 现 在 以 下 几 个 方 aS 面 [: ( ) 降低 拥 有 成 本 ,缓 解 资 金 压 力 ; ( ) 降低 管 理 成 6 1 ] 2 本 ,专 注 核 心 业 务 ; ( ) 减 少 专 业 I 人 员配 备 。 3 T
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

有用的信息和知识的过程。挖掘的对象是数据库和数据仓库, 旨 把有价值的信息挑选出来, 将发现的知识以用户能理解的方式提
在通过对数 据 的 统 计 、分 析 、综 合 、归 纳 和 推 理 , 揭 示 事 件 间 的 相 供给用户。
互关系, 预测未来的发展趋势, 起到辅助实际工作问题求解的作
( 5) 知识评价。用户根据已有的知识对挖掘的结果进行合理
02 4 http://industry.ccidnet.com/pub/article/c786_a9920_p2.html, 2004-
10- 02 5 http://news.ccidnet.com/pub/article/c29_a9920_p1.html, 2004 -
11- 13 6 http://www.e800.com.cn/articles/42/1101208808462.html, 2004 -
11- 15 7 刘海伟,萧德洪,黄国凡.数字图书馆存储系统构建策略.大学图
书馆学报,2004( 3) 8 王启云.高校数字图书馆如何解决网络存储.图书馆情报工作,
2003( 5) 9 彭 磊.建 立 SAN( 存 储 局 域 网 ) — ——高 校 图 书 馆 数 据 存 储 系
统 发 展 趋 势 .现 代 情 报 ,2004(4)
在 解 决 问 题 时 , 可 使 用 以 下 几 种 手 段 : 预 测 模 型 、数 据 库 分 析 、链 元 分 析 和 编 差 检 测 。
① 预 测 模 型 : 在 联 机 分 析 处 理 ( OLAP) 中 使 用 演 绎 推 理 , 在 数据挖掘中使用归纳推理。
② 数据库分析: 把数据库自动划分为聚类( 簇) 。 ③ 链元分析: 基于对横向关联和顺序关联的发现, 且对记录 间联接进行确证。 ④ 偏差检测: 对记录不能被归入到特定格元现象的侦知和 解释。 实际应用时可以交叉更替使用各种算法以挖掘更多的信息。 2 数据挖掘在图书馆的应用 图书馆日常工作中每天都会产生大量的统计数据, 如果没有 一 个 强 有 力 的 数 据 采 集 和 处 理 工 具 介 入 , 往 往 会 变 成 “数 据 坟 墓”, 失去其对图书馆业务工作的指导作用。而数据挖掘就是这样 一种新兴的技术, 可以为图书馆工作提供技术支持和决策管理支 持。 2.1 分析读者需求, 优化信息资源建设 高校图书馆的文献采购常常面临两个问题: ①每年的文献购 置费是有限的, 书库、阅览室等各种可使用的空间也是有限的, 如 何有效地使用有限的经费, 充分利用宝贵的空间, 添置读者真正 需要的文献, 提高文献资源的利用效率; ②根据学校的专业设置 及教学科研情况, 文献购置费在各门学科之间如何分配, 各种文 献载体形式之间如何平衡, 才能使文献购置费发挥最大效益。传 统图书馆大多由专门采访人员独自确定或与少数专家商计决定, 不可避免地带有一定的主观性以及个人喜好, 难免造成经费浪费 及馆藏信息资源的缺漏。 利 用 数 据 挖 掘 技 术 可 以 解 决 以 上 问 题 。图 书 馆 每 天 产 生 大 量 可以对采访工作产生指导作用的数据, 如自动化系统的流通数 据, 图书馆的历史采购数据, 查询系统的各种查询数据等。利用模 糊聚类分析技术, 通过对图书馆业务系统的借阅、流通状况、检索 请求及馆藏书目库进行分析挖掘, 按类统计文献拒借集和频繁借 阅集, 并以此分析出文献的利用率, 及时补充短缺的文献, 剔除 过时的文献或减少部分文献的采购复本量。运用关联分析技术, 对用户每次借阅的文献进行关联分析, 发现各类文献间的关联规 则或比例关系, 可为各学科文献的采访工作提供分析报告和预测 报告, 优化信息资源建设或馆藏结构。 2.2 加强书库科学管理, 提高服务质量 书 库 的 频 繁 倒 架 以 及 图 书 的 残 破 率 、丢 失 率 是 经 常 遇 到 的 问 题, 如何防微杜渐也是值得挖掘的一个方面。通过对历年借阅数 据的相关分析, 增长幅度相应较大的图书种类在上架的时候应根 据预测的趋势预留架位; 通过对注销数据的分类分析统计及与样 本库比较以确认若丢失率超过一定比例的原因出在哪些方面, 给 出 在 制 度 上 或 人 员 上 加 强 管 理 的 建 议 。对 于 那 些 借 阅 频 率 较 大 且 连续续借的文献, 应以量化的方式反馈给采访部门以加重采购的 力度; 对罚赔款数据的挖掘则可提供对诸如特定书刊的借阅期限 和人员限制等的建设性建议, 以提高服务质量。
展, 图书馆要处理和提供的信息越来越多, 越来越复杂。图书馆如 进行数据提取。
何运用这一新技术挖掘丰富的信息资源, 为服务读者和科学管理
( 2) 数据预处理与转换。从与 KDD 相关的数据集合中除去明
提供可靠的依据, 值得图书馆界深入研究。本文试图重点探讨数 显错误的数据和冗余的数据, 进一步精减所选数据中的有用部
有了数据挖掘技术, 图书馆完全可以根据用户以前借阅的 文 献 资 料 , 甚 至 经 常 访 问 的 网 页 ( Web 服 务 器 访 问 日 志 ) 进 行 分 析 、挖 掘 , 进 行 用 户 的 背 景 分 析 、用 户 群 体 的 分 类 分 析 、用 户 偏 好 分 析 、用 户 检 索 满 意 度 分 析 等 , 了 解 他 们 的 兴 趣 爱 好 、研 究 方 向, 得出特定用户的特定检索规律和知识模型, 无需用户先提出 信息请求, 便可确定个性化服务内容, 主动将相关文献送到他们 手中。
关键词 数据挖掘 知识发现 高校图书馆
Application of Data Mining to Academic Libr ar y Shi Jun
Abstr act The paper introduces the knowedge of Data Mining and several kinds of Data Mining software, and discusses the application and some problems of Data Mining in the Academic Library.
个性化服务的内容包括: ( 1) 当发现新的相关信息或书目数 据时, 及时推送给用户; ( 2) 当用户访问图书馆网站时, 根据用户 的 兴 趣 度 , 为 用 户 提 供 定 制 的 Web 页 面 ; ( 3) 跟 踪 用 户 的 兴 趣 变 化模式, 发现用户的最新需要; ( 4) 根据用户的兴趣, 提供相应的 预测报告、动态分析等, 提供个性化决策支持服务。
个性化服务的过程包括: 构建个性化用户动态需求模型; 搜 索、挖掘针 对 特 定 需 求 的 相 关 信 息 ; 按 照 特 定 主 题 , 将 搜 索 、挖 掘 到的信息进行过滤、加工和组合, 整合成相对完整的信息集合; 以 在线或离线形式, 主动发送给用户; 按照特定主题, 对信息集合进 行分析开发, 产生新的知识; 以在线或离线形式, 主动发送到用 户。 2.5 利用数据挖掘建立 Web 学科导航系统
2.3 优化数字图书馆的信息内容 数字图书馆是一种数据信息系统, 这一系统不但拥有内容丰
富、形 式 多 样 的 数 字 化 信 息 资 源 , 而 且 依 赖 于 现 代 高 新 技 术 的 支 持, 高效地满足用户的需求。目前, 数字图书馆的信息内容包括大 量的数字化馆藏、种类繁多的数据库、全文 Web 资源链接以及互 联网上的大量信息。这大量的数据, 只有通过组织、分析和挖掘, 找出数据背后真正有价值的知识信息, 才是用户实际需要的。采 用数据挖掘技术, 将其用于数字图书馆的信息发现和信息提供的 全过程, 可向用户提供更优化的信息服务, 满足用户的个性化需 求。 2.4 针对用户特点提供个性化服务
于存储和在线设备发生频繁读写交换的数据等。 在线、近线、离线三种存储体相互配合, 在满足图书馆数字化
建设的存储整体需求的情况下, 并且在管理软件定义的迁移策略 控制下来做数据分级管理, 既可满足读者的检索查新需求, 又可 扩充系统的存储容量, 只要配置得当, 不仅可为图书馆节约存储 投资成本, 还可达到事半功倍的效果。
与数 据 库 中 的 信 息 不 同 , Web 网 上 的 信 息 具 有 无 序 、非 结 构 化、动态、多 样 性 等 特 点 , 有 时 数 据 源 之 间 还 可 能 存 在 冗 余 、不 一 致甚至矛盾, 因此面向 Web 的数据挖掘要比面向单个数据仓库 中的数据挖掘复杂得多。通过 Web 内容挖掘可以对 Web 上大量 文档集合的内容进行摘 要 、分 类 、聚 类 、关 联 分 析 , 从 大 量 的 Web 资源中抽取潜在的有用知识。通过 Web 结构挖掘, 找到学校相关 专业及研究方向的权威页面。按照事先定义的主题分类模式, 对 每个网 页 文 档 进 行 自 动 的 分 类 、标 引 , 自 动 生 成 便 于 用 户 使 用 的 知识模式, 即学科导航系统, 进一步丰富图书馆的信息资源。 3 主要的数据挖掘软件
92 ·数字图书馆·
!!!!!!!!!!!!!!!江西图书馆学刊( JLSJ)
第 35 卷第 3 期( Vol.35 No.3)
数据挖掘在高校图书馆的应用
石军
摘 要 概述了数据挖掘的一般知识和几种在信息管理领域有应用前景的数据挖掘软件, 探讨了数据挖掘在高校图书馆信息管 理与服务方面的应用, 分析了数据挖掘在应用中存在的问题。
Keywor ds Data Mining, KDD, Academic Library
数据挖掘是当前数据库研究、开发和应用最活跃的分支之
整个知识发现过程由若干挖掘步骤组成:
一, 它在科学发现、商业零售以及信用管理、医学等领域已得到广
( 1) 数据选择。根据挖掘要求, 将多个数据库中的数据进行
泛应用。随着高校图书馆自动化程度与数字图书馆建设的不断发 合并处理, 提取与 KDD 相关的数据, KDD 将 主 要 从 这 些 数 据 中
趋势和行为进行预测并自动探测以前未发现的模式, 从而很好地
相关文档
最新文档