基于数据仓库技术的图书管理信息系统研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

・ - — —
分析 处理 , 而数据 挖掘和联机分 析处理得 出的新 知识也可 以立 即补充 到系统 的知识库 中, 实现系统的各种要求和辅助决策。 3 图书 馆 数 据 仓 库 系统 的 分 析 与 设计 . 在 进行图书数据 仓库系统 的实现时 , 整个设计 过程分为 i个主要 阶段 : 1数据仓库 设计和实现 阶段 : () 主要完 成对 图书数据仓 库的概念 模 型和物理模 型 的设计 , 并在 S L 实现数据仓 库的结 构 ;2 E L阶 Q上 ( )T 段: 主要 完成对图书数据仓库的分析处理和数据装载部分的程序设计 ; () 3 分析处 理实现阶段 : 主要完成对图书数据仓库分析和数据展现部分 的设 计 。 4 图 书馆 数 据 仓 库 的 实 现 . 41 .数据 源分析 图书数 据仓库 的数据 源包括 了读者 库 、 网书库 、 图书流通 信息 库 等 。在这些 信息 中, 有读者 档案表 、 图书档案表 、 图书流通表 以及读 者 服务表 。基于多维数据 分析的要求 , 中抽取 了读者 的基本信息 如姓 从 名 、 书证 号 、 借 单位 等数 据 。图书数据 库中存储的 图书基本信息 如 : 图 书名 、 引号 、 者 、 索 著 出版 社 以及 图书 的 内容 简 介 等 , 结 构 是 非 结 构 化 其 的文本 结构。然后 , 流通信息库 中的流通表和 图书管理表 中抽 取数 从 据转换成所需的事实表。 42E L 计 . T设 E L E t c rnf m od 设 计是从源文件或源数据库 中获取数 T ( xr t a s r L a ) a T o 据 , 经过 清洗 、 换 和集成 后 , 其加 载到 数据 仓库 的过 程 。E L 并 转 将 T 在 整个 数据 仓库 系统 中处于 源文 件或 源数据 库与 数据仓 库层 之 间。 MirsfS LSre 的数据转换 服务( aaTas r e r简称 D S , coo Q e r t v D t rnf m S ̄e, o T) 允许用 户在多种数据源之 间输 入或输 数据或使用 S LS re 的多个 Q ev r 计算机之间转换数据库和数据库对象。 数据仓库 中存 储细节数据 的事实表和维表 要求 在 S LSre 数据 Q evr 库管理 系统 中创建 和处理 , 数据 源往往 是异 构的 , 因此在数据转换中首 先要求 实现将 O A L 数据库 、 C E S R CE A C S 数据库 、 文本数据 及 E C L X E 电 子表形式数据 等数据 源中的数据 导入到 S LS re数据库 中, T 包 支 Q e r v DS 持这 些数据源 , 虽然 在 S LS re 的 D S中提供了文本转换 的功能 , Q e r T v 但 是图书库 中的文本 格式 比较复 杂 , 并且处理 的过程并不是将 文本 中的 内容简单分割后存储 到数据库 中, 可以采用 v + .E 、 B .或 U I c + TV 6 N 0 NX 下的 C 言来编写数据转换嵌人程序结合 S L的方法 对其中的数据进 语 Q 行处理 。其 次 , 要将业 务系统中的数据进行一定的转换和合法性检查 , 才能装 载到数据仓库 , 即生成满足需要 的事实表和维表。 针对 以上情况 , 用上述设计的工具 , 利 采取以下步骤来完成数据转 移工 作 。 第 一步 , 首先在 S LS re 数据库服 务器上 建立一 个数据 准备 区 Q evr 作 为数据仓库 的中间存储 区, 然后将这些维表 和事实表所对 应的数据 源要 涉及的表利用上述设 计的_ T具导人 到S e e 的“ QLS r r 数据准备 区” v 数据库 中, 并进行初步清理 , 消除数据准备 区中的 N L 值 。 UL 第 二步 , 源数据抽 取到 S LS w r Q m e 的数据准备 区后 , 就利用 E L _ T 1 具 的数 据转 换模块 , 逐一对这些表进行转换 , 并生成相应的事实表和维 表。 43 -维度的建立 图�
( ■— —— 二)
l者案 数仓 I前据l 用查 读档库l 管工 理具 据库 当数 工 户询 具
( — —— —
分 析l
1 通 阅l 流借
L资 料 转具 换 工

I二二= l < ≥
L信 流
数 据源
I. L史据 . m 历 J ..J . .. . . . 数
数 据获取 引擎 数据 仓库
f二二 = =
司 O 1分l L 藏析 A 书 P
数 挖 据掘
工 鼻
1分 析l
用 户分析
ቤተ መጻሕፍቲ ባይዱ
分 析工 具
图 1图书馆 数据仓库 的体 系架构 21 据源层 .数 包括从各种 内部的或外部 的信息源获取 的数据信息 。内部数据 源 是 指 图书馆 管理信息系统f 如采访 、 目、 编 典藏 、 流通) 的业务数据库 ; 外 部 数据包括 从图书馆 网站 、 读者论坛上 收集到 的各种 需求信息与业 务 数 据( 各流通窗 口收 集到的读者需求信 息)学校 的学科 专业设置 , 如 , 各 学 院学科专家提供 的需求信息 , 以及 出版社提供 的各种 书 目信 息 , 以提 供 分析使用 。数据源是数据 仓库的数据来 源 , 图书馆管理信息 系统 为 提供原始数据。 22 据 获 取 引擎 .数 在进行 图书馆数据仓库 的建立时 , 个主要问题 是如何将异构 图 一 书馆数据库 中的数据抽取 、 转换为 图书馆数据仓库 的统一格式 , 后加 然 载到 图书馆 数据仓库 中。该 过程关系 到图书馆数据仓 库的质量 , 图 是 书馆数据仓库的应用基石 。外部数据在进人数据仓库 之前要 通过 数据 获取引擎 的处理 。元数据库用 于存储数据模 型和元 数据 , 其中 , 元数据 描述 了数 据仓库 中源数 据和 目标数据 本身的信息 , 定义 了从 源数 据到 目标数据 的转换过程 , 按照元数据数据库 中所确立 的数据标准 、 数据过 滤清洗原则和时 间戳 的加盖规则对外部数据按 不同的粒度进行层次汇 总, 最终形成数据仓库 中的当前数据 、 综合数据 和历史 数据 。 23 据 仓 库 .数 数据仓库 中的数据 , 既可来源 于图书馆 已有 的系统数据( 内部数据 源 )也可 以是其它方式获取 的数 据文件 ( , 外部数据源 ) 。通过数据获取 引擎对数据源进行处理后 , 将数据按层次存储形 成数据仓库。 24 析 工 具 -分 分析 _ 具建立在数 据仓库基础 之上 , T 主要 由联机分 析处理( A ) OL P 和数据挖掘 ( DM) 组成 。O A L P是一个 分析处理技术。它从加入图书馆 数据 仓库的异构 图书馆数据库 的集 合中收集信 息 , 并运用数 学运算和 数据处理技术 , 活 、 灵 交互地提供决策分析 、 趋势分析和预测报告 , 并通 过 多种 O A 工具对 图书馆数据仓库 中的数据进行多维分 析 、 LP 汇总 , 形 成 图表或报 表的形式 , 使管理者可以清晰 、 直观地看到分析结果 。这正 是图书馆 数据仓库 系统所要达 到的 目的。 数据仓库中有大量的数据 , 也蕴藏着一些潜在 的规则 和知识 , 这些 规则和知识通 过传统 的分析方法很难被 发现 , 数据挖 掘技术为解决 这 问题提供了一种策略 。数据挖掘发现 的知识可 以直接用 于指导联机
告。 1图 书馆 数据 仓 库 的特 点 . 11面 向 主 题 .
图书馆 数据仓 库能 够根据 图书馆用 户 的主题需 求组织 和提供 数 据, 普通 的图书馆管理 信息系统 只能按 照图书馆用 户的应用组织 和提 供数据 。面向主题 的特 征则赋予 了图书馆用户更 广泛的权利 , 可按 图 书馆用户 自己的意愿查询和处理信息。 1 . 数 据 源 2多 由于要 对图书馆历 史信息进行管 理 , 以要 涉及多个 图书馆信息 所 系统 和多个 图书馆数据库 并需要 收集 和组织这些分散的 、 跨平 台的、 异 构 的 图书 馆 数 据 。 2图 书 馆 数 据 仓 库 的 体 系 架构 . 图书数据仓 库系统 框架 主要 由数据源层 、 数据 获取 引擎 、 据仓 数 库、 分析工具及用户分析五大模块组成 , 其结构如图 1 所示
科 技信 窟
专题 论述
基 于 数据 仓 库 技 术的 国书 管 理 信 息 系统 硼 究
云 南财 经大 学信 息学 院 李春 宏
[ 摘 要] 文对图书馆数据仓库 系统进行 了分析 、 本 建模 和设计 , 将数据仓 库技 术用 于图书信 息管理 中, 克服 了传统 图书管理信息 系 统的不足 , 图书馆 管理信 息 系统具有 更高的效率和使 用价值。 使 [ 关键词 ] 数据仓库 联机分析处理 维度 目前 , 随着图书馆规模的扩大 , 各类 图书馆藏书信息 已形成 了规模 巨大 的数据 库 , 对于 图书管 理人员来说 , 要更加准确地 掌握各类型 、 需 各学科 图书的流通借 阅及 收藏信息 , 出版社提供 的新 书到馆信息及使 用信息等 ; 同时 , 图书馆 自动化进一步发展 的趋势是开发 图书馆数 据仓 库, 图书馆数 据仓库 可以为 管理者提供 决策 分析 、 势分析 和预测 报 趋
相关文档
最新文档