数字化图书馆解决的方案V1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字化图书馆解决方案
1 图书馆信息化概述
目前在Internet和信息技术的不断发展时代,对高等院校的教学与管理带来了深远的影响,网络远程教学、多媒体应用、数据查阅、信息管理等应用已经成为高校教学与科研重要的一环,并逐步与学校的教学、服务与科研融为一体。高校校园网建设、网络中心的规模与数字图书馆已经成为全面衡量高等学校信息化水平的三项重要的指标。图书馆除向全校师生提供教学、科研以及数字化信息服务外,还面向社会为众多单位提供培训及咨询服务。随着计算机应用的发展,图书馆服务器和数据量急速增加,管理的复杂程度越来越大。
数字化图书馆是一种运行在高速宽带网络上的、可跨库检索的海量数字化信息资源库群,对有价值的图像、文本、语音、影像、影视、软件和科学数据等多媒体信息进行收集,进行数字化加工、存储和管理,实施知识增值,并提供基于网络的电子存取服务。
数字图书馆在本质上就是一个集数据库应用平台、信息资源电子商务平台与资源数字化加工服务平台于一体的巨大数据仓库,以互联网为平台,面向高校内部广大师生和外部互联网用户提供基于内容的服务。作为图书馆发展的方向,数字图书馆应以统一的标准和规范为基础、以数字化的各种信息为底层、以分布式海量资源库群为支撑、以智能检索技术为手段、以电子商务为管理方式,以宽带高速网络为传输通道,将丰富多彩的多媒体信息及时的传递给用户。
2 图书馆系统概述
数字图书馆系统是一个基于Internet/Intranet分布式环境、能够针对用户的需要提供信息服务的分布式海量信息系统,其基本功能包括:
1.提供用户交互式信息浏览、查询,具有基于内容和知识的检索引擎。
2.支持连续媒体的网络传输,数字化图书馆所支持的数据类型包括具有
时间基的连续媒体信息;支持多媒体信息流的同步和集成,建立先进的同步模型和同步机制保证静态信息流的空间同步和动态信息流间的时间同步。
3.建立通用、标准和规范的数字化图书馆系统结构模型,提供数字化图
书馆系统有效的资源管理和控制功能。
4.支持动态服务质量(QoS)管理机制,系统可以根据用户请求、系统检
测和资源均衡需求,动态地调整用户端的QoS参数。
5.数字化图书馆系统的中心服务器和媒体服务器应该具有可伸缩的体系
结构,根据资源的使用情况,采用适当的负载平衡策略,把信息存取和网络传输的负载均衡到相应的机群中,同时,系统具有信息存储和网络带宽的可扩展性。
6.系统具有透明性,信息的重组在一定条件下是可见的,但是对用户是
透明的。
7.系统具有可移植性,具有可运行特征的媒体信息在不同的运行环境下
都可以再现
图书馆的主要组成部分:
1.图书馆管理系统
2.数据库
3.电子期刊库
4.电子图书库
5.硕博论文库
6.自建数据库:论文、期刊、图书、声像、教参等等
7.音视频资源管理系统
8.网络接入认证系统
9.门户网站
10.博客服务
11.论坛服务
12.FTP系统
13.等等
因此,可以说建设数字图书馆的关键技术在于存储系统,一个良好的存储系统解决方案应能适应图书数据的海量存储和不断增长,同时能够满足当今网络环境复杂性和扩展性的不断提高。
这样的目标无疑对存储系统的要求很高,既要求高可用性、高可靠度和大容量,还需要低成本和易安装管理。
3 图书馆信息系统需求分析
数字化图书馆就是将图书馆文献信息数字化,并利用计算机技术储存、查询和发布,以满足当地或远程读者对文本、图像、声音等不同种类的信息需求。
数字图书馆的显著特点就是:
各种信息(文献,期刊,图书,报纸,论文,音乐,视频等)的数字化;
海量数据的存储和管理;
对数据的有效访问和查询;
数字化资料在网上发布和传递。数字化图书馆的开发与建立是计算机、通信和网络技术、海量存储技术以及多媒体技术有机结合的产物,并且还引进了大量数据库技术及概念。
图书馆存储系统需要存储以下内容的数据信息:
1.数据库:一般采用MS SQL和Oracle数据库,数据量不大,一般在
几GB以内,且数据增量不大。
2.电子图书:以文本文件存储和读取为主,文件大小一般为
32KB--64MB,存在形式为静态,容量增长小于5%每年;
3.视频资料信息:包括电影资料的VCD/DVD形式,MPEG2/4形式,以大
文件形式存储,流媒体读取为主.文件大小一般为80MB --5GB;
4.电子期刊:以文本文件存储和读取为主,文件大小一般为
32KB--64MB,存在形式为动态增长,增长速度为线性定值;
5.其他电子信息资料:包括音频资料,硕博论文,自建资源库,教参
等等,以文件方式存储,以流媒体或文件方式读取,文件大小一般
为32KB--40MB
在图书馆中,数据库的管理和操作是最核心的问题,所有的电子图书、期刊和多媒体数据全部存放在大容量存储系统中,存储系统是整个数字图书馆的支撑点。
根据图书馆中数据的特点来分析数字图书馆的数据应用特点,数字图书馆大致可划分为以下两种类型的数据:
1.数据库类型数据:
图书馆管理系统和外购商用软件系统以及自建系统的数据库。
需要提供高速数据检索和查询服务,数据访问速度要求高。
需要提供7*24小时高可靠运行
2.文件型数据:
包括电子图书,期刊,论文,自建数据资源,影视频资料文件等等。
需要提供大容量数据存储空间。
大量数据处于静止状态,少部分数据在相应时间内处于活跃状态。
数据访问速度一般没有严格要求。
随着图书馆数字化进程的逐步深入,图书馆的应用系统越来越多,环境也变得越来越复杂,这无形中增加了图书馆管理人员管理系统的难度。同时,随着应用系统的不断增加,数据也相应大量增长,这就给原有的存储系统提出了更高的要求。
平滑的提供更大的存储空间
提供更快的响应速度
提供更大的数据吞吐能力
总体来讲,图书馆信息化的关注点在于:
如何满足业务连续性要求
⏹关键系统高性能
⏹关键服务不停顿
⏹关键数据不丢失
如何解决数据容量迅速增长带来的成本、管理等问题