数字化图书馆案例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字化图书馆解决方案
图书馆系统概述
数字图书馆系统是一个基于Internet/Intranet分布式环境、能够针对用户的需要提供信息服务的分布式海量信息系统,其基本功能包括:
1.提供用户交互式信息浏览、查询,具有基于内容和知识的检索引擎。
2.支持连续媒体的网络传输,数字化图书馆所支持的数据类型包括具有
时间基的连续媒体信息;支持多媒体信息流的同步和集成,建立先进
的同步模型和同步机制保证静态信息流的空间同步和动态信息流间的
时间同步。
3.建立通用、标准和规范的数字化图书馆系统结构模型,提供数字化图
书馆系统有效的资源管理和控制功能。
4.支持动态服务质量(QoS)管理机制,系统可以根据用户请求、系统检
测和资源均衡需求,动态地调整用户端的QoS参数。
5.数字化图书馆系统的中心服务器和媒体服务器应该具有可伸缩的体系
结构,根据资源的使用情况,采用适当的负载平衡策略,把信息存取
和网络传输的负载均衡到相应的机群中,同时,系统具有信息存储和
网络带宽的可扩展性。
6.系统具有透明性,信息的重组在一定条件下是可见的,但是对用户是
透明的。
7.系统具有可移植性,具有可运行特征的媒体信息在不同的运行环境下
都可以再现
图书馆的主要组成部分:
1.图书馆管理系统
2.数据库
3.电子期刊库
4.电子图书库
5.硕博论文库
6.自建数据库:论文、期刊、图书、声像、教参等等
7.音视频资源管理系统
8.网络接入认证系统
9.门户网站
10.博客服务
11.论坛服务
12.FTP系统
13.等等
因此,可以说建设数字图书馆的关键技术在于存储系统,一个良好的存储系统解决方案应能适应图书数据的海量存储和不断增长,同时能够满足当今网络环境复杂性和扩展性的不断提高。
这样的目标无疑对存储系统的要求很高,既要求高可用性、高可靠度和大容量,还需要低成本和易安装管理。
3 图书馆信息系统需求分析
数字化图书馆就是将图书馆文献信息数字化,并利用计算机技术储存、查询和发布,以满足当地或远程读者对文本、图像、声音等不同种类的信息需求。
数字图书馆的显著特点就是:
各种信息(文献,期刊,图书,报纸,论文,音乐,视频等)的数字化;
海量数据的存储和管理;
对数据的有效访问和查询;
数字化资料在网上发布和传递。数字化图书馆的开发与建立是计算机、通信和网络技术、海量存储技术以及多媒体技术有机结合的产物,并且还引进了大量
数据库技术及概念。
图书馆存储系统需要存储以下内容的数据信息:
1.数据库:一般采用MS SQL和Oracle数据库,数据量不大,一般
在几GB以内,且数据增量不大。
2.电子图书:以文本文件存储和读取为主,文件大小一般为
32KB--64MB,存在形式为静态,容量增长小于5%每年;
3.视频资料信息:包括电影资料的VCD/DVD形式,MPEG2/4形式,以
大文件形式存储,流媒体读取为主.文件大小一般为80MB --5GB;
4.电子期刊:以文本文件存储和读取为主,文件大小一般为
32KB--64MB,存在形式为动态增长,增长速度为线性定值;
5.其他电子信息资料:包括音频资料,硕博论文,自建资源库,教参
等等,以文件方式存储,以流媒体或文件方式读取,文件大小一般
为32KB--40MB
在图书馆中,数据库的管理和操作是最核心的问题,所有的电子图书、期刊和多媒体数据全部存放在大容量存储系统中,存储系统是整个数字图书馆的支撑点。
根据图书馆中数据的特点来分析数字图书馆的数据应用特点,数字图书馆大致可划分为以下两种类型的数据:
1.数据库类型数据:
图书馆管理系统和外购商用软件系统以及自建系统的数据库。
需要提供高速数据检索和查询服务,数据访问速度要求高。
需要提供7*24小时高可靠运行
2.文件型数据:
包括电子图书,期刊,论文,自建数据资源,影视频资料文件等等。
需要提供大容量数据存储空间。
大量数据处于静止状态,少部分数据在相应时间内处于活跃状态。
数据访问速度一般没有严格要求。
随着图书馆数字化进程的逐步深入,图书馆的应用系统越来越多,环境也变得越来越复杂,这无形中增加了图书馆管理人员管理系统的难度。同时,随着应用系统的不断增加,数据也相应大量增长,这就给原有的存储系统提出了更高的要求。
平滑的提供更大的存储空间
提供更快的响应速度
提供更大的数据吞吐能力
图书馆信息系统推荐方案
设备选型原则
存储系统是数字图书馆的核心基础,其性能的优劣,质量的好坏,对全局的影响关系重大。在存储系统平台的选型上应充分考虑系统应用的水平和数据处理数据量的大小,综合总体系统设计的方针,予以慎重选择。
在选择存储平台时,要考虑的因素很多,需要根据实际情况决定,一般来讲,以下特性是必须要考虑的:
存储系统的IO性能
系统未来的可扩展性
存储系统的高可用性
存储系统对各种服务器操作系统的兼容性与标准
系统管理员的可维护性
方案综述
数字图书馆中需要存储的数字资源大致分为以下几类:
图书馆管理系统数据库
图书馆购买的各类商业软件的数据库
图书馆购买的各类电子化的图书和期刊数据
图书馆自建资源库
根据对图书馆信息化系统的需求分析,可以总结出图书馆核心应用的特点如下: 数据库:是整个图书馆业务系统的核心
–数据类型:数据库(SQL, Oracle等)
–性能要求:同时访问人数较多,并发性能要求较高
–可用性要求:不能停机
–数据量:几百MB到几个GB
图书馆应用系统数据:
–数据类型:文件(文本,图像,音视频)
–性能要求:同时访问人数较少,但传输数据量大,带宽要求高
–可用性要求:不能停机
–数据量:很大且增长很快,从几TB到几十TB
根据性能和可用性的分析,可以得出相应推荐的存储系统架构如下: