基于云计算的数字图书馆
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
广东技术师范学院学报(自然科学)
2012年第2期Journal of Guangdong Polytechnic Normal University No .2,2012
基于云计算的数字图书馆研究
李楚贞吴新玲
(广东技术师范学院,广东广州510665)
摘
要:介绍了云计算和数字图书馆的基本概念,在揭示目前数字图书馆存在的问题基础上,结合云计算理念
及特点,论述了云计算环境下数字图书馆所具有的优势,并提出了数字图书馆新的云服务平台,探讨了数字图书馆云服务模式、云组成及其架构,旨在为数字图书馆信息资源共建共享提供更有效的解决方案.
关键词:云计算;数字图书馆;云服务平台;架构中图分类号:TU 958
文献标识码:A
文章编号:1672-402X (2012)02-0098-04
收稿日期:2012-02-20
作者简介:李楚贞(1989-),女,广东潮州人,广东技术师范学院硕士研究生.研究方向:信息系统工程.
吴新玲(1963-),女,湖北宜昌人,广东技术师范学院计算机科学学院教授,硕士生导师.研究方向:数据仓库与数据挖掘技术、机器学习等.
0引言
随着计算机及网络技术的高速发展,图书馆作为学校最为重要的信息服务机构已由传统图书馆发展为数字图书馆,且在经历了互联网时代、Web 时代、网格时代、Web2.0时代后取得了很大的进步,在很大程度上满足了读者的需求,但一系列的问题也随着出现了:各校图书资源重复建设、建设资金不足、读者数量剧增、信息资源呈海量级增长且表现形式丰富多样、现有设备及技术滞后等等,这些都严重影响到数字图书馆的进一步发展.在这种背景下,图书馆如何提供满足用户的个性化服务需求,提高资源利用率就成为图书馆急需解决的问题.
本文在参考已有文献的情况下,提出了一种新的基于云计算环境下的数字图书馆服务平台架构,旨在为数字图书馆信息资源共建共享提供解决方案.
1云图书馆相关知识
1.1云计算概念
云计算作为一种新型的服务计算模型,是并行计算、分布式计算和网格计算的融合与发展,是IT 产业继PC 、互联网之后的第三次革新浪潮,是业界、学术界的热点名词与技术之一.目前,各IT 巨头,如
Google 、Amazon 、IBM 、微软等都已经参与到云计算的研究和开发中,但其定义仍众说纷纭.本质上,云计算是指用户终端使用简易的设备如PC 、手机、PDA
等通过互联网轻松地获取存储、计算、数据库、服务器等计算资源.其中,这些计算资源是由成千上万服务器组成的“云”端提供的,它们在用户看来是透明的且可以无限扩展.云计算结合了虚拟化、分布存储、海量数据管理等技术,利用互联网将分散的、动态的、异构的信息资源和计算能力有效整合起来,供用户方便地访问与使用,实现按需伸缩、按需使用、按需付费,达到高效率低成本的目的.云计算具有价格低廉、规模大、数据存储安全、数据共享、虚拟化等特点.
1.2数字图书馆
数字图书馆是伴随着信息技术、网络技术和数据库技术而出现的产物.它通过数字技术来处理各种类型的资源,从而形成了图文并茂的图书馆.它是基于B/S 结构为用户提供信息服务.用户可以在网络环境下,不受时间和空间的限制,方便快捷地访问它并获取信息.
2基于云计算的数字图书馆的优势
针对以上问题,数字图书馆迫切需要寻找一种新的建设方案来解决这些问题.云计算技术的出现为其提供了有利的条件.目前,云计算在图书馆领域
中的典型应用实例主要有:OCLC推出的第一个基于云计算技术的WorldCat书目数据的Web级协作型图书馆管理服务和美国国会图书馆与DuraSpace公司合作的DuraCloud项目等.
传统的数字图书馆是以互联网为基础提供服务的,而基于云计算的数字图书馆在利用互联网的基础上结合了云计算技术,把云计算作为后台,在各种云服务的支持下,几乎把所有数据和计算能力都搬到了“云”端的服务器集群上.如果用户想要获取图书馆资源,只需登录云图书馆门户网站,把请求发送到“云”端,云端再对其进行操作计算,最后把结果传送到客户端.
结合云计算的理念和特点,基于云计算的数字图书馆具有以下几个优势:
2.1提供海量的信息资源存储能力
云计算模式下的数字图书馆其数据不再是存储在本馆服务器上,而是把所有资源都搬到“云”端.“云”端是由上百万的计算机组成的,通过虚拟化技术可以将物理资源如网络、服务器、数据库之间的差异性进行屏蔽,形成一个统一资源池,从而为海量的信息资源存储提供了解决的途径.同时,云计算的资源可扩展性使用户可以动态部署、动态调度资源.当所需的存储容量很大时,只需向云端申请更多存储服务并付费即可.
2.2保证数据的安全
数字图书馆拥有庞大的信息资源,如果放置这些信息的数据库服务器被黑客恶意攻击或病毒侵扰,后果是不堪设想的.而基于云计算的数字图书馆使人们避免了这一问题.因为云图书馆采用数据多副本容错,且“云”端有无数服务器.即使其中有一台服务器出现问题,也可以将其备份的数据在极短时间内快速拷贝到其它服务器中,并启动该服务器来提供服务,这样就可以避免了因服务器出错而导致资源丢失的现象,真正确保数字图书馆服务的安全性.
2.3数据高度共享
传统的数字图书馆在共享方面受到一些限制:只能在一些相同的数据接口,相同的数据标准的图书馆间进行共享,而不同规模不同类型的图书馆就不行.但是我国人口众多,地域辽阔,地区贫富差距大,导致发达地区图书馆出现资源浪费,贫困地区出现资源缺乏,所以,为了有效利用图书馆资源,提高资源共享率,各校图书馆应共同构建共享的平台以提供统一的服务.基于云计算环境下的数字图书馆就可以利用虚拟化技术、集群技术等把分散的图书馆系统连接起来,形成一个信息资源共建共享平台,使用户终端可以通过互联网随时随地获取其他图书馆资源.
2.4降低数字图书馆的建设和维护费用
传统的数字图书馆需要图书馆员经常对馆内的计算机、服务器等终端设备进行维护、升级和更新才能正常稳定地运行,且长久以来各校图书馆资源相互孤立、重复建设,这造成图书馆建设资金不足及严重的浪费.而云计算模式下的数字图书馆由于云计算具有高度共享的特点,大大提高资源的利用率,此外,因为云端的资源高度集中且具有灵活可扩展性,所以学校图书馆无需负担日益高昂的数据中心管理成本,也不再需要购买大量的基础设施,只需较少的费用动态租赁云计算的各种服务即可.当需要更多的服务或服务不再需要时,只需向云端发出请求即可.另外,设备的日常维护也是由云服务提供商完成的,这样图书馆人员工作强度就会大大降低,从而有更多时间投入到资源的建设与服务.
2.5提供个性化的用户服务
数字图书馆服务的对象主要是学生、老师.针对这些读者,图书馆应能根据读者需求搜索出专而深的知识,但目前搜索引擎仍存在一定的弊端:读者能否找到合适的资源,在很多程度上取决于读者所提供的检索词,但很多时候读者并不能准确地提供检索词,这样读者就要耗费了大量的时间去阅读一些不相关的信息,而且,即使能够提供准确的检索词,读者也要花大量的时间去分辨许多检索结果的好坏.而基于云计算的数字图书馆,其最终目标是建立起完全满足用户需求的图书馆,实现以资源为中心向以用户为中心的转变,真正达到信息资源的共建共享.云图书馆可以在保证隐私的情况下,通过引入数据挖掘技术,对读者的浏览路径进行挖掘得出其访问习惯,从而为其下次访问提供相关的推荐,实现提供高质量信息,用户个性化服务的目的.
3数字图书馆云服务平台
3.1数字图书馆云服务模式
数字图书馆云服务平台是一个大型的数字图书馆计算机群,它把众多的数字图书馆整合到一个统一平台上,通过统一的界面,提供“一站式”服务,使用户能够根据需求快速获取资源.与传统的B/S架构数字图书馆类似,云模式下的数字图书馆,用户通过
各种设备访问云图书馆门户网站,发出请求服务,该请求经过分析处理发送到数字图书馆节点平台上,节点平台根据用户需求对数据库进行操作,获取用户需求信息,并将结果返回给用户.图3-1为数字图书馆云服务模式示意图.
3.2数字图书馆云服务平台的云组成
数字图书馆的核心是数字资源,考虑到数据安全问题,云图书馆不能把所有资源都放在“云”端,对于涉及到保密性的资源,如读者资源、流通数据等就不能直接放在公有云里.因此,基于云计算的数字图书馆模式不能完全推翻图书馆现有的数据部署模式,而是在保留原有模式的基础上,使现有的部署模式与新的模式进行融合,通过研究确定哪些资源可以放在公有云上,哪些应该放在本地计算机,即私有云上.鉴于此,构建基于云计算的数字图书馆中的“云”应包括3种部署模式,从上到下分别是公有云、区域云、私有云.
3.3数字图书馆云服务平台的架构
本文在参考已有文献的基础上,提出了新的数字图书馆云服务平台架构.从最上层到最底层分别是访问层、接口层、管理层、业务层、平台层、基础设施层,其中,每一层都为上一层提供“透明”的服务.图如下所示:
下面对云服务平台架构进行详细的说明:
3.3.1访问层
访问层为用户提供统一的登录/退出接口,任何一个授权用户都可以通过登录数字图书馆云服务平台门户网站进入云服务平台,享受云图书馆的在线服务.由于所有软件都运行在云上,所以用户只需使用一台PC 、手机或PDA 和一个浏览器便可在任何时间任何地点使用各种服务,享受云计算提供的海
量存储和无限的计算能力.针对不同类型的用户,其具体的服务目录将有所不同:机构用户享有图书采购、图书编目、图书管理、借阅管理、图书计费等服务;而个人用户享有图书检索、图书借阅、图书预定、动态跟踪、学术交流等服务.这些用户都可以从服务目录中选择需要使用的服务,也可以通过订阅管理来查阅自己订阅的服务,或终止订阅的服务,从而实现用户的自我管理.
3.3.2接口层
接口层为云图书馆各种服务提供访问接口,其接口可以是传统的图形用户接口(GUI)或基于Web 的接口.用户不需要改变客户端的运行环境.在保持各图书馆特色的同时,也通过接口的标准化,向用户提供统一的云图书馆开放接口服务.
3.3.3管理层
管理层提供了对所有层次的管理功能.具体有安全管理、资源管理、服务目录管理、服务使用计量、服务质量管理、部署管理、服务监控.其中,安全管理保障云图书馆的整体安全,如授权控制、用户认证、安全审计等;服务目录管理提供访问层的服务目录管理功能,管理员可以增加或删除服务;部署管理则
图1
数字图书馆云服务模式示意图
图2
云图书馆云服务平台的架构
提供对用户发起的业务请求进行部署和配置,当用户通过访问层中的订阅管理增加新的服务订阅后,部署管理模块就会自动为用户启动服务实例.
3.3.4业务层
日常的业务都集中在这一层中,主要的业务包括文献采购、文献编目、文献流通、馆际互借、书目查询、参考咨询、图书信息发布、动态信息发布等.在这一层中可以具体根据图书馆所需的实际业务服务动态部署与配置,从而保证云图书馆服务的稳定性、易维护性和弹性.
3.3.5平台层
平台层构建在基础设施层之上,为用户提供对基础设施层服务即IaaS服务的封装,提供的服务主要有数据库服务和中间件服务.数据库服务为用户提供了可扩展的数据库处理能力,包括数据调度、数据分发、数据删除、数据加密备份、数据安全等.而中间件是实现云计算的基础.它支持多个通信和数据访问协议,相连接的计算机或数据库,即使它们具有不同的接口,只要通过中间件其就能相互交换信息,这样就可以解决图书馆间因接口不同而不能共享的问题.常见的中间件有消息中间件、事务处理中间件等.
3.3.6基础设施层
基础设施层是整个平台的物理基础,它决定数字图书馆服务实现的范围与能力.它由两个子层构成:物理资源子层和虚拟资源子层.其中,物理资源子层是由各种真实的物理硬件组成,主要包括计算机、服务器、存储器、数据库、网络设备等.虚拟资源子层则是建立在物理资源子层之上,在该层,通过虚拟化技术如XEN、Vmware对物理资源子层上的硬件设备进行封装隐藏,对外提供统一逻辑接口,从而屏蔽硬件设备的动态性、分布性和异构性,再通过网络把各种类型的虚拟资源统一起来形成一个巨大的虚拟资源池,为上层提供计算、存储、网络等资源.同时,也利用了计算机集群技术,对分散的节点云图书馆进行统一调度管理,虚拟出一个统一的云计算服务平台,可以不断增加新的节点平台,或删除不必要的节点平台,以实现数字图书馆云服务平台的优化配置,满足用户日益增长的信息需求与服务.由于基础设施层是由大量的服务器组成,所以具有很强的逻辑运算功能和较高的运算速度.
4结束语
基于云计算的数字图书馆有效地整合了各学校现有的数字资源,提高了资源共享性和利用率.尽管目前云图书馆的建设面临着很多问题,但相信随着图书馆界对云计算技术的关注以及云计算和云安全技术的日趋成熟与完善,数字图书馆将会有更好的发展,其核心价值即资源的建设与服务将得到真正的体现.今后的工作将实现基于云计算的数字图书馆系统,并把它应用到实践中.
参考文献:
[1]李培.数字图书馆原理及应用[M].北京:高等教育出版社,2004.
[2]胡新平.云图书馆构想[J].情报理论与探索,2010.
[3]王静一.基于云计算技术的数字图书馆云服务平台架构研究[D].吉林大学硕士学位论文,2011.
[4]雷万云等.云计算技术、平台及应用案例[M].北京:清华大学出版社,2011.
[5]周波.基于云计算的图书馆服务模式研究[J].现代情报,2010,30(10).
[6]蒋丽艳.基于云计算的图书馆信息平台的构建[J].现代情报,2011.8.
[7]王文清,陈凌.CALLS数字图书馆云服务平台模型[J].大学图书馆学报,2009,(4).
[8]刘炜.图书馆需要一朵怎样的“云”[J].大学图书馆学报, 2009,(4).
[9]王红.“云图书馆”平台的架构与实现[J].情报理论与实践,2010,33(10).
[10]高晓燕.云计算在图书馆中的应用探究.高校图书情报论坛,2010,9(2).。