大数据时代的高校图书馆建设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据时代的高校图书馆建设
摘要:目前IT界的新一研究热点是大数据。大数据是一种新的信息处理技术,同时也是社会其他领域数据使用所关注的热点。高校数字图书馆的建设同样需要对大数据的存储和利用。本文结合图书馆在大数据时代的实际需求和高校图书馆数字资源建设情况,总结出高校数字图书馆建设中的数据存储、数据处理和数据分析的方法。以期待更新并扩大高校图书馆的智力资源、提升高校图书馆的知识服务能量。
关键词:大数据高校图书馆信息服务
1 大数据的起源和发展
“大数据”概念是由麦肯锡咨询公司最早提出,随之引发各个行业对大数据的研究热潮。学者们认为“大数据”是移动计算、物联网、云计算等一系列新兴技术之后的又一新兴事物。大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。截止到2012年,数据量已经从TB级别跃升到PB、EB 乃至ZB级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49 ZB,2009年的数据量为0.8 ZB,2010年增长为1.2 ZB,2011年的数量更是高达1.82 ZB,相当于全球每人产生200 GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200
PB,全人类历史上说过的所有话的数据量大约是5 EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。
2 图书馆大数据的特征
大数据的特点可以用“4V+1C”分别代表V olume(海量)、Variety(多样化)、Value(价值)、Velocity(快速)以及Complexity(复杂)。
3 高校图书馆在大数据时代的需求分析
3.1 资源管理的需求
图书馆的数据资源日益增大庞大,想要让有序的数据形成有利的知识情报,就必须对数据进行采集、存储、挖掘、分析、管理。高校图书馆必须承担起对数据进行组织并提供使用的中介机构,必须对数据资源进行完整的管理,其中包括提炼过程,和最终实现知识管理的过程。
3.2 服务拓展的需求
图书馆利用大数据深化服务内容,拓展服务种类。第一,通过大数据分析图书馆更加真实地了解用户的心理,读懂用户的潜在需求;第二,大数据分析能顾探求出科研用户的隐形需求,并从庞杂的数据库及网络信息资源中挖掘出更加准确全面的科研资源和热点信息,完成从普通参考咨询服务到主动知识咨询服务的转变。第三,可以利用大数据
进行学科导航、布局MapReduce进行更加快速的检索等。
3.3 面临挑战的需求
用户需求的不断增加给图书馆带来了一个巨大的挑战就是如何将用户吸引到图书馆及其主页上。大数据可以帮助图书馆建立新型知识服务引擎。技术引擎是图书馆信息服务的技术核心,利用大数据技术构建图书馆的新型知识服务引擎,包括资源及学术搜索引擎、资源及服务推荐引擎,知识服务实体行为只能分析引擎、用户知识需求预测引擎等。不断开发、升级、拓展新型服务。
4 大数据时代高校图书馆服务方式
4.1 资源存储
大数据有自己独特的架构,也直接推动了存储的发展。处理大数据需求是一个新的挑战。硬件的发展最终由软件的需求决定。大数据整影响着图书馆数据资源存储基础设施的发展。随着结构化数据和非结构化数据量的增长,以及分析数据来源的多样化,需要存储容量的不断扩大、传输速率地不断提高和计算能力的不断增强。图书馆多采用DAS、NAS和SAN三种传统的存储技术。SAN技术的高性能主要依赖于三个重要的性能支持:存储容量、计算能力和传输能力。在存储性能上,SAN存储系统可以叠加数千TB的磁盘阵列,但是在计算性能上却存在瓶颈。
4.2 云计算作为数据挖掘平台
云计算技术体系分为四层:物理资源层、资源池层、管理中间层和SOA构架层。大数据主要包含数据存储、数据挖掘和数据分析这一过程。云计算可以迅速对大量数据进行部署,而消耗很少的资源和空间。用户常用的数据挖掘和数据分析软件,很容易就能接入云计算平台。基于分布式计算和并行计算的云计算,其分析数据的速度要优于传统服务器布局方式。大数据分析选择云计算因为它的弹性特征能够很好地完成对大容量非结构化数据的可视化分析。
4.3 数据分析
大数据已经不是简单的数据大的事实,只有通过智能、深入的数据分析才能获得有价值的信息。大数据的分析方法有可视化分析、数据挖掘算法分析、预测性分析、语义引擎分析和数据质量管理。,我们可以采用基于分布式系统构架的Hadoop工具进行分析。Hadoop 高效、高扩展、高可靠和高容错的特征,和目前免费的Hadoop版本,这对于资金相对紧缺的图书馆来说是一大利好。
5 结语
大数据技术是高校图书馆未来的发展邢台,也为其实现知识服务管理、服务模式创新提供了思路和方法。尽管大数据在图书馆的研究还在起步阶段,技术亟待成熟。但大数据技术的出现,给图书馆的发展注入了新的生机。需要图书馆和业界人士不断努力探索,共同努力。
参考文献
[1] 孙琳.大数据时代图书馆服务体系创新研究[J].理论观察,2013(4):56-59.
[2] 马晓亭.大数据时代图书馆个性化服务读者隐私保护研究[J].图书馆论坛,2014(2):84-89.
[3] 刘琼.大数据环境下图书馆面临的影响与挑战[J].理论观察,2013(8):112-113.