图书馆数字资源

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浅谈图书馆数字资源的采集与整合

【摘要】数字出版和网络出版方兴未艾,在数字图书馆建设已开始走向服务得今天,无论是商业型数字资源还是开放存取型数字资源都呈现了海量增长的趋势。本文就图书馆如何能够在海量的数字资源中进行采集与整合浅谈了一些看法。

【关键词】采集原则

采集模式采集系统整合模式

数字资源是海量的,理论上一个图书馆可以收集所有的数字资源,但图书馆应该根据自己的任务和服务对象等因素,制定适合自身的数字资源发展政策,确立采集原则、采集模式、采集系统。

一、采集

1、资源的采集原则

(1)对性原则。根据图书馆的性质、任务和特点,针对不同的专题,确定信息的采集方针、明确采集的类型、范围和采集的深度。

(2)统性原则。在网络环境下,应注意掌握和发挥印刷型文献、电子文献和网络信息资源的特点和优势互补、协调发展,从而形成连续系统、完整的数字资源系统,为学术研究人员提供系统、便捷的服务。

(3)靠性与权威性原则。网络信息资源杂乱无序,资源的来源渠道也很复杂,为了避免不可靠的和重复的信息,应从提供者的信誉、机构的性质与规模等方面来考虑,选择权威性和可信度高的网站。

(4)准化原则。在网络环境下,各用户或机构已不再是独立体,而是整个信息网络中的一个节点,各个节点间的信息资源共享实现建立在信息资源建设的统一的标准和规范的基础上。

(5)术性原则。数字资源种类繁多,实现途径多样化,其主要目的是为了进行学术方面的信息传播与交流,实现学术信息资源共享,因此,在数字资源的选取和利用上,应确定数字资源所属的学科范围,通过质量控制选取有学术价值、有深度、反映学科前沿发展水平的科学学术资源,同时应通过同行评审机制确保信息资源质量和学术价值。

(6)益原则。资源的保存最后是为了开发利用,使信息资源建设发挥出最大的使用效益,数字资源模式应根据用户的不同需求对资源进行分类和补充,通过开发相关的技术,最大限度的提高资源的使用效益。

2、数字资源的采集模式

数字资源机构库的资源既包括一次文献的(对象数据)也包括与之对应的二次文献(元数据),图书馆对数字资源的收集将更多的集中在元数据的收集。由于数字资源信息单元多元化的特征,图书馆对信息进行评估和选择将成为图书馆员的工作。图书馆代理用户选择行为将在“库”的层级上展开,采集数字资源信息时应重视收集行的效率和收集范围的全面。采集模式至少包括3种。

(1)在国家层面进行集中的元数据采集,构建国家级数字资源的

元数据总库,然后主题型或其他类型的服务提供者从国家元数据总库采集元数据或进行联机跨库检索。这种模式比较符合我国国情和数字资源的具体要求。技术上也比较容易实现。建立一个国家级数字资源元数据总库,将保障元数据最大限度的一致性,减少重复性工作。

(2)主题型服务提供者执行基于学科的元数据采集任务,然后作为内容提供者为国家数字资源元数据总库进行采集。

(3)按照资源类型(比如期刊论文,预印本,学位论文和技术报告等)由专门的代理机构进行元数据采集,然后作为内容提供者为国家元数据总库采集数据。目前我国主题型服务提供者和专门资源类型的机构还不存在,因此我国有必要建立一套开放存取资源元数据的国家级的集中的自动化采集机制和系统。并在元数据集成的基础上实现元数据的二次采集。

3、采集系统

目前信息资源的采集系统有手工和自动两种方法,手工采集即手工选择几百个网址和选定一个存储得频率;自动采集是使用机械手爬虫程序来管理网络文献,它定期运行一种爬行程序,把“爬”过的信息资源的每一页都抓到服务器上,并且自动管理。数字资源的采集最好采用自动爬行和手工采集相结合的方式。采用自动内容爬行的方法能尽可能迅速收集到网络上巨大规模的信息资源,对于那些不能用自动方法得到的深层次网络并且具有极高价值的开放存

取信息资源内容,应采取手工采集管理方式作为补充。

二、整合

1、图书馆数字资源整合势在必行

(1)从数字资源内容上看,存在以下问题:一是内容交叉、重复。不同数字资源系统之间存在内容交叉、重复的信息,影响用户对信息的选择与获取。二是存在冗余信息、多数数据库资源收录原则是“全”使得大量使用价值不高的信息进入资源系统,干扰用户对信息的获取。三是知识关联程度低。人类知识是一个紧密联系的有机整体,而现有数据库资源系统内的的数据对象大都是孤立存在的,无法体现学科知识的内在联系。四是不宜获取全文。目前数字资源系统大多为题录型数据库,二次数字资源和一次数字资源间缺少链接关系。用户难以获取全文。

(2)从技术角度看,不同的数字资源系统有着不同的编码结构和表达方式,格式的不同导致描述和组织标准的差异,导致检索途径和方法的不同,不同数据库使用不同的检索软件,使得数据库网检索界面也风格各异,迥然不同,具有差异性和复杂性。

综上,从某种意义上讲,数字资源数量越大,给用户造成的负担也就越重,在这种情况下,如果不对数字资源进行合理有效的整合,必然会使用户陷于不得门径而入的困惑境地,影响着数字资源的有效利用。

2、图书馆数字资源的整合模式

数字资源的整合应包括数字资源系统建设、数字资源关联、跨库跨平台检索、保障技术提升四个层面的内容。其中建设是基础,关联、跨库检索是整合的主体内容,保障技术提升是完善。下面谈一下关于数字资源的整合模式。

(1)以书目管理系统opac为平台,以书目数据库为基础整合其他数字资源。这种模式是将各类数字资源的元数据信息导入opac书目库,对象数据(如文献的正文、图像、音频、视频等)合理规划,或是用其它数字资源建设系统平台生成各种类型的对象数据库。opac在图书馆数据库中发展时间长,mark格式相当成熟,规范性好,数据库质量高,因此这种模式在理论上有一定的优势。但这种模式基于书目信息管理系统。对其它信息特别是多媒体信息描述还不尽如意,对大量信息的管理困难,发布不灵活,原有系统的内部结构体系及实现技术又局限了它升级……这些因素决定它并不合

适用来对多媒体等大容量信息进行建库。(2)以先进的数字资源建设系统为平台实现多库无缝检索及库间数据关联。目前,许多图书馆引进了数字资源加工系统进行特色数字资源建设,这类系统平台最好的是国家图书馆(中数图)数字资源采集、加工、管理、检索、整合系列系统。这类系统是面向对象数据。在处理信息的种类及容量方面较opac有很大的优越性,另外这类系统的检索功能更强大,更灵活,能实现全文检索、二次检索、关联检索等,建库灵活多样,能个性发布。它功能齐全、处理信息种类多,能很好的实现无缝跨

相关文档
最新文档