信息资源建设_第七章--数字信息资源建设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章数字信息资源建设
【本章学习目的与要求】
本章所阐述的是数字信息资源建设的理论与实践,包括电子出版物的采访、数据库建设、网络信息资源建设、数字资源整合等内容。
目的是使学生比较系统地掌握数字信息资源建设的现状、方法与技术。
要求正确理解图书馆数字信息资源的构成,学会应用数字资源建设的原则与方法分析和解决数字信息资源建设中的具体实际问题,如电子出版物采访、数据库建设及资源的整合等。
第一节电子出版物的采访
一、电子出版物的界定及类型
(一)电子出版物的界定
♦新闻出版署《电子出版物管理规定》:“本规定所称电子出版物,是指以数字代码方式将图文声像等信息编辑加工后存储在磁、光、电介质上,通过计算机或者具有类似功能的设备读取使用,用以表达思想、普及知识和积累文化,并可复制发行的大众传播媒体。
”
♦新闻出版署和信息产业部制定《互联网出版管理暂行规定》(自2002年8月1日起施行)对互联网出版的界定:“本规定所称互联网出版,是指互联网信息服务提供者将自己创作或他人创作的作品经过选择和编辑加工,登载在互联网上或者通过互联网发送到用户端,供公众浏览、阅读、使用或者下载的在线传播行为。
其作品主要包括:(一)已正式出版的图书、报纸、期刊、音像制品、电子出版物等出版物内容或者在其他媒体上公开发表的作品;(二)经过编辑加工的文学、艺术和自然科学、社会科学、工程技术等方面的作品。
”
♦本教材的定义:
电子出版物是指以数字代码方式为存储方式,以电、磁、光介质为媒体形态,以多种符号形式(图文声像)记录信息内容,通过计算机或者具有类似功能的设备
读取使用,用以表达思想、普及知识和积累文化,并可复制发行的大众传播媒体。
其主要包括普通电子出版物和网络电子出版物两大类。
(二)电子出版物的类型
1.按电子出版物载体形态划分可分为:①软磁盘:②只读光盘;③交互式光盘;
④照片光盘;⑤集成电路卡。
2.按电子出版物的内容形式划分可分为:①全文型电子出版物。
可提供原始文献的全文检索。
②二次文献型电子出版物。
可以提供原始文献的某些线索或关键性内容,主要供检索用。
③多媒体电子出版物。
3.按电子出版物的源文献类型划分可分为:①汇编型。
指将散列的印刷品收集到一起,经过编排后制作成电子出版物。
②原著型。
是一种以印刷品的原著作为依据制作的电子出版物。
③检索型。
是以印刷型检索工具为依据的电子出版物,一般在出版电子出版物的同时大都出版印刷品。
④电子型。
这种电子出版物是没有印刷品。
二、电子出版物的采访原则
(一)采访原则
1.需求导向原则
图书馆采集电子出版物,必须根据本单位的性质、任务和服务对象的需求,将是否符合本馆的性质与任务、是否符合本馆读者的需要,作为选择入藏电子出版物的基本标准。
2.协调互补原则
采集电子出版物要与采集其他类型文献进行协调,具体要求:
(1)对于学术性强,利用率高,并且是本馆重点服务对象所需要的中外文核心期刊,如果既有印刷型又有电子版的,应两者都订。
对于那些学术性较强,但利用率很低的期刊,可以只订电子版。
而对那些学术性不强,利用率却较高的期刊,则可以只订印刷版,而不订电子版。
(2)对于检索型或工具型的电子出版物,为发挥电子出版物检索功能强大的优势,不再订购印刷版。
(3)对于以印刷品为基础制作、出版的电子出版物,这些电子出版物能够提供更多的研究文献的手段与途径,可以使研究更加深入、更为精确。
因此,对已有原著的电子出版物也要适当地收藏,但要协调好与印刷品复本、版本等问题。
3.成本效益原则
以尽可能小的成本获得尽可能大的效益, 具体要求:
(1)要考虑电子出版物与印刷型文献的价格/信息量比。
(2)对订购印刷型期刊与购买联机检索服务的价格进行比较。
(二)采访中应注意的问题
1.注重对资源的选择与评估
选择与评估的标准:
(1)收录的信息源。
对电子出版物收录的信息的准确与权威性、收录信息的内容范围及年代、深度和广度以及是否符合图书馆性质与任务和用户的需求进行判断。
(2)时效性。
对电子出版物内容新颖程度、获取原文的时滞与更新的周期进行分析。
(3)检索功能与易用方面。
对电子出版物检索手段、检索途径、检索效率、结果输出以及易用性等方面进行考查。
(4)出版制作单位的权威性。
包括出版机构的规模及信誉,生产商、代理商是否可靠,综合实力及历史发展情况,是否进行商业化运作、权威性、客户服务水平、免费试用期、使用培训、后续服务等。
(5)电子出版物的价格。
在综合考查电子出版物的性能与购买形式的基础上,得出最佳价格/性能比。
2.重视电子出版物的试用与推广
数据库高昂的购置费用,决定必须要以充分的读者调研作依据。
在作出采购决策之前,必须对电子出版物进行试用。
可通过图书馆主页、BBS、网上调查表、邮件通告、海报张贴等方式进行试用,并全面收集与分析试用信息。
另外,还应通过举办读者培训、印发资料宣传单、图书馆主页、重点用户的培养与沟通等方式推介电子出版物使用方法。
3.设置组织机构与工作流程
电子出版物在购买渠道、使用方式、存贮空间、推广与维护方面均与传统文献不同,已不适合采用传统文献的采购策略与模式,应该建立新的工作流程与运行机制。
电子资源采购一般涉及到三个部门,即采访部门、读者服务部门与技术部门,而且这三个部门必须紧密合作,可成立专门的机构——电子资源订购组。
三、电子出版物的集团采购模式
电子资源集团采购是指由多个图书馆自愿组成集团,联合采购某种电子资源,共同承担电子资源的购买费用,以最少的经费,获取最优价格、最佳服务和最符合需求的电子资源。
它已成为电子资源尤其是网络数据库的主要购买方式,是图书馆资源共建共享在网络环境下产生的一种新模式。
电子出版物的采访协调,应该从微观和宏观两个层次上进行:
在微观层次上,各图书馆都应该主动与其他馆进行采购协调,能够通过馆际资源共享得到解决的电子出版物,原则上不再进行采集;
在宏观层次上,各级文献信息资源建设的协调组织应该重视协调电子出版物的分工合作采购。
要建立电子出版物联合采购机制。
如可采用集团采购模式。
第二节数据库建设
一、书目数据库建设
■书目数据库是指存储有关主题领域各类文献资料的书目信息,以二次文献的形式报道文献的数据库。
包括题录数据库,文摘数据库、引文数据库、期刊目次数据库以及图书馆馆藏目录数据库等类型。
■书目数据库以简略的形式向用户报道文献的信息,提供查找、获取文献的线索,数据库信息量大、信息密度高、文献范围广、数据的连续性、累积性强,是用户快速查找文献的有效工具。
(一)建库模式
■书目数据库的资料主要来源于各馆的回溯书目数据库和添加的新数据。
回溯书目数据库的建设,又称回溯建库,即将书目信息资源数字化,并采用科学的方法将它们合理组织成相互关联的数据组合,存放在计算机的存贮器中,便于有关软件
的存取,供用户随时在网上查寻利用。
■我国书目数据库建库主要有3种模式,一是自建数据库,二是购买标准书目数据库套录(简称套录),三是套录与自建相结合。
还有较多的图书馆采用联机编目合作建库与业务外包的方式。
1.自建数据库
所谓自建数据库,是指将本馆图书书目数据逐条输入计算机中形成馆藏书目数据库。
2.套录标准源数据
套录标准源数据,简称套录,即是通过对外来数据源进行查对,将符合馆藏记录的数据进行补充、修改,并加注馆藏信息的过程。
3.套录与自建相结合
先通过套录外来数据建库,对于套录不到的图书,采用自建数据库方式。
4.联机编目合作建库
联机编目是指利用计算机和网络环境,由多个图书馆共同编目,合作建立具有统一标准的书刊联合目录数据库,在此基础上实现联机共享编目。
编目业务外包是指图书馆与书商之间通过合约,由图书馆将其编目的整个工作委托给书商代为加工。
(二)提高书目数据库质量的措施
1.严格执行相关标准。
中国文献标准化委员会等部门为维护我国书目信息的标准化和规范化制定了一系列标准,为统一文献著录,处理书目数据,建立较完善的文献报道及检索系统,开展国内外中文信息交流打下了基础。
2.强调对内容附注项的著录。
对于同类书以及一些仅凭书名等其他内容无法判定的图书,内容附注为读者选择图书提供必要的参考依据。
对于没有内容提要的图书,可采用如实著录图书的内容加以解决。
3.加强规范控制。
规范控制是通过查询规范文档来维护文献记录中标目的唯一过程。
目的是保证标目的一致性和唯一性。
4.加强和完善各项分编业务规章制度建设。
为了提高书目数据库建设质量,还应该制订与完善各项业务工作细则。
5.重视数据审核。
图书馆应专门设立审核(校)岗,对标引数据与著录数据及规范文档的选取进行审核。
二、特色数据库建设
特色数据库是指依托馆藏信息资源,针对用户的信息需求,对某一学科或某一专题有利用价值的信息进行收集、分析、评价、处理、存储,并按照一定标准和规范将其数字化,以满足用户个性化需求的信息资源库。
(一)建设现状
目前我国高校图书馆、公共图书馆和科学院图书馆都十分重视创建特色数据库。
以中国高等教育文献保障系统(China Academic Library & Information System,简称CALIS)特色专题数据库为例,全国高校专题特色数据库是CALIS“十五”建设的子项目之一。
遵循“分散建设、统一检索、资源共享”的原则,采取重点支持和择优奖励相结合的资助方式,鼓励具有学科优势和文献资源特色的学校积极参加专题特色数据库的建设,建成一批具有中国特色、地方特色、高等教育特色和资源特色、服务于高校教学科研和国民经济建设、方便实用、技术先进的专题文献数据库。
CALIS资助的特色数据库举例:
敦煌学数据库(兰州大学图书馆)
机器人信息数据库(上海交通大学图书馆)
邮电通信文献数据库(北京邮电大学图书馆)
棉花文献文摘数据库(中国农业大学图书馆)
岩层控制数据库(中国矿业大学图书馆)
石油大学重点学科数据库(石油大学(华东)图书馆)
新型纺织信息库(东华大学图书馆)
有色金属特色数据库(中南工业大学图书馆)
东北亚文献数据库(吉林大学图书馆)
中国工程技术史料数据库(清华大学图书馆)
长江资源数据库(武汉大学图书馆)
巴蜀文化数据库(四川大学图书馆)
利用学校的专业学科特色和资源优势自建特色数据库:
北大名师(北京大学图书馆)
民国书目(北京师范大学图书馆)
中国历代建筑画画作品数据库(天津大学图书馆)
古籍音韵学书目库(吉林大学图书馆)
材料复合新技术门户(武汉理工大学图书馆)
钱伟长特色数据库(上海大学图书馆)
民族风俗数据库(成都大学图书馆)
(二)特色数据库的类型
特色数据库可以划分为以下4种类型:
①根据本校专业重点和馆藏特色建立的数据库,全面搜集各种类型、载体的信息资源,进行整理、加工而成,如“通信电子系统与信息科学数据库”等。
②为本地区经济、文化建设服务而建立的数据库,搜集全国各类资料。
如“巴蜀文化数据库”、“长江资源数据库”、“上海作家作品资料”、“东北亚研究文献数据库”等。
③为抢救濒临湮灭的珍贵史料而建设的数据库,如清华大学图书馆搜集整理有关中国工程技术史文献资料建设的“中国工程技术史料效据库”。
(三)应注意的问题及相关措施
1.宏观调控方面
我国的特色数据库建设缺乏宏观调控,基本上是各自为政、分散发展,一方面图书馆的经费紧缺,同时又在重复建设,造成资源浪费。
所以必须进行宏观调控、统筹规划。
2.标准化与规范化方面
标准化是特色数据库建设质量保证。
数据库运行的可靠性、系统性、连续性、完整性、兼容性有赖于标准化,而且标准化是实现网络信息资源共享的基础。
因此,在数据库建设过程中,必须注意数据的规范化和标准化。
3.检索功能方面
要建立完善的多功能检索系统,提供多种检索途径。
要根据文献信息的内容及形式,选取最能反映其特征及最有可能被利用的检索途径,设置丰富有效的检索点。
4.知识产权方面
应从著作权人的利益和图书馆公众利益两方面综合考虑知识产权问题,协调均衡两者利益。
既要提倡保护著作权人利益,同时也要大力发展数字图书馆。
5.资源的深加工方面
要把特色馆藏开发与个性化服务结合起来,个性化服务包括个性化定制服务、个性化推荐服务、个性化知识决策服务,这三种服务都要通过相应的软件系统来实现。
三、数据库产品或服务的购买
♦购买数据库产品或服务也是数字信息资源建设的重要形式。
♦集团购买是目前购买数据库产品的主要方式。
♦目前集团购买通行的方式有三种:一是图书馆联盟扮演集团采购代理商,获得最优价的电子产品,而后各个馆根据自身需求选择少量购买;二是图书馆联盟代购电子产品,安装到本地服务器上,提供给成员馆拨号或Internet访问;三是由图书馆联盟为成员馆签约获得产品的使用许可,提供网关或成员馆直接访问产品网站,图书馆联盟内成员馆不管规模大小都能提供大范围的核心电子资料检索用户服务。
第三节网络信息资源建设
一、网络信息资源是图书馆信息资源体系的组成部分
在网络环境下图书馆信息资源建设的对象不再局限于传统的文献,而是包括传统的印刷型文献、电子出版物和网络信息在内的涵盖范围较广的信息资源,网络信息资源是图书馆信息资源体系的组成部分。
二、网络信息资源建设的内容和方式
图书馆网络信息资源主要包括:
①文献资源信息:包括馆藏资源和网络虚拟资源;
②辅助检索类信息:指为了方便用户快速找到所需资源而提供的信息服务,如专题资源导航、网上资源链接、虚拟咨询台等;
③一般性信息:指图书馆主页上任何用户都可以获取的内容,如最新消息、本馆介绍、服务一览等。
网络信息资源建设可从两方面进行:
(1)加强各类型网络数据库建设。
对印刷型文献进行数字化处理.将其转化为网络资源,建设各类型网络数据库,如联合目录数据库、全文数据库、特色数据库。
(2)重视虚拟信息资源库建设。
对互联网信息资源进行搜寻、收集、分类、整理,建立虚拟信息库,如建设学科导航库(也有称指引库)及主题资源库。
学科导航库是以学科为单元对Internet上的相关学术资源进行搜集、评价、分类、组织和序化整理,并对其进行简要的内容揭示,建立分类目录式组织体系、动态链接学科资源数据库和检索平台,发布于网上,为用户提供网络学科信息资源导引和检索线索的导航系统。
三、网络信息资源的选择
♦所谓信息选择,是指对大量的原始信息以及经过加工的信息材料进行筛选和判别,有效地剔除其他不需要的信息,选取所需要的信息。
♦要建立网络信息资源保障体系,应该制定特、精、全、省的资源搜集原则。
“特”即要搜集具有特色的网络资源;“精”即要搜集来源可靠、内容先进、背景明确、发布规范的精品资源;“全”即要保证搜集目标的完整性;“省”即要尽可能地利用免费资源。
网络信息资源的选择与评价标准:
①权威性:主要根据网站的性质和知名度来判断。
②可靠性:来自权威性机构的信息基本上是可靠的,而匿名网站发布的信息可靠性较差;
③客观性:注意把握商业网站和有倾向性的网站提供的信息的客观性;
④时效性:注意网上信息的发布时间和网页更新时间、更新频率、最近的修改
日期;
⑤原创性评估:要注意区分是以发布原始信息为主的网站,还是提供有关主题链接以及是其他站点信息的镜像等。
四、网络信息资源的组织方式
1.搜索引擎组织方式
搜索引擎组织网络信息主要采用主题树和数据库两种方式,也有称使用分类法组织知识和使用语词组织知识。
♦所谓主题树组织方式,就是将信息资源按照某种事先确定的概念体系,分门别类地逐层加以组织,用户通过浏览的方式层层遍历,直到找到所需的信息线索,再通过信息线索联接到相应的网络信息资源。
♦所谓数据库组织方式,就是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询,就可找到所需要的信息线索(即相关站点链接),并通过信息线索直接连接到相应的网络信息资源。
2.学科导航库方式
这种方式根据特定的目标,选定信息资源的学科领域,对有关的网站网页进行搜索和收集,加以鉴定核实,并对核实后的网址进行合理组织,使之能够提供检索、浏览和链接的信息集合。
♦与搜索引擎的主要区别:它属于专题性和学科专业性的,系统性和易用性强。
它针对某一学科或领域的研究者的需要,将Internet上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URLs(即统一资源地址,包括Http、Gopher、Ftp、Usenet等),系统地组织起来,存放于某一网页,供用户浏览或者检索。
用户在访问某一学科的虚拟图书馆的网页时,通过激活相关的网络线索即超级链接,就可以浏览到大量相关资料。
其组织方式一般有两种:
第一种是分类方式,其一是按照学科性质,根据学科概念体系,依学科分类的方法组织网上信息,用户可按树状结构逐步找到所需信息;二是按照电子资源类型,
即将搜集到的资源按照综合信息、研究机构等外在形式进行分类组织,用户可以按资源类型找到所需信息。
第二种为数据库方式,即利用数据库技术,依据一定的索引语言抽取一个或几个标识点作为检索点,形成检索数据库或指示数据库供用户检索。
3.分类法方式
这种方式是以文献分类法为工具的网络资源检索服务系统,从学科角度揭示网络信息,成为组织网上学术性知识内容的主要应用模式。
传统文献分类法在网络中的应用主要表现在:①用于联机浏览检索;②用于非文本信息的组织;③用于超文本系统的管理;④作为网络信息组织的通用工具;⑤促进分类主题一体化。
传统分类法应用于网络信息组织,必须进行技术改造和不断创新发展,如分类法网络化和易用性方面的改造等。
4.主题法方式
其主要体现为:①关键词法的应用,目前由搜索引擎软件自动建立的网络信息资源索引数据库所支持的就是关键词检索。
②主题词表的应用,少数搜索引擎中提供主题词检索方式,在用户界面上,可直接浏览主题词表,从中选出主题词,作为搜索引擎的检索提问。
③标题词表的应用,通过标题词表规范用户的检索表达式,在得出检索结果的同时,还可以提供相关词作为用户进一步检索的线索,用户可自由进行扩检和缩检,从而提高检索效率。
5.本体方法
本体是网络信息组织与检索工具的理想选择,主要原因是:①本体关于领域知识的共同理解和描述使得现代网络信息组织是建立在语义信息而不是语法信息基础之上的。
②信息组织的目的是建立有效的信息系统,从而便于信息的检索和利用,而本体对于概念及其之间关系的精确描述可以极大地提高信息系统的检索效率。
③本体面向计算机和网络的特点及其形式化描述使其能更好地满足现代信息组织,特别是网络信息组织的需要。
第四节网络信息资源的开放存取
一、开放存取的定义及类型
(一)开放存取的定义
目前普遍接受的定义是由开放社会研究所在匈牙利布达佩斯召集的开放存取国际研讨会上提出的。
开放存取是指通过公共网络免费获取所需要的文献,允许任何用户阅读、下载、复制、传播、打印、检索论文的全文,或者对论文全文进行链接,为论文建立索引,将论文作为素材编入软件。
或者对掳掠女巫进行任何其他出于合法目的的使用,不受经济、法律和技术方面的任何限制,除非网络本身造成数据获取的障碍。
对开放存取概念进行分析,可见其包含两层含义:一是强调学术资源向用户免费开放;二是强调学术资源无限制的合理使用。
(二)开放存取资源的类型
国内外对开放存取资源的类型的划分,目前尚无统一的标准,研究者们提出了多种类型,主要有:
BOAI提出了两种实现开放存取的策略:一是建立“自行存档”,也有称“自归档”;二是创办“开放存取期刊”。
有研究者从网络用户的角度,任务开放存取实现方式可以区分为两大类型:一种是单纯获取型,一种是在线交流型。
还有研究者从开放存取资源的文献类型角度进行划分,包括开放存取图书、开放存取期刊、开放存取论文。
有研究者将开放存取资源划分为3种类型:机构资源库、学科资源库、开放期刊。
本书认为可将开放存取资源划分为开放存取期刊、学科开放存取仓储和机构开放存取仓储等类型。
二、国内外开放存取的发展现状
1.开放存取期刊的发展
开放存取期刊与传统期刊及与电子期刊的区别在于其访问方式与访问权限上,。