文献检索三大数据库比较
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CABI、 AGRICOLA和AGRIS数据库比较研究
王国龙李佩朱海燕
(上海交通大学农学院图书馆 201101)
文摘本文对美国银盘公司检索系统webspirs下的CABI、 AGRICOLA和AGRIS三个数据库从文献收录数量、质量、语种和重复情况等方面进行比较研究,对选择订购和文献检索有一定的参考价值。
关键词农业数据库农业文献文献检索 CABI AGRICOLA AGRIS
国际农业生物学文摘CABI、粮农组织农业索引AGRIS和美国农业联机检索数据库AGRICOLA是世界著名的三大农业数据库,其收录的文献涵盖农业所有学科及其相关学科,是农业科学研究和教学重要的文献源。本文对美国银盘公司检索系统webspirs下的三个数据库从文献收录数量、质量、语种和重复情况等方面进行比较研究。
1 三大数据库收录的文献量比较
采用植物、动物、饲料、肥料和灌溉五个主题词对五类有代表性农业文献进行检索,其结果见表1。
表1 三大数据库收录的五类农业文献总量 (1990-2000)
由上表数据可见CABI所收录的各类文献数量最多,达到55 45%,AGRIS 其次,为35 95%,AGRICOLA最少,仅8 6%。以上是三大数据库 1990-2000
年数据,检索自中国农业大学图书馆银盘数据库系统。如果对该数据库系统三大数据库所收录的上述五类文献总数进行统计,则得到如下结果:
CABI(1999-2001)1349559(41 5%),AGRICOLA(1984-2000)350827(10 81%),AGRIS(1975-2000)1545394(47 61%)。由于在调查的数据中AGRIS收录文献的年限远远大于CABI和AGRICOLA,因此,其文献总量超过了CABI而位居首位。由此可见,AGRIS在文献收录的系统性方面较强,而CABI在最新文献的收录方面拔得头筹。从定量的角度来看两者各有千秋,AGRICOLA则略输一筹。
2 三大数据库收录文献的语种比较
对三大数据库所收录的动物与植物文献的语种情况调查表明,其收录的文献主要为英语、法语、德语、汉语、日语、俄语、西班牙语和意大利语,这8
种文献占总数的 95%以上,其中英语文献数量最多,所占比例为69%到88%,其中AGRICOLA 99 74%,CABI 81 07%,AGRIS 69 65%。中文文献在CABA中的占有量仅次于英语占第二位,在AGRIS和AGRICOLA中分别占第六位和第七位(见表2和表3)。
由表2 可见:在三大数据库中各主要语种文献前五名分别为,CABI:英语、汉语、德语、俄语和法语,AGRICOL:英语、法语、俄语、日语和德语,AGRIS:英语、法语、德语、西班牙语和汉语。总排名顺序为:英语、德语、法语、西班牙语和汉语。
3 三大数据库文献类型比较
对三个数据库的文献类型的调查发现,三个数据库在文献类型的收录上有共性,但各具特点。如对三数据库1992-1997年所收录的有关植物与植物科学的文献调查发现,AGRIS、CABI和AGRICOLA所收录的文献中,期刊文献均占首位,其比率分别为70 43%、86 99%和90 33%(见表3)。但其他文献的收录无论从种类还是比率上均有显著的差异。如从文献收录的种类来看,AGRICOLA最多达32种,其次是AGRIS的24种,CABI最少为 12种。从收录文献的主要类型来看,除期刊外,AGRICOLA主要收录单行本、书目,此外也收录一定量的会议文献,AGRIS主要收录单行本、会议文献和书目文献,也收录一定量的学位论文、地图、技术报告等,CABI收录的会议论文和图书较多,此外也收录一定量的技术报告和专利文献(见表3)。
由表3 可见,各数据库所收录的文献具有一定的特色,如AGRIS的地图,CABI的图书等,从而为数据库的选择与使用提供一定的依据。
表2 三大数据库收录主要语种文献情况
表3 三大数据库主要文献类型排序
4 三大数据库文献重复情况调查
在实际使用中我们发现,三大数据库所收录的文献都存在一定程度的重复。为此,我们对该数据库文献的重复情况进行了抽样调查。调查对象为植物科学、动物科学和环境科学三个主要农业学科,每个学科选择五组词汇用布尔逻辑符and组配,对三个数据库分别进行检索,检索词限定范围为标题title,检索年限为 1995-1999,然后对检索结果进行比较,其结果如下。
由表4 可见,各不同学科之间的文献的重复量和重复率具有显著差别。在三个学科中动物科学重复率最高,达56 86%,其次是植物科学,30 77%,环境科学最低,仅21 98%,还不到动物科学的一半。虽然,此差异可能与所抽取的样本量较小有关,但在不同学科文献之间的重复量和重复率上存在较显著差异是显而易见的。
不同数据库中和数据库之间的文献重复量和重复率也均存在显著差异。由表4和表6可见,重复率最低的是CABI,为36%,其中与AGRICOLA重复 25.48%,与AGRIS重复22.58%;其次是AGRIS为40.70%,其中与CABA重复35.18%,与AGRICOLA重复24.62%;最高的是AGRICOLA,达63.27%,其中与CABA重复53.74%,与AGRIS重复33.33%。此外三个数据库之间完全重复率也因学科与数据库有一定差异。由于三大数据库覆盖了几乎全部世界农业文献,我们可以得出结论,CABI 的文献覆盖率达64%,AGRIS为59.3%,而 AGRICOLA仅36.7%左右。
表4 三大数据库中不同学科文献重复情况
表5 三大数据库之间的文献重复情况
表6 三大数据库中各学科文献完全重复情况
5 结果与讨论
5.1 从三大数据库收录的文献数量来看,CABI和AGRIS较多,AGRICOLA较少;从质量来看,CABI以收录报道性文摘为主,报道-指示性文摘为辅,文献质量较高;AGRIS文摘与题录并重,辅以英、法、西班牙三种文字主题词,与前者相比也各有千秋;AGRICOLA则以题录为主,并附主题标识词,因此略逊一筹。
5.2 三大数据库收录的文献语种情况英语占大多数,其中以AGRICOLA收录的英语文献最多,CABI和AGRIS所收录的其他语种文献相对较多,体现出一定程度的国际性,其中CABI收录的汉语文献较多,AGRIS收录的法语文献较多。
5.3 三个数据库所收录的文献类型以期刊为主,但比率不同,其中以AGRIS
收录的期刊文献比率最低,其收录的文献呈多样性,除期刊论文外,还包括会议论文、单行本、书目、学位论文、技术报告和地图等;CABI收录的文献种类较少,除期刊论文外,主要有会议论文、图书、技术报告和专利文献等;AGRICOLA 虽然收录文献种类最多,其中90%以上是期刊论文,此外是单行本、书目文献和会议文献,其它文献如手册、词典、百科全书等参考工具书,虽然是其特色,但数量较少。
5.4 三大数据库所收录的文献都存在一定程度的重复,重复率随数据库和学科类型而异,通常在20-60%。根据抽样调查,其总体重复率约为40-50,其重复的主要部分是期刊文献,导致其重复的原因是三个数据库重复收录核心期刊的文