整理文献检索三大数据库比较.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CABI、 AGRICOLA和AGRIS数据库比较研究
王国龙李佩朱海燕
(上海交通大学农学院图书馆 201101)
文摘本文对美国银盘公司检索系统webspirs下的CABI、AGRICOLA和AGRIS三个数据库从文献收录数量、质量、语种和重复情况等方面进行比较研究,对选择订购和文献检索有一定的参考价值。
关键词农业数据库农业文献文献检
索 CABI AGRICOLA AGRIS
国际农业生物学文摘CABI、粮农组织农业索引AGRIS和美国农业联机检索数据库AGRICOLA是世界著名的三大农业数据库,其收录的文献涵盖农业所有学科及其相关学科,是农业科学研究和教学重要的文献源。本文对美国银盘公司检索系统webspirs下的三个数据库从文献收录数量、质量、语种和重复情况等方面进行比较研究。
1 三大数据库收录的文献量比较
采用植物、动物、饲料、肥料和灌溉五个主题词对五类有代表性农业文献进行检索,其结果见表1。
表1 三大数据库收录的五类农业文献总量 (1990-2000)
类型CABI % AGRICOLA % AGRIS % 合计% 植物590886 54.70 119091 11.03 370183 34.27 1080160 100 动物459847 56.88 37855 4.68 310805 38.44 808507 100 饲料70985 52.38 13993 10.33 50545 37.30 135523 100 肥料70919 57.92 11119 9.08 40397 33.00 122435 100 灌溉31046 51.55 7691 12.77 21485 35.68 60222 100 总计1223673 55.45 189749 8.60 793415 35.95 2206837 100
由上表数据可见CABI所收录的各类文献数量最多,达到5545%,AGRIS 其次,为3595%,AGRICOLA最少,仅86%。以上是三大数据库 1990-2000年数据,检索自中国农业大学图书馆银盘数据库系统。如果对该数据库系统三大数据库所收录的上述五类文献总数进行统计,则得到如下结果:
CABI(1999-2001)1349559(415%),AGRICOLA(1984-2000)350827(1081%),AGRIS(1975-2000)1545394(4761%)。由于在调查的数据中AGRIS收录文献的
年限远远大于CABI和AGRICOLA,因此,其文献总量超过了CABI而位居首位。由此可见,AGRIS在文献收录的系统性方面较强,而CABI在最新文献的收录方面拔得头筹。从定量的角度来看两者各有千秋,AGRICOLA则略输一筹。
2 三大数据库收录文献的语种比较
对三大数据库所收录的动物与植物文献的语种情况调查表明,其收录的文献主要为英语、法语、德语、汉语、日语、俄语、西班牙语和意大利语,这8种文献占总数的 95%以上,其中英语文献数量最多,所占比例为69%到88%,其中AGRICOLA 9974%,CABI 8107%,AGRIS 6965%。中文文献在CABA中的占有量仅次于英语占第二位,在AGRIS和AGRICOLA中分别占第六位和第七位(见表2和表3)。
由表2 可见:在三大数据库中各主要语种文献前五名分别为,CABI:英语、汉语、德语、俄语和法语,AGRICOL:英语、法语、俄语、日语和德语,AGRIS:英语、法语、德语、西班牙语和汉语。总排名顺序为:英语、德语、法语、西班牙语和汉语。
3 三大数据库文献类型比较
对三个数据库的文献类型的调查发现,三个数据库在文献类型的收录上有共性,但各具特点。如对三数据库1992-1997年所收录的有关植物与植物科学的文献调查发现,AGRIS、CABI和AGRICOLA所收录的文献中,期刊文献均占首位,其比率分别为7043%、8699%和9033%(见表3)。但其他文献的收录无论从种类还是比率上均有显著的差异。如从文献收录的种类来看,AGRICOLA 最多达32种,其次是AGRIS的24种,CABI最少为 12种。从收录文献的主要类型来看,除期刊外,AGRICOLA主要收录单行本、书目,此外也收录一定量的会议文献,AGRIS主要收录单行本、会议文献和书目文献,也收录一定量的学位论文、地图、技术报告等,CABI收录的会议论文和图书较多,此外也收录一定量的技术报告和专利文献(见表3)。
由表3 可见,各数据库所收录的文献具有一定的特色,如AGRIS的地图,CABI的图书等,从而为数据库的选择与使用提供一定的依据。
表2 三大数据库收录主要语种文献情况
数据库CABI AGRICOLA AGRIS
学科植
物
动
物
植
物
动
物
植
物
动
物
英
语
484760 381434 194716 68817 419479 383164
法
语
13326 14569 8414 1894 35873 48708 西班牙语14825 10640 2752 982 25724 45377 德15780 23534 3889 1613 35711 43177
语
意大利语9007 7643 317 73 9405 8544 汉
语
31905 11650 753 196 26610 15064
日
语
12905 6689 170 5562 2345 110318
俄
语
19179 10599 5562 1266 10318 11553
合
计
601687 466758 216573 80403 586571 565905
表3 三大数据库主要文献类型排序
数据库AGRIS CABI AGRICOLA
类型文献数
量比率排
序
文献数
量
比率排
序
文献
数量
比率排
序
期刊论文165006 70.43 1 212884 86.99 1 76804 90.33 1 会议论文21148 9.03 3 24674 10.08 2 651 0.77 4 单行本34598 14.76 2 ———4261 5.01 2 书目文献8278 3.53 4 ———3196 3.76 3 图书———5528 2.26 3 ———技术报告414 0.18 6 1058 0.43 4 5 0.01 7 学位论文3870 1065 7 178 0.07 6 ———专利文献80 0.03 9 311 0.13 5 ———标准文献104 0.04 8 78 0.03 7 ———地图760 0.32 5 ———9 0.01 6 辞典手册32 0.01 10 ———96 0.11 5 合计234290 100 244711 100 85022 100
4 三大数据库文献重复情况调查
在实际使用中我们发现,三大数据库所收录的文献都存在一定程度的重复。为此,我们对该数据库文献的重复情况进行了抽样调查。调查对象为植物科学、动物科学和环境科学三个主要农业学科,每个学科选择五组词汇用布尔逻辑符and组配,对三个数据库分别进行检索,检索词限定范围为标题title,检索年限为 1995-1999,然后对检索结果进行比较,其结果如下。
由表4 可见,各不同学科之间的文献的重复量和重复率具有显著差别。在三个学科中动物科学重复率最高,达5686%,其次是植物科学,3077%,环境科学最低,仅2198%,还不到动物科学的一半。虽然,此差异可能与所抽取的样本量较小有关,但在不同学科文献之间的重复量和重复率上存在较显著差异是显而易见的。