外文发现系统对比分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随着我校电子资源建设工作的不断开展,图书馆拥有的各类引进和自建数字资源日益增多。但是,目前图书馆的数字资源的检索系统相对分散、复杂,数据库利用情况并不理想。为了对数字资源进行整合,帮助师生简单、高效地对数字资源进行检索和获取,充分利用我校购买的数据库,并发现更多有价值的资源,我校拟购买发现平台。以下为国内外影响力较大、系统相对成熟、目前大陆高校使用较多的两个外文发现系统Find+(EDS本土化产品)和Summon的对比分析。

1.系统介绍

Find+发现系统:EBSCO公司在2010年1月推出EDS系统,Find+知识发现平台是由美国EBSCO 公司和南京大学数图实验室联合研发,利用EDS平台授权提供的国外出版商合法元数据的外文多语种搜索技术,结合本地化服务功能,搭建的资源发现系统,是EDS平台的中国本土化产品。

Summon发现系统:Summon是ProQuest旗下的Serial Solution公司于2009年7月推出的国际上第一款网络级资源发现系统。Summon利用授权提供的国外出版商合法元数据,将不同来源的学术资源和摘要集中索引成一个索引数据库,并提供开放的API数据接口供其他系统调用。

Find+和Summon均集成HathiTrust资源。HathiTrust成立于2008年10月,是由美国结构合作委员会图书馆联盟和加州大学图书馆联盟共同创建的数字仓储项目,该项目将成员馆所收藏的印刷性文献进行数字化并同意保存,从而建立共享的数字仓储。截至目前,共用1334万多册,46亿多页,其中500多万册是OA资源。

2.对比高校

Find+:武汉大学,网址::西安交通大学,网址:资源种类

Find+包含的资源种类有:新闻、杂志、学术期刊、书籍专著、评论文章、会议资料、报告、电子资源、传记、音频、专题及学术论文、非印刷资源、原始文档、乐谱、电子书籍、视频、有声读物。

Summon包含的资源种类有:专利、乐谱、书籍/电子书、书籍章节、书评、人工制品、会议录、光盘、出版物、出版物文章、参考文献、口语音乐唱片、商业出版物、商业出版物文章、图书馆馆藏、图像、地图、学位论文、小册子、市场研究、手稿、技术报告、抄本、报告、报纸、报纸文章、政府文献、数据库、数据集、文章、期刊/电子期刊、期刊文章、杂志、标准、档案材料、活页乐

术、视频记录、计算机文件、论文、诗歌、音乐录音、音乐记录等。

从资源种类看,Summon发现相较于Find+资源种类更加丰富,数据来源更加广泛。

4. 检索方式

Summon提供便捷的学术资源“一站式”检索服务,检索方便快捷。快速检索全面揭示馆藏,包括图书馆馆藏目录、电子期刊数据库、电子书数据库、图书馆数字特藏资源以及OA资源等。

Find+在进行快速检索时首先需要对检索范围限定是“电子资源”还是“馆藏资源”,不能同时对所有资源进行检索,降低了检索效率。

5.检索资源量

Find+系统覆盖全球9万多家期刊和图书出版社的资源总量达到亿条,学术期刊超过万,全文资源近7千万,学术资源的语言种类有近200种,非英语的出版社资源超过3000家,中文资源总量达到近2亿条,期刊论文篇目数据达到8000万,书目信息资源800万,电子书资源300万;图书超过1200万种。Find+已于维普、Apabi签约,典型中文库95%覆盖。

Summon包括超过10,000出版商的内容,包含150,000种期刊、20多亿条数据、100多种资源类型,元数据每天更新。独享资源包括PQDT、CSA、ebrary等。同时Summon与CALIS达成协议,可利用56万篇学术论文;且分别与重庆维普、Apabi达成相关数据使用协议,实现CNKI检索90%,万方98%,维普100%覆盖。

空检结果

Find+、Summon两个发现系统均支持空检。

Find+:875,804,632个结果。(其中,%的内容为新闻,%的内容为杂志,%内容为学术期刊。期刊量为139,774,066篇,学位论文的数量为1,325,184篇。)

Summon:1,296,372,812个结果。(其中,%的内容为报纸,%的内容为期刊文章。期刊量为776,351,779篇,学位论文的数量为10,214,848篇。)

从空检结果数据上看,Summon在空检资源总量、期刊量、学位论文数量上都远高于Find+数据库。Find+内容的70%是新闻和杂志。

关键字检索

热点词汇对Find+和Summon的检索结果进行分析比较。中文检索词选取“3D打印”以及“群众路线”两个关键词,英文检索词选择“hadoop”、“Graphene”以及“economic”三个关键词,检索结果分别如表1和表2所示。

表1. Find+和Summon对于中文检索词的检索结果

据使用协议,实现CNKI检索90%,万方98%,维普100%覆盖。Find+已于维普、Apabi签约,典型中文库95%覆盖。从表1检索结果中发现,对于中文检索词,Summon具有更好的发现能力,搜索的总量和期刊量均远远高于Find+检索量。

表2. Find+和Summon对于英文检索词的检索结果

于Summon属于ProQuest旗下产品,独享ProQuest学位论文版权,虽然Find+可通过联邦检索获得部分ProQuest数据,但是数据量较少且准确度不高。因此,在学位论文数量上Summon较Find+有较大优势。

6.元数据来源

Summon系统的元数据来源是从内容提供商处获取,所有签约出版商的列表、覆盖的期刊、数

v1.0 可编辑可修改据库的内容公开透明,元数据的质量高。同时对元数据进行统一格式清洗。

Find+系统将已与出版社签约的元数据收录在EDS仓储中实现元数据检索;对于“图书馆馆藏”可采用导入EDS元数据仓实现元数据检索以及联邦检索两种方式;对于不提供元数据的少部分出版社以及事实型数据通过联邦检索或插件实现整合。

7.检索精度

Find+系统将不同来源的同一资源分多条显示,造成检索结果中存在大量重复数据(见图1所示)。相比之下,Summon数据库中对于数据库商和集成商的资源只出现一次,对不同来源以360Link 的不同链接展示,避免了重复数据的产生。

图1. Find+发现系统中检索出现的重复数据

8.检索方式与检索结果分类

两种外文发现系统均支持基本检索、二次检索、高级检索,Find+系统还支持精确检索。发现系统对发现的结果进行分类,其中Find+对于所有的资源类型显示相同的分面,而Summon针对资源种类的不同显示不同的分面,更具有针对性。

9. 检索结果相关度排序

Summon的排序规则是动态排名和静态排名相结合,动态排名的依据是词语的出现频率、字段权重、术语词干等;静态排名的依据是文献类型、出版日期、本地资源、被引用次数等。Find+是EDS的本土化系统,它依据主题词表及内容提供商提供的原始内容(如题名、关键词等),排序遵循主题词为主要权重的相关度排序。

相关文档
最新文档