常用中文期刊数据库药学文献检索比较

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常用中文期刊数据库药学文献检索比较本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意!

任何一个数据库都没有收录全部的医药文献。对数据库检索功能进行比较报道较多,而数据库标引质量对检索结果影响则似未见报道。我们拟通过个别词模拟检索,对数据库进行探索性的对比性研究,以找出数据库标引质量影响文献检索结果的因素,为医药学工作者文献检索提供参考。以下是整理的药学文献检索论文,供大家参考学习。

1.资料与方法

收录期刊分析

以《中文核心期刊要目总览》中的药学类专业期刊一览表收录的期刊、《中国科技期刊弓I证报告》中2003年药学类期刊总被引频次和影响因子排序表收录的期刊刊名为检索词,分别对中国生物医学文摘数据库(CBM)、中国期刊全文数据库(CNK)以及中文科技期刊数据库(VIP)三个数据库进行检索,检索时段为2000~2003年,对于没有收录的期刊名称,查对《中国科技期刊引证报告》中期刊名称变更表确认。对期刊名称作为自由词的检索结果也进行对比分析。

自由词检索分析

为了充分反映各数据库对常用词汇的标引情况,特选取使用频率较髙、表达方式多样的词汇“促红细胞生成素”为检索词,但预检索发现CBM主题词为“红细胞生成素”,鉴于“红细胞生成素”包含于“促红细胞生成素”,故确定以“红细胞生成素”为检索词,分别对CBM、CNK、VIP进行检索。为避免数据库标引时滞的影响,检索时段为2000-2003年。检索字段为文献题目、关键词、摘要、主题词。

作者检索分析

在自由词检索过程中发现,作者的收录标引格式变化较大,如单姓、单名间有的有空格,有的则没有。为了避免标引格式的差异,从检索到的文献中随机选取3位单姓双名作者,进行作者字段检索,对检索结果进行描述性统计分析。

检索文献的比较

为了便于比较从CBM、CNK、VIP数据库中检索到文献的差异,以为工具,编写文献汇总程序,利用计算机将相同的文章比较、合并,供进一步分析。

2.结果

收录期刊分析

药学类专业期刊一览表和2003年药学类期刊总

被引频次和影响因子排序表[12]中共收录刊物79种,CBM、CNK和VIP分别收录了71,60和70种。未收录的多为专题性刊物、新创刊刊物和地方性刊物。数据库间对同一期刊的收录起始年份也不尽相同。

期刊名称,尤其是带有副刊名的期刊名称,在不同的数据库中表达方法不一致。其中VIP多采用中文冒号“:”分割副刊名,CBM、CNK多采用间隔符号“_”,有时也采用英文句点“.”。有时同一年份、同一数据库格式也有差异。

中国生物医学文摘数据库的检索结果

检索词为“红细胞生成素”,检索字段为关键词、摘要、题目和主题词’分别检索到373’386’426和706篇文献;四个字段检索结果逻辑或(OR)合并,获得767篇不重复文献。如果不考虑检索准确率(即检索特异性),假设这767篇文献为所有文献,则检出率分别为:关键词49%、摘要50%、题目56%、主题词92%。主题词的文献检出率最高,关键词最低。四个字段均包含该检索词的文献,仅有231篇,占所有文献的30%;关键词、摘要、题目三个字段均包含的文献有233篇,占30%。主题词、摘要、题目三个字段均包含的文献有245篇,占32%。两两组合中,以题目与主题词相关性最好,均检索到的文献有422篇一致,

分别占各自检出文献的99%,60%,占所有文献的55%。

关键词检索到而主题词未检出的有12篇。题目检索到而主题词中未检出的有4篇。部分文献的记录显示有关键词而没有标弓I主题词。

中国期刊全文数据库的检索结果

检索词为“红细胞生成素”,检索字段为主题词时,显示文献数量为0。检索字段为关键词、摘要和题目,分别检索到355,386和384篇文献,合并汇总共有568篇不重复文献。如果假设这568篇文献为所有文献,则检出率分别为关键词62%、摘要68%和题目68%。三个字段均包含该检索词的文献,仅有222篇,占所有文献的39%。两两组合中,以关键词与摘要相关性最好,检索出的文献有271篇一致,分别占各自检出文献的76%、70%,占所有文献的48%。

检索结果中,题目中包含“红细胞生成素”而关键词中不包含的有120篇(21%)。题目包含而摘要中没有包含的文献有98篇(17%),与原文对比发现,原文没有关键词的文献’本检索系统中也不包含关键词。题目中包含“重组人红细胞生成素”,关键词中有“重组人红细胞生成素”、“红细胞生成素,重组”、“红细胞生成素”、“促红细胞生成素”等几种表达方法,影响了检出结果。

中文科技期刊数据库的检索结果

检索词为“红细胞生成素”,检索字段为主题词时,显示文献数量为0。检索字段为关键词、摘要和题目,分别检索到490,367和382篇文献,合并汇总共有599篇不重复文献。如果假设这599篇文献为所有文献,则检出率分别为82%,61%和64%。三个字段均包含该检索词的文献,有220篇,占所有文献的37%。两两组合中,以关键词与题目相关性最好,检索出的文献有354篇一致’分别占各自检出文献的72%,93%,占所有文献的59%。

数据库标引质量对检索结果的影响

三个数据库以“红细胞生成素”为检索词的检索结果共计有1934篇文献。经过计算机自动比较汇总(题目相同、作者相同、源期刊名、卷期相同的文献自动合并),再人工逐一核对,获得887篇不重复文献,超过任何一个数据库的收载总量。汇总合并过程中发现有374篇次有差异。经过与原始文献对比,发现主要是数据库标引的文献题目和作者名称与原文有差异’主要表现在错别字、冷僻字表达格式不同等,但标引的题目、关键词有误时,仍可通过其它字段检索可以获得。

对原文献有关字段有错别字的处理,各数据库方

法不尽相同。CNK似未作修正,CBM在收录标引过程中作了修改。对于下标的表示方法,数据库间也不尽相同。CNK就以下划线加括号表示下标,CBM和VIP 中则不作标志。

数据库标引深度的比较

抽取三个数据库中关键词检索结果有差异的文献’核对原文比较数据库关键词、主题词标弓丨情况。从下载的摘要情况看’只有CBM有主题词标弓|。三个数据库都有关键词标引,CBM、CNK大部分文献有关键词标引,核实的部分文献中,均与原文一致。VIP重新选取、标注关键词,每一篇文献都有关键词标引,并对原文的关键词进行了规范化处理。

作者字段检索结果对比分析

各数据库作者字段的检索结果见表1。CBM与CNK之间重合性较好,而VIP在检出率和与其他数据库之间的重叠方面都较低,许多文献的作者仅收录前2位,后跟“等.”,2003年的部分文献收录了所有作者。

本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意!

相关文档
最新文档