如何提高文献检索的查全率

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何提高文献检索的查全率
文献检索是科研的基本功,阅读文献是科研人员获取科研信息的重要途径。

评价文献检索质量的两个最重要的指标是查全率和查准率。

查全率指的是检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。

查全率 = 检出相关文献量 / 文献库内相关文献总量× 100%。

查准率指的是是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。

查全率 = 检出的相关文献篇数/检出的全部文献篇数× 100%。

查全率与查准率在一定程度上是成反比关系的,为了提高查全率就要以牺牲部分查准率为代价,反之亦然。

在不同的情况下,对二者的要求也不同,有时文献的全面更为重要,这时就要以提高查全率为重点,有时希望找到的文献准确率更高,就以提高查准率为重点。

1 检索词的转换。

常见的转换是同义词、近义词、相关词、单复数及缩写形式,如果是动词还有可能有不同的时态。

每一个检索词都有可能有多种表达形式,如果是由英文翻译过来的还有可能有多种翻译方法,所以应该尽可能找全检索词的所有同义词、近义词。

相关词指的是与检索词不是同一个意思但是有关联的词。

如,META分析的同义词包括元分析、荟萃分析、meta-analysis,近义词包括系统综述,相关词为循证医学。

前列腺癌的缩写可能是Pca等等。

值得注意的是,在检索中文文献的时候,有必要把英文的全称和缩写也作为检索词,因为有些中文文章中是直接用英文词汇表示的。

2 使用截词符。

虽然从理论上来说我们找到所有的同义词和近义词可以扩大检索结果,但是要想做到这一点是相当困难的。

这时可以利用截词符来帮忙。

一般用的截词符是“?”和“*”,在不同的数据库中表示的意思有所不同,常见的意思是“?”表示0-1个字符,而“*”表示多个字符。

3 使用上位词,即指代范围更广的词。

有些检索系统有主题词途径,则可以选用上位主题词。

例如水果是苹果的上位词,prostatic neoplasm的上位主题词是prostatic disease。

4 改变布尔运算符,即将连接两个或多个检索词的AND改为OR,即可提高检出数量。

5 改变检索项。

如要求检索词位于标题中或为关键词或主题,检出记录数太少,则可改为要求位于摘要或全文中,检出记录数即可增加。

6 减少限制条件,增加副主题词。

如果前面的检索中有限制条件,放宽或去掉限制条件;如果采用的是主题词和副主题词搭配的形式,看是否漏掉可能的副主题词。

提高查全率的主要方法
(1)降低检索词的专指度,采用上位词或相关词补充到检索式中;
(2)调节检索式的网罗度,如删除某个不重要的概念组面,减少AND运算;
(3)进行族性检索,可采用分类号检索或采用一组近义词或相关词用OR连接在检索式中;
(4)进行截词检索,可以采用的有后截断、前截断、前后截断等截词方法;
(5)增加检索途径,如将主题途径与非主题途径结合起来使用;
(6)取消某些过严的限制符,如字段限制符等
(7)调整位置算符
提高查准率的主要方法
(1)提高检索词的专指度,增加或换用下位词和专指性较强的自由词;
(2)增加概念组面,用AND连接相关检索项;
(3)限制检索词出现的可检字段,如限定在篇名和叙词字段中检索;
(4)用位置算符控制检索词的词间顺序与位置;
(5)利用限制符、前缀符限制文献的外表特征,如文献类型、出版年代、语种、作者等;
(6)用逻辑非NOT来排除一些无关的检索项;
(7)进行加权检索,从定量角度加以控制。

相关文档
最新文档