文献信息检索与利用基本知识介绍

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文献信息检索与利用基本知识介绍

第二届华侨华人文献信息检索与利用讲座讲义(二)

主讲人覃建宁

一、网上电子资源检索与利用

l 检索方法的使用

1、布尔逻辑检索

所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。

常用的布尔逻辑运算有三种,分别是逻辑或、逻辑与、逻辑非。

逻辑或:运算符为“OR”、“or”、“+”,有时也可以用“|”表示。

检索式A OR B ,表示包含检索词A的文献或包含检索词B的文献或者同时包含A和B的文献均为命中文献。使用逻辑或相当于增加检索主题的同义词与近义词,扩大了检索范围。

例:华侨OR 华人

逻辑与:运算符为“AND”、“and”、“*”,有时也可能用“&”表示。

检索式A AND B,表示文献中同时包含检索词A和检索词B的文献才是命中文献。使用逻辑与缩小了检索范围,增强了检索的专指性。

例:华侨AND 马来西亚

逻辑非:运算符为“NOT”、“not”、“-”,有时也可能用“!”表示。

检索式A NOT B,表示包含检索词A同时不包含检索词B的文献为命中文献。逻辑非排除了不希望出现的检索词,增强了检索专指性。但在使用时要特别注意,因为它同时排除了有用的文献。

例:华侨NOT 马来西亚

上述三种逻辑运算的关系见图3.1。对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。在没有括号的情况下,And、Or、Not的运算次序,在不同的系统中有不同的规定,例如DIALOG系统中依次为Not→And→Or;STAIRS系统和ORBIT系统中依次为And和Not按自然顺序执行,然后执行Or运算。检索时应注意了解各机检系统的规定。

每个搜索引擎可以使用的布尔运算符是不同的,有的只允许使用大写的“AND”、“NOT”、“OR”运算符,有的大小写通用,有的可支持“&”、“|”、“!”符号操作,有的不支持或仅支持其中的一个等等。

例如,Google和"Yahoo!中国"都支持布尔逻辑检索。Google可用"AND"、"and"、"&"进行逻辑"与"运算,但只能用大写"OR"表示逻辑"或",不支持"NOT"逻辑符操作,允许使用"-"符号代替逻辑"非"运算;"Yahoo!中国"可用"AND"、"and"、"&"

进行逻辑"与"运算,以"OR"进行逻辑"或"运算,以"NOT"、"not"进行逻辑"非"运算。

确切地知晓每一种搜索引擎的检索功能与特性,无需死记硬背。只要在使用时,查看帮助信息便是了。

2、词组检索

词组检索(phrase),也称为短语检索,或字符串检索。它是将一个词组或短语用双引号“""”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。检索结果必须含有与提问式完全一样( 包括次序) 的字串。几乎所有的搜索引擎都支持词组检索。

例如,以"侨务新闻"作为提问关键词检索时,检索结果则仅反馈侨务新闻的内容。

3、位置检索

位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。机检系统中常用的位置算符(按限制强度递增顺序排列)如下:

(1).(f)算符Field:要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如happiness(f)sadness and crying

(2).(s)算符Sub-field/Sentence:要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如machine(s)plant

(3).(n)算符near:(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3…),且词序任意。例如information(n)retrieval 可以检出information retrieval 和retrieval information,又如econom ?? ?(2n) recovery 可以检出economic recovery、recovery of the economy 、recovery from economic troubles

(4).(w)算符With:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒。例如input(w)output

可检出input output而wear(1w)materials可检出wear materials、wear of materials

采用位置算符检索时,通常最严谨的算符放在最左面,例如:

european(w)economic(w)community(f)patio,

redwood(3n)deck?(s)(swimming(w)pool?)

注意:不同的机检系统,位置检索的功能及算符不同,应参看机检系统的说明。

4、截词检索

截词检索(Truncation)是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇

相关文档
最新文档