精准获取信息的方法——编写检索式

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“网络$”,代表“网络”、“网络软件”、“网络计算
机”、“网络操作系统”等词;
“electron$”,代表“electron”、
“electrons”、 “electronic”、 “electronics”等词。
“?” 、 “#” 和 “$”的相同点与不同点:
(1)“?”与“#”均代表一个汉字、西文字符或其他字符; “#”与“$”均可以不代表任何汉字、西文字符或其他
例如:在含有概念A 的文献集合中,排除同时含有
概念B 的文献,可表示为:“A NOT B”或
“A-B”。
4 运算优先级

运算优选级顺序为(),NOT,OR ,AND ; 可以用括号改变它们之间的运算顺序。通常在有 括号的情况下,括号内的逻辑运算先执行,有多 层括号时,先执行最内层的括号。
例如:(A OR D) AND B,表示先执行“A OR D”的
(3)前人的理论依据及史料依据,可能是准确无误十分 丰富,也可能是篡改文献,贫乏薄弱得不足为据。我们要 通过细致查阅,搞清来龙去脉。
★检索效果评价

查全率是指检索出的相关文献量占系统中所有相关 文献总量的百分比,用来反映检索的全面性。 查准率是指检索出的相关文献量占所有检出文献总 量的百分比,用来反映检索的准确性。 查全率P=a/(a+c)ⅹ100%
S (speckle and nondestruc? (w) test?) /ab,ti,de
☆检索词的选定
确定检索词的基本准则

必须能正确反映检索要求;
必须符合数据库的检索用词规则; 优先选用具有检索意义学科名词术语;

多选常用的基本词汇进行组配。•
选择主题词要领
属种关系又称上下位关 《词表》是文献检索 系,包括概念是属概念,被 进行文献的主 的重要辅助工具,使用 包括的概念是种概念。利用 题分析,包括审读 时要注意从多角度查词, 属概念扩大检索途径,可提 文献,划分主题类 要充分利用辅助表。当 高查全率,利用种概念缩小 型和分析主题结构, 查找范围,可提高查准率。 查不到与某个具体概念 选直接表达文献主 相关关系指属种关系以 相对应的专指叙词时, 题概念的词表中的 外的具有交叉、并列、对立 可以把该概念分解为几 正式专指叙词; 关系的概念,以及形式与内 个较一般的概念(外延 容、本质与现象、原因与结 相对宽的),然后再去 果等关系。善于利用这些关 查表。 系,有利于提高查全率。
精准获取信息的方法 ——编写检索式
主要内容

为什么要精准获取信息 检索策略和步骤


如何编写检索式
搜索引擎中的检索式
为什么要精准获取信息 ★保证检索的全面性
不仅要广泛查阅自己特定范围内的国内外有关研究成 果,而且要把视野放宽,广泛测览特定范围以外的有关研 究成果。不仅要搜集与自己观点一致的材料,也要搜集那 些与自己观点不一致,或与自己构思相矛盾的资料。不仅 要广泛查阅中文资料,同时也应查阅外文资料,以便及时 掌握最新的研究资料和动向特别是要着力搜集第一手资料, 以保证研究的客观全面。

在检索实际中,检索提问涉及的概念往往不 止一个,而同一个概念又往往涉及多个同义 词或相关词。 为了正确地表达检索提问,系统中采用布尔 逻辑运算符将不同的检索词组配起来,使一 些具有简单概念的检索单元通过组配成为一 个具有复杂概念的检索式,用以表达用户的 信息检索要求。

1 逻辑“与”

含义:检出的记录必须同时含有所有的检索词。
2 专指选词法

选用专指性强的主题词越多,则检出的文献针对性越强, 查准率就越高。 突出检索主题的深度。

3 转换选词法




检索词的确定必须经过对检索主题的正确分析得到。 选词过程中还经常会遇到不能直接查到所需文献的词,这 中间就需要有一个转变过程。 例如:检索《COBOL语言设计》课题,若不加分析就选用 “COBOL language design”,则必然碰壁。而通过正确分 析理解就会知道COBOL语言是一种用来编制计算机程序的语 言,所以应先确定检索词为“计算机程序语言(computer programming languages)”,然后再进一步与COBOL组配, 定能得到满意结果。 此种选词法可促使科技人员对主题词表的主题词结构及类 型有所了解,锻炼多角度选词的能力。
注:英文数据库通常用字母,中文数据库要用符号。
二、位置检索(邻近检索)技术



表明两或多个检索词之间关系的符号。 适用于两个检索词以指定间隔距离或者指定的顺序出现的场 合。可以看成特殊功能的AND算符。AND算符不限制两个检索 词的位置和出现顺序。 例如:communication AND satellite 命中的文献可能有 communication satellite; satellite communication; communicaticn devices for satellites; communicaticn links without satellites; 位置算符可以改进AND算符的这种不足,它是特殊功能的AND 算符。按照两个检索词出现的顺序和距离,可以有多种位置 算符,而且对同一位置算符,检索系统不同,规定的位置算 符也不同。

基本作用:一种用于交叉概念或限定关系的组配, 可以缩小检索范围,有利于提高检索的专指性。
用and 或*表示 示为:“A and B”或“A*B”

例如:查找同时含有概念A 和概念B 的文献,可表
2 逻辑“或”

含义:检出的记录中,至少含有两个检索词中的 一个。 基本作用:用于具有并列概念关系的组配。这种 组配可以扩大检索范围,提高查全率。可以避免 了命中文献的重复出现。 用OR 或“+”表示 示为:“A OR B”或“A+B”
改善同时得到提高。
★检索步骤
检索课题
词表
主题分析
选择数据库 确定检索词
用户
构造检索策略
N
结 果 返 回
原文 标引
制定检索式 计算机处理
结果评价
Y
数据库
★制定检索策略

什么是检索式
检索式:检索式是指计算机检索中用来表达用户检索提问 的逻辑表达式,由检索词、检索算符以及系统规定的其他 连接符号等构成
1)“(W)” 含义: “(W)”算符中的W含义为“With”。表示 其两侧的检索词必须紧密相连,除开空格和标点 号外,不得插入其他词或字母,两词的词序不可 颠倒。其简略形式为()。 例如: communication (W) satellite communication () satellite 两者相同

运算符
又称逻辑算符,是表达检索词之间逻辑关系和限制关系的 运算符号,它是复合检索式中必不可缺的构件。包括逻辑 算符、截词符、位臵算符等字段检索
☆编制检索式

用逻辑算符说明词间的逻辑关系 用位臵算符指定词间的位臵关系 用截词符描述词尾变化


检索字段
分析检索结果,调整检索式,直至满意 试解释检索式:
6 小结

检索中逻辑算符使用是最频繁的,对逻辑算符使 用的技巧决定检索结果的满意程度。 用布尔逻辑表达检索要求,除要掌握检索课题的 相关因素外,还应在布尔算符对检索结果的影响 方面引起注意。


另外,对同一个布尔逻辑提问式来说,不同的运 算次序会有不同的检索结果。布尔算符使用正确 但不能达到应有检索效果的事情是很多的。

符,检出的词均包括词干本身。 (2)不同点:
使用“?”,检出的词不包括词干本身;
使用“$”,可代表多个汉字、西文字符或其他字符 检出的词包括词干本身。
☆使用运算符的检索技术
1. 2.
布尔逻辑检索技术 位臵检索技术
3.
4. 5. 6.
截词检索技术
字段限定检索技术
原文检索技术
扩检与缩检
一、布尔逻辑检索技术

例如:检索含有检索项A 或检索项B 的文献,可表
3 逻辑“非” 含义:排除含有某些词的记录的,即检出的记录 中只能含有NOT算符前的检索词,但不能同时含 有其后的词。


基本作用:用于从某一检索范围中排除不需要的 概念。这种组配可以缩小检索范围。
用“NOT”或“-”表示,但在检索时建议使用NOT, 以避免与词间的分隔符“-”混淆。
4 通配符的运用
(1) “?”——代表检索词中的一个汉字、西文字符或其他 字符。 例如: “计算?”,表示“计算机”、“计算器”等词; “航?器”,表示“航空器”、“航天器”等词;

“int??net”,表示“internet”、 “intranet”等词。
(2)“#”——代表检索词中的一个汉字、西文字符或其他 字符,也可不代表任何汉字、西文字符或其他字符。 例如:
2)用布尔逻辑表达检索要求,除要掌握检索课题的相关因 素外,还应在布尔算符对检索结果的影响方面引起注意。 布尔算符使用正确但却不能达到应有检索效果的例子很多。 OR逻辑 有些检索词表达的概念,存在整体与部分的关系。在检索 中,这类关系如果处理不好,就不能得到满意的检索效果。 对此,一般原则是,如果检索词涉及到表达整体的概念, 就要针对具体情况分别列出每一个表达部分概念的检索词, 否则将出现漏检。 NOT逻辑 在检索逻辑中使用NOT,能排除含有由NOT指定的检索词的 文献,协助检索出更准确的文献。但是,使用NOT必须慎 重。因为, 如果两个关系紧密的检索词同在一个检索逻 辑中,对其中一个使用NOT逻辑会导致含另一个词的文献 也被排除。
查准率R=a/(a+b)ⅹ100%
R:表示查全率; P:表示查准率; a:检出的相关文献量为; b:检出的非相关文献量; c:系统中未检出的相关文献量。

查全率的互补数就是漏检率 查准率的互补数就是误检率。

查全率和查准率也是互补的关系。在一个特定的检索 系统中,当查全率不断提高的同时,查准率就会降低, 而当查准率提高的同时,查全率又会降低。但当查全 率和查准率都很低的时候,两者可以通过检索策略的
检索,再与B进行AND运算。
5 注意事项 1)有的检索工具以符号形象地表达布尔检索的功能, 如“+”表示逻辑与,“-”表示逻辑非。有的检索 工具直接把布尔逻辑隐含在菜单中,例如,Lycos以 “match all terms”表示逻辑与,以“match any term”表示逻辑或。绝大多数检索工具的高级检索 完全用表格和文字来表达布尔关系,如,Excite以 “必须包括(MUST contain)”表示逻辑与,用 “一定不含”(MUST NOT contain)表示逻辑非。 有的检索工具部分支持布尔关系,如Yahoo!尚不支 持逻辑非。
把握概念的含义
要利用概念之间
Fra Baidu bibliotek
的属种关系和相
关关系增加检索 线索
注意利用词表
1 直接选词法

当检索题目中使用的自由词与规范词相一致时,可直接选 取。 例如: “光缆(optical fiber)”、 “计算机辅助设计(computer aided design)”等,这 些词属于范围大、命中率高的选词,检索人员可直接进行 检索。这种方法的结果最为接近主题。
示例:使用布尔逻辑运算符
Intelligent robot and control(intelligent robot*control) 表明查询结果中必须同时包含intelligent robot和control Intelligent robot or control(intelligent robot+control) 表明查询结果中至少包含两个检索词中的任意一个,intelligent robot或 control Intelligent robot not control(intelligent robot-control) 表明检索结果包含intelligent robot,但同时必须去掉和control相关的内容
“微#机”,表示“微机”、“微型机”等词; “missile#”,表示“missile”、 “colo#r”,表示“color”、
“missiles”等词;
“colour”等词。
(3)“$”——代表检索词中的任意多个汉字、西文字符或其 他字符,也可不代表任何汉字、西文字符或其他字符。 例如:
★保证检索的准确性
通过细读,基本掌握若干年来所研究的领域内讨论过 的问题,分歧意见,代表人物和主要著作,主要倾向。要 认真推敲观点和论据,并做好记录。
从前人分歧矛盾中发现问题:
(1)前人的结论可能是正确的,但论据不充分;结论可 能是错误的,但研究过程或研究方法可能有启发;
(2)前人的争论焦点,可能是问题的关键所在,也可能 只在表面现象上争吵不休,并未触及问题的实质;
相关文档
最新文档