文献检索方法与技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
排除、限定和合取法
排除法是指对查找对象的产生和存在的状态在时间上 和空间上加以外在否认。通过这种方法极大地收缩检 索范围。
限定法是相对于排除法而言的,指对查找对象在时间 上和空间上加以内在的肯定。令人满意的答案并非完 整地记录在某一篇文献中。
若把不同资料中涉及到的所需信息的记录都截取下来, 汇集在一起,再经过去粗取精、去伪存真的加工就构 成一个完整的答案,这种方法叫做合取法。
3、制定检索策略,编制检索表达式 4、对检索结果进行分析选择 按照检索式检出结果后,应浏览结果,判断是否符合
要求,并加以筛选。若感到不满意,应及时修改检索 策略,加以调整,再行检索,直到满意为止。
5、索取原文
一、信息检索概述
信息检索:依据一定方法,从已经组织好的有关大量 信息集合中,查出特定的相关信息的过程。按照检索 对象的不同,可分为文献检索、数值检索和事实检索。 信息检索利用检索词、检索条件实现过滤。
数据:描述事物的符号,包括数字、文字、图表、图 像、声音等。
数据库:数据的集合。数据库是信息检索系统的核心 部分之一,数据库的质量直接影响信息检索系统的功 能和效率。
报纸:出版周期更短;获取时事政策性信息
政府出版物:源自官方、权威、可靠;可获取政策性、 法规性及科技信息
科技报告:反映前沿科技、内容新颖、有密级控制, 如美国政府四大报告:AD、NASA、PB、DOE报告
专利文献:反映新的技术发明,类型有:专利说明书、 专利公报、专利分类表、专利文摘等检索工具
会议文献:反映最新成果、最新动向、高水平、前沿 发展动态。包括会议论文集、会议录等
学位论文:内容专深,有较高的学术参考价值
标准文献:反映成熟技术,供研制新产品、改造老产 品、改进工艺和操作水平借鉴
产品资料:形象、直观、新颖,可了解工艺水平、产 品动态等
技术档案与图纸:技术性、适用性、保密性
逻辑与: A*B 、 A and B 表示检索含有这两个词的文献集合 用于组配两个不同的概念 减少检索结果 如 traffic AND control UAV and helicopter
逻辑非: A-B 、 A not B 表示检索含检索词A而不含检索词B的文献 用来剔除一些不需要的概念。 减少检索结果 如fruit NOT apple
1.确定检索方向,选择检索工具和途径 1)确定检索方向 这是使检索获得满意结果的先决条件,为此必须弄清
所需信息的特征,如学科归属、主题概念、时间、文 献类型、文献语种等。
2)确定检索工具 根据学科专业、语种等,选择一种或多种检索工具或
检索系统。
3)确定检索途径 主题、分类或作者
2、分析检索课题、选择检索词 1)注意选择同义词和相关词 2)注意适当控制检索词的内涵与外延 3)注意选词的规范性
三、信息检索的基本方法
检索就是实施检索策略、搜寻所得文献信息的过程。 查找的方法并没有一定之规可供遵循。对同一个问题 不同的检索者可能就有不同的查找方法,这是因为主 观上受个人的实际经验、知识结构、对检索工具了解 的广度和深度、认识问题的方法等因素的影响,客观 上又受制于检索工具、检索时间和数据库等因素的影 响。
例如:intelligent NEAR robot*
Nn(或Nn)表示在两个检索词之间最多可插入n个单词, 两词词序任意。
例如:intelligent Nቤተ መጻሕፍቲ ባይዱ robot*
4、字段检索法
指定检索词出现的字段,系统只对指定字段进行匹配 运算。
五、信息检索基本过程
信息检索就是从信息集合中与用户需求相关的信息 信息集合 找出 用户需求 相关信息
抽查法:
抽查法是针对检索课题的特点,选择有关该课题的文 献信息最可能出现或最多出现的时间段,利用检索工 具进行重点检索的方法。
它适合于检索某一领域研究高潮很明显的、某一学科 的发展阶段很清晰的、某一事物出现频率在某一阶段 很突出的课题。该方法是一种花时较少而又能查到较 多有效文献的一种检索方法。
信息检索工具:
1. 文献信息检索工具:目录、文摘、索引、全文数据 库等。
2. 数据与事实信息检索工具:百科全书、年鉴、传记 资料、地理资料、机构名录、统计资料、字典、词典 等。
二、文献信息的类型
图书:内容系统、成熟、可靠,新颖性差
期刊:数量大,覆盖面广;内容新颖、及时;交流影 响广泛,信息价值高
四、信息检索方法
1、布尔检索法 2、截词检索法 3、位置检索法 4、字段检索法
1、布尔检索法 布尔运算符有三种,分别是 逻辑或 OR; 逻辑与 AND; 逻辑非 NOT
逻辑或: A+B、A or B 用来连接同义或相关的词 可增加检索结果 如Railway OR railroad 无人机 or 无人驾驶飞机 or UAV
截词符号:一般为‘?’或‘*’表示截词的截断符号, 各检索系统有不同规定,没有统一标准。
种类: 按截词位置分:前截断、后截断、中截断; 按截词的字符数量分:非限制截断、限制截断
后截断:在检索词词干后面加截词符
非限制截断:在词干后面加一个截词符,表示不限制 词尾可变化的字符位数。
例如:comput?可查找到computed、computing、 computer、computers等词,注意不宜将词截的过短, 否则容易造成误检
一个?代表零个或任意个字符
例如:colo?r,可检索到color、colour、colonizer、 colorimeter的记录。
一个?和数字,其中的数字代表可替换的字符数。
例如:colo?1r,只能检索到包含colour的记录。
3、位置检索法
1)W-With
W算符是With的缩写,表示在此算符两侧的检索词必须 按输入的先后顺序排列,所连接的词之间除可以有一 个空格、标点或连接号外不得夹有任何其他单词或字 母。
2、截词检索法
截词:是指检索者将检索词在认为比较合适的地方截 断,也称模糊检索,又称词干检索法。
截词检索:用截断的词的一个局部进行的检索,即利 用检索词的词干加上截词符号去数据库中进行检索。 凡是满足这个截词的所有字符串的记录,系统都为命 中。
截词检索法在西文数据库中广泛使用。通常是在词干 后可能变化的位置上加上截词符号。检索词的单复数 形式,同一词英、美不同拼法,词根相同的词都可用 截词检索。
使用搜索引擎的经验:
输入关键词/句(用户需求) 搜索引擎(信息检索 系统) 从数据库中(信息集合) “找出”包含 这些关键词的若干记录(相关信息),就是用户体验 到的检索流程。
信息检索可大致分为五个步骤 一是确定检索方向,选择检索工具和途径 二是对课题进行主题分析,选择检索词 三是制定检索策略,编制检索提问式 四是对检索结果进行分析选择 五是索取原始文献
倒查法
倒查法是由近及远,从新到旧,逆着时间的顺序利 用检索工具进行文献信息检索的方法。此方法的重点 是放在近期文献,只需查到基本满足需要时为止。使 用这种方法可以最快地获得新资料,而且近期的资料 总是既概括了前期的成果,又反映了最新水平和动向, 这种方法工作量小,但漏检率较高,主要用于新课题 立项前的调研。
例如:intelligent (W) robot?
Wn(或nW)表示此算符两侧的检索词必须按输入时的顺 序排列,两词间最多插入n个单元词
例如:intelligent w1 robot*
N-Near
N算符是Near的缩写,表示此算符两侧的检索词必须紧 密相连,连接的词之间不允许插入任何其他单词或字 母,词序可颠倒。
循环法
循环法又叫分段法。是指常用法和引文法的结合。
既要利用检索工具进行常规检索,又要利用文献后所 附的参考文献进行追溯检索,分期分段地交替使用几 种方法。即先利用检索工具(系统)检索到一批文献, 再以这些文献末尾的参考目标为线索逆向查找,如此 循环进行,直到满足要求时为止。
利用这种方法能够保证所查的资料较全面、系统。
常用法。这是指利用各种类型检索工具,通过技巧查 找资料的方法。常用法又可分为顺查和倒查两种。
顺查法:
顺查法是指按照时间顺序,由远及近地利用检索系 统进行文献检索的方法。这种方法能收集到某一课题 的系统文献,它适用于较大课题的文献检索。
例如已知某课题的起始年代,现在需要了解其发展 的全过程,就可以用顺查法从最初的年代开始,逐渐 向近期查找。该方法优点是漏检率低,但工作量大。
限制截断:在词干后加若干截词符,限制可变化的位 数。
例如:educat?? 相当于educator、educated
中截断:把截词符号置于一个检索词中间,对词中间 出现变化的字符数加以限定。一般中截断仅允许有限 截断。
例如:organi#ation,可检索到包含organization和 organisation的记录。