文献检索步骤
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
文献检索步骤
检索步骤即检索过程,是根据检索课题要求,选择检索系统,确定检索标识,按照一定的检索途径和方法,查找出特定文献的过程。
1.分析研究课题
分析课题的目的是使检索者确定课题要解决的实质问题,即它所含的概念和具体要求及其之间的关系,这是制定检索策略的根本出发点,也是影响检索效率高低或成败的重要因素。
本步骤需明确以下具体问题:
(1)研究课题主题;
(2)课题所涉及的学科范围;
(3)课题所需文献的内容及其特征;
(4)课题所需文献的类型,包括文献的出版类型、所需文献量、年代范围、涉及语种、有关著者机构等;
(5)课题对查新、查准和查全的指标要求。
若要了解某学科、理论、课题、工艺过程等最新进展和动态,则要检测最近文献信息,强调一个“新”字;若要解决研究中某具体问题,找出技术方案,则检索要有针对性,能解决实际问题的文献信息强调一个“准”字;若要撰写综述、述评或专著,要了解课题、事件的前因后果,历史和发展,则检索详尽、全面系统的文献信息,强调一个“全”字。
2.选择检索工具/系统,确定检索方法
选择检索系统应注意:
(1)根据课题学科范围、所需文献类型,选择合适的检索系统;
(2)根据所具备的条件选择手工检索工具或计算机检索数据库,也可采用二者结合的方法;
(3)选择报道及时、收录文献全面、索引系统完备的检索系统;
(4)既要选择使用综合性的检索工具,也应注意选择使用专业性或单一性的检索工具。
检索的方法很多,在选择检索方法时,可根据课题性质、检索对象、检索范围和实际可能,确定某个具体课题的检索法,如采用追溯法、抽查法等。
3.确定检索途径
在利用检索工具查找文献时,主要利用检索工具的各种索引,即通过检索途径来查找文献线索。
检索工具检索途径类目很多。
首先应充分利用文献的外部特征即篇名、著者、文种序号等,利用文献外部
特征进行检索,非常方便且查准率比较高。
但在检索时,仅仅知道要检索的课题,就要利用主题索引和分类索引等。
其中主题途径是应用最普遍的途径。
4.确定检索标识(适用于计算机检索)
确定检索标识即选取检索词与构造检索式。
然而在实际检索电子资源过程中,我们往往会遗漏一些重要的检索词或选择了不恰当的检索词,这是因为对同一事物不同的人有不同的称呼和表达。
我们可以根据相关词汇的生成方式,总结出选取检索用词的几种方法:
(1)选取检索词
•内容分析
所谓内容分析,就是具体说明事物的组成部分。
以“发电厂烟气净化”为课题作内容分析:
发电厂烟气中含有:灰尘、二氧化硫、氮氧化物;
净化操作则由:除尘、脱硫、脱硝组成。
经过进一步分析可得出:
与除尘有关的内容有静电除尘、过滤、脉冲放电等相关的词;
与脱硫有关的内容有碱性吸附剂等相关的词;
与脱硝有关的内容有流态燃烧技术等相关的词。
对事物的内容和组成了解的越多,才可能提出较全的检索词,如果仅根据一两个浮于表面的抽象词语就会遗漏不少有用的检索词,所得到的文献也不能全面反映课题的内容。
“内容分析”方法可使用于集中检索某一专题的文献。
•异称分析
所谓异称就是在不同地区,不同时代,不同职,不同场合下,对同一东西的不同称呼。
常见的类型有:
学名与俗名如马铃薯与土豆、短路器与高压开关、电动机与马达、电力系统与电网、计算机与电脑等。
不同领域或行业的异称
•变体分析
所谓变体分析就是找出词的各种变化形式。
常见的有以下几种:
1.拼写差异
英美差异如center-centre,program-programme等;
2. 翻译差异:如DCS-分散控制系统,SMES-超导储能等;
3.全称与简称
如:北京大学-北大,USA-UNITED STATES OF AMERICAN等
(2)构造检索式
一般的课题名称及描述语句不能直接作为检索式使用,为了取得好多检索效果,我们需要深入了解课题内容和涉及的范围,查阅工具书,酝酿出用于上机的检索式。
这样的思维过程可以看成是一个从课题名称到检索式的转换过程,它包含了经验和理性的、规律和偶然的一些因素,因此对同一检索课题,不同的的检索者可构造出不同的检索式。
但不管如何,构造检索式有以下一些步骤:
•分析课题语句,对语句进行划分,确定课题所含的(内容)元素,即以词为单位划分句子或词组。
这一步骤应注意两个问题:
划分必须彻底,应该到词为止;
划分必须适度,只能到词为止。
例如:“电厂自动化设计展望”,可划分为“电厂”、“自动化”、“设计”、“展望”。
如果将电厂再划分为“电”、“厂”,就是划分过度。
“影响联合循环电站运行性能的因素”,可划分为“影响”、“联合循环”、“电站”、“运行”、“性能”、“的”、“因素”。
其中“联合循环”在电力工业中有特指性,所以不能将它分开。
•删除不具有检索意义的虚词、其他非关键以及过于宽泛和过分具体的限定词。
不具检索意义的词包括介词、连词、助词、副词等及其他非关键词。
一些过分宽泛的词因不触及问题的实质也应该删除。
例如:“电厂自动化设计展望”
“电厂”、“自动化”、“设计”、“展望”
“电厂”、“自动化”、“设计”
“影响联合循环电站运行性能的因素”
“影响”、“联合循环”、“电站”、“运行”、“性能”、“的”、“因素”
“影响”、“联合循环”、“电站”、“运行”
•替换、补充
有些检索课题的语词表达过于模糊、宽泛、狭窄或不可行,这时可以用概念替换补充法,引入更明确、更具体的概念作为替换词代替原有词,或者作为同义词和相关词增加到原来的概念组中,同时保留原有的词。
以“影响联合循环电站运行性能的因素”为例,通过划分和删除,我们可以得到这个课题较明确的一些概念,如联合循环、电站、运行等。
如果对它们进行更深一步的分析,可以得出更为详细的内容:
联合循环燃气、蒸汽联合循环/IGCC
燃气轮机、余热锅炉、汽轮机等
电站发电厂
•组合
经过对以上课题的分析,我们就可以对分析出的检索词进行组合以形成最终的检索式。
所谓对检索词的组合就是明确各词之间的逻辑关系。
我们常常用布尔算符、优先处理算符、字段限制等方法将检索词组合成检索式。
5.查找文献线索
从检索出的文献中发现新的检索线索,查看文献内容获得检索词、作者提炼的关键词、查看文献的参考文献,可以追踪获得一批相关文献。
6.索取原始文献
对检索到的文献线索进行研究和筛选,如确定所有一定参考价值,需要进一步了解并详细查阅原始文献资料,可根据文献线索查阅原始文献,通过文摘题录等提供的文献出处,向文献收藏单位索取原始文献。
1、明确检索需求及检索目标
在信息检索中,首先需要明确检索信息范围和检索目的,通常包括以下几个方面:
(1)检索信息的学科范围
(2)检索信息的类型
检索信息的文献类型是属于文献型,还是数值型、事实型;是全文型,还是书目型。
(3)检索的目的
如需要解决研究中的某一关键问题,要求查准率高;如开展科研立项、成果查新、专利申请等则要求查全率高;或者只需了解最新动态、研究进展等等。
2、制定检索策略
制定检索策略就是对检索的全面策划,在操作上主要指数据库的选择和检索式的编制。
前者取决于现有的数据库资源,后者则反映检索目标。
在实际操作过程中,检索策略往往侧重检索式的指定。
实际上,检索策略的制定体现在上述六个检索步骤中,任何一步都决定本次检索的成功。
我们用下图表示整个检索步骤和每一步所涉及的策略制定。
分析课题,明确检索要求
选择合适的检索工具(数据库)
制定检索策略,拟定检索式
课题概念分析,找出主要概念;了解数据库的用词特点、可检索字段、检索方法等
判断结果是否满意
分析结果,查找原文
修正检索策略
信息在哪里
准确提问,准确转化成检索语言
检索是一个反复更正的过程
分析信息及其潜在含义
3、选择数据库
数据库选择的准确与否将直接影响检索效果的好坏,数据库选择不恰当,即使是非常完美的检索策略,同样会导致检索失败。
因此,检索前要对所选数据库的专业范围、收录文献类型、时间跨度、检索方法等情况基本了解。
一般来说,选择数据库应遵循以下几条原则:
(1)根据检索目的确定所需数据库的类型
如需要统计数据,应检索数值型数据库;需要某一疾病的诊断标准,应检索指南类数据库;只需要文摘者,可检索书目型数据库;而需要原文者,可检索全文数据库。
(2)根据信息需求的内容、专业范围选择数据库
如检索专业性较强的课题,可选择专业数据库或某一数据库中的专业文档;如检索内容分布广泛或属交叉学科的课题,可同时检索多个不同的数据库。
(3)根据记录来源选择数据库
如数据库的记录来源是来自期刊、报纸还是会议资料、学会论文、科技报告等,有时还需考虑是否容易得到原始文献。
(4)根据熟悉程度选择数据库
当几个数据库内容交叉、重复率较高时,应首选自己熟悉的数据库,只有充分了解数据库的检索方法和特点,才能保证查全率和查准率。
4、分析课题,确定检索词,编制检索式
对课题进行主题分析,掌握课题的内容实质,找出最能代表主题概念的若干检索词。
正确的主题分析是制定检索策略的依据,它决定了检索策略的质量和检索效果的好坏。
进行主题分析,确定检索词、编制检索式的基本方法可归纳为如下几点:
(1)在所检数据库主题词与自由词并用时,应首先从相应的主题词表中选择所需的检索词,以便获得最佳检索效果。
(2)没有确切表达课题内容的主题词时,可采用自由词检索,此时应注意以下几点:
①使用各学科在国际上通用的、文献中出现过的术语。
尽量避免选用冷僻词和自选词,对于一些专业性极强的罕见词,确实是课题需要,也可选作检索词。
②从专业词典、手册、分类表以及期刊中选择检索词或者参考现有的原始文献。
③考虑同义词、近义词、上位词、下位词等,注意使用缩略语、截词以及西文的不同拼写形式等。
④分析课题的内容实质,找出隐性的主题概念,将抽象主题转化为具体概念,使用较专指的下位词。
(3)以课题核心概念为主,排除无关概念,把重复概念进行归并,简化检索式,提高检索效果。
过多过严的概念组配,很可能导致大量相关文献的漏检,甚至出现检索结果为零的情况。
(4)初步检索后,浏览检索结果,从记录中重新选择检索词进行检索。
这一方法主要适用于检索选词无把握或难以确定恰当检索词的情况。
(5)根据检索需求选择正确的检索途径。
如主题词途径、自由词途径、作者途径、期刊名途径、分类途径等。
(6)合理运用逻辑运算符构造检索式。
符号的使用一定要正确、符合概念逻辑,并力求简洁、优化,还应注意运算符的优先级和括号的使用。
5、随时调整检索策略
检索后通过查看文献检索结果数量的多少或相关程度的高低,可以评价检索策略的好坏。
通常情况下,需要多次修改检索策略,直到检索结果满意为止。
在实际检索中,当放宽检索以提高查全率时,就
会降低查准率;反之,当缩小检索范围以提高查准率时,就会降低查全率。
因此要正确分析误检、漏检原因,及时调整策略。
(1)误检原因分析
①没有对检索词进行限制。
包括字段限制,时间限制,分类限制等。
②主题概念不够具体或具有多义性导致误检。
③对所选的检索词截词截得过短。
(2)漏检原因分析
①错选数据库。
②检索概念太多、检索概念错误或拼写错误。
③选用了不规范的主题词或某些产品的俗称、商品名作为检索词。
④同义词、近义词或隐含概念没有充分考虑。
⑤上位概念或下位概念没有完整运用。
⑥位置运算符过多、过严格或字段限制太严格。
(3)缩小检索途径的方法
①进行加权检索;
②提高检索词的专指度,选用下位词或专指性较强的自由词检索;
③减少同义词与同族相关词;
④增加限制概念,采用逻辑“与”连接检索词;
⑤使用字段限定,将检索词限定在某个或某些字段范围;
⑥使用逻辑”非”算符,排除无关概念;
⑦调整位置算符,由松变严;
⑧浏览部分中间检索结果,从检出的记录中选取新的检索词对中间结果进行限制。
(4)扩大检索途径的方法
①降低检索词的专指度,选用上位词或相关词检索;
②选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度;
③减少逻辑“与”的运算,丢掉一些次要的或者太专指的概念;
④去除某些字段限制;
⑤调整位置算符,由严变松;
⑥去除文献类型、年份、文种等文献外表特征的限定;
⑦选择更合适的数据库。
6、输出和分析结果
检索完成后,采用一定的输出方式(套录或打印)和格式输出检索结果。
各个数据库提供了多种输出格式,每种格式能得到的文献内容特征和外表特征都不一样,一般情况下,文献检索中篇名、作者、出处、文摘等字段是不可缺少的,因为这些字段有一定的参考意义。
结束检索后,对结果进行分析,也是完整检索过程中不可缺少的一步,有助于提高检索质量。