计算机检索的步骤和方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机检索得步骤与方法

1、明确检索要求与检索目标

计算机检索得第一步准备工作就是明确检索要求与检索目标。明确检索要求就就是要搞清楚本课题属于什么学科,所需文献得类型及语种,查找文献得年代,所需文献得最佳篇数,允许支配得检索费用。这些要求对选择数据库、构造检索策略都就是十分重要得.

确定检索目标也就是进行计算机信息检索前应搞清楚得准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关得全部文献,即要求较高得查全率;以便充分地做好开题得准备工作;如果属于探索性、开创性得课题,则只需要查出一些启发性得文献,对查准率与查全率要求都不一定有很高得要求。

2、课题分析

2、1课题概念得分析方法

分析课题就就是分析出课题所涉及得主要概念,并找出能代表这些概念得若干个词或词组,进而分析概念之间得上、下、左、右关系。对于新学科、交叉学科与边缘学科得课题,则要搞清楚这些概念之间得关系.概念分析得结果应以概念组为单元得词或词组得形式列出,以便下一步制订检索策略时使用。

2、2隐含概念得分析方法

有些课题得实质性内容往往很难从课题得名称上反映出来,课题所隐含得概念与相关得内容需要从课题所属得专业角度作深入分析,才能提炼出能够确切反映课题内容得检索概念.例如:”社会保障"包含”养老保险"、”失业保险"、”医疗保险”与"社会救济”等概念,如果要检索社会保障方面得文献,应该析出上述概念,才能保证文献得查全率。

2、3核心概念得选取

有些检索词中已经含有得某些概念,在概念分析中应予以排除。例如:课题”公司劳动奖励、职工培训与养老保险制度管理得理论与实践",如果把”劳动奖励","职工培训”,"养老保险”,"公司",”制度","管理”六个概念全部组配起来,则会造成大量文献漏检.实际上,劳动力资源管理已经包含了劳动奖励、职工培训与养老保险三个方面,而且,劳动力管理

必然就是针对该三个方面而言得。因此,本课题只须采用”劳动力资源”与”管理”这两个本质概念即可。

为了提高文献得查准率,应该从相应得规范词表中选择所需得检索词。并且在确定检索词时,除了要考虑反映主题概念得同义词、近义词等相关得检索词外,还要注意选择被选用检索词得缩写词与不同拼法得词,以避免漏检有关得文献.

3、检索词得扩展、选择与处理

目前得计算机信息检索系统,还不具备智能思考得能力,还不会对所输入得检索词以及涉及得所有词进行自动、全面得检索,因此,必须在概念分析得基础上列出与概念有关得词,从中做出选择,并利用截词等方法对检索词予以归并.

3、1相同概念得检索词得扩展

扩展相同概念得检索词得方法一般有同义词方法、主题词表方法与截词方法(1)同义词方法。在同一概念得范畴内,从语言角度,选择不同得名称、不同得拼写方法与单复数形式。不同得名称包括学名与俗名、简称与全称,商品名与物质或产品名,事物得代码与事物得学名.不同得拼写方法,以英语为例,包括英式英语与美式英语得区别。

(2)截词方法。当某些检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词得单复数变化与英美不同拼写形式),可以采用截词方法扩展检索词。这种方法要求在词干后使用截词符。截词符一般包括”?”与”*"两种。具体采用什么形式,各个系统都有明确得规定。例如:在DIALOG系统中,截词符号有无限截词算符(”?") 与有限截词(”??”与"???")等多种,”?"有时还用做字符屏蔽符。

(3)主题词表方法。许多数据库都编有自己得主题词表。在数据库编有主题词表得情况下,应该尽量从词表中选择检索词。使用主题词表,不仅可以使检索词更加规范,提高检索结果得准确性,而且可以从同族词中选取更多得上位词、下位词、相关词,使获得得检索结果更为理想。

3、2检索词得选择与处理

运用上述方法得到得词,首先应加以选择,并且注意选用本专业通用得术语(应避免使

用冷僻词与根据中文术语自译生造得词),然后以概念为单位,构成组面(facets).例如:课题"东西方社会保障制度比较研究"得概念组面与检索词为:

概念组面1:"社会保障” social security 概念组面2:"制度研究”system? Resear ch

4、数据库得选择

不同数据库得学科范围不同,检索指令不同,收费得标准也不同.所以,在检索之前应该阅读有关数据库得使用介绍,以便选择数据库时做到心中有数。

选择数据库,我们一般应该遵循以下几条原则:

1。按照课题得检索要求与目得,选择收录文献种类多、专业覆盖面宽、年代跨度对口得数据库;

2。当需要查找最新文献信息时,选择数据更新周期短得数据库;

3.当还需要获取原文时,选取原文获取较容易得数据库;

4。在同时有多个数据库可供选择得情况下,应首先选择比较熟悉得数据库.

5.当几个数据库得内容交*重复率比较高时,应选择检索费用比较低得数据库。

5、检索策略构成与调整方法

在实际检索过程中,仅需一个检索词就能满足检索要求得情况并不很多.通常我们需要使用多个检索词构成检索策略,以满足由多概念组配而成得较为复杂课题得要求。

检索策略,又称提问逻辑,就就是对多个检索词之间得相互关系与检索顺序作出得某种安排。构造检索策略就就是运用计算机情报检索系统可以接受得方法,包括布尔逻辑算符、位置逻辑算符等方法,表达课题检索要求得过程。

5、1布尔逻辑算符

规定检索词之间得逻辑关系得算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑"或(OR)"、”与(AND)”与”非(NOT)”。

(1)或(OR)运算符。也可用”+”代替,就是用来组配具有同义或同族概念得词,如同义词、相关词等。其含义就是,检出得记录中,至少含有两个检索词中得一个。OR算符得基本作用就是扩大检索范围,增加命中文献量,提高检索结果得查全率,OR运算符还有一个去重得功能。在实际检索中,同一组面中含义相同得词,相互之间都使用OR运算符。另外,在使用截词方法检索具有相同词干得检索词时,这些词之间也自动地隐含了逻辑"或"得关系. (2)与(AND)运算符.也可用”*”代替,用来组配不同检索概念。其含义就是检出得记录必须同时含有所有得检索词。AND算符得基本作用就是缩小检索范围,减少命中文献量,提高检索结果得查准率.在实际检索中,不同概念组面之间以及同一组面内得不同含义得词之间通常使用AND算符。

(3) 非(NOT)运算符。也可用”-"代替,但在检索时建议使用NOT,以避免与词间得分隔符”—”混淆,NOT算符就是排除含有某些词得记录得,即检出得记录中只能含有NOT算符前得检索词,但不能同时含有其后得词。NOT算符得基本作用就是缩小检索范围,提高检索结果得查准率、

对于一个复杂得逻辑检索式,检索系统得处理就是从左向右进行得。在有括号得情况下,先执行括号内得运算;有多层括号时,先执行最内层括号中得运算,逐层向外进行.在没有括号得情况下,And、Or、Not得运算次序,在不同得系统中有不同得规定。

5、2 位置算符

位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定得顺序出现得场合,比如,以词组形式表达得概念;彼此相邻得两个或两个以上得词;被禁用词或特殊符号分隔得词等。位置算符就是调整检索策略得一种重要手段.按照两个检索词出现得顺序与距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定得位置算符也不同。例如,pendex光盘数据库使用得位置算符”(N)"(表示其两侧得检索词必须紧密相连,除开空格与标点符号外,不得插入其它词或字母,两词得词序可以颠倒)、"(F)”(表示其两侧得检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词得词序可以颠倒)、”(S)"(表示其两侧得检索词必须在同一句子中出现,两词得词序可以颠倒)与”(W)”(表示其两侧得检索词必须紧密相连,除开空格与标点符号外,不得插入其它词或字母,两词得词序不可以颠倒)四种(如下所列)。

相关文档
最新文档