信息检索第六章计算机信息检索概

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章计算机信息检索概述

6.1计算机信息检索的含义和特点

一、计算机信息检索的含义

计算机信息检索:人们根据特定的信息需要,按照一定的方法,利用计算机从相关的信息检索系统中识别并获取所需的信息。包括信息存储过程和信息检索过程。

二、计算机信息检索发展简史

1、脱机批处理检索:20世纪五六十年代是脱机批处理检索的试验和实用化阶段。这一时期,计算机尚未连接通信网和远程终端装置,主要利用计算机进行现刊文献的定题检索和回溯检索。当时的信息检索是脱机批处理检索,即用户向计算机操作人员提问,操作人员对提问内容进行主题分析,编写提问式输入计算机建立用户提问档,按提问档定期对新到的文献进行批量检索,并及时通知用户。同时这一阶段开始利用计算机编辑出版检索性刊物。

2、联机检索阶段:20世纪60-80年代是联机检索的试验和实用化阶段。第三代集成电路计算机,存储介质,存储容量,数据库管理,通信技术的发展为联机检索提供了技术支持。随着国际联机检索系统的发展,信息检索在这一阶段实现了远程实时检索。

3、光盘检索阶段:20世纪80年代以来,新型信息载体激光光盘在信息检索领域得到广泛应用。光盘检索操作方便,不受通信线路影响。早期是单机驱动器和单用户,为解决多用户同时检索的要求,出现了复合式驱动器,自动换盘机,光盘网络技术。

4、网络化联机检索阶段:20世纪80年代以来,随着TCP/IP协议的普遍采用,美国国家科学基金会的接入,计算机检索发展到了今天的网络化联机检索阶段。互联网具有广泛性方便性的特点,使许多联机检索系统纷纷上网,除保留原来服务项目和内容外,还增加了许多新的动态信息服务。同时以搜索引擎为核心的网上搜索技术也日益发展,成为当前最具有普遍意义的信息检索形式。

三、计算机信息检索的分类(不同标准不同类型)

1、根据所检索数据库的形式:①书目检索:查出某一主题的文献条目的检索,包括题录检索,文摘检索等②数据检索:查出有关数据的检索,以求得某一问题量化的准确数值,包括统计数据和科学数据③事实检索:查出有关事件或实在情报,以求得对某一问题的解答。④全文检索:直接利用原始文献建库进行的检索。

2、根据计算机检索服务方式:①定题检索:根据用户检索课题内容,定期从新到资料库中为用户提问进行计算机检索的服务方式。特点:定期性新颖性批处理性②回溯检索:指追索过去的信息,也可用于查找最新信息,能适应多数用户的查询需要。可用于申请专利的新颖性,科研立项的查新,撰写论文和编写教材的信息收集。③日常检索:用户根据自己的信息需求,直接利用终端检索,检索系统即使提供用户所需的信息。

3、根据检索方式:①脱机检索:成批处理检索提问的计算机检索方式,计算机检索的初期类型②联机检索:利用检索终端和通信线路,直接查询检索系统数据库的计算机检索方式③光盘检索:以光盘数据库为基础的一种独立的计算机检索,包括单机光盘检索和光盘网络检索④网络检索:利用检索工具在互联网上进行信息存取的行为,目前主要利用的信息检索系统是搜索引擎。

四、计算机信息检索的特点

手工检索:人们长期以来采用的文献信息检索的传统方法,人们借助简单的机械工具,直接凭头脑进行判断,对记录在普通载体上的资料进行相应的检索。

优点:①直观性强②灵活性高③费用比较低

缺点:①检索速度慢②时空限制强③更新周期长④新颖性时效性低⑤检索途径少

1、检索范围大:由于计算机的运算速度高和数据库存储量大,计算机信息检索系统收录了数量巨大内容全面的信息。仅联机检索系统就能提供成百上千个数据库的检索,搜索引擎更是收录了庞大的网路信息资源。

2、检索速度快:计算机的快速检索能力保证了计算机检索系统的检索速度,手工检索需要数日数周的课题,计算机检索几分钟甚至几秒钟就可以完成检索。

3、检索功能强,组配灵活:①布尔检索词组检索限定检索截词检索字段检索等②提供多途径检索

4、检索途径多:①除手工检索的途径外,还能满足多途径交叉检索的需要,尤其适用于综合性课题的检索②大部分检索系统还能提供题名作者关键词等等检索途径。

5、数据更新及时,时效性强:光盘多为每月更新一次,网络则为每天更新一次

6、检索结果输出形式多样:①检索结果可选择直接浏览,存盘,打印,E-mail传输检索结果等②部分检索系统还提供不同字段输出形式③或者选择简单格式和详细格式两种检索结果显示形式

缺点:①计算机信息检索系统所收录的数据回溯时间有限,不能满足所有的信息查询需要②计算机检索需要有一定的计算机知识,需要一定的计算机环境,不适合每一个信息需求者。

当前,计算机检索成为人们检索信息的主要途径,但手工检索和计算机检索还将在长时间内共存。

6.2计算机信息检索策略

一、检索策略的含义和作用

检索策略:在分析检索课题内容实质基础上,选择检索系统检索途径,确定检索词及相关的逻辑关系等的信息检索方案。实质是对检索过程的科学规划。关键是构造确切表达信息需求的检索表达式。

作用:①优化检索过程②有助于提高查全率查准率③节约检索时间费用④取得最佳检索效果(正确的检索策略的作用)

二、检索表达式

检索表达式:是检索策略的具体体现,简称检索式。一般由检索词和各种逻辑运算符组成,将检索词之间的逻辑关系位置关系等用检索系统规定的各种逻辑算符连接起来,成为计算机可以识别和执行的命令形式。

(一)逻辑表达式:

逻辑表达式:利用布尔算符,对检索词的关系进行表达,又称布尔逻辑表达式。布尔算符是19世纪英国数学家乔治.布尔发明的,以集合论和布尔逻辑为理论基础,是目前计算机检索最简单最基本的匹配模式。有逻辑与“and”逻辑或“or”逻辑非“not”

逻辑与“AND”表示它所连接的两个检索词必须同时出现在结果中,检索式可写为:A AND B,含义为A与B重合部分。有些数据库中用“*”表示。可用来提高查全率。

逻辑或“OR”表示它所连接的两个检索词任意一个出现在检索结果中就满足检索条件,检索式可写为:A OR B,含义为A与B的并列关系,用来表达概念的同义词近义词相关词等扩大检索范围保证查全率。有些数据库中用“+”表示。

逻辑非“NOT”表示它所连接的两个检索词要从第一个概念中排除第二个概念,检索式可写为:A NOT B。表示具有不包含某种概念关系的一组组配,用来缩小检索范围,在实际检索中要慎用。一些中文数据库中用“-”来表示。

相关文档
最新文档