浅谈信息检索技术的发展

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浅谈信息检索技术的发展

(建筑X2012250015赖永迈)

摘要:信息检索就是给定用户需求返回满足该需求信息的一门学科,通常涉及信息的获取、存储、组织和访问,是信息用户为处理解决各种问题而查找、识别、获取相关的事实、数据、知识的活动及过程。本文阐述了信息检索理论及技术的发展历史,对信息检索的发展趋势进行了简要分析。

关键词:网络信息检索发展历史

21世纪是信息化社会,互联网的信息量太大、噪音太多,寻找所需要的信息非常不容易,信息素质成为评价人才的重要因素,利用现代信息技术获取信息能力,已成为一种基本生存手段和必要的技能。

信息检索是给定用户需求返回满足该需求信息的一门学科。通常涉及信息的获取、存储、组织和访问及从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。

信息检索技术是内容应用特别是互联网内容应用的核心技术,可以说在这些应用中无处不在,信息检索将会成为一门计算机专业的基础学科。那么,在现实生活中,信息检索可以用于哪些应用呢?从国家层面的需求来说,信息检索可广泛地用于情报处理、国家安全等,从企业层面的需求来看,信息检索可广泛地用于搜索、推荐、挖掘类应用,可谓无处不在,无孔不入,在很大程度上方便了国家和人民的生活,是推进社会文明的强大力量,其中坚力量不容小觑。

了解信息检索背后的基本原理和技术发展史,能够进行深层的研究或开发相关的应用。信息的查找萌芽于图书馆的参考工作。“信息检索”一词出现于20世纪50年代。信息检索包括3个主要环节:①信息内容分析与编码,产生信息记录及检索标识。②组织存贮,将全部记录按文件、数据库等形式组成有序的信息集合。③用户提问处理和检索输出。关键部分是信息提问与信息集合的匹配和选择,即对给定提问与集合中的记录进行相似性比较,根据一定的匹配标准选出有关信息。它按对象分为文献检索、数据检索和事实检索;按设备分为手工检索、机械检索和计算机检索。由一定的设备和信息集合构成的服务设施称为信息检索系统,如穿孔卡片系统、联机检索

系统、光盘检索系统、多媒体检索系统等。信息检索最初应用于图书馆和科技信息机构,后来逐渐扩大到其他领域,并与各种管理信息系统结合在一起。与信息检索有关的理论、技术和服务构成了一个相对独立的知识领域,是信息学的一个重要分支,并与计算机应用技术相互交叉。

一、计算机信息检索的发展阶段

计算机信息检索的发展过程是与计算机技术及其它现代科学技术的发展过程紧密相关的。计算机用于信息检索始于50年代初,在40多年的发展历史中,计算机信息检索大体经历了三个发展阶段。

(一)脱机检索阶段

此阶段是从50年代中期到60年代中期。自1946年2月世界上第一台电子计算机问世以来,人们一直设想利用计算机查找文献。进入50年代后,在计算机应用领域“穿孔卡片”和“穿孔纸带”数据录入技术及设备相继出现,以它们作为存贮文摘、检索词和查询提问式的媒介,使得计算机开始在文献检索领域中得到了应用。

1954年,美国海军兵器中心首先采用IBM-701型计算机建立了世界上第一个科技文献检索系统,实现了单元词组配检索,检索逻辑只采用“逻辑与”,检索结果只是文献号,1958年,美国通用电器公司将其加以改进,输出结果增加了题名、作者和文献摘要等项目。1964年,美国化学文摘服务社建立了文献处理自动化系统,使编制文摘的大部分工作实现了计算机化,以后又实现了计算机检索。同年,美国国立医学图书馆建立了计算机数据库,即医学文献分析与检索系统,不仅可以进行逻辑“或”、“与”、“非”等种运算,而且还可以从多种途径检索文献。

这一阶段主要以脱机检索的方式开展检索服务,其特点是不对一个检索提问立即作出回答,而是集中大批提问后进行处理,且进行处理的时间较长,人机不能对话,因此,检索效率往往不够理想。但是,脱机检索中的定题服务对于科技人员却非常有用,定题服务能根据用户的要求,先把用户的提问登记入档,存入计算机中形成一个提问档,每当新的数据进入数据库时,就对这批数据进行处理,将符合用户提问的最新文献提交给用户,可使用户随时了解课题的进展情况。

(二)联机检索阶段

此阶段是从60年代中期到70年代初。由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以通过检索终端设备

与检索系统中心计算机进行人机对话,从而实现对远距离之外的数据库进行检索的目的,即实现了联机信息检索。

这个时期,由于计算机处理功能的加强,数据存贮容量的扩大和磁盘机的应用,为建立大型的文献数据库创造了条件。例如美国的DIALOG系统(DIALOG对话系统)、ORBIT系统(书目情报分析联机检索系统)、BRS系统(存贮和信息检索系统)、欧洲的ESA-IRS系统(欧洲航天局信息检索系统)等都是在此时期开始研制并逐步发展起来的,并且均在国内或组织范围内得到实际应用。

可以说,联机检索是科技信息工作、计算机、通讯技术三结合的产物,它标志着70年代计算机检索的水平。

(三)网络化联机检索阶段

此阶段是从70年代初到现在。由于电话网、电传网、公共数据通信网都可为情报检索传输数据。特别是卫星通信技术的应用,使通信网络更加现代化,也使信息检索系统更加国际化,信息用户可借助国际通讯网络直接与检索系统联机,从而实现不受地域限制的国际联机信息检索。尤其是世界各大检索系统纷纷进入各种通信网络,每个系统的计算机成为网络上的节点,每个节点联接多个检索终端,各节点之间以通信线路彼此相连,网络上的任何一个终端都可联机检索所有数据库的数据。这种联机信息系统网络的实现,使人们可以在很短的时间内查遍世界各国的信息资料,使信息资源共享成为可能。

可以说,联机网络和检索终端几乎遍及世界所有国家和地区,使得国际联机信息检索的发展达到了相当高的水平,开展商业性国际联机检索服务的大机构已达200余家,像美国的DIALOG信息公司已成为全世界最为著名的联机检索服务机构。

在未来的信息检索发展中,信息检索将朝着智能化,可视化,简单化,多样化,个性化,商业化方向发展。

一、智能化

智能化是网络信息检索未来主要的发展方向。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预,这意味着用户将彻底从繁琐的规则中解脱出来。

二、可视化

相关文档
最新文档