基于位置检索信息检索技术的研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于位置检索信息检索技术的研究

[摘要]:本文主要阐述了位置检索技术的基本概念、分析了位置检索技术的特点和优缺点,并指出了位置检索技术的发展方向。

[关键词]:信息检索技术位置检索位置检索

在过去的几年里,网络信息资源已呈现出指数级增长的态势,为了有效、快速、准确地在信息海洋中找到人们所需要的信息,已是信息时代人们的重要需求,因而,作为根据互联网信息的特点而发展起来的一种检索方式,信息检索技术在信息社会中将发挥越来越重要的作用。目前已广泛应用于网络的信息检索技术主要有布尔逻辑检索、截词检索、位置检索、字段限定检索、加权检索和聚类检索等六种。位置检索作为其中一种重要的检索技术,能把文献中出现的每一个词( 或字) 都作为检索入口的基于全文标引的检索过程和技术,文献中任何有检索意义的词或字串都可被检索出来。使检索更直接、更彻底,对目前网络信息检索技术的研究有重要的意义。

一、位置检索的基本概念

位置检索也叫全文检索、临近检索。就是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接以全文本信息作为主要处理对象,使用自由词进行检索并根据数据资料的内容而不是外在特征来实现的信息检索手段。它的基本工作方式是能够将所有包含检索词的文献检索出来,不管这个词出现在文献的什么位置,或者说文献中的任意一个词都可以作为检索到该文献的条件。位置检索提供存取全文文本(指原始记录)的空间,文本中任何字符和字符串均可作为检索的入口点,位置检索是以原始记录中的检索词、字间的特定位置为对象的运算,对文献不作标引,故没有标引用词[1]。位置检索主要分为两类: 基于关键词匹配的精确检索和根据内容的概念检索[2]。

二、位置检索技术的分析

2.1.位置检索技术的特点

从基本概念、实现条件和实际应用中可以看出,位置检索技术具有包含信息的原始性;信息检索的彻底性;所用检索语言的自然性和数据相对稳定性的特点。这些使得位置检索其他检索无法比拟的灵活、简便的优势。但是由于自然语言缺乏规范的固有特点,也存在误检现象多的缺陷。

2.2 位置检索技术的优点

位置检索具有以下优点:自动建立数据库,速度快;不存在词汇滞后问题;可

以直接提供原文献、具有直接客观性。它提供存取全文文本的空间,能直接检查原始文献或解决问题所需要的文献资料,不必进行二次检索,既直接又保证了客观性。位置检索得到的是全文文本,而不是文献的摘要或替代品。位置检索技术具有详尽彻底性,可对文中任何字、词、句进行检索,还可表示检索词间的复杂

位置关系,文献的正文部分或附属部分都可以检索和显示。用户使用时无须提供专业化的检索条件,借助截词、邻接等匹配方法,文本中任何字符或字符串都可作为检索的入口点,用户可直接查询文本中的任何部分或特定单元,查询效率大大提高。[3]

2.3 位置检索技术的缺点

语词与概念之间存在着多对多的关系,一个语词可以表达多个概念,同时一个概念也可以用多个不同的词来表达。自然语言的这种情况给基于关键词的信息检索造成了一定的困难。基于关键词的位置检索是以文档中有没有检索要求中的关键词来召回检索结果,而不是以检索词所表达的意思来召回结果的。从这个角度来说,位置检索可能会造成大量的漏检。位置检索系统不适应于学科或专业的分类检索要求;越是被论述得多的事物,越难在位置检索系统中得到满意的检索结果。

三、中文位置检索技术的发展方向

目前,位置检索技术日益成熟,文献型的检索系统的开发和使用也相当广泛,在索引结构、检索技术、自动标引等相关领域取得了显著进展,但是现在信息检索的研究和开发工作也面临着许多的挑战。在网络时代,新一代自然语言将成为检索语言发展的方向。

因此,中文自然语言处理仍然是关键因素,没有领先的中文自然语言处理技术,信息检索就无法在检索效果“质”的方面取得突破。[3]未来的位置检索技术必须从深度和广度上提高位置检索的性能、研发多种检索工具从数据挖掘角度来提高位置检索的查全率和查准率,提供更易使用的自然语言查询接口,进一步提高链接技术,成为集成多种检索方法的检索系统,从而更好的适应社会信息容量增长的检索需求。

参考文献:

[1] 郭绍华. 网络信息检索技术的现状及发展趋势[J].黑龙江教育学院学报,2011年6 月第30 卷第6 期

[2] 柳群英. 网络信息检索技术现状及发展趋势[J]. 情报探索,2010年3月第4 期( 总第96 期).

[3]孙清玉. 有效的信息检索技术———全文检索[J]. 情报探索,2010 年2 月第2 期(总148 期)

[4] 曹元大,贺海军,涂哲明,王琴. 全文检索字索引技术的研究与实现[J]. 计算机工程,2002年6月第28卷第6期

相关文档
最新文档