浅谈现代信息检索技术的发展

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

浅谈现代信息检索技术的发展

要想充分利用这些浩如烟海的文献信息资源,必须借助各种各样的检索工具。同时,因特网信息资源的骤增及其异构性、动态性,不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理,从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。下面就知识检索与信息检索的关联和发展,作初步的探讨。一、布尔检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。

②“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。二、信息检索信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。它是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序数据查找、字符匹配,实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术,改进了基本检索功能,但缺点是对精确的提问不能给出精确的回答。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。

三、知识检索知识检索的基本思想是,模拟扩展人类关于知识处理与利用的智能行为和认识思维方法,是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如:抽象思维方法,形象思维方法。知识检索具有明显的优势:①实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析预测后的超前性领域成果或知识。②提供主动服务方式,自动优化用户需求,主动提供个性化检索。③面向用户,依据用户的需求及其变化,能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术,全面提高检索效率。知识检索是综合应用信息管理科学人工智能认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取所有媒体类型的知识源,并能准确精选用户需要的结果。四、智能检索智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索

出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。五、计算机信息检索随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时睛报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。DiMog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。在单语言检索中,计算机检索系统利用网络蜘蛛进行网络信息的收集,然后利用自动标引技术对搜集的信息进行标引形成索引信息库。用户输入检索式后,计算机把检索式与数据库中索引项进行匹配,按索引式与标引项相关性大小降序输出检索结果。跨语言检索中,只要在检索过程中加入语言处理技术,就可以使一种语言与其他语言对应。信息检索是经济生活和科学研究的一个重要组成部分,尤其在今天这个飞速发展的信息时代,如何广泛、快速、准确地获取对自己有价值的信息,特别是如何借助电子化、网络化的手段去获取有价值的信息,直接影响到教学、科研等工作的成败。因此信息检索的方法和技能,越来越成为现代科技工作者和教师所必备的基本技能。目前,计算机信息检索已成为广大用户获取信息的主要方式,而且呈现出联机信息检索、光盘信息检索以及因特网信息检索多元并存的信息检索格局。如何快速、准确及有效地检索到所需信息,已成为日益突出的问题,那么,了解各信息检索系统的特点是实施信息检索最基本的前提。下面就其三种计算机信息检索系统作一介绍。 1.联机信息检索系统。所谓联机信息检索,是指信息用户利用终端设备,通过国际通讯网络与世界上的信息检索系统,进行直接的人机对话,从检索系统的数据库中查找出用户所需信息的全过程。一个联机信息检索系统,通常由检索服务机构、国际通讯网络和终端组成。 2.光盘信息检索系统。光盘信息检索系统是单机信息检索系统的一种,它解决了单机检索系统数据存储量少的缺点,是目前应用较为广泛的一种计算机信息检索系统。在信息检索领域应用的光盘主要是只读光盘。 3.因特网信息检索。作为用户最多、影响最大的计算机网络,因特网堪称世界上资源最丰富的信息库和文档资料库,几乎能满足全球范围内对任何信息的需求。因特网信息检索系统一般由计算机服务器、通信网络、通信协议。网络信息检索服务器、用户终端等构成。六、网络信息检索网络信息检索简单地10说就是网络环境下的信息检索。它与传统信息环境下的检索有很大的不同,网络信息检索具有多样性、灵活性也超出了传统的信息检索。原来传统途径可获得的信息,现在几乎全部可以通过网络检索得到,而且更快、更新、更准确。随着计算机、多媒体和现代通讯技术的飞速发展,以印刷型文献为主的学校图书馆开始向以电子信息和虚拟信息为主的数字图书馆转化,Internet创造了丰富和多元化的学习资源,实现了资源共享。随着学习社会化、终身学习体系的诞生和进一步推进,网络在中小学教育中的应用也日益广泛和深入起来。Internet为我们带来了丰富的学校综合教育信息资源,它是提供Internet上的可用于学校综合教育过程的,在学校教育系统中传递的信息。近几年,Internet的发展使信息采集、传播和利用无论是从规模还是速度都达到了空前的水平。信息内容涉及广泛,几乎包括工农业生产、科技、教育、文化艺术、商业、资讯、娱乐休闲等诸多方面。在Intemet上,购物、在线教育、在线股市、远程医疗、点播电影、网络会议、网络展览都已变成现实,成为人类技术和文明的巨大财富,是全球取之不尽,用之不竭的信息资源基地。丰富信息资源带到人们面前的同时,也带来了问题:人们在

相关文档
最新文档