现代信息检索系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

②联机检索(1965-1991)
1965 年 美 国 系 统 发 展 公 司 ( SDC ) 研 制 成 功 ORBIT ( on-line retrieval of Bibliographic Information-time Shared )联机情报检索软件, 开始了联机情报检索系统阶段。与此同时,美国洛 克希德公司研制成功了 Dialog检索系统。至今,该 系统仍为世界上最著名的信息检索系统。70年代卫 星通讯技术、微型计算机以及数据库生产的同步发 展,使用户得以冲破时间和空间的障碍,实现了国 际联机检索。远程实时检索多种数据库是联机检索 主要的优点。计算机检索技术从脱机阶段进入联机 信息检索时期。联机检索是计算机技术、信息处理 技术和现代通信技术三者的有机结合。
③网络化联机检索(1991-目前)
Internet在六七十年代初见雏形,八十年代末开始迅速流行。此时, 单纯的手工检索和机械检索都显露出各自或多或少的缺点,因此极有必 要发展一种新型的信息检索方式。在通信和网络技术扶持下,出现了各 种信息利用工具。如:WWW浏览器——优秀的万维网有取代其他工具的 趋势;Windows平台配备的性能优良的电子邮件工具;思维机器公司推 出了WAIS,允许用户检索整个因特网上文本信息资源;明尼苏达大学推 出了Gopher,使用户能十分容易地存取因特网上的信息资源;针对FTP 资源的Archie ;BBS等等。WAIS的进一步发展,传统的联机检索向因特 网上迁移。网络信息检索系统包括了计算机在信息检索领域表现出来的 全部优点。它是联机检索的高级阶段,使人们可以在很短的时间里查找 到全球的信息。值得指出的是,网络信息环境的出现,使得信息检索研 究的对象和范围不断扩大,研究队伍也突破了原有的以图书情报领域的 专家学者为主的框架,众多的信息公司加入到研究开发信息检索系统的 行列。可以说,网络使计算机信息检索技术进入一个崭新发展阶段,而 网络信息检索又使得网上信息源利用率提高,信息组织更为有序和高效。 总之基于因特网的检索系统成为网络信息检索系统的代表。
②Google搜索引擎
Google在 1998 年由斯坦福大学的博士生 Larry Page 和 Sergey Brin在其 宿舍里创立,一年后进入商业运营。Google 是由英文单词“googol”变化而来。 “ googol” 是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个 词 , 表 示 1 后 边 带 有 100 个 零 的 数 字 , 经 “ Mathematics and the Imagination”一书广为流传。Google 使用这个词代表公司想征服网上无穷无尽 资料的雄心,体现了公司整合网上海量信息的远大目标。 Google的“蜘蛛”程序名为“Googlebot”,Google一般每隔28天派出“蜘蛛” 程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该 网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越 快。 搜索的网页80亿;图片10亿;Usenet信息10亿,其中提供的帖子超过10亿, 时间可以追溯到1981年;可用语言100多种;搜索结果所采用的语言35;国际域 名100多个;员工全球3,000多人。 Google 开发出了世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。 Google 每天需要提供 1.5 亿次查询服务。Google 富于创新的搜索技术和典雅 的用户界面设计使 Google 从当今的第一代搜索引擎中脱颖而出,所代表的已 不仅仅是某项先进的技术,而是一种新兴的文化。Google 的结构设计排除了竞 价排名,可以诚实、客观并且方便地帮您在网上找到有价值的资料。
网络数据库检索系统的特点
网络数据库检索系统的特点: ★数据库分布式存储,且多存放在硬盘上,因此数量多,信息量大。同时由 于超文本语言和超文本传输协议的作用,提供了大量相关资源的链接,使资源内 容更加丰富。 ★数据库内容形式向多媒体化发展,不仅有文本,还有大量图像、动画、声 音等,给用户提供了更为直观的服务。 ★数据库更新速度快,一般为日更新。 ★数据库和系统分布式管理,响应速度快。 ★检索模式:客户端/网关服务器/服务器方式为主,客户方在微机上运作, 分析从服务器上返回的数据,给用户显示信息;服务方则给用户提供客户端应用 程序,通过网关分析处理各类请求,并提供数据服务,提高了检索效率。 ★应用程序与数据隔离,数据相对独立、完整、安全性好;但对客户方来说, 由于访问是通过互联网进行的,安全性较差。 ★信息组织模式:非线性化,超文本形式,因此可以从某一资源点上快速、 直接地指向相关资源链接点。 ★检索机制:检索功能强,索引多,多数通过WWW浏览器提供检索,对非专业 人员来说,易学易用。缺点是,不同的数据库使用的检索系统不同,检索命令也 不尽相同,仍需用户不断学习。 ★检索环境宽松,检索费用较联机检索低很多。但由于数据库开发费用较高, 价格较高,因此总体费用高于光盘检索。 网络数据库的发展兴起于20世纪90年代中期,很快就得到了用户的好评和广泛使 用,在网络条件好的地区尤其如此。3、搜索引擎检索①搜索引擎②Google搜索引擎
①搜索引擎公司 ( , Inc) 于 1999 年底占国内80%的市 场份额。功能完备,搜索精度高,除数据库的规模及部分特殊搜索功能外, 其他方面可与搜索引擎业界领军人物 Google相媲美,在中文搜索支持方面 有些地方甚至超过了 Google ,是目前国内技术水平最高的搜索引擎。为பைடு நூலகம் 括 Lycos 中国、 、 21CN 、广州视窗等搜索引擎,以及中央电视台、 外经技术,亚秒级的迅捷速度, 庞大的服务器群,每分每秒接受来自全球各个国家的中文搜索请擎为己任,经过三年努pider) 自动的在互联网中搜 索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集 到最大数量的互联网信息。在中国和美国均设有服务器,搜索范围涵盖中 国大陆、香港、台湾、澳门、新加坡检索和高级检索,提供 “二次检索”功能。 如果无法确定输入什么关键词才能找到满”做参考,这些“相关搜索”是基于其它用户使用的关键词制作而成的。
现代信息检索系统
1、计算机信息检索
①脱机批处理检索(1954-1965) ②联机检索(1965-1991) ③网络化联机检索(1991-目前)
①脱机批处理检索(1954-1965)
1946年世界上第一台电子计算机问世后,50年代初 就有人开始研究其在信息检索领域的应用。50年代中期 至60年代中后期是信息检索的脱机批处理阶段。当时计 算机还没有连接通信网,也没有远程终端装置,不能提 供实时检索( Question and Answer ),只能进行现刊 文 献 的 定 题 检 索 ( Selective Dissemination of Information ) 和 回 溯 性 检 索 ( Retrospective Search),同时利用计算机编辑出版检索性刊物。1954 年,美国海军机械实验中心使用IBM701型机,初步建成 了计算机情报检索系统,这预示着以计算机检索系统为 代表的信息检索自动化时期的到来。
2、网络数据库检索
网络数据库检索系统是指用户在自己的 客户端上,通过互联网和浏览器界面对数 据库进行检索,这一类检索系统都是基于 互联网的分布式特点开发和应用的,即: 数据库分布式存储,不同的数据库分散在 不同的数据库生产者的服务器上;用户分 布式检索,任何地方的终端都可以访问并 存储数据;数据分布式处理,任何数据都 可以在网上的任何地点进行处理。
相关文档
最新文档