网络信息检索.

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网络信息检索——搜索引擎篇

摘要:概述网络信息检索,主要针对搜索引擎进行比较,参考一些文献来对将来的搜索引擎进行合理的展望。

关键字:网络信息检索搜索引擎发展趋势实时搜索

网络信息检索概述

网络信息检索是指能够通过网络接受用户的查询指令,并向用户提供符合其查询要求的网络信息资源的过程。可以把网络信息检索理解为见多对象为网络信息的信息检索。(西安电子科技大学出版社《网络信息检索》

搜索引擎概述

网络信息检索的应用有搜索引擎,多媒体信息检索,话题识别与跟踪,信息过滤,问题回答五个方面。本文主要讲述搜索引擎的相关内容。

本文所称的搜索引擎是指因特网上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人或网站登录等方式,将因特网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询做出响应,提供用户所需的信息。用户的查询途径主要包括自由词全文检索、主题词检索、分类检索及其它特殊信息的检索(企业、人名、电话黄页等。

著名搜索引擎Google,百度,yahoo中国

Google是一家美国上市公司(公有股份公司,于1998年9月7日以私有股份公司的形式创立,以设计并管理一个互联网搜索引擎。Google公司的总部称作“Googolplex”,它位于加利福尼亚山景城。Google 创始人Larry Page 和Sergey Brin 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。Google 目前被公认为是全球规模最大的搜索引擎。

百度是中国的两位海外留学生李彦宏和徐勇博士创建的中文搜索引擎。它拥有目前世界上最大的中文信息库,总量达到1亿2千万以上,并且还在以每天几十万页的速度快速增长。2000年1月,百度公司在中国成立了他的全资子公司百度网络技术(北京有限公司。随后于同年10月成立了深圳分公司。2011年6月又在上海成立了上海办事处。2005年百度在美国的纳斯达克上市,省委当年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。

Yahoo中国是网站分类目录的领头军,它以分类目录,网站检索为主,附带网页全文检索,也是目前最重要的搜索服务网站。雅虎有中文,英文等十余种语

言版本,每一版的内容互不一样。可以说,每一种不同的版本都是一种不同的,相对独立的搜索引擎。

他们各自信息搜集方式的比较

百度是最典型的一种自动搜索引擎,google是一般典型的自动搜索引擎。他们由一个成为蜘蛛的机器人程序,由四部分组成的自动索引。该搜索引擎的有点事信息量过大,更新及时,不需要人的干预,缺点是搜到信息过多,许多无用信息需要用户行结果中筛选。

Yahoo属于分类搜索引擎。Yahoo并不是单纯地提供所有网站网页的全文检索服务,而是将其收集到的网站及网页分门别类加以索引和文摘(由人工完成,以一个分层的线性目录来为用户提供按图索骥式的服务。该类搜索引擎因加入了人的智力,所以信息准确,导航质量非常高,不足之处是需要人的介入,维护量大,信息量少,信息更新不及时。

综合各个方面(本文只比较搜寻信息方式的不同,其他方面不加赘述,三大搜索引擎各具千秋。从实用性来说,google的检索功能强大、灵活,尤其是支持多种字段检索以及网页的推荐功能,并可以安用户的习惯设置检索界面;百度收录的中文信息覆盖面广、数量大,更新快,注重服务的本地化;雅虎作为指南型分类检索工具,在相对查全率方面具有优势。我们可以根据各自的生活、工作、学习的需要,选择一种适

合自己的搜索引擎,但是现有的搜索引擎也不是尽善尽美,它们也或多或少的存在些问题,希望它们能互相取长补短、不断丰富、完善,更好的满足用户个性化的多远检索需求。

搜索引擎的发展趋势

i.首先,搜索引擎将会更加注重强大的信息的整合能力,搜索结果通过多较多、多数据渠道和多媒体的展现。譬如搜索北朝鲜,关于朝鲜的简介、新闻、博客、论坛、视频、电视访谈、图片,实时的微博,等等整齐排列。

ii.越来越注重实时搜索能力。拥有上亿用户的中文微博,各类社会关系网络,是的任何人可以快速发布信息和个人感想。基于这些信息大战的实时搜索可提供灵活的关键词搜索,该可以提供很多关于地点敏感,人物敏感、情感敏感的搜索功能。发展独立的微博搜索和社会关系网络搜索或者把微博和社会关系网络的内容纳入到通用的搜索,都是实时搜索的重要应用。

iii.语义分析技术除了常规的自然语言处理包括分词、抽取关键词、适度的句法分析、分类之外,还要进行语义角色标注和情感分析。

iv.逐渐由搜到用的快速迁移。目前,多种形式的应用平台集合了最优秀的应用程序。用户搜索到响应的应用程序,就可以快速完成某一项任务。

v.灵活的人机接口,利用自然语音、自然语言,图像、配上基于地理位置

的各项服务创造出崭新搜索体验,将会在移动常客(如开车愈显重要。

vi.个性化。社会关系网络和移动互联网的发展使得梦寐以求的个性化搜索逐步成为现实。它按照每个用户的需求来进行搜索,并且根据用户以前的行为来定制搜索结果的排列方式。另外还会提供强大的推荐功能。用户大家桌面或手机,系统会根据你以往的搜索行为、你所处的位置和时间会自动弹送你需要的信息供你查阅。

参考文献:

1董守斌袁华《网络信息检索》,西安电子科技大学,2010

2沈固朝《网络信息检索:工具,方法,实践》,高等教育出版社,2004 3谢新洲《网络信息检索技术与案例》,北京图书馆出版社,2005 4新一代搜索引擎的研发战略周明

/Read/Read.aspx?id=40149463

5百度百科

/view/1154.htm

6常用搜索引擎的比较刘金凤

/view/5f7efdc78bd63186bcebbcbb.html

相关文档
最新文档