搜索引擎的应用现状和发展趋势研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
搜索引擎的应用现状和发展趋势研究
新华云科
内容提要本文从应用角度概述了搜索引擎的现状,根据可见的前沿理论成果提出了搜索引擎的发展趋势。
关键词搜索引擎现状发展趋势
一、搜索引擎的应用现状。
搜索引擎是从互联网上获取信息的重要工具,自上世纪九十年诞生以来,其功能一直在不断更新和创新发展,理论界把它分为两代:以Yahoo为代表的第一代搜索引擎,即目录式搜索目前还在使用;以Google为代表的第二代搜索引擎,即以关键词和关键词组合搜索是目前的主流搜索引擎。
第一代搜索引擎的主要特征是基于人工分类目录搜索。目录式搜索是以人工方式或半自动方式建立起来的目录导航,目录的用户界面是分级结构,首页提供了几个分类入口,把信息放在目录下,逐级向下查询,用它也可以找到需要的信息。因为是手工输入,所以算不上是真正的搜索引擎,只是按目录分类链接而已。
其显著缺陷是完全依靠手工操作,需要人工按照分类一层一层填写,逐层进入才能找到,搜索速度非常慢,使用比较复杂。尽管现在仍有使用,但可以确定的是,依靠目录式搜索这种原始方式就将走到尽头,使用搜索引擎的时代已经到来。正如美国《连线》杂志主编,克里斯•安德森所说,“搜索引擎的诞生,极大缩短了人们查找信息的时间,最大化的提升了人们的工作效率。”
第二代搜索引擎的主要特征是运用“符号计算”,基于关键(字)词搜索,以及以关键词组合为基础的全文搜索和模糊搜索。与目录式搜索相比,基于关键词搜索的优势是使用方便,搜索速度快,直接搜索内容,是目录式搜索无法比拟的。
其显著缺陷是返回的信息太多,信息过载。从理论上说,只要输入关键词就能够把与关键词匹配信息搜索出来,但是这又导致了它的缺陷:执行搜索以后返回的信息过多,相关和无关信息混杂在一起,必须从中逐一进行筛选,没有人能够筛选得完。你要一点水,它给你一条河甚至一片海,让人耗费的时间无法忍受。要减少信息过载,就需要输入多个关键词组合渐进式查询,让人感到使用不方便。
二、搜索引擎的发展趋势。
对第一代、第二代搜索引擎功能存在的缺陷,用户体验尤为深刻,无不期盼更快、更准、更方便的第三代搜索引擎的问世。这正是搜索技术研发的方向、目标和发展趋势,很多公司正在进行尝试。
2004年8月,搜狐提出第三代互动搜索概念;2005年9月,美国政府提出开始研制第三代搜索;2005年10月,微软公布了做第三代搜索引擎的构想。
2011年10月19日,中搜推出开放的第三代搜索引擎平台,据称是全球第一款搜索技术与人类智慧结合、专业知识和搜索技术融合的开放式搜索平台,可以根据用户需求,为用户提供更加全面、精准、可编辑的搜索结果。中搜总裁陈沛表示,“目前,采用关键词匹配的第二代搜索是用户对搜索体验处于初级阶段,中搜则是用更高级的搜索体验,希望更多企业和个人参与到这次大潮中,共同构建一个全新的搜索世界。”
腾讯科技2012年3月15日消息,据国外媒体报道,谷歌拟采用语义搜索技术升级搜索
引擎。未来数个月,谷歌的搜索结果网页将不再只显示一个蓝色链接列表,还将提供用户所输入的搜索关键字的直接答案。这将是谷歌历史上幅度最大的搜索引擎升级之一,谷歌不会完全取代当前的关键字搜索系统,计划通过整合名为“语义搜索”的技术提供相关度更高的搜索结果,搜索引擎将与“人们了解世界”的方式更为想像,需要1年时间才能推出“新一代搜索服务”。
腾讯科技2012年04月13日消息,亚马逊日前宣布在“亚马逊网络服务”系列中添加一项名为“云搜索”的服务。2004年亚马逊曾经拥有自己的A9搜索引擎,2006年亚马逊关闭了A9搜索,时隔六年之后重返搜索市场,推出云搜索服务,此时亚马逊的云搜索服务已经成为一个真正的商品。
尽管这些第三代搜索引擎的功能都是从理论上描述的,其应用价值还有待用户体验评判,还没有形成“关键词搜索”的替代技术,但可以确定的是,运用“语言计算”技术,基于自然语言搜索,智能返回搜索结果,是第三代搜索引擎的基本特征,是搜索引擎发展的新趋势。
基于自然语言搜索的发展趋势。人们的日常交流是使用自然语言而非关键词,因为关键词表达的意思和意图不完整不准确,反映在关键词搜索结果上的缺陷是返回信息过多。基于自然语言搜索,符合人们的语言习惯,像人与人之间的交流一样轻松、直接、方便,不必再拘泥于分类、关键词等传统搜索方法,这无疑给用户提供了巨大的便利。
智能化返回搜索结果的发展趋势。第二代搜索引擎是“符号计算”,可以基于关键词符号匹配信息,并不能处理关键词本身的语义,这就是基于关键词搜索存在一系列缺陷的原因。从这个层面上讲,第三代搜索引擎的发展趋势是,把“语言计算”、云搜索服务技术和人工智能融合,让计算机返回的结果富有针对性,将准确信息显示在前两三项的搜索结果之中。让计算机具有人的智能和逻辑分析能力,能够理解自然语言表达的语义,使搜索结果与用户需求实现更精准的匹配,以解决问题的形式把结果返回给用户。