搜索引擎技术的发展

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

搜索引擎技术的发展

搜索引擎是收集、整理网上信息资源并按一定规则加以整理和组织,提供人们按相应的规则提取信息线索,并能直接连接到相关网上信息搜索工具。搜索引擎的目的是帮助人们寻找信息资源。目前大家所认识的主流搜索引擎也不外乎是百度和谷歌,其次就是搜搜、搜狗、以及雅虎,这些都是比较综合的搜索引擎。而这其中除了百度和谷歌的里面的产品属于开放性搜索外,还有目录搜索引擎,当你输入某个关键词搜索的时候所有包括有合格关键词的网页就被找出来了并按一定的顺序排列。个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索引擎的社区化产品的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。

通用搜索引擎的不足

目前搜索引擎的确风光无限,在给网民带来许多便利的同时也带来了巨大的经济效益。但这不代表网民对目前搜索引擎表示完全满意,在CHIP的调查中,有73.3%的网民认为,搜索结果重复率高,搜索到的网页打不开等是一个令人讨厌的现象。同时,有54.1%的网民认为个性化内容少,结果雷同也是不可以忍受的。另外,还有48.3%的网民认为专业/行业搜索功能差,有49.1%的网民认为信息更新速度慢,有30.1%的网民认为多媒体搜索功能弱。由此看来,搜索引擎还是需要不断改进和完善,才能满足人们的需要。归根到底,用户是否对搜索引擎的信息满意,企业是否能从搜索邀请推广中获得价值,这才是搜索引擎是否可以长期发展的基础。

搜索引擎覆盖范围相对减少:搜索引擎的索引能力正在越来越落后于网络的快速增长速度,自97年12月以来,搜索引擎的覆盖面相对于网络上公开的可检索的内容实际上是减少了。

搜索差异问题:对同一关键字使用不同的搜索引擎得出的结果差别很大,有时采用这种搜索引擎得到的结果较为满意,而有时使用另一种搜索引擎则更好一些。因此,可以考虑综合多个搜索引擎的查询结果,以达到更为令人满意的查询效果。

个性化问题:搜索引擎信息检索系统通常作为一种大型的服务器程序运行,同时响应多个用户的请求,这些系统不能够根据用户的兴趣需求来定制检索结果。事实上,不同领域背景知识结构的用户对检索结果的要求是不一样的,故应该建立一种适合用户需求的,随用户的兴趣变化而动态调整的智能检索系统。

主动查询问题:搜索引擎的检索工作是用户驱动的,即由用户显式地提出检索请求,系统给出响应。这是一种较为被动的信息获取方法,是否存在一种主动协助用户获取信息的机制,将网络中用户需要的信息主动通知给用户。

动态监测问题:由于网络中的信息是动态变化的,用户经常需要了解一些信息的最新动态,而在现有搜索引擎技术条件下,只有通过再次查询才能获取最新信息,对用户来说是极为不便的。若能将变化的信息主动通知给用户,将节约用户很多时间与精力。

搜索引擎的未来发展

搜索引擎的快速发展也就是近15年发生的,这与互联网的发展趋势密切相关。最近几年,互联网在经过了web2.0的市场培育阶段后,迎来了以互联网用户的个性化和社交化为中心的趋势。同时,移动设备的逐渐流量及两大趋势的融合,催生了很多新型应用,为了迎接和顺应这种趋势,对搜索引擎来说,也产生了新的挑战。本文将阐述未来搜索引擎的发展趋势。纯属个人观点。

1,社会化搜索

随着Facebook的流行,社交网络平台和应用占据了互联网的主流,社交网络平台强调用户之间的联系和交互,这对传统的搜索技术提出了新的挑战。

传统搜索技术强调搜索结果和用户需求的相关性,社会化搜索除了相关性外,还额外增加了一个维度,即搜索结果的可信赖性。对某个搜索结果,传统的结果可能成千上万,但如果处于用户社交网络内其他用户发布的信息、点评或验证过的信息则更容易信赖,这是与用户的心里密切相关的。社会化搜索为用户提供更准确、更值得信任的搜索结果。

2,实时搜索

随着微博的个人媒体平台兴起,对搜索引擎的实时性要求日益增高,我想这

也是搜索时引擎未来的一个发展方向。

实时搜索最突出的特点是时效性强,越来越多的突发事件首次发布在微博上,实时搜索核心强调的就是“快”,用户发布的信息第一时间能被搜索引擎搜索到。

3,移动搜索

随着智能手机的快速发展,基于手机的移动设备搜索日益流行,但移动设备有很大的局限性,比如屏幕太小,可显示的区域不多,计算资源能力有限,打开网页速度很慢,手机输入繁琐等问题都需要解决。

4,个性化搜索

个性化搜索的核心是根据用户的网络行为,建立一套准确的个人兴趣模型。而建立这样一套模型,就要全民收集与用户相关的信息,包括用户搜索历史、点击记录、浏览过的网页、用户email信息、收藏夹信息、用户发布过的信息、博客、微博等内容。比较常见的是从这些信息中提取出关键词及其权重。

为不同用户提供个性化的搜索结果,是搜索引擎总的发展趋势,但现有技术有很多问题,比如个人隐私的泄露,而且用户的兴趣会不断变化,太依赖历史信息,可能无法反映用户的兴趣变化。

5,地理位置感知搜索

目前很多手机已经有GPS的应用了,这是基于地理位置感知的搜索,而且可以通过陀螺仪等设备感知用户的朝向,基于这种信息,可以为用户提供准确的地理位置服务以及相关搜索服务。

6,跨语言搜索

这方面做的最好的是Google,Google目前已经提供多种语言之间的跨语言搜索,比如我搜“麻省理工”排在第一位的则是麻省理工学院的主页。

如何将中文的用户查询翻译为英文查询,目前主流的方法有3种:机器翻译、

双语词典查询和双语语料挖掘方法。对于一个全球性的搜索引擎来说,具备跨语言搜索功能是必然的发展趋势,而其基本的技术路线一般会采用查询翻译加上网页的机器翻译这两种技术手段。

7,多媒体搜索

目前搜索引擎的查询还是基于文字的,即使是图片和视频搜索也是基于文本方式。那么未来的多媒体搜索技术则会弥补查询这一缺失。多媒体形式除了文字,主要包括图片、音频、视频。

多媒体搜索比纯文本搜索要复杂许多,一般多媒体搜索包含4个主要步骤:多媒体特征提取、多媒体数据流分割、多媒体数据分类和多媒体数据搜索引擎。

8,情境搜索

情境搜索是融合了多项技术的产品,上面介绍的社会化搜索、个性化搜索、地点感知搜索等都是支持情境搜索的,目前Google在大力提倡这一概念。

所谓情境搜索,就是能够感知人与人所处的环境,针对“此时此地此人”来建立模型,试图理解用户查询的目的,根本目标还是要理解人的信息需求。比如某个用户在苹果专卖店附近发出“苹果”这个搜索请求,基于地点感知及用户的个性化模型,搜索引擎就有可能认为这个查询是针对苹果公司的产品,而非对水果的需求。

9, 移动搜索

根据comScore公司对美国6300余万手机上网人群的统计说明,2009年1月份每日使用手机上网的人数达到了2240余万,占整体手机上网人群的35%,比2008年同期有了高达107%的增长。2010年12月的统计结果更是显示,美国和日本市场使用手机搜索功能的用户分别占到整个手机上网用户群体的21.4%和31.5%,位于手机上网各种应用功能中的第二位和第一位。

2010年,我国手机网民规模继续扩大,截至2010年12月,手机网民达3.03亿,较2009年底增加了6930万人。手机网民在总体网民中的比例进一步提高,从2009年末的60.8%提升至66.2%。2010年,手机网民较传统互联网网民增幅更大,成为

相关文档
最新文档