搜索引擎的语法规则
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概况
互联网的发展可以用日新月异来形容,它每时每刻都在发生变化。由于互联网上的信息是呈几何级数增长且极其无序的,信息量越大,越难被利用。没有人对互联网上信息的有效性和有序性负责,因此如何进行快速有效地查询,获取和利用互联网上的信息,就成了一个大问题。目前解决这一问题的最佳途径是利用搜索引擎。这个需求直接导致了信息检索技术的快速发展,各类搜索引擎层出不穷。
但是如同互联网上的信息一样,搜索引擎的发展本身也是无序的,我们要通过搜索引擎,在互联网上找到需要的信息,直接获得自己想要的东西,或者学习之类都是面对海量信息。因此我们首先要了解其特点。
如何选择最符合需要的搜索引擎,通过其在互联网上找到我们所需要的信息,也是一个需要研究和解决的课题。基于这个目的,我们对目前互联网上较有规模的中文搜索引擎作一个粗浅的比较,以期抛砖引玉,使现有的中文搜索引擎发展得更快更好。
发展历程略
特点
一、快速化
速度的提高是现在各个搜索引擎都在努力达到的目标。快不仅仅是指搜索引擎返回结果的速度,更是指搜索引擎获取新信息的速度,现在博客、论坛和资讯网站都已经成为信息最重要的来源,一般都什么重大新闻,直接上百度要多快有多快。
二、多样化
多样化主要包括两个方面:内容多样化和搜索途径多样化。
内容除文字之外还包括图片、音频、视频内容的搜索。而在搜索结果内容上,也是非常的多样化,有图文、最新新闻、微博信息、轻应用、知心搜索等。
搜索途径多样化:可以通过语音指令、动作指令、地理位臵等进行搜索。
三、实时搜索
随着个人媒体平台兴起,搜索引擎的实时性要求日益增高,百度也推出了关于微博的实时搜索,搜索方法:浏览器中输入
/s?rtt=2&tn=baiduwb&wd=关键字,实时搜索最突出的特点是时效性强,越来越多的突发事件首次发布在微博上,实时搜索核心强调的就是“快”,用户发布的信息第一时间能被搜索引擎搜索到。
一、各大搜索网站的特长、优势及弱点分析
1、“Google”是功能强大,易用性最强的搜索网站,搜索速度快而且提供了最丰富的高级搜索功能。
Google()是业界著名的搜索网站,Google 获得过最受欢迎搜索引擎奖、最佳搜索引擎技术奖、最佳图像搜索技术奖等多项荣誉。
优点:不论是中文还是英文搜索都同样出色,而且还有业内公认的高水平图像搜索技术与日渐成熟的目录搜索功能。Google是易用
性最强的搜索网站,搜索速度快而且提供了最丰富的高级搜索功能。除了不支持自然语言和通配符搜索以外,其他不论是单个汉字、多个汉字或者一个句子,都可以作为关键字在Google上进行搜索。而且Google还支持关键字的简繁转换功能,您只需要输入简体或者繁体的关键字,就可以同时在简体中文网页和繁体中文网页中查找。
令人印象最深的是,搜索结果的排名准确性相当高。这归功于Google 根据网页的相关性、网站内部的链接结构及受欢迎的程度,来确定搜索结果的排列顺序的专利技术PageRank。与传统排名方式不同的是,它能确保优秀的网站总能够排在搜索结果的前列,这也是用户使用Google往往能够更快更容易地命中搜索目标的原因。
缺点:死链率比较高是Google最大的问题,中文网站检索的更新频率不够高,不能及时淘汰已经过时的链接。虽然通过“网页快照”功能,可以减少目标页面不存在的现象,但Google的“网页快照”功能在国内经常出现不可访问的问题,令用户无所适从。
2、“新浪”有集众家之长的多种搜索功能,准确性也不错
优点:新浪搜索()将网页、网站和新浪自己的内容结合在一起,网页搜索使用Google的搜索技术,网站搜索依靠制作人员与网友人工编辑的网站目录来实现。无论是网页搜索还是网站搜索,都能找到比较多的结果,而且准确性也不错。
缺点:新浪搜索在使用过程中缺少提示信息,并且由于曾经多次更换搜索技术提供商,对用户的影响较大。新浪搜索的帮助文档虽然很详细,但其中的内容有些并没有及时更新,介绍的还是过时的搜索方法。此外,新浪的网站搜索死链率较高,而且由于编辑水平的参差不齐,有许多网站的说明都比较简单和不清楚。在网站数量有增无减、
缺乏科学的排名的情况下,搜索效果不太理想。
3、“雅虎”中规中矩,网页搜索表现不错,但死链率较高
雅虎中国()支持网页、网站搜索,搜索速度快而且准确性比较高。在人工分类目录检索服务方面,雅虎中国有着比较丰富的经验,从1995年开始积累的分类目录服务信息和经验都是其他提供商所无法比拟的,雅虎中国的网站搜索的准确性也体现出了这种优势,并且其网页搜索功能的表现也相当不错。
但雅虎中国的搜索结果死链率很高,而且缺少一些应有的高级搜索功能。另外,该搜索的易用性有待提高,虽然在5月份升级后改善了网页的界面,严格控制搜索页面中的排名广告,规定每次搜索结果中的广告数量不能超过5个,但用户打开雅虎中国的首页时还是要受到一些影响。而且,对搜索结果的描述和在用户搜索过程中的提示说明也不太清晰、明了,离雅虎“关注用户体验”这一宣传口号,还有一定的距离。
4、“网易”网站搜索非常出色,但缺少提示
天网搜索最大的缺点是搜索结果死链率很高,同时也缺少一些应有的高级搜索功能。但天网搜索的易用性强,搜索结果的准确性也相当高,对于一个非商业站点来说已经很不错了。特别值得推荐的是,天网搜索的FTP服务器文件搜索功能非常强大,而且还为用户整理了一份庞大的热门搜索关键字目录,方便用户浏览和下载所需的文件。
搜索网站最主要的功能就是按照用户给出的条件找到互联网上相关
的资源,因此搜索结果的准确性是最重要的,死链率是影响搜索结果
的一大因素,另外,对于一个经常需要使用的工具,其易用性同样是非常重要的。搜索网站支持的关键字种类和高级搜索功能,对我们如何进行搜索也有较大的影响,因此,搜索网站具有什么样的高级搜索功能,搜索的速度快慢等等也都是重要的使用要素。
而这其中除了百度和谷歌的里面的产品属于开放性搜索外,其他大部分只是目录搜索,但是这些目录搜索的资源也相当的可观,基本上都覆盖了行业中的大部分主流信息。其实百度谷歌属于全文索引类,他们都有自己的程序索引整个互联网中的资源。但是它们里面的很多信息也都是从这些专业的搜索中检索到的,而有些东西只是在不同的位臵获取,实际信息确差不多。
百度谷歌之外的这些搜索引擎基本上都属于目录搜索引擎。主要是人工编辑的网站分类目录,目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是和开放性搜索引擎的定义不一样,实际上也可以算搜索引擎的一种类型。当你输入某个关键词搜索的时候,所有含有这个关键词的网页就被找出来,并按一定顺序排列。这其实就已经符合搜索引擎的基本原理。其次就是垂直类的搜索引擎,这个不及百度谷歌这类的开放性全文搜索引擎,其次也就是它们了。垂直性搜索引擎只是在搜索行行业进行检索。具有代表性的就是奇虎搜索吧,尤其是奇虎的论坛搜索功能。
搜索引擎的分类
根据搜索引擎的不同分类主要有:新闻类搜索引擎,例如:新浪的新闻搜索、百度的新闻搜索、谷歌的资讯搜索、新华网新闻搜索