搜索引擎

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

“搜索引擎”研究报告

——笪雨欣

1搜引擎的历史与发展

摘要:据资讯网站Pcworld报道,搜索引擎已经成为人们最常用的互联网工具之一。它的身影无处不在,为人们提供各种便利服务。目前互联网上的搜索引擎有上千种,每一种搜索引擎的覆盖率份

据资讯网站Pcworld报道,搜索引擎已经成为人们最常用的互联网工具之一。它的身影无处不在,为人们提供各种便利服务。目前互联网上的搜索引擎有上千种,每一种搜索引擎的覆盖率份额不等,每一种搜索引擎都有各自的优缺点,有不同的查询语言。那么,下面与大家一起回顾搜索引擎20年来的演变历史:20年前,一位麦吉尔大学的学生联合几位同学创造出了被看做是世界上第一款互联网搜索引擎:Archie。

在上世界90年代初期,Gopher统治者互联网,它是当时一个非常有名的信息查找系统。能将文件组织成某种索引,允许用户使用层叠结构的菜单与文件,以发现和检索信息。由此衍生出的Veronica就是方便人们搜索Gopher的查找工作,但随着Gopher的消亡,Veronica也同时退出历史舞台。

1993年10月Martijn Koster创建了ALIWEB,专门为万维网设计开发,它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。

Excite开始于1995年底,它发展的速度非常快先后吞并了两个竞争对手:先是买下了Magellan,然后又兼并了WebCrawler,这两个站点现在还在独立地运行。

今天,谷歌、百度、Bing都拥有广泛的用户群体,人们习惯了在网络上使用搜索引擎查找资料。我们每天也能从IT资讯中获得有关搜索引擎新功能的信息,各大巨头都在探讨未来搜索引擎的发展模式。

2.网上搜索策略及搜索技巧

技巧一:使用正确的方法

无论你是使用一个简单或是高级的Google搜索,在此都存在你应该使用的某种可靠的方法。遵循适当的方法你就能获得非常准确的结果;要是忽略这条建议的话,你也许就会看到大量不相关的结果或是缺乏你想要的相关结果。

技巧二:合理利用一个“与/或”的搜索

大多数的用户都没有意识到,Google会自动假定一次搜索要求中所有的词之间都是一种“和”的关系。也就是,如果你输入两个词,它就会假定你所寻找的页面是包含这两个词的。它不会反馈给你仅包含其中一个词的页面。

技巧三:你的搜索中包括或不包括的词

关于这些“and”和“or”的词,Google会自动地将这些在你输入的搜索要求中的不重要的、普通的词忽略掉。这些被称作是“忽略的单词”,包括“and”、“the,”、“where”、“how”、“what”、“or”(所有字母皆为小写,还有其它一些类似的词——包括一些单独的数字或单独的字母(例如“a”)

技巧四:搜索近似的词

在此还有个额外的技巧:如果要只是列出近义词的页面,而不需要给出许多原先输入的那个词的页面,可以用“-”符号来连接“~”操作,例如“~keyword -keyword”。这样就能在近义词所得的结果中排除原先输入的词。在先前的例子中,要得到仅有“elderly”近义词的搜索结果,就输入“~elderly -elderly”即可。

3.索引擎基本工作原理:

在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。

另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。

当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

心得体会:

以前,一直不明白像是谷歌、百度之类的搜索引擎有什么区别,

也不管自己要搜的到底是什么类型的信息,总是随意的乱用搜索引

擎,有时候根本搜不到自己想要的东西。但是经过这次作业,我觉得

自己算是开点儿窍了。原来搜索东西也是个大学问,里面有许许多多

的技巧,(比如“-”的使用,我以前从来不知道);还有关键字的使用,不要将要查的内容全部输进去,因为与之全部关联的结果可能很少,所以会搜不到想找的东西。试着将内容概括为几个关键词,分别输入,这样搜集到的信息量会大很多。当我掌握了这些技巧以后,搜索真的容易了许多。

在搜索和老师的解说中,我也明白了搜索引擎之间的不同。平时习惯用的百度所呈现的结果不一定准确,网络上有太多的虚假信息,这需要我们自行辨别,拥有自己的判断能力。百度的搜索一般是在自己下面所属的网页上寻找内容,这种小范围的搜索使得它的结果不一定准确。而谷歌就与它截然不同。在搜索过程中,我收获了许多,其中一个博客(参考文献上会注明)上的对于这两种搜索引擎的概括让我感触挺深的,就以这句话作为结尾吧:“Google和百度的对于搜索引擎运营的最大区别是,Google认为搜索引擎是工具,Google为了让用户更加快速地离开自己的页面而不断努力。百度把搜索引擎看做打造自身社区的工具,为了实现‘框’住用户,用尽一切方法将搜索引擎用户引向百度的内容和社区页面而做出各种努力。”

相关文档
最新文档