搜索引擎论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

搜索引擎原理之我见

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

说到搜索引擎,中国都不会陌生的引擎就是百度、搜狗和谷歌,刚开始谷歌在中国站绝大部分市场,自从李彦宏的百度一出,百度就蒸蒸日上,直接把谷歌赶出了中国,其中在百度中,只有输入Google相关的关键词,Google才可能排在前面,输入其他这些场合用词,Google 连采取对应的SEO百度的策略都没有,自然就不可能在百度中获得多关键词排名了。所以,百度给google每天带去的流量是非常少的。搜狗也是后来开发的。

说到百度,就想起一句耳闻能祥的话:有事找度娘。从这句话中就可以看出现在百度在网民心中的分量,已经是一种依赖,不可缺少的一部分。市场几乎占尽了中国市场,当然这也是百度自己的努力,搜索起来效率及其高,不然也不会到了让网民不能依赖的地步。

搜索引擎比较出名的一个名次就是蜘蛛,搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。最后呈现我们看到的想要的东西。

百度搜索引擎拥有目前世界上最大的中文搜索引擎,总量超过3亿页以上,并且还在保持快速的增长。百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。Google 的使命是整合全球范围的信息,使人人皆可访问并从中受益。Google 目前被公认为全球最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间返回相关的搜索结果。在访问Google 主页时,您可以使用多种语言查找信息、查看新闻标题、搜索超过10 亿幅的图片,并能够细读全球最大的Usenet 消息存档。

百度和谷歌相比,最大的优势就是制造中文的搜索引擎,从而吸引了大量网民的喜爱,其中百度贴吧是众搜索引擎中的一个特色,贴吧是网民闲谈的地方,具有开放性。百度百科算是一种抄袭,我听说过一个国际的百科叫维基百科,不过百度百科有些创新,更符合中国网民使用。

总的来说,搜索引擎是当代网民不可或缺的一部分,方便了人的生活。

相关文档
最新文档