搜索引擎发展史

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

搜索引擎发展史
Archie--所有搜索引擎的祖先
所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。

当时World Wide Web还未出现。

Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。

Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP 地址可以下载该文件。

由于Archie深受欢迎,受其启发,Nevada System Computing Services 大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具
Veronica(Veronica FAQ)。

Jughead是后来另一个Gopher搜索工具。

由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。

世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。

刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。

与Wanderer相对应,1993年10月Martijn Koster创建了
ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。

ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。

1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan’s World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。

1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。

这就是Excite。

后来曾以概念搜索闻
名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元
搜索引擎Dogpile
1994年1月,第一个既可搜索又可浏览的分类目录EINet
Galaxy(Tradewave Galaxy)上线。

除了网站搜索,它还支持Gopher和
Telnet搜索。

 
1994年4月,Stanford两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。

随着访问量和收录链接数的增长,Yahoo目录
开始支持简单的数据库搜索。

因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。

搜索效率明显提高。

(Yahoo 以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)
WebCrawler--互联网上第一个支持搜索文件全部文字的全文搜索引擎
1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。

1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。

WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。

(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)
Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。

Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。

1994年7月20日,数据量为54,000的Lycos正式发布。

除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。

(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)
Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,
但直到年底它的搜索引擎才与公众见面。

起初,Infoseek只是一个不起眼的搜
索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。

但是它的发
展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。

Infoseek
友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。

而1995年12月与Netscape的战略性协议,使
它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。

(注:Infoseek后来曾
以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果)
元搜索引擎(A Meta Search Engine Roundup)
1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。

用户只需提交一次搜索请求,由元搜索引擎负责转换处理
后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查
询结果,集中起来处理后再返回给用户。

第一个元搜索引擎,是Washington大
学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。

元搜索引擎概念
上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。

 
DEC的AltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy
可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release )。

但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。

Altavista最突出的优势
是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为
了展示DEC Alpha芯片的强大运算能力)。

而Altavista的另一些新功能,则永远改变了搜索引擎的定义。

AltaVista是第一个支持自然语言搜索的搜索
引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。

用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。

AltaVista也声称是第一个支持用户自己向网页索引库提交
或删除URL的搜索引擎,并能在24小时内上线。

AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。

在面向用户的界面上,AltaVista
也作了大量革新。

它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可
能从来不知道的的有趣功能。

这系列功能,逐渐被其它搜索引擎广泛采用。

1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上
万的搜索结果中找到想要的。

然后到来的是HotBot。

1995年9月26日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。

声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。

HotBot也大量运用cookie储存用户的个人搜索喜好设置。

(Hotbot曾是
随后几年最受欢迎的搜索引擎之一,后被Lycos收购)
Northernlight 公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,Northernlight搜索引擎正式现身。

它曾是拥有最大数据库的搜索引擎之一,
它没有Stop Words,它有出色的Current News、7,100多出版物组成的
Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单
的自动分类。

(2002年1月16日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch,选中"World Wide Web only",仍可使用Northernlight搜索引擎)
1998年10月之前,Google只是Stanford大学的一个小项目
BackRub。

1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月
15日注册了的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。

1999年2月,Google完成了从Alpha版到Beta版的蜕变。

Google公司则把1998年9
月27日认作自己的生日。

Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,
象Altavista一样,再一次永远改变了搜索引擎的定义。

在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不
如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。

直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。

Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究
的副产品。

1999年5月,发布了自己的搜索引擎AllTheWeb。

Fast创立的目标
是做世界上最大和最快的搜索引擎,几年来庶几近之。

Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。

Teoma 起源于1998年Rutgers大学的一个项目。

Apostolos Gerasoulis 教授带领华裔Tao Yang教授等人创立Teoma于新泽西Piscataway,2001年春初次登场,2001年9月被提问式搜索引擎Ask Jeeves收购,2002年4月再次发布。

Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources。

Wisenut 由韩裔Yeogirl Yun创立。

2001年春季发布Beta版,2001年9月5日发布正式版,2002年4月被分类目录提供商looksmart收购。

wisenut 也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek。

Gigablast 由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。

Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。

Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。

Openfind起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。

2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。

北大天网是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。

2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。

Baidu 2000年1月,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)在北京中关村创立了百度(Baidu)公司。

2001年8月发布搜索引擎Beta版(此前Baidu只为其它门户网站
搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎。

Baidu虽然只提供中文搜索,但目前收录中文网页超过9000万,可能是最大的的中文数据库。

Baidu搜索引擎的其它特色包括:网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索。

2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。

移动通信可以说从无线电通信发明之日就产生了。

1897年,M.G.马可尼所完
成的无线通信试验就是在固定站与一艘拖船之间进行的,距离为18海里。

现代移动通信技术的发展
始于本世纪20年代,大致经历了五个发展阶段。

第一阶段从本世纪20年代至40年代,为早期发展阶段。

在这期间,首先
在短波几个频段上开发出专用移动通信系统,其代表是美国底特律市警察使用
的车载无线电系统。

该系统工作频率为2MHz,到40年代提高到30~40MHz可
以认为这个阶段是现代移动通信的起步阶段,特点是专用系统开发,工作频率
较低。

第二阶段从40年代中期至60年代初期。

在此期间内,公用移动通信业务
开始问世。

1946年,根据美国联邦通信委员会(FCC)的计划,贝尔系统在圣路
易斯城建立了世界上第一个公用汽车电话网,称为“城市系统”。

当时使用三
个频道,间隔为120kHz,通信方式为单工,随后,西德(1950年)、法国(1956年)、英国(1959年)等国相继研制了公用移动电话系统。

美国贝尔实验室完成
了人工交换系统的接续问题。

这一阶段的特点是从专用移动网向公用移动网过渡,接续方式为人工,网的容量较小。

第三阶段从60年代中期至70年代中期。

在此期间,美国推出了改进型移
动电话系统(1MTS),使用150MHz和450MHz频段,采用大区制、中小容量,实
现了无线频道自动选择并能够自动接续到公用电话网。

德国也推出了具有相同
技术水平的B网。

可以说,这一阶段是移动通信系统改进与完善的阶段,其特
点是采用大区制、中小容量,使用450MHz频段,实现了自动选频与自动接续。

第四阶段从70年代中期至80年代中期。

这是移动通信蓬勃发展时期。

1978年底,美国贝尔试验室研制成功先进移动电话系统(AMPS),建成了蜂窝状移动通信网,大大提高了系统容量。

1983年,首次在芝加哥投入商用。

同年12月,在华盛顿也开始启用。

之后,服务区域在美国逐渐扩大。

到1985年3月已扩展到47个地区,约10万移动用户。

其它工业化国家也相继开发出蜂窝式公
用移动通信网。

日本于1979年推出800MHz汽车电话系统(HAMTS),在东京、大胶、神户等地投入商用。

西德于1984年完成C网,频段为450MHz。

英国在1985年开发出全地址通信系统(TACS),首先在伦敦投入使用,以后覆盖了全国,频段为900MHz。

法国开发出450系统。

加拿大推出450MHz移动电话系统MTS。

瑞典等北欧四国于1980年开发出NMT—450移动通信网,并投入使用,频段为450MHz。

这一阶段的特点是蜂窝状移动通信网成为实用系统,并在世界各地迅速发展。

移动通信大发展的原因,除了用户要求迅猛增加这一主要推动力之外,还
有几方面技术进展所提供的条件。

首先,微电子技术在这一时期得到长足发展,这使得通信设备的小型化、微型化有了可能性,各种轻便电台被不断地推出。

其次,提出并形成了移动通信新体制。

随着用户数量增加,大区制所能提供的
容量很快饱和,这就必须探索新体制。

在这方面最重要的突破是贝尔试验室在70年代提出的蜂窝网的概念。

蜂窝网,即所谓小区制,由于实现了频率再用,大大提高了系统容量。

可以说,蜂窝概念真正解决了公用移动通信系统要求容
量大与频率资源有限的矛盾。

第三方面进展是随着大规模集成电路的发展而出
现的微处理器技术日趋成熟以及计算机技术的迅猛发展,从而为大型通信网的管理与控制提供了技术手段。

第五阶段从80年代中期开始。

这是数字移动通信系统发展和成熟时期。

以AMPS和TACS为代表的第一代蜂窝移动通信网是模拟系统。

模拟蜂窝网虽然取得了很大成功,但也暴露了一些问题。

例如,频谱利用率低,移动设备复杂,费用较贵,业务种类受限制以及通话易被窃听等,最主要的问题是其容量已不能满足日益增长的移动用户需求。

解决这些问题的方法是开发新一代数字蜂窝移动通信系统。

数字无线传输的频谱利用率高,可大大提高系统容量。

另外,数字网能提供语音、数据多种业务服务,并与ISDN等兼容。

实际上,早在70年代末期,当模拟蜂窝系统还处于开发阶段时,一些发达国家就着手数字蜂窝移动通信系统的研究。

到80年代中期,欧洲首先推出了泛欧数字移动通信网(GSM)的体系。

随后,美国和日本也制定了各自的数字移动通信体制。

泛欧网GSM已于1991年7月开始投入商用,预计1995年将覆盖欧洲主要城市、机场
和公路。

可以说,在未来十多年内数字蜂窝移动通信将处于一个大发展时期,及有可能成为陆地公用移动通信的主要系统。

与其它现代技术的发展一样,移动通信技术的发展也呈现加快趋势,目前,当数字蜂窝网刚刚进入实用阶段,正方兴末艾之时,关于未来移动通信的讨论已如火如菜地展开。

各种方案纷纷出台,其中最热门的是所谓个人移动通信网。

关于这种系统的概念和结构,各家解释并末一致。

但有一点是肯定的,即未来移动通信系统将提供全球性优质服务,真正实现在任何时间、任何地点、向任何人提供通信服务这一移动通信的最高目标。

分工:资料搜集:陈剑平
资料整理:刘振鸣
高二(1)班。

相关文档
最新文档