搜索引擎研究报告[1]
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
发展六
• 个性化趋势是搜索引擎的一个未来发展的重要特征和必然 趋势之一。一种方式通过搜索引擎的社区化产品(即对注 册用户提供服务)的方式来组织个人信息,然后在搜索引 擎基础信息库的检索中引入个人因素进行分析,获得针对 个人不同的搜索结果。自2004年10月yahoo推出myweb测 试版,到11月a9推出个性化功能,到2005年 Googlesearchhistory基本上都沿着一条路子走,分析特定 用户的搜索需求限定的范围,然后按照用户需求范围扩展 到互联网上其他的同类网站给出最相关的结果。另外一种 是针对大众化的,Google个性化搜索引擎,或者 yahooMindSet,或者我们都知道的前台聚类的vivisimo。但 是无论其中的哪一种实现方式,即Google的主动选择搜索 范围,还是yahoo(http://my.yahoo.com),vivisimo的在 结果中重新组织自己需要的信息,都是一种实验或者创想 ,短期内无法成为主流的搜索引擎应用产品。 • 发展首页
点击添加标题
搜索引擎的发展史
所有搜索引擎的祖先,是1990年由Montreal的McGill 标题 University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的Archie(Archie FAQ)。Alan Emtage等 想到了开发一个可以用文件名查找文件的系统,于是便有了 Archie。Archie是第一个自劢索引互联网上匿名FTP网站文件 的程序,但它还丌是真正的搜索引擎。Archie是一个可搜索 点击添加 的FTP文件名列表,用户必须输入精确的文件名搜索,然后 标题 标题 标题 Archie会告诉用户哪一个FTP地址可以下载该文件。 由于 Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ) 搜索工具Veronica(Veronica FAQ)。Jughead是后来另一 个Gopher搜索工具。 发展一 发展二 发展三 发展四 发展五 发展六 目录
发展五
• 智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效 果,进一步还可在知识层面或者说概念层面上辅助查询,通过主题词 典、上下位词典、相关同级词典检索处理形成一个知识体系或概念网 络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。 • 例: • (1)查询“计算机”,与“电脑”相关的信息也能检索出来; • (2)可以进一步缩小查询范围至“微机”、“服务器”或扩大 查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算 机应用”等范畴; • (3)还包括歧义信息和检索处理,如“苹果”,究竟是指水果 还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义 知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等 技术结合处理,高效、准确地反馈给用户最需要的信息。 • 发展首页
标题 标题
发展一 世界上第一个Spider程序,是MIT Matthew Gray的 World wide Web Wanderer,用于追踪互联网发展 规模。刚开始它只用来统计互联网上的服务器数 量,后来则发展为也能够捕获网址(URL) 。 • 搜索引擎一般由以下三部分组成: • 爬行器(机器人、蜘蛛) • 索引生成器 • 查询检索器 • 发展Байду номын сангаас页
搜索引擎的技巧
• • 1、垂直主题搜索引擎 网上的信息浩如烟海,网络资源以十倍速的增长,一个搜索引擎很难收 集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太 宽,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。这样以来 ,垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了 一系席之地,比如象股票、天气、新闻等类的搜索引擎,具有很高的针对性 ,用户对查询结果的满意度较高。作者认为,垂直主题有着极大的发展空间 。 2、非www信息的搜索 提供FTP等类信息的检索 3、多媒体搜索引擎 多媒体检索主要包括声音、图像、视频的检索。关于图片搜索引擎的原 理,《浅谈图片搜索引擎的实现》 http://blog.minidx.com/2007/12/19/265.html 中提出了具有跨时代意义设计思 路。 • 目录
发展三 1994年4月,斯坦福大学的两名博士生,美籍华人 杨致远和David Filo共同创办了Yahoo!。随着访问 量和收录链接数的增长,Yahoo目录开始支持简单 的数据库搜索。因为Yahoo!的数据是手工输入的 ,所以不能真正被归为搜索引擎,事实上只是一 个可搜索的目录。Yahoo!中收录的网站,因为都 附有简介信息,所以搜索效率明显提高。 • 注:Yahoo以后陆续有 Altavista、Inktomi、 Google提供搜索引擎服务 • Yahoo!--几乎成为20世纪90年代的因特网 的代名词。 • 发展首页
发展四 1995年,一种新的搜索引擎形式出现了——元搜索 引擎(Meta Search Engine)。用户只需提交一次 搜索请求,由元搜索引擎负责转换处理后提交给 多个预先选定的独立搜索引擎,并将从各独立搜 索引擎返回的所有查询结果,集中起来处理后再 返回给用户。 第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜 索引擎概念上好听,但搜索效果始终不理想,所 以没有哪个元搜索引擎有过强势地位 发展首页
搜索引擎研究报告
初一(2)班 颜炜敏.詹洛涛
前 言
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网 上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户 提供检索服务的系统。
搜索引擎对我们的学习和生活有着巨大的影响和作用,让我们一起来了解搜索引擎 吧!
目 录
搜索引擎的作用
搜索引擎的发展史
搜索引擎的技巧
搜索引擎的未来展望
搜索引擎的作用
搜索引擎的作用
搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能, 同时也是“研究网站用户行为的 一个有效工具”。高效的站内检索可以让用户快速准确地找到目标信息, 从而更有效地促进产品/服务的销售, 而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效 的网络营销策略具有重要价值。 1、从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推劢起 到举足轻重的作用 2、从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎 营销 3、就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成 部分,是向终端客户传递信息的重要环节 目录
发展二 Excite 的历史可以上溯到1993年2月,6个Stanford University(斯坦福大学)大学生的想法是分析字 词关系,以对互联网上的大量信息作更有效的检 索。到1993年中,这已是一个完全投资项目,他 们还发布了一个供webmasters在自己网站上使用 的搜索软件版本,后来被叫做Excite for Web Servers。 • 注:Excite后来曾以概念搜索闻名,2002年5 月,被Infospace收购的Excite停止自己的搜索引擎 ,改用元搜索引擎 Dogpile • 发展首页
• • • •
搜索引擎的未来展望
• 随着互联网的发展,网上可以搜寻的网页变得愈来愈多, 而网页内容的质素亦变得良莠不齐,没有保证。所以,未 来的搜索引擎将会朝着知识型搜索引擎的方向发展,期以 为搜寻者提供更准确及适用的资料。目前,网上的百科全 书如雨后春笋般发展起来;另一方面,近年来亦有不少公 司尝试在搜寻方面改进,务求更符合用户的要求。当中诸 如Copernic Agent之类的搜寻代理就是其中之一。 • 在台湾,威知资讯(WebGenie)是利用文字探勘(Text Mining)技术发展搜寻引擎产品的公司,利用人工智能算法 ,可达成目前搜寻引擎所缺乏的简易人机互动模式,诸如 关联字提示、动态分类字提示等[1],算是较另类的搜寻引 擎产品。 • 目录