商用搜索引擎的架构与原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
技术变革
http://media.hust.edu.cn
航海技术
葡萄牙、西班牙、荷兰等
技术变革
http://media.hust.edu.cn
技术革命
http://media.hust.edu.cn
第一次工业革命 18世纪60年代~19世纪40年代 18世纪60年代,瓦特改进的蒸汽机的发明
搜索引擎名称
成立时间 终止时间 收购方
特色
AltaVista Inktomi Fast
Overture
1995 1996 1997
1998
2003 2002 2003
2003/4
Overture 速度 Yahoo! 综合 Overture 全/高级功能
Yahoo!
3721 www.3721.com www.zhongsou.com 8848 www.8848.com search.tom.com www.google.com
早期搜索引擎
http://media.hust.edu.cn
搜索引擎战国时代
http://media.hust.edu.cn
Archie
1990
字符方式
人工收录 检索文件
第一个基于 互联网的检 索服务
搜索引擎名称 成立时间 终止时间
WebCrawler 1994 1996
收购方
Excite
特色 第一个全文 字符检索 综合 门户 自动摘要/ 索 引 量 基本语法 括 号
网 址:http://media.hust.edu.cn
课程资源下载
http://media.hust.edu.cn
课程资源下载
http://media.hust.edu.cn
课程资源下载
http://media.hust.edu.cn
技术革命伴随着大国的崛起
http://media.hust.edu.cn
第二次工业革命 19世纪70年代-20世纪初 电力的广泛应用(即电气时代) 、内燃机
技术变革
http://media.hust.edu.cn
华尔街
http://media.hust.edu.cn
信息革命 1946年,第一台电子计算机ENIAC 1969年,第一个计算机网络APPANET
第一个殖民大国葡萄牙 美洲大陆的主宰西班牙帝国 金融资本家荷兰 从“快乐的英格兰”到“日不落帝国” 路上强权法兰西 夹缝中的德意志 东方列强日本 好霸争强的俄罗斯 从蚂蚁到大象的美国 正在崛起中中国……
1
技术革命伴随着大国的崛起
http://media.hust.edu.cn
类别/主要特点
搜索引擎、免费收录网站/竞价 广告 分类目录/付费登录 分类目录/付费登录 分类目录/付费登录 实名搜索/地址栏搜索 行业搜索 在线购物搜索引擎 搜索引擎/付费登录 搜索引擎、免费收录网站/关键 词自助广告 雅虎中国提供的中文搜索引 擎,免费登录搜索引擎/竞价广 告 搜狐提供的独立搜索引擎,免 费登录搜索引擎/竞价广告 分类目录/免费登录网站 分类目录/付费登录
http://media.hust.edu.cn
顺利向成长阶段过渡 1999.6.7:获风投2500万美元
迅速扩张:8人-200人,搜索次数50万-200万次 加速成长
/天 主要收益来自搜索技术的授权费 管理局限日益凸显,开始物色贤能之士主持大局
2001.3:埃利克·施密 特(Eric Schmidt)出 任董事长,开始大刀阔 斧的改革
根据一定的策略、运用特定的计算机程序搜集 互联网上的信息 在对信息进行组织和处理后,为用户提供检索 服务的系统 搜索引擎的核心价值 让人们最便捷地获取信息,找到所求
考试方式 考试
平时作业
6
基本要求
http://media.hust.edu.cn
课程内容
http://media.hust.edu.cn
2011.12-2012.6 各类网络应用使用率
http://media.hust.edu.cn
何谓“搜索引擎”?
http://media.hust.edu.cn
课程简介
http://media.hust.edu.cn
搜索引擎(Search Engine)
专业选修课,交叉学科的新兴课程
32学时,2学分
http://media.hust.edu.cn
中文搜索第一品牌-百度的故事
http://media.hust.edu.cn
1998年夏天,清华大学做技术讲座, 搜狐员工建议回国创业 1999.10月,再次回国,感受到祖国
互联网的巨大变化,决定归国创业
勤俭创业 公司地址:北大归国学人招待所
世界搜索霸主-Google的故事
http://media.hust.edu.cn
世界搜索霸主-Google的故事
http://media.hust.edu.cn
全面盈利
赞助商链接-关键词广告 2000年盈利2500万美元,2001年翻4倍,2002 年3亿,2003年9.619亿……
2003年,超越雅虎和微软MSN,成为最受欢迎的
类别/主要特点
搜索引擎/关键词广告 搜索引擎/PPC 分类目录 搜索引擎 搜索引擎/分类目录 分类目录/PPC 分类目录 搜索引擎 搜索引擎 黄页/白页登录与搜索 搜索引擎 搜索引擎/PPC 搜索引擎(欧洲最大) 分类目录 搜索引擎 搜索引擎 分类目录/免费 在线购物搜索引擎
搜索引擎的发展趋势
http://media.hust.edu.cn
武汉天气
搜索应用
http://media.hust.edu.cn
武汉哪里可以找到女朋友
搜索应用
http://media.hust.edu.cn
根叔
5
搜索应用
http://media.hust.edu.cn
Search Engine Optimization
内事找百度,外事问谷歌
http://media.hust.edu.cn
Inktomi
1994
图形方式
半自动
检索网站
著名门户
技术为王
http://media.hust.edu.cn
中文搜索引擎名称
百度 新浪 搜狐 网易 中国搜索(慧聪) TOM搜索 中文Google
网址
www.baidu.com search.sina.com.cn dir.sohu.com search.163.com
掌握搜索引擎的工作原理
熟悉搜索引擎的使用方法
1
2
商用搜索擎架构与原理 社区与垂直搜索
多媒体搜索
(6学时) (2学时)
(4学时)
基本掌握搜索引擎的设计方法
3 4 5 6 7 8
商务智能与搜索引擎推广
搜索引擎优化
(4学时)
(2学时)
移动搜索 利用开源工具构建小型搜索引擎 搜索引擎的未来
(2学时) (1学时) (1学时)
搜索引擎 2011年第四季度,营业收入105.8亿美元,净利 润27.1亿美元
非常规上市 选择摩根斯坦利和瑞士信贷第一波士顿为上市承 销商 2004.8.19,以每股85美元在纳斯达克上市 当天股价上涨18%,第二天108.31,11月200 美元 Google的成功上市,在整个硅谷、华尔街乃至 世界引起极大的轰动 评论家称
8
世界搜索霸主-Google的故事
http://media.hust.edu.cn
世界搜索霸主-Google的故事
http://media.hust.edu.cn
创始人 拉里·佩奇(Larry Page) 谢盖尔·布林(Segey Brin) PageRank横空出世 1995年开始 车库起家 1998.9.7:休学 $100万天使基金创办Google Page-CEO,Brin总裁 地点:加州废旧车库
京东商城-刘强东 360-周鸿祎 小米-雷军
苏宁易购-凌国胜
3
搜索应用
http://media.hust.edu.cn
根叔
搜索应用
http://media.hust.edu.cn
武汉 广州 高铁
搜索应用
http://media.hust.edu.cn
北京青年
4
搜索应用
http://media.hust.edu.cn
参考教材
http://media.hust.edu.cn
扩展阅读
http://media.hust.edu.cn
教材 卢亮,张博文. 搜索引擎—原理、实践及应用, 电子工业出版社,2007 参考资料 W.Bruce Croft. Search Engines, 机械工业出版 社,2009 李晓明,闫宏飞,王继民著. 搜索引擎--原理、 技术与系统, 科学出版社, 2005
把握搜索市场机遇
定位:为用户提供便捷的互联网搜索服务,帮
助使用者从互联网的海量信息中找到自己需要 的东西 1999年度最好的网络技术 1999年春天,搬到帕洛阿尔托中心的大学街
世界搜索霸主-Google的故事
http://media.hust.edu.cn
世界搜索霸主-Google的故事
Gopher
1991 图形方式 1993 图形方式
人工收录 检索文件 图形方式,
超文本
Excite
Lycos
1994
1994
2001
2000
InfoSpa ce
Fast
Wanderer /Wandex Yahoo!
自动收录 检索网站
第一个搜索 引擎
Infoseek
Yahoo!
1994
1994
2000
网址
www.google.com www.overture.com search.yahoo.com search.msn.com search.aol.com www.looksmart.com www.askjeeves.com www.altavista.com www.Inktomi.com www.infospace.com www.lycos.com www.findwhat.com www.espotting.com www.about.com www.excite.com www.teoma.com www.dmoz.org www.bizrate.com
联系方式
http://media.hust.edu.cn
电
话Βιβλιοθήκη Baidu027-87558541
搜索引擎技术基础
主讲:于俊清
http://media.hust.edu.cn
电子邮件:yjqing@hust.edu.cn
QQ 号 码: 735091398 办 公 室:网络与计算中心(南六楼)209室
• “Google上市具有里程碑意义,这是网络泡沫破灭 多年以来,高科技企业在市场上取得的最大一次成功”
9
世界搜索霸主-Google的故事
http://media.hust.edu.cn
世界搜索霸主-Google的故事
http://media.hust.edu.cn
昨天
今天
中文搜索第一品牌-百度的故事
百度
1998
2000
竞价排名/附 费 pagerank 全球最大的中 文搜索引擎
一搜 搜狗 Yahoo!中国 Lycos中国
www.yisou.com www.sogou.com cn.yahoo.com search.lycos.com.cn
英文搜索引擎名称
Google Overture(Yahoo!) yahoo MSN Search AOL Search LookSmart Ask Jeeves AltaVista Inktomi InfoSpace Lycos Find What Espotting Media About Excite Teoma.com Dmoz Bizrate
两个房间:一间卧室,一间办公室
1999年底,与好友徐勇带着$120万 的融资回国 2000年,创办“百度公司”,取诗 句“众里寻他千百度” 地点:北大归国学人招待所2个房间
邱哲,符滔滔. 开发自己的搜索引擎,人民邮电
出版社,2007
内容提要
http://media.hust.edu.cn
搜索引擎架构与原理
主讲:于俊清
第一讲:
搜索引擎的前世今生 商用搜索引擎结构与组成
http://media.hust.edu.cn
搜索引擎质量评估 搜索引擎排序策略 分布式搜索引擎
7
2
硅谷
http://media.hust.edu.cn
风云人物
http://media.hust.edu.cn
风云人物
http://media.hust.edu.cn
风云人物
http://media.hust.edu.cn
风云人物
http://media.hust.edu.cn
风云人物
http://media.hust.edu.cn