网络搜索引擎信息检索
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
百度——核心技术
Baidu核心技术
超链分析:通过分析链接网站的 多少来评价被链接的网站质量,保 证用户在百度搜索时,越受用户欢 迎的内容排名越靠前。李彦宏是超 链分析专利的唯一持有人。
百度——竞价排名
• 竞价排名的基本特点是按点击付费,推广信息出现在搜索结果中(一 般是靠前的位置),如果没有被用户点击,则不收取推广费。 • 在搜索引擎营销中,竞价排名的特点和主要作用如下: (1)按效果付费,费用相对较低; (2)出现在搜索结果页面,与用户检索内容高度相关,增加了推广 的定位程度; (3)竞价结果出现在搜索结果靠前的位置,容易引起用户的关注和 点击,因而效果比较显著; (4)搜索引擎自然搜索结果排名的推广效果是有限的,尤其对于自 然排名效果不好的网站,采用竞价排名可以很好弥补这种劣势; (5)企业可以自己控制点击价格和推广费用; (6)企业可以对用户点击情况进行统计分析。
– Allintitle:教育技术 中国
• site:把搜索范围限定在特定站点中,可以提高查询效率。 “site:”后面跟的站点域名,空一格后再加上关键词,站
点域名不要带“http://”,而且“site:”和站点名之间不 要有空格。
– 如:site:skycn.com 图书管理
百度——高级搜索语法(3)
网络信息资源检索
主要内容
• • • • 中文搜索引擎 外文搜索引擎 学术搜索引擎 开放获取资源
1常用中文搜索引擎
• • • • 百度 www.baidu.com 谷歌 www.google.com.hk 必应 cn.bing.com 中搜 www.zhongsou.com
百度——百度的发展
• 2000年1月百度创立于北京中关村,其目标定位 于打造中国人自己的中文搜索引擎。 • 2000年5月百度首次为门户网站——硅谷动力提 供搜索技术服务,之后迅速占领中国搜索引擎市 场,成为最主要的搜索引擎技术提供商。 • 2001年8月,发布Baidu.com搜索引擎Beta版,从 后台服务转向独立提供搜索服务。现已成为全球 最大的中文搜索引擎。 • 2001年10月正式发布Baidu搜索引擎。
• ilib是万方数据股份有限公司针对互
联网用户需求建立的专业学术知识服务网
站,隶属于万方数据资源系统,对外服务
数据由万方数据资源系统统一部署提供。
学术搜索引擎(外文)
• http://www.scirus.com http://www.ojose.com http://www.findarticles.com http://citeseerx.ist.psu.edu http://www.sciseek.com http://www.wolframalpha.com
Google——图书搜索
books.google.com.hk
两种检索途径
Google——学术搜索scholar
• 访问地址
http://scholar.google.com/
• 2004年Google推出学术搜索。可提供:来自学术
著作出版商、专业性社团、预印本、大学及其他
学术组织的论文、图书、摘要和文章。
百度——高级搜索语法(4)
• Filetype:把搜索结果限定在某种文件类型中
– 百度支持的文件类型有 doc pdf ppt xls txt
– 如:filetype:ppt 荷塘月色
• 注:所有高级搜索语法中所使用的标点符号,必须是英文 状态下输入,即半角符号
百度——产品众多
百度地图,查路线
• title: 把搜索范围限定在网页标题中。如title:sunset找到所 有网页标题中包含sunset的网页。
• inurl: 把搜索范围限定在URL连接中
Lycos西班牙的搜索引擎
www.Lycos.com
ulitka俄文搜索引擎
www.ulitka.ru
日文雅虎
www.yahoo.co.jp
百度——首页
百度——网页快照
百度——高级搜索语法(1)
• 布尔逻辑检索:
– – – – 与(AND) 空格 或(OR) ︱ 非(NOT) – 例:奥巴马 | 简历 神雕侠侣 -电视
• 短语搜索 : “”
– 例:”2010招聘会”
百度——高级搜索语法(2)
• intitle:把搜索范围限定在网页标题中,“intitle:”和后 面的关键词之间不要有空格。 – 如:intitle:教育技术 中国。
• 2011年10月底宣布第一个第三代搜索引擎诞生,最大特 点是人工智能
中搜
中搜
2外文搜索引擎
• • • • AltaVista Lycos Ulitka 日文雅 www.AltaVista.com www.Lycos.com www.ulitka.ru www.yahoo.co.jp
Altavista
【权限】免费查看题录和文摘。
www.scirus.com
http://www.wolframalpha.com
4开放存取资源(OA)
•
开放存取(Open Access,简称OA),兴起于20世纪90年 代,是国际科技界、学术界、出版界、信息传播界为推动科研 成果利用因特网自由传播而发起的运动,以此促进科学信息的 广泛传播,促进学术信息的交流与出版,提升科学研究的公共 利用程度,保障科学信息的长期保存。作为一种高效、公平的 学术信息交流新机制,开放存取是一种学术信息共享的自由理 念和出版机制,在这种出版模式下,学术成果可以无障碍地传 播,研究人员不仅可以在任何地点和任何时间不受经济状况的 影响平等免费地获取和使用公众网上的学术成果,也可以利用 OA,发表自己的见解,与世界各地的研究人员进行深入的交 流,促进学术上的共同进步。
所以及数字填空观测协会等科研机构,可浏
览约1亿颗恒星和2亿个星系。
必应——bing
• 访问地址
– http://cn.bing.com
• 微软公司2009年5月29日正式宣布推出全新 中文搜索品牌“必应”,打造全新的快乐
搜索体验。
• 必应,取有求必应之意。
中搜
• 访问地址
– http://www.zhongsou.com
Altavista支持的语法
• domain: 把搜索范围限定在特定站点中,与google的site 用法相同。 domain后面跟站点域名,空一格加关键词, 如domain:edu.cn将搜索结果限定在中国教育网中。 • link: 链 接 搜 索 , 查 询 所 有 指 向 某 网 址 的 网 页 。 比 如 link:www.myway.com 可搜索到所有连接到 myway.com 的 页面。
利用在线代理访问谷歌
• 作为一个全球化的产品,Google拥有140多个域名,允许用 户以多种语言进行搜索,在操作界面中提供多种语言可供 选择。 • 2006年,Google公司在北京宣布该公司的全球中文名字 为“谷歌” 该公司亦拥有“谷歌.cn‖、“谷歌.中国”、 “咕果.com‖ 等中文域名。同时拥有全球最短域名 “g.cn”。 • 北京时间2010年3月23日凌晨3时零3分,谷歌公司高级副 总裁公开发表声明,宣布停止对谷歌中国搜索服务的“过 滤审查”,并将搜索服务由中国内地转至香港。 • www.google.com.hk
备选公交线路
百度音乐
百度知道
百度一下你就知道, 尤其是电脑遇到问题, 先百度,在求助。
百度百科
你可以参与编辑的百 科全书。但不是所有 词条都可以编辑。
百度词典、翻译
整句翻译或者整段翻 译,但鉴于机器翻译 的弊端,所以其翻译 结果仅供参考。
搜索各种实用在线插件
百度文库
可利用“百度文库下 载器”,实现免登陆、 免金币的便捷下载。 推荐“冰点”软件。
Google首页
直接打开第一个 检索结果的页面。
Google支持的布尔逻辑算符:空格 OR Google支持的高级搜索语法:
– Intitle:检索词必须出现在网页标题中
• 如 intitle :教育技术
– Inurl:检索词必须出现在网页中
• 如 inurl:jiqiao
– Site:把搜索范围限定在某一特定网域中
www.scirus.com
【评价】互联网上最全面、综合性最强的科技信息类搜索引擎。 【类型】目前已有45亿科技信息编入其中,包括学术期刊、研究 所、政府、科学组织、会议、科学家和公司主页等网站信息。
【学科范围】农业与生物科学,天文学,化学与化工,计算机科
学,地球科学,经济,能源,环境科学,语言学,法学,数学, 医学,药理学,物理学,心理学,社会学等。
• 如 site:skycn.com_计算器
– Filetype: 查找特定类型文件
• 如 filetype:doc_体育
– ―‖双引号:用于精确匹配,引号内的内容不能 分开
• 如 “沈阳师范大学教务处”
– link: 链接搜索,查询所来自百度文库指向某网址的网页。 例如,“link:www.google.com‖将找出所有指 向 Google 主页的网页。
Google——聚类以缩小检索范围
Google——网页翻译
繁体转换为简体
针对外文页面特有的 整页翻译功能
Google产品也众多
Google产品——地图搜索
Google产品——地图搜索
2.2Google产品——街景
Google产品——图书搜索
• google图书可以做什么?
– – – – – – 你可以查找自己喜欢的图书, 查看图书目录了解图书的大致内容, 也可以浏览部分页面内容, 有些甚至可以看到全文, 并下载PDF副本, 还可以知道如何获取图书。
3学术搜索引擎(中文)
• 谷歌图书
– http://books.google.com
• 谷歌学术搜索
– http://scholar.google.com
• CNKI知识搜索
– http://search.cnki.net
• iLib搜索
– http://www.ilib.cn
CNKI知识搜索
万方数据的 ilib
•访问地址 www.AltaVista.com •Altavista是全球最知名的搜索引擎公司之一,它的名称代表 ―从高处望下‖,于1995年由数码设备公司(Digital
Equipment Corporation)创立。AltaVista是功能全面的搜索
引擎,曾经名声显赫,但现在地位已被Google取代。即便如 此,它仍被认为是功能最完善,搜索精度较高的全文搜索引 擎之一,其搜索精度已达业界领先水平,提供网页、图像、 音频、视频、新闻等主题搜索。
• 2006年,Google发布学术搜索的中文版。现在已
经整合了万方数据、维普资讯网和中国知网的资 源。
Google——学术搜索scholar
Google ——学术搜索scholar
Google——天空地图
观看数百万光年以外的遥远星系,看行星
运动,甚至超新星的爆发,这些图片来自美
国的哈勃太空望远镜、空间望远镜科学研究
• inurl:把搜索范围限定在url链接中,对搜
索结果的url做某种限定。“inurl:”和后面
所跟的关键词不要有空格。找关于
photoshop的使用技巧
– 如:inurl:jiqiao photoshop,这个查询串中的
“photoshop”,是可以出现在网页的任何位置,而 “jiqiao”则必须出现在网页url中
PubMed Central
• 是世界上最主要的生物医学开放获取资源之一, 是美国卫生研究院生物医学与生命科学数字化 期刊数据库,由美国国立医学图书馆于2000年 开发创建,旨在保存生命科学方面的研究论文。 • 收录280多种重要的生物医学期刊和200多种开 放存取期刊。 • 无需登录,无限制下载。 • 地址:http://www.pubmed.gov
百度专利搜索
www.cnpat.com.cn
百度其他产品,试试看!
• 创立于1998年,总部设在加利福尼亚州山景城。 • Google 创始人 Larry Page 和 Sergey Brin在斯坦 福大学的学生宿舍内共同开发了全新的在线搜索 引擎,然后迅速传播给全球的信息搜索者。 • Google 目前被公认为是全球规模最大的搜索引擎, 它提供了简单易用的免费服务。 • 不作恶(Don't be evil)是谷歌公司的一项非正式 的公司口号,最早是由Gmail服务创始人在一次会 议中提出。