网络信息检索

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

主动使用空格的检索效果
结果在第三条就看到了
结果在这里
第三种检索方法 3、用半角双引号括起词组或短语,进 行精确短语匹配 将其用半角双引号括起“中国人寿司 歌”,输入到检索框中。
检索结果一目了然(2006年结果)
2007年数据库更新完善后的检索情况
数据更新完善后的检索情况
2011年2月检索情况
高级检索举例
示例2:搜索“医学论文写作”方面的 网页及PPT课件
包含以下全部的字词
结果=1500,000条
包含以下的完整字句
结果=384,000条
不包括以下字词
结果=1440,000条
搜索医学论文写作方面的PPT课件
PDF PPT DOC XLS SWF
检索结果=620条
Google 的特殊功能
搜索引擎概述---概念
1、搜索引擎(Search Engine) :人们经常将网 络信息检索工具概称为搜索引擎.它以一定的策略 在Internet上搜集、发现信息,对信息进行提取、 组织和处理,并为用户提供检索服务,从而达到信 息导航的目的。搜索引擎也是一类网站,即因特网 上具有检索功能的网页。 它能够在万维网上主动搜索其他web站点中的 信息并对其自动进行索引,即记录下各个Web页面 的URL地址并进行有序排列.这些索引内容存放在 可供的查询的索引数据库中。
高级检索
高级检索
搜索结果区中提供四种逻辑匹配方式 依此表示 and 、精确短语检索、 or 、 not 。 每个检索框只能输入检索词,不能输入运 算符。 同时还提供了语言、更新时间、检索词 位置、网域等限定,另外还可通过“类似 网页”搜索相关网站。
高级检索
将搜索范围限制在某个特定的网站中 排除某个特定网站的网页 将搜索限制于某种指定的语言 查找链接到某个指定网页的所源自文库网页 查找与指定网页相关的网页 示例1:查找微软网站上关于“windows2000 的安全”课题资料。
网络检索工具——搜索引擎
因特网上蕴藏着丰富的信息资源。它 已经成为全球传播科研、教育、商业和社 会信息的最主要渠道。我们怎么从着信息 的海洋中准确迅速地找到所需的信息?从 20世纪80年代起人们开发了各种网络信息 检索工具。1989年,万维网诞生了。 WWW上的资源成为因特网的主流,越来 越多的万维网搜索引擎成为检索网络信息 资源的工具。所以我们在这里介绍WWW上的 搜索引擎。
查找某文档类型网页:PDF、PPT、swf、DOC PostScript (ps)等. 网页快照:单击“网页快照”即可. 定位检索功能:通过“手气不错”键实现. 类似网页:点击“类似网页”键实现.
Google 的特殊功能
1、查找某文档类型网页:Google已经可以支持13 种非HTML文件的搜索。除PDF、DOC、PPT、 xls文 档外(百度可以),Google现在还可以搜索、 Shockwave Flash (swf)、PostScript (ps)和其它 类型文档。如果您只想查找PDF或Flash文件,而不 要一般网页,只需搜索“关键词 filetype:pdf” 或“关键词 filetype:swf”就可以了。 举例(1)流氓兔 filetype:swf (2)查lung cancer的PDF外文全文文献 lung cancer filetype:pdf
一、搜索引擎概述
本次课程内容
一、搜索引擎概述
1、常用搜索引擎介绍 2、搜索引擎的关键词语法规则 3、Google与百度的检索技巧
推荐资源:
优酷视频: 什么是搜索引擎? http://v.youku.com/v_show/id_XMTkzOTM4NzY =.html?f=1528056 http://v.youku.com/v_show/id_XNjQ0MTY4NTI4. html 搜索引擎的历史和百度搜索引擎 http://v.youku.com/v_show/id_XMTkzOTM1ODg =.html?f=1528056 搜索1Google的高级搜索技巧 http://v.youku.com/v_show/id_XMTM3NjMwODA w.html
搜索引擎概述---类型
2、根据搜索引擎的信息搜集方法和服务提供方式 的不同来划分为以下三大类: (1)全文搜索引擎(机器人搜索引擎) (2)目录式搜索引擎 (3)元搜索引擎
本质区别:目录索引搜索引擎的资料数据库中,搜索保 存的是互联网上各网站的站名、网址和内容提要;全文 搜索引擎的资料库中,搜索保存的则是互联网上各网站 的每一个网页的全部内容,范围要大得多。

《Google成功的七堂课》 《百度:如此专注》
《Internet第一搜索引擎 ——Google检索指南》

《Google时代的工作方法: 如何解放你的大脑、发现你 想要的、作对你想做的》
《Google改变生活》

巧用百度
第三章互联网信息检索 ——搜索引擎
网络信息资源分类
简单地可以分为两类: 一类是来自正式文献信息源的信息:质量 高、内容可靠,一般都有检索平台,花钱购 买才能很方便的使用。(如CNKI数据库) 一类是各类网站上的信息:包罗万象、良 莠不齐,一般通过搜索引擎进行检索。 注意:科学研究需要的文献资料,一般要 通过图书馆主页的各种数据库获取。
Google基本检索指令表
符 号 功能说明 举例
“Wuhan University"
注意事项
引号最好用半 角
“ ” 将整个引号中的
内容作为一个整 体
空格 表示逻辑与 OR 表示逻辑或 表示逻辑非
Wuhan University Wuhan OR OR是大写字母 University Wuhan -University 操作符与后面 的关键字之间 不能有空格,与 前面的词之间 有空格
Google概况 优点:信息量大,更新快,能给用户 最全面最广泛的搜索结果。 缺点:有很多无关信息出现,降低相 应的命中率,必须从结果中再筛选。 提供的查询结果重复链接较多。
2006年4月在中国更名“谷歌” 2012年12月12日,谷歌关闭在中国大陆 市场搜索服务,搜索服务由中国内地转 至香港
检索途径(网页、图片、视频、新闻、音乐等)
基本检索语法规则
(4)短语检索:用半角的双引号括起词组或 短语,进行精确短语匹配。如:“Kidney failure”. (5)GOOGLE不区分英文字符大小写:“GoD” 和“god”搜索的结果是一样的。不支持“*” 搜索 (6)不支持“通配符”(*) 搜索: 也就是说, Google 只搜索与输入的关键词完全一样的 字词
Google主页
百度主页
YAHOO搜索主页
搜索引擎的工作原理
在因特网中发现、搜集网页信息
信息搜集
对信息进行提取和组织、建立索引库
索引数据库
根据用户输入的查询条件,在索引库中快速检出文档, 进行相关度评价,将结果进行排序将查询结果返给用户
用户
1、全文搜索引擎介绍
全文搜索引擎
全文搜索引擎是名副其实的搜索引擎。它 们都是通过从互联网上提取各个网站的信 息(以网页文字为主)而建立的数据库中, 检索与用户查询条件匹配的相关记录,然 后按一定的排列顺序将结果返回给用户, 因此它们是真正的搜索引擎。 国外具代表性的有 Google等,国内著 名的有百度(Baidu)
基本检索一般方法举例 例1:查找中国人寿司歌的歌曲名称
第一种检索方法
1、将中国人寿司歌作为检索词直 接输入基本检索框 结果:搜索引擎自动将中国人寿 司歌分隔成中国人和寿司两个检索 词进行查找.
第一种检索方法
没有在前10条中发现答案(2006年结果)
第二种检索方法
2、用户主动使用空格分隔,默认 为AND 中国人寿 司歌作为两个检索词用 空格隔开并输入。 检索结果如下:
基本检索语法规则(记住第1、4条)
(1)默认检索:输入多个检索词以空格分隔,默 认为AND匹配。最多可输入10个检索词。即不需使 用AND或“+”号,其会在关键词之间自动添加AND。 空格表示逻辑“与”。 ( 2)逻辑“或”检索:用大写 OR连接多个检索词。 高级检索中仍然有相当OR逻辑关系的字段。 ( 3 )逻辑“非”检索:检索词前加上减号“ -” (减号前必须留一空格),表示逻辑“非”,搜 索不包含该检索词的网页
基本检索中的限定检索
(3) Filetype :用来限定命中文件的类型。 命令格式: 关键词 filetype:文件类型 例:文献检索 filetype:ppt,表示在网页 中搜索包含“文献检索”内容的PPT文件.
基本检索中的限定检索
(4)inurl:在网页的url内搜索指定的内容。 inurl后面的关键词则可以出现在网页的文 档中。URL中文叫统一资源定位器。 命令格式: inurl:限定的字符串检索词 例: inurl:MP3 宋祖英,表示宋祖英可以 出现在网页的任何位置,而 MP3 则必须出 现在网页的URL中。
高级检索
高级检索界面
security
Windows 2000
Microsoft.com
检索结果
高级检索中的含义解释
1、包含以下全部的字词:相当于词间“与”关系, 2、包含以下的完整字句:相当于“ ”字符串检 索, 3、包含以下任何一个字词:相当于词间“或”关 系 4、不包括以下字词:相当于词间“非”关系
全文搜索引擎提供的完整信息
全文搜索引擎工作原理
工作原理是由网络机器人软件ROBOT,每天 24小时不停地访问因特网上的网站,并根 据页面上的链接从一个网页跳到另一个网 页,提取网页,以及标题、关键词、超链 接、元数据乃至网页全文等各种信息。搜 索到的网页信息被存储在数据库中,由机 器自动标引形成索引,建立索引库。
1.1、Google搜索引擎介绍
Google搜索引擎介绍 Google是由2名斯坦福大学博士生 Larry Page 和Sergey Brin (拉里· 佩奇和谢尔盖· 布林)1998年创 立,是目前世界上最大、用户最多、 全球公认最佳的搜索引擎。 网址(http://www.google.com.hk/)或 (http://www.google.com)
第三章 互联网信息检索
请大家动手查找,歌曲:
有位朋友,记得在《我是歌手》听过一首 韩红的歌 歌名不记得 只记得歌词几句 能 帮我搜索到歌曲名吗? 歌词大意是:花雨漫天飞翔

请大家动手查找,图片
引言

“在这个星球的历史上,从来没有这么多的 人—依靠自身—有能力去找到这么多的东 西和这么多关于其他人的信息。 ”
Google搜索引擎介绍
Google 是由英文单词“googol”变化而来 表示 1 后边带有 100 个零的数字。 Google 使用这个词代表公司想征服网上无 穷无尽资料的雄心。 Google支持100多种语言,目前已增长 至上千亿网页,其对网页进行整理,为世 界各地的用户提供便捷的网上信息查询。
检索途径
检索入口
高级检索页面
检索功能
GOOGLE提供基本搜索和高级搜索两种搜索方式: 1、基本检索 就是直接在主页的检索框内输入检索词和短语提 问,自由检索,直接获取检索结果。 2、高级检索 搜索结果区中的四种匹配方式依此表示and、精确 短语检索、or、not。每个检索框只能输入检索词, 不能输入运算符。同时还可进行时间、语言、网 域等的限制。
举例:搜索三峡旅游相关网页
用Site:限定查三峡大学毕业论文格式
如果不限定检索也可以查到,但是查准率低
方法: 检索词直接输入基本检索框
检索结果=138000条
搜索王菲的照片(intitle: 王菲写真)
搜索宋祖英的MP3音乐 (inurl:MP3 宋祖英)
在论坛上查教育技术博士点高校有哪些(教育技术博士点 inurl:bbs)
来自:Thomas
Friedman :《世上的一切问题 你去问Google》
网络搜索难点:是如何找到更少的搜索结果, 而不是找到更多。 网络搜索目标:
花费最少的时间 找到最精确的信息。


《超越谷歌:学生如何做学术研究》:
学生在学习中使用了混合方式进行与课程有关的研究 工作。 大多数学生将搜索引擎作为其研究开始的第一步
基本检索中的限定检索
(1)site:限定在某个特定的网域或站点中进 行检索。 命令格式:检索词 site:域名 例:三峡旅游 site:com,表示在商业网站 中搜索含“三峡旅游”的网页。
基本检索中的限定检索
(2)intitle:表示限定在网页标题中搜索. 命令格式:intitle:检索词 例:intitle: 王菲写真,表示在网页中 搜索包含“王菲写真”的网页.
相关文档
最新文档