第三讲 搜索引擎及其使用技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
把搜索范围限定在特定链接中—link 如: Britney link:www.yahoo.com
把搜索范围限定在特定站点中—site 如: 姚明 site:sina.com.cn
如何辨别网站的性质 .edu .gov .net .org .int .com .ac.cn 教育学术 官方政府单位 网络管理或服务机构 财团法人或基金会等非官方的一般机构 国际性组织 代表商业企业团体与组织 中国科学研究机构
元搜索引擎(META Search Engine)
同时在其他多个引擎上进行搜索,并将结果返回给用 户。 没有自己的数据库,利用一个统一的界面,查询其他 独立的搜索引擎。 优点:快捷,信息覆盖面更加广泛 缺点:高级检索功能不完善,检索结果没有经过处理 代表:InfoSpace、Dogpile、Vivisimo等(元搜索 引擎列表),中文元搜索引擎中具代表性的有北斗等。
注意: “-”为英文字符 “-”与前面一个检索词之间要 有空格 “-”与后面一个检索词之间不 能有空格
近似词检索 注意: “~”为英文字符 “~”与检索词之间不能有空格
特定词组检索
要搜索与指定网站有相似内容的网页,需在搜索框中 键入“related:”,并在其后键入相应的网址。
如:related:www.swjtu.edu.cn
2.1 Google检索步骤
确定检索需求 构建检索策略
点击检索
评估检索结果 点击浏览 保存所需信息
2.2 Google检索技巧
正确选择搜索字词 不区分大小写、自动使用“AND” 合理利用 “与/或”的搜索:OR 搜索中包括或不包括的词:+、 搜索近似词:~ 搜索特定词组:“ ” 网页快照、类似网页 利用高级检索 使用“更多”功能
http://www.dogpile.com/
且慢,让我先Google一下
我们若能更妥善地搜寻资料,实在已经改变世界
21
2 Google及其使用技巧
由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明。 约搜索30亿张网页,包括35个国家和地区的语言的资源。 已占有全球搜索市场的80%。Google 在中国的搜索市场的市场份额 也已突破30%,并且增长速度迅猛,在中文搜索市场有举足轻重的作 用。 有庞大的数据库,提供全面的结果信息,可搜索所有网站,快速有效 的搜索到自己所需内容,是一个快速、强大的搜索引擎,它具有足够 的响应能力来处理任何极度复杂的搜索,用户界面相当好。并且具有 一定的大写、名词识别能力的快速搜索引擎,它的数据库是最大的, 能找到别的搜索引擎所不能找到的东西。
67
中文版搜 索结果
文献出处及全文网址
组合运算X选Y表示在X个单位中选Y个有多少种选法
计算一个数的n次方根 平方根 三角函数 (括号中的数字单位为弧度) 以 e 为底的对数 以 10 为底的对数 阶乘 百分之
按链接搜索
有一些词后面加上冒号对 Google 具有特殊的含义。其中 的一个词是“link:”。查询 link: 显示所有指向该网址的网 页。例如,“link:www.google.com”将找出所有指向 Google 主页的网页。不能将 link: 搜索与普通关键词搜索 结合使用。 指定网域 有一些词后面加上冒号对 Google 有特殊的含义。其中的 一个词是“site:”。要在某个特定的域或站点中进行搜索, 可以在 Google 搜索框中输入“site:xxxxx.com”。
“中国石油 ” “601857” “zgsy”
“邮编”、“YB” 、“区号”、 “qh” 、“QH”
手机号码
用Google 查询手机电话号码归属地,您只需直接输入要 查的号码即可(不需要任何关键词)。Google 能自动识 别以13开头的11位数字为手机号码而返回相关的网站链接, 让您即刻便知道答案。
• 翻译网页及有难度的英汉互译 • 图像搜索
Google 的“图像搜索”是网络上现今最好用的图像搜索工具, 收录有超过3.3亿张图像。要进行图像搜索,先进入高级搜索页或 http://images.google.com/,在图像搜索框中输入要查找的资料, 然后单击“搜索”按钮。在查询结果页上单击缩略图即可看到原始大 小的图像,同时还可看到该图像所在的网页。
得心“in”手
把搜索范围限定在网页标题中——intitle
把搜索范围限定在url链接中——inurl 例: photoshop inurl:jiqiao
人在旅“图”
人在旅“图”
“学”海无涯
文章中任何位 置检出结果
66
例:检索2000-2007年有关生物芯片在药物 研究领域应用的文献
关键词 filetype:swf”
货币转换
要使用我们的内置货币转换器,只需在 Google
搜索框中键入您需要完成的货币转换,并单击
“回车”键或 Google Search 按钮即可。 【实例】
3.5 USD =? RMB
10新加坡元等于多少印度卢比 8人民币换成泰国的货币 30 人民币每公升 =? 美元每加仑
定义
要查看字词或词组的定义,只需键入“define”,接着键
入一个空格,然后键入您需要其定义的词。如果 Google 在网络上找到了该字词或词组的定义,则会检索该信息并 在搜索结果的顶部显示它们。 通过包含特殊操作符“define:”,并使该操作符与您需 要其定义的字词之间不留空格,还可获得定义的列表。
“天气”、“气象”、“tianqi”、“tian qi”
金融信息
在搜索框中输入股票和基金的名称或代码, 可查询最新的
股票和基金信息。
邮编区号
用Google 查询邮政编码或长途电话区号,您只需输入
关键词(“邮编”,“yb” 和“YB” 任选其一;“区 号”, “qh” 和“QH” 任选其一)和要查的城市地名 或邮政编码或电话区号即可。Google 会为您提供相关 的所有信息,包括所在地的省市名称,邮政编码及长途 电话区号。
• 自动"and"查询
默认情况下,Google 只返回包含所有搜索字词的网页。在字词 之间无需添加"and"。请记住,字词键入的顺序会影响搜索结果。要 进一步限制搜索,只需加入更多字词。
• 大小写
Google 搜索不区分大小写。不论您如何键入,所有字母都会视 为是小写的。例如,搜索 INFORMATION 、information 、
http://www.yahoo.com.cn/
全文搜索引擎 (Full Text Search Engine)
提取以网页文字为主的信息,建立索引数据库,检索与用户查询条件 匹配的相关记录,然后按一定的排列顺序将结果返回给用户。 分类:从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种 是拥有自己的检索程序,并自建网页数据库,搜索结果直接从自身的 数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式 排列搜索结果,如Lycos引擎。 优点:是查询全面、充分,用户能够对各网站的每篇文章中的每个词 进行搜索,检索直接、方便,而且可使用布尔逻辑检索、短语检索等 高级功能。 缺点:繁多而杂乱的感觉。 代表:Google、百度、Altavista 。
Google更多功能
得心 “In”手:intitle / inurl / intext 人在旅“图”:http://ditu.google.cn/
“学”海无涯:http://scholar.google.com/schhp?hl=zh-CN
“书”林漫步:http://books.google.com/ 新闻“快讯”:http://www.google.com/alerts?hl=zh-CN 热门“榜”单:http://www.google.cn/rebang/home 关注“趋势”:http://www.google.com/trends?hl=zh-CN
• 手气不错
它可以将您直接带到 Google 针对您的查询所找到的相关性最高 的网站。您完全看不到搜索结果页,不过如果您看到了,“手气不错” 网站会列在最顶端。例如,要查找 Cambridge大学的主页,只需在 搜索字段中输入“Cambridge”,然后单击“手气不错”按钮。 Google 将直接进入剑桥大学的官方主页 www. Cambridge.edu。
全文搜索引擎
目录式搜索引擎(Search index/Directory)
通过用户浏览层次类型目录来寻找所需信息。 分类:一般按主题分类,并辅之以年代、地区 等分类。 优点:使用户清晰方便地查找到某一大类信息, 尤其适合那些希望了解某一范围内信息,并不 严格限于查询关键字的用户。 缺点:搜索范围较全文搜索引擎要小许多,尤 其是当用户选择类型不当时,可能遗漏某些重 要的信息源。 代表:Yahoo、搜狐、新浪网站
天气查询
用 Google 查询中国城市地区的天气和天气预报,
只需输入您要查询的城市地区名称和一个关键词 (“天气”、“气象”、“tq”、“tianqi”、 “tian qi” 等,任选其一)就能在搜索结果页面 的最上方看到当日及未来二至三天的天气情况。
当鼠标移动到天气图标上时,还可以显示对应的
天气情况细节。
INformaTion等所返回的结果是一样的。
自动排除常用字词
• Google 会忽略常用字词和字符,如“where”和“how” 以及其他会降低搜索速度,却不能改善结果的单个数字和 单个字母。 • 如果必须要使用某一常见字词(数字)才能获得需要的结 果,您可以在该字词前面放一个"+"号,从而将其包含在查 询字词中。
符
号
功
能
示
例
3+44 13-5 7*8 12/3 8^2 8%7 18选4 32开5次方 sqrt(9) tan(45) ln(17) log(1,000) 5! 20%
+ * / ^ % 选 开…次方 sqrt sin, cos, etc. ln log ! %
加 减 乘 除以 的…次方 模 (除之后的余数)
搜索引擎常常是用户利用网上资源的第一途径。
1.2 搜索引擎的工作原理
1. 抓取网页
2. 处理网页
3. 提供检索服务
1.3 搜索引擎的种类
按工作语种区分
单语种搜索引擎
多语种搜索引擎
按数据来源区分
独立搜索引擎
元搜索引擎
按检索内容区分
综合型搜索引擎
专题型搜索引擎
按检索机制区分
目录搜索引擎
元搜索引擎
计算器
Google 为用户提供了一个内置计算器。只需要在搜索字段中输入算 式,按一下回车键或者搜索就可以了。这个计算器可以用来做所有简 单的计算,一些复杂的科学计算,单位换算,以及提供各种物理常数。
【实例】 2^20 sqrt(-4) 一磅=?克 光速乘以二秒等于多少公里
log((sin(5))^2)- 3
第三讲 搜索引擎及其 使用技巧
回顾及引入
下一讲:实习
主要内容
搜索引擎定义、原理及分类 Google及其使用技巧 常用的学术搜索引擎 其它搜索引擎
1 搜索引擎概述
1.1. 搜索引擎的定义
搜索引擎,即Search engine,是指根据一定的策 略、运用特定的计算机程序搜集互联网上的信 息,在对信息进行组织和处理后,为用户提供 检索服务的系统。或是一个提供信息“检索” 服务的网站。
支持13种非HTML 文件的搜索
Google 高级检索实例
例:查找与美国计算机协会类似的网站 (http://www.acm.org)。
输入www.acm.org
信息需求:查找相关专业的重要网站
wenku.baidu.com
查找其他类型文件
Google可以支持13种非HTML文件的搜索。除了PDF文档, Google现在还可以搜索Microsoft Office (doc, ppt, xls, rtf) 、Shockwave Flash (swf)、PostScript (ps)和其它 类型文档。新的文档类型只要与用户的搜索相关,就会自 动显示在搜索结果中。 例如,如果您只想查找 PDF或Flash 文件,而不要一般网 页,只需搜索: 关键词 filetype:pdf