2、google等学术搜索引擎的检索方法与技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这是因为专业数据库 的索引库只有:文 摘、标题、关键 词、著者、机构 等文摘型内容,所 以会漏检。学术 谷歌是扫描全文, 有效地保证了查 全率。
CNKI知识搜索
“CNKI知识搜索”是大家经常使用的查找学术 文献的工具。它是基于中国知网学术文献总 库的搜索。
CNKI翻译助手
更多……
Elsevier Scirus科学搜索引擎 http://www.scirus.com 百度阅读 http://yuedu.baidu.com/
Google 高级检索实例 2
信息需求类型:直接查找具体数值,权威发布源
例:高级检索查找2007年我国农村互联网普及率 包含全部字词:2007 包含以下完整字句:农村互联网普及率为 网域: 仅cnnic.net.cn(仅在CNNIC网站中搜索)
2021/4/13
复旦大学文献检索教研室
34
2021/4/13
4、 提高用户体验 搜索引擎最在意的是用户体验,站长投其所好自然会受到收索引擎的青睐,比如:经 常更新高质量原创文章、网站跳出率、提高网站的停留时间、增加用户粘性等等。这 些就要靠网站质量来撑了。
搜索引擎的分类
搜索引擎的类型
按收录的资源的学科覆盖面划分
综合性搜索引擎
Infoseek、Excite
专门学科及专题 性搜索引擎
35
Google 高级检索实例 3
信息需求:查找相关专业的重要网站 例:查找与美国计算机协会类似的网站 (http://www.acm.org)
输入www.acm.org
Google scholar
http://scholar.google.com 是搜索引擎公司Google面向研究人员推出的专门搜 索学术性著作的搜索引擎,资源来源于学术印刷品 、专家协会、大学及网络上的学术文章,包括评论 、主题、书籍、预印本和技术报告以及开放存取的 资源等,还可以查询文章被引用情况。
点击进入
图像搜索
按实际需要选择常规检索或高级检索
如果不善于使用限定检索,可考虑使用高级检索功能。 高级检索可兼容逻辑操作符与部分限定代码功能。还 提供更为具体的检索范围限制。
Google 高级检 索
Google高级检索实例1
信息需求类型:广泛了解课题研究的动向
例:查找有关“集成电路评估”研究的网页,要求检索词出 现在网页标题中。 allintitle:“integrated circuits” evaluation
Electronic Library、 SOSIG 、WSRN 等
搜索引擎的分类
搜索引擎的使用技巧
关于逻辑算符 检索表达式的构成 选择恰当的关键词 正确使用限定代码 其它技巧
逻辑与功能
逻辑非功能
逻辑或功能
专用术语查询功能
常用检索符号
书名号《 》 双引号 “ ” 截词符:*
搜索引擎的使用技巧
Google等搜索引擎使用方法与技巧
问题思考
利用搜索引擎检索下列课题 湖南大学教务处签发的相关文件; 与www.hnu.edu.cn类似的网站; 基于jpg格式的图书馆的图片资料。
搜索引擎
Oclc在2011年的调查报告中显示,有84%的人把网络 搜索引擎作为信息研究的起点,但没有一个人从图书馆网 站 开 始 他 们 的 搜 索 活 动 ( 另 外 有 3% 的 人 选 择 了 Wikipedia)。这和五年前oclc的研究报告《大学生对图 书馆与信息资源的认识》(只有2%的用户从图书馆网页 上进行信息检索)比起来,很明显,图书馆对读者的吸引 力更低了。虽然与学术搜索引擎和网络搜索引擎相比,图 书馆更值得信任和更准确。但由于搜素引擎的方便、快捷 、易用的资源一体化检索,显然让用户更青睐。
提高检索的时效
随着新产品、新技术更新速度加快, 传统数据库更新速度已显得相对滞后,检索期 刊的滞后期少则一个月,多达半年。搜索引擎以其更新及时的特点正好弥补了传统数 据库的不足。课题检索时在检索数据库的基础上,利用Internet搜索引擎进行检索,可 以弥补数据库的时差问题,尤其是在新产品检索时,更应该进行数据库之外的 Internet上的信息查询。
网页快照
网页快照,英文名叫Web Cache,网页缓存。搜 索引擎在收录网页时,对网页进行备份,存在 自己的服务器缓存里,当用户在搜索引擎中点 击“网页快照”链接时,搜索引擎将Spider系 统当时所抓取并保存的网页内容展现出来,称 为“网页快照”。
当搜索的网页被删除 或连接失效时,可以 使用网页快照来查看 这个网页原始的内容
搜索引擎
百度特色搜索(1)——新闻搜索
百度新闻不含任何人工编辑成分,没有新闻偏见,真实地反映每时每刻 的新闻热点,突出新闻的客观性和完整性。
焦点新闻是通过自动计算一篇新闻被所有新闻网站转载和引用的次数, 鉴于越受关注的新闻将会被越多的转载或引用,相当于由每个新闻网 站和报刊杂志的编辑记者一起参与投票民主选举热点新闻。
百度新闻每天发布 80000--100000 条
搜索引擎
百度特色搜索(2)—百度指数
在百度产品中,百度指数对某些关键词信息进行了更多的 汇总,可以提供诸如关键词详细数据和曲线图、关键词对 比分析、查看关键词搜索排名前十的省份和城市分布和人 群属性分布等数据分析功能。
搜索引擎 Scirus(www.scirus.com)--科技搜索引擎
2、 关键词要突出显示 搜索引擎会看网站里关键词是否突出显示,比如加粗了、有链接、是导航里的文字等 ,同时关键词的密度也要增加到3%-9%最佳。假设你的网站里有100篇文章都和这 个关键词相关,那么搜素引擎就会认为你这个网站和搜索词的相关度更高,是读者想 看到的网站,排名也会随之提升。
3、 网站爬行顺序和效率要高 网站服务器响应时间要快,打开速度也要快,7秒钟打不开的网站就会认为用户体验度 很差。同时网站结构要好,最好有网站地图,蜘蛛能跟着链接爬行到所有的网页。 400页面要有返回首页的链接,否则就会把蜘蛛带进死胡同。经常检查死链或者无效 链接,
科技研究的助手
搜索引擎
Scirus是专门用于科技信息检索的世界上最全面的
科技搜索引擎。它的主要特色:
信息源主要是两部分:网页和期刊 过滤非科学方面的信息 收录同行评审(peer-reviewed)的文章 可以搜索特定作者、期刊、出版年等缩小查询范围 可同时查询学科相关的会议、摘要、及专利资料
Scirus--高级检索
进入数据库下载全文
Google图书搜索
百度(www.baidu.com)
搜索引擎
“众里寻他千百度,蓦然回首,那人却在灯火阑珊处” ——辛弃疾 《青玉案》
常用搜索引擎
主要特色功能 1: 百度快照 2: 相关搜索 3: 拼音提示 4: 错别字提示 5: 英汉互译词典 6: 计算器和度量衡转换 7: 专业文档搜索 8: 股票,列车时刻表和飞机航班查询 9: 高级搜索语法 10:高级搜索,地区搜索和个人设置
作者检索
按标题检索
例:检索2000-2007年有关生物芯片在药物 研究领域应用的文献
检索结果
Google scholar in English
Google scholar in English
利用Google Scholar的服务功能 导入Endnote 电子邮件提醒 检索结果可以方便地链接到合作图 书馆
搜索引擎概述 Google等搜索引擎的一般使用方法 Google 学术搜索的检索技巧 CNKI学术搜索的使用技巧
搜索引掣
搜索引擎
搜索引擎:是一种通用的检索以WWW资源站点为主
的网络信息资源的检索工具。
搜索引擎因其提供的检索结果为特定资源 的链接,与传统的以提供原始文献出处的 索引的检索原理相同,本质上是一种二次 文献检索服务。
降低传统检索的成本
学术搜索引擎基于互联网上的免费资源,在常规检索中有效运用学术搜索引擎,能 够大大降低检索成本,提高检索效率。
运用Google Scholar辅助检索举例
检索课题:碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究 关键词: 玄武岩;夹凝灰岩;隧道
检索结果:学术谷
歌5条;维普1条、 CNKI1条
E读学术搜索http://www.yidu.edu.cn/
搜索引擎的加深学习
推荐学习网址: 1.中文搜索引擎指南网
http://www.sowang.com 2.搜搜快报 http://www.sskb.cn/sort/4.html
搜索引擎
搜索引擎使用现状
全球每天约有近4亿次搜索请求,其中中国超过 6600万次; 78.3%网民使用搜索引擎,仅次于电子邮件; 84.6% 网民是通过搜索引擎发现新的网站,排 名第一; 41%网民是通过搜索引擎进入在线购物平台。
(数据来源自CNNIC发布的《中国互联网络发展状况统计报告》)
主要内容
搜索引掣
搜索引擎工作原理
从互联网上抓取网页 (数据采集) 建立索引数据库 (数据标引)
搜索排序 (数据组织)
把结果返回给用户 (数据检索)
输出结果排序原则
相关度 检索词出现的位置和词频(位置词频法) 链接流行度(网页被其他网页或网站引用或链 接的次数) 付费
任何搜索引擎的搜索结果排序,都有它自己的算法,这也是 搜 索 技 术 的 核 心 所 在 。 比 如 Google 的 Page rank. 但总的原则,是要以用户体验为中心,确保与搜索的关键词最 相关的网页排在最前面,然后按其重要程序依此排列。 这个排序的过程和结果完全由程序来决定,没有人工干涉。
搜索引擎
限制检索范围: • 文献年代 • 文献类型 • 文献格式 • 数据来源 • 学科范围
检索示例
课题:SARS病毒来源的研究状况 核心词:SARS,病毒,来源 SARS:SARS , severe acute respiratory syndrome 病毒: virus 来源:source,sources
①网站:Site
如:老舍 Site:sina.com
②文件类型:filetype
如:信息组织 filetype:pdf
③标题:intitle:信息检索 ④链接:inanchor或link ⑤内文:intext
⑥相关:related
指定网域
指定文件类型
“手气不错”功 能
利用“手气不错”将自 动进入 Google 查询到 的第一个网页或者将最 相关的网页排在第一条
搜索引擎的使用技巧 检索表达式的构成
主要由关键词和限定代码构成。
搜索引擎的使用技巧
关于限定代码
主要指对具体关键词的限定、说明或对网页外部特征的 描述。可以是关键词语,也可以是数字、拉丁字母等 符号。
搜索引擎的使用技巧
常用检索运算符号(注:不同的搜索引擎,符号的采用略有不同)
布尔逻辑操作符 “and”、“or”、 “not” 常用限定代码符号
百度专利搜索http://zhuanli.baidu.com/
百度文库搜索http://wenku.baidu.com 读秀图书搜索 http://www.duxiu.com/ Google专利搜索http://www.google.com/patents 书生之家搜吧 http://www.souba.org/sou/
处理结果 在线词表
排序方式 结果来源
截止到5月20日
为什么要利用学术搜索引擎?
弥补数据库检索的“盲区”
传统检索所用的数据库在资源存储形式、学科范围、检索方式上都有一定的限定。 而学术搜索引擎则是全方位,多角度搜索,能搜索各种格式的文件,没有学科的限制, 边界很广,这正好弥补了课题检索对检全率的需求。对于某些特殊的检索,如要求查 某种产品的参数,要求比较产品的外形, 搜索引擎的图片查询功能就有用武之地了。 有些搜索引擎不但能搜到图片,甚至连多媒体、网站链接都可以搜索,这将会对某些 特殊的检索中起到关键作用。
随着运营成本的提高,搜索引擎为了有商业上的收入,逐渐 打起了网页排序的主意。它把付费的网站放在自然排序结果的 前面,按照点击次数收费。并按照“竞价”的模式对付费网页 排序。简单的说,就是你愿意为每次点击付出的费用越高。你 的网页排名就能越靠前。
1、 网站关键词与文章相关性要高 搜索引擎会检查网站关键地方是否含有关键词,如: (1) 更பைடு நூலகம்的文章里:文章标题、段落开头或者结尾、文章的结尾处是否有关键词 (2) 网站网址、导航里最好有关键词 (3) 网页代码里的meta标签里添加关键词
CNKI知识搜索
“CNKI知识搜索”是大家经常使用的查找学术 文献的工具。它是基于中国知网学术文献总 库的搜索。
CNKI翻译助手
更多……
Elsevier Scirus科学搜索引擎 http://www.scirus.com 百度阅读 http://yuedu.baidu.com/
Google 高级检索实例 2
信息需求类型:直接查找具体数值,权威发布源
例:高级检索查找2007年我国农村互联网普及率 包含全部字词:2007 包含以下完整字句:农村互联网普及率为 网域: 仅cnnic.net.cn(仅在CNNIC网站中搜索)
2021/4/13
复旦大学文献检索教研室
34
2021/4/13
4、 提高用户体验 搜索引擎最在意的是用户体验,站长投其所好自然会受到收索引擎的青睐,比如:经 常更新高质量原创文章、网站跳出率、提高网站的停留时间、增加用户粘性等等。这 些就要靠网站质量来撑了。
搜索引擎的分类
搜索引擎的类型
按收录的资源的学科覆盖面划分
综合性搜索引擎
Infoseek、Excite
专门学科及专题 性搜索引擎
35
Google 高级检索实例 3
信息需求:查找相关专业的重要网站 例:查找与美国计算机协会类似的网站 (http://www.acm.org)
输入www.acm.org
Google scholar
http://scholar.google.com 是搜索引擎公司Google面向研究人员推出的专门搜 索学术性著作的搜索引擎,资源来源于学术印刷品 、专家协会、大学及网络上的学术文章,包括评论 、主题、书籍、预印本和技术报告以及开放存取的 资源等,还可以查询文章被引用情况。
点击进入
图像搜索
按实际需要选择常规检索或高级检索
如果不善于使用限定检索,可考虑使用高级检索功能。 高级检索可兼容逻辑操作符与部分限定代码功能。还 提供更为具体的检索范围限制。
Google 高级检 索
Google高级检索实例1
信息需求类型:广泛了解课题研究的动向
例:查找有关“集成电路评估”研究的网页,要求检索词出 现在网页标题中。 allintitle:“integrated circuits” evaluation
Electronic Library、 SOSIG 、WSRN 等
搜索引擎的分类
搜索引擎的使用技巧
关于逻辑算符 检索表达式的构成 选择恰当的关键词 正确使用限定代码 其它技巧
逻辑与功能
逻辑非功能
逻辑或功能
专用术语查询功能
常用检索符号
书名号《 》 双引号 “ ” 截词符:*
搜索引擎的使用技巧
Google等搜索引擎使用方法与技巧
问题思考
利用搜索引擎检索下列课题 湖南大学教务处签发的相关文件; 与www.hnu.edu.cn类似的网站; 基于jpg格式的图书馆的图片资料。
搜索引擎
Oclc在2011年的调查报告中显示,有84%的人把网络 搜索引擎作为信息研究的起点,但没有一个人从图书馆网 站 开 始 他 们 的 搜 索 活 动 ( 另 外 有 3% 的 人 选 择 了 Wikipedia)。这和五年前oclc的研究报告《大学生对图 书馆与信息资源的认识》(只有2%的用户从图书馆网页 上进行信息检索)比起来,很明显,图书馆对读者的吸引 力更低了。虽然与学术搜索引擎和网络搜索引擎相比,图 书馆更值得信任和更准确。但由于搜素引擎的方便、快捷 、易用的资源一体化检索,显然让用户更青睐。
提高检索的时效
随着新产品、新技术更新速度加快, 传统数据库更新速度已显得相对滞后,检索期 刊的滞后期少则一个月,多达半年。搜索引擎以其更新及时的特点正好弥补了传统数 据库的不足。课题检索时在检索数据库的基础上,利用Internet搜索引擎进行检索,可 以弥补数据库的时差问题,尤其是在新产品检索时,更应该进行数据库之外的 Internet上的信息查询。
网页快照
网页快照,英文名叫Web Cache,网页缓存。搜 索引擎在收录网页时,对网页进行备份,存在 自己的服务器缓存里,当用户在搜索引擎中点 击“网页快照”链接时,搜索引擎将Spider系 统当时所抓取并保存的网页内容展现出来,称 为“网页快照”。
当搜索的网页被删除 或连接失效时,可以 使用网页快照来查看 这个网页原始的内容
搜索引擎
百度特色搜索(1)——新闻搜索
百度新闻不含任何人工编辑成分,没有新闻偏见,真实地反映每时每刻 的新闻热点,突出新闻的客观性和完整性。
焦点新闻是通过自动计算一篇新闻被所有新闻网站转载和引用的次数, 鉴于越受关注的新闻将会被越多的转载或引用,相当于由每个新闻网 站和报刊杂志的编辑记者一起参与投票民主选举热点新闻。
百度新闻每天发布 80000--100000 条
搜索引擎
百度特色搜索(2)—百度指数
在百度产品中,百度指数对某些关键词信息进行了更多的 汇总,可以提供诸如关键词详细数据和曲线图、关键词对 比分析、查看关键词搜索排名前十的省份和城市分布和人 群属性分布等数据分析功能。
搜索引擎 Scirus(www.scirus.com)--科技搜索引擎
2、 关键词要突出显示 搜索引擎会看网站里关键词是否突出显示,比如加粗了、有链接、是导航里的文字等 ,同时关键词的密度也要增加到3%-9%最佳。假设你的网站里有100篇文章都和这 个关键词相关,那么搜素引擎就会认为你这个网站和搜索词的相关度更高,是读者想 看到的网站,排名也会随之提升。
3、 网站爬行顺序和效率要高 网站服务器响应时间要快,打开速度也要快,7秒钟打不开的网站就会认为用户体验度 很差。同时网站结构要好,最好有网站地图,蜘蛛能跟着链接爬行到所有的网页。 400页面要有返回首页的链接,否则就会把蜘蛛带进死胡同。经常检查死链或者无效 链接,
科技研究的助手
搜索引擎
Scirus是专门用于科技信息检索的世界上最全面的
科技搜索引擎。它的主要特色:
信息源主要是两部分:网页和期刊 过滤非科学方面的信息 收录同行评审(peer-reviewed)的文章 可以搜索特定作者、期刊、出版年等缩小查询范围 可同时查询学科相关的会议、摘要、及专利资料
Scirus--高级检索
进入数据库下载全文
Google图书搜索
百度(www.baidu.com)
搜索引擎
“众里寻他千百度,蓦然回首,那人却在灯火阑珊处” ——辛弃疾 《青玉案》
常用搜索引擎
主要特色功能 1: 百度快照 2: 相关搜索 3: 拼音提示 4: 错别字提示 5: 英汉互译词典 6: 计算器和度量衡转换 7: 专业文档搜索 8: 股票,列车时刻表和飞机航班查询 9: 高级搜索语法 10:高级搜索,地区搜索和个人设置
作者检索
按标题检索
例:检索2000-2007年有关生物芯片在药物 研究领域应用的文献
检索结果
Google scholar in English
Google scholar in English
利用Google Scholar的服务功能 导入Endnote 电子邮件提醒 检索结果可以方便地链接到合作图 书馆
搜索引擎概述 Google等搜索引擎的一般使用方法 Google 学术搜索的检索技巧 CNKI学术搜索的使用技巧
搜索引掣
搜索引擎
搜索引擎:是一种通用的检索以WWW资源站点为主
的网络信息资源的检索工具。
搜索引擎因其提供的检索结果为特定资源 的链接,与传统的以提供原始文献出处的 索引的检索原理相同,本质上是一种二次 文献检索服务。
降低传统检索的成本
学术搜索引擎基于互联网上的免费资源,在常规检索中有效运用学术搜索引擎,能 够大大降低检索成本,提高检索效率。
运用Google Scholar辅助检索举例
检索课题:碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究 关键词: 玄武岩;夹凝灰岩;隧道
检索结果:学术谷
歌5条;维普1条、 CNKI1条
E读学术搜索http://www.yidu.edu.cn/
搜索引擎的加深学习
推荐学习网址: 1.中文搜索引擎指南网
http://www.sowang.com 2.搜搜快报 http://www.sskb.cn/sort/4.html
搜索引擎
搜索引擎使用现状
全球每天约有近4亿次搜索请求,其中中国超过 6600万次; 78.3%网民使用搜索引擎,仅次于电子邮件; 84.6% 网民是通过搜索引擎发现新的网站,排 名第一; 41%网民是通过搜索引擎进入在线购物平台。
(数据来源自CNNIC发布的《中国互联网络发展状况统计报告》)
主要内容
搜索引掣
搜索引擎工作原理
从互联网上抓取网页 (数据采集) 建立索引数据库 (数据标引)
搜索排序 (数据组织)
把结果返回给用户 (数据检索)
输出结果排序原则
相关度 检索词出现的位置和词频(位置词频法) 链接流行度(网页被其他网页或网站引用或链 接的次数) 付费
任何搜索引擎的搜索结果排序,都有它自己的算法,这也是 搜 索 技 术 的 核 心 所 在 。 比 如 Google 的 Page rank. 但总的原则,是要以用户体验为中心,确保与搜索的关键词最 相关的网页排在最前面,然后按其重要程序依此排列。 这个排序的过程和结果完全由程序来决定,没有人工干涉。
搜索引擎
限制检索范围: • 文献年代 • 文献类型 • 文献格式 • 数据来源 • 学科范围
检索示例
课题:SARS病毒来源的研究状况 核心词:SARS,病毒,来源 SARS:SARS , severe acute respiratory syndrome 病毒: virus 来源:source,sources
①网站:Site
如:老舍 Site:sina.com
②文件类型:filetype
如:信息组织 filetype:pdf
③标题:intitle:信息检索 ④链接:inanchor或link ⑤内文:intext
⑥相关:related
指定网域
指定文件类型
“手气不错”功 能
利用“手气不错”将自 动进入 Google 查询到 的第一个网页或者将最 相关的网页排在第一条
搜索引擎的使用技巧 检索表达式的构成
主要由关键词和限定代码构成。
搜索引擎的使用技巧
关于限定代码
主要指对具体关键词的限定、说明或对网页外部特征的 描述。可以是关键词语,也可以是数字、拉丁字母等 符号。
搜索引擎的使用技巧
常用检索运算符号(注:不同的搜索引擎,符号的采用略有不同)
布尔逻辑操作符 “and”、“or”、 “not” 常用限定代码符号
百度专利搜索http://zhuanli.baidu.com/
百度文库搜索http://wenku.baidu.com 读秀图书搜索 http://www.duxiu.com/ Google专利搜索http://www.google.com/patents 书生之家搜吧 http://www.souba.org/sou/
处理结果 在线词表
排序方式 结果来源
截止到5月20日
为什么要利用学术搜索引擎?
弥补数据库检索的“盲区”
传统检索所用的数据库在资源存储形式、学科范围、检索方式上都有一定的限定。 而学术搜索引擎则是全方位,多角度搜索,能搜索各种格式的文件,没有学科的限制, 边界很广,这正好弥补了课题检索对检全率的需求。对于某些特殊的检索,如要求查 某种产品的参数,要求比较产品的外形, 搜索引擎的图片查询功能就有用武之地了。 有些搜索引擎不但能搜到图片,甚至连多媒体、网站链接都可以搜索,这将会对某些 特殊的检索中起到关键作用。
随着运营成本的提高,搜索引擎为了有商业上的收入,逐渐 打起了网页排序的主意。它把付费的网站放在自然排序结果的 前面,按照点击次数收费。并按照“竞价”的模式对付费网页 排序。简单的说,就是你愿意为每次点击付出的费用越高。你 的网页排名就能越靠前。
1、 网站关键词与文章相关性要高 搜索引擎会检查网站关键地方是否含有关键词,如: (1) 更பைடு நூலகம்的文章里:文章标题、段落开头或者结尾、文章的结尾处是否有关键词 (2) 网站网址、导航里最好有关键词 (3) 网页代码里的meta标签里添加关键词