第六章网络医学信息检索
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16
医学文献检索
二、综合性搜索引擎举要
百度 百度 Google Google Scirus Scirus Oaister Oaister BASE BASE
wenku.baidu.com
17
医学文献检索
百 度
�网址:http://www.baidu.com �百度是全球最大的中文搜索引擎之一,除提供网页搜索、 图片搜索、百度知道、MP3搜索、视频搜索、贴吧、地图 搜索等主要产品外,同时也提供文库、词典、百科、翻译、 人才等更加细化的搜索服务。
� 优点 具有较高的查全率、及时性和有效性;检索时直接输 入关键词或词组、短语,无需判断类目归属。 � 缺点 标引过程缺乏人工干预,准确性较差,检索误差较大。
15
医学文献检索
元搜索引擎
� 元搜索引擎 集成若干个独立搜索引擎的功能,给用 户提供一个统一的查询界面,对用户的查询要求加工 处理后转发给相应的多个独立搜索引擎,查询结果由 元搜索引擎反馈给用户。 � 特点 与独立搜索引擎相比,元搜索引擎具有信息资 源覆盖面大、搜索结果可靠性强、信息服务多样化和 易维护等优势。
医学文献检索
检索方法
� 基本检索 在主页检索框中输入检索词点击“Google搜索”。
� 支持布尔逻辑运算符“与”(用空格表示,不支持“AND”)、 “或”(用“OR”表示)、“非”(用“-”表示,“-”后不留空 格)。 � 采用“+”操作符,确保搜索到 Google搜索技术通常忽略的普通字 词、字母或数字等。 � 支持跨语种检索和多语种检索。 � 支持通配符“*”,用来代替多个字符,如“中华*杂志”。 � 支持精确检索,用西文双引号将检索词括起可实现精确检索。 � 支持“site:”、“link:”、“intitle:”、“inurl:”、 “filetype:”等限定检索。 � 不区分英文字母大小写。
中医药文献信息获取与利用
第二节
搜索引擎
11
医学文献检索
一、概述
�搜索引擎(Search Engine) 是互联网上的信息检 索系统,它通过软件(Robot、Crawler、Spider等) 自动搜索或网站登录等方式,以一定的策略收集 网络信息并建立索引数据库,提供网上信息查询 服务。 �搜索引擎在网络信息资源查找中发挥着重要作用。
25
医学文献检索
百度文库
26
医学文献检索
Google
� 网址:http://www.google.com.hk � Google(谷歌)目前收录40多种语言的超过一万亿个 网页,采用全文标引的方式,提供26种语言的检索界 面。
27
医学文献检索
Google
检索方法 检索方法
其他功能 其他功能
28
18
医学文献检索
百 度
基本检索 基本检索
高级搜索和个性设置 高级搜索和个性设置 其他功能 其他功能
19
医学文献检索
基本检索—逻辑检索
� “与”运算 运算符为“+”或空格,用于缩小检索范围。 使用“+”时需在其前后保留一个半角空格。如“内科学 + 教材”或“内科学 教材” 。 � “或”运算 运算符为“|”,用于扩大检索范围。使用 “|”时需在其前后保留一个半角空格。如“艾滋病 | AIDS”。 � “非”运算 运算符为“-”,用于除去特定的不需要的信 息,缩小检索范围。使用“-”时需在其前保留一个半角 空格。如“龙胆泻肝丸 -关木通”。
� 利用搜索引擎检索
�基于目录型搜索引擎的检索 如利用Yahoo!或其它专 业性网络资源指南查找信息。 �基于全文型搜索引擎的检索 利用全文型搜索引擎, 输入关键词、短语、词组等进行检索。
9
医学文献检索
网络信息检索的特点
范围拓宽 检索快捷 多元灵活 更新迅速 资源共享 界面友好 结果冗杂
10
医学文献检索
20
医学文献检索
—逻辑检索 基本检索 基本检索—
21
医学文献检索
基本检索
�精确搜索 如搜索“太阳伤寒”得到的是专论此证的 结果。 �相关检索 当无法确定输入什么检索词才能找到满 意的结果时,可先输入一个简单词语搜索。 �限定检索
22
医学文献检索
基本检索—限定检索
”限定 将检索限定在某些网站上,可在输入检索词的 � “site: site:”
如果对百度各种查询语法不熟悉,或限定检索时间、 检索结果显示方式等,可以使用百度集成的高级搜索界 面进行各种搜索查询。 http://www.baidu.com/gaoji/advanced.html
24
医学文献检索
其它功能
� 百度快照 网页在百度上自动生成的临时缓存页面。 � 百度百科 是一部内容开放、自由的网络百科全书,旨在提供 一个涵盖各领域知识的中文信息收集平台。 � 百度词典 该搜索支持全面的英汉词典、汉英词典、汉语字典、 汉语词典、汉语成语词典功能。 � 百度文库 是供网友在线分享文档的开放平台,支持主流的 doc(docx)、ppt(pptx)、xls(xlsx)、pdf、txt等文件格式。 � 百度知道 是一个基于搜索的互动式知识问答分享平台。 � 百度图片 百度其所收录的中文网页中提取各类图片,建立了 中文图片库,可检索图片近亿张。 � 百度视频 可搜索多媒体文件,如输入“伤寒”,可搜索到有 关“伤寒”方面的教学视频。
� 高级检索 对上述语法悉,可在高级检索页面中检索。
29
医学文献检索
其他功能
�手气不错 可直接引导到与检索词最相关的网页。 �相似结果 提示与该网页性质类似的网页。 �图片搜索 以缩略图方式显示图片。 �翻译 具有在 57 种语言之间即时翻译的的功能,提供所支持 的任意两种语言之间的字词、句子和网页翻译。 �学术搜索 是面向研究人员推出的专门搜索学术性著作的搜索 引擎,资源来源于学术印刷品、专家协会、大学及网络上的学 术文章与图书,还可以查询文献被引用情况。 �图书搜索 搜索结果显示图书的基本信息(如标题、作者、出 版日期等),可供浏览该书的授权页面及可以链接到购买图书 的在线书店和可以借到该图书的当地图书馆。
32
医学文献检索
学术搜索
33
医学文献检索
Scirus
� 网址:http://www.scirus.com � Scirus由Elsevier科学出版社开发,是网络上较为全面 的科学搜索引擎。通过Scirus可查找到科学、技术数 据及其他检索引擎检索不到的最新技术报告以及经专 家评审的期刊文献。 � 信息来源除大量科技相关网页外,还包括:Science Direct、BioMed Central、Medline、PubMed Central、 USPTO、ArXiv、NASA、Wiley-Blackwell等数据库服 务商、出版商及大学拥有的数字化信息。可检索到全 文(包括同行评议文章)、文摘、技术报告、专利、 课件、预印本、新闻等类型的资源。
12
医学文献检索
搜索引擎的类型
按照检索机制划分
按照根据信息覆盖范 围及适用用户群划分
目录型搜索引擎 全文型搜索引擎 元搜索引擎
搜索引擎
综合性搜索引擎 专业性搜索引擎
全文型
13
医学文献检索
目录型搜索引擎
� 目录型搜索引擎:是由信息管理专业人员在广泛搜集网 络资源,并进行加工整理的基础上,按照某种主题分类 体系编制的一种可供检索的等级结构式目录。该搜索引 擎是最早出现的网络搜索引擎。 � 特点:适用于检索综合性、概括性的题目,或对检索准 确度要求较高并需要浏览相关网站时。
35
医学文献检索
BASE
� 网址:http://www.base-search.net � 比勒费尔德学术搜索引擎 (Bielefeld Academic Search Engine)由德国比勒费尔德大学图书馆研制,对因特 网学术资源深入挖掘,提供世界范围内多学科资源 的一体化搜索,可浏览不同类型的数字馆藏。 � 由2059个机构提供内容,共收录了32621027篇文献。 除印本书服务、因特网资源服务和Gutenberg DE目 录工程等文献服务,还包括免费索取开放检索资料 和公共机构储存资源,多数免费。
网络信息资源的特点
�以现代信息技术为记录手段、以网络为传播媒体。 �信息资源丰富、数量巨大而庞杂。 �共享交互程度高、检索方式多样。 �动态性高、时效性强。 �信息资源无序、优劣混杂。
8
医学文献检索
网络信息资源检索 二、 二、网络信息资源检索
基本方法 � 浏览
�偶然发现(网上冲浪,随意性阅读) �顺“链”而行
后面跟“site:<网站>”。 ”限定 输入“link:<网址>”,可查出所有链接到此网址 � “link: link:” 的网页;若输入“link:-<网址>”的形式则排除某个特定站点的网 页。 ”限定 可限定搜索网页标题中含有某检索词的网页 � “intitle: intitle:” 。 ”限定 可限定只搜索URL中含有某文字的网页。 � “inurl: inurl:”
5
医学文献检索
网络信息资源的分类
按网络资源的生产途径和发布范围分 � 商用网络电子资源:如电子期刊、全文数据库、电子图书、
参考数据库等。
� 网络公开学术资源:包括各种学术团体、行业协会、政府
机构和相关商业部门等在网上正式发布的网页及其信息。
� 特色资源:主要基于各教育机构、政府机关、图书馆的一些
特色收藏制作,又称为灰色资源,如古籍特藏、学位论文、教 学课件等。
中医药文献信息 获取与利用
杨继红
山西中医学院文献检索教研室
中医药文献信息获取与利用
第六章
网络信息资源
目 录
第一节 概 述 第二节 搜索引擎 第三节 网络免费信息资源与开放存取
3
医学文献检索
中医药文献信息获取与利用
第一节
概述
4
医学文献检索
一、网络信息资源
� 网络信息资源目前尚无统一的定义,但普遍认为是 指通过计算机网络可以利用的各种信息资源的总和。 � 具体说来是指所有以电子数据形式把文字、图像、 声音、动画等多种形式的信息存储在光、磁等非纸 介质的载体中,并通过网络信息、计算机或终端等 方式再现出来的资源。 � 与传统信息资源相比,其主要特征是信息的数字化 和网络获取。
34
医学文献检索
Oaister
� 网址:http://oaister.worldcat.org � Oaister是美国密歇根大学图书馆开发维护的一个优 秀的开放存取搜索引擎,提供了各种学术数字资源 的一站式检索。 � 收集了来自1100多家学术机构的数字资源,包括图 书、期刊、音频、图像、电影、数据集等250万条记 录,且通常是其他搜索引擎无法找到的隐性资源, Oaister依靠OAI-PMH (the Open Archives Initiative Protocol for Metadata Harvesting)来搜索这些资源。
� 其他:如FTP资源、微信息(博客、Facebook)。
6
医学文献检索
网络信息资源的分类
按信息表现形式分
文本信息 图像信息 声音信息 视频信息 网络信息资源
按照信息加工深度分
文献型 事实型 数值型
超文本/超媒体型
索引型 文摘型
书目 索引数据库 搜索引擎
按照信息的内容分
全文型 工具型
7
医学文献检索
30
医学文献检索
学术搜索
31
医学文献检索
学术搜索
� 检索范围 包括期刊论文、摘要、图书、预印本和技 术报告等类型。Google中文学术搜索可搜索到维普资 讯、万方数据资源系统、CNKI及各种公开的学术期 刊、各类文章、专家评审文献、技术报告、图书和摘 要等中文学术资料。 � 检索方法 提供基本搜索和高级搜索两种检索方式。 � 检索结果 按相关性对搜索结果进行排序,将最有价 值的参考信息在页面顶部显示。其特点有:格式规范、 提供被引情况、提供相关主题文献、提供所有版本。
�优点 信息分类清晰、导航质量高,检索准确率高。 �缺点 更新速度较慢,信息量较小,收录范围不够全面。
14
医学文献检索
全文型搜索引擎
�全文型搜索引擎 也称检索型搜索引擎,提供主题词 或关键词及其组配的方式进行全文检索,返回结果可 按相关性排序。 �特点 适用于检索特定的信息及较为专、深、具体或 类属不明确的课题。
”限定 将检索限定在某一类文件中,在输入检索 � “filetype: filetype:”
词的后面跟“filetype:<文件类型>”。“Filetype:”后可跟以下文件 格式: DOC、XLS、PPT、PDF、RTF、ALL。 如:“高血压 filetype:ppt”。
23
医学文献检索
高级搜索和个性设置
医学文献检索
二、综合性搜索引擎举要
百度 百度 Google Google Scirus Scirus Oaister Oaister BASE BASE
wenku.baidu.com
17
医学文献检索
百 度
�网址:http://www.baidu.com �百度是全球最大的中文搜索引擎之一,除提供网页搜索、 图片搜索、百度知道、MP3搜索、视频搜索、贴吧、地图 搜索等主要产品外,同时也提供文库、词典、百科、翻译、 人才等更加细化的搜索服务。
� 优点 具有较高的查全率、及时性和有效性;检索时直接输 入关键词或词组、短语,无需判断类目归属。 � 缺点 标引过程缺乏人工干预,准确性较差,检索误差较大。
15
医学文献检索
元搜索引擎
� 元搜索引擎 集成若干个独立搜索引擎的功能,给用 户提供一个统一的查询界面,对用户的查询要求加工 处理后转发给相应的多个独立搜索引擎,查询结果由 元搜索引擎反馈给用户。 � 特点 与独立搜索引擎相比,元搜索引擎具有信息资 源覆盖面大、搜索结果可靠性强、信息服务多样化和 易维护等优势。
医学文献检索
检索方法
� 基本检索 在主页检索框中输入检索词点击“Google搜索”。
� 支持布尔逻辑运算符“与”(用空格表示,不支持“AND”)、 “或”(用“OR”表示)、“非”(用“-”表示,“-”后不留空 格)。 � 采用“+”操作符,确保搜索到 Google搜索技术通常忽略的普通字 词、字母或数字等。 � 支持跨语种检索和多语种检索。 � 支持通配符“*”,用来代替多个字符,如“中华*杂志”。 � 支持精确检索,用西文双引号将检索词括起可实现精确检索。 � 支持“site:”、“link:”、“intitle:”、“inurl:”、 “filetype:”等限定检索。 � 不区分英文字母大小写。
中医药文献信息获取与利用
第二节
搜索引擎
11
医学文献检索
一、概述
�搜索引擎(Search Engine) 是互联网上的信息检 索系统,它通过软件(Robot、Crawler、Spider等) 自动搜索或网站登录等方式,以一定的策略收集 网络信息并建立索引数据库,提供网上信息查询 服务。 �搜索引擎在网络信息资源查找中发挥着重要作用。
25
医学文献检索
百度文库
26
医学文献检索
� 网址:http://www.google.com.hk � Google(谷歌)目前收录40多种语言的超过一万亿个 网页,采用全文标引的方式,提供26种语言的检索界 面。
27
医学文献检索
检索方法 检索方法
其他功能 其他功能
28
18
医学文献检索
百 度
基本检索 基本检索
高级搜索和个性设置 高级搜索和个性设置 其他功能 其他功能
19
医学文献检索
基本检索—逻辑检索
� “与”运算 运算符为“+”或空格,用于缩小检索范围。 使用“+”时需在其前后保留一个半角空格。如“内科学 + 教材”或“内科学 教材” 。 � “或”运算 运算符为“|”,用于扩大检索范围。使用 “|”时需在其前后保留一个半角空格。如“艾滋病 | AIDS”。 � “非”运算 运算符为“-”,用于除去特定的不需要的信 息,缩小检索范围。使用“-”时需在其前保留一个半角 空格。如“龙胆泻肝丸 -关木通”。
� 利用搜索引擎检索
�基于目录型搜索引擎的检索 如利用Yahoo!或其它专 业性网络资源指南查找信息。 �基于全文型搜索引擎的检索 利用全文型搜索引擎, 输入关键词、短语、词组等进行检索。
9
医学文献检索
网络信息检索的特点
范围拓宽 检索快捷 多元灵活 更新迅速 资源共享 界面友好 结果冗杂
10
医学文献检索
20
医学文献检索
—逻辑检索 基本检索 基本检索—
21
医学文献检索
基本检索
�精确搜索 如搜索“太阳伤寒”得到的是专论此证的 结果。 �相关检索 当无法确定输入什么检索词才能找到满 意的结果时,可先输入一个简单词语搜索。 �限定检索
22
医学文献检索
基本检索—限定检索
”限定 将检索限定在某些网站上,可在输入检索词的 � “site: site:”
如果对百度各种查询语法不熟悉,或限定检索时间、 检索结果显示方式等,可以使用百度集成的高级搜索界 面进行各种搜索查询。 http://www.baidu.com/gaoji/advanced.html
24
医学文献检索
其它功能
� 百度快照 网页在百度上自动生成的临时缓存页面。 � 百度百科 是一部内容开放、自由的网络百科全书,旨在提供 一个涵盖各领域知识的中文信息收集平台。 � 百度词典 该搜索支持全面的英汉词典、汉英词典、汉语字典、 汉语词典、汉语成语词典功能。 � 百度文库 是供网友在线分享文档的开放平台,支持主流的 doc(docx)、ppt(pptx)、xls(xlsx)、pdf、txt等文件格式。 � 百度知道 是一个基于搜索的互动式知识问答分享平台。 � 百度图片 百度其所收录的中文网页中提取各类图片,建立了 中文图片库,可检索图片近亿张。 � 百度视频 可搜索多媒体文件,如输入“伤寒”,可搜索到有 关“伤寒”方面的教学视频。
� 高级检索 对上述语法悉,可在高级检索页面中检索。
29
医学文献检索
其他功能
�手气不错 可直接引导到与检索词最相关的网页。 �相似结果 提示与该网页性质类似的网页。 �图片搜索 以缩略图方式显示图片。 �翻译 具有在 57 种语言之间即时翻译的的功能,提供所支持 的任意两种语言之间的字词、句子和网页翻译。 �学术搜索 是面向研究人员推出的专门搜索学术性著作的搜索 引擎,资源来源于学术印刷品、专家协会、大学及网络上的学 术文章与图书,还可以查询文献被引用情况。 �图书搜索 搜索结果显示图书的基本信息(如标题、作者、出 版日期等),可供浏览该书的授权页面及可以链接到购买图书 的在线书店和可以借到该图书的当地图书馆。
32
医学文献检索
学术搜索
33
医学文献检索
Scirus
� 网址:http://www.scirus.com � Scirus由Elsevier科学出版社开发,是网络上较为全面 的科学搜索引擎。通过Scirus可查找到科学、技术数 据及其他检索引擎检索不到的最新技术报告以及经专 家评审的期刊文献。 � 信息来源除大量科技相关网页外,还包括:Science Direct、BioMed Central、Medline、PubMed Central、 USPTO、ArXiv、NASA、Wiley-Blackwell等数据库服 务商、出版商及大学拥有的数字化信息。可检索到全 文(包括同行评议文章)、文摘、技术报告、专利、 课件、预印本、新闻等类型的资源。
12
医学文献检索
搜索引擎的类型
按照检索机制划分
按照根据信息覆盖范 围及适用用户群划分
目录型搜索引擎 全文型搜索引擎 元搜索引擎
搜索引擎
综合性搜索引擎 专业性搜索引擎
全文型
13
医学文献检索
目录型搜索引擎
� 目录型搜索引擎:是由信息管理专业人员在广泛搜集网 络资源,并进行加工整理的基础上,按照某种主题分类 体系编制的一种可供检索的等级结构式目录。该搜索引 擎是最早出现的网络搜索引擎。 � 特点:适用于检索综合性、概括性的题目,或对检索准 确度要求较高并需要浏览相关网站时。
35
医学文献检索
BASE
� 网址:http://www.base-search.net � 比勒费尔德学术搜索引擎 (Bielefeld Academic Search Engine)由德国比勒费尔德大学图书馆研制,对因特 网学术资源深入挖掘,提供世界范围内多学科资源 的一体化搜索,可浏览不同类型的数字馆藏。 � 由2059个机构提供内容,共收录了32621027篇文献。 除印本书服务、因特网资源服务和Gutenberg DE目 录工程等文献服务,还包括免费索取开放检索资料 和公共机构储存资源,多数免费。
网络信息资源的特点
�以现代信息技术为记录手段、以网络为传播媒体。 �信息资源丰富、数量巨大而庞杂。 �共享交互程度高、检索方式多样。 �动态性高、时效性强。 �信息资源无序、优劣混杂。
8
医学文献检索
网络信息资源检索 二、 二、网络信息资源检索
基本方法 � 浏览
�偶然发现(网上冲浪,随意性阅读) �顺“链”而行
后面跟“site:<网站>”。 ”限定 输入“link:<网址>”,可查出所有链接到此网址 � “link: link:” 的网页;若输入“link:-<网址>”的形式则排除某个特定站点的网 页。 ”限定 可限定搜索网页标题中含有某检索词的网页 � “intitle: intitle:” 。 ”限定 可限定只搜索URL中含有某文字的网页。 � “inurl: inurl:”
5
医学文献检索
网络信息资源的分类
按网络资源的生产途径和发布范围分 � 商用网络电子资源:如电子期刊、全文数据库、电子图书、
参考数据库等。
� 网络公开学术资源:包括各种学术团体、行业协会、政府
机构和相关商业部门等在网上正式发布的网页及其信息。
� 特色资源:主要基于各教育机构、政府机关、图书馆的一些
特色收藏制作,又称为灰色资源,如古籍特藏、学位论文、教 学课件等。
中医药文献信息 获取与利用
杨继红
山西中医学院文献检索教研室
中医药文献信息获取与利用
第六章
网络信息资源
目 录
第一节 概 述 第二节 搜索引擎 第三节 网络免费信息资源与开放存取
3
医学文献检索
中医药文献信息获取与利用
第一节
概述
4
医学文献检索
一、网络信息资源
� 网络信息资源目前尚无统一的定义,但普遍认为是 指通过计算机网络可以利用的各种信息资源的总和。 � 具体说来是指所有以电子数据形式把文字、图像、 声音、动画等多种形式的信息存储在光、磁等非纸 介质的载体中,并通过网络信息、计算机或终端等 方式再现出来的资源。 � 与传统信息资源相比,其主要特征是信息的数字化 和网络获取。
34
医学文献检索
Oaister
� 网址:http://oaister.worldcat.org � Oaister是美国密歇根大学图书馆开发维护的一个优 秀的开放存取搜索引擎,提供了各种学术数字资源 的一站式检索。 � 收集了来自1100多家学术机构的数字资源,包括图 书、期刊、音频、图像、电影、数据集等250万条记 录,且通常是其他搜索引擎无法找到的隐性资源, Oaister依靠OAI-PMH (the Open Archives Initiative Protocol for Metadata Harvesting)来搜索这些资源。
� 其他:如FTP资源、微信息(博客、Facebook)。
6
医学文献检索
网络信息资源的分类
按信息表现形式分
文本信息 图像信息 声音信息 视频信息 网络信息资源
按照信息加工深度分
文献型 事实型 数值型
超文本/超媒体型
索引型 文摘型
书目 索引数据库 搜索引擎
按照信息的内容分
全文型 工具型
7
医学文献检索
30
医学文献检索
学术搜索
31
医学文献检索
学术搜索
� 检索范围 包括期刊论文、摘要、图书、预印本和技 术报告等类型。Google中文学术搜索可搜索到维普资 讯、万方数据资源系统、CNKI及各种公开的学术期 刊、各类文章、专家评审文献、技术报告、图书和摘 要等中文学术资料。 � 检索方法 提供基本搜索和高级搜索两种检索方式。 � 检索结果 按相关性对搜索结果进行排序,将最有价 值的参考信息在页面顶部显示。其特点有:格式规范、 提供被引情况、提供相关主题文献、提供所有版本。
�优点 信息分类清晰、导航质量高,检索准确率高。 �缺点 更新速度较慢,信息量较小,收录范围不够全面。
14
医学文献检索
全文型搜索引擎
�全文型搜索引擎 也称检索型搜索引擎,提供主题词 或关键词及其组配的方式进行全文检索,返回结果可 按相关性排序。 �特点 适用于检索特定的信息及较为专、深、具体或 类属不明确的课题。
”限定 将检索限定在某一类文件中,在输入检索 � “filetype: filetype:”
词的后面跟“filetype:<文件类型>”。“Filetype:”后可跟以下文件 格式: DOC、XLS、PPT、PDF、RTF、ALL。 如:“高血压 filetype:ppt”。
23
医学文献检索
高级搜索和个性设置