《生物医学信息检索》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
h
1
第一章 信息检索概述
第一节 信息、信息社会、信息检索 一、信息的概念(Information)
广义:信息是指事物存在方式及其运动规律、 特点的外在表现形式,以及信息活动中各种 要素的总称,包括信息本体、与信息有关的 人员、设备、技术和资金等各种资源。
狭义:信息是指文献资源或数据资源,包括 任何媒体中的片段、文章、图书、情报、观 念等。
=
查出的有关文献量 查出的文献总量
× 100%
•
误检率N
=
查出的无关文献量 查出的文献总量
× 100%
第一篇 信息检索概述
• 检索效率的基本特性
如图所示: R
P 0
• P高则R底;R高则P底 • 要取得较好的检索效果应兼顾二者,一般,
查全率为:60~70% 查准率为:40~50%
第一篇 信息检索概述
第一篇 信息检索概述
网络资源特点
• 数量巨大,增长迅速 • 内容丰富,形式多样 • 时效性强,变化迅速 • 交互性好,可以共享 • 分布广泛, 无序化 • 信息冗余, 缺乏管理 • 商业性强, 多数收费
Βιβλιοθήκη Baidu
第一篇 信息检索概述
五、文献检索效果评价
1. 查全率与查准率的概念
• 查全率是指系统在进行某一检索时,检出 的相关文献量与系统文献库中相关文献总 量的比率,它反映该系统文献库中实有的 相关文献量在多大程度上被检索出来。
三、信息的特征
1)客观性 2)普遍性 3)依附性 4)认知性 5)转移性和变换性
6)价值性 7)存储性 8)传递性 9)共享性 10)时效性
第一篇 信息检索概述
四、信息的类型 信息按照其外在的表现形式和内涵等,有许多不
同的分类法。了解信息的类型,对获取信息、分析 信息、表达信息都很有必要。
几种主要的信息类型 1、按载体形式 2、按出版类型 3、按使用级别 4、网络信息资源
创造或一些新见解的文献。
二次信息
书目文献:是对一定范围、时间或类型的大量
一次性文献按其特征收集整理、压缩、加工,并 按一定顺序组织编排、用于检索查找利用这些文 献而编制的文献。
三次信息
高级信息产物:在充分利用二次文献的基础上
对一次文献做出的系统整理和概括的论述,并加 以分析综合编写而成的概括性文献。
•
查全率R=
查出的有关文献量 存储的某一课题的文总献量
×
100%
•
漏检率
O
=
未被查出的有关文献量
存储的某一课题的文献总量×
100%
第一篇 信息检索概述
• 查准率是指系统在进行某一检索时,检出 的相关文献量与检出文献总量的比率,它 反映每次从该系统文献库中实际检出的全 部文献中有多少是相关的。
•
查准率P
第一篇 信息检索概述
1、按载体类型
印刷型
纸张-图书、期刊、专利文献等
缩微型 视听型
感光材料-缩微胶片、平片、胶卷 磁带等-录音带、录像带、电影胶片
机读型
磁、光盘-电子期刊、图书、数据库
第一篇 信息检索概述
2、按出版类型
图书
内容比较成熟、系统、可靠的出 版物,是学习和参考的主要信息源
International Standard Book Number
第一篇 信息检索概述
(2)影响查准率的因素
索引词不能准确描述文献主题和检索要求; 组配规则不严密; 选词及词间关系不正确; 标引过于详尽; 组配错误; 检索时所用检索词(或检索式)专指度不够,
检索面宽于检索要求; 检索系统不具备逻辑“非”功能和反馈功能; 检索式中允许容纳的词数量有限; 截词部位不当,检索式中使用逻辑“或”不当
零次信息
指未正式发表或未进入社会交流的最原始的文献
第一篇 信息检索概述
第一篇 信息检索概述
4、网络信息资源 • “通过计算机网络可以利用的各种信息资源
的总和” • 网络中存在着大量的生物学和医药学信息资
源,它连接着世界上许多著名的医学研究机 构、医科大学和医院,成为一个集生物医学 信息资源为一体的数据资源网 • 在数量、结构、分布和传播的范围、载体形 态、内涵和传递手段等方面都显示出了新的 特点
第二章 信息与知识、情报、文献
二、信息与情报(Information)
1、情报的概念 情报是指用不同的方法和手段,在有效的时间内
所获得的有针对性和有价值的知识。 西方:情报和信息是同一个词 Information 我国:情报是一种信息,但信息不是情报。要将
信息变成情报一般要经过选择、统计分析和加工整 理的过程,情报的概念范围要比信息窄一些。 2、情报的特点
2.影响检索效果的因素
(1)影响查全率的因素
文献库收录文献不全;
索引词汇缺乏控制和专指性;
从文献 存储来 看,主 要有
词表结构不完整; 词间关系模糊或不正确; 标引不详或标引前后不一致;
标引人员遗漏了原文的重要概念或用词
不当等。
第一篇 信息检索概述
从情报 检索来 看,主 要有
检索策略过于简单; 选词和进行逻辑组配不当; 检索途径和方法太少; 检索人员业务不熟练和缺乏耐心; 检索系统不具备截词功能和反馈功 能,检索时不能全面地描述检索 要求等。
知识性、传递性、效用性。
第二章 信息与知识、情报、文献
有固定名称和连续卷号、期号的定
期刊
期出版物。所含信息量大、新颖,
是科研工作主要信息源(ISSN)
特种文献
其它文献资料出版物的总称,信息 全面、密度高,一般图书馆不做重 点收藏
第一篇 信息检索概述 文献出版类型
第一篇 信息检索概述
3、按使用级别
原始创作:是以作者本人的工作经验、观察
一次信息
或实际科研成果为依据而创作的具有一定发明
第一章 信息检索概述
二、信息素养
• 信息素养(Information literacy)指具有检 索、分析、评价和利用各种信息源以解决 信息需求及制定明智决策的能力,是对个 人信息行为能力、独立学习能力以及批判 性思维能力等概括性描述。
• 信息素养包括:信息意识、信息能力、信 息道德等方面。
第一篇 信息检索概述
第二章 信息与知识、情报、文献
一、信息与知识
1.信息 information 信息指物质存在或运动方式与状态的表现形式 或反映,是现实世界事物的反映,它提供了客观世 界事物的消息、知识,是事物的一种普遍属性。
2.知识 knowledge 是人们对自然界、人类社会中各种信息进行分 析、加工提炼,并且加以系统和深化而形成的信息 集合。 知识就是信息,是信息的高级形态。
1
第一章 信息检索概述
第一节 信息、信息社会、信息检索 一、信息的概念(Information)
广义:信息是指事物存在方式及其运动规律、 特点的外在表现形式,以及信息活动中各种 要素的总称,包括信息本体、与信息有关的 人员、设备、技术和资金等各种资源。
狭义:信息是指文献资源或数据资源,包括 任何媒体中的片段、文章、图书、情报、观 念等。
=
查出的有关文献量 查出的文献总量
× 100%
•
误检率N
=
查出的无关文献量 查出的文献总量
× 100%
第一篇 信息检索概述
• 检索效率的基本特性
如图所示: R
P 0
• P高则R底;R高则P底 • 要取得较好的检索效果应兼顾二者,一般,
查全率为:60~70% 查准率为:40~50%
第一篇 信息检索概述
第一篇 信息检索概述
网络资源特点
• 数量巨大,增长迅速 • 内容丰富,形式多样 • 时效性强,变化迅速 • 交互性好,可以共享 • 分布广泛, 无序化 • 信息冗余, 缺乏管理 • 商业性强, 多数收费
Βιβλιοθήκη Baidu
第一篇 信息检索概述
五、文献检索效果评价
1. 查全率与查准率的概念
• 查全率是指系统在进行某一检索时,检出 的相关文献量与系统文献库中相关文献总 量的比率,它反映该系统文献库中实有的 相关文献量在多大程度上被检索出来。
三、信息的特征
1)客观性 2)普遍性 3)依附性 4)认知性 5)转移性和变换性
6)价值性 7)存储性 8)传递性 9)共享性 10)时效性
第一篇 信息检索概述
四、信息的类型 信息按照其外在的表现形式和内涵等,有许多不
同的分类法。了解信息的类型,对获取信息、分析 信息、表达信息都很有必要。
几种主要的信息类型 1、按载体形式 2、按出版类型 3、按使用级别 4、网络信息资源
创造或一些新见解的文献。
二次信息
书目文献:是对一定范围、时间或类型的大量
一次性文献按其特征收集整理、压缩、加工,并 按一定顺序组织编排、用于检索查找利用这些文 献而编制的文献。
三次信息
高级信息产物:在充分利用二次文献的基础上
对一次文献做出的系统整理和概括的论述,并加 以分析综合编写而成的概括性文献。
•
查全率R=
查出的有关文献量 存储的某一课题的文总献量
×
100%
•
漏检率
O
=
未被查出的有关文献量
存储的某一课题的文献总量×
100%
第一篇 信息检索概述
• 查准率是指系统在进行某一检索时,检出 的相关文献量与检出文献总量的比率,它 反映每次从该系统文献库中实际检出的全 部文献中有多少是相关的。
•
查准率P
第一篇 信息检索概述
1、按载体类型
印刷型
纸张-图书、期刊、专利文献等
缩微型 视听型
感光材料-缩微胶片、平片、胶卷 磁带等-录音带、录像带、电影胶片
机读型
磁、光盘-电子期刊、图书、数据库
第一篇 信息检索概述
2、按出版类型
图书
内容比较成熟、系统、可靠的出 版物,是学习和参考的主要信息源
International Standard Book Number
第一篇 信息检索概述
(2)影响查准率的因素
索引词不能准确描述文献主题和检索要求; 组配规则不严密; 选词及词间关系不正确; 标引过于详尽; 组配错误; 检索时所用检索词(或检索式)专指度不够,
检索面宽于检索要求; 检索系统不具备逻辑“非”功能和反馈功能; 检索式中允许容纳的词数量有限; 截词部位不当,检索式中使用逻辑“或”不当
零次信息
指未正式发表或未进入社会交流的最原始的文献
第一篇 信息检索概述
第一篇 信息检索概述
4、网络信息资源 • “通过计算机网络可以利用的各种信息资源
的总和” • 网络中存在着大量的生物学和医药学信息资
源,它连接着世界上许多著名的医学研究机 构、医科大学和医院,成为一个集生物医学 信息资源为一体的数据资源网 • 在数量、结构、分布和传播的范围、载体形 态、内涵和传递手段等方面都显示出了新的 特点
第二章 信息与知识、情报、文献
二、信息与情报(Information)
1、情报的概念 情报是指用不同的方法和手段,在有效的时间内
所获得的有针对性和有价值的知识。 西方:情报和信息是同一个词 Information 我国:情报是一种信息,但信息不是情报。要将
信息变成情报一般要经过选择、统计分析和加工整 理的过程,情报的概念范围要比信息窄一些。 2、情报的特点
2.影响检索效果的因素
(1)影响查全率的因素
文献库收录文献不全;
索引词汇缺乏控制和专指性;
从文献 存储来 看,主 要有
词表结构不完整; 词间关系模糊或不正确; 标引不详或标引前后不一致;
标引人员遗漏了原文的重要概念或用词
不当等。
第一篇 信息检索概述
从情报 检索来 看,主 要有
检索策略过于简单; 选词和进行逻辑组配不当; 检索途径和方法太少; 检索人员业务不熟练和缺乏耐心; 检索系统不具备截词功能和反馈功 能,检索时不能全面地描述检索 要求等。
知识性、传递性、效用性。
第二章 信息与知识、情报、文献
有固定名称和连续卷号、期号的定
期刊
期出版物。所含信息量大、新颖,
是科研工作主要信息源(ISSN)
特种文献
其它文献资料出版物的总称,信息 全面、密度高,一般图书馆不做重 点收藏
第一篇 信息检索概述 文献出版类型
第一篇 信息检索概述
3、按使用级别
原始创作:是以作者本人的工作经验、观察
一次信息
或实际科研成果为依据而创作的具有一定发明
第一章 信息检索概述
二、信息素养
• 信息素养(Information literacy)指具有检 索、分析、评价和利用各种信息源以解决 信息需求及制定明智决策的能力,是对个 人信息行为能力、独立学习能力以及批判 性思维能力等概括性描述。
• 信息素养包括:信息意识、信息能力、信 息道德等方面。
第一篇 信息检索概述
第二章 信息与知识、情报、文献
一、信息与知识
1.信息 information 信息指物质存在或运动方式与状态的表现形式 或反映,是现实世界事物的反映,它提供了客观世 界事物的消息、知识,是事物的一种普遍属性。
2.知识 knowledge 是人们对自然界、人类社会中各种信息进行分 析、加工提炼,并且加以系统和深化而形成的信息 集合。 知识就是信息,是信息的高级形态。