南方医-医学信息获取与管理PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主要通过“和(and,*)”、“或(or,+)”、“非 (not,-)”等将检索词联结起来。 • 如:信息检索 AND 计算机
(信息检索 OR 文献检索) AND 计算机 文献检索 NOT 文献检索课
布尔逻辑运算符
AND
OR
Hale Waihona Puke Baidu
NOT
influenza AND vaccination
vaccination OR vaccine
医学信息获取与管理
什么是信息(Information)?
• 是生物体通过感觉同外界交换内容的总称, 是物质的一种基本属性,是物质存在方式 及其运动规律特点的外在表现。
– 信息有多种类型:自然信息、生物信息、社 会信息等。
春天来了?
什么是知识(knowledge)?
• 是人们通过信息对自然界,人类社会以及思 维活动规律的认识与掌握,是人脑通过思维 重新组合的系统化信息的集合。
• ?——有限截断,可代替词中的1个字符。
– 例:白介素?2,可以查出白介素-2的文献;环孢?素可以查 出含有环孢霉素、环孢菌素的文献;Leukemi?可以查 出含有Leukemia、Leukemic、Leukemid的文献
检索技术及其实现——检域限制
• 检域限制也称字段限制,包括前缀限制符和后缀限制符。 如对DIALOG系统而言,前缀限制符有:
• 运用加权检索可以命中核心概念文献,因此它是一种缩小 检索范围提高检准率的有效方法。但并不是所有系统都能 提供加权检索这种检索技术,而能提供加权检索的系统, 对权的定义、加权方式、权值计算和检索结果的判定等方 面,又有不同的技术规范。
主要文献类型的著录格式
• 专著: 作者. 书名. 出版地:出版者,出版年 如: Borko H, Bernier C L. Indexing concepts and methods. New
• 学位论文:作者.题名[学位论文]. 保存地点:保存单 位,年份
如:Cairns R B. Infrared spectroscopic studies on solid oxygen
• Know-what Know-why • Know-how Know-who
什么是情报(Information)?
• 是解决特定问题所需要的知识 (知识性、传递性、效益性)
• 情报(信息)意识:即“意识情报的能 力”,是人们对大量客观存在的情报的 自觉反应。情报意识也指人们获取情报 的积极性和主动性。
例:stomach near4 ache
截词
• 包括后截(最常用)、中截、前截等。 • 不同检索系统截词符各有规定,常用有:?、*、!、$
• *——无限截断,可代替词尾的0-n个字母,
– 如: vaccin*,可以查出所有含有vaccin词根的文献,如: vaccina ; vaccine; vaccines; vaccination; Vaccinium ; vaccinated ; post-vaccinal ; Post-vaccination; vaccine-naive
• 狭义概念——仅指上述过程的后半部分,即从信息 集合中找出所需要的信息的过程,相当于人们通常 所说的信息查寻(Information Search)。
计算机检索的基本原理
• 检索技术及其实现。 • 检索技术包括基本布尔逻辑组配、截词、词位
限制、检域限制等。 • 布尔逻辑组配是现行计算机检索的基本技术,
–
AU= 限查特定作者
–
JN= 限查特定刊名
–
LA= 限查特定语种
–
PN= 限查特定专利号
–
PY= 限查特定年代
• 后缀限制符例如:
–
/TI 限在题目中查
–
/AB 限在文摘中查
–
/DE 限在叙词标引中查
• 目前大多数检索系统提供菜单式检索,只需选择字段,不 需要记住及输入字段代码。
• 加权检索是某些检索系统中提供的一种定量检索技术。加 权检索同布尔检索、截词检索等一样,也是文献检索的一 个基本检索手段,但与它们不同的是,加权检索的侧重点 不在于判定检索词或字符串是不是在数据库中存在、与别 的检索词或字符串是什么关系,而是在于判定检索词或字 符串在满足检索逻辑后对文献命中与否的影响程度。加权 检索的基本方法是:在每个提问词后面给定一个数值表示 其重要程度,这个数值称为权,在检索时,先查找这些检 索词在数据库记录中是否存在,然后计算存在的检索词的 权值总和。权值之和达到或超过预先给定的阈值,该记录 即为命中记录。
York:Academic Press,1978
• 期刊: 作者(多作者用逗号分开,超过3个者用et al). 文章题 目.刊物名称,年代,卷数(期数):页数
如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
• 是知识的外在表现形式。
信息与知识、情报、文献的相互关系
•
信息←→知识→情报
文献
文献
情报 知识 信息
信息检索(Information Retrieval)
• 广义概念——是指将信息按一定的方式组织和存贮 起来,并根据信息用户的需要找出有关的信息过程, 故全称:“信息的存贮与检索(Information Storage and Retrieval ) 。
情报的属性
• 知识性:经过加工并为用户所需要的特 定知识或信息。
• 传递性:动态接受与利用。 • 效用性:启迪思维、增进见识、改变知
识结构、提高认识能力,发挥实用的、 社会的、经济的价值。
什么是文献(Literature, Document)?
• 用一定的方式(文字、图象、声音)记 录在一定的载体(纸张、磁盘、光盘) 上的知识都成为文献。
influenza NOT vaccination
位置检索
“with” 表示“同字段与”
检索式A with B,表示限定检索词A和B 在同一字段范围内出现的文献为命中文
献。例:stomach with ache
位置检索
“near(n)” 表示“同句与”
检索式A near B,限定检索词在同一自 然句中,即在同一句话中包含检索词A 和B的文献为命中文献。N为一个数字, 表示检索词之间间隔的词数。
(信息检索 OR 文献检索) AND 计算机 文献检索 NOT 文献检索课
布尔逻辑运算符
AND
OR
Hale Waihona Puke Baidu
NOT
influenza AND vaccination
vaccination OR vaccine
医学信息获取与管理
什么是信息(Information)?
• 是生物体通过感觉同外界交换内容的总称, 是物质的一种基本属性,是物质存在方式 及其运动规律特点的外在表现。
– 信息有多种类型:自然信息、生物信息、社 会信息等。
春天来了?
什么是知识(knowledge)?
• 是人们通过信息对自然界,人类社会以及思 维活动规律的认识与掌握,是人脑通过思维 重新组合的系统化信息的集合。
• ?——有限截断,可代替词中的1个字符。
– 例:白介素?2,可以查出白介素-2的文献;环孢?素可以查 出含有环孢霉素、环孢菌素的文献;Leukemi?可以查 出含有Leukemia、Leukemic、Leukemid的文献
检索技术及其实现——检域限制
• 检域限制也称字段限制,包括前缀限制符和后缀限制符。 如对DIALOG系统而言,前缀限制符有:
• 运用加权检索可以命中核心概念文献,因此它是一种缩小 检索范围提高检准率的有效方法。但并不是所有系统都能 提供加权检索这种检索技术,而能提供加权检索的系统, 对权的定义、加权方式、权值计算和检索结果的判定等方 面,又有不同的技术规范。
主要文献类型的著录格式
• 专著: 作者. 书名. 出版地:出版者,出版年 如: Borko H, Bernier C L. Indexing concepts and methods. New
• 学位论文:作者.题名[学位论文]. 保存地点:保存单 位,年份
如:Cairns R B. Infrared spectroscopic studies on solid oxygen
• Know-what Know-why • Know-how Know-who
什么是情报(Information)?
• 是解决特定问题所需要的知识 (知识性、传递性、效益性)
• 情报(信息)意识:即“意识情报的能 力”,是人们对大量客观存在的情报的 自觉反应。情报意识也指人们获取情报 的积极性和主动性。
例:stomach near4 ache
截词
• 包括后截(最常用)、中截、前截等。 • 不同检索系统截词符各有规定,常用有:?、*、!、$
• *——无限截断,可代替词尾的0-n个字母,
– 如: vaccin*,可以查出所有含有vaccin词根的文献,如: vaccina ; vaccine; vaccines; vaccination; Vaccinium ; vaccinated ; post-vaccinal ; Post-vaccination; vaccine-naive
• 狭义概念——仅指上述过程的后半部分,即从信息 集合中找出所需要的信息的过程,相当于人们通常 所说的信息查寻(Information Search)。
计算机检索的基本原理
• 检索技术及其实现。 • 检索技术包括基本布尔逻辑组配、截词、词位
限制、检域限制等。 • 布尔逻辑组配是现行计算机检索的基本技术,
–
AU= 限查特定作者
–
JN= 限查特定刊名
–
LA= 限查特定语种
–
PN= 限查特定专利号
–
PY= 限查特定年代
• 后缀限制符例如:
–
/TI 限在题目中查
–
/AB 限在文摘中查
–
/DE 限在叙词标引中查
• 目前大多数检索系统提供菜单式检索,只需选择字段,不 需要记住及输入字段代码。
• 加权检索是某些检索系统中提供的一种定量检索技术。加 权检索同布尔检索、截词检索等一样,也是文献检索的一 个基本检索手段,但与它们不同的是,加权检索的侧重点 不在于判定检索词或字符串是不是在数据库中存在、与别 的检索词或字符串是什么关系,而是在于判定检索词或字 符串在满足检索逻辑后对文献命中与否的影响程度。加权 检索的基本方法是:在每个提问词后面给定一个数值表示 其重要程度,这个数值称为权,在检索时,先查找这些检 索词在数据库记录中是否存在,然后计算存在的检索词的 权值总和。权值之和达到或超过预先给定的阈值,该记录 即为命中记录。
York:Academic Press,1978
• 期刊: 作者(多作者用逗号分开,超过3个者用et al). 文章题 目.刊物名称,年代,卷数(期数):页数
如: Porter MF, Zhang J. An algorithm for suffix stripping. Program, 1980, 14(3):130~137
• 是知识的外在表现形式。
信息与知识、情报、文献的相互关系
•
信息←→知识→情报
文献
文献
情报 知识 信息
信息检索(Information Retrieval)
• 广义概念——是指将信息按一定的方式组织和存贮 起来,并根据信息用户的需要找出有关的信息过程, 故全称:“信息的存贮与检索(Information Storage and Retrieval ) 。
情报的属性
• 知识性:经过加工并为用户所需要的特 定知识或信息。
• 传递性:动态接受与利用。 • 效用性:启迪思维、增进见识、改变知
识结构、提高认识能力,发挥实用的、 社会的、经济的价值。
什么是文献(Literature, Document)?
• 用一定的方式(文字、图象、声音)记 录在一定的载体(纸张、磁盘、光盘) 上的知识都成为文献。
influenza NOT vaccination
位置检索
“with” 表示“同字段与”
检索式A with B,表示限定检索词A和B 在同一字段范围内出现的文献为命中文
献。例:stomach with ache
位置检索
“near(n)” 表示“同句与”
检索式A near B,限定检索词在同一自 然句中,即在同一句话中包含检索词A 和B的文献为命中文献。N为一个数字, 表示检索词之间间隔的词数。