信息检索)生物医学文献主题标引基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
某种实验研究的直接目的和结果;
临床疾病的预防、诊断、治疗等主要手段、 方法和创新; 一篇文献中占篇幅较多的内容等。
在MEDLARS-MEDLINE系统中,用加权符号 “*”表示
如: *Aspirin / therapeutic use
注:主要主题词对应主题检索中的加权概念
h
6
(4)组配(Cooperation) 按一定规则,用两个或两个以上的主题词 (或主题词与副主题词)构成逻辑关系组合 来表达一个专指概念的方法。 形式: (A)主题词+主题词 交叉组配
-------国家标准局GB3860-83《文献主题标引规则》
简言之,标引就是对文献主题分析的结果赋予检索标识的过程。而检索标
识,是一种代表文献主题的标记符号。如分类Βιβλιοθήκη Baidu、主题词、关键词等。
2. 文献检索标识:
外部特征:著者、文献号
内容特征:分类号标识
主题词标识:关键词(自然标识)
h
2
单元词、标题词及叙词(人为标识)
(3) 《中国图书馆分类法》
(4) 《杜威十进分类法》(DC)
(5) 《美国国会图书馆图书分类法》(LC)
(6) 《美国国立医学图书馆图书分类法》(NLMC)
h
10
二、主题标引(Subject Indexing)
1、中国生物医学文献标引系统
中国医学科学院、中国中医研究院联合设计
以 NLM MEDLARS及《汉语主题词表》为依托
标引依据:《MeSH》、《中医药学主题词表》
2、医学主题词表(Medical subject Headings, MeSH)
NLM编制,21,000个主题词,83个副主题词(Subheadings) 严 规范化
字顺表,树状结构表(辅表)
用途:标引和检索(确保主题标引者和主题检索者在用语上的一致)
MeSH对文献作者、读者所使用的自然语言进行规范,主要体
Basic knowledge of biomedical literature subject indexing
生物医学文献 主题标引基础
余恩琳
汕大医学院医学文献检索教研室
elyu@stu.edu.cn
2013.9
h
1
一、基本知识
1. 标引(Indexing)的概念:
是对文献进行主题分析,从自然语言转换成规范化的检索语言 的过程。对文献给予分类号标识的过程,称为分类标引 (Classification indexing);给予主题词标识的过程,称为主 题标引(Subject Indexing)。
病毒性心脏病+心肌炎 病毒性心肌炎
(B)主题词/副主题词 限定组配
锰/中毒 锌/缺乏
h
7
4、标引与检索的关系
主题分析
文献
主题概念
转换
规范语
标引过程 检索过程
词表
检索 系统
课题
主题概念
主题分析
转换
检索提 问式
标引和检索关系图,即检索原理图
h
检索 结果
标引是手段 检索是目的 标引为检索服务8
5、学习文献标引的意义:
3. 主题标引的几个基本概念 (1)主题词(Subject Headings):
也称叙词(Descriptors),是一些以概念为基础的,经 过规范化和优选处理的,具有组配功能,并能显示 词间语义关系和动态性的词和词组。是用来揭示文 献主题内容,标引和检索文献的一种信息检索语言 词汇。
主题词主要特点:
(1)方便检索,提高检索效率,使查准率与 查全率保持合理的水平;
(2)了解标引知识,便于专业研究
如发表文章
标识“中图类号”
标识关键词(尽量使用规范化的主题词,
提高文章被检索出来的概率,从而提高被引
用率)
h
9
6.目前常用的几种文献分类法
(1) 《中国人民大学图书馆图书分类法》
(2) 《中国科学院图书馆图书分类法》
现单一性、动态性两个特点h
11
单一性:
(1)规定概念与主题词的单一对应,即一个主题词 只能表达一个概念,决不允许一词多义或一义多词;
(2)目的是使讨论同一概念的文献不至于分散,保 证检索方便、准确和全面。
如:乙酰水杨酸 见 阿司匹林;
Kidney Cancer / Kidney Tumor / Kidney Carcinomor / Neoplasms, Kidney
叙词法的基本特征:
① 按文献所论述的事物(即主题)集中文献;
② 用人们日常使用的名词术语经过规范化后直接表 达文献所论述的事物;
③ 用参照系统等间接显示事物概念之间(即主题之 间)的关系;
④ 用字顺序列直接提供按事物名称检索文献的途径 (即主题检索途径)。
h
5
(3)主要主题词(Major MeSH Headings, Mjme) 对文献核心主题概念的标识。
see Kidney Neoplasms 动态性:
指词表的每年增删修订。主题词及副主题词随学科研 究的不断深化加以补充和新旧更替
h
12
3、主题词的基本形式:
(1)单个词:Brain、Electrocardiography
(2)词组:
直接形式:Blood Chemical Analysis, Lung Neoplasms
④组配(Cooperation)
⑤语义关系(semantic relation):指主题词之间的内在联系。 主要包括等同关系、等级关系和相关关系
⑥动态性(Dynamic):指主h题词表中的词的更新变化4。
(2)主题词法(叙词法)
是直接以代表事物名称或概念的规范化的名词术语,
作为表达文献主题内容的标识符号,并依据这些标 识符号的语义和字顺,编排和组织文献检索工具的 一种方法。简言之就是利用主题词的原理建立检索 系统的一种方法。
倒置形式:
Kidney Failure
(字顺表)
Kidney Failure, Acute
Kidney Failure, Chronic
Cardiovascular Diseases (树状结构表)
Vascular Diseases
①概念性(concept):
事物
文献信息内容
概念
自然语言
概念
h
注:主题词为实词,指事物的具体层面
信息检索语言
3
②规范化(Normalize):指对自然语言的词形和词义进 行限制,使一个词只能表达一个概念,或一个概念只 能用一个词来表达,即词和概念是一一对应的关系。 通过词表来控制。
③优选处理(Priority):词表收词有限,不是所有的自然 语言词汇都可以作用主题词。通过词频统计确定。
临床疾病的预防、诊断、治疗等主要手段、 方法和创新; 一篇文献中占篇幅较多的内容等。
在MEDLARS-MEDLINE系统中,用加权符号 “*”表示
如: *Aspirin / therapeutic use
注:主要主题词对应主题检索中的加权概念
h
6
(4)组配(Cooperation) 按一定规则,用两个或两个以上的主题词 (或主题词与副主题词)构成逻辑关系组合 来表达一个专指概念的方法。 形式: (A)主题词+主题词 交叉组配
-------国家标准局GB3860-83《文献主题标引规则》
简言之,标引就是对文献主题分析的结果赋予检索标识的过程。而检索标
识,是一种代表文献主题的标记符号。如分类Βιβλιοθήκη Baidu、主题词、关键词等。
2. 文献检索标识:
外部特征:著者、文献号
内容特征:分类号标识
主题词标识:关键词(自然标识)
h
2
单元词、标题词及叙词(人为标识)
(3) 《中国图书馆分类法》
(4) 《杜威十进分类法》(DC)
(5) 《美国国会图书馆图书分类法》(LC)
(6) 《美国国立医学图书馆图书分类法》(NLMC)
h
10
二、主题标引(Subject Indexing)
1、中国生物医学文献标引系统
中国医学科学院、中国中医研究院联合设计
以 NLM MEDLARS及《汉语主题词表》为依托
标引依据:《MeSH》、《中医药学主题词表》
2、医学主题词表(Medical subject Headings, MeSH)
NLM编制,21,000个主题词,83个副主题词(Subheadings) 严 规范化
字顺表,树状结构表(辅表)
用途:标引和检索(确保主题标引者和主题检索者在用语上的一致)
MeSH对文献作者、读者所使用的自然语言进行规范,主要体
Basic knowledge of biomedical literature subject indexing
生物医学文献 主题标引基础
余恩琳
汕大医学院医学文献检索教研室
elyu@stu.edu.cn
2013.9
h
1
一、基本知识
1. 标引(Indexing)的概念:
是对文献进行主题分析,从自然语言转换成规范化的检索语言 的过程。对文献给予分类号标识的过程,称为分类标引 (Classification indexing);给予主题词标识的过程,称为主 题标引(Subject Indexing)。
病毒性心脏病+心肌炎 病毒性心肌炎
(B)主题词/副主题词 限定组配
锰/中毒 锌/缺乏
h
7
4、标引与检索的关系
主题分析
文献
主题概念
转换
规范语
标引过程 检索过程
词表
检索 系统
课题
主题概念
主题分析
转换
检索提 问式
标引和检索关系图,即检索原理图
h
检索 结果
标引是手段 检索是目的 标引为检索服务8
5、学习文献标引的意义:
3. 主题标引的几个基本概念 (1)主题词(Subject Headings):
也称叙词(Descriptors),是一些以概念为基础的,经 过规范化和优选处理的,具有组配功能,并能显示 词间语义关系和动态性的词和词组。是用来揭示文 献主题内容,标引和检索文献的一种信息检索语言 词汇。
主题词主要特点:
(1)方便检索,提高检索效率,使查准率与 查全率保持合理的水平;
(2)了解标引知识,便于专业研究
如发表文章
标识“中图类号”
标识关键词(尽量使用规范化的主题词,
提高文章被检索出来的概率,从而提高被引
用率)
h
9
6.目前常用的几种文献分类法
(1) 《中国人民大学图书馆图书分类法》
(2) 《中国科学院图书馆图书分类法》
现单一性、动态性两个特点h
11
单一性:
(1)规定概念与主题词的单一对应,即一个主题词 只能表达一个概念,决不允许一词多义或一义多词;
(2)目的是使讨论同一概念的文献不至于分散,保 证检索方便、准确和全面。
如:乙酰水杨酸 见 阿司匹林;
Kidney Cancer / Kidney Tumor / Kidney Carcinomor / Neoplasms, Kidney
叙词法的基本特征:
① 按文献所论述的事物(即主题)集中文献;
② 用人们日常使用的名词术语经过规范化后直接表 达文献所论述的事物;
③ 用参照系统等间接显示事物概念之间(即主题之 间)的关系;
④ 用字顺序列直接提供按事物名称检索文献的途径 (即主题检索途径)。
h
5
(3)主要主题词(Major MeSH Headings, Mjme) 对文献核心主题概念的标识。
see Kidney Neoplasms 动态性:
指词表的每年增删修订。主题词及副主题词随学科研 究的不断深化加以补充和新旧更替
h
12
3、主题词的基本形式:
(1)单个词:Brain、Electrocardiography
(2)词组:
直接形式:Blood Chemical Analysis, Lung Neoplasms
④组配(Cooperation)
⑤语义关系(semantic relation):指主题词之间的内在联系。 主要包括等同关系、等级关系和相关关系
⑥动态性(Dynamic):指主h题词表中的词的更新变化4。
(2)主题词法(叙词法)
是直接以代表事物名称或概念的规范化的名词术语,
作为表达文献主题内容的标识符号,并依据这些标 识符号的语义和字顺,编排和组织文献检索工具的 一种方法。简言之就是利用主题词的原理建立检索 系统的一种方法。
倒置形式:
Kidney Failure
(字顺表)
Kidney Failure, Acute
Kidney Failure, Chronic
Cardiovascular Diseases (树状结构表)
Vascular Diseases
①概念性(concept):
事物
文献信息内容
概念
自然语言
概念
h
注:主题词为实词,指事物的具体层面
信息检索语言
3
②规范化(Normalize):指对自然语言的词形和词义进 行限制,使一个词只能表达一个概念,或一个概念只 能用一个词来表达,即词和概念是一一对应的关系。 通过词表来控制。
③优选处理(Priority):词表收词有限,不是所有的自然 语言词汇都可以作用主题词。通过词频统计确定。