主题标引
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.标引概念:标引(Indexing)是对文献进行主题分析,从自然语言转换成规范化的检索语言的过程。
2.标引深度(Indexing depth):是指对一篇文献所赋予的全部检索标识的数量。
就主题标引而言,则指标引一篇文献平均所给予的主题词的数量。
标引深度是影响查全率和查准率的重要因素。
查全率和查准率是衡量检索系统效率的两项重要指标。
按标引深度划分:
深标引:对文献内容揭示较深的标引,它反映文献中的主要与次要概念,主要用于计算机检索系统。
主题词的数量较多,7-8个/篇。
浅标引:对文献内容揭示较浅的标引,只反映文献的主要概念,主要用于手工检索系统。
主题词的数量较少,4-5个/篇。
3. 标引等级的划分标准:
标引等级(Indexing degree):是指将文献中的概念根据主次按等级划分,分为三个等级。
即一级概念标引、二级概念标引和三级概念标引。
一级概念标引,也称主要标引(IM词)
它既用于手检系统标引,也用于机检系统标引。
1)反映文献主要论点或作者研究目的的内容,讨论篇幅≥2/3的内容;2)有创新的实验研究或诊疗方法手段。
3)重点讨论的专指性概念
二级概念标引,也称次要标引(NIM词)
只用于机检系统标引。
具体包括:
1)文献论述的次要重点,占篇幅<1/3;
2)被讨论的实验方法或诊疗技术;
3)主要标引词的限定词;
4)特征词,如动物、年龄组等。
三级概念标引,也称不要标引
具体包括:
1)文中提到的常规技术,又未加讨论。
2)为实验方法提供的条件。
3)多项同类概念。
4.标引原则及含义:真实性,客观性,专指性,一致性,全面性
5.主题分析(Subject analysis)的概念:根据文献存贮与检索的要求,对文献内容进行分析,从中提炼主题概念,确立主题类型、剖析主题结构和确定概念间关系的过程。
6.我国国家标准《文献叙词标引规则》中规定的主题分面模式,将文献主题分为四个面:
主题面、通用面、特征面、位置面。
常见的概念间的关系有:并列关系,交叉关系,限定关系,因果关系影响关系,应用关系,相关关系
7.主题词表的概念、作用和种类
1.主题词表:也称叙词表。
它是将文献标引人员或用户的自然语言转换成规范化名词术语的
一种术语控制工具;是概括各门或某一门学科领域,并由语义相关、族性相关的术语组成的规范化的动态词典。
医学主题词表的作用:
a) 保证主题词的规范化;
b) 保证文献作者、标引者和检索者之间用词一致;
c) 为检索工具提供主题途径
医学主题词表的种类:
医学主题词表有三种类型:
(1)医学主题词注释字顺表
(2)轮排表(机读版)
(3)树状结构表(分类表)
(二)收词原则
1.选词范围:具有一定使用频率,反映生物医学基本概念和表达特定事物的专有概念、具有独立检索意义的词或词组。
按照族性类别分为15大类,可概括为10各方面。
2.选定原则:
(1)能表达特定事物的专有名词,如机构名、药品名等。
(2)能汇集一定的文献量。
(3)选定的主题词,应概念明确、通用易懂,具有单一性。
(4)必须由专家推荐和审定。
(5)复合主题词。
树状结构表的作用:
(1)用树状结构号确定主题词在族系中的位置,是字顺表和树状结构表的联系号。
是标引人员选用副主题词组配范围的依据。
(2)是标引人员和检索人员选择专指性主题词的依据:
(3)是选择专指词或上位词的依据
(4)可以满足族性检索的要求,实现扩展检索。
(5)通过分类号可以了解某主题词的学科属性及该词与其他词的属分关系,加深对医学知识的了解。
(6)提高联机检索效率
(7)可满足生物医学科学未来进展的长远需要
树状结构编码(tree structure numbers) 也称树状结构号或分类号。
MEDLARS将所收录的主题词分为15个大类,
每类都有一个树状结构号,可以确定其主题词在分类表中的位置。
类号后有+号表示该词还有下位类。
副主题词也称限定词:是指明主题词所论述的重点课题的自然范畴或通常发生的某一方面,对主题概念起限定作用的一类词汇。
副主题词对主题词的限定组配以概念间的逻辑关系为基础,以表达专指概念为目的
副主题词的意义:
减少词表量,缩小体积,提高揭示文献的专指性;
限定主题概念、缩小检索范围,提高查准率;
揭示主题词之间的逻辑关系,避免词与词之间的虚假组配和语法歧义。
副主题词的基本特征:泛指性,动态性,等级性,规范性。