文献信息检索语言
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SNOMED CT可应用于电子病历、ICU 监测、临床决策支持、医疗研究、临床实验、 用计算机处理的医嘱、疾病监测、图像指数、 药物管理和公众健康信息服务等以提高处理 各项临床医学事务的能力。
(二)概念体系
2008年版SNOMED CT包括311000余个概念, 这些概念按照从一般到具体的等级结构组织起来。
(一)文献信息检索语言的含义 文献信息检索语言简称检索语言(retrieval
language),是用于描述信息系统中文献信息的内容特 征或外部特征及表达用户信息检索提问的一种专用语言。 分为规范化语言和非规范化语言。规范化语言是对文献检 索用语的概念加以人工控制和规范,对同义词、多义词、 近义词等进行规范化处理用同一个词来表达一个概念。非 规范化语言也叫自然语言,如关键词、自由词等。
B.一体化医学语言系统的主要组成部分 1.超级叙词表 2.语义网络 (1)语义类型 (2)语义关系 (3)语义网络 3.专家词典
(四)一体化医学语言系统(Unified Medical Language System,UMLS) A.创建一体化医学语言系统的意义
一体化医学语言系统是自1986年至今由美国国立医 学图书馆主持的一项长期研究和开发计划,该研究旨在建 立一个计算机化的可持续发展的生物医学检索语言集成系 统和机读情报资源指南系统,其目标是提高计算机程序 “理解”生物医学词汇涵义的能力,并运用这种理解帮助 用户通过多种交互检索程序,克服由于不同系统检索语言 差异性和不同数据库相关信息的分散性所造成的诸多信息 检索问题。
MeSH词表由字顺表(Alphabetic List)和树 状结构表(Tree Structures)两部分组成。
1.字顺表(Alphabetic List) 将主题词、款 目词、类目词按英文字母顺序排列,并通过词下 的树状结构号、注释及参照系统揭示词语间复杂 的语义关系,帮助读者在检索时选规范化的主题 词。
还设了83个副主题词,副主题词是一种对主题词 加以修饰和限定的词。用于和主题词进行组配标 引和检索文献,以提高主题概念的专指性。
副主题词使用范围及注释表 如: Blood 血液(B2,C,D1-24,D27,F3) 用于血液中各种物质的存在或分析,也用于疾病状态下 血液的检查或变化。但不包括血清诊断和血清学。血清诊 断用“诊断(Diagnosis)”,血清学则用“免疫学 (Immunology)”。 Complication 并发症(C,F3) 用于同时或随后发生的疾病,即同时存在的疾病、并发 症或后遗症。 Drug Therapy 药物疗法(C,F3) 用于疾病主题词,通过投给药物、化学制剂和抗生素来 治疗疾病,不包括饮食疗法和放射疗法,后者要用特定的 副主题词,免疫疗法和生物制品治疗用“治疗 (Therapy)”副主题词。
(二)国内主要文献分类法
《中国图书馆分类法》简称《中图法》,是目前我国使 用最广泛的一种等级体系分类法。它不仅应用于各类型图书 馆的藏书排架和组织目录体系,绝大多数的文献检索工具也 是按《中图法》的分类体系编制和提供服务的。该分类法是 由北京图书馆、中国科学技术情报所等单位共同编制的,与 1974年出版,并经过多次修订与再版,目前最新的已修订第 四版。
(二)《医学主题词表》(Medical Subject Headings)简称(MeSH)
该表是美国国立医学图书馆(NLM)编制用于 对生物医学文献进行标引和检索的权威性术语控 制工具。收集约2.5万个经过规范化的医学主题词, 副主题词83个。是Medline、PubMed、 CBMdisc等数据库系统的主题词检索指南,也是 确保主题标引者与检索者在标引文献与检索文献 时用词上的标准一致。
SNOMED CT自身开放性的构架形式可以使新生 的医学概念、医疗信息术语均可以通过SNOMED 分类方法迅速添加到术语集中,并按照SNOMED 编码原则实现数字化来满足医学信息学高速发展的 需要。
五、医学主题词表
(一)自然语言和词汇控制 1.自然语言 用于进行书面和口头交流的语词,其语义、 情感都比较丰富。但自然语言用于情报检索存在不足之处。 2.词汇控制 (1)对自然语言的语词进行压缩、优选和规范化处理。 (2)对自然语言进行语义处理,并建立一个与概念体系 相对应的具有层次结构的术语体系(即词汇体系)。
(二)国际疾病分类法的意义
成为世界性的疾病、损伤和死亡原因分类的统一标准化 工具。它对促进世界卫生保健事业,掌握医疗卫生工作动 态以及卫生情报的国际交流,起着极其重要的作用。
(三)ICD的主体结构
第一卷是ICD编码的主要内容类目表; 第二卷是使用指导手册; 第三卷是分类的字顺索引。
四、国际系统医学术语集
2.树状结构表(Tree Structure) (1)树状结构表的结构
A.类目表 B.等级表 (2)树状结构表的功能 A.检索者可按学科体系进行选主题词。 B.可帮助检索者扩大检索范围,提高查全率,以及缩小 检索范围,提高查准率。 C.通过树状结构号确定所选词的学科范围。 (3)树状结构表的应用
3. 副主题词表(subheadings) 为使主题词标引专指性更强,《MeSH》表里
SNOMED CT收录的海量词汇,通过对概念合 理的划分,形成具有l8个顶级概念的体系 。如下:
(1) 临床所见/紊乱(Clinical finding/disorder ) (2)操作(procedure) (3)观察对象(observable entity (4)身体结构(body structure) (5)有机体(organism) (6)物质(sub百度文库tance) (7)药物/生物产品(pharmaceutical/biologic
2.美国国家医学图书馆分类法(简称NLMC)
该分类法是专门用于健康科学而设的,1951年出版第 一版,经多次修订,2000年为第五次修订版,2002年出 版电子版,其分类法提供索引中的类号与总表类号的超链 接,并且索引用语直接至MeSH Browser的标题。自 2002年起,NLMC每年仅以电子版的形式发行。
2003年9月OCLC正式出版了DDC第22版的印刷版,其 电子版于2003年6月推出。
DDC用传统的学科来分类,共分10个主要学科来涵盖所 有的知识体系,每个大类下细分10类,每个类下又再分10 小类,每个学科用特定范围的数字来表示。
DDC十个大类分别是: 000 计算机学科、知识与系统 100 哲学 200 宗教 300 社会科学、社会学与人类学 400 语言 500 自然科学和数学 600 技术(应用科学) (包括医学类) 700 艺术、美术和装饰艺术 800 文学 、修饰学与评论 900 历史
(一)发展沿革及应用
(二)概念体系
(一)发展沿革及应用 国际系统医学术语集 (Systematized
Nomenclature of Medicine-Clinical Terms, 简称SNOMED CT, http://www.ihtsdo.org/snomed-ct/) 是一个能 提供医学信息存储、提取与交换的医学标准术语系 统。1965年首版推出。
(三)检索语言的作用 信息检索系统存储与检索共同遵循的一种专用语言,它
既是汇集、组织、存储文献的标准,也是检索提问时所利 用的手段及工具。
检索语言是信息标引人员与检索人员进行思想交流的媒 介,也是人与检索系统之间交流的桥梁,在信息检索过程 中起着语言保障的作用。
(四)检索语言的种类 1.按照检索标识的组合方法划分 :先组式语言和后组式语
《中图法》有五大部类、22个大类、6个复分表、30多个 专类复分表、55811条类目组成了一个比较完整的分类体系。
《中图法》的22个基本大类 A 马克思主义、列宁主义、毛泽东思想、邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
(二)检索语言的构成
检索词典(retrieval thesaurus):是文献标引用语和 检索用语的语源和依据性文本。它是对各学科的名词术语、 概念、代码、分类号等进行规范化处理的结果,起着规范 控制自然语言的作用。常见的检索词典有各种分类表和主 题词表。
构成检索语言的基本三要素有:专用字符、基本词汇 和语法规则。
NLMC采用字母数字混合码标记类目。
三、国际疾病分类法
(一)国际疾病分类法概述 (二)国际疾病分类法的意义 (三)ICD的主体结构
(一)国际疾病分类法概述
国际疾病分类法 International Classification of Diseases,简称ICD,是按照既定疾病分类标准,将各种 疾病名称归入相应类目的一种系统。
( 三) 医学主题词浏览器(MeSH Browser) MeSH Browser(医学主题词浏览器,
http://www.nlm.nih.gov/mesh/mbrowser.h tml)是MeSH表的网络版,旨在帮助用户迅速查 询相关主题词并显示主题词的等级结构体系。
MeSH Browser提供了两种查询方式: 1.树形结构导航查询(Navigate from tree top)
product) (8)标本(specimen) (9)物理性物体(physical object)
(10) 物理力(physical force) (11)事件(event) (12)环境和地理位置(environments and geographic
locations) (13)社会环境(social context) (14)分期与分度(staging and scales) (15)连接概念(linkage concept) (16)限定值(qualifier value ) (17)特殊概念(special concept) (18)记录人工制品(record Artifact)
言。 2.按照检索语词规范化程度划分: 规范语言和非规范语言。 3.按照所描述的文献信息特征划分 :文献外部特征语言和
文献内部特征语言。
二、文献分类法
(一)文献分类法概述 (二)国内主要文献分类法
(三)国外著名文献分类法
(一)文献分类法概述 根据文献知识内容所属的学科性质,分门别类地、系
统地揭示和组织文献的一种方法。它是由许多类目根据一 定原则组织起来,通过标记符号来代表各级类目和固定其 先后次序的分类体系。 分类法的内容结构:有编制说明、类目表、索引 、附录这 几个部分构成。
N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书
(三)国外著名文献分类法 1.《杜威十进制分类法》简称DDC,是由美国图书馆学
家麦威尔 杜威(Melvil Dewey)于1873年创建的,第一 次出版是在1876年。该分类法是目前全世界使用最广泛、 影响最大的图书资料分类法。
文献信息检索语言
王惠英 福建医科大学图书馆 医学文献检索教研室
2012.9
一、文献信息检索语言概述 二、文献分类法 三、国际疾病分类法 四、国际系统医学术语集 五、医学主题词表 六、文献主题分析与标引
一、文献信息检索语言概述
(一)文献信息检索语言的含义 (二)检索语言的构成 (三)检索语言的作用 (四)检索语言的种类
从树状结构入手查询主题词的相关信息。 2.输词查询(Enter term or the beginning of any
root fragments) 直接在输入框输词查询主题词,还可限定在《化学主题
词表》某一特定字段化学物质登记号或酶编码中进行查询。
NLM提供4种方式联机免费获取其电子版及相关信息: 1.MeSH Browser; 2.UMLS Metathesaurus(超级叙词表); 3.MeSH网站 (http://www.nlm.nih.gov/mesh); 4.MeSH databases