检索语言
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
类目按概念之间的逻辑隶属关系,再往下 逐级展开,划分出更专指、更具体的类目。
如“R521.2支气管淋巴结核”
R R5 R52 R521 R521.1 R521.2 医药、卫生 内科学 结核病 肺结核 原发综合征 支气管淋巴结核
《中图法》的分类号采用拉丁字母和阿拉 伯数字相结合的混合号码。当一个类号的数 字超过三位时,为了醒目而加上圆点‚.”, 并无其他意义。
由简单至复杂进行层层划分,逐级展开,形成
一个严格有序的直线性知识门类等级体系。
《中国图书馆分类法》(CLC) 主 要 类 型 《中国图书资料分类法》
《中国科学院图书馆图书分类法》
《美国国会图书馆图书分类法》 《杜威十进分类法》
中国图书馆分类法
简称《中图法》,为国内94%的信息机 构所使用。 1975年首次出版,1999年出版第四版, 并随后推出电子版。2010年9月已出版 第五版。
I25 中国小说 R521.2 支气管淋巴结核
类名或类目
分类号
资料法中的类号
注释
体系分类法的作用
强调知识的系统化组织 符合人们认识事物的习惯 便于检全某一学科、专业的文献 因课题可随时扩大或缩小检索范围
主题语言 以反映文献内容的主题词或关键词作
为文献存储和检索的标识,并按一定的顺
序排列而成ห้องสมุดไป่ตู้一种检索语言。 优点:直接性、专指性强,比较适合专 深课题的检索。 主题词、关键词
例如肺发育不全,输入主题词‚肺‛后,在副 主题词菜单中选择‚畸形‛表示发育不全;又如双子 宫,用子宫/畸形组配检索。
副主题词表 (Subheading)
abnormalities 畸形 (A1-10,A13-14, B2) administration& dosage (D) 投药与剂量 blood 血液 (B2, C, D1-24, F3) complications 并发症 (C, F) diagnosis 诊断 (C, F3) etiology 病因学 (C, F3) epidemiology 流行病学 (C, F3,Z) metabolism 代谢 (A2-16,B,C,D,F3) virology 病毒学 (A,B1-3,B5-7……)
词后,系统会自动显示该主题词所能组配
的副主题词。《MeSh》有一个副主题词表,
1989-1990年IM使用的副主题词是77个,
1991-1994年是80个,每年略有变化。目 前使用的副主题词是92个。
副主题词
副主题词(Subheadings) ,与主题词进行组 配,对某一主题词的概念进行限定或复分,使主题词 具有更高的专指性。如诊断(Diagnosis,DI)、药 物治疗(Drug Theray,DT)、血液供给(Blood Supply,BS)等。正确选择副主题词也很关键。
对一词多义、多词一义的词语,检索不便
控制语言
又称规范语言、人工语言,采用经过人工控 制的规范性的词语或符号作为检索标目,来专
指或网罗相应的概念,这些规范化的标目能较
好地对同义词、近义词、相关词、多义词及缩
略词等概念进行规范。
例如:‚肿瘤‛
同义词 tumor 肿 tumour cancer
人为规定的词
分为五大部类22个基本大类
《中图法》将学科分为5个部类22 个大类
R 医药卫生
分类号 类目 分类号 类目 R1 预防医学、卫生学 R74 神经病学与精神病学 R2 R3 R4 R5 R6 R71 R72 R73 中国医学 基础医学 临床医学 内科学 外科学 妇产科学 儿科学 肿瘤学 R75 R76 R77 R78 R79 R8 R9 皮肤病学与性病学 耳鼻咽喉科学 眼科学 口腔科学 外国民族医学 特种医学 药学
主题词可以集中语言表达不同但是概念相
同的文献,故能提高文献检索的查全率和查准
率。
关键词 未经过严格规范化处理的检索词或词 组(自然语言)。通常从文献的题目、摘 要、正文中选取出来。标引出的关键词在 文献中起关键作用,通常是由名词、形容 词等实质性词构成。
关键词的特点
优点: 可不用《医学主题词表》,自由选词,
款目词
相关参照
提示主题词含义相近,指引查找相关主题词
主题词 例: Contraception see related 参见 Family planning
相关主题词
Family Planning 主题词 see related 相关主题词 Contraception
副主题词 在进行检索时,用户输入一个主题
neoplasm
瘤
neoplasm carcinoma
使用规范化的词能相对提高检索效率,但对检索 者和情报存储人员选词上要求比较严格。
按描述的内容划分
题名、刊名 文献外表特征 责任者姓名 专利号、档案号等
检 索 语 言
文献内容特征
分类语言 主题语言
分类号
叙词
关键词
分类语言
是使用分类方法将文献主题概念区分、 归纳形成类目体系,然后以号码为基本字符 ,用分类号表达类目体系中每个主题概念的 检索语言。 体系分类法、分面组配式分类法、 半分面分类法
(C, F3)
表明诊断的各个方面,包括检查、鉴别诊断及预后, 但不包括普查、放射照相诊断等,对后几种分别用“预防 和控制”、“放射照相术”等。
Nursing 护理
(C,E1-4,F3)
表明对疾病的护理和护理技术,包括诊断、治疗 和预防操作中的护理作用。
副主题词使用举例
例1:查“心脏疾病的治疗”方面的文
标引语言、索引语言。
控制语言、非控制语言 表达文献外部特征、表达文献内容特征
按规范化程度划分
题名、刊名
非控制语言
责任者姓名
检 索 语 言
专利号、档案号等
关键词
控制语言
分类语言 主题语言
分类号 叙词
非控制语言
又称非规范语言、自然语言,采用未
经人工控制的词语或符号来作为检索标目,
通常所说的自由词、关键词就属此类。
主题语言
字顺表的参照系统
“见‛、‚代‛参照(款目 词) “属‛、‚分‛参照 (91年取 消) 相关参照
“见”、“代”参照
用于规范同义词、近义词,反映词与 词之间的同义关系。
例1 例2 Cancer
款目词
see
见
Neoplasms
主题词
Tumor
see
Neoplasms
逆参照:
例3 Neoplasms 主题词 X(代) Cancer X Tumor
责任者名、题名、机构名、出版地、出版社、 ISBN、专利号、档案号等。
内容特征
文献所属的学科类别
或表达的主题内容。
文献检索流程图
检索语言
检索语言
文献存储
文献检索
是检索者、检索工具及情报存储人员之间的 沟通桥梁。
检索语言
是文献存储和检索所遵循的一种规范,用 于描述检索系统中文献的外表特征及内容特征 和表达用户检索提问的一种专门语言。亦称为
素/治疗应用;链球菌感染/药物疗法。
医学主题表(MeSH) 副主题词必须按照其后括号内限定的范围和说 明语中的规定与主题词进行组配,避免错误组配。 胃切除术后并发症 ①胃切除术(E4)/并发症(C,F3) ②胃切除术(E4)/副作用(D,E1-4…) 分析:副主题词‚/并发症‛的组配范围是C(疾 病类)、F3(精神障碍类),副主题词‚/副作用‛ 的组配范围包含E4(各科技术),主题词‚胃切除 术‛的树状结构号是E4,属‚/副作用‛的组配范 围。①显然是错误组配。
信息组织的内容
确定标识 优化选择 改编重组 对信息的外表或内容特征进行描述 对信息进行深层加工,加以适当改编和 按一定方法将信息记录组织排列成一个 根据用户需要,从信息流中把符合用户 需要的一部分信息挑选出来 有序整体 重新组合,形成各种优质信息产品,如 综述、汇编等。 组织排序
信息组织的依据
外部特征
主题词
已经过规范化处理的具有实质性意义的词 或词组,又称叙词。 ‚规范‛:是对一个概念的同义词、近义 词和拼法变异词适当归并,采用参照系统,并 有主题词的范畴表和树状结构,形成专门的主 题词表。
主题词的特点
规范错综复杂的名词概念,对同义词、近
义词、多义词进行规范和控制,使标引人员与
检索人员在检索时有共同语言。
《MeSh》汇集约20,000多个医学主题词。
Family Health
N1.400.300 91; was see under FAMILY 1979-90 Family Life Cycles see Family Family Planning 主题词
主题语言
N2.421.143.401+ 树状结构号 68; BIRTH CONTROL was see under CONTRACEPTION 1975, was see under FAMILY PLANNING 1968-74, 建词年份 was see heading 1963-67 变更情况 see related 63-67: Family planning see Birth control 参照系统 Contraception 68-74: Birth control see under Family X Birth Control planning 75--: Birth control see under Contraception X Planned Parenthood XR Contraception XR Population Control
医学主题表(MeSH)
先天性肾发育不全 ①肾疾病(C12)/先天性(C1-12,…) ②肾(A5)/畸形(A1-10,…) 分析:以上两种组配都符合各自的组配范围, 似乎都是正确的,但是‚/先天性‛说明语中规定, 与疾病主题词组配,表明出生时或出生前存在的疾 病,不包括形态学畸形和分娩时的损伤,两者分别 用‘畸形’和‘损伤’。‚/畸形‛的说明语中规 定:与器官组配,表明因先天性缺陷而致器官的形 态改变。②符合说明语的范畴,是正确组配。
副主题词使用说明
Blood 血液 (B2, C, D1-11) (C, F3)
用于表明血液中各种物质的存在或分析,但不包括血 清诊断和积压血清。后两者分别用“诊断”和“免疫学”。
Complication 并发症 Diagnosis 诊断
表明两种疾病同时存在或相继存在的状况,即同时 存在的疾病或后遗症、并发症。
献
Heart diseases / Therapy 治疗 心脏疾病
例2:查“肝肿瘤 CT诊断”方面的文献
Liver neoplasms / radiography
肝肿瘤 放射照相术
医学主题表(MeSH) 在《医学主题词注释字顺表MeSHAAL》中, 对每个范畴类目的主题词和副主题词的组配原则 进行了严格规定,组配时要按照规则进行。
不受限制。
缺点: 同一主题的文献可能分散在不同的词
下,从而造成漏检。如要提高查全率, 就必须分别检索表达同一主题的关键 词的同义词、近义词等。
常用主题词表
《医学主题词表》(MeSH) 《医学主题词注释字顺表》 《中国中医药学主题词表》
《汉语主题词表》
医学主题词表(MeSH) 《医学主题词表》( Medical Subject Headings,简称MeSh),是美国国立医学图书馆 编制的权威性主题词表。它是一部规范化的可 扩充的动态性叙词表。美国国立医学图书馆以 它作为生物医学标引的依据,编制了《医学索 引》(Index Medicus)及建立计算机文献联机 检索系统 Medline 数据库。
体系分类法
概 念 原 理 作 用 类 型
体系分类法
是根据文献所属的学科内容分门别类 地系统化组织、揭示文献的一种方法,亦 称等级列举式分类法、枚举式分类法。 主要用于文献的排架管理和检索工具的 编排组织。
体系分类法的原理
以学科门类为基础,根据文献的内部和某 些外部特征,运用概念划分的原则,按知识门 类的逻辑次序由总体到分支、由一般到具体、
文献检索教研室 李梅
主要内容
信息组织 分类语言 检索语言 主题语言 主题标引
信息组织
是根据检索的需要,以各种类型的信息 资源为对象,利用一定的规则和方法,依 据信息资源的外部特征或内容特征,通过 对其特征的分析、选择、处理,将无序的 信息资源组织为有序集合的过程。
信息组织与文献检索的关系
信息组织是文献检索的基础和前提。 文献检索则是信息组织的目的和归 宿,是信息组织的反向过程。
例如副主题词治疗(therapy)与疾病主题 词组配,可用于综合疗法。例如:消化性溃疡的 心理疗法,用消化性溃疡/治疗;心理疗法组配。
医学主题表(MeSH)
副主题词治疗应用(therapeutic use)
与药物、生物制品和物理作用物主题词组
配,指用于预防和治疗疾病,包括兽医用
药。
例如红霉素治疗链球菌感染,用红霉