第四章-主题法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、主题法的类型
• 主题法的类型可以有许多不同的划分方法,按照 主题法的选词方式,可分为:标题法、元词法、 叙词法、关键词法;按照使用时组配的先后,可 以分为先组式主题法和后组式主题法;按照使用 时是否进行控制,可分为受控主题法和非受控主 题法。 • 1、标题法 • 标题法是最早出现的主题法类型,标题是主题标 题的简称(subject heading),是直接表达文献 主题的标识,大多是对文献内容所论述及事物名 称及特征的规范表达。众多标题集合而成的主题 标识系统,就是标题语言。标题语言或用标题语 言进行标引的方法叫标题法。
• 3、叙词法,也叫叙词语言,国内亦称主题词,是从自 然语言中精选出来的、经过严格处理的语词作为文献主 题标识,通过组配方式表达文献主题的主题法类型,通 过规范化处理的,以基本概念为基础的表达文献主题的 词或词组。是对单元词语言的直接继承,但克服了单元 词语言的不足,吸收并综合了多种标引语言的原理和方 法,是能结合计算机使用的后组式语言,是目前主要的 受控语言。
• ⑤有科学术语与文献类型名称组成的复合词,如 计算机词典、固体物理书目等
• 二、词形控制和词义控制 • 1、词形控制 • 自然语言中存在大量涵义相同或大致相同,但字 面形式不同的语词。在叙词语言中,则要通过词 形控制,消除这种现象。因为,这种现象的存在, 会降低叙词检索系统的检全率,也会给叙词的字 顺排检带来不便。所以,叙词语言对叙词形式必 须进行严格控制。汉表词形控制的主要内容有:
• 目前使用最广泛的是美国的《国会图书馆标题 表》(简称LCSH) ⑴标题法的特点 ⑵标题的类型和结构 单词标题:Economics(经济学) Cataloging(编目) 词组标题:农业信贷;青少年汽车驾驶员;电视 与儿童;图书馆学;加利福尼亚海狮;雪橇与 滑雪;动画片中的儿童。 复分标题:水果-病虫害;音乐-奥地利;参考书书目。
• ⑴规定语词形体,当一个汉字存在几种形体,如 繁简体、异体或未正式公布的简体时,一律以通 行的字体为标准,如,储液池(正式叙词),贮 液池(非正式叙词) • ⑵规定外来语和数字的用法,外来名词术语一般 应选用规范的汉译名,但在外文名词术语更为通 行时,也可直接选用。例如:FORTRAN语言、 BASIC语言、A射线、BCS理论,数字在汉表中 视具体情况,有两种形式一是汉字形式,二是阿 拉伯数字形式,但同一概念只能选用一种形式表 达。 四氧化三铁、铀235、135照相机等
• ⑵选择的语词应该念明确,一词一义,符合科学 性、通用性的特点,适宜于准确地表达文献主题 和检索提问。对于自然语言中的同形异义词、多 义词一般不予选入,在确实需要时,应通过限定 的方法加以使用。 • ⑶语词的选择应符合叙词概念组配的特点,要求 既能发挥组配的优越性,又能兼顾词汇的专指性, 在收入单词的同时也收入一定数量的具有造词功 能的词和词组。 • ⑷选定的语词应符合汉语的构词特点,在词形上 符合语词标识的要求,并尽量选用便于字面成族 的词。
• “图书馆学-关系-情报学”组配表达“图书馆学 与情报学的关系” • “粤语-比较-普通话”组配表达“广东话与普通 话的异同” • ③特称组配 • “平面磨床”和“卧式”组配表达“卧式平面机 床” • 属概念 “种差”多出的特征 待标引的种概念 • “齿轮”和“不锈钢”组配表达“不锈钢齿轮” • ⑷叙词组配的作用 • 三、主题法的特征
• ⑷表示研究方法、工艺、加工技术、操作等方面 的名词术语,如调查、总结、铸铁、热处理、爆 炸成型、抽样调查、有限元法、质量管理、经济 核算等。 • ⑸表示学科门类、技术部门、理论、定理等的名 词术语,如哲学、伦理学、生物学、图书馆学、 经济学、遥感技术、水利工程、对立统一规律、 万有引力定律等。 • ⑹表示文献类型的名词术语,如词典、年鉴、百 科全书、期刊、索引等 • ⑺某些具有构词功能的词,如台式、小型、多用 途等
• 2、词汇类型 • 叙词表选词以名词为主,必要时也收入少量形容 词。按照反映事物概念数量的不同,收入词表的 语词可以分为普通名词和专有名词两种。普通名 词是叙词表的基本构成成分,其选词范围包括: ⑴表示具体事物的名词术语,如商品、信息资源、 汽车、车床、电子计算机、细菌、水稻、原子、 反应堆、图书馆、宇宙、海洋等 • ⑵表示事物材料的名词术语,如塑料、橡胶、人 造纤维、感光材料等。 • ⑶表示事物性质、现象、状态、过程等方面的名 词术语,如导电性、耐用性、失真、老化、土壤 熟化、日冕、船舶过载、腐蚀等
到置标题:美洲野猪,成化石的;化学,有机; 化学,无机;地图,统计学的;知识,社会 学的。 自由浮动短语标题: [Personal name] in fietion,drama,poetry, etc.小说、戏剧、诗歌中的某人 [Topic or place] in literature 文学作品中的某论题或某地 [Topic or place] in art 艺术作品某论题或某地 [Name of river] Watershed 某河流分水界
• • • •
特征: 1、直接以词语为检索标识 2、以字顺为主要检索途径。 3、以特定的事物、问题、现象,即以主题 为中心集中信息资源。 • 4、往往通过详尽的参照系统等方式揭示主 题词之间的关系。 • 5、主题法在信息资源组织中的作用,主要 是用来处理信息资源、编制各种检索工具 及检索系统。
• 字顺主题索引实例(3种方式) • ⑴根据藏书类目的类名编制的,而不是根据该 类目所收录的每种藏书做成的 • 《郭沫若文集》主题索引款目为 • 文学-作品综合集-中国-现代-别集 I217.2 • 《矛盾文集》主题索引款目为 • 文学-作品综合集-中国-现代-别集 I217.2 • ⑵根据每种藏书编制的,但著录的也是分类号, 仍是指向整个类目 • 《郭沫若文集》主题索引款目为 • 郭沫若-文学-作品综合集 I217.2 • 《矛盾文集》主题索引款目为 • 矛盾-文学-作品综合集 I217.2
• ⑶根据每种藏书编制的,著录的是索书号,即 指向类目中具体的藏书 • 《郭沫若文集》主题索引款目为 • 郭沫若-文学-作品综合集 I217.2/G815 • 《矛盾文集》主题索引款目为 • 矛盾-文学-作品综合集 I217.2/M378 • (不是主题目录,没有每种藏书基本编目数据, 花费人力和经费较少,与主题目录相比,其主 题检索功能相差不少)
Biblioteka Baidu
• ⑶规定标点符号的用法,一般只在必要时使用括 号、连线、小圆点等符号,其他标点符号除特殊 情况外,概不使用。如:静态分析(经济学)、 发射管(电子)、九.一八事变、气体—固体界 面等均为正式主题词 • ⑷规定词序,收入词表的复合词一般均采用自然 语序,不使用倒置形式。例如用院校图书馆不用 图书馆,院校;用控制计算机不用计算机,控制。 倒置形式在必要时可作为非叙词收入词表,用于 指向相应叙词。
⑴叙词语言对元词语言的扬弃
• 对词组的分解是字面分解,组配也是字面 组配,易导致语义失真及误检
主题:美术学校 元词法用:美术 学校 产生歧义:美术专科学校 学校的美术课 主题法直接用:美术学校 进行标引
字面组配 香蕉+苹果 胃+溃疡+出血 概念组配 香蕉味食品+苹果 胃溃疡+消化性溃疡出血
香蕉苹果 胃溃疡出血
• 如:Culture in literature • 文学作品中的文化 • Horses in art • 艺术作品中的马
• 2、元词法,也叫单元词法、元词语言 • ⑴元词法的后组使用方式
主题
0 1 2 030 021
分类
3 4 033
5 6 035 055
7 8 007
9 019
0
1
2 3 002
第二节 叙词语言的词汇控制
• 一、词汇选择 • 为了保证词汇的选择质量,叙词表对词汇选择原则以及 词汇的类型、范围都有明确的规定 • 1、词汇选词原则(大的框框) • 为了保证词汇选择的质量,汉语叙词的选择一般遵守下 述原则 • ⑴叙词的选择,应依据标引和检索的实际需要,并考虑 学科或专业领域的现状及发展。选定的词汇,应是在文 献检索中有一定使用频率、并能汇集一定文献量的名词 术语。对于表达新事物、新学科的语词,应根据其现实 需要,结合其发展情况,加以选用。
• ⑺历史事件名称,如辛亥革命、海湾战争、 第二次世界大战等 • ⑻法规、条约名称,如中华人民共和国教 育法、中日和平友好条约(1978)等 • ⑼文献名称,如《资本论》《红楼梦》等
• 3、先组词的选择 ⑴应该选用词组(先组词)作叙词的规则 ①词表涉及领域中使用频率较高的常用词组, 一般直接收入词表,如化学工业、高等教育,国 际贸易政策、情报检索语言、数据处理等,均直 接选入 • ②一组词分解后其单词的含义会发生变化,产生 二义性时,直接选用词组,如燃料电池、全面战 争二词分解后,燃料、全面二词的含义发生变化, 应直接选入。 • ③凡有词组分解后其中的一方失去意义,没有实 际检索价值,应直接选用词组。如回溯检索、台 面二极管二词分解后,回溯、台面两词没有实际 检索意义,应直接选入
• ④采用并进一步完善了标题语言的参照系统 • ⑤采用等级列举式分类语言的原理编制叙词分 类索引(范畴索引)和等级索引(词族索引), 甚至引入等级列举式分类表实现分类主题一体 化 • ⑥采用关键词语言的轮排方法,编制轮排索引 • 教材上有表
• ⑶叙词的概念组配类型 • ①交叉组配 • “心理学”和 “教育学”组配表达“教育心 理学” • “电视机”和“录像机”组配表达“电视录 像机” • “水生动物”和“哺乳动物”组配表达“水 生哺乳动物” • ②方面组配 • “汽车”和“发动机”组配表达“汽车发动 机”
• • • •
表示特定事物的专有名词 ⑴地名,如广东省、中国、亚洲、泰山等 ⑵民族名和语言名,如汉族、壮族、英语、俄语 ⑶时代或年代名,如明代(1368-1644)、二十 一世纪、1997等 • ⑷人名,如孙中山、李时珍 • ⑸机构、会议等名称,如北京大学、中央电视台、 联合国、奥林匹克运动会 • ⑹产品名称,如F-16战斗机,南京长江大桥
• ④对一词组以组配表达产生二义性时,可适当选 用词组,如:工业橡胶一词,以工业与橡胶组配, 可以工业橡胶和橡胶工业两种意义,一般直接选 用 • ⑤专有名词一般可直接选用,不与分解,例如广 州图书馆,北京大学 • ⑵不选用词组作叙词的规则 • ①可分解为两个或多个交叉关系的语词的复合词, 如:生物遗传学可分解为 生物学 和遗传学两个 表示交叉关系的语词,喷气式垂直降落飞机可分 解为喷气式飞机和垂直起落飞机两个表示交叉关 系的语词,不应直接选用
• ⑵叙词语言对其他检索语言原理方法的吸收 • 叙词语言在继承和发扬元词语言的积极因素基础 上,还吸收并综合了多种检索语言的原理和方法, 主要表现为: • ①采用了分面组配分类语言的概念组配来取代单 元词语言的字面组配 • ②适当采用标题语言的预先组配,选用必要的词 组,放弃元词语言的标识单元性原则 • ③采用标题语言和单元语言对语词实行严格控制 的方法,以保证概念表达的唯一性
• ②由事物与其方面,包括材料、属性、操作等的 概念构成的复合词,一般应予以分解,如水电站 设计,用水电站+设计;水稻生长习性,用 水稻 +生长习性 • ③由事物与其部分构成的复合词,一般用表示事 物整体的词与表示部分的词表示。如:车床润滑 系统,用车床+润滑系统,飞机座舱用飞机+座舱 • ④由专有名词如国家名、地区名、时代名、人名 的与其他主题概念组成的复合词,如中国石油工 业,李白诗歌创作。但是由专有名词与其他词组 成的专门名词除外,如弗洛伊德误差、阿贝尔扩 张等应直接选入。
4 5 6 7 064 055 076
8
9 029
标引
0 1 010 040
2 3 002
4 5 6 024 055
7 8 007
9 039
• ⑵元词法的特点: • ①词表体积小(没有先组词)②标引专指度高(通过灵 活组配形式表达主题)③便于从不同主题角度检索(以 每个元词作为检索入口)④适合对专指主题进行标引 • ⑶元词语言的不足