5 主题组织

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第 5 章主题组织

5.1主题组织概述

5.1.1主题组织内涵

主题组织是按照信息对象等所反映的主题特征的异同,用接近自然语言的这些语词能表达宽泛程度各异的概念语词和语词符号标识这些特征,通过参照系统等方法揭示概念词间关系,并将概念语词、语词符号按音、形顺序排列来组织信息,以便提供一种易用的面向具体事实、概念的检索途径的信息组织方法和活动。它是信息组织两大方法之一,在现代信息组织活动中占有十分突出的地位。

主题表是主题组织法的运用结果,主题表习惯上也称为主题法,它与我们所说的主题组织法是不同的概念。

5.1.2主题语言

1.主题、主题词、主题表

主题指信息对象所表达或反映的主要内容、问题或事物。按信息所表达的中心问题数量的多少,主题可分为单主题和多主题两种类型。单主题只含有一个中心问题,即只有一个主题;多主题指含有两个以上的中心问题,即有两个以上主题。

主题词是用于描述、存贮、检索信息主题的受控词汇,是主题表中能表达一定意义的最基本词汇单元。主题词是以众多的事物概念为基础的,它是事物本质属性的概括,是一个类称概念。主题词的选用主要依据三方面,即出现频率、标引频率、查找频率。具体来讲是应具有实际检索意义,主题词分为单元词、标题词、关键词和叙词,标题词是先组式语言,即在主题标引前,其概念已组配好;单元词和叙词是后组式的语言,即只在正式标引式才将概念加以组配,显然它的适用能力比先组式语言强;而关键词是不受控制的语词,是一种接近自然语言的一种主题语言。主题词具有概念性、控制性、组配性、语义性、动态性等特征。

将主题词按一定方式、规则组织成的词汇表称为主题词表,主题词表按主题词的类型可划分为标题词表、单元词表和叙词表,按主题检索标识的不同组配程序,分为先组式主题表和后组式主题表。二者的含义差别体现在主题词表在标引前是否已经组配好。

2.主题语言要素

主题语言的要素,包括以下四个方面:

①语词标识:标识有两类即号码标识和语词表示,语词表示是采用自然语言中的但经过控制的名词术语,作为描述文献主题的标识。

②字顺系统:汉字字顺系统主要有音序和形序。

③参照系统:是主题词表显示主题词语义关系的语义词网络。

④主题检索工具:是根据主题语言原理编制的各种主题检索工具,主要是主题目录、主题索引、计算机中的主题词倒排档等。

5.2标题词语言

5.2.1标题词的内涵和词汇控制

标题词(Subject Heading)是指经过规范化和标准化处理的简略表达信息对象论及或涉及的事物即主题的语词,是完全受控的一种主题标识,通常是比较定型的事物的名称。标题语言,是主题语言系统中最早的一种,它以选自自然语言中经过控制的语词术语作为标识,从语词控制角度看,它是一种先组式的。

标题语言基本构成要素是主标题、副标题和说明语。

例:

Books (主)

——Reviews(Indirect) (副)

Here are entered collections of review,works on the technique of writing review are entered under the heading Book reviewing.

见《美国国会图书馆标题表》第九版

5.2.2标题词的语义参照

标题的语义参照是标题法揭示标题之间的语义关系的一种重要手段。主有单纯参照、相关参照和一般参照。单纯参照是反映同义关系的参照,一般用“见(see)”、“见自(see from)”来显示等同关系。相关参照是指两个具有等级或者相关关系而又是正式使用的标题词之间的参照,用“参见(see also)”、“参见自(see also from)”来显示。一般参照是一种概括性的举例性参照。

例:

电脑(非正式标题词)

见电子计算机见(正式标题词)

电子计算机(正式标题词)

见自电脑见自(非正式标题词)

海洋学(上位标题词)

参见海洋地质学参见(下位标题词)

作为一种传统的的主题法,标题词表的特点有:(1)采用列举式词表,(2)定组式标题结构,(3)操作简便。

5.3元词语言

5.3.1元词的内涵

单元词(uniterm)又称元词,它是从文献中抽取出来并经过控制处理的、能表达文献主题最小、最基本的在概念上不能再分解的的,并能独立地描述文献所论及或涉及的事物——主题的词汇单位。

比较系统地建立起单元词法理论和体系地是1951年陶伯的单元词卡系统。

单元词可以是一个单纯词,如“山”、“水”、“氧”、“玻璃”、“逻辑”、“火车”、“资料”、“马克思”、“乌鲁木齐”等,也可以是一个合成词,如“文字”、“图书馆”、“车床”、“隔音”、“公路”等。

任何复杂的概念都可由单元词的组合(配)而成。

在实际使用过程中,单元词法使用的单元词并非都是任意的,实际上它只选用经过规范化处理够的单元词来表示文献的主题。

组配就是从主题词表(但组配也适用于分类组织法)中选取若干个主题词,按照一定的概

念组合关系和符号,把他们有机地结合起来,以表达更为专指的主题。组配时主要使用比号组配法和比孔组配法两种方法。

5.3.2元词的特点

单元词法的主要特点是:标题是组配构成的,而且是“后组式的”,

具体地说,单元词法的主要特点是:

(1)摆脱了标题法中每个标题只能选择一种标题形式作为正式标题的局限性,也就是可以同时使用多个单元词对同一份文献从不同的侧面分别进行标引;

(2)单元词之间不存在次序问题。但是这有可能会产生误检,例如在查找“学校图书馆”时,由于使用“图书馆”和“学校”这两个单元词进行组配,结果可能会把“图书馆学校”和“学

(3)校图书馆”的额外内线都检索出来。

(4)组成“标题“的每一个单元词都是排检词,都可以作为检索入口,因而与标题法相比,单元词的检索途径较多。

(5)利用对单元词的增加或减少,可以进行扩检或缩检。

(6)标引深度较高。单元词是一个标识(一个单元词)一张卡片,单元词的数量都有一定的限制。每张单元词卡片一般可以记录200个文献号码,而且还可以继续使用第2、3张卡片。如果采用比孔卡片,则可以记录更多的文献号码,因而可以大大提高文献的标引深度。例如,美国杜邦公司的几个检索系统,有许多文献标引了400多个单元词。

(7)有利于向计算机检索方向发展。

单元词法最初不编制词表,因而对词义的控制和词义的规范都不作要求,但是后来也编制了词表并使用语义参照系统。

5.4叙词语言

5.4.1叙词的涵义和特点

为了避免单元词法的上述缺陷,人们又研制了一种新的信息组织方法——叙词法。叙词(descriptor,Subject terms),它是经过词汇控制后,在信息组织中用来显示文献主题,在检索中用来构造提问式的一种检索词汇。

它是以受控的自然语言为语词基础,以字顺和分类系统为词汇显示的基本手段,以语词的概念组配而不是字面组配为重要特征的一种标引和检索文献的理论方法,又称其为描述词、叙述词,在国内也叫主题词。叙词法就是以叙词作为标识符号,标引和检索文献信息的一种检索方法。

1959年美国杜邦公司编制了第一部叙词表,其后,随着计算机的应用,叙词表的编制迅速发展,叙词语言成为受控信息组织和检索的主要语言。

叙词法的主要特点是:(1)直接以规范化了的自然语言——叙词作为标识符号,直观性强;(2)直接从论述和研究的具体对象和问题出发进行选词,并采用叙词组配来描述主题,专指性强;(3)叙词法能随时加以增设修改,适应性强;(4)对叙词主要采用字顺排列方式,查找迅速;(5)主要采用后组式概念组配方法,灵活性强;(6)对同一主题的文献,可以作多维检索(多途径检索);(7)叙词表中编制和建立了叙词语义关系的网络结构(叙词字顺索引的参照系统,叙词范畴分类系统、叙词等级系统,叙词词族图等),加强了叙词法的学科系统性和族性检索作用。

5.4.2字面组配与概念组配的区别

实际上,字面组配与概念组配有时候相同,有时候则不同。

例如“农用钢挖泥船”就可以用“农用船”、“钢船”和“挖泥船”三个概念进行组配。

相关文档
最新文档