主题图技术与相关知识组织方法的比较研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主题图技术与相关知识组织方法的比较研究
马建霞
(中科院国家科学图书馆兰州分馆 甘肃730000)
文 摘 通过简单介绍主题图的定义及其核心概念,与相关的知识组织方法,如索引、词汇表、叙词表、分类法、概念图,以及语义网中的知识表现等进行了比较。
关键词 主题图 知识组织 索引 词汇表 叙词表 分类法 概念图 知识表现
Co m para ti ve Study Between Top i c M ap and Rel a ted Knowledge O rgan i za ti on M ethod M a J i a nx i a(The Lanzhou B ranch of the Nati onal Science L ibrary,Gansu730000)
Abstract After an general intr oducti on t o t op ic map and it’s i m portant concep ts,an comparative study a mong t op ic map and the related knowledge organizati on methods such as index,gl ossary,the2 saurus,taxonomy,concep t map and knowledge rep resentati on was carried out.
Key words:T op ic map,Knowledge organizati on,I ndex,Gl ossary,Thesarurs,Taxonomy, Concep t map,Knowledge rep resentati on
1 前言
主题图是一种新兴的数字化知识组织方式。在X ML Top ic Map(XT M)1.0规范中[1],主题图被定义为一系列以主题、联系和范围组成的主题图节点,这些节点以符合XT M或者其他规范(HyT m)的文件形式或者以满足XT M加工需求的内部应用的方式存在。
概括地说,主题图是一种用于描述信息资源的知识结构的数据格式,它可以定位某一知识概念所在的资源位置,也可以表示知识概念间的相互联系。
[2]
主题图实际上在信息资源的上层构建了一个结构化的语义网,它独立于技术平台,描述主题之间的关系及主题与具体资源的联系,通过揭示概念之间的关系,将用户指引到相关的资源。建构主题图,其目的在于建立一个个人化的知识导航界面,并给使用者一个能快速掌握轻松学习知识的操作界面。主题图被誉为信息管理和知识管理之间的桥梁,是信息世界中的GPS定位仪,它可以提供信息资源的直观的导航。[3,4]
对于主题图技术的定义,我认为,狭义地讲,主题图技术就是如何用主题图标记并展现信息资源知识结构,并将该知识结构与信息资源集合相关连的方法;广义而言,主题图技术包括在主题图构建过程中的本体分析、主题图XT M文件的生成、编辑、存储、主题图的可视化展示等主题图的各种应用中以及主题图与其它知识表示技术互操作中所用到的技术和方法。[22]
目前国际上对与主题图技术的研究主要在以下几个领域:主题图标准体系的建立与研究,主题图在知识管理中的应用,主题图的可视化、主题图的应用工具、主题图与其他知识表现技术的比较与互操作、主题图及其本体的构建方法等。国内对主题图技术的研究和应用刚刚启动。
2 主题图技术核心概念
现实世界中的客观事物往往具有其自身的某些特征,比如名称、位置、存在的特定范围以及一事物和其他事物之间的联系等,这些事物在主题图中的反映就是一组主题。这些主题同样也包含自身的特征集合,最基本的特征是:主题的名称,主题所在的资源实体(出处)以及它与其他主题间的关联。一个主题图就是一个由主题、关联性以及资源实体(出处)组成的集合体。
主题图中关键的概念是主题(t op ic)、关联(as2 s ociati ons)和出处(occurrence),另外还有主题的标记(identity)、分面(facet)、范围(scope)。[5-7]
74
2007年第2期(Vol.26.No.2) 图书馆杂志(L ibrary Journal)
3 主题图与相关知识组织与表现技术的比较
在计算机信息管理领域,知识管理是以某一组织范围内对知识的产生、传播、储存、应用、共享为研究对象的理论和方法。知识管理中的关键问题是知识如何被组织,正是对知识的编码和有序化决定了知识是否可以被获得。主题图技术是知识的产生和传递过程中的一种知识编码组织技术。[5]
自从美国图书馆学家布利斯(H.E.B liss)提出知识组织理论以来,国内外学者对于知识组织进行了大量的研究:
蒋永福认为:知识组织是指对事物的本质及事务间的关系进行揭示的有序结构,即知识的序化,通俗地说,是对知识客体进行的诸如整理、加工、揭示、控制等一系列组织化过程及其方法。[8]
王知津认为:知识组织是对知识进行整序和提供,既能处理大量的现有知识,又能相对降低存储知识的物理载体文献的盲目增长以免知识过于分散化。所以提供文献、评价科学文献和系统表述以生成新的便于利用和获取的有序化知识单元的处理系统就是知识组织。[9]
A.Sigel认为:“知识组织”是使知识集合增值的一种跨学科领域的文化活动。知识组织是研究如何组织概念和概念之间的相互关系,从而以一种有序的形式把握知识,并使这种知识易于传播和利用的主题领域。[11]
而J.D.Anders on则认为:知识组织是对文献的内容、特征、目标的描述,并组织这些描述,使这些文献和其中的内容能够被人们检索到。知识组织包括索引、文摘、编目、分类、记录管理、书目和创建文本和书目数据库。这一概念以文献为中心,而不是以知识结构为中心。这一观点认为知识必须具体化为文献或文本后(显性知识后)再经由特定方式将文献内含的知识层面进行抽取、标引,进而建立一套系统化作业模式与原则理论,这些活动正是图书馆学中的分类编目、索引等理论与实务所覆盖的层面。[11]
总之,知识组织的理论建立在知识单元———概念的基础上,知识是以知识单元(概念)及许多语词或句子的可能组合来表达。知识组织是将无序或分散的特定知识,根据一定的原则与方法,使之有序、集中、定址,以方便知识的提供、利用和传播。科学知识组织系统中,除了科学文献组织系统(等级分类系统、分面分类系统、索引系统)以及学科体系知识组织系统(教科书、百科全书、综述、述评)外[10]还有科学术语知识组织系统,人工智能知识组织系统、模拟空间的知识组织系统。
在知识组织领域人们认为某种程度的词汇控制至关重要,因而知识组织非常关注分类法、叙词表和本体论的研究和利用。Hodge将数字图书馆的知识组织系统分为:术语集(ter m list)包含权威档、词汇表(gl ossaries)、地名词典、字典;分类系统包括标题表、分类表(taxonomy);关系词群(包括叙词表、语义网络和本体)。
主题图这种知识组织方式继承了索引、词汇表、叙词表、本体、分类表等知识组织方式的特征,并吸取了人工智能领域的ont ol ogy、语义网的思想,这使得它能够比较好地适应数字化环境中的知识组织。
下面,将就与主题图密切相关的知识组织方式进行对比分析,以此展现主题图技术的理论基础和思路。
3.1 索引
索引是某一文献集合包含的文献单元或概念的系统性指南,这些文献单元或概念分别被描述在按照某种共知或规定的可查顺序(如字母顺序、年代、数字等)排列起来的款目上[13]。“它通常不提供信息或者知识内容本身,只提供一种指示系统,使读者或用户能准确地找出文献或信息集合中的特定信息,它以具体主题、观点、事物、概念、名称、语词、符号为对象,对文献内容做深入发掘和全面揭示,给使用者明晰的指引。”国际标准化组织I S O1975年《文献工作-出版物索引》(I S O999-1975)[13]中规定索引的结构:索引款目(包括标目、说明语、存储地址)、索引的参照系统(包括参照(见参照、参见参照、见至参照、反参照)、标目注释)。
例如:图2的索引摘自一本有关歌剧的图书,其中,包括了索引款目、索引的参照系统,根据标目的类型不同用不同的印刷字体表示出来,该标目的出处用页码表示,而且根据标目的类型不同和出处的类型不同用不同的印刷字体或者颜色表示出来。其中见参照表示一个主题的不同表达方式,参见参照表示与该主题有关联的主题。
主题图吸收了索引中的基本思想。主题图中的主题对应于索引中的索引款目,联系对应于索引中的参照系统,标目的出处对应于主题图中的出处(occurrence),主题图用范围(scope)定义了某个概念或者概念之间的关系有效的范围。
主题图比传统的索引更进一步的是,主题图认
84图书馆杂志(L ibrary Journal) 2007年第2期(Vol.26.No.2)