网络信息组织中的分类法与主题法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【标题】网络信息组织中的分类法与主题法

【内容提要】分类法与主题法是网络信息组织的两种主要方法。文章综述了分类法与主题法在网络信息组织中的应用现状、存在问题及进一步完善的办法,并指出分类主题一体化是网络信息组织的发展趋势。

【摘要题】信息化与网络化建设

【关键词】网络信息组织 / 分类法 / 主题法 / 分类主题一体化 / 关键词 / 搜索引擎【正文】

网络信息组织就是采用一定的方式,将 Internet 中某一方面大量的、分散的、杂乱的信息(网站或网页中可索引的公共信息,不包括各种专门数据库的信息)经过整序、优化,形成一个便于有效利用的系统过程。分类法与主题法是网络信息组织的两种最主要的方法。本文拟分析分类法与主题法在网络信息组织中的应用情况,并探讨应用中存在的问题及解决的办法。

1 分类法在网络信息组织中的运用

1.1 分类法在网络信息组织中的应用现状

目前,分类法在网络信息组织中的应用主要有两种方式:一是采用传统的分类法,主要用于学术性信息资源的组织与查询。如利用杜威十进制法 (DDC) ,比较成功的综合性网络目录有加拿大国家图书馆的“ CanadianInformationbySubject ”。较好的专题性网络目录有加拿大多伦多参考图书馆的“ ExpandingUniverse ”,主要面向天文学资源。另有一些特色站点是“ GNOSIS ”、“ CyberDewey ”、“ Sized ”、“ WWLIB ”等;使用国际十进制分类法 (UDC) 的网络目录有“ BUBLESubjectTree ”,它覆盖了英国国内综合性网上资源。“ NISS ”,综合性网络目录,类目前标有 UDC 分类号。“ SOSIG ”,它选用了 UDC 的社会科学部分的分类号,共有 26 个类号;使用美国国会图书馆分类法 (LLC) 的网络目录如“ CYBERSTACKS ”,由美国依阿华大学开发,主要提供 6 大部类的资源。国内分类法在网络信息组织中的应用较少,《中图法》作为容量最大,使用面最广的中文图书分类法,只有在中文搜索引擎“网络指南针”中得到了应用,目前只有两级类目框架。应该说真正意义上的《中图法》的网络版还没有出现。二是采用自编的分类体系,其设计从普通用户出发,主要用于通用性网络信息资源的组织与查询。网络信息组织的自编分类体系大都是主题分类法,主题分类法基本上采用等级结构,以主题为中心,按事物而不是按学科划分类目。大多数中文搜索引擎就是采用这种分类体系来组织信息,如著名的中文搜索引擎雅虎中国(Yahoo!) 。

1.2 利用分类法组织网络信息的优势

(1) 分类法具有较强的系统性。分类法采用划分范畴的树状结构按事物或学科分类组织网上信息资源,具有层次清晰、体系稳定等优点。

(2) 分类法便于浏览检索。分类法的等级结构便于用户在查找时进行浏览。当用户的检索目的不明确或检索词不确定时,分类浏览方式更有效率,它引导着用户按照初始的目标一步一步接近需求的信息。

(3) 分类法提供对非文本信息的组织。当前,网络信息资源中非文本信息占的比重越来越大,如:图形、图像、声音、动画等,分类法独有的聚类功能和代码标识在组织和揭示多媒体信息中占有极大的优势。

(4) 检索语言的通用性。分类法以知识分类为基础,以符号为标识,具备成为不同语言转换中介的条件。

1.3 分类法在网络信息组织中存在的问题

大多数中文搜索引擎都采用自编的分类体系组织网络信息,这种自编的分类体系主要存在以下问题:

(1) 分类体系不严密。一些搜索引擎在划分类目时,并未真正从知识领域、知识体系的角度来分类,而仅仅从商业角度考虑,因而使得分类体系漏掉了许多重要的知识领域,体系的系统性和完整性受到很大的影响。如雅虎中国 (Yahoo!) 的基本大类中没有设置工业类、农业类等基础性类目,而把它们作为二级类目、三级类目,或是分散到其它类目中。

(2) 类目之间缺乏逻辑性,隶属关系混乱。部分中文搜索引擎分类体系的类目之间缺乏逻辑性,类目归属关系不尽合理。表现在某些上、下位类之间隶属关系模糊,缺乏合理的知识联系。如“东方网景”把教育列于自然科学类下,“网易”在文学类下列出入文历史和宗教等。

(3) 类目名称不规范。主要表现为类名不统一,类名用语不准确,类名不能确切概括类目的内涵。如搜狐称“计算机与互联网”,中文雅虎称“电脑与因特网”,网易中热门查询的“另类”等。

(4) 类目划分标准模糊。由于类目设置采用多元标准划分,一些类下往往使用两个或多个分类标准,有的甚至在同一层次上列出不同等级的类目,致使同位类设置显得混乱。

1.4 分类法在网络信息组织中的进一步完善——建立统一的网络信息分类体系

现有的网络信息分类体系,无论是体系的完整性、类目的划分和设置,还是类名的内涵、外延都各不相同,这对网络信息资源的组织、检索造成困难。针对上述问题,建立统一的网络信息分类体系势在必行。

建立统一的网络信息分类体系,必须遵循面向网络信息资源,面向网络技术环境,面向用户的原则,突出其实用性和易用性,充分借鉴网上已编制的分类体系的经验和传统分类法理论、技术和成果。在具体实施过程中,应注意以下几点:

(1) 以主题作为聚类标准。网络分类法聚类的标准不是传统分类法的学科,而是以主题作为聚类的主要依据。

(2) 从类目的划分与设置来看,应突出重点类目,减少划分的层次。网络分类法的编制应根据多数用户查询的需要,把信息量大、用户感兴趣的知识范畴突出列类,而不必考虑它在科学体系中所处的层次如何。在类目设置和划分时,将大多数类目的层次控制在 3 、 4 层为宜。为了减少划分层次,划分过程可以不十分严格地按等级层次进行,而是采用多重列类法,使用若干标准同时对某一上级类目进行划分,建立若干从属上级类目的平行子类目,满足网络用户多途径、多角度检索的需求。

(3) 充分揭示信息知识内容的相关性。揭示事物的相关性和根据事物的相关性整序,是信息组织的基本手段。对于知识的多重从属关系可采取交替列类的方法揭示,知识之间的相关关系可大量使用类目参见的方法揭示,通过超文本链接,用户便可透过不同的窗口,浏览被参见的类目。

(4) 能与主题词表相结合。在网络信息检索系统中,分类的宽泛浏览检索与使用自然语言的专指检索,应是不可分割的完整统一体。网络信息分类法的着眼点不应只集中在分类法本

相关文档
最新文档