信息组织方法体系
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5. 在版编目的理论(cataloging in publication,CIP)是一种针对图书 的预先编目形式。依据相关法规, 由经过授权的图书馆或其他机构在 图书编辑出版过程中根据出版机构 所提供的图书校样或填报的图书在 版编目数据单进行编目,然后再由 出版机构将编目结果印刷在图书的 特定位置上的一种编目活动。
• 信息系统组织是把经过描述和标引的信息 实体和信息记录组织成一个有序的系统, • 信息通过特征描述和内容揭示,获得了表 示信息的标引,但这只是针对某一文献和 信息单元的,把这些信息有序地组织起来 才完成了信息组织的过程,这就需要信息 系统组织。
二 信息组织方法
2.1 按组织对象分:文献实体组织与文献内 容组织 文献实体组织的对象是文献,书本指的是传 统的信息资源类型,主要指印刷型的出版 物,如图书、期刊、会议论文、科技报告 等。文献实体组织是把这些文献及其著录 和标引记录组织成一个有序的系统。如图 书馆的分类排架系统、分类目录、主题目 录等。
1.2 信息标引
• (一)信息标引的含义:
• 信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其 他有意义的特征标识出来,作为文献存储与检索依据的一种文献处理过程。 简单来说,标引就是依据检索语言,确定文献标识的过程。
• (二)信息标引的步骤:
• 1.主题分析:通过讨论文献的中心思想,确定被标引文献的主题概念。 • 2.概念转换:以主题分析为基础,将确定的主题概念赋予检索标识的过
程。
• (三)信息标引的类型:
• 1.分类标引:依据一定的分类检索语言,对文献内容的学科性质及其检
索意义的形式特征进行分析、归纳,赋予文献分类检索标识的过程。
• 2.主题标引:依据一定的主题词表,对文献内容的先进行主题分析,再
赋予文献词语标识的过程。
ຫໍສະໝຸດ Baidu 自动标引
1.自动标引含义:是直接通过计算机的操作处 理,赋予检索标识的过程。 2.自动标引的类型
1.1.4 信息描述的作用和原则
• 文献目录/信息资源数据库的功能。揭 示功能;检索功能;管理功能。 • 信息描述的原则。客观性、实用性、 规范性、制度化。
1.1.5 信息描述理论与实践的发展
古代。 1. 中国,分类目录《七略》、《四库全 书总目提要》 2. 西方,亚历山大图书馆《在全部学术 领域指引人们写作之表记》;1548年 《编目方法》;1595年《英文印本图 书目录》
2.3.2 主题组织法
1)定义:以自然语言中的词语或规范化的 词语作为揭示文献主题的标识,并以此 标识编排组织和查找文献的排检方法。 主题词:表达主题概念的词语,优选出 的词语必须词义明确,避免其多义性, 并受特定的词表控制。 2)分类:a标题词法、b单元词法、c关键 词法 d叙词法
a标题词法
a1定义:以标题词(规范的事物名称、名词 术语)作为文献主题内容的标识和检索标 识的先组式主题法。
B)采用MARC格式描述网络信息。1991 年LC提出了讨论以USMARC为主要架 构,制定了囊括网络信息的相关字 段,以后又不断修订。包括扩大网 络信息资源的涵盖范围;增加、修 改008字段第26位数据元的代码; 5- -相应字段增加$u以记录资源的 URL;增设856电子文件地址与检索。
C)使用专门的网络数据描述语言进行网 络信息资源描述。(XML;DC)
信息组织方法体系
信息组织方法体系
• 一 信息揭示与信息组织 • 二 信息组织方法 • 三 信息组织手段
一、信息揭示与信息组织
• 1.信息描述 1.信息描述 • 2.信息标引 2.信息标引 • 3.信息系统组织 3.信息系统组织
1.1 信息描述
• 信息描述(information description), 是网络时代中学术界对传统“文献编 目”概念的一种继承和发展。
近现代。 1. 欧美,19世纪中叶潘尼滋的《大英博物 馆印本图书著录规则》被认为是第一部 现代编目条例,即《91条规则》。博德 利与《博德利图书馆目录》;朱厄特与 《朱厄特规则》;克特与《印刷本字典 式目录规则》;杜威与《美国图书馆协 会编目规则》;德国皇家图书馆《普鲁 士规则》;柳别茨基与巴黎国际编目原 则会议的原则声明;英美编目条例2版。 。
在网络时代,图书馆所搜集、整理 的对象已经延伸到了网络中的虚拟 馆藏,网络信息已经成为了图书馆 重要的信息资源。“文献编目”无 论从内涵还是从外延上讲都无法涵 盖现有的图书馆编目对象和编目内 容。于是出现了“信息描述”、 “信息组织”的概念。
信息组织, 信息组织,就是依据一定的规则和方 法,将大量原本处于无序状态的信息 资源(包括实体资源和网络资源)有 序化,使之形成便于使用的信息系统。 这个过程如果针对的是传统印刷型和 非印刷型文献实体信息资源,仍然可 以称为文献编目;如果其对象还包括 网络信息资源,就应当称为信息组织。
3. 联合编目理论(Cooperative cataloging),若干个图书馆根据协 议和统一的工作规范,分担编目工作, 共享编目成果的一种编目形式。
4. 共享编目理论(Shared cataloging),是集中编目和联合编 目的融合体。以一个权威机构的编目 数据为主,其他参加机构的补充编目 数据为辅,各参加机构通力合作,完 成文献编目,共享编目成果的编目形 式。 联机共享编目online shared cataloging。
单元词从文献内容中抽出,再经规范,能表达一个独 立的概念。是最基本的、不能再分的词汇,比如“计 算机软件”不是单元词,而“计算机”和“软件”才 是单元词。
b2单元词表:专利工具中的《WPI-规范化主 题词表》
b单元词法
b3特点:
优点:强调词汇的单元化和后期组配,因 此提高了主题法的灵活性; 缺点:由于它过分强调词汇单元化,词汇 处理方法又不甚合理,易发生错误组配, 误检率较高,故实用性不是很好。
1.1.2 信息描述的含义
信息组织就内容而言,包括信息标引、 信息描述和信息排序。 信息描述,是根据一定的规则和标准, 对信息资源的形式特征和部分内容特征进 行描述并给予记录的过程。其结果是一条 由若干个信息描述项组成的有关该信息资 源的书目数据记录。
1.1.3 网络信息资源描述
A)采用ISBD(国际标准书目著录)格式 描述网络信息。国际图联(IFLA) 1997年为电子信息资源的著录制定出 版了ISBD(ER),对信息资源的获取 增加了获取方式注明(Mode of Access),可著录信息获取的方式及 URL地址。
(1)从标引深度划分:全文自动标引和题名自动标引; (2)从选用的标引词划分:叙词自动标引和关键词自动标引; (3)从标引方式划分:自动赋词标引和自动抽词标引; (4)从标引形成的标识划分:主题自动标引和分类自动标引。
3.自动标引的类型
• 统计标引法 • 语言分析标引法 • 人工智能标引法
1.3 信息系统管理
2. 中国。初创阶段20世纪初-1949;奠 基、发展、停顿与恢复阶段19491979;腾飞阶段1979底- 。1979年4 月中国加入ISO。《中国文献编目规 则》、《西文文献编目规则》。
近现代文献编目的主要理论成就 1. 编目标准化理论:文献编目条例。 2. 集中编目理论(Centralized cataloging),由一个公认的编目中 心按照统一的分编规则编制书目记 录,并向多个文献收藏机构提供书 目数据的一种编目协作模式。
6. 书目控制理论(bibliographic control,BC),基本含义是针对文 献进行有效的组织与管理。 IFLA1974年起推行世界书目控制规 划UBC。制定了《个人名称》、 ISBDs、采纳了ISBN、ISSN,推荐 了UNIMARC、DDC。
当代的信息描述理论与实践
• “20世纪以来” • 机读目录-增加字段描述文献网址; 元数据:CDF(频道定义格式)、 CDWA(艺术作品描述目录)、CIMI (博物馆信息计算机交换标准框架)、 DC(都柏林核心元数据)、EAD(档 案编码描述格式)、GILS(政府信息 查找服务核心元数据标准)等。
C关键词法
C1定义:以关键词作为文献主题内容的标 识和检索标识的主题法。
关键词:直接从文献题名、文摘或全文中抽取出来的有 实际检索意义的信息单元(关键词)。关键词是非规范的, 无需查阅标准词表,或者只编制一个“禁用词表”,它 收录为数不多的禁用词,如助词、连词、介词、冠词以 及一些通用概念的词。
c关键 词法
C2特点:
优点:关键词法不受词表控制,快捷简便, 适于用计算机组织和检索文献信息; 缺点:由于关键词法的词语不规范,影响了 文献信息的查全率和查准率。
d叙词法
d1定义:以叙词做主题词的后组式主题法
叙词:是一种以概念为基础的,经过优选的规 范化名词术语,具有单义性,组配性能好的特 性。
a标题词法
a3特点: 优点: • 使检索具有直接性与直观性; • 适合于从事物出发按专题进行特性检索 缺点: • 缺乏按学科进行族性检索的能力; • 缺乏表述专指度较高的复杂概念的能力; • 缺乏多途径检索和自由扩检的能力。
b单元词法
b1定义:以单元词作为文献主题内容的标识 和检索标识的后组式主题法。
• 元数据(metadata)又称为“描述 数据”。即关于数据的数据,它是 对数据内容的描述,现在常说的元 数据是特指在标记语言(SGML, HTML,XML)环境下对网络信息资源 进行描述的解决方案,作用是便于 网络信息资源的发现、存储、管理 和检索利用。
Dublin Core的元数据由信息资源的题 名、主题、描述、来源、语言、信 息资源间的关系、覆盖范围、创建 者、出版者、其他信息资源的贡献 者、版权、日期、信息资源类型、 信息资源格式、识别符等15个著录 单元构成,并将它们分成内容特征、 知识产权和例证说明三大类。
规范化处理:同义词(计算机和电脑)、近义词(实 验与试验)、词形(汉字的简体、繁体、异体)、词 组的组合方式(正叙、倒叙、并列)、用注释方式对 标题词的内涵进行限制的规范
a2标题词表:《工程标题词表》(SHE) 《工程标题词表》
《工程标题词表》(SHE) 工程标题词表》
① INFORMATION SCIENCE ⑥ 903 ②(Before 01/86,use code 901) ③ Abstracting (Beginning01/81) ③ Indexing (Apply code 723 if computerized) ⑥ (723) Information Dissemination ④See INFORMATION DISSEMINATION ③ Information Retrieval (For systems, see INFORMATION RETRIEVAL SYSTEMS) ③ Information Use Language Translation and Linguistics ⑥ (723) (Apply code 723 if computerized. ⑤See also TRANSLATING MACHINES) 说明:①主标题词;②注释项,说明词的使用范围、用法及含义;③副标 题词;④见项,指向规范化的标题词;⑤参见项,指向相关的标题词; ⑥分类号(用于计算机检索)。
2.2 按信息组织的层次分:语法信息组织、 语义信息组织与语用信息组织 语法信息组织有: 字顺组织法、代码组织法、地序组织法、时 序组织法。
2.3 常用信息组织法
1.分类组织法 2.主题组织法 3.集成组织法
2.3.1 分类组织法
1)概念:就是根据分类对象的内容性质、形 式体裁、读者用途等分门别类地系统地组 织事物。—谢阳群 《微观信息管理》 2)种类: 分面分类法和体系分类法
1.1.1 信息描述基本原理
广义文献编目包括两部分:其一是对 文献内容的概括和揭示,主要通过分 类标引和主题标引来实现;其二是对 文献内容和形式特征进行的分析、选 择和记录,即著录,英美国家所谓的 描述性编目(descriptive cataloguing)或实体描述(physical cataloguing)。