【信息组织】机读目录格式

合集下载

机读目录概述范文

机读目录概述范文

机读目录概述范文机读目录(MARC)是一种用于记录图书馆藏书的标准编码格式,为图书馆管理和检索图书馆藏书提供了重要的工具。

MARC的发展源于20世纪60年代,当时需要一种可以用计算机进行处理的目录记录格式。

MARC的出现极大地促进了图书馆事业的发展,提高了图书馆信息服务的效率和质量。

MARC格式记录的优点是灵活性和可扩展性。

因为MARC格式设计时采用了层次化的结构,使得字段和子字段可以根据需要进行组合和扩展。

这意味着图书馆可以自定义一些字段来记录特定的信息,以满足自己的特殊需求。

例如,一些特殊馆藏的图书馆可以添加一些额外的字段来描述这些馆藏的特殊属性。

此外,MARC格式记录还可以与其他标准和格式进行对接,实现数据的互通和共享。

例如,MARC格式记录可以转换为国际标准书号(ISBN)或国际标准编号(ISSN)格式,以便在全球范围内唯一标识图书或期刊。

MARC格式记录也可以与其他图书馆信息系统的数据格式进行转换,实现图书馆之间的联机互通。

虽然MARC格式记录在图书馆界得到了广泛的使用和认可,但也面临一些挑战。

首先,MARC格式记录的编写和维护需要一定的专业知识和技能,对于一些小型图书馆来说可能比较困难。

其次,MARC格式记录的结构较为复杂,可能需要较长的时间来学习和掌握,使得人们对其应用和发展的兴趣有所降低。

最后,随着数字图书馆和数字出版的兴起,MARC格式记录的适用性和效率也面临一定的挑战。

总体而言,MARC格式记录作为一种图书馆信息管理工具,为图书馆事业的发展做出了巨大贡献。

在未来,MARC格式记录仍将继续发展和演变,以应对数字化时代和信息技术的挑战,为图书馆信息服务提供更加全面和高效的支持。

机读目录格式

机读目录格式

机读目录格式图书、期刊及光盘的著录方法一、中文图书(一)著录原则按照《普通图书著录规则》(GB3792.2-85)(二)著录内容(1) 001字段(控制记录)010******* 系统可自动生成(2) 010字段@a:ISBN号@b:装订形式(平装可省) @d:CNY:单价(人民币)(3) 100字段处理数据项自动生成。

(4) 101字段作品语种项一般只要求@正文语种项。

(5) 102字段出版国别项@a出版国代码,$b出版地区代码。

(6) 105字段编码数据项一般由系统格式所定。

(7) 106字段形态特征项@a物理形式标识。

常用"r",一般印刷品。

(8) 200字段题名责任项@a:正题名@d:并列正题名@e副题名@f第一责任者@g其它责任者@h分册(辑)号@i分册(辑)名@v卷册号标识。

(9) 205字段版本项@a版次说明(第一可省略)。

(10) 210字段出版发行项@a出版发行地@c出版发行者名称@d 出版发行日期。

(11) 215字段载体形态项@a页数或卷册数@c图表及其它细节@d尺寸或开本。

(12) 225字段丛编项@a正丛编题名@f丛编责任者@v卷标识。

(13) 300字段一般附注项除已有专门附注字段以外的信息,均入此字段,@a附注内容,例:@高等学校教材(14) 303字段著录附注项@a(15) 304字段题名附注项@a本书主编为:××、×××;副主编为:××、×××。

(16) 314字段责任附注项即对著者的说明。

@a张山[1996-],博士,四川农业大学动物医学教授(17) 330字段摘要文摘项即对全书的内容做一概述。

@a本书主要介绍了......(18) 461字段丛编主要用来连接图书所属的丛编的有关信息。

(19) 510字段并列题名项@a(20) 517字段其他题名项@a(21) 606字段普通主题项@a主标目@x主题复分@y地区复分@z 年代复分。

中国机读目录格式说明

中国机读目录格式说明

中国机读目录格式说明【记录头标】记录头标是按照ISO 2709的规定设立的。

它包括处理记录时可能需要的有关记录的一般性信息。

整个头标区固定为24个字符长,由固定长数据元素组成,这些数据元素通过字符位置来标识。

固定长数据一览表数据元素名称字符数字符位置(1)记录长度 5 0-4(2)记录状态 1 5(3)执行代码 4 6-9(4)指示符长度 1 10(5)子字段标识符长度 1 11(6)数据基地址 5 12-16(7)记录附加定义 3 17-19(8)地址目次结构 4 20-23(1)记录长度:………………………………头标区…………5个十进制数。

右边对齐,不足5个数字时用零补齐。

本域由软件产生,用户不能修改。

(2)记录状态:………………………………头标区…………代码:c=修改过的记录d=删除的记录n=新记录o=曾为较高层次记录p=曾为不完整的预编记录(3)执行代码:………………………………头标区…………(a)记录类型,1字符代码: a=印刷的文字资料b=手稿性的文字资料(b)书目级别,1字符代码: m=单行本─专著或多卷集。

s=连续出版物─连续发行并趋向无限期连续发行的出版物。

a=分析性资料─物理上包含在另一种资料里的一种资料,它是另一种资料的组成部分。

c=汇编性著作─人为配套的著作集。

(c)层次等级代码,1字符:表示记录和其它记录有层次连接关系,说明在层次中的相对位置以及记录与同一文件中其它记录的从属关系。

代码:空格=层次关系未定0=无层次关系1=最高层记录2=低层次记录(在最高层以下的记录)(d)未定义,空格(4)指示符长度:………………………………头标区…………表示指示符长度的1位十进制数字,CN-MARC格式为2。

用户不可修改。

(5)子字段标识符长度:………………………………头标区…………表示子字段标识符长度的1位十进制数字,CN-MARC格式为2。

用户不可修改。

(6)数据基地址:………………………………头标区…………占5个字符位,用十进制数表示。

中国机读目录格式

中国机读目录格式
• 如:正式出版后文献的特征与CIP记录不符者。
– 如:00957oam2#2200289###450#
执行代码
由4位字符构成,字符位:6-9;分别定义记录类型、书 目级别、层次等级代码;第9位字符未定义,用“#”表示。
– 记录类型
• 《 中国机读目录使用手册》规定了14种记录类型代码。 • 如:00957oam2#2200289 ### 450#
– 可检字段与不可检字段
200 1#$a西游录$f(元)耶律楚才著$c异域志$f(元)周致中著
有关概念
数据字段区所含的数据有如下两种形式
• 数据控制字段——定长字段(00X)结构:
数据
字段分隔符
• 变长字段(010—999)结构 :
字段指示符 1 字段指示符 2 $a
数据 ……
字段分隔符
200 1#$a西游录$f(元)耶律楚才著
内容标识符
字段指示符
• 指与变长字段相关的字符(数字和字母),它提供有关可变长 字段的内容、记录中不同字段的关系及某些数据处理过程中所 需操作的附加信息。
如:200 题名与责任说明字段 0# 题名无意义 1# 题名有意义
子字段标识符
• 由2个字符组成的代码,用以识别可变长字段中不同的子字段。 • 第一个字符用$表示;第二个字符可以用数字或字母
中国机读目录格式
主要内容
CNMARC机读记录的逻辑结构 记录头标 地址目次区 数据字段区 常用字段的使用方法
第一节 CNMARC机读记录的逻辑结构
CNMARC机读记录结构如下
区域 记录头标 地址目次区
记录 数据字段区
记录分隔符
功能块 0----标识块 1----编码信息块 2----著录信息块—— 3----附注块 4----款目连接块 5----相关题名块 6----主题分析块 7----知识责任块 8----国际使用块 9----国内使用块

《中国机读目录格式使用手册》编目例析

《中国机读目录格式使用手册》编目例析

《中国机读目录格式使用手册》编目例析中国机读目录格式使用手册是图书馆事业的一个重要组成部分,它对
于图书馆中的图书、期刊、报纸等各类文献资源进行编目有着关键性的作用。

本文将对《中国机读目录格式使用手册》进行编目例析,以帮助读者
更好地理解和使用该手册。

首先,我们来看一下手册中对于图书的编目规则和示例。

在编目图书时,按照一定的格式填写各个字段,例如书名、责任者、ISBN号等。

同时,还需要进行主题标注,即采用主题词或者具体的分类号对图书进行标注。

除了图书之外,手册还包含了其他类型文献资源的编目规则和示例,
例如期刊、报纸、音像资料等。

对于期刊的编目,需要填写期刊名、责任者、出版地、出版社、出版日期等字段,同时还需要标注主题词和分类号。

对于报纸的编目,需要填写报纸名、责任者、出版地、出版社、出版日期
等字段,并标注主题词。

以上只是《中国机读目录格式使用手册》中的一些编目规则和示例,
该手册还包含了更多详细的内容,涵盖了各种文献资源的编目要求。

对于
图书馆编目人员来说,熟练掌握这些规则和示例,能够帮助他们高效、准
确地进行编目工作。

总结起来,《中国机读目录格式使用手册》是一本用于规范图书馆编
目工作的重要参考工具,其中包含了各类文献资源的编目规则和示例。


过学习和熟练掌握该手册,图书馆编目人员可以更好地进行编目工作,提
高文献资源的检索效率和服务质量。

中国机读目录格式(图书馆专用)

中国机读目录格式(图书馆专用)

• 定长子字段:长度固定的子字段。它可包含 一个或多个数据元素。可用于定长字段,如 100字段中的$a子字段。也可用于变长字段, 如200字段的$z子字段。 • 层次等级:分配给主书目实体的一个数值。 该数值标识主实体在一个预先确定的层次等 级结构中所处的位置。如多卷集各卷的目录 描述和多卷集整体的目录描述,可看作是一 个属于另一个的两个不同层次等级。层次等 级仅仅在整体及其各独立部分均已生成书目 记录的情况下才可以使用。
3功能模块简介
• 3.1 0—标识块 • 本块用来标识记录或标识出版物实体上的 号码。如 • 010 国际标准书号 • 子字段标识符 子字段内容 • $a ISBN • $b 限定 • $d 获得方式和/或价格
• 例: • 010 ##$a7-118-00249-1$b精装$dCNY55.00 • 010 ##$a7-81023-606-7$dCNY6.80(上册); • CNY9.80(下册)
• 1.2关于格式内容扩充的说明 • 格式结构将保持稳定,今后机读格式的变化 仅限于追加有限的字段、子字段和代码,为 了使我国的机读目录在国际范围内具有良好 的可交换性,编制格式的主要依据是国际图 联的UNIMARC以及我国出版物的一些特殊 情况和规则的新变化。
• 1.3定义 • 检索点:用于检索书目记录的名称,词语和 代码。 • 数据元素:被明确标识的最小信息单元。在 可变长字段中,数据元素构成子字段,用子 字段标识符标识。 • 字段:由字段标识符标识的被定义的特定字 符串,可包含一个或多个子字段。 • 字段分隔符:位于每一个可变长字段末尾的 控制符,用来区分每一个相邻的字段。此外, 还用于地址目次区的末尾。
• 数据字段区:将有关文献的数据按功能块, 字段,子字段或数据元素这三个层次组织起 来。层次级别为:子字段构成字段,字段构 成功能块。《格式》的数据字段区设置了 0——标识块 1——编码信息块 2——著录 信息块 3——附注块 4——款目连接块 5— —相关题名块 6——主题分析块 7——知识 责任块 8——国际使用块 9——国内使用块 十个功能块。 • 记录分隔符:至于每条机读记录的末尾,用 来区分记录的控制字符。

中文机读目录格式

中文机读目录格式
中文图书机读目录格式
采编部 刘勤
什么是MARC? 什么是 MARC是Machine Readable Catalogue的 是 的 英文缩写形式,即机器可读目录。 英文缩写形式,即机器可读目录。MARC格式 格式 即机器可读目录格式。 即机器可读目录格式。MARC是计算机编目的 是计算机编目的 产品。 产品。它是以代码形式和特定格式结构记录在 计算机存贮载体上, 计算机存贮载体上,能够被计算机识别并编辑 输出书目信息的目录形式。 输出书目信息的目录形式。
205 版本说明 本字段包含文献的版本说明、 本字段包含文献的版本说明、附加版本说明以及 与该版本有关的责任说明。 与该版本有关的责任说明。 例:200 1#@a最新英汉双解辞典 最新英汉双解辞典 205 ##@a2版@b修订本 朱建成等修订 修订本@f朱建成等修订 版 修订本 影印本处理:(外文图书影印本,按中文图书著录) :(外文图书影印本 影印本处理:(外文图书影印本,按中文图书著录) 2---字段中 字段中205字段需注明“影印本” 字段需注明“ 字段中 字段需注明 影印本” 3---字段中著录说明 字段中著录说明 305字段:……………授权出版 字段: 字段 授权出版 306字段:……………合作出版 字段: 字段 合作出版
210 出版发行等 @a出版、发行地 出版、 出版 @c出版、发行者名称 出版、 出版 @d出版、发行时间 出版、 出版 北京@c中国科学技术出版社 例:@a北京 中国科学技术出版社 北京 中国科学技术出版社@d2006
215 载体形态项 本字段包含文献载体形态特征方面的信息。 本字段包含文献载体形态特征方面的信息。 @a特定文献类型标识和文献数量 特定文献类型标识和文献数量 @c其他形态细节 其他形态细节 @d尺寸 尺寸 @e附件 附件 例:215 ## @a2册(240,132页)@c图@d26cm@e光 册 , 页 图 光 盘1片 片 * 尺寸单位(厘米)著录应小写,不大写 尺寸单位(厘米)著录应小写, * 附件中有光盘应著录为“光盘 片”,不用“光盘 附件中有光盘应著录为“光盘1片 不用“光盘1 张”

《信息组织》复习要点

《信息组织》复习要点

第一章一、名词解释1、文献:是用一定的技术手段把一定的信息内容记录到一定载体上形成的存储型传递媒体。

2、著录:对表示文献内容、外表形式和物质形态的特征进行分析、选择和记录的过程。

标引:指在分析文献内容和情报提问的基础上,用某种索引语言或标志符号把文献的主题概念及其他有检索意义的特征标示出来,作为情报存储和检索依据的处理过程。

按照索引语言或标示符号的类型,可分为分类标引,主题标引和非主题标引。

3、款目:依据一定的方法,对表示文献内容,外表形式和物质形态的特征所做出的记录。

4、信息组织的必要性即为什么要学习信息组织?a.知识和信息的海量新和无限性与人的精力和时间的有限性形成了尖锐的矛盾;b.知识和信息的无序性和污染性与人类使用的选择性也形成了尖锐的矛盾;c.越来越多的人意识到,“原始信息本身并不能产生价值” ,只有对信息资源采用相应的方法加以控制和处理才能使人们实现对其合理开发和有效利用,而信息组织则是解决这一问题的根本方法和关键措施之一;d.深入研究与解决关于信息组织的系列问题是十分必要的。

5、信息组织(信息序化或信息整理):利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。

6、信息组织的基本专业要求是?a.信息内容有序化;b.信息流向明确化;c.信息流速适度化。

7、耗散结构论是比利时学者普里高津提出来的;协同论是德国物理学教授海尔曼. 哈肯提出来的。

知识理论——H.E. 布里斯提出来的。

知识组织可分为主观知识的组织和客观知识组织两种类型。

8、专指度:是指我们在信息揭示的主题标引中对信息中各个主题的内容和方面的展示过程。

9、按照信息组织的组织对象把信息组织分为信息资源组织和检索工具;依据信息组资源的注意内容,主要分为分类法和主题法。

第二章1、七分法是我国出现最早的一部图书分类体系,始创于汉代的《七略》,后现于南朝的《七志》和梁朝的《七录》。

机读目录概述

机读目录概述

中国机读目录的研制过程
1975年刘国均发表的《马尔克计划简 介——兼论图书馆引进电子计算机问题》 揭开了我国计算机编目和机读目录研制 工作序幕。
1979年北京图书馆等单位组成“北京地 区机读目录研制协作组”,开始研究 LCMARC磁带。1980年我国正式颁布了 国家标准字符集。
中国机读目录的研制过程
MARC21
1994年12月起,美、加、不列颠图书馆 开始推动USMARC、CANMARC、 UKMARC三者的机读编目格式整合计 划,但最后的成果MARC21(1999年) 是CANMARC和USMARC的之间的合 作与发展。
MARC21是一套响应网络时代而产生的 一种通用的开放的资料格式。
二、地址目次区
目次区紧接在头标区之后,含有一个/ 多个目次款目。每个目次长12个字 符,包括三位数字字段号、四位数 字数据字段长度和五位数字字段起 始符位置。描述中由计算机自动生 成。
三、数据字段区
目次区之后为数据字段区,由若干 个定长和变长字段构成,每个字段 之间由字段分隔符隔开。
数据字段区所含数据有两种形式。
MARC21
MARC21基本上发展成为五大部分: 1. 书目数据MARC21 2. 规范数据MARC21 3. 分类数据MARC21 4. 馆藏数据MARC21 5. 团体信息MARC21
MARC21
MARC21在原有基础上增加了538 字段(系统需求和存取注释)、516 字段(计算机文件类型或数据注 释)、256字段(计算机文件特征) 以及856字段(电子地址和存取)等 字段。
1982年,《文献目录信息交换用磁带格式》 (GB2901-82),主要参考了ISO2709-81。
1986年,UNIMARC2版中文译本问世,北 京图书馆等单位据此编写了CNMARC讨论 稿,1989年得到认定。

机读目录概述

机读目录概述
• 依据《 UNIMARC 手册》制定 依据《 手册》 • 结合中国汉字的特殊性,增设了一些必须字段、子字段 结合中国汉字的特殊性,增设了一些必须字段、 • 格式一体化
机读目录格式简介
机读目录框架结构
–《文献工作——文献目录信息交换用磁带格式》 《文献工作 文献目录信息交换用磁带格式》 文献目录信息交换用磁带格式 ISO2709) (ISO2709)
机 读 目 录 概 述
信息管理教研室 田梅
主要内容
第一节 机读目录格式简介 第二节 计算机编目流程 第三节 计算机编目与手工编目的分析比较
第一节 机读目录格式简介
计算机编目
– (Computerized Cataloging)是一种现代化的编目方法,将书目 Cataloging)是一种现代化的编目方法, 信息输入到计算机中,在程序的自动控制下处理书目数据, 信息输入到计算机中,在程序的自动控制下处理书目数据,生成 目录产品的过程。 目录产品的过程。
• UNIMARC的特点 UNIMARC的特点
–将不同文种、不同载体的文献的机读目录实行格式一体化 将不同文种、 将不同文种 –设置了连接款目块 设置了连接款目块
机读目录格式简介
21格式 格式》 简称MARC 三、《MARC 21格式》(简称MARC 21 )
–美国、加拿大图书馆协会共同推出,1999-2000出版 美国、加拿大图书馆协会共同推出,1999-2000出版 美国
• USMARC格式一体化 USMARC格式一体化 • 减少USMARC与CANMARC的差别 减少USMARC与CANMARC的差别 USMARC
–2001年8月,英国宣布采用MARC 21 格式 2001年 2001 英国宣布采用MARC –五大部分 五大部分

机读目录格式

机读目录格式

图书、期刊及光盘的著录方法一、中文图书(一)著录原则按照《普通图书著录规则》(GB3792.2-85)(二)著录内容(1) 001字段(控制记录)010******* 系统可自动生成(2) 010字段@a:ISBN号@b:装订形式(平装可省) @d:CNY:单价(人民币)(3) 100字段处理数据项自动生成。

(4) 101字段作品语种项一般只要求@正文语种项。

(5) 102字段出版国别项@a出版国代码,$b出版地区代码。

(6) 105字段编码数据项一般由系统格式所定。

(7) 106字段形态特征项@a物理形式标识。

常用"r",一般印刷品。

(8) 200字段题名责任项@a:正题名@d:并列正题名@e副题名@f第一责任者@g其它责任者@h分册(辑)号@i分册(辑)名@v卷册号标识。

(9) 205字段版本项@a版次说明(第一可省略)。

(10) 210字段出版发行项@a出版发行地@c出版发行者名称@d出版发行日期。

(11) 215字段载体形态项@a页数或卷册数@c图表及其它细节@d尺寸或开本。

(12) 225字段丛编项@a正丛编题名@f丛编责任者@v卷标识。

(13) 300字段一般附注项除已有专门附注字段以外的信息,均入此字段,@a附注内容,例:@高等学校教材(14) 303字段著录附注项@a(15) 304字段题名附注项@a本书主编为:××、×××;副主编为:××、×××。

(16) 314字段责任附注项即对著者的说明。

@a张山[1996-],博士,四川农业大学动物医学教授(17) 330字段摘要文摘项即对全书的内容做一概述。

@a本书主要介绍了......(18) 461字段丛编主要用来连接图书所属的丛编的有关信息。

(19) 510字段并列题名项@a(20) 517字段其他题名项@a(21) 606字段普通主题项@a主标目@x主题复分@y地区复分@z年代复分。

《信息组织》复习(简版)

《信息组织》复习(简版)
索引
索引是以文献或文献集合中包括的信息内容为其揭示单元的工具,包括期刊索引、书后索引等。
情报检索语言
情报检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称情报检索语言。检索语言由词汇和语法两部分组成。词汇是检索语言的主体,是各种词表,包括分类表或标题表、叙词表等;语法,则是分类标引和主题标引的规则系统,它们规定词汇集的使用方法
(重点)2.主题标引和分类标引的相同点和不同点。
主题标引和分类标引的相同点:1.揭示的对象相同。2.依据的数据来源相同。3.操作程序相同。4.基本处理方法相同。
主题标引和分类标引的不同点:1.主题分析的角度不同。2.转换途径不同。3.标识不同。4.揭示的特点不同。
3.主题标引的基本方式:整体标引、全面标引、对口标引、综合标引、分类标引。
检全率、检准率
检全率,指通过检索系统检出的与某一检索提问相关的文献数与检索系统中与该提问相关文献总数之比。
检准率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出
6、述,亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
7、元数据:元数据即描述数据的数据,对数据及信息资源的描述性信息
分类索书号:又称分类排架号,是表示一文献在分类收藏中位置的号码。
2.分类标引的基本要求:准确、充分、一致、适用。
4.分类标引工作的程序,以及在这些分类步骤中应注意的问题。
分类标引工作的程序:查重—主题分析—归类—给号—审核。
查重:检查是否为已标引,避免重复。依据:书名目录进行。联机情况下,使用联机目录工具。
文本检索:不标引,直接用计算机,通过自然语言,对信息资源进行检索的方式。

中国机读目录格式介绍

中国机读目录格式介绍

中国机读目录格式介绍中国机读目录格式是一种被广泛应用于图书馆和文献中心的目录编制规范,用于对书籍、文献、期刊和其他资料进行描述和索引。

机读目录的主要目的是使读者能够通过计算机检索和获取所需文献或资源,提高信息检索效率。

下面将详细介绍中国机读目录格式。

一、机读目录的结构1. 主标识符(Main Entry):即目录的主要标识符,一般是书名、文献标题或期刊名称。

主标识符可以根据不同的目录编制规则进行格式化,例如《图书分类法》、《中图法》等。

3. 附注(Note):包括目录的附加信息和解释,例如版本信息、出版商信息、目录述评等。

4. 主题词(Subject Heading):采用图书馆的主题词汇表对目录进行主题索引,以方便用户检索。

二、机读目录的元素1. 主标识符元素(Main Entry Element):包括主标识符类型、主标识符内容和主标识符辅助信息。

主标识符类型可以是书名、文献标题、期刊名称等,主标识符内容是具体的书名或标题,主标识符辅助信息包括出版年份、出版地等。

3. 附注元素(Note Element):主要包括附注内容和附注类型,附注内容是目录的附加信息,附注类型可以是版本信息、出版商信息、目录述评等。

4. 主题词元素(Subject Heading Element):包括主题词类型和主题词内容。

主题词类型是指采用的主题词汇表,主题词内容是具体的主题词。

三、机读目录的编写和应用中国机读目录格式的编写和应用可通过专门的目录编写软件来实现,例如“图书馆国家联网工程”采用的“图书目录分析处理系统(AMIS)”。

这种软件支持目录编写人员进行目录的格式化和输入,同时也支持系统用户进行检索和查询。

机读目录的应用可以通过网络或图书馆内部检索系统进行,用户可以根据主标识符、个别标识符或主题词等进行检索,从而找到所需的文献或资源。

机读目录的应用大大提高了文献检索的效率和准确性,对于学术研究、教育教学和知识传播具有重要意义。

中国机读目录格式使用手册

中国机读目录格式使用手册

中国机读目录格式使用手册1.1目的和范围格式是用于中国国家书目机构同其他国家书目机构以及中国国内图书馆与情报部门之间,以标准的计算机可读形式交换书目信息。

格式在数据规范方面为书目数据库的建立和书目数据处理提供参考或依据。

格式对专著、连续出版物、测绘资料、乐谱、声像等类的机读形式的书目记录,规定了字段标识符指示符和子字段代码,以及书目记录的内容标识在各种载体上的逻辑的和物理的格式。

1.2关于格式内容扩充的说明格式结构将保持稳定,今后机读格式的变化仅限于追加有限的字段、子字段和代码,为了使我国的机读目录在国际范围内具有良好的可交换性,编制格式的主要依据是国际图联的UNIMARC以及我国出版物的一些特殊情况和规则的新变化。

1.3定义检索点:用于检索书目记录的名称,词语和代码。

数据元素:被明确标识的最小信息单元。

在可变长字段中,数据元素构成子字段,用子字段标识符标识。

字段:由字段标识符标识的被定义的特定字符串,可包含一个或多个子字段。

字段分隔符:位于每一个可变长字段末尾的控制符,用来区分每一个相邻的字段。

此外,还用于地址目次区的末尾。

定长子字段:长度固定的子字段。

它可包含一个或多个数据元素。

可用于定长字段,如100字段中的$a子字段。

也可用于变长字段,如200字段的$z子字段。

层次等级:分配给主书目实体的一个数值。

该数值标识主实体在一个预先确定的层次等级结构中所处的位置。

如多卷集各卷的目录描述和多卷集整体的目录描述,可看作是一个属于另一个的两个不同层次等级。

层次等级仅仅在整体及其各独立部分均已生成书目记录的情况下才可以使用。

子字段:字段内所定义的数据单位。

变长字段:长度可变的字段。

可包含一个或多个数据元素或子字段。

其长度包括文字数据,字段指示符,子字段标识符及字段分割符。

2.格式结构2.1结构它对每一个用于交换的书目记录规定了必须遵循的标准记录结构。

其标准构成为:记录头标:位于一条机读记录的开端,记载了该记录的有关参数。

一机读目录格式(MARC)

一机读目录格式(MARC)

二.字符集
1. GB2312-80《信息交换用汉字编码字符集· 基本集》 2. GBK字符集 3. GB18030-2000《信息技术和信息交换用字编码字 符集、基本集的扩充》 4. ISO 10646 level3(Unicode)
三.电子资源的著录方式
(一) 定义: (二) 类型: 基本著录 多层次著录(综合著录、分散著录、单册 分析著录) (三) 具体方法:
2.大江东去
(二)伊丽莎白。泰勒电影系列 13.劫后英雄传
14.玉女神驹。。。
六.4**连接字段
1. 无总题名合订书
记录1 (第一个合订著作记录) 200 1#$舌华录$f(明)曹臣编纂$c宋琐语$f(清)郝懿行编 纂$g喻岳衡点校 210 ##$a长沙$c岳麓书社$d1985 记录2(第二个合订著作记录) 200 1#$a宋琐语$f(清)郝懿行编纂$g喻岳衡点校 423 #0$12001#$a舌华录$1701#0$c(明)$a曹臣(用423连 接第一个合订著作记录)
例3
四.题名
3. 题名的结构:正题名 + 其它题名信息
例4 黄梅戏唱腔精选 1949-1999 (正题名) (内容限定)
例5
气体动力学基本原理 (共同题名) C编 (分卷标识) 非定常气体动力学的一维处理 (分卷册题名) 新世纪人生宝典 老年卷 (共同题名) (从属题名)
例6
四.题名
3. 题名的结构:正题名 + 其它题名信息
一.机读目录格式(MARC)
1.机读目录格式的发展
国际: UNIMARC—Universal Machine-Readable Cataloging Format CCF—Common Communication Format UNIMARC: 1977 UNIMARC—Universal MARC Format 1980 UNIMARC—Universal MARC Format 1983 UNIMARC Handbook 1987 UNIMARC Manual 1994 UNIMARC Manual 至今已更新3次。 中国:1987 中国机读目录格式(CNMARC), 1991年国家图书馆正式向全国发 行CNMARC记录 1996 成为文化行业标准(WH/T0503-96)。 1996 中国机读规范格式 1997 年国家图书馆正式向全国发行中文规范 记录 2002 成为文化行业标准(WH/T15-2002)。

3-机读目录格式

3-机读目录格式
机读目录格式
MARC Format
机读目录格式
是各国文献机构自动化系统之间传输和交换机 读目录数据时共同遵循和使用的标准记录格式, 又称机读目录交换格式。 它规定书目数据在机读介质上的表示和标识方 法,包括机读记录的构成、各数据字段在机读 介质上的总体安排及其内容结构。
2020/5/27
机读目录格式的类型
2020/5/27
机读目录样例
Байду номын сангаас
卡片目录样例
学习要求与思考题
什么是记录头标?记录头标由哪些数 据元素构成? 数据字段区包括哪两类字段?各起什 么作用? 熟悉内容标识符的类型及各自的作用。
2020/5/27
THANK YOU!
举例
子字段标识符
数据元素
子字段
@a药物动力学参数手册 @Ayao wu dong li xue can shu shou ce @f田 文艺编@Ftian wen yi bian
2020/5/27
字段
人事信息数据
字段
记录
2020/5/27
姓名 张三 李四 王五 ……
工号 31001 31002 31003
字段标识符
2020/5/27
字段长度
字段起始位置
数据字段区(fields)
控制字段(Control fields)是提供系统 的控制号和表示文献特征的各种代码化 数据的字段。所有控制字段均不设指示 符和子字段,其字段标识符的前两位都 为“0”,即从001-009。
2020/5/27
数据字段区(fields)(续)
由两个字符组成,用以识别可
@a
变长字段中的不同子字段。第一

个字符为子字段分隔符,用“@”

第7章 中国机读目录格式

第7章 中国机读目录格式

二、数据字段区的标识系统
1 . 内容标识符 何谓内容标识符(Content designetor ) ? 它 是指用于识别数据元素, 或提供有关数据元素 的附加信息的符号或编码, 是字段标识符、字 段指示符以及子字段标识符的总称。人们通 常将“内容标识符”简称为“标识符”。内 容标识符位于数据前, 标志数据开始。
一、编制书目记录的基本原理
1 . 字段、子字段的记录顺序 在机读目录的书目记录中, 字段、子字段的顺 序与卡片目录中款目的著录项目的顺序息息 相关。
而机读编目则是在手工编目的基础上, 增加了 一个MARC 格式。
【例】题名与责任说明项:
百川书志/ (明)高儒著 .古今书刻/ (明)周宏祖 著 200 题名与责任说明字段: 200 1# $a 百川书志$f(明)高儒著$c 古今 书刻 $f( 明)周宏祖著
三、记录附加定义
记录附加定义由3 个字符构成, 其字符位为 17—19。各个字符位的定义分别为: 1.编目等级(字符位17) 编目等级是用一个字符代码表示机读记录的 完整程度, 说明是否依据受编文献编制机读记 录。因此, 要根据建立机读记录的具体情况选 用编目等级代码。
三、记录附加定义
# 完全级 表示依据受编文献本身建立的记录。 例: 00957nam2#2200289###450# ( 该例字 符位17“编目等级”的代码为“# ”, 表示该记 录是依据实物建立的。)
上例说明了两个问题。第一, 在机读记录中, 同一字 段内子字段的先后顺序是由文献编目条例的有关规 则决定的。第二, 在MARC 格式中某些字段或子字 段具有重复性。
2 . 部分字段与子字段的重复性
所谓重复性是指字段或子字段在同一记录或在同一 字段内可重复使用。

中国机读目录格式

中国机读目录格式
如: 215 载体形态项 : $d尺寸 ;$e 附件 ……
分隔符
字段分隔符
– 在每个可变长字段的结尾用以分隔字段的控制符号。 – 系统自动生成 – 文本格式中表现为“*”
记录分隔符
– 置于每条机读记录的结尾用来区分记录的控制字符。 – 系统自动生成 – 文本格式中表现为“%”
00699nam0#2200241###450# 0010010000000050017000100100028000271000041000551010008000961 0200150010410500180011910600060013720000570014321000310020021 5001600231300001900247330008500266606002700351606001300378690 001100391701003200402801002300434 00286159520051229161344.0 a7-5636-19682dCNY20.00 a20050221d2004 em y0chiy0110 ea0 achi aCNb370000 ay z 000yy ar1 a现代应用数学9xian dai ying yong shu xuef王才经编著 a东营c石油大学出版社d2004 a150页d26cm a 研究生系列教材 a本书讲解了非线性规划问题序列二次规划算法、分形及其 应用、小波变换及其应用等内容。0 a应用数学x研究生j教材0 a应用数 学 aO29v4 0a王才经9wang cai jing4编著 0aCNbMARCc20051230
字段
子字段
200 题名与责任者块
205 版本说明
$a ……
……
$c ……
215 载体形态项——
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

性别 男 女 男
出生年月 1965.3 1969.5 1974.2
描述员输入
记录长度 系统生成
2020/9/23
系统 固定
数据基地址 系统生成
数据元素
记录状态
占字符数 字符位置
1
5
记录类型
1
6



书目级别
1
7
码 层次等级代码
1
8

编目等级
1
17




著录格式
1
18

主要赋值
c d n o p
a c e f g j k l m
a m s c
# 0 1 2
# 1 2 3
完全级(依据原文献编目) 次级1(未依据原文献编目) 次级2(预编记录) 次级3(未达到完全级)
完全采用ISBD格式 部分采用ISBD格式 未采用ISBD格式
地址目次区(Directory)
地址目次区是一条记录内所有数据字段 的索引,它由一系列固定长目次项组成。 每个目次项固定为12个字符长,包括相 应字段的字段标识符、字段长度和字段 起始字符位置。
数据字段(Data fields)是记录文献目 录信息的字段。 这部分基本上是可变长字段,详细描述 文献特征。
2020/9/23
数据字段区内容
数 据字段 区
记地
录址 0 1 2 3 4 5 6 7 8
头目 标 代 著 附 款 相 主 知 国
标 区
次 区
识 块
码 信 息
录 信 息
注 块
目 连 接
关 题 名
# I n
含义
修改过的记录 删除的记录 新记录 已有较高层次的记录 曾为不完整的预编记录
文字资料印刷品 乐谱印刷品 测绘资料印刷品 测绘资料手稿 放映和视频资料 音乐性录音资料 维图形(图画 计算机存贮介质 多媒体
分析性资料(组成部分) 专著、单卷文献 连续出版物 成套的著作集
层次关系未定 无层次关系(单卷书) 高层次记录(丛书) 低层次记录(丛书的子书)
机读目录格式
MARC Format
机读目录格式
是各国文献机构自动化系统之间传输和交换机 读目录数据时共同遵循和使用的标准记录格式, 又称机读目录交换格式。 它规定书目数据在机读介质上的表示和标识方 法,包括机读记录的构成、各数据字段在机读 介质上的总体安排及其内容结构。
2020/9/23
Hale Waihona Puke 机读目录格式的类型字段 标识符
200
字段 指示符
第一 0:题名无意义 1:题名有意义
第二 未定义
字段
子字段
子字段标识符
数据元素
@a
正题名
@i
分辑题名
数据元素(Data Element)
字段 分隔符
MARC记录中被明确标识的最小信息单元。在可变长数 据字段内,数据元素组成一个个子字段;在头标、目次区 和定长字段内,数据元素是按字符位置定义的数字或字母 代码。
字段标识符
2020/9/23
字段长度
字段起始位置
数据字段区(fields)
控制字段(Control fields)是提供系统 的控制号和表示文献特征的各种代码化 数据的字段。所有控制字段均不设指示 符和子字段,其字段标识符的前两位都 为“0”,即从001-009。
2020/9/23
数据字段区(fields)(续)
举例
子字段标识符
数据元素
子字段
@a药物动力学参数手册 @Ayao wu dong li xue can shu shou ce @f田 文艺编@Ftian wen yi bian
2020/9/23
字段
人事信息数据
字段
记录
2020/9/23
姓名 张三 李四 王五 ……
工号 31001 31002 31003
国家通讯格式
澳大利亚(ANBIMARC)、加拿大(CANMARC)、法国 (MONOCLE)、联邦德国(MABI)、印度(NISSAT)、 日本(Japan MARC)、英国(UKMARC)、美国 (USMARC)、中国(CNMARC)。
地区通讯格式
经互会国家(MEKOF-2)、法语国家(INTERMARC)、 拉丁美洲(MARCAL)、欧洲理事会(EUDISED)。
题 分 析
识 责 任
际 使 用
块块
块块块块 块

9录
国分
内隔
使 用


数据字段区是若干个数据字段的 集合,它将有关文献信息的数据按 功能块以字段、子字段及数据元素 这三个层次组织起来。
数据字段区
功能块 功能块 ……… ……… 功能块 字段 字段 ……… ……… 字段
子字段 子字段 ……… ……… 子字段 数据元素 数据元素 ……… ……… 数据元素
2020/9/23
目次区
可变长字段
目次项1 共12位字符
目次项2 目次项3
… 目次项n 字段分隔符
字段标识符 3位字符 数据字段长度 4位字符 起始字符位置 5位字符
同上 同上
1位字符
目次项
目次区每个项目描述一个字段,有多少个字 段,就有多少个目次项: 001001200000003000300012005001400015
字符数 5 1 4 1 1 5 3 4
字符位置 0-4 5 6-9 10 11
12-16 17-19 20-23
填写内容 计算机自动生成 新书选“n” 印本图书选m##
2 2 计算机自动生成 ### 450#
00957nam##2200289###450#
记录头标
00957nam##2200289###450#
简称头标,位于每条机读记录的开端,它 包含ISO-2709规定的对记录进行处理时所 需的通用信息。 整个头标固定为24个字符,由8个固定长数 据元素组成。头标区无字段号、指示符和 子字段。
2020/9/23
数据元素名称 记录长度 记录状态 执行代码 字段指示符长度 子字段标识符长度 数据基地址 记录附加定义 地址目次项结构
国际通讯格式
UNIMARC、CCF。
2020/9/23
机读目录格式结构
记录头标区
地址目次区
目次项1 字字起 段段始 标长位 识度置
目次项2
固定长
固定长
数据字段区 分隔符 控 数 字记 制 据 段录 字 字 分分 段 段 隔隔
符符
固定长 可变长
可变长
2020/9/23
记录头标区(Record Leader)
字段
字段 字段
子字段
标识符 指示符 子字段标识符
数据元素
字段(Field)
字段 分隔符
在MARC记录中,字段是由字段标识符标识 的被定义的字符串。
字段包括字段标识符、字段指示符、子字段 和字段分隔符。
字段
字段 字段
子字段
标识符 指示符 子字段标识符
数据元素
子字段(Subfield)
字段 分隔符
子字段是字段内明确定义的最小数据单元。 由子字段标识符和数据元素组成。
相关文档
最新文档