第二讲 CNMARC格式详解

合集下载

中国机读目录格式详解

中国机读目录格式(CNMARC)【记录头标】记录头标是按照ISO 2709的规定设立的。

它包括处理记录时可能需要的有关记录的一般性信息。

整个头标区固定为24个字符长，由固定长数据元素组成，这些数据元素通过字符位置来标识。

固定长数据一览表数据元素名称字符数字符位置(1)记录长度50-4(2)记录状态15(3)执行代码46-9(4)指示符长度110(5)子字段标识符长度111(6)数据基地址512-16(7)记录附加定义317-19(8)地址目次结构420-23(1)记录长度：………………………………头标区…………5个十进制数。

右边对齐，不足5个数字时用零补齐。

本域由软件产生，用户不能修改。

(2)记录状态：………………………………头标区…………代码：c＝修改过的记录d＝删除的记录n＝新记录o＝曾为较高层次记录p＝曾为不完整的预编记录(3)执行代码：………………………………头标区…………(a)记录类型，1字符代码：a＝印刷的文字资料b＝手稿性的文字资料(b)书目级别，1字符代码：m＝单行本─专著或多卷集。

s＝连续出版物─连续发行并趋向无限期连续发行的出版物。

a＝分析性资料─物理上包含在另一种资料里的一种资料，它是另一种资料的组成部分。

c＝汇编性著作─人为配套的著作集。

(c)层次等级代码，1字符：表示记录和其它记录有层次连接关系，说明在层次中的相对位置以及记录与同一文件中其它记录的从属关系。

代码：空格＝层次关系未定0＝无层次关系1＝最高层记录2＝低层次记录(在最高层以下的记录)(d)未定义，空格(4)指示符长度：………………………………头标区…………表示指示符长度的1位十进制数字，CN-MARC格式为2。

用户不可修改。

(5)子字段标识符长度：………………………………头标区…………表示子字段标识符长度的1位十进制数字，CN-MARC格式为2。

用户不可修改。

(6)数据基地址：………………………………头标区…………占5个字符位，用十进制数表示。

影像资料的CNMARC著录格式

【ｅｏｄ】ｉｄｖｅｄｔ；ＮＲ；ｅｃｐｉＫｙｗｒｓＦｍａｄｔａＣＭＡＣＤｓｉｏｌｎｉｌａｒｔｎ
影像资料是通过电、、光磁等各种技术手段记录原始声音和图像信息的一种新型信息载体。影像资料主要指电影片与录像资料，包括完整的电影片、录像带、视盘等。影像资料的类有循环录像带、盒式录像带、开盘录像带及视柱等各种录像制
录、影视宣传资料等，所以从相应字段必须描述的影像资料内容特征中确定取舍，并从有关反映出影像
资料的原始属性、形态特征中知晓并读｝没备的类Ｊ
开及功能，些还需通过出现在题名屏幕、ＩＪ有片头、片
史献资料编目是图书馆的一项重要基础业务，编目包括著录和主题标引两部分工作。在著录的过程ｌ，ｆ提供对资源的题名、１责任者、出版情况、载体形
Hale Waihona Puke ２６－６新０＃ｇ￣世纪图书０馆— —回
维普资讯
邂镰懿一＿｜＿ｌ。
１影像资料的标引较为困难－３主题标引和分类标引的标准化和规范化是文献资源能被充分利用的基础。在现代科技日益发展，学科日趋细分的今天，分类越细，专指性越强，揭示文献的内容更加准确。ＣＬＳＡＩ主题标引总规则也规定：文献的标引方式，一般采取概括性的整体标引和重点性的分析标引相结合的原则，根据文献内容和渎者需求，进行适度标引。影像文献资料的发展很快，数量不断增加，主题也在不断发展和变化。为了确保影像资料文献使用的主题词规范、，准确应尽量使用《中国分类主题词表》数据和￥电影档案编码数据。ｂ￥一般编码数据有则必备，ａ不可重复。定长，０２

CNMARC格式中非控主题词的标引规则

而录的主题词是根据文献主题内容选取的关键词．也不宜拆分开来。应以词组和科技术语作为非控词。信不信与高称非控词或自由词，指词表中未收录，对揭示、例如 “ 息高速公路 ” 宜拆为 “ 息 ” “ 速公是但．资不宜拆为“ 源 ” “ 资与共享 ” 。识别和检索文献起关键性作用的名词术语。非控词路 ”“ 源共享 ” 标引是为了弥补受控的主题语言表达新概念滞后和１复合词组的分拆。５复合概念非控词的保留或分拆应以是否有利于专指度低的缺点而采取的一种辅助标引的方法。“ 辅助标引 ”决定了它既不能采用受控语言严格的词汇对叙词标引的补充标引为前提条件。．１５控制方法。不能像关键词那样无任何约束。通过多１．一个复合概念非控词虽然可以用两个或两个又年的标引实践．我们认为应在选词原则和标引规则
法、语控制、引规则以及应注意的问题进行了讨论。词标
中图分类号：２４３４Ｇ５．６
文献标识码：Ｂ
文章编号：０３１８（０６０ — ０１０１０— ５８２０）３０８— ３
．中国机读目录格式（ＮＭＡＣ中的 “ １ ” 段１４选择词组和科技术语为非控词ＣＲ）６０字固定搭配且具有特定含义的词组和科技术语，就是专门为标引“ 非控主题词 ” 而设置的。该字段记

CNMARC格式著录标准和规则

CNMARC格式著录标准和规则
苏州大学图书馆顾蔷芬
一. CNMARC机读记录结构
• 记录头标区，由24位字符组成，由定长数据元素构成，包含记录处理所需数据 • 地址目次区，由若干个目次项和一个字段分隔符组成。每个目次项由三个数字的字段号、四个数字的字段长度和五个数字的起始字符位置构成 • 数据字段区，由若干固定长和可变长字段构成 • 记录分隔符
例1：2001#$a80386/80468原理$f俞利著例2：2001#$a眺望珍珠港$e美日从合作走向战争的历史透视$d=#A historical perspective of pearl harbor attack$f刘笑盈著$zeng 例3：2001#$a凝聚态物理学$h上卷 $f冯端，金国钧编著
• 例:
出版日期类型
d
出版年一
2000
出版年二
####
• 某一图书是 2000年第1版 • 某一图书是 1997年第1版 2001年第2版式 • 某一图书是 2000年第1版 2001年重印
d
2001
1997
d
2000
3.1 100 通用处理数据（一般处理数据）
• 例:
出版日期类型出版年一出版年二
3. 1-- 编码信息块
3.1 100 通用处理数据（必备字段，不可重复）
• • • • • • ①字符位置0-7：入档日期 ②字符位置8：出版日期类型 “d”表示一次或一年出全的专著 “e”表示复制图书 ③字符位置9-12：出版年一 ④字符位置13-16：出版年二
3.1 100 通用处理数据（一般处理数据）
• 例6：010##$a7-80137-390-1 • $dCNY28.00(含光盘) • 010##$a7-80021-047-1$b光盘 • 或 010##$a7-80137-390-1 • $dCNY28.00(含光盘) • 016##$a9-…………….$b光盘

新修家谱的CNMARC格式著录和标引

谱保存于一些图书馆、档案馆、方志办等。浙江图书
择版心、书签（或书衣）、书名页、卷端、谱序等各处题名中所含信息量较大的，能正确反映谱主的居地、姓氏、本次纂修次数的著录，如有卷数则标明卷数。纂
２０１３年２月
ＦＥＢ．２０ｆｏｒｍａｔｉｏｎＲｅｓｅａｒｃｈ
第２期（总１８４期）
Ｎｏ．２（ＳｅｉｒｌａＮｏ．１８４）
新修家谱的ＣＮＭＡＲＣ格式著录和标引
完备，体现了家谱文献的特点。谱籍通常由省（直辖
市）和县（市）组成，加方括号置于书名前的。正书名
的热潮仍在持续，新修家谱仍在不断诞生。家谱的收藏原来仅限于家族内收藏．在家谱目录编纂工作的推动下．现在各家谱委员会或编修个人会把新修家
馆每年都会收到各地编修的家谱。图书馆如何来编制新修家谱的馆藏数据尽快提供给读者利用呢？目
前各图书馆仍以ＭＡＲＣ描述书目数据，因此笔者参
照《总目》的著录项目，结合新修家谱的文献特征，谈谈新修家谱的ＣＮＭＡＲＣ格式著录和标引。１《总目》条目的著录项目和规则在《总目》的“ 凡例” 中提到：本书条目著录项目
要的补充说明，如书名的来源、家谱的残存情况、纂修次数等。内容提要主要是对始祖、始迁祖、迁徙源

CNMARC格式及数据著录

中文图书编目系列讲义之一CNMARC格式及数据著录前言图书目录是反映馆藏、指导阅读、检索图书的工具。

它记录图书的书名、作者、出版、内容与收藏等情况。

按形式分有：卡片目录、书本式目录和机读目录。

随着现代科学技术的发展，计算机在图书馆的广泛应用，编制机读目录已成为现代图书馆一项新的、重要的业务工作，它是实现图书馆工作自动化的基础。

MARC（即Machine readable catalogue的英文缩写）就是机读目录，也称机器可读目录，是计算机编目的产品。

它是以代码形式和特定格式结构记录在计算机存储载体上，能够被计算机识别并编辑输出文献信息的目录形式。

凡遵循ISBD（国际标准书目著录）标准、以ISO2709格式存储的MARC数据，能够被标准的图书馆自动化系统所采用，就能实现网络环境下文献书目信息资源的共建、共知、共享。

图书编目既需要具备一定的专业技术知识，又需要花费大量的人力和时间。

在信息时代的今天，各图书馆为了加快新书上架速度，满足广大读者对文献知识信息的需求，提高读者服务工作的质量和水平，又能减员增效，越来越强烈地要求图书经销商提供MARC数据。

出版社、图书经销商具有得天独厚的掌握图书资源的条件，能以最快的速度、以最准确的方式为我们的客户--图书馆提供MARC数据, 这种横向书目资源的整合，能在最大程度上满足广大读者对图书信息的急切需求，这是我们在激烈的图书市场竞争中不可懈怠的任务和责任。

拥有丰富的、有一定学科文献覆盖面的书目信息，也使得各图书馆可以方便地对图书进行多途径查重及进行选购，极大地提高图书的采购效率和图书利用率。

目次简介MARC及MARC格式一、MARC记录结构1、记录头标2、目次区（略）3、数据字段区二、CNMARC数据字段著录0XX 标识块（001、010字段）1XX 编码信息块（100、101、102、105、106字段）2XX 著录信息块（200、205、210、215、225字段）3XX 附注块（300、304、305、306、311、312、314、324、327、393字段）4XX 连接款目块（410、423字段）5XX 相关题名块（500、510、512、513、516、517、518字段）6XX 主题分析块（600、601、602、604、605、606、607、610字段）7XX 知识责任块（701、702、711、712、730字段）8XX 国际使用块（801字段）9XX 国内使用块（本地使用块）（905字段）三、附录1、国内出版地代码2、文献类型（形式复分）常用主题词（6xx@j）3、CNMARC记录样例4、名词术语解释5、书目数据录入原则6、著录信息源MARC记录，简称记录。

CN-MARC格式各字段详解

CNMARC格式各字段详解010 国际标准书号（ISBN）本字段包含国际标准书号及其限定字样。

当记录含有多个ISBN时，该限定字样可将其区分开。

本字段对应ISBD的标准书号和获得方式。

即使没有ISBN ，本字段也可包含获得方式或定价。

本字段选择使用, 当有多个有效的ISBN数据时，可重复。

指示符指示符1:未定义, 填空格。

指示符2:未定义, 填空格。

子字段子字段标识符子字段内容注释$a ISBN 不重复$b 限定不重复$d 获得方式和/或定价不重复$z 错误的ISBN 可重复100 通用处理数据本字段包含用于记录任何媒体资料的固定长数据。

本字段必备, 不可重复。

指示符指示符1:未定义, 填空格。

指示符2:未定义, 填空格。

子字段$a 通用处理数据：该子字段中记载的全部数据是由字符位置标识的，字符位置从0-35记数。

所定义的字符位置必须呈现在该子字段中。

该子字段不可重复。

$a子字段固定长数据元素表数据元素名称字符数字符位置(1)记录生成时间(必备) 8 0-7(2)出版时间类型 1 8(3)出版年1 4 9-12(4)出版年2 4 13-16(5)阅读对象代码 3 17-19(6)政府出版物代码 1 20(7)修改记录时间(必备) 1 21(8)编目语种代码(必备) 3 22-24(9)音译代码 1 25(10)字符集(必备) 4 26-29(11)补充字符集 4 30-33(12)题名语系代码 2 34-35101 作品语种本字段包含作品实体的整体、部分和题名的语种代码，以及该作品为译作时，其原作的语言标识。

凡是有语言文字的作品均为必备字段, 不可重复。

指示符指示符1:翻译指示符，标示作品是否为译作或含译文0 原作语种1 作品为原作译本或非原作的中间语种的译本2 作品包含译文（文摘除外）指示符2:未定义, 填空格。

子字段子字段标识符子字段内容注释$a 正文、声道等语种可重复$b 中间语种（作品非译自原作）可重复$c 原作语种可重复$d 提要或文摘语种可重复$e 目次页语种（与正文语种不同时）可重复$f 与正文语种不同的题名页语种可重复$g 正题名语种（与正文或声道的第一语种不同）不重复$h 歌词等的语种可重复$i 附件语种可重复$j 字幕语种可重复102 出版或制作国别本字段包含著录实体的一个或多个出版或制作国的国别代码。

【信息组织】CNMARC数据描述法

再了解几个专业术语
“可重复”与“不重复”
“可重复”表示该字段或子字段可以在一条记录或一个字段中出现多次。 “不重复”表示该字段或子字段在一条记录或一个字段中只能出现一次。
“300 一般性附注”字段是可重复的其下设的子字段“＠a”是不可重复的。
应该：300 ＠a 中等卫生职业技术学校教材 300 ＠a 供乡村医生专用
010国际标准书号（ISBN）
010字段的子字段
＠a ISBN ＠b 限定说明＠d 获得方式和／或价格＠z 错误的ISBN
例1：010 ## ＠a7-5023-0562-9＠b精装＠dCNY14.60＠z7-5023-0562-7 例2：010 ## ＠a7-5013-0908-6＠b精装＠dCNY205.00（全6册）例3：010 ## ＠a7-80001- -1＠b第一卷＠dCNY500.00（n卷总价）
CNMARC数据描述法
首先认识CNMARC功能块
0 --标识块 1 --编码信息块 2 --著录信息块 3 --附注块 4 --连接块
5 --相关题名块 6 --主题分析块 7 --知识责任块 8 --国际使用块 9 --本地使用块
CNMARC描述格式
功能块
头标区 001 010 100 101 102 105 106
ISBN 0-87287-220-3
组标识出版者标识书序标识校验号
ISBN 0 8 7 2 8 7 2 2 0 权 10 9 8 7 6 5 4 3 2 乘积 0 +72 +56 +14 +48 +35 +8 +6 +0
= 239 239÷11 = 12 …… 余8 11 – 8 = 3 …… 计算机校验号

中文图书CNMARC著录简要说明

• 同一种图书，有平装和精装两种版本，且ISBN不同时，或 ISBN相同，但价格不同时，按先平装、后精装顺序依次均重复010字段。
例1： 010 ##|a7-80137-390-1|b第1卷|dCNY19.00 010 ##|a7-80137-389-8|b精装#;#第1卷
|dCNY28.00
(1)多卷书有分卷题名，而且有独立意义，以分卷题名作为正题名，多卷书总题名作为丛编名。
例：200 1#|a罗马与西罗马帝国|f (英) J.M. 罗伯茨著 225 2#|a世界文明通史|v3
(2)具有独立的、有检索意义的题名、责任者、国际标准书号、价格等条件的丛书的单册，采用分散著录。
时是否是依据国际标准书目（ISBD）规则。
.通常情况下，只有对书目记录进行较大修改或更新（主要
指标目改变或检索点发生了变化），5字符位才用代码“c”，此时需注意添加修改馆修改记录的801字段。例： cam0 801#0|aCN|bNLC|c19980216 801#2|aCN|bJLU|c20000427 (该记录由国家图书馆1998年2月16日编制,2000年4 月27日吉林大学图书馆对其进行了较大的修改.)
4. 各著录单元的简要说明
记录头标区
是记录的必备字段，不可重复。其总长度为24个字符位。除5-8字符位及17、18字符位需由编目员根据文献具体情况人工录入外，其它均由计算机系统自动生成。
.5字符位：记录状态代码 , 反映书目记录的状态。 .6字符位：记录类型代码，定义记录类型。 . 7字符位：书目级别代码，定义书目级别。 .8字符位: 层次级别代码，说明书目记录内的书目信息或内容标的完整程度以及它在层次等级中的位置。 .17字符位：编目等级代码，说明书目记录内的书目信息或内容标识的完整程度以及编制记录时是否与出生物实体核对过。 .18字符位：著录格式，说明记录采用的著录规则，在著录200－225字段

第二讲CNMARC格式介绍

第二讲CNMARC格式介绍引言：CNMARC（英文全称：Chinese Machine-Readable Cataloging）格式是中国图书馆学界根据我国图书馆的特点和要求，根据MARC格式进行了改编和发展而成的一种机读编目格式。

CNMARC格式的目的是为了实现图书馆馆藏资源的统一管理和共享，使得图书馆馆藏资源能够更加高效地被利用。

本文将介绍CNMARC格式的发展历程、基本特点以及实际应用。

一、CNMARC格式的发展历程：CNMARC格式的发展可以追溯到上世纪80年代初，当时我国图书馆学界开始研究如何利用机读编目技术来提高图书馆的工作效率和服务质量。

在研究的过程中，图书馆学界引入了国际上通用的MARC（机读编目）格式，并对其进行了修改和发展，形成了适合中国国情和图书馆需求的CNMARC格式。

经过多年的发展，CNMARC格式已经成为我国图书馆界的标准机读编目格式。

二、CNMARC格式的基本特点：1.字段结构：CNMARC格式采用了与MARC格式相似的字段结构，包括了主标目字段、责任者字段、出版发行字段、分类与索引字段等。

例如，主标目字段以“200”开头，责任者字段以“700”开头，出版发行字段以“210”开头。

3.语言和汉字处理：CNMARC格式支持多种语言的编目，尤其是对汉字的处理有特殊的考虑。

CNMARC格式采用了中国的国家标准GB2312字符集，确保了汉字数据的正确编码和传输。

4.可扩展性：CNMARC格式允许用户根据需要增加新的字段或子字段，以适应不同图书馆的特殊需求。

5.易于转换和共享：CNMARC格式采用了标准的MARC国际通用格式，因此可以方便地与其他图书馆共享机读编目数据。

另外，CNMARC格式中的字段标识和数据元符号都具有一定的规范性，便于进行格式转换和检索。

三、CNMARC格式的实际应用：CNMARC格式已经在我国许多图书馆中得到广泛应用，实现了图书馆资源的共享和联合编目。

通过使用CNMARC格式，图书馆可以通过数据交换来获取其他图书馆的编目数据，从而减少自己的编目工作量。

CNMARC的关联字段_关联字段

ＣＮＭＡＲＣ的关联字段_关联字段CNMARC格式中，一些字段之间存在着相互关联的对应关系，体现在一字段内数据元素间，一字段与其它字段数据元素间在含义、性质、概念等方面的关联或一致。

但在中文图书编目工作中经常看到，一些CNMARC记录有关联的字段间存在各种不关联或不一致的情况，影响了书目记录的质量。

作为编目员，根据所编文献的具体情况和CNMARC格式的相关规定，注意这些关联字段间数据元素的对应一致，就会提高书目记录的质量。

本文依据《新版中国机读目录格式使用手册》，谈谈CNMARC格式中的关联字段。

1记录头标的关联字段（1）记录头标字符位置5“记录状态”的代码与“801记录来源”字段指示符2关联。

字符位置5代码为“n＝新记录”时，801字段指示符2的值为“0”；字符位置5代码为“c＝经修改的记录”时，由于记录中有改错或有字段被删除，原标为“n”、“o”或“p”的代码，改标为“c”，自动生成重复的801字段指示符2的值为“2”和$c子字段修改处理的时间。

（2）字符位置5代码为“o＝曾发行较高层记录”时，字符位置8“层次等级”代码应取值“2”，有225字段。

（3）字符位置6“记录类型”代码为“c＝乐谱印刷品”时，应有013 ISMN字段，105字段字符位置0－3“图表代码”应有“g＝乐谱”（专著性文字资料），125字段“$a 印刷性乐谱类型”子字段和208字段作对应的著录。

（4）字符位置7“书目级别”代码为“m＝专著”时，010、105字段必备，100字段字符位置8“出版时间类型”代码适用“d、e、f、g、h、i、j、u”中之一，并与字符位置9－12“出版时间1”和字符位置13－16“出版时间2”取得一致。

（5）字符位置7代码为“s＝连续出版物”时，011、110、207、326字段必备，100字段字符位置8代码适用“a、b、c”中之一，并与字符位置9－16“出版时间1”和“出版时间2”取得一致。

（6）字符位置7代码为“c＝合集”时，与481和482字段关联。

文献信息编目——普通图书的CNMARC著录规则..

3 普通图书CNMARC著录规则
···
4
Part 4 网络信息资源编目
4 网络信息资源编目
···
都柏林核心元素集
其他类型文献著录Βιβλιοθήκη · · · · · · ·
连续出版物标准文献测绘制图资料录音资料影像资料微缩资料电子资源
DC
· 为描述电子资源、支持网络检索而建立的一种元数据模式，旨在对网络信息资源有效地组织、检索与管理。 ·包括15个元素
MARC是Machine Readable Catalog(ue)的缩写，意即“机器可读目录”，即以代码形式和特定结构记录在计算机存储载体上的、用计算机识别与阅读的目录。 ——经常听到CNMARC
ISBN
所有中国1987年之后正规出版的普通图书版权页都有ISBN号，
ISBN是International Standard Book Number 这几个英文单词的首
著录项目书名与责任说明项版本项规定信息源书名页、版权页、封面、书脊、序言、后记书名页、其他正文前书页、版权页
···
出版、发行项
载体形态项丛编项附注项标准书号与获得方式项
书名页、其他正文前书页、版权页、封面
整部图书及附件书名页、版权页、封面、图书其余部分任何信息源任何信息源
03
共有21个字段
600 个人主题 690 《中国图书馆分类法》分类号
3 普通图书CNMARC著录规则
···
7-7-- 知识责任块
包含对在变文献的创则负有知识责任的个人或团体名称。共有11个字段
701 个人名称——等同知识责任（702 次要知识责任）
711 团体名称——等同知识责任（712 次要知识责任）

解读CNMARC字段标准

CNMARC简介CNMARC的格式结构CNMARC书目记录字段按功能划分为以下九个功能块,字段标识符的第一个数字（最左边）表示字段所属的功能块。

0——标识块：主要由记录控制号、国际标准书号(ISBN)、统一书刊号等字段构成。

常用字段有：001、005、009、010、091、092。

1——编码信息块：主要由描述作品的各个方面的编码数据，如一般处理数据、作品语种、出版国别等编码字段构成。

常用字段有：100、101、102、105、106。

2——著录信息块：主要由包括ISBD和中国国家标准《文献著录准则》规定的除附注项和文献标准号码以外的全部著录项目，如题名与责任者项、版本项、出版发行项、载体形态项、丛书项和文献特殊细节项等字段构成。

常用字段有：200、205、210、215、225。

3——附注项：主要包括对作品各方面的文字说明，由一般附注、内容附注、提要和文摘、采访信息附注等字段构成。

常用字段有：300、303、304、308、320、325、327、328、330、345。

4——连接块：主要包括以数字和文字形式对其它记录的标准连接。

常用字段有：410、411、423、451、453、454、461、462、463、464。

5——相关题名块：主要包括作为检索点的本作品的其它题名，由统一题名、并列题名、其他题名、编目员补充的附加题名等字段构成。

常用字段有：500、510、512、514、515、516、517、540、541。

6——主题分析块：主要由分类、主题标识、非控主题词等字段构成。

常用字段有：600、601、605、606、607、610、690、692。

7——责任者块：主要包括对作品负有主任的个人及团体的名称。

并区分为主要责任者、等同责任者及次要责任者等字段构成。

常用字段有：701、702、711、712。

8——国际使用块：主要包括对负有责任的机构的标识，有记录来源字段构成。

常用字段：801。

CNMarc简介

如： 0010010000000050017000100100028000271000041000551010008000 96@
CNMARC－数据区
数据区分为9个功能块，以3个数字表示，第一个数字表示该字段所属功能块。每个功能快由一些可变长控制字段和可变长数据字段组成。可变长控制字段（001和005）由数据和一个字段分隔符组成可变长数据字段由字段标识符（3个），字段指示符（2个）和子字段组成子字段由子字段标识符（如：@a）和数据组成如：010##@a7-04-015339-4@dCNY30.6
固定长度为 2 4个字符，即0-23位。
其中第0 - 4位字符为该MARC记录的总长度
第1 2 -1 6位为MARC记录数据基地址。它的值等于头标区长度与目次区长度之和如：01071nam0#2200277###450#
CNMARC－目次区
地址目次区，紧跟记录头标区之后，自动生成的，纪录数据区可变长字段和字段位置的索引。它由若干个目次项组成 ,每项均为12个字符。目次项可分为三个部分 :字段标识符（3个）、字段长度（4个）、字段起始地址（5个）目次项数目与字段数目相等，以字段分隔符结束。
MARC是元数据（Metadata）的一种。
这里的元数据是一种关于数据结构化的数据，是关于资源的信息。
使用元数据可以提高信息被有效的检索和利用特点：丰富的描述、高效检索缺点：制作成本高
CNMARC数据结构
CNMARC一般为.iso文件，也有mrc\marc\cnm 文件 CNMARC格式主要分为四部分： 1、记录头标 2、地址目次区 3、数据字段区 4、记录终止符。
CNMARC 数据区分隔符
因MARC记录中使用的记录分隔符、字段分隔符和子字段分隔符为不可见ASCII码控制字符记录分隔符的AS

CNMARC第二讲CNMARC数据字段的内容

本例提供了将200字段嵌套在连接款目中的用法。通过410字段在所编款目与丛属的丛编之间产生连接。嵌套在410字段中的是710字段（含有对丛编负主要责任的团体名）和200字段（含丛编）。所编的实体是该丛编的第五卷（v.5）。因此，v.5 嵌套在200字段中的$v子字段中。
2021/7/20
信息组织
2021/7/20
信息组织
2
指示符1：题名有无检索意义指示符此项规定表明编目机构编制的记录是否
把记入第一个$a子字段的正题名作为检索点处理。它对应于根据编目条例确定的题名附加款目或题名主要款目。
0=题名无意义，该题名不宜作附加款目。 1=题名有意义，该题名作检索点。对于非第一个正题名的其它正题名选为检索点的情况，参见本字段的相关字段。
2021/7/20
信息组织
21
$A正题名汉语拼音其数据可由计算机自动生成。
2021/7/20
信息组织
22
1、重考古今伪书考四卷/（明）姚际恒撰;顾实重考 2、液晶的最新技术：物性、材料、应用/（日）松本正一，（日）角田市良著；王殿福，孙红军译 3、中国新诗库·第三辑，胡适卷/胡适著；周良沛编选 4、巴尔扎克全集·第二十二卷，人间喜剧：哲理研究·III/（法）巴尔扎克（Balzac,H.D.)著；王文融等译
例：British standard methods of analysis of fat and
fatty oils[printed text]·Part 1，Physical methods ·Section 1.12，Determination of the dilation of fats 2001#$aBritish standard methods of analysis of fat and fatty oils$bprinted text$hPart 1$iPhysical methods$hSection 1.12$iDetermination of the dilation

第二讲 CNMARC格式介绍

CALIS联合目录
CALIS所采用MARC格式
CALIS联合目录数据库大多数印刷型文献采用 MARC格式：基于UNIMARC的CNMARC格式 • 中文、日文书目采用CNMARC格式 CNMARC MARC21格式 • 西文、俄文采用MARC21格式 MARC21 采用不同格式的目的方便共享目前的技术能够实现不同格式的记录的一体化储存、一体化检索和一体化显示
CALIS联合目录
CNMARC书目格式介绍
CALIS联合目录数据库中现有计划发展
图书（Monograph）连续出版物（Serial）
电子资源（Electronic Resource，原名计算机文件乐谱（Music）资料录音资料（Sound Recordings）影片和录像资料（Motion Pictures and Videorecordings）地图（Map）
CALIS联合目录
丰富的描述与知识检索效应
高
MARC
DC
关键词
丰富的描述
低
检索效率
高 CALIS联合目录
MARC是什么？
丰富的描述与知识检索效应成正比前页图表说明对资源的信息内容描述越详细，检索效益越高。
关键词描述最简单，但是检索效益最低； MARC描述最复杂，检索效益最高，但是成本也最高；基于DC的元数据介于其中。
CALIS联合目录
2 次级2 • 该记录为在版编目（CIP）记录，这类记录通常是不完整的，如载体形态字段可能没有或不完整。 3 次级3 • 该记录属于不完整编目的记录，该记录有可能由发行机构升级为完全级的记录，也有可能不再被升级。 4 次级4 • CALIS联合目录自定义级别，该记录属于不完整的书目记录，通常由采访人员根据订单建立。 CALIS联合目录

浅析中文译著图书的CNMARC著录

浅析中文译著图书的CNMARC著录随着全球化进程的不断加快，中文译著的出版逐渐成为图书出版领域的一个重要部分。

对于这些中文译著图书的著录和管理，CNMARC著录成为了一个重要的工具。

本文将从CNMARC著录的角度，对中文译著图书进行浅析，探讨其在图书著录中的应用和意义。

一、CNMARC著录简介CNMARC（China MARC，中国图书馆信息联机系统）是中国图书馆协会制定的一套适用于中国的MARC数据格式，用于图书馆信息的著录与管理。

CNMARC以国际上通行的MARC （Machine-Readable Cataloging，机器可读目录）格式为基础，根据中国图书馆的著录规则和实际需求，结合中文图书的特点，进行了本土化的改进和扩充。

CNMARC格式被广泛应用于中国图书馆的图书著录和管理工作中，是中国图书馆信息化建设的重要组成部分。

二、中文译著图书的特点中文译著图书是指外国文学作品、学术著作等在中国出版并由中文翻译的图书。

这类图书在中国的出版数量逐渐增多，并且涵盖了广泛的内容领域，包括文学、历史、社会科学、自然科学等各个学科门类。

中文译著的出版不仅丰富了中国读者的阅读选择，也促进了中外文化之间的交流与理解。

对这类图书进行准确、规范的著录和管理显得尤为重要。

中文译著图书的著录需要考虑以下几个特点：1. 双语信息：中文译著图书通常包含原著名称、作者名称等双语信息，需要在著录时做好对应的处理，确保信息的完整和准确。

2. 翻译者信息：中文译著图书的著录还需要包含翻译者的信息，以便读者了解到具体的翻译人员及其翻译成果。

3. 原著信息：对于中文译著而言，原著信息也是非常重要的，需要对原著的出版信息、作者信息等进行著录。

4. 出版国际化：中文译著通常来自各个国家和地区，因此在著录时需要考虑到国际化的要求，保证著录信息符合国际标准。

以上特点使得中文译著的著录工作相对复杂，需要对CNMARC著录格式有较为深入的了解，才能完成准确、规范的著录工作。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

– 可检字段与不可检字段
200 1#＄a西游录＄f（元）耶律楚才著＄c异域志＄f（元）周致中著
有关概念
数据字段区所含的数据有如下两种形式
• 数据控制字段——定长字段（00X）结构：
数据
字段分隔符
• 变长字段（010—999）结构：
字段指示符 1 字段指示符 2 ＄a
数据 ……
字段分隔符
200 1#＄a西游录＄f（元）耶律楚才著
第三节地址目次区
由若干目次项和字段分隔符构成全部数值由系统自动生成
– 目次项：占12个字符位，固定长
• 分别用3位、4位、5位字符揭示数据字段区中相应字段的字段标识符、数据字段长度、起始字符位置
– 字段分隔符
• 一般用在该区终结处表示该区结束，系统自动生成
– 注意：目次项占12个字符位是固定长的，但是，每条记录所描述的字段数量不同，所以地址目次区所占字符长度是可变长的。
• 如：正式出版后文献的特征与CIP记录不符者。
– 如：00957oam2#2200289###450#
执行代码
由4位字符构成，字符位：6-9；分别定义记录类型、书目级别、层次等级代码;第9位字符未定义,用“#”表示。
– 记录类型
• 《中国机读目录使用手册》规定了14种记录类型代码。 • 如：00957oam2#2200289 ### 450#
机读格式 010##＄a7-81029-926-3＄d12.00 2001#＄a 信息世界漫谈＄f 李衍达编著 210##＄a 北京＄c 清华大学出版社＄d2000．3 215##＄a147 页＄d18cm 225##＄a 院士科普丛书＄f 路永祥 690##＄a G20＄v4 701#0＄a 李衍达＄4 编著 801#0＄aCN＄b XXMCL＄c20050701 901##＄a XXMCL＄b0214977＄d G20＄e2
数据字段区的标识系统
两种标识符号：内容标识符和分隔符
– 内容标识符
• 包括：字段标识符、字段指示符、子字段标识符
– 用于识别数据元素，或提供有关数据元素的附加信息的符号或编码。
– 位于数据前，标志数据开始
• 字段标识符——用于识别各个字段的3位数字或字符代码；其第1位数用以区分不同的功能块。如：010 国际标准书号字段 101 作品语种字段
– 书目级别
• 《中国机读目录使用手册》规定了4种书目级别代码。 • a=分析级：该书目描述的实体包含在另一实体中。 • m=专著：以一册或以限定数量出版的出版物。 • s=连续出版物 • c=合集（汇集型的书目实体） • 注意：与该记录描述的主要书目实体有关。
执行代码
– 层次等级代码
• CNMARC是按照层次等级结构将文献信息资源分别编制机读目录；并用层次级别代码指明该记录在层次等级中的地位，揭示机读记录间的从属关系。
第五节常用字段的使用方法
0----标识块
用来标识记录或标识出版物实体并出现在实体上的号码。
– 包括27个字段
• 001 记录标识号
005 记录处理时间
• 010 国际标准书号 011 国际连续出版物号
• 013 国际标准音乐号 014 论文标识号
• 015 国际标准技术报告号……
0----标识块
– 作用：供计算机准确、迅速的存取相应字段的数据
第四节数据字段区
数据字段区的组织
数据字段区
功能块功能块
…… 功能块—— 功能块
字段字段——
…… 字段字段
子字段子字段
…… 子字段—— 子字段
数据元素数据元素
…… 数据元素数据元素
数据字段区的组织
0----标识块 1----编码信息块 2----著录信息块 3----附注块 4----款目连接块
其它数据元素
记录长度 – 占5个字符，5个十进制数组成最大数值为99999，不足5位时，左边添0； – 反映一条记录所占全部字节数。
指示符长度 – 用一位十进制数字表示指示符长度，CNMARC中均为2
子字段标识符长度 – 用一位十进制数字表示指示符长度，CNMARC中均为2
数据基地址 – 占5个字符，5个十进制数组成最大数值为99999，不足5位时，左边添0； – 表示第一个数据字段相对于记录首位的起始字符位置，等于头标区和地址目次区的字符总数。
5----相关题名块 6----主题分析块 7----知识责任块 8----国际使用块 9----国内使用块
CNMARC各功能块与款目著录项目对照表
CNMARC 数据字段区中的功能块
0XX 标识块 1XX 编码信息块 2XX 著录信息块
3XX 附注块 4XX 款目连接块 5XX 相关题名块 6XX 主题分析块 7XX 知识责任块 8XX 国际使用块 9XX 国内使用块
部分”所占的字符位数。一般取值为0。 – 第4位：未定义，用#表示。 – 如：00957oam2#2200289###450#
记录头标里的代码表示的是记录的特征，而不是直接表示书目实体本身的特征
思考： 00893nas0#22002651##450# 的含义
思考题
CNMARC机读记录的逻辑结构有何特点？何谓记录头标？由哪些数据元素组成？熟悉需要人工输入的各个代码的含义。
内容标识符
字段指示符
• 指与变长字段相关的字符（数字和字母），它提供有关可变长字段的内容、记录中不同字段的关系及某些数据处理过程中所需操作的附加信息。
如：200 题名与责任说明字段 0# 题名无意义 1# 题名有意义
子字段标识符
• 由2个字符组成的代码，用以识别可变长字段中不同的子字段。 • 第一个字符用＄表示；第二个字符可以用数字或字母
– 编目等级：
• 用1个字符表示机读记录的完整程度，说明是否依据受编文献编制的机读目录。
• # = 完整级：依据受编文献本身建立的记录 • 1 = 次级1 ：未依据受编文献建立的记录 • 2 = 次级2 ：表示预编记录 • 3 = 次级3 ：该记录为不完整的记录（项目不完整） • 如：00957oam2#2200289###450#
001 记录标识号
– 特点：
• 记录唯一相关的标识符号；具有唯一性，可作为检索点；
• 每条记录的必备字段，不可重复； • 不设字段指示符，不设子字段； • 固定长字段：共12个字符，3个数据元素组成 • 如：001 011999000001
001 011989009021
记录附加定义
– 著录格式
• 用1位字符代码表示记录采用的著录规则；是否依据了《国际标准书目著录规则》的规定。
• # = 记录完全采用ISBD格式 • i = 记录为部分或不完全的ISBD格式 • n = 记录为非ISBD类格式
– 字符位19未定义，用#表示 – 如：00957oam2#2200289###450#
款目中的著录项目标准编号与获得方式项
题名与责任说明项、版本项、文献特殊细节项、出版发行项、载体形态项、丛编项及正题名标目附注项
交替题名、合订题名、并列题名及统一题名等标目主题词与分类号个人著者名称、机关团体名称以及会议名称方面的标目
索书号与分类号
G20
信息世界漫谈/李衍达编著．——北京：清华大学出版
字段
子字段
200 题名与责任者块
205 版本说明
＄a ……
……
＄c ……
215 载体形态项——
225 丛编 …… ＄d 尺寸
＄e 附件
第二节记录头标
记录头标（Record label）
– 位于一条机读记录的开端，记载了该记录的有关参数。为计算机处理一条机读记录提供必不可少的基本参数。
– 固定长度为24个字符，包括8个数据元素：
数据元素名称
字符数
字符位置
1）记录长度
5
2）记录状态
1
3）执行代码
4
4）指示符长度
1
5）子字段标示符长度
1
6）数据起始地址
5
7）记录附加定义
3
8）地址目次区结构
4
0-4 5
6-9 10 11 12-16 17-19 20-23
记录状态
用来标识记录处理状态，由1位字母构成。《中国机读目录使用手册》规定了下列5种记录状
中国机读目录格式
主要内容
CNMARC机读记录的逻辑结构记录头标地址目次区数据字段区常用字段的使用方法
第一节 CNMARC机读记录的逻辑结构
CNMARC机读记录结构如下
区域记录头标地址目次区
记录数据字段区
记录分隔符
功能块 0----标识块 1----编码信息块 2----著录信息块—— 3----附注块 4----款目连接块 5----相关题名块 6----主题分析块 7----知识责任块 8----国际使用块 9----国内使用块
其它数据元素
地址目次项结构
– 占4位字符； – 第1位：记录地址目次区用几位数字表示数据字段区每一个
字段的长度； CNMARC中用4位十进制数表示； – 第2位：记录地址目次区用几位数字表示数据字段区每一个
字段的起始位置；CNMARC中用5位十进制数表示； – 第3位：用1位十进制数表示每个地址目次区的“执行定义
• 《中国机读目录使用手册》规定了4个层次等级代码。 • # =层次关系未定义的记录 • 0 =无层次等级关系的记录 • 1 =最高层次的记录 • 2 =低于最高层次的记录
–字符位9未定义，用“#”表示。
• 如：00957oam2#2200289 ### 450#
记录附加定义