第三章机读目录概述
信息组织_第三章信息描述
主办国 美 英 美 澳 芬 美 德 加 日本 意大利 美 中国
主办地点 俄亥俄州.都柏林 华瑞克大学 俄亥俄州.都柏林 堪培拉 赫尔辛基 华盛顿特区 法兰克福 渥太华 东京 佛罗伦萨 西雅图 上海
主办组织 OCLC/NCSA OCLC/UKOLIN OCLC/CNI OCLC/DSTC,NLA OCLC/NLF OCLC/TLC OCLC/ OCLC/NLC/IFLA NII/DCMI/JST DCMI/AIB/BNCF DCMI/UW/IIS/MS
一、信息描述的意义
3、信息描述的规范——网络信息资源的描述规范
近年来,网络信息资源的描述问题成为广泛关注的热点之 一。出版界、计算机界和书目文献界一起,结合电子环境 和技术的发展,共同创建了一系列新的描述规范,包括:
《文本编码倡议》(Text Encoded Initiative,简称TEl) 《都柏林核心集》(Dublin Core,简称DC) 《政府信息定位服务》(Government Information Locator Service, 简称GILS) 《联合地理数据委员会的数字地球空间元数据》(Content Standard Digital Geospatial Metadata,简称CSDGM) 《可视资源核心范畴》(Core Categories for Visual Resources,简称 CCVR) 《编码档案描述》(Encoded Archival Description,简称EDA) 《博物馆信息的计算机交换》(Computer Interchange Of Museum Information,简称CIMl)
二、信息资源描述项目、标识和描述级次
组织机构一览表
组织简称 OCLC UKOLIN CNI DSTC NLA NLC
机读目录概述范文
机读目录概述范文机读目录(MARC)是一种用于记录图书馆藏书的标准编码格式,为图书馆管理和检索图书馆藏书提供了重要的工具。
MARC的发展源于20世纪60年代,当时需要一种可以用计算机进行处理的目录记录格式。
MARC的出现极大地促进了图书馆事业的发展,提高了图书馆信息服务的效率和质量。
MARC格式记录的优点是灵活性和可扩展性。
因为MARC格式设计时采用了层次化的结构,使得字段和子字段可以根据需要进行组合和扩展。
这意味着图书馆可以自定义一些字段来记录特定的信息,以满足自己的特殊需求。
例如,一些特殊馆藏的图书馆可以添加一些额外的字段来描述这些馆藏的特殊属性。
此外,MARC格式记录还可以与其他标准和格式进行对接,实现数据的互通和共享。
例如,MARC格式记录可以转换为国际标准书号(ISBN)或国际标准编号(ISSN)格式,以便在全球范围内唯一标识图书或期刊。
MARC格式记录也可以与其他图书馆信息系统的数据格式进行转换,实现图书馆之间的联机互通。
虽然MARC格式记录在图书馆界得到了广泛的使用和认可,但也面临一些挑战。
首先,MARC格式记录的编写和维护需要一定的专业知识和技能,对于一些小型图书馆来说可能比较困难。
其次,MARC格式记录的结构较为复杂,可能需要较长的时间来学习和掌握,使得人们对其应用和发展的兴趣有所降低。
最后,随着数字图书馆和数字出版的兴起,MARC格式记录的适用性和效率也面临一定的挑战。
总体而言,MARC格式记录作为一种图书馆信息管理工具,为图书馆事业的发展做出了巨大贡献。
在未来,MARC格式记录仍将继续发展和演变,以应对数字化时代和信息技术的挑战,为图书馆信息服务提供更加全面和高效的支持。
第三章 信息检索教程
举例:期刊2
23
期刊著录格式
24
期刊的著录
写出下面期刊文献著录:
25
小节练习1
1. 什么是文献著录? 2.文献著录的结果是—— 3. 既著录主要项目,还著录全部选择项目的著录级次称为—— 4. 既著录主要项目,还著录部分选择项目的著录级次称为——
26
3.2 机读目录与元数据
3.2.1 机读目录
43
3.2.3 都柏林核心元数据和机读目录的比较
1. 著录的对象不同
DC与 MARC的 3. 著录的主体不同 比较 4. 著录的详简程度不同
5. 标识的方法不同
2. 数据的形式不同
44
小节练习2
1、什么是机读目录,一条CNMARC机读目 录的组成? 2、头标区数据元素: 00123cbm1#2200277###52## 其中c、b、m、1分别表示什么? 3、什么是元数据?
12
图书的著录(参考文献著录规则)
13
14
图书著录中的文献类型标志
常用文献类型用单字母标识,具体如下: (1)期刊[J](journal) (2)专著[M](monograph) (3)论文集[C](collected papers) (4)学位论文[D](dissertation) (5)专利[P](patent) (6)技术标准[S](standardization) (7)报纸[N](newspaper article) (8)科技报告[R](report)
CNMARC记录
记录头标区
地址目次区
数据字段区
记录分隔符
注:各字段数据元素及其标准详细情况参见教材P83-87
33
ISO-2709的机读目录标准
信息检索与利用--第三讲
历史
地理 自然科学 医药卫生 工业技术 农业科学技术 综合性图书
杜威十进分类法
杜威十进分类法(Dewey Decimal Classification,DC/DDC), 美国M.杜威编制的综合性等级列举式分类法。 杜威十进分类法大类表: 000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学和数学 600 技术(应用科学) 700 艺术、美术和装饰艺术 800 文学 900 地理、历史及辅助学科
2、国内常用图书分类法简介
任何一个图书馆,不论其藏书有多少,都必须对藏书进 行科学的分类和排架,以便读者有效利用文献资源。 所谓图书分类,就是根据图书的学科内容或读者对象、 文种、编辑形式、体裁等特征来分门别类地组织图书。 •《中国图书馆分类法》 (Chinese Library Classification - CLC) 简称《中图法》,它是当今国内图书馆使用最广泛的分 类法体系,国内主要大型书目、检索刊物、机读数据库, 以及《中国国家标准书号》等都著录《中图法》进行分 类。
1.分类排架法
(1)先按《中图法》分类体系排架; 以文献分类体系为主体的排架方法,多用于排列图书。 分类排架号(索书号)=分类号 + 辅助号
分类号:代表图书内容所属的学科类目, 辅助号:为同类图书的区分号。 一般先按分类号顺序排列,分类号相同,再按辅助号顺序排列, 一直区分到各类图书的不同品种。 (2)同类图书排列法通常有4种: 1)按著者名称字顺排列 即相同类号的图书再依据著者号码的次序排列。用这种排列法可 集中同类中同一著者的不同著作,附加区分号后,还可集中同一 著作的不同版本、不同译本、不同注释本、同一传记主编的各种 传记等。是各国图书馆普遍采用的排列方法。 2)按书名字顺排列, 3)按出版时间排列 4)按图书编目种次排列,
文献检索(第三章)
社 会 科 学
自 然 科 学
(2)主题途径 主题途径
这是通过文献资料的内容主题进行检索的途径,主 题途径依据的是各种主题索引或关键词索引,主题索引 或关键词索引按检索词的字顺排列,检索者只要根据课 题确定了检索词(主题词或关键词),便可以像查字典那 样,按照字顺去逐一查找,从检索词下的索引款目,找到 所需文献的线索。 主题途径检索文献关键在于分析课题,提炼主题 概念,运用词语来表达主题概念。对于主题索引,需 要把自拟的语词同相应的词表核对。主题途径是一种 主要的检索途径。
五 文献信息检索的方法
1.常用法
常用法又称直接法,是指直接利用检索工具(系 统)检索文献信息的方法,这是文献检索中最常用的 一种方法。它又分为顺查法,倒查法和抽查法。
1.1 顺查法
顺查法指按照时间的顺序,由远及近地利用检索 系统进行文献信息检索的方法。这种方法能收集到某 一课题的系统文献,它使用于较大课题的文献检索。 例如,已知某课题的起始年代,现在需要了解其发展 的全过程,就可以用顺查法从最初的年代开始,逐渐 向近期查找。优点是漏检,误检率低,但劳动量较 大。
(1)基本部类:如中图法分五大类部:马列毛邓;哲学; 社会科学;自然科学;综合性图书。 (2)基本大类:构成分类表的第一级类目。中图法为22个 基本大类。 (3)简表:由基本大类与由其直接展开的一、二类目所形 成的类目表。 (4)详表:由简表展开的各种不同登记的类目所组成的类 目表,是文献分类的真正依据。
OPAC :是指以计算机编码形式存贮在计算机 系统内,供读者通过终端设备进行联机检索的 图书馆目录,即书目数据库的一种形式。
2.题录(bibliography 、bibliographic、citation)
题录是单篇文献外表特征的揭示和报导,即对某一文献外部特 征的描述,由一组著录项目构成一条文献记录。 题录的著录项目一般有著者,篇名及出处等,常以一个内容上 独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整 本出版物)为基本著录单位。题录在揭示文献内容的深度方面,比 目录深入,但又比文摘简单。 示例1:
中国机读目录格式(图书馆专用)
• 定长子字段:长度固定的子字段。它可包含 一个或多个数据元素。可用于定长字段,如 100字段中的$a子字段。也可用于变长字段, 如200字段的$z子字段。 • 层次等级:分配给主书目实体的一个数值。 该数值标识主实体在一个预先确定的层次等 级结构中所处的位置。如多卷集各卷的目录 描述和多卷集整体的目录描述,可看作是一 个属于另一个的两个不同层次等级。层次等 级仅仅在整体及其各独立部分均已生成书目 记录的情况下才可以使用。
3功能模块简介
• 3.1 0—标识块 • 本块用来标识记录或标识出版物实体上的 号码。如 • 010 国际标准书号 • 子字段标识符 子字段内容 • $a ISBN • $b 限定 • $d 获得方式和/或价格
• 例: • 010 ##$a7-118-00249-1$b精装$dCNY55.00 • 010 ##$a7-81023-606-7$dCNY6.80(上册); • CNY9.80(下册)
• 1.2关于格式内容扩充的说明 • 格式结构将保持稳定,今后机读格式的变化 仅限于追加有限的字段、子字段和代码,为 了使我国的机读目录在国际范围内具有良好 的可交换性,编制格式的主要依据是国际图 联的UNIMARC以及我国出版物的一些特殊 情况和规则的新变化。
• 1.3定义 • 检索点:用于检索书目记录的名称,词语和 代码。 • 数据元素:被明确标识的最小信息单元。在 可变长字段中,数据元素构成子字段,用子 字段标识符标识。 • 字段:由字段标识符标识的被定义的特定字 符串,可包含一个或多个子字段。 • 字段分隔符:位于每一个可变长字段末尾的 控制符,用来区分每一个相邻的字段。此外, 还用于地址目次区的末尾。
• 数据字段区:将有关文献的数据按功能块, 字段,子字段或数据元素这三个层次组织起 来。层次级别为:子字段构成字段,字段构 成功能块。《格式》的数据字段区设置了 0——标识块 1——编码信息块 2——著录 信息块 3——附注块 4——款目连接块 5— —相关题名块 6——主题分析块 7——知识 责任块 8——国际使用块 9——国内使用块 十个功能块。 • 记录分隔符:至于每条机读记录的末尾,用 来区分记录的控制字符。
机读目录概述
机读目录格式简介
机读目录框架结构
–《文献工作——文献目录信息交换用磁带格式》 《文献工作 文献目录信息交换用磁带格式》 文献目录信息交换用磁带格式 ISO2709) (ISO2709)
机 读 目 录 概 述
信息管理教研室 田梅
主要内容
第一节 机读目录格式简介 第二节 计算机编目流程 第三节 计算机编目与手工编目的分析比较
第一节 机读目录格式简介
计算机编目
– (Computerized Cataloging)是一种现代化的编目方法,将书目 Cataloging)是一种现代化的编目方法, 信息输入到计算机中,在程序的自动控制下处理书目数据, 信息输入到计算机中,在程序的自动控制下处理书目数据,生成 目录产品的过程。 目录产品的过程。
• UNIMARC的特点 UNIMARC的特点
–将不同文种、不同载体的文献的机读目录实行格式一体化 将不同文种、 将不同文种 –设置了连接款目块 设置了连接款目块
机读目录格式简介
21格式 格式》 简称MARC 三、《MARC 21格式》(简称MARC 21 )
–美国、加拿大图书馆协会共同推出,1999-2000出版 美国、加拿大图书馆协会共同推出,1999-2000出版 美国
• USMARC格式一体化 USMARC格式一体化 • 减少USMARC与CANMARC的差别 减少USMARC与CANMARC的差别 USMARC
–2001年8月,英国宣布采用MARC 21 格式 2001年 2001 英国宣布采用MARC –五大部分 五大部分
信息检索与利用-第三章
①《史记人名索引》②《唐诗鉴赏辞典》③《唐诗鉴赏辞典》名句索引部分 ④《现代英语语法》⑤《现代英语语法》索引部分
二、索
引
(二)索引的类型
1. 书籍索引:摘取书籍中的具体内容编制的检索书刊。 有字、词、句索引,有人名索引,有地名索引,有篇目 索引,有书目索引等。 2. 报刊索引:摘取报刊中论文篇目并注明出处的检索 书刊。 3. 书刊索引:把图书文献和报刊论文篇目混合编制的 检索工具,多用于专题性索引。 4. 会议录索引:是专门揭示会议文献的检索工具。 5. 引文索引:是以文献资料后所附的参考文献的作者、 题目、出处等项目,按照引证与被引证的关系编排而成 的索引。
中国古代字书(字典、词典)
字典词典的编纂在我国有悠久的历史,据 《汉书·艺文志》记载,公元前800多年周宣王 时,就有了字书雏形《史籀篇》,秦代有《苍颉 篇》、《爰历篇》、《博学篇》等蒙学字汇读物 出现。东汉许慎的《说文解字》是我国历史上第 一部真正意义的字书,并创立了部首检字法。以 后历代陆续编制了大量的字书,清代的《康熙字 典》是收字最多、首称“字典”的古代字书。
中文工具书排检方法
⑶ 号码法
号码法是形序法的一种变形,它把各种汉字的笔形用若干数字代 码表示出来,再将数字依照一定规则连接成一个个号码,再按号码 排列汉字。最常见常用的是四角号码法 。
“横一垂二三点捺,叉四插五方框六, 七角八八九是小,点下有横变零头。”
例:①左上角0 ↖ ②右上角2 ↗ 端 =0212 ↙ ↘ ③左下角1 ④右下角2 ①左上角4 ↖ ②右上角4 ↗ 芒 =44710 ↙ ↘ ③左下角7 ④右下角1
一、书 目
(一)书目概述
书目即图书目录,是著录一批相关的图书或报刊文献 的基本特征,按照一定次序编排而成的揭示和报道书刊文 献的工具。 我国古代书目:按经、史、子、集四部分类编排; 现行书目:大多按《中国图书馆分类法》分类编排; 机读书目都能提供分类、主题、标准书号、题名、著 者、出版社、出版时间等多种检索途径。
机读目录概述
中国机读目录的研制过程
1975年刘国均发表的《马尔克计划简 年刘国均发表的《 年刘国均发表的 兼论图书馆引进电子计算机问题》 介——兼论图书馆引进电子计算机问题》 兼论图书馆引进电子计算机问题 揭开了我国计算机编目和机读目录研制 工作序幕。 工作序幕。 1979年北京图书馆等单位组成“北京地 年北京图书馆等单位组成“ 年北京图书馆等单位组成 区机读目录研制协作组” 区机读目录研制协作组”,开始研究 LCMARC磁带。1980年我国正式颁布了 磁带。 磁带 年我国正式颁布了 国家标准字符集。 国家标准字符集。
美国
1971年 美国国家标准局将LCMARC格 1971年,美国国家标准局将LCMARC格 LCMARC 式定为国家标准;1982年LCMARC改 式定为国家标准;1982年LCMARC改 称为USMARC 1998年 月至2000 USMARC; 2000年 称为USMARC;1998年6月至2000年7 月经修订后,正式更名为MARC21 MARC21。 月经修订后,正式更名为MARC21。
2. 变长数据字段。010-999所有字段。 变长数据字段。 所有字段。 所有字段 其结构为: 其结构为:
指 示 符 1 指 示 符 2 子字 子字 段标 数据 段标 数据 识符 识符 字段 分隔 符
…
数据字段区划分为10个功能块, 数据字段区划分为 个功能块,每 个功能块 个功能块包含若干个字段。 个功能块包含若干个字段。而字段 标识符的第一个(最左边) 标识符的第一个(最左边)数字表 示字段所属的功能块。 示字段所属的功能块。
10大功能块 10大功能块
0—标识块 标识块 1—编码信息块 编码信息块 2—著录信息块 著录信息块 3—附注块 附注块 4—连接款目块 连接款目块 5—相关题名块 相关题名块 6—主题分析块 主题分析块 7—知识责任块 知识责任块 8—国际使用块 国际使用块 9—国内使用块 国内使用块
中国机读目录格式介绍
中国机读目录格式介绍中国机读目录格式是一种被广泛应用于图书馆和文献中心的目录编制规范,用于对书籍、文献、期刊和其他资料进行描述和索引。
机读目录的主要目的是使读者能够通过计算机检索和获取所需文献或资源,提高信息检索效率。
下面将详细介绍中国机读目录格式。
一、机读目录的结构1. 主标识符(Main Entry):即目录的主要标识符,一般是书名、文献标题或期刊名称。
主标识符可以根据不同的目录编制规则进行格式化,例如《图书分类法》、《中图法》等。
3. 附注(Note):包括目录的附加信息和解释,例如版本信息、出版商信息、目录述评等。
4. 主题词(Subject Heading):采用图书馆的主题词汇表对目录进行主题索引,以方便用户检索。
二、机读目录的元素1. 主标识符元素(Main Entry Element):包括主标识符类型、主标识符内容和主标识符辅助信息。
主标识符类型可以是书名、文献标题、期刊名称等,主标识符内容是具体的书名或标题,主标识符辅助信息包括出版年份、出版地等。
3. 附注元素(Note Element):主要包括附注内容和附注类型,附注内容是目录的附加信息,附注类型可以是版本信息、出版商信息、目录述评等。
4. 主题词元素(Subject Heading Element):包括主题词类型和主题词内容。
主题词类型是指采用的主题词汇表,主题词内容是具体的主题词。
三、机读目录的编写和应用中国机读目录格式的编写和应用可通过专门的目录编写软件来实现,例如“图书馆国家联网工程”采用的“图书目录分析处理系统(AMIS)”。
这种软件支持目录编写人员进行目录的格式化和输入,同时也支持系统用户进行检索和查询。
机读目录的应用可以通过网络或图书馆内部检索系统进行,用户可以根据主标识符、个别标识符或主题词等进行检索,从而找到所需的文献或资源。
机读目录的应用大大提高了文献检索的效率和准确性,对于学术研究、教育教学和知识传播具有重要意义。
《文献学概要》(讲义要录)
文献学概要第一章文献与文献学一、“文献”释义“文献”一词,现存的古书中,最早见于《论语·八佾》:“子曰:夏礼,吾能言之,杞不足征也。
殷礼,吾能言之,宋不足征也。
文献不足故也。
足,则吾能征之矣。
”文献,东汉郑玄注云:“献,犹贤也。
我不以礼成之者,以此二国之君,文章贤才不足故也。
”郑玄以“文章”、“贤才”解释“文献”其意义较为明确。
历史是发展的,孔子就是他的门生的“献”,而其言行被记录下来,成为《论语》,对后代的学者来说,又成了“文”。
因此,“文”和“献”又不是对立的,今天的文,未尝不是昔日的献,而今天的献又未尝不是将来的文。
因此“文献”可认为是古今一切社会史料的总称。
而作为孔子,最初对于文献的要求,是出于要了解已经发生了的过去的典章制度,远的是古代,近的是现代、当代,总之可认为是历史。
因此“文献”是我们认识历史、研究历史、验证历史的依据,它可以是书,也可以是人,统称则为“文献”。
今天提“文献”这个词,一般偏重于“文”,尤其偏重于古代的文。
我们可以认为是这个词向偏义词方向演化,但我们却不能不知道它本来的含义。
关于献,再举两例:(1)明代大学者焦竑有一部大书《国朝献征录》120卷,这个书名译成现代汉语,则是《当代人物传》。
这个“献”指当代重要人物,与历史关系重大的人物。
(2)清代有位学者李桓编了一部《国朝耆献类征》720卷。
耆,老也。
献,人物。
二、文献学研究的范围如上所说,文献包含着所有历史资料。
一那么文献学研究的范围也就涉及到各式各样包罗古今的文献。
文献学的范围是什么呢?文献学主要是研究文献的形态、文献的整理方法、文献的鉴别、文献的分类与编目、文献的收藏、文献形成发展的历史、各种文献的特点与用途、文献的检索等等。
目的在于:全面认识文献,学会在浩如烟海的文献中,用较少的时间,找到尽可能全的自己所需要的文献资料,同时还要有能力对这些资料的不同版本进行鉴别,确定较早的、较全的、较可靠的版本。
而且有能力对原始文献作整理加工,自己使用以外,还可以供更多的人使用。
3-机读目录格式
MARC Format
机读目录格式
是各国文献机构自动化系统之间传输和交换机 读目录数据时共同遵循和使用的标准记录格式, 又称机读目录交换格式。 它规定书目数据在机读介质上的表示和标识方 法,包括机读记录的构成、各数据字段在机读 介质上的总体安排及其内容结构。
2020/5/27
机读目录格式的类型
2020/5/27
机读目录样例
Байду номын сангаас
卡片目录样例
学习要求与思考题
什么是记录头标?记录头标由哪些数 据元素构成? 数据字段区包括哪两类字段?各起什 么作用? 熟悉内容标识符的类型及各自的作用。
2020/5/27
THANK YOU!
举例
子字段标识符
数据元素
子字段
@a药物动力学参数手册 @Ayao wu dong li xue can shu shou ce @f田 文艺编@Ftian wen yi bian
2020/5/27
字段
人事信息数据
字段
记录
2020/5/27
姓名 张三 李四 王五 ……
工号 31001 31002 31003
字段标识符
2020/5/27
字段长度
字段起始位置
数据字段区(fields)
控制字段(Control fields)是提供系统 的控制号和表示文献特征的各种代码化 数据的字段。所有控制字段均不设指示 符和子字段,其字段标识符的前两位都 为“0”,即从001-009。
2020/5/27
数据字段区(fields)(续)
由两个字符组成,用以识别可
@a
变长字段中的不同子字段。第一
…
个字符为子字段分隔符,用“@”
文献编目基础知识
文献编目基础知识文献编目基础知识主讲人石春耘顾蔷芬第一部分:概述第二部分:文献编目工作所包含的内容和基本概念第三部分:我馆文献编目工作概况第四部分:汇文系统编目模块功能简介第五部分:CNMARC格式著录标准和规则第一部分:概述1文献机构的目录职能:1.1目录的揭示职能和检索职能:目录的职能主要是对文献的形式和内容特征描述,通过完整的著录来实现,(传统编目工作主要产生题名、责任者、主题、分类四大款目)为读者提供文献的目录,以揭示馆藏内容。
1.2目录的宣传职能和和识别职能1.3目录的管理、交流职能和情报、参考职能:2 文献编目的发展及现状2.1文献编目、网络信息资源编目和信息资源编目:对大量馆藏实体信息资源进行整理、整序和整合的工作,被称为"文献编目",但对于大量非馆藏网络信息资源,同样也存在一个整理、整序和整合的工作,所以我们将这两大部分的编目工作统称为信息资源编目。
2.2文献编目现状:20世纪下半期,西方的信息资源编目工作已由跨国化、统一化、手工化、进入到国际化、标准化、自动化、网络化。
在我国近三十年,文献编目工作也得到了长足的发展,大部分地区的图书馆的编目工作已完成了标准化、自动化的进程,文献资源共建共享已逐步成为现实,开展的网上联合编目并取得了较好的社会效益和经济效益。
我馆2000年上了"汇文"系统,2002年正式申请成为CALIS的成员馆,实现了联机合作编目。
3 网络信息资源编目与发展3.1我国网络信息资源编目现状3.2网络信息资源编目知识简介DC简介:采用DC格式作为网络信息资源描述工具1995年OCLC和NCSA创造出了一套全新的编目格式Dublin Core,即都柏林核心,简称DC,DC的创建思想是使用简单的标识集合来描述网络信息资源,所包括的三个大类十五个要素可基本揭示信息资源的特征。
第一大类为描述资源内容的要素;第二大类为描述知识产权的要素;第三大类为描述资源外部属性的要素。
机读目录基本知识
著录信息源
著录项目
题名与责任说明项 出版发行项 载体形态项 丛编项 附注项
规定信息源
题名页 版本项 版权页或题名页、 封面、出版说明等处 题名页、其他序页、出版说明 整部图书及附件 丛编/专著题名页、封面、其它 任何信息源
标准号与获得方式项
任何信息源
中西文文献界定
• 授权影印书 • 正文为西文的学术专著,可能有少量注释 • 正文为西文的专业文献汇编或选读 • 正文为西文的双语教学用书
• 001001400000003000300014005001400017… … 字段号 字段长度
字段起始位置
数据区
• XJT012006007276▲##▼a7-301-10447-2 ▼dCNY22.00 ▲## ▼aTU712▼b/58 ▲##▼aCAL 012006050691▲## ▼a20060508d2006####ekmy0chiy0121 ea ▲0# ▼achi▲## ▼aCN ▼b110000 ▲## ▼aak a 000yy▲## ▼ar▲1# ▼a工 程事故分析与工程安全▼Agong cheng shi gu fen xi yu gong cheng an quan ▼f主编 谢征勋, 罗章▲## ▼a北京▼c北京大学出 版社▼d2006…… ▲
• 330 |a本书从人类的起源到每一个历史时期都有精辟凝炼的论述, 以深厚的人文关照和俏皮睿智的文笔,展示了人类历史的浩荡长卷。 • 410 #0 |1 mamkind|mChinese & English • 606 0# |a世界史|Ashi jie shi|x汉语|x英语 • 606 0# |a英语|AYing Yu|x汉语|j对照读物 • 690 |aK109|v4 • 690 |aH319.5|v4 • 700 #1 |a房龙,|Afang long|g(Van Loon, Hendrik Wiliem),|f18821946|4著 • 702 #0 |a秦立彦|Aqin li yan|4译 • 702 #0 |a冯士新|Aping shi xin|4译 • 801 #0 |aCN|bCCAU|c20030313 • 998 |aCCAU • 920 |a261020|z1 • 905 |a261020|b1360365-68|dH319.5|e472
第3章 信息著录与标引
信息标引是指在分析文献内容的基础上,用某种检索语言把文献主题以及其 他有意义的特征标识出来,作为文献存储与检索依据的一种文献处理过程. 简单来说,标引就是依据检索语言,确定文献标识的过程.
(二)信息标引的步骤:
1.主题分析:通过讨论文献的中心思想,确定被标引文献的主题概念. 2.概念转换:以主题分析为基础,将确定的主题概念赋予检索标识的过
5
(二)元数据
1.元数据:data about data (关于数据的数据);在互联网中,
元数据是指描述任何互联网数据和资源,促进互联网信息资源 是组织和发现的数据,以协助对网络资源的识别,定位与描述.
2.元数据的作用
(1)定位与检索. (2)著录与描述.描述数据单元的数据元素包括:内容,载体, 位置,获取方式,制作与利用方法. (3)资源管理. (4)资源保护与长期保存.
(1)从标引深度划分:全文自动标引和题名自动标引; (2)从选用的标引词划分:叙词自动标引和关键词自动标引; (3)从标引方式划分:自动赋词标引和自动抽词标引; (4)从标引形成的标识划分:主题自动标引和分类自动标引.
3.自动标引的类型
统计标引法 语言分析标引法 人工智能标引法
9
�
(2)国内
中国国家标准《文献著录总则》 《西文文献著录条列》 《连续出版物著录规则》等
3
2.《文献著录总则》
1983年正式颁布. 目的:在于根据各种类型文献的共同特点,确定文献著录原则,内容, 标识符合,格式等统一规定. 作用:为信息著录提供原则性框架,但并不作为文献著录的直接依据. 《文献著录总则》依据《国际标准书目著录》(ISBD)规定9大著录项目, 大项下设置若干子项.
① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 机读目录的产生与发展
(6)1977年,IFLA 研制UNIMARC (7)1991年,美国图书馆协会接受格式一体 化建议,对USMARC进行一体化 (8)1998年至2000年,一体化的USMARC更 名为MARC21。 (9)2002年推出MARCXML,是目前通用的XML 格式MARC。 (10)在适用于MARC21的MARCXML推出之 后,丹麦国家图书馆致力于开发M arcXchange,这是适用于各种MARC的XML格 式。在由LC接任MarcXchange的维护机构后 ,2008年它正式成为国际标准ISO25577
. . .
100
41
34(11+23)
3.2 CNMARC的逻辑结构
3.数据字段区
A. 10大功能块
0XX 标识块
5XX
相关题名块
主题分析块 知识责任块 国际使用块 国内使用块
1XX 编码信息块 6XX 2XX 著录块 3XX 附注块 7XX 8XX
4XX 连接款目块 9XX
3.2 CNMARC的逻辑结构
第三章 机读目录概述
机读目录的产生与发展 CNMARC的逻辑结构 MARC21
3.1 机读目录的产生与发展
1.在西方发展 (1)1965年,美国国会图书馆开始研制 业务工作采用电子计算机的可能性 (2)1966年2月,进行试验 (3)1966年4月,美国国会图书馆( /index.html)设计 出世界上第一个机读目录格式MARCI (4)1967年,转向MARCII的研制 (5)1969年开始向全国发行MARCII格式 书目磁带,最初称为LCMARC,1983年改为 称为US- MARC,即美国机器可读目录。
【刘国钧简介】
刘国钧(1899~1980)中国图书馆学家。字衡如 。1899年11月15日生于江苏江宁府(今南京市) 。1920年毕业于南京金陵大学哲学系后留校图书 馆工作。1922年赴美国威斯康星大学留学,曾加 修了图书馆学课程。1925年获哲学博士学位,同 年回国,任金陵大学教授兼图书馆主任,北平图 书馆编纂部主任,西北图书馆馆长等职。1929~ 1930年任北平图书馆编纂部主任,主编《图书馆 学季刊》。1930年回金陵大学先后任教授兼图书 馆馆长、文学院院长等职。1937年随金陵大学内 迁成都。1943年去兰州,任西北图书馆筹备主任 ,1944年任馆长,1949年任顾问。
3.2 CNMARC的逻辑结构
机读目录样例
305 $a原英文版于1995年由牛津大学出版社出版 304 $aM.M.考斯泰基,规范译名:M.M.科斯特茨基 320 $a有英文书目(第298~315页) 5101 $aThe political economy of the World trading system$eFrom GATT to WTO$zeng 5171 $a从关贸总协定到世界贸易组织$ACong Guan Mao Zong Xie Ding Dao Shi Jie Mao Yi Zu Zhi 606 $a关税和贸易总协定$x研究 60102$a世界贸易组织$x研究 690 $aF743$v4 701 1$a科斯特茨基$AKe Si Te Ci Ji$g(Kostecki, Michel M. )$4著 702 0$a刘平$ALiu Ping$4译 801 0$aCN$bDATATRANS$c20000321 8564 $u2000/0215/021574.htm 905 $aDATATRANS$b000456$dF743$e145
注释 自动生成 代码 代码 自动生成 自动生成 自动生成 代码 自动生成
3.2 CNMARC的逻辑结构
实例:
01286nam0#2200289###450#
3.2 CNMARC的逻辑结构
2.目次区 由计算机生成的对记录中每个数据字段 的位置的索引。由若干个数据款目构成, 每个数据款目由字段标识符、字段长度和 字段起始字符位置组成,固定长度为12。 通过目次区可以查找MARC记录中某一特 定字段的起始字符位置,一般供系统分析 员排除记录故障时使用,编目员不直接使 用。
1951年到北京,先后任北京大学图书馆学系教授 、系主任。并兼任北京大学学术委员会委员、北 京图书馆顾问等。 1958年起担任北京大学图书馆学系主任。 1979年被推选为中国图书馆学会名誉理事。 1980年6月27日刘国钧因病逝世于北京。刘国钧长 期从事图书馆工作和图书馆学教学研究工作。他 在图书馆学研究上,十分注意理论与实践的结合 和图书馆事业发展的新趋势。他的许多研究成果 ,如图书分类、图书编目、图书馆自动化技术等 ,都对中国图书馆事业的建设和发展起着推动作 用。著有《中国图书分类法》、《图书馆学要旨 》、《图书馆目录》、《中国书史简编》、《刘 国钧图书馆学论文选集》等。 来源:更多的人物可见湖南图书馆网站的人物介 绍栏目/tsgrwjs/
3.3 MARC21 一.字段块
00X: 控制信息段 1XX: 主要款目标目 3XX:载体形态项 5XX:附注字段 7XX:附加、连接 9XX:本地使用 2XX: 题名、版本、出版 4XX:丛编说明字段 6XX:主题检索字段 8XX:丛编附加、馆藏信息
3.3 MARC21
二.必备字段
MARC21/B格式共设183个字段,其中必 备字段为?个 请同学们根据上表指出哪些字段是必备 字段?
3.2 CNMARC的逻辑结构
头标必备、不可重复。 数据元素名称 字符位置 记录长度 0- 4 记录状态 5 执行代码 6- 9 指示符长度 10 子字段标识符长度11 数据基地址 12-16 记录附加定义 17-19 目次区结构 20-23
字符数 5 1 4 1 1 5 3 4
3.2 CNMARC的逻辑结构
MARC记录:简称记录Machine Readable Catalogue MARC记录是书目数据库里的一个信息单元。 每条记录由头标、目次区和若干个字段构成。
CNMARC格式的总体结构图见P55图5-1
ቤተ መጻሕፍቲ ባይዱ
3.2 CNMARC的逻辑结构
1.记录头标区:简称头标。位于记录的开端 ,固定长为24字符,提供本记录的有关参 数。 记录头标区的记录状态、执行代码和记录 附加定义需要人工设定。
【美国国会图书馆简介】
(Library of Congress,United States)建 于1800年,距今已有二百余年的历史,是美国 的官方国家图书馆之一,也是全球最重要的图 书馆之一。美国国会图书馆是在美国国会的支 持下,通过公众基金、美国国会的适当资助、 私营企业的捐助及致力于图书馆工作的全体职 员共同努力建成的,它是美国历史最悠久的联 邦文化机构,已经成为世界上最大知识宝库。 它保存各类收藏近1亿2100万项,超过三分之 二的书籍是以多媒体形式存放的。其中包括很 多稀有图书、特色收藏、世界上最大的地图、 电影胶片和电视片等(除农业技术和临床医学 方面的信息分别由国家农业图书馆和国家医学 图书馆收藏外,其它信息均被国会图书馆收藏 )。
3.2 CNMARC的逻辑结构
2.目次区
字段标识符 字段长度 字段起始字符位置 … … 字段分隔符 (00-02) (03-06) (07-11) 款目1
数据款目
001001100000 010002300011
字段标识符
001 010
字段长度
11 23
字段起始字符位置
0 11(0+11)
100004100034
3.1 机读目录的产生与发展
2.在中国发展 (1)1975年,刘国钧先生发表论文,揭 开了我国机读目录研究工作的序幕。 (2)1979年开始研究,1996年,CNMARC 《中国机读目录通讯格式》发布。 (3)2004年3月出版CNMARC/B《新版中 国机读目录通讯格式》 (4)2003年,MARC21格式使用手册启动 ,向全国各类图书馆提供编制西文数 据数据的统一标准和较为规范的参考 依据。
补充几个基本术语
(1)字段:由字段标识符标识的被定义的 字符串。在CNMARC中,除了00X字段,其 它字段均包含一个或一个以上子字段。其 长度包括字段指示符、子字段标识符、数 据元素和字段分隔符。 (2)子字段:字段内明确定义的最小数据 单元。
补充几个基本术语
(3)字段标识符:用于标识字段的一组符 号,由3位数字字符组成。 (4)指示符:字段中头两个字符位的值。 提供字段内容、字段之间的相互关系以及 数据处理过程中所需操作的附加信息。每 个指示符的值都有其独立的含义。字段指 示符一般为数字或空位。 (5)子字段标识符:由两个字符组成,用 以识别可变长字段中的不同子字段。第1 个字符为子字段分隔符,第2个字符为字 母或数字。
3.3 MARC21
MARC21/B格式共设183个字段,其中必备字 段为7个(P354-360)
– – – – – – – 001 控制号 003控制号标识 005最近一次处理的日期和时间 008定长数据元素 040编目源 245题名说明 300载体形态
3.3 MARC21 三.重要字段说明
3.1 机读目录的产生与发展
(11)MARC的未来 讨论MARC未来时,不可忽视RDA( Resource Description Access )。RDA于 2005年开始编制,目的在于取代已有三十年历 史的AACR2。 IFLA于1998年出版《书目记录的功能需 求》(FRBR, Functional Requirements of Bibliographic Records),提出“作品──内容表 达──载体表现──单件”概念模型,是对文献间 衍生关系的深层揭示。表现这种文献间关系是对 书目系统的新要求,目前所谓的“FRBR化”,是指 通过转换书目记录集,使之符合FRBR的要求,单一 书目记录本身不能实现FRBR显示。因为MARC书目 记录基于“载体表现”,不能有效地表达其上位的 “内容表达”及“作品。