元数据

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4.2
MARC21(2709)
• 1)元数据结构
• 2)MARC21(2709)在互联网上的发展与 应用
1)元数据结构
• MARC21(2709)(国际标准,即 ISO2709),对每一个用于交换的书目记 录规定了必须遵循的标准记录结构,即每 条MARC记录分为四个区:头标区、目次 区、数据区和记录分隔符。 • 我国国家标准GB2901也遵循同样的格式规 范。
1.2 元数据的功能
• • • • • 支持资源发现 组织数字信息资源 支持资源的互操作 支持数字识别 支持存档和保存
2 元数据的分类
• • • • 1)按元数据复杂程度区分 :略 2)按描述的资源类型区分:略 3)按信息资源利用功能区分 描述元数据、管理元数据、保存元数据、 技术元数据、使用元数据
2)DC元数据类型
• DC有核心DC和扩展DC之分。 • 核心DC指的是DC的15个核心元素:题名、 出版者、形式、类型、标记符、日期和主 题等。 • 扩展DC是在核心DC的基础上引进了修饰词, 如体系修饰词(Scheme),语种修饰词 (Lang),子元素修饰词(Subelement), 进一步明确了元数据的特性。
15个核心元素
4 MARC元数据
4.1 MARC元数据简介 4.2 MARC21(2709) 4.3 MARC21(XML)
4.4 ISO2709与GB2901
4.5 CNMARC
传统的卡片目录
S 种植优良新品种/李登春等主编.—北京 32 气象出版社,1992.08 4015 298页; 7-5029-0961-3 (平) 5.50元. 92303030-31(2) ○
(四)记录分隔符
• MARC格式规定,在每一个MARC记录的 最后面,放置一个专门的符号以表示 该MARC记录的结束。
记录分割符及记录中的符号
子字段标识符 字段分割符
记录分割符
机读目录
2)MARC21在互联网上的发展与应用
• 1992年,美国国会图书馆(LC),美国图书馆协 会(ALA)和OCLC共同提出了MARC的“电子 定位与存取”字段-856字段。此项提议于1993 年1月由“书目信息机读格式委员会”通过,856 成为记录电子信息资源的特定字段。 • 856字段是专门用于记载电子信息资源定位与存 取信息的字段,是在为网络信息资源编目时才特 有的字段。它包含定位与存取电子资源所需要的 信息,第1指示符标识存取方式;第2指示符标识 资源关系。
CNMARC功能块
0XX 标识块 1XX 编码信息块 2XX 著录信息块 3XX 附注块 4XX 连接块 5XX 相关题名块 6XX 主题分析块 7XX 知识责任块 8XX 国际使用块 9XX 本地使用块
3)标识符号
• 数据字段区采用的标识符号有三种:内容 标识符、指示符、分隔符 • 内容标识符:字段标识符(由3位数字组成, 如010)和子字段标识符(由2位字符组成, 第1位为专用符号,如$或@,第2位为字母 或数字) • 指示符:两位数字或字母,位于字段标识 符之后,向计算机提供数据的操作信息 • 字段分隔符:采用专用符号,如#
代码 #
1 2 3 4


完全级
次级1(未核实文献实体) 次级2(在版编目数据) 次级3(不完整记录) Calis定义,订购记录
头标区的分解—著录格式
00890nam0#2200277###45##
代码 # 含 义
完全采用ISBD格式
i
n
部分地或者不完全地ISBD格式
非ISBD格式
(二)地址目次区
第五章 信息资源描述的元数 据方案
1 元数据概述 2 元数据的分类 3 DC元数据 4 MARC元数据
1 元数据概述
1.1 元数据的基本含义 1.2 元数据的功能
导入
Leabharlann Baidu
什么是元数据
简单来说,元数据对于数据来说,类似于一个 人的名片,或者是一本图书馆藏书的卡片。 这个概念相对抽象,下面通过一个例子来说明 什么是元数据(以及元数据标准、元数据库、 元数据记录等等) ?
这张表格每填写好一张,就可以录入成 为元数据库中的一条元数据记录:
1.1 元数据的基本含义
• 关于数据的结构化数据 • 用于描述数据的内容、覆盖范围、质量、管理方 式、数据的所有者、数据的提供方式等信息的数 据,是数据与数据用户之间的桥梁 • 资源的信息 • 编目信息 • 管理、控制信息 • 是一组独立的关于资源的说明 • 定义和描述其它数据的数据
描述
保存
技术
使用
3 DC元数据
1)DC元数据简介
2)DC元数据类型
1)DC元数据简介
• DC是都柏林核心(Dubin Core)的简称, 全称是都柏林核心元素集(Dubin Core Element Set)。 • 都柏林核心集是于1995年3月在美国俄亥俄 州的都柏林召开的第一届元数据研讨会上 提出来的,并以会议所在地的名字命名。 • 都柏林核心以其简练、易用、可扩展等特 性,被广泛认同为网络资源描述元数据集。
编目员输入
记录长度 系统生成
系统 固定
数据基地址 系统生成
头标区的分解—记录状态
00890nam0#2200277###45##
代码 n c 新记录 修改过的记录 含 义
p
...
由在版编目升级的记录
...
头标区的分解—记录类型
00890nam0#2200277###45##
代码 a 含 义
印刷型文字资料
什么是元数据
当我拿着自己的数据光盘去入库归档的 时候,管理员要求我填写一张关于要入
库数据的表格,以便于管理和查阅。
填好这张关于要入库光盘的表格,就是 这张光盘中数据的元数据! 而这一张表格所规定的要填写的内容 (以及填写规定),就可以看作是这个 单位内部的“元数据标准”!
什么是元数据
我们把这张表格中所规定填写的项目, 作为一个一个的属性字段,可以建立一 个关于元数据的数据库———就是元数 据库:
• 目次区紧接在头标区之后,含有一个/多个 目次款目。每个目次长12个字符,用于描 述一个字段; • 3位数字标识字段号、4位数字表示字段长 度、5位数字表示字段起始符位置。由计算 机自动生成。
• 例如: 001001400000003000300014005001400017010002 800031„„
记录头标区 地址目次区 数据字段区 记录分隔符
(一)记录头标区
• 按照国际标准ISO2709-1981的规定 ,头标 区24位,用于记录计算机处理所需要的一 些基本参数,包括记录长度、状态、数据 基地址等信息;
• 例如:00890nam0#2200277###45##
头标区的分解
• 24位,记录长度、状态、数据基地址等 00890nam0#2200277###45##


头标区的分解—书目级别
00890nam0#2200277###45##
代码
m s …


专著
连续出版物 ...
头标区的分解—层次等级代码
00890nam0#2200277###45##
代码 # 含 义
层次等级关系未定
0
...
五层次的记录
...
头标区的分解—编目等级
00890nam0#2200277###45##
目次区分解
• 目次区每个项目描述一个字段,有多少字 段,就有多少个这样的项:
• 001001400000003000300014005001400017…
字段号 字段长度
字段起始位置
(三)数据字段区
• 目次区之后为数据字段区,用于输入有关 信息的各种描述数据,绝大部分由人工输 入。
1)字段结构
元数据分类
类型 管理 定义 用于管理与控制信息资源的元数据 使用实例 • 采购信息 • 版权及复制记录 • 获取权利控制(密级) • 馆藏信息 • 数字化的选择标准 • 版本控制 用于描述与标识信息资源的元数据 • 目录记录 一般为手工制作的元数据 • 专门索引 • 资源之间的超链接 • 用户所做的注解 与信息资源的保存管理相关的元数据 • 资源的物理状态描述文档 • 有关保存资源物理或数字化版本的 文档,例如数据的更新与迁移 与系统功能相关的元数据或元数据行为模式• 硬件及软件文档 • 数字化信息,例如格式、压缩比及缩放比 • 系统响应时间的记录 • 许可及安全数据,例如密码及加密密钥 与用户级别与类型相关的有关信息资源的元数据 • 展出记录 • 用户及利用记录 • 内容重用及多版本信息
4.3 MARC21(XML)
• MARC21(2709)是专业人员的专业格式, 一般人看不懂。为了使普通用户便于阅读和 理解,LC推出了MARC21(XML)格式。 P221
4.4 ISO2709与GB2901
• 没有文献数据的标准,就没有文献管理的 自动化。ISO2709是在MARCⅡ格式的基 础上产生的。参考这一国际标准,我国提 出了国家标准GB2901。
① 定长数据字段。主要包括001记录标识号和 005记录处理时间等以00-标识的字段,不 设指示符和子字段。 ② 变长数据字段。010-999所有字段。其结构:
指 示 符 1 指 示 符 2
子字 子字 段标 数据 段标 数据 识符 识符

字段 分隔 符
2)功能分块
• 数据字段区划分为10个功能块,每个 功能块包含若干个字段。而字段标识 符的第一个(最左边)数字表示字段 所属的功能块。
机读目录
4.1 MARC元数据简介
• MARC( Machine Readable Catalog ),机器 可读目录(简称机读目录),是用于在计算机条 件下描述、存储、交换、控制和检索著录数据的 标准,已成为世界上流行最广的书目元数据标准。
• MARC数据,以代码形式和特定格式结构记录在 计算机存贮载体上,可由计算机进行控制、处理 和编辑输出的目录。其实质是一种元数据。 • MARC数据的交换和共享通过Z39.50协议实现。
MARC的发展历程
• 1965年,美国国会图书馆,MARCⅠ • 1968年,英美两国合作,MARCⅡ • 1973年,国际标准化组织,《磁带上文献 目录信息交换格式》(ISO2709) • 1977年,国际图书馆协会联合会, UNIMARC • 1991年,中国,CNMARC • 1999年,美国国会图书馆、加拿大国家图 书馆、英国图书馆,MARC21
什么是元数据
例如,在一个企业之中,拥有一个专门的数据资料管 理机构,来统一管理各类需要提交和归档的数据资料。 这些要统一入库归档的数据各不相同: 从数据内容来看,可能有管理类、业务类和科学研 究类; 从学科来看,可能有销售、人力资源、财务管理等 等; 从存储类型来看,可能有DBase、EXCEL、文本文 件等等; …… 总之,内容、结构、数据量、介质各不相同。
4.5 CNMARC
• 中国机器可读目录,使我国通用的机读目 录通信格式。
网页描述信息 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"> <!-- saved from url=(0023)http://www.fjnu.edu.cn/ --> <HTML><HEAD> <TITLE>欢迎访问福建师范大学</TITLE> <META http-equiv=Content-Type content="text/html; charset=gb2312"><LINK href="images/web.css" type=text/css rel=stylesheet> <META content="MSHTML 6.00.2800.1589" name=GENERATOR></HEAD>
相关文档
最新文档