编目精灵--RDA与关联数据
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
选择切合本地编目工作的部分章节
IT界称为应用纲要(application profiles,APs).
RDA工具包:创建工作流程
DC描述集纲要(DSP)
DCMI开发了RDF兼容的应用纲要机读表达,称为 Dublin Core Description Set Profile (DSP) 提供标准格式,方便由部分数据元素创建应用 含RDF兼容元素及与之相关的约束条件 约束条件包括:
可重复性 必备或可选 元素值的类型(纯文本、控制词表,等等)
RDF兼容的应用纲要
为着互操作的目标, 致力于“再用”(reuse) 而非“再发明”(reinvent) 元素与词表可取自任 何有适当定义的集合 很多语义网应用可混 合不同来源元素
元素来源
词表来源
应用纲要
词表来源
元素来源
RDA作为其他领域的元数据集来源
一些核心属性会被所有或大多数纲要采 用,而更专的属性仅用于极少纲要 关键:所有这些定制的纲要应相互兼容, 因为要采用相同定义与注册的数据属性
6. 未来展望
RDF不是令图书馆数据完 美的魔咒,它只是今天的 技术,可能被另一技术取 代 RDF与书目记录系统的不 同在于它允许书目描述进 行交流、延伸、互相影 响,在三元组层次与其他 图书馆或非图书馆来源交 流,对图书馆界的优势显 而易见 MARC记录最初开发时, 只是一种发行LC印刷目录 卡片的更好方式,然而机 读格式使创建联机目录成 为可能,在之前是不可想 象的 现在我们还不知道转变图 书馆数据到新技术会催生 什么创新,但这种可能性 令人好奇,这不只会改变 编目活动,有更灵活的数 据载体,还能建立新的用 户服务
三元组可以表达与XML记录相同的数据,但本质 上不构成记录 三元组难以显示,因为非人可读 三元组的属性既可是字符串,也可以是URL格式 的URI
作品的机读表示
黑泽明导演了《七人の侍》,又名《七武士》,后改编为《七侠荡寇志》
作品的三元组集
《七侠荡寇志》的三元组集
标识符
不论对作品、个人、地点及其他实体或属 性,标识符共享越多,“A即B”的表述越精 确 创建RDF数据的一大问题是:如何为图书 馆创建的所有元数据实例创建标识符
理想状态:每一作品、个人、地点等具有唯一通 用标识符 聚集服务:OCLC把同一书目资源MARC记录归 并为一条
5. 应用纲要
图书馆需创建定制版编目规则
AACR2有600多页、RDA有数百属性,针对的是 编目时可能遇到的各种情况 大量MARC数据研究显示,大部分数据元素极少 使用
RDA工具包的“工作流程”即此定制功能
如“作品”具有“题名”、“形式” 如“个人”具有“名称”、“生年”、“卒年”
2.2 RDA Properties
RDA定义的每一数据元素(data element)被 视为RDF的一个属性(property)
RDA注册版有1300+属性,有些是子属性
直接对应RDA文件中的元素表及定义
属性定义依据语义网传统,含DC社区的扩展
RDA试图成为尽可能完整的元数据集,其 他希望使用RDA的领域(社区)可使用应用纲 要,扩展本地或专业词表 如果RDA仅部分满足机构的需求,也不必 全部重新创建元数据集,应用纲要是支持 数据共享的技术机制
图书馆的应用纲要
图书馆可创建各类应用纲要
特定对象,如视频资料、法律馆藏 特定语言馆藏 简化规则,如最小级编目
未来展望zrdf不是令图书馆数据完美的魔咒它只是今天的技术可能被另一技术取代zrdf与书目记录系统的不同在于它允许书目描述进行交流延伸互相影响在三元组层次与其他图书馆或非图书馆来源交流对图书馆界的优势显而易见zmarc记录最初开发时只是一种发行lc印刷目录卡片的更好方式然而机读格式使创建联机目录成为可能在之前是不可想象的z现在我们还不知道转变图书馆数据到新技术会催生什么创新但这种可能性令人好奇这不只会改变编目活动有更灵活的数据载体还能建立新的用户服务我的解读小结zrda的元数据注册为rda实体属性关系及取值表提供了通向关联数据的基础zrda也因此可以通过应用纲要方式被其他希望互操作的领域所应用z图书馆书目及相关数据的表达需要超越记录层即使以xml表示达到更细粒度的数据层目前以rdf三元组表达才能成为关联数据与其他数据互相沟通形成一个不断生长的信息网z记录是图书馆应用所必须如何把适应关联数据的数据层表达组合为记录格式目前还在探索中
取值 取值 取值
/rdabrowse.htm
2.1 FRBR entities
FRBR实体是RDA元素描述的总组织原则 FRBR实体=RDF类(classes)
如《哈姆雷特》和《白鲸》都是“作品” 如莎士比亚和赫尔曼·梅尔维尔都是“个人”
类具有属性(attributes)=RDF properties
Recording Relationships between . . . 内 部关系(FRBR三组实体)
附录 Appendices: A-L 词表 Glossary
RDA附录
A 大写 B 缩写 RDF三元组 C 首冠词 (triple):主 D 描述性数据句法 体、谓词、 E 检索点控制句法 客体 F 个人名称附加指引 G 头衔 H 公历日期 I 关系指示词:资源与相关个人、家族和团体间 关系(FRBR第1组与第2组实体相互关系) J 关系指示词:作品、内容表达、载体表现和单 件间关系(FRBR第1组实体内部关系) K 关系指示词:个人、家族和团体间关系(FRBR 第2组实体内部关系) L关系指示词:概念、对象、事件和地点间关系 (FRBR第3组实体内部关系)
关联数据问答(Linked Data FAQ)/ 翻译:李佳佳 审校:张春景 刘炜
Outline
1. RDA Background 背景 2. RDA in RDF 3. Maintenance of the Metadata Standard 元数据标准维护 4. RDA Vocabularies and the Bibliographic Record 词表与书目记录 5. Application Profiles 应用纲要 6. A Word about the Future 未来展望
《镜中世界》
1933年电影 Alice in Wonderland
《爱丽斯漫游仙境》
2.3 RDA Value Vocabularies
RDA指导编目员选择用词
现有近70个词表 在元数据注册中被称为词表 在DC文件中被称为取值表(属性值)
使用SKOS定义取值表
与RDF兼容,专用于设计术语表及叙词表 表现概念间关系(如上位概念、下位概念) 有首选或交替的显示与款目词,可用于多语种词 表
4. RDA词表与书目记录
创立以RDF定义词表的目的是建立 数据层(而非记录层)应用间的兼 容 主体 客体 谓词 关联数据依赖于三元组,这是几乎 所有语义网兼容应用都能提供的通 用微格式 如何将数据元素组合进记录格式仍 待讨论
一种假设是以XML格式表达RDA eXtensible Catalog project (XC)提供 RDF兼容与FRBR兼容记录的实例
2. RDA in RDF
三个基本组成部分
FRBR entities FRBR三组实体 RDA properties
来自RDA元素分析的属性,含实体间关系 实体
RDA数据元素(data elements)
属性(Attributes) 关系(Relationships)
属性 属性 属性
RDA Value Vocabularies RDA中的术语表(lists of terms),用 DCAM术语即“取值词表”
RDA工具包:资源链接
Element Sets & Encoding Standards 元素集与编码标准 FRBR FRAD FRSAR MARC Standards Dublin Core Meta Data Initiative Open Archives Initiative OAI-PMH NSDL Registry RDA元素集和词汇的元数据注册 XC Extensible Catalog 开源的新一代OPAC前端
RDA基底材料词表(无上下位关系)
RDA标准乐器组合词表(有上下位关系)
标准乐器 组合词表 (续)
RDA以外的词表
美国国会图书馆:/authorities
LCSH Thesaurus of Graphic Materials MARC Code List for Relators ……
RDA与关联数据
胡小菁 华东师范大学图书馆
2010图书馆前沿技术论坛:关联数据及书目数据 的未来 (2010.8.23 上海)
资源描述与检索(RDA): FRBR框架下的AACR2
正文 0-37
0: Introduction 导言 1-16 (Section1-4)
Recording Attributes of . . . 属性
记录 数据 数据 数据
XC XML作品记录
XC XML内容表达记录
作品 10081
内容表达内容表达 10082 12345
RDF三元组 vs XML记录
要参与关联数据社区,数据必须以RDF三元组而 非XML记录表达
记录将数据元素集装在一个容器中提供应用 三元组使数据中的个别描述与其他描述互相沟通,形成一 个不断生长的信息网
解读 RDA in RDF
Karen Coyle: RDA Vocabularies for a Twenty-First-Century Data Environment, Chapter 4
Library Technology Reports, v.46, no.2, p.26-36
对照阅读:RDA:20世纪的编目规则,D-Lib Magazine, Jan/Feb 2007
美国医学图书馆:Neurocommons Alpha
SKOS格式的MeSH
ISO标准用语表 其他专业词表(医学、法律、艺术、建筑……) ──非语义网格式词表在语义网环境下提供数据重 用的趋势已经出现
3. 元数据标准的维护
机器可操作格式使编目标准中元素的维护简便、 快捷且为大家可见,也方便使用这些元素与词表 的系统即时更新 RDA词表的注册设计了临时词(Provisional terms),用于开发与测试 每个词表可独立维护、互不影响,可由感兴趣社 区管理 可下载机读格式元素与词表可定期接受更新 每个款目有版本戳记用于版本控制,像wiki那样 保留旧版本,方便看到标准的变迁
1. RDA
近10年研究成果,近150年目录与编目思想 积累
指导编目员创建目录款目的规则集 构成书目描述的数据元素的说明
部分取值来自资源本身 部分取值来自控制词表
不是机读记录格式建议 数据记录与数据展示分离
让RDA从概念性转为行动性
DCMI与JSC合作
2007.4.30-5.1在大英图书馆开会 元数据管理组织(Metadata Management Associates)及 志愿者实施 大英图书馆及Siderean软件公司资助
关联数据
关联数据是语义万维网第一种可行的表达形式, 实用且可操作,适用于各种形式的数据。 关联数据是一组最佳实践的集合,它采用RDF (资源描述框架)数据模型,利用URI(统一资 源标识符)命名数据实体,来发布和部署实例数 据和类数据,从而可以通过HTTP协议揭示并获取 这些数据,同时强调数据的相互关联、相互联系 以及有益于人机理解的语境信息。
17 (Section 5)
Recording Primary Relationships . . . 主要 关系(FRBR第1组实体间)
18-23 (Section 6-7)
Recording Relationships to . . . 外部关系 (FRBR第2组实体与第1组实体;作品主题)
24-37 (Section 8-10)
Diane Hillmann 雪城大学
由RDA数据元素创立机器可操作本体(machineactionable ontology) RDA元素集的RDF兼容表达 图书馆编目数据首次以语义网格式表达
Registry of RDA in RDF /rdabrowse.htm
元素项的编码,独立于FRBR实体及项目 (部分项目与多个实体相关)以利扩展
属性的注册项元素
1. Identifier (URI)
/...
2. Name 名称
机器友好格式,如:titleProper
3. Label 标签
特定语言显示标签,如英语用:Title Proper
4. Description 描述
取自RDA词汇的定义,供人阅读,可更换语种
属性的注册项元素(续)
5. Domain 领域
元素所属“类”(FRBR实体),如:FRBR载体表现 无说明表示可不依附FRBR或与FRBR其他实体元素结合
6. Range 值域
受控或非控取值,一般在应用纲要中定义
7. Type 类别rtyOf 上位属性
如“变异题名”有上位属性“题名”
9. hasPropertyOf 下位属性
如“题名”有下位属性“正题名”、“关键题名”、“简略题名”等
属性概要
浏 览 器 显 示
属性描述
机读格式 RDF/XML
关系视为属性
关系视为属性(续)
图书 Through the Looking-Glass
IT界称为应用纲要(application profiles,APs).
RDA工具包:创建工作流程
DC描述集纲要(DSP)
DCMI开发了RDF兼容的应用纲要机读表达,称为 Dublin Core Description Set Profile (DSP) 提供标准格式,方便由部分数据元素创建应用 含RDF兼容元素及与之相关的约束条件 约束条件包括:
可重复性 必备或可选 元素值的类型(纯文本、控制词表,等等)
RDF兼容的应用纲要
为着互操作的目标, 致力于“再用”(reuse) 而非“再发明”(reinvent) 元素与词表可取自任 何有适当定义的集合 很多语义网应用可混 合不同来源元素
元素来源
词表来源
应用纲要
词表来源
元素来源
RDA作为其他领域的元数据集来源
一些核心属性会被所有或大多数纲要采 用,而更专的属性仅用于极少纲要 关键:所有这些定制的纲要应相互兼容, 因为要采用相同定义与注册的数据属性
6. 未来展望
RDF不是令图书馆数据完 美的魔咒,它只是今天的 技术,可能被另一技术取 代 RDF与书目记录系统的不 同在于它允许书目描述进 行交流、延伸、互相影 响,在三元组层次与其他 图书馆或非图书馆来源交 流,对图书馆界的优势显 而易见 MARC记录最初开发时, 只是一种发行LC印刷目录 卡片的更好方式,然而机 读格式使创建联机目录成 为可能,在之前是不可想 象的 现在我们还不知道转变图 书馆数据到新技术会催生 什么创新,但这种可能性 令人好奇,这不只会改变 编目活动,有更灵活的数 据载体,还能建立新的用 户服务
三元组可以表达与XML记录相同的数据,但本质 上不构成记录 三元组难以显示,因为非人可读 三元组的属性既可是字符串,也可以是URL格式 的URI
作品的机读表示
黑泽明导演了《七人の侍》,又名《七武士》,后改编为《七侠荡寇志》
作品的三元组集
《七侠荡寇志》的三元组集
标识符
不论对作品、个人、地点及其他实体或属 性,标识符共享越多,“A即B”的表述越精 确 创建RDF数据的一大问题是:如何为图书 馆创建的所有元数据实例创建标识符
理想状态:每一作品、个人、地点等具有唯一通 用标识符 聚集服务:OCLC把同一书目资源MARC记录归 并为一条
5. 应用纲要
图书馆需创建定制版编目规则
AACR2有600多页、RDA有数百属性,针对的是 编目时可能遇到的各种情况 大量MARC数据研究显示,大部分数据元素极少 使用
RDA工具包的“工作流程”即此定制功能
如“作品”具有“题名”、“形式” 如“个人”具有“名称”、“生年”、“卒年”
2.2 RDA Properties
RDA定义的每一数据元素(data element)被 视为RDF的一个属性(property)
RDA注册版有1300+属性,有些是子属性
直接对应RDA文件中的元素表及定义
属性定义依据语义网传统,含DC社区的扩展
RDA试图成为尽可能完整的元数据集,其 他希望使用RDA的领域(社区)可使用应用纲 要,扩展本地或专业词表 如果RDA仅部分满足机构的需求,也不必 全部重新创建元数据集,应用纲要是支持 数据共享的技术机制
图书馆的应用纲要
图书馆可创建各类应用纲要
特定对象,如视频资料、法律馆藏 特定语言馆藏 简化规则,如最小级编目
未来展望zrdf不是令图书馆数据完美的魔咒它只是今天的技术可能被另一技术取代zrdf与书目记录系统的不同在于它允许书目描述进行交流延伸互相影响在三元组层次与其他图书馆或非图书馆来源交流对图书馆界的优势显而易见zmarc记录最初开发时只是一种发行lc印刷目录卡片的更好方式然而机读格式使创建联机目录成为可能在之前是不可想象的z现在我们还不知道转变图书馆数据到新技术会催生什么创新但这种可能性令人好奇这不只会改变编目活动有更灵活的数据载体还能建立新的用户服务我的解读小结zrda的元数据注册为rda实体属性关系及取值表提供了通向关联数据的基础zrda也因此可以通过应用纲要方式被其他希望互操作的领域所应用z图书馆书目及相关数据的表达需要超越记录层即使以xml表示达到更细粒度的数据层目前以rdf三元组表达才能成为关联数据与其他数据互相沟通形成一个不断生长的信息网z记录是图书馆应用所必须如何把适应关联数据的数据层表达组合为记录格式目前还在探索中
取值 取值 取值
/rdabrowse.htm
2.1 FRBR entities
FRBR实体是RDA元素描述的总组织原则 FRBR实体=RDF类(classes)
如《哈姆雷特》和《白鲸》都是“作品” 如莎士比亚和赫尔曼·梅尔维尔都是“个人”
类具有属性(attributes)=RDF properties
Recording Relationships between . . . 内 部关系(FRBR三组实体)
附录 Appendices: A-L 词表 Glossary
RDA附录
A 大写 B 缩写 RDF三元组 C 首冠词 (triple):主 D 描述性数据句法 体、谓词、 E 检索点控制句法 客体 F 个人名称附加指引 G 头衔 H 公历日期 I 关系指示词:资源与相关个人、家族和团体间 关系(FRBR第1组与第2组实体相互关系) J 关系指示词:作品、内容表达、载体表现和单 件间关系(FRBR第1组实体内部关系) K 关系指示词:个人、家族和团体间关系(FRBR 第2组实体内部关系) L关系指示词:概念、对象、事件和地点间关系 (FRBR第3组实体内部关系)
关联数据问答(Linked Data FAQ)/ 翻译:李佳佳 审校:张春景 刘炜
Outline
1. RDA Background 背景 2. RDA in RDF 3. Maintenance of the Metadata Standard 元数据标准维护 4. RDA Vocabularies and the Bibliographic Record 词表与书目记录 5. Application Profiles 应用纲要 6. A Word about the Future 未来展望
《镜中世界》
1933年电影 Alice in Wonderland
《爱丽斯漫游仙境》
2.3 RDA Value Vocabularies
RDA指导编目员选择用词
现有近70个词表 在元数据注册中被称为词表 在DC文件中被称为取值表(属性值)
使用SKOS定义取值表
与RDF兼容,专用于设计术语表及叙词表 表现概念间关系(如上位概念、下位概念) 有首选或交替的显示与款目词,可用于多语种词 表
4. RDA词表与书目记录
创立以RDF定义词表的目的是建立 数据层(而非记录层)应用间的兼 容 主体 客体 谓词 关联数据依赖于三元组,这是几乎 所有语义网兼容应用都能提供的通 用微格式 如何将数据元素组合进记录格式仍 待讨论
一种假设是以XML格式表达RDA eXtensible Catalog project (XC)提供 RDF兼容与FRBR兼容记录的实例
2. RDA in RDF
三个基本组成部分
FRBR entities FRBR三组实体 RDA properties
来自RDA元素分析的属性,含实体间关系 实体
RDA数据元素(data elements)
属性(Attributes) 关系(Relationships)
属性 属性 属性
RDA Value Vocabularies RDA中的术语表(lists of terms),用 DCAM术语即“取值词表”
RDA工具包:资源链接
Element Sets & Encoding Standards 元素集与编码标准 FRBR FRAD FRSAR MARC Standards Dublin Core Meta Data Initiative Open Archives Initiative OAI-PMH NSDL Registry RDA元素集和词汇的元数据注册 XC Extensible Catalog 开源的新一代OPAC前端
RDA基底材料词表(无上下位关系)
RDA标准乐器组合词表(有上下位关系)
标准乐器 组合词表 (续)
RDA以外的词表
美国国会图书馆:/authorities
LCSH Thesaurus of Graphic Materials MARC Code List for Relators ……
RDA与关联数据
胡小菁 华东师范大学图书馆
2010图书馆前沿技术论坛:关联数据及书目数据 的未来 (2010.8.23 上海)
资源描述与检索(RDA): FRBR框架下的AACR2
正文 0-37
0: Introduction 导言 1-16 (Section1-4)
Recording Attributes of . . . 属性
记录 数据 数据 数据
XC XML作品记录
XC XML内容表达记录
作品 10081
内容表达内容表达 10082 12345
RDF三元组 vs XML记录
要参与关联数据社区,数据必须以RDF三元组而 非XML记录表达
记录将数据元素集装在一个容器中提供应用 三元组使数据中的个别描述与其他描述互相沟通,形成一 个不断生长的信息网
解读 RDA in RDF
Karen Coyle: RDA Vocabularies for a Twenty-First-Century Data Environment, Chapter 4
Library Technology Reports, v.46, no.2, p.26-36
对照阅读:RDA:20世纪的编目规则,D-Lib Magazine, Jan/Feb 2007
美国医学图书馆:Neurocommons Alpha
SKOS格式的MeSH
ISO标准用语表 其他专业词表(医学、法律、艺术、建筑……) ──非语义网格式词表在语义网环境下提供数据重 用的趋势已经出现
3. 元数据标准的维护
机器可操作格式使编目标准中元素的维护简便、 快捷且为大家可见,也方便使用这些元素与词表 的系统即时更新 RDA词表的注册设计了临时词(Provisional terms),用于开发与测试 每个词表可独立维护、互不影响,可由感兴趣社 区管理 可下载机读格式元素与词表可定期接受更新 每个款目有版本戳记用于版本控制,像wiki那样 保留旧版本,方便看到标准的变迁
1. RDA
近10年研究成果,近150年目录与编目思想 积累
指导编目员创建目录款目的规则集 构成书目描述的数据元素的说明
部分取值来自资源本身 部分取值来自控制词表
不是机读记录格式建议 数据记录与数据展示分离
让RDA从概念性转为行动性
DCMI与JSC合作
2007.4.30-5.1在大英图书馆开会 元数据管理组织(Metadata Management Associates)及 志愿者实施 大英图书馆及Siderean软件公司资助
关联数据
关联数据是语义万维网第一种可行的表达形式, 实用且可操作,适用于各种形式的数据。 关联数据是一组最佳实践的集合,它采用RDF (资源描述框架)数据模型,利用URI(统一资 源标识符)命名数据实体,来发布和部署实例数 据和类数据,从而可以通过HTTP协议揭示并获取 这些数据,同时强调数据的相互关联、相互联系 以及有益于人机理解的语境信息。
17 (Section 5)
Recording Primary Relationships . . . 主要 关系(FRBR第1组实体间)
18-23 (Section 6-7)
Recording Relationships to . . . 外部关系 (FRBR第2组实体与第1组实体;作品主题)
24-37 (Section 8-10)
Diane Hillmann 雪城大学
由RDA数据元素创立机器可操作本体(machineactionable ontology) RDA元素集的RDF兼容表达 图书馆编目数据首次以语义网格式表达
Registry of RDA in RDF /rdabrowse.htm
元素项的编码,独立于FRBR实体及项目 (部分项目与多个实体相关)以利扩展
属性的注册项元素
1. Identifier (URI)
/...
2. Name 名称
机器友好格式,如:titleProper
3. Label 标签
特定语言显示标签,如英语用:Title Proper
4. Description 描述
取自RDA词汇的定义,供人阅读,可更换语种
属性的注册项元素(续)
5. Domain 领域
元素所属“类”(FRBR实体),如:FRBR载体表现 无说明表示可不依附FRBR或与FRBR其他实体元素结合
6. Range 值域
受控或非控取值,一般在应用纲要中定义
7. Type 类别rtyOf 上位属性
如“变异题名”有上位属性“题名”
9. hasPropertyOf 下位属性
如“题名”有下位属性“正题名”、“关键题名”、“简略题名”等
属性概要
浏 览 器 显 示
属性描述
机读格式 RDF/XML
关系视为属性
关系视为属性(续)
图书 Through the Looking-Glass