专题:元数据

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结构:抽象、 结构:抽象、设计
二、元数据的语义、结构及句法 元数据的语义、
5. 元数据的结构
示例: 示例:国家图书馆中文元数据结构图
信息总体
保存描述信息
内容信息
参考信息
上下文信息
出处信息
固有信息
描述信息
资源描述
版权管理
管理历史
起源史
认证指示符
结构信息
版源自文库信息
数字化过程
管理历史
原始技术环境
基本抽象格式描述
描述和管理数据在信息评价体系中的位置
一、元数据的概念
7. 元数据在网络信息检索中的作用
管理大量低网路带宽的数据 支持有效的网络信息资源的发现与检索; 支持有效的网络信息资源的发现与检索; 异构信息资源的集成与共享; 异构信息资源的集成与共享; 控制限定检索的信息
一、元数据的概念
8. 元数据在数据仓库中的作用
一、元数据的概念
2. 元数据所存储的信息
元数据存储以下信息: 元数据存储以下信息: 程序集的说明; 程序集的说明; 标识(名称、版本、区域性、公钥) 标识(名称、版本、区域性、公钥) 导出的类型 该程序集所以来的其他程序集 运行所需的安全权限 类型的说明 名称、可见性、 名称、可见性、基类和实现的接口 成员(方法、字段、属性、事件、嵌套的类型) 成员(方法、字段、属性、事件、嵌套的类型) 属性 修饰类型和成员的其他说明性元素
元数据的语义定义可以是在资源分析基础上产生, 元数据的语义定义可以是在资源分析基础上产生,或加以规 范,或引用现有的概念等 语义:分析、 语义:分析、选择与定义
二、元数据的语义、结构及句法 元数据的语义、
元数据应用纲要( Profile) 4. 元数据应用纲要(Application Profile)
数据仓库与数据挖掘
元数据
2009.3.29
一、元数据的概念
1. 元数据是什么
元数据是: 元数据是: 关于数据的数据( Data) 关于数据的数据(Data about Data) 结构化的数据( Data) 结构化的数据(Structured Data about Data) 资源的信息( Resource) 资源的信息(Information about a Resource) 管理控制信息( Information) 管理控制信息(Administrative Information) ……
一、元数据的概念
4. 元数据的特征
元数据是一种编码体系, 元数据是一种编码体系, 是指根据某种标准对元素进行 编码 元数据是用于描述数字化信息资源 元数据为数字化信息资源建立了一种机器可以理解的框 实现描述、整合、 架,实现描述、整合、控制及代理等功能 元数据一经建立便可共享 元数据的结构和完整性以来与信息资源的价值和使用环 境 元数据的开发环境往往是一个变化的分布式环境
二、元数据的语义、结构及句法 元数据的语义、
5. 元数据的结构
元数据由一系列的元素组成, 元数据由一系列的元素组成,元素之间的相互关系形成元数 据的结构 元数据的结构与所描述、管理的资源对象的特性关联, 元数据的结构与所描述、管理的资源对象的特性关联,也与 元数据规范的设计思想和相关抽象模型相关。 元数据规范的设计思想和相关抽象模型相关。可以依据实际 情况选择所需的结构模型, 情况选择所需的结构模型,通常选用树型结构模型
一、元数据的概念
3. 元数据与数据的关系
元数据也是数据, 其本身也可以作为被描述的对象, 元数据也是数据 , 其本身也可以作为被描述的对象 , 描述 它的数据就是元数据 在信息管理系统中, 在信息管理系统中,一般把数据看成是独立的信息单元 元数据可以出现在: 元数据可以出现在: 数据内部 独立于数据 伴随着数据 与数据结合在一起
一、元数据的概念
5. 元数据能解决什么问题
描述(description) 描述(description) 互操作(interoperation) 互操作(interoperation) 数据管理(data management) 数据管理( management) 访问控制(rights management) management) 访问控制( 资源发现( discovery) 资源发现(resources discovery) 内容分级( services) 内容分级(content rating services) 认证(authentication) 认证(authentication)
二、元数据的语义、结构及句法 元数据的语义、
2. 元数据设计流程
规范控制 属性提取
内容专家从资 源利用的角度 提取属性要求 考察需要进行 规范控制的属 性,制定策略
资源分析
分析应用领 域资源特点 和文献利用 方式
建立模型
详细列出相关 实体, 实体,标明其 相互之间的关 系
语义选择定义
限定规则 规范调研
二、元数据的语义、结构及句法 元数据的语义、
4. 元数据应用纲要
元数据应用纲要体现了元数据规范应用设计中的模块化原则, 元数据应用纲要体现了元数据规范应用设计中的模块化原则 , 使元数据规范具有更好的互操作能力, 使元数据规范具有更好的互操作能力 , 并可依据应用的需求 进行不同元数据规范之间的组装 由于语言文化的差异,使用国际上通行的元数据标准与规范 由于语言文化的差异, 时,需要进行本土化
二、元数据的语义、结构及句法 元数据的语义、
5. 元数据的结构
元数据结构需重视元数据扩展的方法与机制, 元数据结构需重视元数据扩展的方法与机制,抽象模型的建 立对元数据方案的规范起到参考作用 元数据结构的设计应考虑到元数据规范或应用纲要的扩展机 制
二、元数据的语义、结构及句法 元数据的语义、
5. 元数据的结构
原则3 原则3:可以自定义相关的编码体系和编码规则 原则4 原则4:可以重新定义所引用概念元素的定义
可以为所引用的标准元素进行适应应用需求的剪裁, 新定 可以为所引用的标准元素进行适应应用需求的剪裁 , 义的引用元素的语义必须是原语义定义的部分或者是缩减 原语义的外延, 原语义的外延 , 而不可以扩大引用元素定义的外延或扩大 其应用范围
描述哪些数据在数据仓库中 定义要进入数据仓库中的数据和从数据仓库中产生的数据 记录根据业务事件发生而随之进行的数据抽取工作时间安 排 记录并检测系统数据一致性的要求和执行情况 衡量数据质量
一、元数据的概念
实例: 9. 实例:数字图书馆中的元数据
类型
管理
定义
用于管理与控制信息资源的元数据
使用实例
采购信息、版权复制记录、 采购信息、版权复制记录、馆藏信 数字化标准、 息、数字化标准、版本控制 目录记录、专门索引、资源间超链、 目录记录、专门索引、资源间超链、 用户所做的注解 资源的物理状态描述文档; 资源的物理状态描述文档;有关保 存资源物理或数字化版本的文档 软件、硬件文档;数字化信息( 软件、硬件文档;数字化信息(格 压缩比等); );系统相应时间记 式、压缩比等);系统相应时间记 安全数据(密码、加密密钥) 录;安全数据(密码、加密密钥) 用户及利用记录;内容重用及多版 用户及利用记录; 本信息
二、元数据的语义、结构及句法 元数据的语义、
元数据应用纲要( Profile) 4. 元数据应用纲要(Application Profile)
元数据纲要规定以下原则: 元数据纲要规定以下原则: 原则1 原则1:元数据元素可以取自一个或多个命名域 原则2:不要定义新的元数据元素 原则2 原则3:可以自定义相关的编码体系和编码规则 原则3 原则4 原则4:可以重新定义所引用概念元素的定义
描述
用于描述与标识信息资源的元数据
保存
与信息资源保存管理相关的元数据
技术
与系统功能相关的元数据或元数据行为模式
使用
与用户级别等相关的有关信息资源的元数据
二、元数据的语义、结构及句法 元数据的语义、
1. 定义
元数据的语义: 元数据的语义:是指元数据的元素定义 元数据的结构: 元数据的结构:描述了各个元数据的元素之间的相互关系 句法与语法规则: 句法与语法规则:规定了元数据体系是如何被表达与描述的
二、元数据的语义、结构及句法 元数据的语义、
4. 元数据应用纲要
原则1: 元数据元素可以取自一个或多个命名域 原则1
通过公开可以访问的资源标识符, 通过公开可以访问的资源标识符 , 保证所引用的元数据是 规范的可辨识的, 规范的可辨识的,也保证了元数据的互操作性
二、元数据的语义、结构及句法 元数据的语义、
4. 元数据应用纲要
原则2 原则2:不要定义新的元数据元素
不意味着不允许根据实际应用情况的需要增加新的元数据 元素,而是增加新的元数据必须定于其命名域,以便辨识 元素, 而是增加新的元数据必须定于其命名域, 和引用, 和引用,满足互操作中语义解析的要求
二、元数据的语义、结构及句法 元数据的语义、
4. 元数据应用纲要
Resource identifier


提供描述、标识或翻译资源知识内容的术语、 提供描述、标识或翻译资源知识内容的术语、关键词及短语 与资源生命周期关联的时间,如创建、出版、修改、 与资源生命周期关联的时间,如创建、出版、修改、访问时间 标识资源使用的限制或法律规则,如访问限制条款、授权访问 标识资源使用的限制或法律规则,如访问限制条款、 方式 有关资源生产、制作、维护、分发负责的实体名称、 有关资源生产、制作、维护、分发负责的实体名称、地点及其 他信息 资源名称、相关短语。可使用编码, 资源名称、相关短语。可使用编码,通常被作为题名使用 标识描述资源知识产权内容的语言、脚本、语言分支、 标识描述资源知识产权内容的语言、脚本、语言分支、方言等 赋予资源唯一名称、字母编码或数字。 赋予资源唯一名称、字母编码或数字。资源标识符具有唯一性 资源内容类型、 资源内容类型、载体类型 负责创建或编辑资源知识产权内容的机构或个人名称 提供资源的版本、 提供资源的版本、版次及版本关联信息等
描述数字、 描述数字、信息资源的内部结构
存取控制性元数据( Metadata) 存取控制性元数据(Access Control Metadata)
描述信息被利用的基本条件和期限, 描述信息被利用的基本条件和期限,以及信息资源的知识产权特征 和使用权限
评价性元数据( management) 评价性元数据(Critical management)
系统验收
验证元数据在 系统中是否达 到设计的功能
数字化图书馆元数据设计流程
二、元数据的语义、结构及句法 元数据的语义、
3. 元数据的语义
不管是描述性元数据, 不管是描述性元数据,还是管理型元数据或其他类型的元数 其本质是描述对象的各种属性及相关关系等内容。 据,其本质是描述对象的各种属性及相关关系等内容。元数 据最基本单元是由一个个元素形成, 据最基本单元是由一个个元素形成,每个元素的语义定义既 明确了其含义, 明确了其含义,也明确了其内涵和外延 语义定义是一个元数据规范的基本要素,也是元数据应用与 语义定义是一个元数据规范的基本要素, 互操作的最为重要的基础
一、元数据的概念
6. 元数据的分类
描述性元数据( Metadata) 描述性元数据(Intellectual Metadata)
一般分为描述性元数据、管理型元数据、结构性元数据, 一般分为描述性元数据、管理型元数据、结构性元数据,描述了信 息资源的主题和内容特征
结构性元数据( Metadata) 结构性元数据(Structural Metadata)
是一种元数据标准的应用形式,也可以看作是一种规范的元 是一种元数据标准的应用形式, 数据规范( schema) 数据规范(metadata schema) 具体做法: 具体做法: 定义所要描述的资源属性,并采取ER分析方法明确所要描 ER分析方法明确所要描 定义所要描述的资源属性,并采取ER 述的资源对象 从不同元数据标准规范中选择使用的元素, 从不同元数据标准规范中选择使用的元素,声明这些元素 的语义、相互关系,建立相关规则, 的语义、相互关系,建立相关规则,来自多个元数据标准 规范的元数据元素应当拥有自己的命名域 声明元素限定或修饰 选择置标方案
国际图联IFLA提出了一个具有10个元素的核心元数据方案 国际图联IFLA提出了一个具有10个元素的核心元数据方案 IFLA提出了一个具有10
序号
1 2 3 4 5 6 7 8 9 10
元素
Subject Data Conditions of use Publisher Name assigned to the resouce Language/mode of expression
元数据专家从 现有标准和相 关项目中获得 参考 分析应用领域 资源特点和利 用方式 制定属性限定 原则
著录规则
制定详细的著 录规则, 录规则,用于 数据加工
置标方案
选择XML/RDF 选择XML/RDF XML置标 、XML置标
系统需求
元数据需求应 作为应用系统 需求的一部分
设计开发
依据功能设定 进行设计开发
相关文档
最新文档