元数据
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元数据字典
最大出现次数
说明元数据实体或元数据元素可以具有的最大实例数目。只出现一次 的用“1”表示,重复出现的用“N”表示。允许不为1的固定出现次数 用相应的数字表示,如“2”、“3”、“4”等。
数据类型
元数据元素的有效值域和允许对该值域内的值进行有效操作的规定。 本标准中使用到的数据类型有字符串型和日期型等。 A. 字符串型 这种数据类型可以包含“元数据字符集”元素指明的字符集的所有字 符,字符串长度从1开始至任意值; B. 日期型 给出年、月和日的值,包含从公元前4712年1月1日到公元4712年12月 31日的任何合法日期。日期的字符串编码是字符串,应当遵守GB/T 7408-2005规定的日期格式。
增加:进行元数据正式注册、备案 修改:对元数据进行更新 废止:从注册系统删除要废止的元数据
– 发布:试用元数据作为标准的元数据由注册机构发布
元数据注册与管理
提交机构、注册机构、注册系统 对元数据进行统一编号
DOI(Digital Object Identifier-数字对象标识 )
《信息技术 元数据注册》( ISO/IEC 11179 , GB/T 18391-2009) 《科技平台 元数据注册与管理》( GB/T 30524-2014 )
元数据的存储
元数据编写软件工具
–XML文件,也可以采用其他形式保存,如数据库 –采用“缩写名”作为臵标
<?xmlversion=“1.0” encoding=”GB2312“ standalone=”no“?> <?xml—stylesheet type=“text/xsl” href= “ mystyle.xsl”?> 〈!-- Metadata for Seismology--〉 <Metadata xmlns:xsd="/2001/XMLSchema"> <Ident > „ </Ident > </Metadata>
– “科技平台 统一身份认证” – “科技平台 一致性测试的原则与方法” – “科技平台 数据元的设计与管理” – “科技平台 元数据汇交接口 报文格式” – “科技平台 元数据汇交接口 汇交流程” –…
科技平台资源核心元数据
包括7个元素和2个实体 7个元素:
–标识符:科技资源的唯一标识编码 –名称 –最新提交日期:最近一次提交核心元数据的日 期 –描述 –关键词 –访问限制:公开级为1,限制级为2 –资源信息链接地址
地震数据 元数据
地震数据:包含《地震数据分类与代码 第1 部分:基本类别》(DB/T11.1-2006)中的 所以类别 元数据:关于数据的数据[GB/T 197102005之4.5]。 地震行业标准: 《地震数据 元数据》 (DB/T 41-2011)
标准编制的依据
依据科学数据共享工程技术标准《元数据 标准化基本原则和方法》(0.9版) 主要参考了科学数据共享工程技术标准 《科学数据共享元数据内容》(1.4版) 地震数据:DB/T 11《地震数据分类与代码》 系列标准 结合地震数据的特征增加了地震数据附加 属性实体和元素。
本标准编制的依据
本标准选用了《科学数据共享元数据内容》 (1.4版)中全部核心元数据、公共元数据 中除元数据扩展信息子集外的全部子集、 实体和元素,以及参考元数据中的部分实 体和元素(包括参照系子集、覆盖范围实 体、标识信息中的部分元素等),并增加 了时间参照系实体。
元数据子集、实体、元素
元数据可分为三个层次:元数据元素、元 数据实体和元数据子集: 元数据元素:元数据的基本单元。 元数据实体:一组说明数据相同特性的元 数据元素。 元数据子集:元数据的子集合,由相关的 元数据实体和元素组成。
元数据与数据元
数据元: 数据元素 ,最基础的数据单元 力求在不同场合的数据表达一致,不出现 相同名称但内涵不同的情况 制定数据元目录,进行统一
元数据作用
• 描述:元数据最基本的功能就在于对数据
资源的内容和位臵进行描述 • 定位:由于网络信息资源是虚拟的,因此, 明确它的为的位臵十分重要。元数据中包 含有关网络数据资源位臵方面的信息和确 定资源的位臵,促进了网络环境中资源的 发行和检索 • 搜索:元数据为搜索提供基础
元数据字典
短名
短名作为元数据元素、实体和子集的标识。
约束/条件
说明元数据实体或元数据元素是否必须选取的属性。包括 必选(M)和可选(O)。 A.必选(M) 表明该元数据实体或元数据元素必须选择。 B.可选(O) 根据实际应用可选择也可不选的元数据实体或元数据元素。 如果一个可选元数据实体未被使用,则该实体所包含的元 素(包括必选元素)也不选用。可选元数据实体可以有必 选元素,但只当可选实体被选用时它们才成为必选的。
台站、测项信息
台站信息表
台站测点信息表
观测站信息表
台站测项分量信息表
主观测与辅助观测对应表
观测设施信息
洞体信息表
地电观测场地信息表 井、泉信息表
洞体测项信息表
地电测项信息表 井泉测项信息表
地磁观测场地信息
仪器信息
仪器信息
仪器信息表 台站仪器运行信息表 台站仪器校准信息表
台站仪器运行参数信息表
台站仪器运行维护信息表
用来描述或识别数据资源 相当于数据目录
基础数据:
是与数据获取、处理等过程密切相关的信息 如台站、观测设施、仪器等方面的信息
前兆数据
基础数据 原始数据 预处理数据 常规数据产品 专业数据产品
前兆基础数据
台站、测项信息
观测设施信息(洞体、井泉、场地等)
仪器信息(仪器、校准、维修、参数等)
地震系统还没有建立元数据注册系统
元数据示例
科技平台标准化
科技平台标准化
2009年成立了“全国科技平台标准化技术 委员会”(SAC/TC 486) 是科技领域内的标准化技术归口组织 秘书处在科技平台中心 地震标准化技术委员会( S发布的科技平台标准:
最好用B/S模式实现元数据录入界面
数据集划分
数据之间应有内在联系 可大可小,但应作为一个整体 视数据性质、用户需求、分发方便性等 比如:
– 固定台站观测,可以一台或一类仪器的时序数 据为一个数据集 – 流动观测,可以一个网一期观测的数据为一个 数据集
元数据注册
元数据注册与管理
包括:
– 元数据提交:提交机构向注册机构提出元数据增加、修改或 废止的申请 – 受理:注册机构对提交的元数据进行审查,确认是否受理 – 评审:注册机构组成评审小组对提交的元数据进行技术评审 – 试用:通过技术评审后,注册机构对元数据进行统一编号、 备案和管理,并发表元数据试用信息 – 维护
地震数据 元数据
周克昌 2015-11-17
《地震数据 元数据》
元数据基本概念
元数据(Meta-data):关于数据的数据
( Data about data ) [GB/T 19710-2005,定义4.5] 是为数据共享而定义的元数据,不包含为 管理数据所需的元数据
元数据与基础数据区别
元数据:
地震数据元数据子集
B.标识信息。元数据描述的数据集的基本信息。 包含唯一标识数据资源的信息。包含有关数 据集名称、内容描述、目的、状态、数据集 分类、维护和更新频率、关键字、空间分辨 率、时间标识、地理覆盖范围、时间覆盖范 围、参考系和联系信息等信息。标识信息实 体是必选的;
地震数据元数据子集
C.质量信息。提供数据集质量的总体评价信息。 包含质量描述、数据源、加工过程、执行的 质量标准、质量管理员、质量等级等。质量 信息实体是可选的;数据集生产者可以通过 这部分内容对数据集质量评价的方法和数据 集的加工生产过程进行详细地描述。而这一 部分也是用户对数据集在数据质量和精度方 面确定是否适合自己使用要求的主要依据
数据分类与代码系列标准
DB/T 4-2003 地震数据分类与代码 第1部分:基本类别
DB/T 4-2003 地震数据分类与代码 第2部分:观测数据
DB/T 4-2003 地震数据分类与代码 第3部分:探测类别
DB/T 4-2003 地震数据分类与代码 第4部分:调查类别
DB/T 2-2003 地震波形数据交换格式
元数据内容说明
地震数据按类描述 是“标识信息”子集中“数据集内容描述” 实体下的一个实体,用于针对观测、探测、 调查、实验、专题等不同获取途径的各类地 震数据,说明其基本属性。在本标准中,该 实体是必选的。
地震数据分类
地震数据分六大类( DB/T11.1《地震数据分 类与代码 第1部分:基本类别》 ): 观测数据 探测数据 调查(考察)数据 实验(试验)数据 专题数据 防震减灾综合数据
元数据作用
• 管理:支持数据资源的存储和使用管理,
包括权限管理、防伪管理、使用管理等 • 评估:元数据提供数据资源的名称、内容、 格式、制作者等基本属性,使用户在无需 浏览数据资源的情况下酒客对数据资源具 备基本了解和认识,参照有关标准,即可 对其价值进行必要的评估,作为存储和利 用的参考 • 选择:根据元数据提供的信息,用户能够 做出对数据资源取舍的决定
元数据字典
域
可以取值的范围。对于一个元数据元素,域说 明该元素允许的值或使用自由文本。“自由文 本”表明对字段的内容没有限制。应使用基于 整型的代码表示包含代码表的域。
地震数据元数据子集
地震数据元数据5个元数据子集,每个子集 包含一个或多个相关的元数据实体和元素
地震数据元数据子集
A.元数据实体信息。有关元数据的当前信息。 包含元数据标识、字符集、采用的元数据标 准、创建或更新日期以及元数据维护方的信 息。元数据实体信息是必选的;
元数据字典
采用表格方式定义和描述地震数据元数据 实体和元数据元素(表1) 所使用的描述元素包括编号、名称、英文 名称、短名、定义、约束/条件、最大出现次 数、数据类型和域。 表中每行代表一个实体或元素,其中带晕 线的行代表实体,其它行代表元素。
元数据字典
编号
采用了层次型的编号。编号表示元数据元素或实 体在元数据字典中的层次和顺序。 最高层由数字“1”、“2”、“3”、“4”等表示,其 它层的编号由“.”号分隔的若干组数字组成,每组数 据为一节,最后一节表示在层次内的顺序,其前面 的节表示层次和在该层内的顺序。 如,“1.2”表示该元素属于第2层,是最高层编号 为“1”的元数据实体的元素,在该实体的元素和实 体中排序第2,依次类推。
元数据内容说明
数据分类 本标准中的数据分类采用DB/T11.1《地震 数据分类与代码 第1部分:基本类别》和 DB/T11.2《地震数据分类与代码 第2部分: 观测数据》中规定的地震数据分类与代码。 对于观测、探测数据,可使用DB/T11.2、 DB/T11.3中给出的小类代码。对于调查、实 验和专项等数据,目前还未划分小类,可使 用DB/T11.1中给出的中类代码。
–GB/T 30522-2014《科技平台 元数据标准化基 本原则与方法》 –GB/T 30523-2014《科技平台 资源核心元数据》 –GB/T 30524-2014《科技平台 元数据注册与管 理》 –GB/Z 30525-2014《科技平台标准化工作指南》 (指导性技术文件)
科技平台标准化
正在制定的科技平台标准:
地震数据元数据子集
D.分发信息。分发信息包含有关数据集分发的 格式、数据量、介质、分发订购程序、用户 获取资源的途径、以及分发者的信息。分发 信息实体是必选的;通过分发信息,用户可 以了解到数据集在何处,怎样获取、获取介 质以及获取费用等信息
地震数据元数据子集
E.限制信息。限制信息包含访问和使用资源的 约束或限制。包含安全限制分级、访问限制、 使用限制、用户注意事项等。限制信息实体 是必选的。
科技平台资源核心元数据
2个实体: 提交机构
–机构名称、通信地址、邮政编码、联系电话、 电子邮箱
资源类别
–类目名称、类目代码、分类标准名称、分类标 准版本
科技部数据汇交要求
科技基础性工作专项、973项目等 数据汇交方案:按任务书要求,要交哪些
数据? 元数据汇交:数据资源基本信息的描述 数据实体汇交:按照汇交方案应进行汇交 的数据、数据文档、相关辅助软件、专著 论文等 应该在项目验收前完成,否则影响验收 数据接收:中国科学院地理科学与资源研 究所