元数据和数据元

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

元数据和数据元
由于最近在做主数据⽅⾯的项⽬,就去各论坛了解了⼀下有关主数据的姿势。

这次来记录⼀下元数据和数据元的区别。

数据元(Data element):⼜称数据类型,通过定义、标识、表⽰以及允许值等⼀系列属性描述的数据单元。

在特定的语义环境中被认为是不可再分的最⼩数据单元。

这个照我的理解啊,应该就是字段了。

没⽑病。

元数据是关于数据的组织、数据域及其关系的信息,简⾔之,元数据就是关于数据的数据。

列举:
数据结构:数据集的名称、关系、字段、约束等;数据集就暂且理解为⼀张表,(名称、关系、字段、约束,可以理解为表的字段、外键关系和索引)
数据部署:数据集的物理位置;就暂且理解为存储在磁盘上的物理路径吧...
数据流:数据集之间的流程依赖关系(⾮参照依赖),包括数据集到另⼀个数据集的规则;
质量度量:数据集上可以计算的度量;
度量逻辑关系:数据集度量之间的逻辑运算关系;
ETL过程:过程运⾏的顺序,并⾏、串⾏;
数据集快照:⼀个时间点上,数据在所有数据集上的分布情况;
星型模式元数据:事实表、维度、属性、层次等;
报表语义层:报表指标的规则、过滤条件物理名称和业务名称的对应;
数据访问⽇志:哪些数据何时被何⼈访问;
质量稽核⽇志:何时、何度量被稽核,其结果;
数据装载⽇志:哪些数据何时被何⼈装载;
就上⾯这些东西在百科上找的,写的⽐较抽象。

以后在⽤的时候也许就能理解关于数据的数据这句话的含义了。

数据元⼀般来说由三部分组成:
a)对象类:思想、概念或真实世界中的事物的集合,它们具有清晰的边界和含义,其特征和⾏为遵循同样的规则。

b)特性:对象类中的所有成员共同具有的⼀个有别于其它的、显著的特征。

c)表⽰:它描述了数据被表达的⽅式。

元数据(Metadata)是描述其它数据的数据(data about other data),或者说是⽤于提供某种资源的有关信息的结构数据(structured data)。

元数据是描述信息资源或数据等对象的数据,其使⽤⽬的在于:识别资源;评价资源;追踪资源在使⽤过程中的变化;实现简单⾼效地管理⼤量⽹络化数据;实现信息资源的有效发现、查找、⼀体化组织和对使⽤资源的有效管理。

元数据的基本特点主要有:
a)元数据⼀经建⽴,便可共享。

元数据的结构和完整性依赖于信息资源的价值和使⽤环境;元数据的开发与利⽤环境往往是⼀个变化的分布式环境;任何⼀种格式都不可能完全满⾜不同团体的不同需要;
b)元数据⾸先是⼀种编码体系。

元数据是⽤来描述数字化信息资源,特别是⽹络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建⽴⼀种机器可理解框架。

元数据体系构建了电⼦政务的逻辑框架和基本模型,从⽽决定了电⼦政务的功能特征、运⾏模式和系统运⾏的总体性能。

电⼦政务的运作都基于元数据来实现。

其主要作⽤有:描述功能、整合功能、控制功能和代理功能。

由于元数据也是数据,因此可以⽤类似数据的⽅法在数据库中进⾏存储和获取。

如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使⽤变得准确⽽⾼效。

⽤户在使⽤数据时可以⾸先查看其元数据以便能够获取⾃⼰所需的信息。

摘⾃《GB/T 19488.1 电⼦政务数据元第1部分:设计和管理规范》
再说说两者的区别吧
数据元是⽤来装载数据的⼀个数据单元(字段)。

元数据是⽤来描述数据的数据,包括数据元。

相关文档
最新文档