关于元数据、资源目录、主数据、数据元、元数据管理、主数据管理解释ppt课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据统计方面
百度文库
静态元数据
名称 描述 数据类型 关系 生成时间 索引
船员违法 记分信息
记录船员 违法记分
信息
数字型
空 2015/9/2 XXX
动态元数据
入库时间 更新周期 数据质量 统计信息 状态 存储位置 存储大小
引用处
2015/9/3 天
200条 30000条
正常
XXX库/源 头_TABLE
200M
数据元 数据元集信息示例
中文名称 (简称)
姓名名称 (姓名)
性别代码
标识符
PAT00_100020 PAT00_100031
英文名称
定义
对象类
Person-name 由人的姓和名组成的字符串。

Person-sex, code
男性与女性之间的生物学区分,用代 码表示。

年龄(岁)
PAT00_100042
Person-age, years表示人的实际年龄(岁)。

身份证件类别名称 PAT01_100024
Type of identify 表示个人的身份证件类别,如居民身
card
份证、军官证、护照等。

身份证件类别代码 PAT01_100025
数据选择:
支持用户在不必浏览信息对象本身的情况下能够对信息对象有基本的了解和 认识从而决定对检出信息的取舍
数据定位:
提供信息资源本身的位置方面的信息如DOI 信息对象之所在便于信息的获取
URL
URN
等信息由此可准确获知
数据管理:
保存信息资源的加工存档结构使用管理等方面的相关信息以及权限管理版权 所有权使用权防伪措施电子水印电子签名等
• 所建立的数据库中,数据(基本)表的字段名应能从数据元集中选取且具有唯一对应关系; [MSA-S-PT-4:海事云数据中心技术标准-平台数据标准,4.1.2.2 数据元编制规则]。因此可理 解表的列字段即为数据元
数据元 数据元描述示例:船员登记号
数据源特征
数据元属性
分类编号
数据库表中展示内容
标识符 数据元类型 数据格式
船员登记号(“船员”是对象词,“登 记”是特性词、“号”是表示词)
Crew Registration Number chuan-yuan-deng-ji-hao 船员编号 适用于海事全系统 船员的唯一识别号 海事局 部海事局船员处 船员管理系统 部海事局科技信息处
该类数据一旦定义后则不可更改,例外 情况:……(省略)
可再分的最小的数据单元。
• [MSA-S-PT-4:海事云数据中心技术标准-平台数据标准,4.1.2.1 数据基本定义] • 数据元一般来说由三部分组成:对象、特性、表示
举例
• “船舶种类代码”为数据元,“0205”为数据元的值,“船舶种类名称”为数据元,“集装 箱船”为数据元的值
• “船舶种类代码”中,“船舶”为对象词,“种类”是该数据元的特性词,“代码”是该数 据元的表示词。
船员主题/违规违法/记分 信息
我们将要在共享数
据库项目中面对的 元数据
元数据
元数据作用
数据描述: 对信息对象的内容属性等的描述能力是元数据最基本的功能。
支持用户发现资源的能力即利用元数据来更好地组织信息对象建立它们之间
数据检索: 的关系为用户提供多层次多途径的检索体系从而有利于用户便捷快速地发现 其真正需要的信息资源
数据。
数据是手提箱,而元数据是它上面的姓名标牌; 数据是文件夹,而元数据是夹子的标签; 数据是书的内容,元数据是书脊上的杜威十进制数码。
例子太 少啦!
元数据 船员违法记分示例
数据源方面
源系统名称 船员管理系统 行政处罚系统
源系统IP 源系统数据库 源系统表名 源系统类型
*.*.*.* sysbase
数据中心建设概念解释
商占超
目录
数据元 元数据 主数据 元数据管理 主数据管理
数据服务资源目录
目录
数据元 元数据 主数据 元数据管理 主数据管理
数据服务资源目录
元数据
定义 举例
• 元数据 MetaData • 就是“描述数据的数据”或“关于数据的结构化数据” • 哈佛大学数字图书馆项目定义: 元数据是帮助查找、存取、使用和管理信息资源
值域
数据元名称
数据库表中不展示内容, 英文名称
用于理解
中文全拼
同义名词
相关环境
定义
注册机构
提供者
数据库表中不展示内容, 源系统
用于管理
维护者
限制项
属性定义
CY010100001:CY 01 0100 001
船员 基本信息 登记 登记号
CrewRegNum 字符型 an9 代码结构如 C+9位整数数字,C表示船员, 数字表示编号。
TABLE_XXX 内部_核心
*.*.*.* sysbase
TABLE_XXX 内部_核心
数据抽取转换方面
抽取方式 目标表 目标字段 源表
源字段
计算公式
ETL 目标_TABLE 目标_字段 源头_TABLE 源头_字段 源头_字段=源头_字段+目标_字段
WS 目标_TABLE 目标_字段 源头_TABLE 源头_字段 源头_字段=目标_字段
• 一张表是船员基本信息:姓名、编号、培训班,另一张表存放船员的培训课程信息:课程编 号、名称、学分。
• 姓名、编号、培训班、课程编号、学分都是数据元,但这些数据元有自己的元数据,即描述 数据,分别是长度、类型、值域等。
• 对于船员基础信息表而言,姓名、编号、培训班是描述船员基础信息的数据,是它的元数据。 • 对于船员培训信息表而言,课程编号、名称、学分是描述船员培训信息表的数据,是它的元
的信息。 • 是关于数据仓库的数据,指在数据仓库建设过程中所产生的有关数据源定义,
目标定义,转换规则等相关的关键数据。 • 描述数据的内容(what)、覆盖范围(where, when)、质量、管理方式、数据
的所有者(who)、数据的提供方式(how)等信息,是数据与数据用户之间的 桥梁;
以一个船员培训为例
保存资源被使用和被评价的相关信息通过对这些信息的统计分析方便资源的
数据评估: 建立与管理者更好地组织资源并在一定程度上帮助用户确定该信息资源在同 类资源中的重要性
目录
数据元 元数据 主数据 元数据管理 主数据管理
数据服务资源目录
数据元
定义
• 数据元 data element • 用一组属性描述定义、标识、表示和允许值的数据单元。 • [GB/T 18391.1-2002,定义3.14] • 通过定义、标识、表示以及允许值等一系列属性(元数据)描述的数据单元,被认定为是不
相关文档
最新文档