数据标准管理实践白皮书

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据标准管理实践白皮书

前言

数据标准(Data Standards)是保障数据的内外部使用和交换的一致性和准确性的规范性约束。数据标准管理是规范数据标准的制定和实施的一系列活动,是数据资产管理的核心活动之一,对于政府和企业提升数据质量、厘清数据构成、打通数据孤岛、加快数据流通、释放数据价值有着至关重要的作用。但是目前,各行业缺少数据标准管理的理论指导和行业实践案例,企业在标准建立、标准审核、标准落地、标准评估等方面仍存在诸多困难。

本白皮书结合了国内外数据管理相关理论知识的最新成果,以及国内数据标准管理的实践经验,对数据标准管理进行了深入探讨。重点辨析了数据标准以及相关内涵,梳理了数据标准分类及体系,概括了数据标准管理的组织架构和制度体系,总结了企业开展数据标准管理面临的挑战,并提出了相关实践建议。相信本白皮书对国内各行业从事数据治理工作的管理者、实践者和研究者都将具有一定参考意义。

目录

一、数据标准概述 (1)

(一) 数据标准的内涵 (1)

(二) 数据标准分类 (2)

(三) 数据标准在数据资产管理中的作用 (7)

二、数据标准管理主要内容 (10)

(一) 标准规划 (10)

(二) 标准制定 (11)

(三) 标准发布 (13)

(四) 标准执行 (14)

(五) 标准维护 (16)

三、数据标准管理的保障措施 (17)

(一) 数据标准管理组织架构 (17)

(二) 数据标准管理制度体系 (17)

四、数据标准管理挑战与建议 (19)

(一) 数据标准管理的挑战 (19)

(二) 数据标准管理的实践原则 (19)

一、数据标准概述

数据标准是进行数据标准化的主要依据,构建一套完整的数据标准体

系是开展数据标准管理工作的良好基础,有利于打通数据底层的互通性,提升数据的可用性。本章从数据标准的概念入手,多角度探讨数据标准的内涵,构建数据标准分类体系,并阐述了数据标准作为数据资产管理核心要素的重要性。

(一) 数据标准的内涵

数据标准(Data Standards)是指保障数据的内外部使用和交换的一致性和准确性的规范性约束1。在数字化过程中,数据是业务活动在信息系统中的真实反映。由于业务对象在信息系统中以数据的形式存在,数据标准相关管理活动均需以业务为基础,并以标准的形式规范业务对象在各信息系统中的统一定义和应用,以提升企业在业务协同、监管合规、数据共享开放、数据分析应用等各方面的能力。

“数据标准”并非是一个专有名词,而是一系列“规范性约束”的抽象。但是,数据标准的具体形态通常是一个或多个数据元的集合,即数据元是数据标准的基本单元。《信息技术数据元的规范与标准化第1 部分数据元的规范与标准化框架》(GB/T 18391.1-2002)将数据元定义为用一组属性描述定义、标识、表示和允许值的数据单元2。表 1 以《银行间市场基础数据元》(JR/T 0065-2019)标准为例,展示了银行间市场基础数据元属性及

1 《数据资产管理实践白皮书 4.0》,中国信息通信研究院,2019.

2 JR/T 0065-2019,《银行间市场基础数据元》

其描述:每一个数据元应由数据元中文名称、数据元英文名称、数据元标识符、说明、数据类型、取值、IMIX 域名七个属性组成,每一个数据元属性的描述包括该属性的注释以及相关标准规则。

表 1 数据元示例-银行间市场基础数据元属性及其描述(JR/T 0065-2019)

(二) 数据标准分类

数据标准是进行数据标准化、消除数据业务歧义的主要参考和依据。对

数据标准进行分类,将有利于数据标准的编制、查询、落地和维护。

数据标准有多种分类方式,对于不同的分类方式,均可采用以数据元为数据标准制定的基本单元构建数据标准体系。本白皮书以银行业、电信业的数据标准分类为例,说明在这种分类方式下的数据标准。

数据可以分为基础类数据和指标类数据。基础类数据指业务流程中直

接产生的,未经过加工和处理的基础业务信息。指标类数据是指具备统计意

义的基础类数据,通常由一个或以上的基础数据根据一定的统计规则计算而得到。相应地,数据标准也可以分为基础类数据标准或指标类数据标准。基础类数据标准是为了统一企业所有业务活动相关数据的一致性和准确性,

解决业务间数据一致性和数据整合,按照数据标准管理过程制定的数据标准。指标类数据标准一般分为基础指标标准和计算指标(又称组合指标)标准。基础指标具有特定业务和经济含义,且仅能通过基础类数据加工获得,计算指标通常由两个以上基础指标计算得出3。并非所有基础类数据和指标类数据都应纳入数据标准的管辖范围。数据标准管辖的数据,通常只是需要在各业务条线、各信息系统之间实现共享和交换的数据,以及为满足监控机构、上级主管部门、各级政府部门的数据报送要求而需要的数据。

在基础类数据标准和指标类数据标准这个框架下,可以根据各自的业务主题进行细分。细分时应尽可能做到涵盖企业的主要业务活动,且涵盖企业生产系统中产生的所有业务数据。以银行业的基础类数据标准和指标类数据标准分类为例(见图1),基础类数据标准分为客户数据标准、产品数据标准、协议数据标准、渠道数据标准、交易数据标准、财务数据标准、资产数据标准、公共代码数据标准、机构和员工数据标准、地域和位置数据标准等。指标类数据标准包括监管合规指标、客户管理指标、风险管理指标、资产负债指标、营销管理指标、综合经营指标等。

基础类数据标准和指标类数据标准通过分别建立基础类数据元和指标类数据元,并将基础类数据元和指标类数据元与数据映射,实现基础类数据标准和指标类数据标准的落地。具体来说,对于结构化数据中的任意一个字段,当其不具备指标特征时,可直接将其与某一业务类别下的基础类数据元

(如包含命名规则、数据类型和值域等属性)映射,实现该字段的标准化(符

3 在企业结构化数据中,还存在标签数据。标签数据是主要反映客观对象的概括性特征,一般由客观对象的基

础或指标数据按一定规则加工而成,因此通常被当作一种指标类数据来管理,但由于标签数据具有多变性、周期

性、时效性且数量非常大,从管理实践上看与指标类数据还存在一定的差异。

相关文档
最新文档