数据管控规范标准[详]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1数据管理架构
1.1数据管理平台功能蓝图
数据管理就是对交易中心现有的业务支撑系统的数据进行统一的数据管理、质量管控、并且通过标准的共享模式,实现核心数据统一存储,维护和使用的问题,提升交易中心现有数据的安全存储和高效使用等能力,并更加深入地进行数据挖掘等工作,为中心创造更多的价值。未来的数据管理平台将对中心现有系统的数据进行统一的数据的整合、数据的管控,并运用数据进行统一的服务管控来提升服务共享的水平,为中心的服务提供全方面的数据支撑。数据管理平台的功能蓝图如图所示:
●数据整合域,是对现有业务系统的数据进行采集和清洗转换,并对采集过程中的数
据进行质量检测,来确保整合数据的准确性和可靠性。
●数据管控域,对采集到数据按照其不同的属性进行分类存储管控,对数据的质量、
数据的安全以及信息的生命周期进行统一的管理,并对数据在使用过程的各种信息
进行统计分析。
●服务共享域,利用数据管理平台已有的数据资源,进行自定义的数据服务配置,
定制出符合要求的服务,进行相关服务流程的编排,通过数据中心将服务进行发布。
●服务管理域,主要是对提供的服务进行管理,包括服务应用的管理,服务流程的管
理以及服务监控。
1.2数据集成
数据整合就是将离散于各个业务系统中的数据进行集中化。数据整合阶段主要分为以下三个步骤执行:
●数据类型识别
根据业务使用情况分析目前各个系统中的数据实体,其中哪些是主数据,哪些是非主数据但需要共享的数据,哪些是私有数据。数据类型会作为制定同步规则和清洗规则的重要依据。
●数据同步规则确定
分析采集的各种数据需要达到的同步频率,从实时、准实时到天、月不等,针对不同的同步频率需求结合每次同步的数据量来选择同步方式,ETL(抽取-转化-加载)和ESB(企业服务总线)分别适用于不同场景。ETL本身也有多种具体的技术手段来实现各种情况下的同步,如Hotplug、全表对比、时间戳等。在这里,将根据不同的数据类别和数据使用频度和需求频度等情况,制定出相应的数据同步的机制,采用实时数据整合和批量数据整合两种方式进行数据的整合。
●数据清洗规则确定
在进行数据整合过程中,由于不同系统中可能重复出现的数据,以及数据本身的缺失和错误等问题,为了避免由于不同系统中相同数据由于编码规则、格式之间的差异,在清洗过程中需要制定统一的数据清洗规则,对数据进行清洗和转换,确保数据管理平台中的数据能够保持一致性。
同时,在数据清洗的过程中,需要对采集数据的质量以及清洗后数据的质量进行检测。其中,在数据采集过程中,对采集的数据进行整合,确保采集的数据都能满足质量要求,能够通过正确的清洗和转换;对于转换完成的数据,通过再次的检测,保证转换数据的一致性和正确性,从而确保数据的准确行和权威性。
1.3数据管控
数据管控就是对于进行整合后的数据进行相关的管控,使其能够满足交易中心管理对于数据使用的各种需求。
1.3.1 数据生命周期规划
数据生命周期规划,就是对数据从在各个应用系统的中产生,然后通过各种采集整合手段聚合到数据管理平台,直至最终通过建立各种主题数据仓库提供各种数据服务的整个过程进行规划,使数据能够满足各种业务的使用需要。
数据生命周期规划,把数据划分为以下3个域,分别保存不同阶段的数据:
ADB应用数据库
应用数据库主要是为交易中心主要的业务支撑系统和部管理系统的应用提供数据存储
和访问。在应用数据库只存储支撑本系统运行的数据资源,以满足本系统的使用要求。应用数据库的数据在进行日常业务处理的过程中,不断的进行更新,以便同实际的业务情况保持一致。
●数据管理平台
应用数据库的数据,经过统一的清洗和转换后,进入数据管理平台进行统一的存储管理。在数据管理平台,将通过建立统一的数据视图,为各种数据服务提供数据。数据管理平台的数据更新根据不同的数据需求和应用系统的实际情况进行区分,通过实时的数据采集和批量数据采集两种方式进行。
●数据仓库
数据仓库是为了满足某一特定的决策支持和联机分析而建立的结构化数据环境。交易中心在进行业务活动和部管理的过程中形成了大量的数据资源,利用数据仓库,对已有的数据资源进行深入的挖掘和联机分析,即可以满足交易中心日常的数据查询要求;又可充分挖掘数据涵的意义,为中心的各项业务决策提供良好的支持。例如,根据交易中心目前的使用要求,建立交易信息、企业信息、专家信息的主题数据仓库,为中心的各项活动提供业务支持。
1.3.2 元数据管理
元数据是关于数据的数据,元数据主要用于在数据仓库里描述数据及其环境,它是在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。因此,元数据的管理对于数据仓库有着重要的意义。
在目前的数据管理平台上,将提供对各数据的实体定义和流程管控管理两方面的元数据进行管理。其中,数据实体管理是对各个数据实体来进行实体定义,对实体之间的关系进行约束,实现对数据管理平台里所有数据实体的管理。对于流程管控管理方面,通过制定规的数据流程制度,严格控制数据的流向以及数据在各流程中的情况,对数据管理平台中的各项数据流程进行管控。
1.3.3 主数据管理
主数据是描述核心业务实体(如招标项目、企业和专家)的一个或多个属性,主数据管理具有很高的重要性。首先,完善的主数据管理可以使各个业务视角能获得一致的数据基础,
减少数据差异带来的业务错误和客户投诉,还可以充分发挥各个业务视角数据管理和维护的能力,而不加重业务部门的负担,另外,主数据管理是SOA实施过程中,关键业务对象抽象的重要基础。主数据管理具备以下功能特点:
◆整合:在组织层面上整合了现有应用系统的主数据信息,进行主数据的集中处理。
◆共享:主数据作为组织权威的统一、一致的数据,为组织各应用系统提供准确的共
享数据。
◆统一:实现对于客户、产品和供应商都通用的主数据形式,加速数据输入、检索和
分析。
◆并行管理:支持数据的多用户管理,包括限制某些用户添加、更新或查看维护主数
据的流程的能力。
◆集成能力:集成产品信息管理、客户关系管理、客户数据集成以及可对主数据进行
分析的其他解决方案。
在交易中心的系统中,主要的主数据为招投标项目主数据、企业主数据和专家主数据,各个主数据又由若干个相关实体组成。通过统一的主数据管理,可以规数据的录入和使用,使得数据的存储的一致性,使用的规性。以下为各主数据在进行主数据管理前后的情况列表。