企业数据模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据质量 数据是企业的重要资产,因而数据质量也是至关重要的。异类冗余数据是劣质数
据的重要影响因素。EDM能够自然而然地暴露出冗余数据的数据差异,因而对于数据
ENTERPRISE DATA MODEL
!1
质量是必须的。一旦新的数据系统是基于EDM框架构造的,很多潜在的数据质量问题 在实施之前就能够得以发现并解决。
ESAM的建立遵循企业数据标准,命名方法和一套评审流程。ESAM由业务迭代 验证。当业务一致同意后,主体域被分为高层次数据分类(基础类,交易类和信息类) 并加入宏数据库中。主体域对于企业宏数据战略非常关键,因为所有的数据对象都会 归属于某个主体域。主体域会分配给一个或多个业务域主管。
初看起来,ESAM只是一个简单的图,可能只需几个小时便可以构建出来。但实 际上ESAM需要花更多时间,这是因为需要整个组织机构的参与。这个量级上的协调 和达成一致需要时间。有经验的设计专家对一般大小的企业的建模过程可能是2到3个 月。为了完成这一过程,和业务专家的会议可以是非正式的。但必须要有整个组织的 参与和交互,这是因为ESAM的价值正式对业务的深度理解和共识。
主体域模型的建立 ESAM是在现有企业知识的指导下,由该业务领域内的专家紧密工作开发的。组
织架构和业务功能需要被明确理解。大多数机构通用的主体域(用户,员工,地点和 财务)要首先明确出来。然后明确其余的主体域,最后以一个完整的“官方”主体域列 表和其定义结束。这些还要通过业务专家的审核。
定义和命名每个主体域的过程是很重要的,因为这提供了对机构的重要议题获得 业务边界一致性的机会。这些议题包括了这一类的问题:什么是客户。如果在高层次 能够取得一致,那么更详细的概念就会比较容易定义。在这个过程中,需要为后续 EDM的制定进行的更细致的分析制定优先级。
第一层 第二层 第三层
主体域模型 概念模型 概念实体模 企业数据模型 图1 企业数据模型层次
ENTERPRISE DATA MODEL
!3
企业主体域模型(ESAM) 企业数据是任何对企业重要的数据或者需要保留作他用的数据。任何认为没有用途的 数据将不会被保留。基本上可以认为企业需要考虑的数据是及其巨大的,这样一来, 即使有很大的团队来设计,发展和维护企业数据,也不可能不将其划分为更多可管理 的部分。ESAM的目标就是本着“分而治之”的想法。ESAM涵盖了整个组织机构。业务 所产生或消费的所有数据都由一个主体域表示。通常一个组织机构的主体域的数量为 10到12。更复杂的机构可能会有更多的主体域。ESAM是EDM的框架。
!7
概念描述了一个机构产生和消费的信息,和实施问题与细节无关。概念在ECM按照主 体域分组。一个概念可以表示主体域之间的关系。即使是在这种情况下,概念仅属于 一个主体域。概念有助于进一步定义主体域及其范畴。
概念是主体域定义的细节。概念根据其业务相关性可能有不同程度的细粒度。每个概 念都涵盖了非常大范围或是小部分的数据。关键是概念代表了重要的业务理念而不是 数据的数量。
整合打包应用 EDM能够用于支持打包应用的规划和采购及其集成实施。这个整合可以通过将打
包应用和EDM做“匹配”,明确打包应用和现有系统的集成点,从而通过打包产品为一 致的质量数据流提供路标。
系统战略规划
ENTERPRISE DATA MODEL
!2
由于EDM独立于现有系统,提供了一个战略的视图,也明确了数据相关性。将现 有系统和EDM做匹配,可以进行战略差距分析,明确所需业务战略信息需求。从差距 分析和数据相关性可以决定数据系统的版本优先级别。
概念之间的关系定义了数据之间的依存关系,而不是可选性(需要或者不需要的关系) 或者基数(数字关系;0,1,无限)。一条简单的线用来表示概念之间的业务关系。 不是所有可能的关系都被表示出来。概念并不是表示孤立业务或者孤岛业务,而是业 务的整体视图。概念的边界有可能非常灰色,甚至是关于主体域的概念。灰色地带是 理想的因为这更能代表这一个整体的企业设计。
对于信息类主体域往往会有很多问题,因为它们通常由交易主体域的总结性的或 /和历史数据组成。信息类主体域的定义可能会很像是属于原本的交易主体域。拿航空 公司的主体域为例,预定是一个交易主体域而库存是信息类。库存主体域的一个核心 概念是“预定历史”,包括了能够导出库存的可用座位数据,是一个航空“产品库存”。 预定和库存都很重要但是属于不同的航空主体域。这也是为什么数据分类学对于理解 来说是很有价值的。
3 February 2016
企业数据模型
原文
ᘉᦲғᩇ᩼ ங‫ݩמ‬ғfay347297
引言 企业数据模型是企业整个组织内所有产生和消费的数据概览,并且能够符合行业
情况。企业数据模型(EDM, Enterprise Data Model)是数据单一整合定义,并不偏向任 何系统或者应用。EDM和数据在物理上如何采集,存储,处理和访问完全无关。 EDM统一并规范表示了组织机构的重要事项和相关处理规则。
数据所有权 企业数据由于其本身,尤其是在维护和管理时,的可共享本质,使得数据所有权
非常重要。EDM标识并归档了跨业务和组织边界的数据关系和依存条件,因此被用作 数据所有权管理工具。不仅如此,EDM也支持“共享”所有权的概念,因而对企业数据 规划来说不可或缺。
数据系统可扩展性 EDM支持可扩展的数据体系结构。可扩展性指的是一个系统的功能性可以扩展,
企业概念模型 企业概念模型(ECM)是企业数据模型的第二层,对每个主体域的主要业务概念进行 识别和定义构成了企业概念模型。ECM是一个高层的数据模型,一般每个主体域有1012个概念。这些概念比主体域更பைடு நூலகம்细致地表达了业务细节。ECM由概念及其定义以及 它们之间的关系组成。
数据概念
ENTERPRISE DATA MODEL
主体域的名称应该非常清楚,简明并且综合的;最好用一个词。尽可能使用标准 的业内名称(用户,员工和财务)。由于考虑了所有相关信息,定义是从水平视图上 构想的。定义有助于确定主体域范围。由于要给整个机构看,因此定义很重要,必须 要简单,并且容易理解。不要采用理论,学术或者专利用语。
主体域之间的关系表示了重要的业务交互和依存条件。一条简单的线段用于表示 主体之间的主要业务关系。在这一层次,并没有可选性关系(必须的或者不必须的关 系)或者基数关系(数字关系,0,1,无限)。出于实际考虑并没有表示所有可能的关 系。ESAM并不是想单独表示每个主体域而是强调业务的整体视图,也即关系点。这 些主体域之间的界限是非常“灰色”的。ESAM也可以被认为是一种维恩图,只在一个 主体域内有重叠部分。
ENTERPRISE DATA MODEL
!6
ESAM的颜色和整个EDM一样很重要。每个主体域及其相关概念,以及数据对 象,有着不同的颜色。属于同一主体域的所有数据概念,实体和表格用一种颜色。用 色可以使得在看任何机构的数据模型时能够即刻理解。以图2中的航空公司的14个主体 域为例,才用了14种不同的颜色。随着ESAM制度化,主体域甚至会由其颜色代表。
EDM是用于整合的数据体系框架,标识了可共享或者冗余数据的功能和组织边 界。为了方便,整合的数据提供了一个“唯一版本的真实”。并且减少了数据冗余,数 据歧义,对于数据质量,一致性和正确性也是很关键的。
作为一种数据体系框架,EDM是所有数据系统设计的“出发点”。EDM可以看作 是建筑的设计蓝图;为数据系统的计划,建设和实施提供了一种可视化方法和支持架 构。对于企业数据规划,例如操作型数据存储(ODS)或者数据仓库(DW), EDM都是 必须的,这是因为数据整合是所有这些规划的基础原则。EDM有助于数据整合,减少 数据孤岛,和原有系统保持一致。不仅如此,EDM为其他几种类型的企业规划也发挥 着积极的作用:
• 收入 票务,预定,销售,库存,定价 • 运营 航班,地点,设备,维护,飞行计划
ENTERPRISE DATA MODEL
!4
• 支持 IT, 财务,员工,客户
主体域数据分类法 分类法是基于一系列的准则按照层次结构将事物命名,分类和归类的科学。数据
分类学(*参见数据分类学文章)是将数据按层次结构分类的工具,便于数据系统的理 解,架构,设计,建立和维护。数据分类法包括多层级的归类。在最高层,所有的数 据可以归为3类:基础,交易或者信息,如图3所示。这些类别由数据的产生和概念以 及数据生命周期的类型区分。
主体域可以按照三个高层的业务类别分组:收入,运营和支持。由于每种类别都 表示完全不同的业务交点,这些分组非常重要。收入一类主要和收入活动相关的,包 括收入计划,会计和报告。运营类别代表日常运营的主要业务功能。支持类型辅助业 务活动而不是表示主要业务。所有的机构都有这些高层的业务分组。一个航空公司的 主体域可按如下分组:
数据资源
基础数据
交易数据
信息数据
图3 - 数据分类法
基础数据用于定义,支持或者/和创造其他数据。它包括了参考类型数据,宏数 据和需要用于执行业务交易的数据。交易数据是由业务交易产生或者更新的数据。它 本质上是动态并和运营系统同步。信息数据是历史的,总结的或者导出的数据,通常 由运营数据产生。信息数据主要用于决策支持系统,偶尔也用于运营系统中供运营决 策支持使用。
主体域 每个主体域是数据的一个高层分类,这些数据代表了一个机构所感兴趣的主题的一组 概念。主体域可以表示通用的业务概念(客户,产品,员工和财务)也可以表示行业 特定概念。航空公司的主体域如图2所示。
客户
预定
员工
财务
销售 定价
信息技术 航班
地点
库存
飞行计划 财务 维护 设备
图2 - 航空公司主体域模型/主体域分组
企业数据建模过程对所有的数据系统设计(ODS,DW, data marts 和应用)都采用 一个“自顶向下-自底向上”的方法。该过程从“自顶向下”驱动。EDM是自上而下步骤的 产物。自底向上也很重要,因为能够有效并且实际地利用现有的数据源进行数据设计
EDM有三层分解部分构成。首先生成企业主体域模型(ESAM, Enterprise Subject Area Model), 然后扩展生成企业概念模型(ECM, Enterprise Conceptual Model), 进一步 扩展,生成企业概念实体模型(ECEM, Enterprise Conceptual Entity Model)。尽管这些 模型是互相关联的,但他们都有各自尤其特点和目的。从这个角度上来说,设计EDM 更类似于一种艺术多过一种科学。EDM是基于当时的最可能获得的最佳知识作为一个 整体生成的,随着时间的推移,总能够发现更多的知识。EDM可以按照“层次”来构 思,如图1所示。
主体域可以根据它们的主要数据类别进行分类。在详细层面,主体域包括所有三 种数据类别。归类主要基于主体域中该类的大小,使用和实施。航空公司的14个主体 域可以按如下归类:
• 基础类 - 设备,IT, 员工,销售,地点,客户
ENTERPRISE DATA MODEL
!5
• 交易类 - 票务,预定,航班,财务,维护 • 信息类 - 定价,库存,飞行计划
目标 组织机构方法是将事物组成有序的结构。ESAM提供了按照业务对象而不是应用
或者数据系统组织EDM的结构。企业数据系统(ODS或者DW)也可以由ESAM组织起 来,提供其设计,使用,管理和计划的有序结构。构建ESAM的过程也很重要。这个 过程提供了一个“销售”企业整体数据价值的机会,也能够发现很多机构核心数据的整 合问题。
扩大或延伸,从而有效地满足用户环境不断变化的需求。可扩展的系统可以几乎没有 副作用的情况下增加或者扩展系统功能。基于战略业务角度,并且独立于技术的EDM 支持可扩展性,可以以最小的IT改变代价迎接新的机遇发展。
行业数据整合 没有任何业务是在真空环境中运行的。由于EDM符合外部的视图,或者说是“行
业匹配”, 能够提高企业在其行业中共享通用数据的能力。在同一行业的组织机构往 往消费一些相同的基础数据,例如,用户,位置和供应商。组织机构也可以和相关行 业或者“业务合作伙伴”共享数据。例如,在航空业,数据经常和租车公司共享。EDM 从行业角度符合行业数据整合的框架。
相关文档
最新文档