数据治理-百度百科
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据治理
目录
什么是数据治理
什么是应对型数据治理
什么是主动型数据治理
应对型数据治理的缺点及其改进方案
主动数据治理优势、应当避免的问题
主动数据治理最适合哪些领域
何时开始主动数据治理
什么是数据治理
数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。
什么是应对型数据治理
应对型数据治理是指通过客户关系管理(CRM) 等“前台”应用程序
和诸如企业资源规划(ERP) 等“后台”应用程序授权主数据,例如客户、产品、供应商、员工等。然后,数据移动工具将最新的或更新的主数据移动到多领域MDM 系统中。它整理、匹配和合并数据,以创建或更新“黄金记录”,然后同步回原始系统、其它企业应用程序以及数据仓库或商业智能/分析系统。
什么是主动型数据治理
我们如何朝着更主动的架构和数据治理模式前进?第一个要求是我们开始在多领域MDM 系统中直接授权数据,分离传统 CRM 和ERP 系统中的数据录入。当录入系统和记录系统为同一个系统时,应用程序架构很简单。CRM 和 ERP 系统变成主数据的消费者—它们不再创建它。
但是,为了实现此有价值的简化,需要灵活、用户友好的界面。它有助于创建针对不同业务用户(从临时用户到专家)组的用户界面版本,同
时仍然具有完整的数据管理控制台,数据管理员通过该控制台可处理需要人为判断的问题,并跟踪数据质量度量标准和解决异常。
多领域MDM 系统本身的角色发生变化,从在别处输入或更新的数据的被动接收者和整理者变为原始录入系统和记录系统。新记录或修改后的记录通过内部数据治理规则后,MDM 系统通过实时或接近实时的中间件将经过认证的记录发布到CRM 和 ERP 系统以及所有数据仓库或分析系统。如果不需要实时或接近实时的反馈,新记录和更改后的记录可排队等候,以便通过批量集成与企业的其它系统同步。
这一变化还消除了主要的复杂性原因。MDM 系统成为了源系统,企业中的其它应用程序和数据库成为消费系统,而不是让处于复杂源系统网络的中心的MDM 系统位于左侧,而消费系统位于右侧。因此,省去了接近一半的系统集成工作量,并且还省去了映射源系统和其独立且特殊方法(允许数据录入返回到 MDM 系统)的工作。
这看上去是一个激进的步骤,但是它实际上是长期趋势的延续。当企业应用程序套件最初变得通用时,公司假设它们的新CRM 或ERP 系统是唯一的真相来源。但是,随着时间的推移,公司沦为扩散系统和数据库的牺牲品。因此,没有一个前台或后台系统拥有完整的主数据集。
如果您将要添加一个多领域MDM 系统并承认CRM 和 ERP 系统并不是设计用于管理主数据,为何不进行下一步骤并取消它们的创建、更新或删除主数据的功能,而是允许这些系统只能读取和处理主数据呢?
应对型数据治理的缺点及其改进方案
批量集成和应对型数据治理方法引入的时间延迟可能导致业务部门继续操作重复、不完整且不精确的主数据。因此,这会降低多领域 MDM 方案实现在正确的时间向正确的人员提供正确数据这一预期业务目标的能力。在期望被设定为数据将变得干净、精确且及时之后,批量集成引入的时间延迟让人感到沮丧。应对型数据治理(下游数据管理员小组负责整理、去重复、纠正和完成关键主数据)可能导致让人认为“数据治理官僚化”。
应对型数据治理还会导致最终用户将数据管理团队看做“数据质量警察”,并产生相应的官僚化和延迟以及主数据仍然不干净的负面认识。这还将使得MDM 方案更难实现它的所有预期优势,并可能导致更高的数据管理总成本。此方法的风险是组织可能以“两个领域中的最差”而告终,至
少部分上如此–已在MDM 方案中投资,但是只能实现一些潜在优势,即在整个企业内获得干净、精确、及时以及一致的主数据。
有三个方法可超越应对型数据治理。
1. 用户将数据直接输入到多领域 MDM 系统中:用户使用界面友好的前端将数据直接输入到多领域MDM 系统中,但是他们的新记录和现有记录的更新留在暂存区域或保留区域,直到数据管理员审核和认证为止。这之后MDM 系统才接受插入或更新,以便进行完整的整理、匹配、合并,并将“最佳记录”发布到企业的所有其他应用程序。此方法好过将一个完全不同的应用程序(例如CRM 或 ERP 系统)作为
“录入系统”,但是它仍然会出现延迟和效率低下。尽管存在这些缺点,使用暂存区域确实解决了大部分问题,例如不用强制执行重要属性的录入或在创建前不必进行彻底搜索。此外,由于我们并不受传统应用程序或现代 CRM 或ERP 应用程序如何处理数据录入功能的影响,通过不对应对方法进行批量数据移动,我们还大大缩短了时间安排。
2. 用户输入直接传送到多领域 MDM 系统中的数据:在外面输入新记录或更新,但是会立即传送到MDM 系统,以便自动整理、匹配和合并。异常或例外传送到数据管理员的队列,几个管理员便可支持更多最终用户。这是第一个主动方法的改进,因为我们利用MDM 系统的业务规则、数据整理和匹配功能,只要求管理员查看作为整理、匹配和合并流程的例外而弹出的插入或更新。
3. 用户使用特定于数据治理的前端输入数据:第三个方法是允许最终用户直接录入到多领域MDM 系统中,但是应使用专为主动数据治理方法而设计的前端。可专门为最终用户数据录入设定屏幕,您可利用功能齐全的MDM 系统允许的自动化、数据整理、业务规则、搜索和匹配等所有功能。因此,不必首先将数据输入到 MDM 系统的暂存区域中,并且您不需要系统外的单独工作流应用程序。
主动数据治理优势、应当避免的问题
主动数据治理的优势
主动数据治理的第一个优势是可在源头获得主数据。具有严格的“搜索后再创建”功能和强大的业务规则,确保关键字段填充经过批准的值列表或依据第三方数据验证过,新记录的初始质量级别将非常高。