数据治理与大数据平台设计PPT课件
大数据时代的数据治理ppt课件
数据获取
找到数据 提供数据 使用数据 治理数据 数据运维
数据准备
数据服务开发
数据共享发布
自助化 自动化 规范化 可视化 智能化
业务元数据与技术元数据对接; 自助化数据申请和订阅。
基于数据目录的数据服务开发; 在线编辑数据模型,生成作业。
数据服务标准应用方式; 数据通道提供平台支撑。
基于数据地图形成全链路监控; 事前、事中、事后的数据质量检查。
全局的数据资产监控 数据问题跟踪能力
资金是运动的价值,资金的价值是随 时间变 化而变 化的, 是时间 的函数 ,随时 间的推 移而增 值,其 增值的 这部分 资金就 是原有 资金的 时间价 值
大数据治理产品
亿信华辰-睿治普元-数据众包• 对开发人员:通过元数据管理能管控系统的开发上线、提 升开发规范性,自动生成上线脚本,降低开发工作难度和 出错几率
• 对运维人员:通过元数据管理能让日常巡检、版本维护等 工作变得简单可控,辅助日常问题分析查找,简化运维工 作。
资金是运动的价值,资金的价值是随 时间变 化而变 化的, 是时间 的函数 ,随时 间的推 移而增 值,其 增值的 这部分 资金就 是原有 资金的 时间价 值
大数据治理阶段
0 1
摸家底
全面梳理企业信息 自动构建数据资产库
0 2
建体系
建立数据标准 提升数据质量
0 3
促应用
形成企业知识图谱 为全企业提供数据价值
资金是运动的价值,资金的价值是随 时间变 化而变 化的, 是时间 的函数 ,随时 间的推 移而增 值,其 增值的 这部分 资金就 是原有 资金的 时间价 值
···
资金是运动的价值,资金的价值是随 时间变 化而变 化的, 是时间 的函数 ,随时 间的推 移而增 值,其 增值的 这部分 资金就 是原有 资金的 时间价 值
数据治理课件
规范数据的跨境流动,确保数据安全和隐私权益 。
数据安全和隐私保护的技术手段
加密技术
对数据进行加密处理, 确保数据在传输和存储 过程中的机密性和完整
性。
访问控制技术
限制对数据的访问权限 ,防止未经授权的访问
和泄露。
数据脱敏技术
对敏感数据进行脱敏处 理,避免敏感信息的泄
露。
审计监控技术
数据治理课件
目录
• 数据治理概述 • 数据治理的组织和角色 • 数据质量管理 • 数据安全和隐私保护 • 数据架构和数据模型管理 • 数据生命周期管理
01
数据治理概述
数据治理的定义01Βιβλιοθήκη 0203定义
数据治理是对数据资产的 管理活动,确保数据质量 、安全性、可靠性和一致 性。
目的
通过数据治理,提高企业 的数据管理能力,提升数 据价值,为企业决策提供 支持。
数据质量度量
数据质量度量是对数据质量的量化评估,通过一系列的指标 来衡量数据质量的水平,如准确率、完整性率、一致性比率 、及时性等。
数据质量问题的解决和预防
数据质量问题识别
通过数据质量评估和度量,可以 识别出数据质量问题,如数据不 准确、不完整、不一致、不及时
等。
数据质量问题解决
针对识别出的数据质量问题,采 取相应的措施进行解决,如数据 清洗、数据修正、数据补充等。
数据采集、存储、处理、归档和销毁的实践和策略
总结词
数据采集、存储、处理、归档和销毁是数据 生命周期管理的重要环节,需要制定相应的 实践和策略来确保数据的准确性和完整性。
详细描述
在数据生命周期管理中,数据的采集、存储 、处理、归档和销毁是非常关键的环节。为 了确保数据的准确性和完整性,需要制定相 应的实践和策略。这些实践和策略包括:数 据采集的方法和标准、数据存储的架构和规 范、数据处理的分析和算法、数据归档的存
大数据时代的数据管理与治理培训课件
05
企业级数据管理与治理案例 分析
学员心得体会分享
加深了对大数据及数据管 理与治理的理解
增强了对企业级数据管理 和治理实践的认识
掌握了数据管理和治理的 基本方法和工具
意识到数据安全和隐私保 护的重要性
未来发展趋势预测
大数据技术将持续创新,推 动数据管理与治理发展
04
企业级数据管理与治理将更 加注重跨部门、跨领域协同 合作
01 03
数据管理与治理将更加注重 业务价值实现
02
数据安全与隐私保护将成为 重要关注点
THANKS
感谢观看
支持。
06
企业级数据管理与治理实践案 例分享
Chapter
金融行业:风险防控和客户关系管理
风险防控
利用大数据分析技术,构建全面的风 险评估模型,实时监测市场动态和交 易行为,有效识别潜在风险,为金融 机构提供科学决策支持。
客户关系管理
通过数据挖掘和分析,深入了解客户需 求和行为特征,实现个性化产品推荐和 精准营销,提升客户满意度和忠诚度。
数据压缩与加密
减少存储空间占用,提高 数据安全性
存储优化策略
数据分区、数据备份与恢 复、存储资源动态管理等
数据安全保障措施
数据加密技术
保护数据在传输和存储过程中的 安全性
01
02
数据审计与监控
03
记录数据操作日志,实时监测异 常数据访问行为
04
访问控制策略
基于角色或属性的访问控制,防 止未经授权的数据访问
医疗行业:精准医疗和智慧健康服务
精准医疗
基于大数据和人工智能技术,对海 量医疗数据进行深度挖掘和分析, 实现精准诊断和治疗方案制定,提 高医疗质量和效率。
2024版大数据时代的数据治理ppt课件
2023REPORTING 大数据时代的数据治理ppt课件•数据治理概述•大数据时代下的数据挑战•数据治理的关键技术•数据治理的实施步骤•数据治理的实践案例•数据治理的未来展望目录20232023REPORTINGPART01数据治理概述数据治理的定义与重要性定义数据治理是一种组织范围内的数据管理策略,旨在确保数据质量、安全性和有效利用,以满足组织战略和业务目标。
重要性随着大数据时代的到来,数据已成为企业核心竞争力的重要组成部分。
数据治理能够确保数据的准确性、一致性和可靠性,提高数据价值,降低数据风险,从而为企业创造更多商业机会。
以数据管理为主,关注数据存储、备份和恢复等基础设施层面的问题。
初级阶段数据管理逐渐演变为数据治理,关注数据的全生命周期管理,包括数据质量、安全、隐私等方面。
发展阶段数据治理成为企业战略层面的重要议题,与业务战略紧密结合,实现数据驱动的企业决策和优化。
成熟阶段确保数据质量保障数据安全促进数据利用遵守法规要求通过建立数据质量标准和检测机制,确保数据的准确性、完整性、一致性和及时性。
通过合理的数据共享和交换机制,推动数据在组织内部的充分利用,提高数据价值。
制定和执行数据安全策略,防止数据泄露、篡改和损坏,确保数据的机密性、完整性和可用性。
确保数据处理活动符合相关法律法规和行业标准的要求,降低合规风险。
2023REPORTINGPART02大数据时代下的数据挑战随着互联网、物联网等技术的普及,数据产生速度呈指数级增长,给数据存储和处理带来巨大压力。
数据产生速度加快数据存储成本上升数据管理难度增加大规模数据的存储需要庞大的存储空间,导致存储成本不断攀升。
海量数据的管理和维护变得异常复杂,需要高效的数据管理技术和工具。
030201数据量的爆炸式增长03数据语义丰富数据的含义和背景信息千差万别,需要深入挖掘和理解数据的内在含义。
01结构化数据与非结构化数据并存除了传统的结构化数据外,非结构化数据如文本、图片、视频等日益增多,给数据处理和分析带来挑战。
大数据治理解决方案ppt课件
7.1业务词库
业务词库
业务词库是企业用于传达 其对信息的认识的语言。 创建并维护该层业务元数 据,对表达要求的含义和 描述IT系统可用的信息至关 重要。
业业务务词词库库保保证证了信了息信开息发开的发准 确的性准和确速性度和。速度。
术语代表着企业和业务层 面对信息的理解,所以许 多组织倾向于自下而上创 建数据词典,对已有的信 息进行归类。
12
从非结构化文件中采集元数据,支持企业搜索
创建非结构化数据的索引,也是元数据的一种形式,许多企业的搜索供应商已开发 相应工具。
保险业
通过向呼叫人员提供客服关怀、告警、保单和客 户信息文件等多个文件库的可搜索访问,可将平 均处理时间减少三秒,年节约数百万美元。
制药业
通过提供对EMC Documentum、文件系统、 微软Share-Point、内网和外部数据库中客户、 患者和研究数据的快速访问,加快科研进程。
➢ 数据架构:结构化和非结构化数据系统及应用的架构 式设计,用于实现数据的可用性,并将数据分配给合 适的用户。
➢ 元数据:指用于创建常见的语义定义、IT术语、数据模 型和数据库的方法和工具。
➢ 审计信息日志和报告:指监测和测量数据价值、风险 和信息治理有效性的组织流程。
➢ 数据结构和认识:如关键角色的职位说明中,是 否包含大数据治理,如配备首席数据官和信息治 理官?
执行大数据隐 私政策
大数据治理团队可以通过 使用数据分析工具发现敏 感的大数据,以监督对政 策的遵从度。
10
从相关的大数据存储中输入技术元数据
在创建业务词库后大数据治理团队需要从大数据源中采集合用的、相关的元数据。
数据库 文件
结构化
信息管理经销商
元数据
《大数据平台简介》课件
B
C
D
可扩展性强
大数据平台采用分布式架构,可以根据业 务需求进行横向和纵向的扩展,满足企业 不断增长的数据处理需求。
数据整合能力强
大数据平台能够整合不同来源、不同格式 的数据,实现数据的统一管理和分析。
挑战分析
数据安全风险高
随着数据量的增长,数据安 全问题也日益突出,如何保 障数据的安全和隐私成为大 数据平台面临的重要挑战。
定义
大数据平台是一个集数据存储、处理、分 析和管理于一体的综合性系统,旨在高效 处理大规模数据集,挖掘其潜在价值。
高效性
具备高性能的数据处理能力,能够快速处 理和分析大规模数据。
可靠性
提供数据备份、恢复和容错机制,确保数 据安全可靠。
扩展性
具备水平扩展和垂直扩展能力,可根据业 务需求灵活增加计算和存储资源。
大数据平台的应用场景
数据分析与挖掘
对海量数据进行深入分析和挖掘,发现 潜在规律和趋势,为企业决策提供支持
。
数据科学与机器学习
利用大数据平台进行数据建模、特征 工程、模型训练和评估等,支持机器
学习和人工智能应用。
数据仓库与报表
构建企业级数据仓库,提供标准化的 报表和查询服务,满足企业日常运营 和管理的需求。
05
CATALOGUE
大数据平台案例分析
案例一:某电商的大数据平台建设
总结词
该电商企业通过大数据平台建设,实现 了精准营销、个性化推荐和供应链优化 。
VS
详细描述
该电商企业利用大数据技术,收集并分析 用户行为、购买历史、浏览记录等数据, 实现了个性化推荐和精准营销。同时,通 过大数据分析,优化了供应链管理,降低 了库存成本,提高了运营效率。
大数据治理PPT课件第1章大数据治理的背景和基本概念
10. 数据资产化 数据作为一种新型资产,如果不能被良好管理,也可能变成一种“负债”。如 何管理数据资产,“盘活”数据以充分释放其附加价值非常重要。
11. 安全和隐私 作为以互联网为依托的大数据,它将面临着网络带来的各种安全风险,这些风 险威胁到大数据的安全,并可能给用户造成利益损失。在科学研究、产品开发、数据公开 的过程中,算法需要收集、使用用户数据,因此,一些个人或敏感数据数据就不可避免的 面临安全风险。如何保护数据安全和用户隐私是顺利实施大数据治理的最基础的问题之一。
第1章 大数据治ห้องสมุดไป่ตู้的背景和 基本概念
数据治理是数据管理框架的核心职能
1.1大数据治理的定义
大数据治理则是面向大数据的数据治理,其定义如下: 大数据治理是广义信息治理计划的一部分,即制定与大数据有关的数据优化、隐私保护 与数据变现的政策。
包括以下内涵 (1)大数据治理是广义信息治理计划的一部分。信息治理机构必须将大数据整合到既有的 信息治理框架中。 (2)大数据治理关乎政策制定。这里的政策是指人们在特定情形下采取的措施。如大数据 治理政策可能申明:“未经顾客知情并同意,组织不得将顾客的Facebook资料整合到其主数据 记录中”。 (3)大数据必须优化。与企业对实物资产的优化管理类似,组织必须对大数据进行优化, 包括元数据管理、数据质量管理、信息生命周期管理等。 (4)大数据必须变现。变现的方式既可以是直接将数据卖给第三方,也可以是利用数据开 发新的服务。 (5)大数据的安全隐私至关重要。在处理社交媒体、地理定位、生物计量学和其他形式的 个人可识别信息(Personally Identifiable Information,PII)时,组织必须制定适当的政策,以 防止大数据误用带来的声誉、法律等方面的各种风险。 (6)大数据治理必须对各种冲突进行协调。基于不同目标,大数据往往会带来多种冲突, 如客户隐私与企业利益之间的冲突、计算代价和服务质量之间的冲突等。 信息治理(Information Governance)即领导、指导、控制、提供保障的行为或过程,通过这 些行为或过程,信息被当作贯穿于整个企业的资源得以有效管理,其中包括解决信息冲突问 题方面的管理。
社会综合治理大数据分析云平台解决方案课件
市民便捷生活 资源大量消耗 空间过度集中 经济结构失衡 环境严重污染 社会矛盾激化
建立健全基本公共服务体系;加强和创新
召
社会管理;积极稳妥推动城镇化。
唤
建设服务政府、责任政府、法治政府、廉 洁政府。 全面推进社会主义经济、政治、 文化、社会、生态文明建设。
社会综合治理全面发展
社会网格化管理的创新趋势
小区服务
平 台
家政服务
社会综治服务层面需求分析
网格化基层治理平台将基层治理界域进一步细化为便于复制和考核的网格模式, 按照“网格统一划分、人员统一配备、信息统一采集、资源统一整合、服务统 一标准,事项统一处理”原则,从管理机制、队伍建设、服务模式、技术手段 等方面,打造基层治理“一网统管”,落地“街乡吹哨、部门报到”和“接诉 即办”,推动基层治理的精细化创新升级。
部门业务数 据库
服务中心 信息处理 管理考核
执行单元 信息采集 主动服务
五级穿透
一级 二级 三级 四级 五级
城市综合服务治理中心
市级网格化社会服务治理指挥中心
结果反馈 派
事件上报
任务指派
任务指
区、县网格化治理中心 任务指派 区、县派出所、网格化处置部门
结果反馈
事件上报
任务指派
任务指派
街、镇网格化治理中心 任务指派 街、镇派出所、网格化处置部门
社会服务治理创新模式下的智慧应用框架
业务 目标
创新治理模式,整合公共资源,提升乡镇管理效率,提供便捷服务
公文流转
公告通知
乡 党建管理 镇
统计报表
管 理
沟通平台
基础数据
三位一体 乡镇治理 服务门户 PAD应用 城市综合服务治理平台
大数据平台开发课件PPT
仪表盘设计
信息图表
讲解设计仪表盘的原则和技巧, 用于直观展示大数据分析结果。
掌握信息图表的制作方法,将 复杂的数据转化为简洁有力的 图形展示。
数据安全与保护
数据隐私
讨论大数据平台中数据隐 私的问题和挑战,以及隐 私保护的解决方案。
安全性
介绍保护大数据平台安全 的措施,包括身份验证、 访问控制和数据加密。
大数据平台开发课件PPT
本课件介绍大数据平台开发过程和关键内容。了解大数据平台的概述、构建 与架构、数据存储与管理、数据分析与处理等内容。
课程介绍
通过本课程,您将掌握大数据平台开发的核心理论和实践技能。了解大数据 平台的基本概念、应用场景和未来发展趋势。
大数据平台概述
概念与定义
学习大数据的定义、特点和重 要性,以及大数据对各行业的 影响。
灾备与恢复
讲解灾备和恢复的策略和 方法,确保数据的完整性 和持续可用性。
数据采集与清洗
了解数据采集的方法和技术,以及数据清洗的重要性和常用的清洗方法。
解释分布式计算的概念和原理,介绍常见的 分布式计算框架。
架构设计
深入研究大数据平台的架构设计原则和最佳 实践。
数据存储与管理
存储技术
介绍常见的大数据存储技术, 如HDFS、NoSQL数据库等。
数据管理
数据治理
讨论数据的收集、清洗性, 以及如何制定数据管理策略。
数据爆炸
了解大数据时代产生的原因和 背景,掌握大数据的规模和增 长速度。
三个V
介绍大数据的三个特征:数据 量大、数据速度快、数据种类 多。
平台构建与架构
基础设施
构建大数据平台所需的硬件、网络和软件基 础设施。
容错与可扩展性
大数据时代的数据治理ppt课件
基于数据地图形成全链路监控; 事前、事中、事后的数据质量检查。
全局的数据资产监控 数据问题跟踪能力
亿信华辰-睿治普元-数据众包ห้องสมุดไป่ตู้
平台化、可视化、智能化
睿治是一款覆盖数据全生命周期的数据治理平 台,它通过对数据从创建到消亡全过程的监控 和治理,实现数据的统一管理,保证了业务数 据在采集、集中、转换、存储、应用整个过程 中的完整性、准确性、一致性和时效性。
全貌和数据关系 • 通过H5等流行的展现技术实现各浏览器的兼容 • 支持界面的移植
关注用户诉求、结合使用场景
• 对业务人员:通过元数据管理的业务需求管理,能更容 易地和技术人员沟通,便于需求的技术落地
• 对开发人员:通过元数据管理能管控系统的开发上线、 提升开发规范性,自动生成上线脚本,降低开发工作难 度和出错几率
1
新一代数据平台
数
据
难以基于海量数
平
据进行业务创新
台 发
大数据处理
展
跨平台数据传
情
数据使用者无法
输困难
况
理解数据模型
数据之间没 有统一标准
数据难以快速 集成和共享
“数据仓库”概 第一个DW 念提出
数据集市
Hadoop项目诞生
大数据计算
数据质量 问题堪忧
传统数据仓库兴起
1981 1988 1992 1996 1999 2003 2005 2007 2009 2011 2013 2019
全配置、自部署、零干预;动态缺失数据探查 多维接入,自动化血缘与影响力分析
数据团队
一站式的数据众包服务,可根据特定领域、特 定场景的客户需求,提供定制化的数据获取与 加工方案的设计与执行服务, 为客户交付标准 化结构化的可用数据,数据类型涵盖文本、图 像、音频、视频、网页等。
大数据平台概述ppt课件
演讲人
2022 - 01 - 04
1
目录
01. 工作应用 02. 工程核心
2
01 工作应用
3
工作应用
01
业务相关
用户画像 风险控制
02
决策相关
数据科学的领域,了解 统计学、算法 数据科学家
03
工程相关
如何实施、实现、解决 什么业务 数据工程师
4
02 工程核心
5
工程核心
A
数据 源
B
分析数据的应用场 景
14
场景一
舆情分析
选择用ES,在单机上做了一个简单的测试,大概三亿多条数据,用最 坏的 查 询 条 件 进 行 搜 索 , 保 证 这 个 搜 索 是 全 表 搜 索 ( 基 于 Lucence创 建 了 索 引 , 使得这种搜索更高效),整个查询时间能控制在几秒以内
15
场景二:商业智能产品
数据 存储
C
数据 处理
6
工Hale Waihona Puke 核心数据源02四种
01
特点决定数据采集 和数据存储的技术
选型
7
内外部
内部主动写入 CRM 外部网络拉取 获得外部数据本身提供的api 写爬虫获取 特点
8
四种
结构化和非结构化数据
u结构化偏向文件, NoSQL数据库
9
不变可添加数据, 可修改可删除数据
前 增量同步策略 后
离线编程模 型
内存编程模 型
实时编程模 型
1
2
3
21
感谢聆听
22
10
数据量大小
大
u高延迟 u实时分析 uLambda架 构
11
《大数据平台介绍》课件
THANKS
大数据平台的应用场景
总结词:大数据平台广泛应用于商业智能、智慧城市 、金融风控等领域。
详细描述:大数据平台在许多领域都有广泛的应用。在 商业智能领域,企业利用大数据平台进行市场分析、用 户行为分析、销售预测等,以提升业务决策的准确性和 效率。在智慧城市领域,大数据平台用于城市管理、交 通监控、公共安全等方面,提高城市运行效率和公共服 务水平。在金融风控领域,大数据平台用于风险评估、 信贷审批、欺诈检测等,以提升金融业务的安全性和可 靠性。此外,大数据平台还在医疗健康、科学研究、智 能制造等领域得到广泛应用。
恢复策略
制定详细的数据恢复流程和预案,以便在数据丢失或损 坏时能够迅速恢复数据。
性能优化与升级方案
性能优化
根据大数据平台的运行情况,对系统性能进行优化,提高数据处理速度和系统稳定性。
升级方案
根据技术发展和业务需求,制定升级方案,确保大数据平台能够持续满足业务发展需求 。
06 大数据平台的发展趋势与展望
总结词
随着数据量的快速增长和数据处理需求的日益复杂,传统数据处理方式无法满足需求,因此大数据平台应运而生 。
详细描述
随着互联网、物联网、社交媒体等领域的快速发展,数据量呈爆炸式增长,同时数据处理需求也变得日益复杂。 传统数据处理方式在处理速度、效率、规模等方面存在局限性,无法满足大数据时代的需求。因此,大数据平台 作为一种新型的数据处理框架和工具,应运而生。
详细描述
大数据通常是指数据量巨大、难以用传统数据处理工具和方法处理的数据集合。它具有4V特性,即体 量(Volume)、速度(Velocity)、多样(Variety)和价值(Value)。体量指数据的规模庞大,速 度指数据处理速度快,多样指数据类型多样,价值指大数据具有很高的潜在价值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
短信通知
一级检控
确认
业务部门管理员
短信通知
数据仓库
技术主管部门
11/2/2019
32
策略和方法
反面影响和 正面的效果 征得了领导
层关注
改进工作 分布实施, Description of 循序渐进 the contents
强化决策支持
标准规范
组
织 机
访 问
构服
务
主数据管理系统
通知
注册
准入
申请
废弃
审批
维护
管
安 全
理 流
管
程
理
数
数
据 导 入
匹配查重
查 询 数据校验
据
版本管理
分 发
ERP
11/2/2019
CRM
人事
财务
……
28
议程
• 数据治理的背景和现状 • 数据治理策略 • 元数据管理 • 主数据管理 • 数据质量管理 • 大数据平台设计
11/2/2019
21
主数据类型
当事人
地域
事物
财务和组织
11/2/2019
22
主数据与参考数据
• 参考数据可以是主数据,但不一定是主数 据
11/2/2019
23
为什么要作主数据管理
数据冗余
Why?
数据冲突
难亍应变
11/2/2019
阻碍业务
24
如何做好主数据管理
经常遇到的问题
11/2/2019
技术主管部门
技术部门负责数 据集成、使用等 过程中的数据质 量,并对数据质 量报告进行定期 发布。
评审委员会
技术部门设置评 审委员会,对数 据方面的变更进 行管控,具备技 术方案否决权。
11/2/2019
31
数据质量治理流程
录入 修改
数据录入/质量检查
复制
ETL
应用服务 生产库
后台库
《数据质量管理规范》二级检控
标准域
数量
类型: 数字型 长度: 19,0
分类词
数量
11/2/2019
标准用语
月度销售数量
类型: 数字型 长度: 19,0
标准单词
月度 销售 数量
修饰词
分类词(域)
标准单词 标准单词
标准单词
月度
+ 销售
数量
14
数据定义标准体系
标准单词
标准用语 标准 体系
标准域
11/2/2019
15
数据模型标准化
数据治理 大数据平台设计
11/2/2019
议程
• 数据治理的背景和现状 • 数据治理策略 • 元数据管理 • 主数据管理 • 数据质量管理 • 大数据平台设计
11/2/2019
2
数据治理背景
1 大数据时代凸现数据重要性
2 数据治理是大数据的基础
数据 治理
3 信息孤岛现象严重 4 数据质量问题严重
5 数据应用未得到有效管理
6 数据安全问题日益严峻
11/2/2019
3
数据 治理 现状
11/2/2019
1 意识到了问题的严重
2 “维持”代替“管理” 3 历史“包袱”沉重 4 相关方利益交织,协调困难 5 方案规划容易,落地困难 6 过度依赖技术工具 7 对于数据没有明确区分
Plan&Rule&Standards
11/2/2019
6
数据治理策略
获得支持
引入外援
找到“痛点”
确定“起点”
责任到人
持之以恒
绩效评估
11/2/2019
7
经验总结
标准先行
实事求是
使用工具
数据 治理
11/2/2019
8
11/2/2019
实施建议
*数据质量提升是目标 *主数据管理是关键 *元数据管理是基础
11/2/2019
17
标准化体系(数据定义&模型设计)
标准 规范
模型
引用
要素
关系
定义 规则
11/2/2019
制定 完善
审核、评估、发布
提交
元数据管理系统
反馈
指
导
库
元
数
注
脚
数
据
册
本
据
库
元
同
服
设
数
步
务
计
据
应用系统
可使用 可管理 可控制
18
元数据管理工具的选择
• 元模型易于扩展 • 界面友好 • 安全和系统管理 • 配置管理 • 发布、查询、报表功能 • 平台开放 • 提前试用
Why?
3 可视化数据流动 4 影响和血缘分析
5 推进标准化建设
6 规范化数据审计
11/2/2019
12
经验分享
1.
标准先行
2.
全局治理
3.
尽快见效
4.
高层支持
5.
业务参与
6.
奖惩机制
11/2/2019
13
数据定义标准化
原属性名(标准化对象)
月销售量
词素分析
标准单词对象
词素
词素
词素
月 + 销售 + 量
11/2/2019
19
议程
• 数据治理的背景和现状 • 数据治理策略 • 元数据管理 • 主数据管理 • 数据质量管理 • 大数据平台设计
11/2/2019
20
什么是主数据
• 企业主数据分散存储在企业各系统内,对 企业至关重要的核心业务实体的数据,比 如客户、合作伙伴、员工等
– 关键 – 分散 – 缓慢 – 共享
25
如何做好主数据管理
整理并分析主数据的生命周期
识别并管理主数据相关方
11/2/2019
识别主数据含义、上下文、类型
26
主数据实施流程
数据 梳理
主数据 识别
项目 实施
运行 维护
项目实施要点
•选择工具 •定制开发 •制定标准规范 •确定组织架构
11/2/2019
27
主数据 管理体系
提升数据质量
统一数据共享
11/2/2019
29
数据质量问题
1、数据的值域 3、数据的完整性 5、业务规则 7、数据转换
数据质量
2、数据的定义 4、数据的有效性 6、结构完整性 8、数据流
11/2/2019
30
组织架构设计
● 业务与技术部门各司其职,共同做好数据质量管理工作
业务部门
统计部门(业 务部门)负责 业务规则的制 定,在业务层 面统管数据质 量和安全。
实体、属性、关系、主键,范式化等 命名规则、用语词典、标准域等
数据管理政策、方针等 配置管理、版本管理等
准确性 、完整性、实时性、一致性
结构 管理 质量
模型设计 标准
查询结果的准确性、使用便利性、查询结果的迅速性
应用
11/2/2019
16
模型诊断
实施路线
模型优化
设计规范
设计指南
按照模型设计规范和指南统一设计企业内部数据模型
9
议程
• 数据治理的背景和现状 • 数据治理策略 • 元数据管理 • 主数据管理 • 数据质量管理 • 大数据平台设计
11/2/2019
10
什么是元数据
• 元数据的定义
– 技术元数据 – 业务元数据 – 操作元数据
11/2/2019
11
为什么要进行元数据管理
1 数据的参考框架
2 解决数据模糊性
4
议程
• 数据治理的背景和现状 • 数据治理策略 • 元数据管理 • 主数据管理 • 数据质量管理 • 大数据平台设计
11/2/2019
5
数据治理要素
组织
Organization
流程、活动与机制
Process&Activities&Mechanism
技术平台与工具
Platform&Tools
计划、制度 与标准规范