报告Informatica主数据管理解决方案_CA.pptx
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
合并 管理
重复 识别
模型 管理
Ora数据仓库 运行、生产、销售
TD数据仓库
客户/市场
2 数据探索
3 数据质量
运营支撑
5
数
据
发 布
分析决策
服
务
仪表板
数据集市
分析报表 课件
数据获取
1
数据集成 Data Integration
关键需求: • 在任意的源和目标数据之间进行数
据访问和发布 • 各种数据格式,各种地方 • 不同的延迟需求 (批量, 实时, 消息队列) • 高性能和高可用 • 支持不同MDM部署风格 • 元数据可视化
产品支持: •Informatica Data Profile
课件
数据清洗
3
数据清洗 Data Quality
产品支持: •Informatica Data Quality •AddressDoctor
关键需求: • 数据清洗 • 数据丰富 • 地址标准化 • 数据监控和报告 • 基于SOA 访问DQ规则 • 根据条件的格式 • 校验规则 • 数据变化,去噪,转换 • 开放式清洗架构
课件
案例 Data Quality Framework
KPI Calculation And Aggregation Model (CAAM)
Master Data Quality KPI%
Incompleteor duplicateor ObsoleteorInconsistnetrecords MasterDataRecords- Incompleteor duplicateor ObsoleteorInconsistnetrecords InaccuracyRatio
课件
数据质量问题实例
Du重pli复ca性tio: n: Fuz模zy糊m匹at配ching 完整合性法: 性: 丢失关非键法数格值式
一致性: 数据C是on格si式ste正n确cy并: 完整,
In但co不rre符ct合F业orm务a逻t 辑
值域划分: 界定数值范围
准关确联性性: : 须利识用别其记他录数关据系来 验证其准确程度
完整性 COMPLETENESS
合法性 CONFORMITY
一致性 CONSISTENCY
重复性
关联性
DUPLICATION INTEGRITY
准确性
值域划分
\ACCURACY RANGE
课件
数据质量功能一览
特性 剖析
功能
从非结构化的模式推 演数据的含义
CDI 样例
姓名: 姓+名字 (CHS,KOR,JPN); FN+MN+PN+LN (Latin);
PIM 样例
“liquid”+”crystal”+”dis play” =
1 concept
Comprehensive data quality
解析 清洗,标准化 匹配, 剔重
从非结构化的数据 构建
结构化数据
Addr = #, street, city, state, zip, country;
识别、纠正数据错误; 将数据转化成标准格
Diving watch with Watch attrib and Diving
Equip课m件ent attrib
共同参与数据质量工作
数据经理 业务主管
数据 管理人员
记分卡 基于WEB 客户端
1. 分析
IT 开发人员
5. 数据质量报告与 跟踪
数据质量
4. 部署数据质量计 划
2. 确定数据质量规则 和目标
课件
主数据管理的不同实现路径
平台级 MDM
客户
产品
COA
根据客户的特 有需求进行配 置,使用不同
客户需求
• 灵活的数据模型 • 可定制的业务逻辑和工作流程 • 可配置的用户界面/接口
COA Product Customer
应用级 MDM
预置的应用以 解决特定的主
数据问题 (customer,
product, financial)
金融客户
意外
储蓄
机票
积分
航空客户
健康 养老
业务经理
支付 助学
保险代理
孩子
父母 客户
航段
企业
航空
网上业务 离港
住宅
收件
物流客户
物流
配偶 旅行代理
发件
酒店
客服
票务
旅业客户
课件
企业集团主数据平台集中管理各类主数据
投资管理
客户服务
财务管理
社交媒体
Organizatio n
Acct Rep MDM Account
统一主数据管理平台方案
但彬 Informatica 中国
Informatica 专注于数据集成的独立软件开发商
• 成立时间: 1993
$900
• 2012年收入为: 8.116亿美元
$800
• 7年平均增长率:每年17%
$700
• 员工人数: 2,810多人
$600
• 合作伙伴: 450多家
$500
产品支持: •Informatica PowerCenter •Informatica PowerExchange •Informatica B2B Exchange
课件
数据探索
2
数据探索 Data Profiling
关键需求:
• 发现和记录数据中的所有异常
• 将问题进行分类(完备性、遵从性、 一致性、准确性、唯一性、依赖性)
Product
财务管理
决策支持 人力资源
企业数据仓库
企业数据集成
集团
产业 集团
Account Pricing
Product Organization
Account
Account Zone
Services
课件
从主数据入手,提升主数据质量,是业务管控的基础
• 主数据的重要性——大多数的数据质量问题是主数据问题 • 使治理目标和范围明确 • 主数据系统使咨询内容落地
数据服务
Customer Product
DI/DQ
决策支持
DW
人力资源
数据管理
Account Organization
Sales Rep
Partner Organization
Product
Account Pricing
Product Organization
Account
Account Zone
Services
课件
Informatica 产品定位
外部数据 云计算
套装应用Байду номын сангаас
非结构化数据
业务系统
ERP
CRM
PLM
财务
办公
网站
•任意格式 •任意数据源
•任意延时 •任意模式
2. 数据审计与发现
(数据探查)
5. 主数据和参 考数据管理
客户
产品
区域
渠道
•Any format •Any
source •Any
latency •Any mode
课件
量化质量,跟踪监控
基于web的积分卡便于共享
基于Web格式的记分卡 是你能够:
查看和共享数据质量记分 卡
下钻到具体数据
制定策略,降低对业务的 影响
数据主管 业务经理
简单易用,不需要任何专业技术
课件
Data Quality 可提供每个实体对象记分卡及监控
纳税人 税金 发票 出口退税
规则
课件
DQA - 业务人员可手工管理不良数据
式/术语
Bill = William St, Str = Street
(ENU/DEU) St = Saint (FRA)
Camera = manufacturer, mega
pixels, zoom, and color
Woodd=wood=wud Paper weight:
100g i.s.o. 100kg
1
MasterDataRecords
100%
Material Data Quality KPI%
Customer Data Quality KPI%
Vendor Data Quality KPI%
Employee Data Quality KPI%
Incomplete or duplicate or Obsolete or Inconsiste nt records Master Data Records - Incomplete or duplicate or Obsolete or Inconsiste nt records Inaccuracy Ratio
• 预定义数据模型
• 预定义的业务逻辑和工作流程
• 预定义的用户界面/接口
• 解决不同领域业务问题
• 可用统一的平台扩展到解决其他业务问 题和领域
• 解决特定领域的业务问题 • 扩展到其他业务领域需要购买新的应用
课件
Informatica MDM 简介
经验证的多域主数据方案
Informatica MDM 提供产品、客户、账户等关键数据的 统一视图,快速低成本提升业务运营、客户体验、以及
跨越多行业的客户解决方案 (25+ solutions)
部署情况
大量案例证明在多域主数据部署的 能力
快速部署 平均上线时间: 3-9 个月 最具伸缩性解决方案 最大 450M 主
记录数的成功案例
可验证的多域主数据 几乎一半的客 户都在统一平台上部署了客户和产品域
课件
平台需要的能力
5
数据发布
为应用和数据仓库交付可信的数 据
6b. 数据虚拟 化
数据仓库
复杂事件处理
1. 数据采集
3. 数据质量管理
(建立和管理数据质量规则, 仪表盘,报警等)
4. 数据处理
7. 数据归档
分析应用
BI 仪表盘
报表 数据挖掘
8. 元数据管理 (操作型, 技术型, 业务层)
归档
课件
内容提要 • 从公司治理到主数据管理 • 主数据平台解决方案 • Informatica 案例分享
3. 制定质量提高计划
课件
使用Analyst对数据进行全方位的剖析
Data Steward
使业务人员参与数据分析工作,提高生产力和工作效率,降低IT 人员的依赖性
课件
使用Developer开发具体任务
图形化界面,功能强大,操作简单
课件
流间分析
在处理流程中任意位置进行分析
剖析数据源
剖析处理单元
剖析规则
Services
课件
客户、产品、服务、供应商、机构、资源等组成 完整的 360度主数据视图
完整的主数据视图
不同主数据是业务的 不同视角: • 客户角度
• 产品、服务 • 机构 • 资源 • 产品角度 • 客户 • 资源 • 机构 • 供应商角度 • 产品 • 机构角度 • 产品 • 客户 • 资源 • 资源角度 • 机构 • 产品 • 客户
4
数据管理
管理统一、可信、真实的主数据
3
数据清洗
数据清洗和标准化
2
数据探索
剖析、发现数据内容、一致性、数据结构
1
数据获取
从不同的应用和数据源访问、获取数据
课件
ESB
ODS
ESB
统一客户数据平台架构
业务应用
1
遗留数据
企 业
数
据
集
成
平
台
社交媒体 和第三方数据
4
数据管理平台
主数据管理
数据 管控
数据 关联
公司治理
IT治理
影响公司业务方确向保、IT能管够理支、撑和企控业制战发略展目主路数标线据的的治管理一理系、列组流织程架、构策、略和、流惯程例。、规章制度等。
确保企业主数据的有效性、可访问性、质量、一致性、可审性、和安全性所需要的流程、策略、标准、和 技术。
CRM System
ERP System
业务流程
课件
集团企业数据利用的发展与挑战
• 不同的系统管理各种业
务流程
• 走向精细化协同管理
投资管理
• 利用数据仓库汇集数据
• 但是企业内外协同受信
息流现状的制约
• 面临的问题
• 数据标准
• 数据质量 • 管控流程 • ……
Account Organization
Sales Rep
客户服务
Partner Organization
合规等能力
市场影响力
跨越多行业的平台级解决方案 (Financial Services, Life Sciences,
High Tech …)
超过 50% 的财富 500 企业和全球 500 强企业
Merrill Lynch, Deutsche Bank, Johnson & Johnson, Pfizer, Apple, Kodak, Cadbury, …
识别和消除 重复数据
Haidong Song = 宋海东=
2 products in different languages are in fact
the same item
数据丰富
增加附加的属性 和分类
Haidong Song: “single, 1 child, Summit Estate,
DoNot Mail”
Order Mgmt System
Finance System
HR System
Account Organization
Sales Rep
Partner Organization
Product
Account Pricing
Product Organization
Account
Account Zone
• 主要的系统集成商、独立软件供
应商、原始设备制造商和按需生 $400
产的先驱
$300
• 客户: 超过5,000家
• 客户遍布全球82个国家
$200
• 直接客户遍布全球28个国家
$100
• 客户忠诚度排名位居榜首 (已连续7年获此殊荣)
$0
2005 2006 2007 2008 2009 2010 2011 2012
重复 识别
模型 管理
Ora数据仓库 运行、生产、销售
TD数据仓库
客户/市场
2 数据探索
3 数据质量
运营支撑
5
数
据
发 布
分析决策
服
务
仪表板
数据集市
分析报表 课件
数据获取
1
数据集成 Data Integration
关键需求: • 在任意的源和目标数据之间进行数
据访问和发布 • 各种数据格式,各种地方 • 不同的延迟需求 (批量, 实时, 消息队列) • 高性能和高可用 • 支持不同MDM部署风格 • 元数据可视化
产品支持: •Informatica Data Profile
课件
数据清洗
3
数据清洗 Data Quality
产品支持: •Informatica Data Quality •AddressDoctor
关键需求: • 数据清洗 • 数据丰富 • 地址标准化 • 数据监控和报告 • 基于SOA 访问DQ规则 • 根据条件的格式 • 校验规则 • 数据变化,去噪,转换 • 开放式清洗架构
课件
案例 Data Quality Framework
KPI Calculation And Aggregation Model (CAAM)
Master Data Quality KPI%
Incompleteor duplicateor ObsoleteorInconsistnetrecords MasterDataRecords- Incompleteor duplicateor ObsoleteorInconsistnetrecords InaccuracyRatio
课件
数据质量问题实例
Du重pli复ca性tio: n: Fuz模zy糊m匹at配ching 完整合性法: 性: 丢失关非键法数格值式
一致性: 数据C是on格si式ste正n确cy并: 完整,
In但co不rre符ct合F业orm务a逻t 辑
值域划分: 界定数值范围
准关确联性性: : 须利识用别其记他录数关据系来 验证其准确程度
完整性 COMPLETENESS
合法性 CONFORMITY
一致性 CONSISTENCY
重复性
关联性
DUPLICATION INTEGRITY
准确性
值域划分
\ACCURACY RANGE
课件
数据质量功能一览
特性 剖析
功能
从非结构化的模式推 演数据的含义
CDI 样例
姓名: 姓+名字 (CHS,KOR,JPN); FN+MN+PN+LN (Latin);
PIM 样例
“liquid”+”crystal”+”dis play” =
1 concept
Comprehensive data quality
解析 清洗,标准化 匹配, 剔重
从非结构化的数据 构建
结构化数据
Addr = #, street, city, state, zip, country;
识别、纠正数据错误; 将数据转化成标准格
Diving watch with Watch attrib and Diving
Equip课m件ent attrib
共同参与数据质量工作
数据经理 业务主管
数据 管理人员
记分卡 基于WEB 客户端
1. 分析
IT 开发人员
5. 数据质量报告与 跟踪
数据质量
4. 部署数据质量计 划
2. 确定数据质量规则 和目标
课件
主数据管理的不同实现路径
平台级 MDM
客户
产品
COA
根据客户的特 有需求进行配 置,使用不同
客户需求
• 灵活的数据模型 • 可定制的业务逻辑和工作流程 • 可配置的用户界面/接口
COA Product Customer
应用级 MDM
预置的应用以 解决特定的主
数据问题 (customer,
product, financial)
金融客户
意外
储蓄
机票
积分
航空客户
健康 养老
业务经理
支付 助学
保险代理
孩子
父母 客户
航段
企业
航空
网上业务 离港
住宅
收件
物流客户
物流
配偶 旅行代理
发件
酒店
客服
票务
旅业客户
课件
企业集团主数据平台集中管理各类主数据
投资管理
客户服务
财务管理
社交媒体
Organizatio n
Acct Rep MDM Account
统一主数据管理平台方案
但彬 Informatica 中国
Informatica 专注于数据集成的独立软件开发商
• 成立时间: 1993
$900
• 2012年收入为: 8.116亿美元
$800
• 7年平均增长率:每年17%
$700
• 员工人数: 2,810多人
$600
• 合作伙伴: 450多家
$500
产品支持: •Informatica PowerCenter •Informatica PowerExchange •Informatica B2B Exchange
课件
数据探索
2
数据探索 Data Profiling
关键需求:
• 发现和记录数据中的所有异常
• 将问题进行分类(完备性、遵从性、 一致性、准确性、唯一性、依赖性)
Product
财务管理
决策支持 人力资源
企业数据仓库
企业数据集成
集团
产业 集团
Account Pricing
Product Organization
Account
Account Zone
Services
课件
从主数据入手,提升主数据质量,是业务管控的基础
• 主数据的重要性——大多数的数据质量问题是主数据问题 • 使治理目标和范围明确 • 主数据系统使咨询内容落地
数据服务
Customer Product
DI/DQ
决策支持
DW
人力资源
数据管理
Account Organization
Sales Rep
Partner Organization
Product
Account Pricing
Product Organization
Account
Account Zone
Services
课件
Informatica 产品定位
外部数据 云计算
套装应用Байду номын сангаас
非结构化数据
业务系统
ERP
CRM
PLM
财务
办公
网站
•任意格式 •任意数据源
•任意延时 •任意模式
2. 数据审计与发现
(数据探查)
5. 主数据和参 考数据管理
客户
产品
区域
渠道
•Any format •Any
source •Any
latency •Any mode
课件
量化质量,跟踪监控
基于web的积分卡便于共享
基于Web格式的记分卡 是你能够:
查看和共享数据质量记分 卡
下钻到具体数据
制定策略,降低对业务的 影响
数据主管 业务经理
简单易用,不需要任何专业技术
课件
Data Quality 可提供每个实体对象记分卡及监控
纳税人 税金 发票 出口退税
规则
课件
DQA - 业务人员可手工管理不良数据
式/术语
Bill = William St, Str = Street
(ENU/DEU) St = Saint (FRA)
Camera = manufacturer, mega
pixels, zoom, and color
Woodd=wood=wud Paper weight:
100g i.s.o. 100kg
1
MasterDataRecords
100%
Material Data Quality KPI%
Customer Data Quality KPI%
Vendor Data Quality KPI%
Employee Data Quality KPI%
Incomplete or duplicate or Obsolete or Inconsiste nt records Master Data Records - Incomplete or duplicate or Obsolete or Inconsiste nt records Inaccuracy Ratio
• 预定义数据模型
• 预定义的业务逻辑和工作流程
• 预定义的用户界面/接口
• 解决不同领域业务问题
• 可用统一的平台扩展到解决其他业务问 题和领域
• 解决特定领域的业务问题 • 扩展到其他业务领域需要购买新的应用
课件
Informatica MDM 简介
经验证的多域主数据方案
Informatica MDM 提供产品、客户、账户等关键数据的 统一视图,快速低成本提升业务运营、客户体验、以及
跨越多行业的客户解决方案 (25+ solutions)
部署情况
大量案例证明在多域主数据部署的 能力
快速部署 平均上线时间: 3-9 个月 最具伸缩性解决方案 最大 450M 主
记录数的成功案例
可验证的多域主数据 几乎一半的客 户都在统一平台上部署了客户和产品域
课件
平台需要的能力
5
数据发布
为应用和数据仓库交付可信的数 据
6b. 数据虚拟 化
数据仓库
复杂事件处理
1. 数据采集
3. 数据质量管理
(建立和管理数据质量规则, 仪表盘,报警等)
4. 数据处理
7. 数据归档
分析应用
BI 仪表盘
报表 数据挖掘
8. 元数据管理 (操作型, 技术型, 业务层)
归档
课件
内容提要 • 从公司治理到主数据管理 • 主数据平台解决方案 • Informatica 案例分享
3. 制定质量提高计划
课件
使用Analyst对数据进行全方位的剖析
Data Steward
使业务人员参与数据分析工作,提高生产力和工作效率,降低IT 人员的依赖性
课件
使用Developer开发具体任务
图形化界面,功能强大,操作简单
课件
流间分析
在处理流程中任意位置进行分析
剖析数据源
剖析处理单元
剖析规则
Services
课件
客户、产品、服务、供应商、机构、资源等组成 完整的 360度主数据视图
完整的主数据视图
不同主数据是业务的 不同视角: • 客户角度
• 产品、服务 • 机构 • 资源 • 产品角度 • 客户 • 资源 • 机构 • 供应商角度 • 产品 • 机构角度 • 产品 • 客户 • 资源 • 资源角度 • 机构 • 产品 • 客户
4
数据管理
管理统一、可信、真实的主数据
3
数据清洗
数据清洗和标准化
2
数据探索
剖析、发现数据内容、一致性、数据结构
1
数据获取
从不同的应用和数据源访问、获取数据
课件
ESB
ODS
ESB
统一客户数据平台架构
业务应用
1
遗留数据
企 业
数
据
集
成
平
台
社交媒体 和第三方数据
4
数据管理平台
主数据管理
数据 管控
数据 关联
公司治理
IT治理
影响公司业务方确向保、IT能管够理支、撑和企控业制战发略展目主路数标线据的的治管理一理系、列组流织程架、构策、略和、流惯程例。、规章制度等。
确保企业主数据的有效性、可访问性、质量、一致性、可审性、和安全性所需要的流程、策略、标准、和 技术。
CRM System
ERP System
业务流程
课件
集团企业数据利用的发展与挑战
• 不同的系统管理各种业
务流程
• 走向精细化协同管理
投资管理
• 利用数据仓库汇集数据
• 但是企业内外协同受信
息流现状的制约
• 面临的问题
• 数据标准
• 数据质量 • 管控流程 • ……
Account Organization
Sales Rep
客户服务
Partner Organization
合规等能力
市场影响力
跨越多行业的平台级解决方案 (Financial Services, Life Sciences,
High Tech …)
超过 50% 的财富 500 企业和全球 500 强企业
Merrill Lynch, Deutsche Bank, Johnson & Johnson, Pfizer, Apple, Kodak, Cadbury, …
识别和消除 重复数据
Haidong Song = 宋海东=
2 products in different languages are in fact
the same item
数据丰富
增加附加的属性 和分类
Haidong Song: “single, 1 child, Summit Estate,
DoNot Mail”
Order Mgmt System
Finance System
HR System
Account Organization
Sales Rep
Partner Organization
Product
Account Pricing
Product Organization
Account
Account Zone
• 主要的系统集成商、独立软件供
应商、原始设备制造商和按需生 $400
产的先驱
$300
• 客户: 超过5,000家
• 客户遍布全球82个国家
$200
• 直接客户遍布全球28个国家
$100
• 客户忠诚度排名位居榜首 (已连续7年获此殊荣)
$0
2005 2006 2007 2008 2009 2010 2011 2012