Informatica数据集成产品介绍
Informatica PowerCenter
Informatica PowerCenter 高可扩展性与高性能的企业数据集成标准确立企业数据集成标准Informatica® PowerCenter® 为具备高可扩展性与高性能的企业数据集成软件确立了标准。
PowerCenter 可使您的 IT 组织能够通过单一方式访问、转换和传输数据,无需任何手动编码。
该软件的高可扩展性能可以支持海量数据并满足企业对安全和性能的需求。
PowerCenter 可作为所有企业集成方案的数据集成基础,包括数据仓库、数据治理、数据迁移、面向服务的体系架构 (SOA)、B2B 数据交换以及主数据管理 (MDM)。
•在正确的时间提供正确信息,让业务部门拥有其所需的及时、相关和可信的数据与报告,以便制定更准确、更及时的业务决策 •经济高效地进行扩展,以满足增长的数据需求,节约硬件成本,并降低与数据停机相关的成本和风险 •让开发人员、分析师和管理员团队能够更快更好地协作,共享和重复利用工作成果,以加快项目的交付速度“在我们这一行,至关重要的是能够抢先取得竞争优势和研究项目的投资回报。
不断增长的竞争只会进一步强调这一点,让你更容易理解‘时间就是金钱’这句话的含义。
在此艰难的环境下,Informatica [PowerCenter ] 为进行日常报告助了一臂之力,从而保证我们的团队具备最优的响应度和效率。
”– Alain Afios ,数据处理主管 研发部门,AventisBBVA Compass 是一家金融机构,在世界各地拥有 748 间分行。
该银行必须有效地检测、调查和报告可疑的洗钱活动,以符合国家和国际法规、指令及最佳实践的要求。
同时,该银行也需要降低合规成本。
BBVA Compass 依赖于 PowerCenter 来集成 17 个跨企业的数据源,其中包括拥有不同格式、结构和延迟性的贷款、信用卡、账户及在线银行交易数据。
PowerCenter 提供了金融活动与客户风险的全面视图。
informatica中常用各组件的功能
目录未找到目录项。
Informatica 数据整合分为三类数据集成,即下游集成、中游集成和上游集成下游集成:指数据仓库,显著特点是,从数据流的角度看,数据仓库的主体功能是所有应用系统的下游,所有数据都会流向数据仓库中游集成:指数据交换平台,特点是,任何平台和它的关系都是对等的,它是这个数据枢纽hub的中心点,用来支持所有系统之间数据的数据交换,用于解决数据集成毛团问题。
上游集成:指主数据平台,而且是交易型主数据平台。
用于管理企业核心数据的黄金记录,作为企业核心记录的黄金数据的标准平台。
Informatica 的四个客户端及作用:1,Repository Manager:用于管理Repository本身,如创建文件夹,导入/导出Mapping、Worlkfolw,版本管理,部署,Repository的清除。
2,Designer:用于导入ETL元数据,开发ETL程序。
在Power Center中ETL程序被叫做Mapping,即源到目标的映射。
3,Workflow Manager:用于对Mapping的进行数据源、数据目标、使用的字符集、调优及参数配置等,使Mapping能够运行。
此外,还提供了基本的调度和排程的能力。
4,Workflow Monitor:用于监控运行时的Workflow和session,监控ETL运行是否正常、执行效率及异常时的错误信息。
Power Center的开发过程:0,使用PowerCenter客户端连接域(Domian)和数据库服务器Repository Service;建立一个文件夹(Folder),用于开发学习;1,在客户端PowerCenter Designer中导入源表和目标表的结构定义;注:在Power Center Designer中导入的仅仅是表结构,与执行过程的表名无强相关2,在Designer中,创建Mapping(ETL流程)3,在Designer中,拖动源和目标,以及相应组件进入Mapping4,在Designer中,建立源和目标,以及相应组件之间的映射5,在Workflow Manager中提供相应的配置信息及参数6,通过Workflow Monitor客户端进行监控7,预览执行结果重要概念:Mapping:是一个程序,但它不直接可以执行Session:是一个Mapping的实例,指定相关的配置信息后,可以执行;Workflow:可以执行一个或者多个Session,对Session或者其他Task组件进行排程基础组件:1,Source:源文件数据源可以是数据库表,文本文件,XML文件,SAP等,应用系统、Hadoop,MQ等源文件常用方法:手工创建,通过数据库、文本文件、样例文件导入注意:理论上,源表结构定义继承了数据库中表的定义,但是实践中有可能导入后的数据类型发生变化,如表中varchar2,而导入后变为nvarchar2,从而引起Session执行异常。
Informatica主数据管理解决方案
市场影响力
跨越多行业的平台级解决方案 (Financial Services, Life Sciences,
High Tech …)
超过 50% 的财富 500 企业和全球 500 强企业
Merrill Lynch, Deutsche Bank, Johnson & Johnson, Pfizer, Apple, Kodak, Cadbury, …
Account Organization
Sales Rep
客户服务
财务管理
决策支持 人力资源
企业数据仓库
企业数据集成
集团
产业 集团
Partner Organization
Product
Account Pricing
Product Organization
Account
Account Zone
Services
完整的主数据视图
不同主数据是业务的 不同视角: • 客户角度
• 产品、服务 • 机构 • 资源 • 产品角度 • 客户 • 资源 • 机构 • 供应商角度 • 产品 • 机构角度 • 产品 • 客户 • 资源 • 资源角度 • 机构 • 产品 • 客户
金融客户
意外
储蓄
机票积分航空客户 Nhomakorabea健康 养老
业务经理
•Informatica PowerExchange
•Informatica B2B Exchange
Content Embargo Until June 4th, 2013 at 5:00pm PST
16
数据探索
2
数据探索 Data Profiling
关键需求:
informatica中常用各组件的功能
informatica中常用各组件的功能目录未找到目录项。
Informatica 数据整合分为三类数据集成,即下游集成、中游集成和上游集成下游集成:指数据仓库,显著特点是,从数据流的角度看,数据仓库的主体功能是所有应用系统的下游,所有数据都会流向数据仓库中游集成:指数据交换平台,特点是,任何平台和它的关系都是对等的,它是这个数据枢纽hub的中心点,用来支持所有系统之间数据的数据交换,用于解决数据集成毛团问题。
上游集成:指主数据平台,而且是交易型主数据平台。
用于管理企业核心数据的黄金记录,作为企业核心记录的黄金数据的标准平台。
Informatica 的四个客户端及作用:1,Repository Manager:用于管理Repository本身,如创建文件夹,导入/导出Mapping、Worlkfolw,版本管理,部署,Repository的清除。
2,Designer:用于导入ETL元数据,开发ETL程序。
在Power Center中ETL程序被叫做Mapping,即源到目标的映射。
3,Workflow Manager:用于对Mapping的进行数据源、数据目标、使用的字符集、调优及参数配置等,使Mapping能够运行。
此外,还提供了基本的调度和排程的能力。
4,Workflow Monitor:用于监控运行时的Workflow和session,监控ETL运行是否正常、执行效率及异常时的错误信息。
Power Center的开发过程:0,使用PowerCenter客户端连接域(Domian)和数据库服务器Repository Service;建立一个文件夹(Folder),用于开发学习;1,在客户端PowerCenter Designer中导入源表和目标表的结构定义;注:在Power Center Designer中导入的仅仅是表结构,与执行过程的表名无强相关2,在Designer中,创建Mapping(ETL流程)3,在Designer中,拖动源和目标,以及相应组件进入Mapping 4,在Designer中,建立源和目标,以及相应组件之间的映射5,在Workflow Manager中提供相应的配置信息及参数6,通过Workflow Monitor客户端进行监控7,预览执行结果重要概念:Mapping:是一个程序,但它不直接可以执行Session:是一个Mapping的实例,指定相关的配置信息后,可以执行;Workflow:可以执行一个或者多个Session,对Session或者其他Task组件进行排程基础组件:1,Source:源文件数据源可以是数据库表,文本文件,XML文件,SAP等,应用系统、Hadoop,MQ等源文件常用方法:手工创建,通过数据库、文本文件、样例文件导入注意:理论上,源表结构定义继承了数据库中表的定义,但是实践中有可能导入后的数据类型发生变化,如表中varchar2,而导入后变为nvarchar2,从而引起Session执行异常。
Informatica_(3)组件
Informatica_(3)组件⼀、Informatica介绍Informatica PowerCenter 是Informatica公司开发的世界级的企业数据集成平台,也是业界领先的ETL⼯具。
Informatica PowerCenter使⽤户能够⽅便地从异构的已有系统和数据源中抽取数据,⽤来建⽴、部署、管理企业的数据仓库,从⽽帮助企业做出快速、正确的决策。
此产品为满⾜企业级要求⽽设计,可以提供企业部门的数据和电⼦商务数据源之间的集成,如XML,⽹站⽇志,关系型数据,主机和遗留系统等数据源。
此平台性能可以满⾜企业分析最严格的要求。
Informatica PowerCenter已被全球多家著名企业⽤来建设BI/DW系统,它可集成和分析企业的关键商务信息,优化整个商务价值链的表现和响应速度。
Informatica PowerCenter拥有⼀个功能强⼤的数据整合引擎,所有的数据抽取、转换、装载的功能都是在内存中执⾏的,不需要开发者⼿⼯编写这些过程的代码。
Informatica PowerCenter 数据整合引擎是元数据驱动的,通过知识库和引擎的配对管理,可以保证数据整合过程能够最优化执⾏,并且使数据仓库管理员⽐较容易对系统进⾏分析管理,从⽽适应⽇益增加的数据装载和⽤户群。
⼆、informatica开发步骤:定义源: Desinger定义⽬标: Desinger创建映射: 源--》转换组件--》⽬标Mapping都是由源表、转换组件和⽬标表组成,⽤于描述数据抽取的过程。
源表和⽬标表可以从源和⽬标⽂件夹拖拽到⼯作区,转换组件需要⼿动创建。
Mapping设计的关键就是转换组件的使⽤,这关系到数据抽取的正确性和效率。
定义任务: Workflow Manager创建⼯作流: Workflow Manager⼯作流调度监控 : Workflow Monitor三、转换组件1. 组件列表Source Qualifier 从数据源读取数据Expression ⾏级转换Filter 数据过滤Sorter 数据排序Router 条件分发joiner 异构数据关联连接Lookup 查询连接Aggregator 聚合Update Strategy 对⽬标编辑(insert\update\delete\reject)Union 数据合并Sequence Generator 序列号⽣成器Normalizer 记录规范化Rank 对记录进⾏TOPxTransaction Control 对装载数据按条件进⾏事物控制Stored Procedure 存储过程组件Custom ⽤户⾃定义组件HTTP WWW组件Java Java⾃编程组件其它应⽤组件2. 组件类型Passive类型:流⼊流出组件的⾏数不发⽣变化,如:Expression、Lookup、HTTP组件。
informatica产品选配说明
1. PowerCenter引擎 PowerCenter SE基础 2.PowerCenter无限制开发工具、工作流、监控工具 包 3.PowerCenter知识库管理引擎
2
数据专用接口
通过不同专用的数据接口,PowerCenter可以连接几乎 所有的主流数据类型,包括数据库(Oracle、DB2、 SQLServer、Sybase、Informix、Teradata、Natezza 、GreenPlum等),应用程序(SAP ERP、SAP BW、 Oracle E-biz、peoplesoft、Siebel、SAS、Essbase 等),Web Service、MQ/MSMQ等等,以及大数据接口 (如HDFS、Hive、Hbase等)。实现数据的读取与装载
7
元数据管理选项
产品选配说明 必选。1、每台服务器必须 已2C的倍数选配(例如: 2C/4C/6C/8C等)。2、如要 做集群功能规避单机风险, 必须最少部署两台服务器, 否则无法实现集群功能。3 、如是多台服务器,每台服 务器部署的数量必须1:1相 等。 1、数据库接口、大数据接 口只按照类型不同选配确定 数量。不按照同一个品牌的 库的个数选取。(例如:本 地现有Oracle数据库3个、 DB2数据库3个,那么最终选 取数据接口Oracle*1、 DB2*1)。2、应用程序所选 配的每个类型的个数与拥有 的(以前已经采购过的+现 在准备扩容的) PowerCenter SE的数量1:1 对应。3、注意:数据库和 大数据的类型价格一样,而 应用程序和其他接口价格不 一样
该功能模块选配数量必须与拥 有的(以前已经采购过的+现 在准备扩容的)PowerCenter SE的数量1:1对应。 该功能模块选配数量必须与拥 有的(以前已经采购过的+现 在准备扩容的)PowerCenter SE的数量1:1对应。
Informatica_PowerCenter交流(ETL)
等待时间缩短 75%,产量提高 5 倍,同时硬件 成本降低 50%。
8
Informatica为企业传递信息价值
提升监控 流动人口和 突发事件的能力
加速业务流程 提高决策分析
数据集中共享 与清算
数据集成 提升宏观经济 分析能力,辅助 国家监管及决策
数据大集中 加速业务流程 提高服务能力 及风险监管
BPM/Workflow (human interaction)
Orchestration (process integration)
Business Services
Events
Identity & Access Management
EJB
SOAP
HTTP
JMS
~ Real-time ~
Authentication
Bulk & Message Processing
Data Access
R/W
DB Transaction
Capture
Data Quality Certification
Data Transformation
Format Conversion
Data Traceability
Data Encryption & Masking
使命:让数据为企业的 创新提供强大动力服务
• 客户满意度:TNS 在2010 年度数据集成客户满意度调查中,Informatica 连续第 5 年获得最高
评价;Gartner 2011年报告调查中,Informatica分别在客户支持和技术支持的总体质量方面得到 了迄今为止的最高分。此外,在接受调查的 Informatica 客户中,84% 认可 Informatica 是技术领 导者,超过 90% 的客户指出 Informatica 的技术方向与他们的长期 IT 战略一致
informatica repository table -回复
informatica repository table -回复主题: Informatica Repository表引言:Informatica Repository是一个关键的组件,它存储了Informatica PowerCenter工具的所有元数据信息。
Informatica是一种数据集成工具,用于在不同的应用程序、数据库和系统之间传输和转化数据。
Repository 表是Informatica Repository数据库中用于存储这些元数据信息的表格。
本文将分步回答关于Informatica Repository表的一些问题。
第一部分:Informatica Repository表的基本概述1. Informatica Repository是什么?InformaticaRepository是一个中心化的元数据存储库,用于管理和存储Informatica PowerCenter工具所需的所有元数据信息。
2. 什么是元数据?元数据是描述数据的数据。
在Informatica Repository中,元数据包含了有关源和目标的连接信息、转换逻辑和配置设置等。
3. 为什么需要Informatica Repository表?Informatica Repository表用于存储Informatica工具中的各种元数据,包括源和目标连接信息、转换逻辑和任务配置等。
这些表提供了访问和管理这些元数据的结构和方法。
第二部分:Informatica Repository表的结构和功能1. Informatica Repository表有哪些主要组成部分?Informatica Repository表大致可分为以下几个主要组成部分:- 源和目标连接信息表:用于存储与数据源和数据目标的连接相关的信息,例如数据库的连接字符串、用户名和密码等。
- 转换逻辑表:用于存储ETL转换过程中的逻辑信息,例如数据映射、过滤条件和转换规则等。
ETL抽取工具Informatica介绍-1
VANDA SYSTEMS & COMMUNICATIONS HOLDINGS LIMITED
PowerCenter体系结构 PowerCenter体系结构
VANDA SYSTEMS & COMMUNICATIONS HOLDINGS LIMITED
1个或多个(Repository)
• PowerCenter数据整合引擎是基于元数据驱动的,提 供了基于元数据驱动的元数据知识库(Repository) ,该元数据知识库可以在主流的关系型数据库中部署 。该元数据库中存储所有的ETL元数据,包括:源、 目标表的物理和逻辑元数据, ETL转换规则,知识库 用户权限,ETL任务运行历史信息等元数据。
VANDA SYSTEMS & COMMUNICATIONS HOLDINGS LIMITED
主流的ETL厂商和产品 主流的ETL厂商和产品 ETL
• 专业ETL厂商和产品包括Ascential公司的Datastage 、Informatica公司的Powercenter、 NCR Teradata 公司的ETL Automation
VANDA SYSTEMS & COMMUNICATIONS HOLDINGS LIMITED
Informatica主要特点
• 4)字段的拆分,内置众多的字符串函数,例如 SUBSTR, Instr等,可完成字段的拆分、合并等操 作。 5)多字段的混合运算,内部具有Expression组件 ,可增加复杂的多字段混合计算,同时可嵌入100 多种函数和参数,极大的提高了计算表达式的灵活 性。
用于连接应用 数据, 数据, 如 ERP ( SAP)、 )、 EAI( MQ) ( )
VANDA SYSTEMS & COMMUNICATIONS HOLDINGS LIMITED
Informatica数据集成产品介绍
– 业界领先的企业级数据集成平台
• PowerMart
– 部门级数据集市和分析型应用平台(通过数据集成中心(DIH)扩展)
• PowerConnect
– 用来抽取ERP,CRM,遗产系统,EAI,主机/AS400数据源和元数据
• PowerChannel
– 提供在分布式环境下的数据采集功能,支持广域网环境
E
A
B
H
S
M
P
S
R
Y
G
S
N
C
I
S
N
T
Y
L
O
L
T
R
-3%
-6%
-23%
-23%
-26%
-27%
各地区客户
日本: 超过30家客户 包括 Mitsubishi, NTT, NHK…
澳大利亚/新西兰: 超过20家客户 新加坡: 16家客户
包括 SingTel, GE, Motorola, HP 韩国: 4家客户,包括 Sumsung
大中国地区的客户
台湾: 3家客户,包括 TSMC,与NCR的紧密关系 中国大陆: ~6家客户
包括中国电信,中国联通,Motorola 香港: ~6家客户 包括 HK Exchange
Informatica 产品基本结构
Informatica数据集成产品
• PowerCenterRT
– 在Power Center基础上加入实时特性的数据集成平台
2000
2001
Informatica的客户状况
• 100强的60%是Informatica的客户 • 道琼斯工业平均指数的63% • 世界500强
Informatica数据集成资料
采用工具:
• ETL
成本
采用工具和人工编写程序的成本,
在一定的时间后,成本产生了反转的结果
人工编写程序:
• Hand-coded ETL • Home-grown EII, EAI • Low-end replication 初期成本: • 软件费用 • 培训 • 硬件
•复制 •数据分发
•访问和分析 •资源规划和发布
元数据 统一系统和用户管理 3
数据集成之主流技术论述
以元数据为驱动、引擎式的工具, Informatica为代表
脚本级驱动
Case 'Y’
col2=col2*10-2 if col3=2 then col4=lkp(col1,col2) else col4=0 endif Case ‘N’ col2=10 col4=lkp(col3,col5) 4
DataAnalyzer PowerCenter
核心产品:数 据集成平台
PowerExchange
Data Quality
数据质量管理
用于连接主机数据 /AS400、Oracle、 DB2、SQL数据源的 CDC、Real Time; ERP(SAP等)、EAI (MQ、WebService Databases 等)
数据整合之主流技术论述
以元数据为驱动、引擎式的工具, Informatica为代表
5
企业一般的数据整合工作和技术
主机端
Control M + JCL + Cobol
Hand Coding !! 人工编写
开放系统端
PL-SQL JAVA
Shell
informatica data quality
informatica data quality
Informatica Data Quality(IDQ)是一种数据质量管理解决方案,由Informatica公司推出,旨在帮助企业提高数据质量、减少数据质量问题并优化业务决策过程。
IDQ 提供了一系列高度定制化的工具和功能,可以帮助企业解决数据质量方面的挑战,包括:
1. 数据清洗:识别和修复数据中的错误、漏洞和不一致性,包括应用拼写检查、验证规则和标准化等数据清洗技术。
2. 数据标准化:标准化数据结构、格式和命名系统,以确保数据的一致性和可对比性。
3. 重复数据识别和去重:识别和去除重复的、冗余的数据,以确保数据的正确性和准确性。
4. 数据质量规则管理:创建和维护数据质量规则,以自动识别和纠正数据问题。
5. 数据异常识别和管理:检测和解决数据异常,例如缺失数据、无效数据、异常值和异常数据分布。
6. 数据可视化和报告:提供可视化工具和报告功能,帮助企业查看和理解数据质量问题,并跟踪改进进展。
IDQ 可以与其他Informatica产品集成,也可以与第三方数据管理系统进行连接。
它还支持多种数据源和格式,包括关系型数据库、云存储、半结构化和非结构化数据。
总之,IDQ 是一种功能强大的数据质量管理工具,可以帮助企业提高数据质量,并对业务决策过程产生积极的影响。
Informatica_产品_PowerCenter介绍
Informatica主要特点4
高开发效率
高开发效率—图形化开发,无须编码
17
高开发效率—强大的转换功能
18
高开发效率—自动化项目开发生命周期
Mapping Analyst for Excel
Analysts Architects Developers Operators
Mapping Architect for Visio
Informatica产品介绍
Informatica主要特点1 完善的ETL功能
完善的ETL功能
异构数据源,异构目标 实现多种缓慢变化维 全局变量及参数,支持参数文件 局部变量,前后记录比较 数据源为文件列表/为命令返回值(支持通配符) Session Recovery 调用Java、C/C++、VC、VB等外部程序 基于多目标表约束装载 错误数量控制 FTP 源和FTP目标 ETL任务分区 增量汇总 测试装载 数据驱动增删改类型能 Bulk /External Loading
20
高开发效率— Mapping模版设计
内置多套模板
21
使用Visio设计Mapping 架构
Metadata driven framework for generating custom wizards for templates to maximize productivity
Targeted for DI Architect Ability to build your own wizards based on the pattern without coding
Rank:取出最大或最小的一定数量的记录
Input:定义Mapplet的输入,仅在Mapplet designer中可用 Output:定义Mapplet的输出,仅在Mapplet designer中可用
数据集成平台
• WEB Metadata Reporter
– 通过WEB共享元数据信息 – 支持WEB Sphere,Tomcat,JRun,Weblogic
Repository Manager
• 元数据版本管理 • 元数据复制、链接 • 组、用户级别权限管理
– 支持操作类型权限(读、写、修改、执行)
• 支持多用户
合作伙伴
财务状况
增长30% 增长30% (YOY)
公司简介
• 创立于1993年,总部位于Palo Alto, California of USA 的 Informatica(Nasdaq:INFA)公司,作为电子商务分析型 软件市场的领先者,一直致力于通过自身的产品和服务提 升企业的竞争性优势。其拳头产品Informatica Insight Network(Infrastructure and Analytics)已被全球1,100多 家企业用来集成、分析和个性化企业的关键商务信息,优 化整个商务价值链的表现和响应速度。公司于1999年四月 首次公开上市发行,(Nasdaq: INFA) $16/每股,拥有包括 Citigroup, Deutsche Bank, AT&T, British Telecom, Motorola, Cisco, HP, Boeing, National Semiconductor, Timer Warner, News Group在内的广泛的客户群。
公司简介
• Informatica 作为电子商务分析软件,数据集成和 分析型应用解决方案提供商,拥有包括分析型应 用软件、广泛的支持服务和强大的数据集成平台 在内的综合性产品家族。. Informatica的基础设施 产品以可伸缩的、可扩展的企业级数据集成平台 为特点,并广泛支持来自Informatica和其他的领 先智能商务提供商的数据仓库基础设施和分析型 应用软件的开发和管理。 • Informatica的分析型应用软件也是建立在数据集 成平台之上,旨在为企业解决任何可能出现的有 关相关性、性能、瓶颈、战略和其他的种种问题。
Informatica介绍
数据仓库
数据交换
数据监控
2
2005,神州数码(中国)有限公司.版权所有
五个应用范围
1、数据迁移
数据迁移(Data Migration)
• 系统升级 • 系统合并 • 遗留转换
3
2005,神州数码(中国)有限公司.版权所有
五个应用范围
2、数据同步
数据同步(Data Synchronization)
20
2005,神州数码(中国)有限公司.版权所有
PowerCenter五个主要特点
1、所见即所得
起点低:
• 完全图形化界面,采用拖拽方式,不用写代码
易编辑:
• 易于操作、阅读、维护 • 不同转换功能以不同的图标显示 • 以流程线表示转换步骤
好管理
• 管理客户端明确 • 引入倒出管理方便
21
10
2005,神州数码(中国)有限公司.版权所有
五个工具产品
2、PowerCerter
11
2005,神州数码(中国)有限公司.版权所有
五个工具产品
3、PowerExchange
12
2005,神州数码(中国)有限公司.版权所有
五个工具产品
4、PowerConnect
Applications & Platforms
SAP NetWeaver
IBM Lotus Notes
SAP BW Siebel
Hyperion Essbase SAS
PeopleSoft
Messaging
IBM MQ Series
Microsoft MSMQ
TIBCO
webMethods
ODBC
Standards LDAP
informatica字符编码
informatica字符编码在数据处理和传输过程中,字符编码是一种重要的技术,它可以将字符转换成计算机可以处理的二进制代码。
Informatica作为一种广泛使用的数据集成工具,也涉及到字符编码的问题。
本文将介绍Informatica字符编码的基本概念、实现方式以及在数据处理中的应用。
一、基本概念字符编码是将字符转换成二进制代码的过程,以便计算机能够识别和处理。
在计算机中,字符通常是以字节的形式存储和传输的。
为了使不同的字符集之间能够相互兼容,需要使用字符编码。
常见的字符编码包括ASCII码、Unicode码、UTF-8等。
Informatica作为一种数据集成工具,在进行数据传输和处理时,也涉及到字符编码的问题。
在Informatica中,字符编码通常指的是数据源和目标之间的编码转换。
在进行数据传输时,由于不同的系统之间可能使用不同的字符编码,需要进行编码转换以确保数据的正确传输和处理。
二、实现方式Informatica提供了多种方式来实现字符编码的转换,包括:1.配置文件设置:Informatica提供了配置文件,可以在其中设置字符编码的转换方式。
通过配置文件,可以指定数据源和目标之间的字符编码转换方式,以确保数据的正确传输和处理。
2.插件和转换器:Informatica提供了多种插件和转换器,可以根据不同的数据源和目标之间的字符编码差异进行转换。
通过使用插件和转换器,可以实现灵活的字符编码转换,提高数据处理的效率和准确性。
3.脚本和编程接口:Informatica还提供了脚本和编程接口,可以根据需要对数据进行更复杂的处理和转换。
通过使用脚本和编程接口,可以实现自定义的字符编码转换逻辑,以满足特定的数据处理需求。
三、应用场景Informatica字符编码在数据处理中具有广泛的应用场景,包括:1.数据迁移:在进行数据迁移时,可能会涉及到不同系统之间的数据传输和处理。
通过使用Informatica进行字符编码转换,可以确保数据的正确传输和处理,避免出现数据丢失或错误的情况。
Informatica_MDM_解决方案
Informatica MDM 解决方案Informatica MDM 可以向企业提供针对有关客户、产品、渠道合作伙伴、供应商、员工及其他更多统一和可靠关键业务数据的业务用户访问权。
多领域MDM:在您的整个组织中创建单一、权威版本的数据Informatica 的多领域主数据管理(MDM) 解决方案找到并移除您关键数据中的不一致性数据和重复数据,然后在多个格式和系统间解决。
通过创建单一、及时、可信的业务视图,多领域MDM 解决方案可实现有助于提升商业价值的主要IT 方案:∙客户数据集成。
提供一致、准确的客户视图及客户与贵组织的关系视图(甚至跨区域和业务领域)。
∙产品数据管理。
保证整个企业中产品和产品层次结构数据准确。
∙商务智能、报告和分析。
向关键应用程序提供可靠的整合信息,以提高决策能力和运营效率。
∙复合应用程序。
向复合或自定义应用程序交付已整合的可靠数据。
∙B2B 客户和渠道管理。
创建360 度客户账户视图,包括:分支和附属机构、产品和服务、渠道合作伙伴以及它们之间的复杂关系。
∙风险管理和合规性。
跨客户、交易方、合同、事务、金融票据、业务领域和地理区域增强可见性。
借助多领域主数据管理(MDM),解决不一致且重复的数据以支持战略目标Informatica 的多领域MDM 解决方案基于Informatica 平台,集成信息并将其交付到任何背景下的任何系统中。
它旨在省去跨多个系统搜索和手动协调不同格式的数据所花费的大量时间。
它还能够跨地点、应用程序、渠道和部门交付结果数据,使贵组织可以更快地朝着关键目标迈进:∙获得并保持客户∙提高效率并降低成本∙针对合并与收购进行整合∙管理合规性,限制风险和增强透明度多领域MDM 通过可信且完整的数据推动业务发展借助Informatica 多领域MDM 解决方案功能,财富500 强和全球500 强公司(从金融服务业和制造业到生命科学和医疗保健)得以更快地实现价值、降低总拥有成本以及获得卓越的投资回报:∙识别不一致和重复的数据∙将数据解析为唯一的真实版本∙揭示关键数据之间的关系,获得可操作的洞察力,提高业务绩效。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
产品结构
• • • • • Informatica Server Workflow Manager , monitor Informatica Repository Server Repository Manager Designer
Informatica Server
• 数据集成引擎 • 支持各种操作平台,各种源、目标数据库
• 允许企业将电子商务数据源(XML)与传统数据 源(ERP,CRM, 等)集成起来,以进行更加广泛 的业务分析。对数据源分析可通过DTD或XML模 型来直接解析XML数据。 • 元数据共享 • Informatica的局部和全局的元数据库(Local and global metadata repository)可以注册各部门级 数据市场的信息并可动态将部门级数据市场与其 它分布式信息存储连接起来,从而可以得到全企 业的统一的数据仓库元数据视角。
• 世界1000强
– 10家最大的制造商,有7家是Informatica的客户
• 政府部门
– 13家最大的医药集团,有11家是Informatica的客户 – 美国海陆空三军所有的4个分支(陆军、空军和海军)
2001/2000年数据仓库/分析行 业的许可证收入的增长
• INFA = Informatica • BOBJ = 业务目标 • ASCL = Ascential • BRIO = Brio • HYSL = Hyperion • SGNT = Sagent
Informatica Repository Server
• 全局元数据管理 • 全局元数据共享
– 支持发布、链接
• 元数据交换支持各种设计、前端工具
– Brio,BO,Cognos,Hyperion,Microsoft,MicroStra tegy,Peoplesoft,Seagate Software…
企业级可扩展性和可伸缩性
• Informatica PowerCenter 6可单独实施或可以作 为Informatica PowerCenter 6 Data Integration Hub(DIH)实施,成为企业相关数据转换的核心 集成引擎。Informatica PowerCenter 6 DIH可以 协调和管理多个利用Informatica PowerMart 6建 立的主题数据市场。 • 将杰出的可扩展性和性能相结合,Informatica PowerCenter 6可以访问多种商业数据源。通过 其增强的性能、改善的可伸缩性、及新的并行数 据抽取性能,Informatica PowerCenter 6能在很 短时间处理大量的数据。
世界级标准企业数据集成平台
• Informatica PowerCenter 6是建立可伸缩和可扩展的 Informatica数据集成平台的核心和基础。与Informatica PowerConnect产品一起使用,Informatica PowerCenter 6可以提供对广泛的应用和数据源的支持,包括对ERP系 统的支持(Oracle, PeopleSoft, SAP),对CRM系统的支 持(Siebel),对eCommerce数据的支持(XML, MQ Series),遗留系统,及主机数据。Informatica PowerCenter 6是最突出的分析性数据集成平台。 • Informatica PowerCenter 6是一个可以使大的企业或组织 能够按其复杂的业务信息需求,读取、转换和集成遗留系 统、关系型ERP,CRM,消息信息和电子商务数据的数 据集成平台。
– UNIX (HP-UX™,AIX™,Solaris™),Windows – DB/2, Informix, MS SQL Server™, NCR Teradata, Oracle, Sybase,IMS, VSAM,PeopleSoft EPM™, SAP® BW™, Geac SmartEnterprise Warehouse,MS Access, Flat Files, ODBC and others
18% 13% 9%
•
• ACTU = Actuate • COGN = Cognos • EPNY = E.piphany
• MSTR = Microstrategy
I N F A
B O B J
A C T U
C O G N
E P N Y
பைடு நூலகம்A S C L
B R I O
H Y S L
S G N T
M S T R
并行处理能力
• 可允许用户实施跨多服务器的Informatica PowerCenter 6转换引擎,可使系统性能最 大化。 • 改善的查询缓存使用 • 可以通过允许用户在活动的会话期间向查 询缓存中增加数据行。永久性查询缓存可 被不同的数据匹配共享,因此可以避免对 数据库的重复查询。
对电子商务的支持
• Metadata Exchange
– 提供与各种第三方产品之间的元数据交换能力
PowerCenter 简介
• Informatica PowerCenter 6是世界级的企业 数据集成平台,可帮助企业做出快速、一 致、高质量的决策。此产品为满足企业级 要求而设计,可以提供企业部门的数据和 电子商务数据源之间的集成,如XML,网 站日志,关系型数据,主机和遗留系统等 数据源。此平台性能可以满足企业分析最 严格的要求。
公司简介
• Informatica 作为电子商务分析软件,数据集成和 分析型应用解决方案提供商,拥有包括分析型应 用软件、广泛的支持服务和强大的数据集成平台 在内的综合性产品家族。. Informatica的基础设施 产品以可伸缩的、可扩展的企业级数据集成平台 为特点,并广泛支持来自Informatica和其他的领 先智能商务提供商的数据仓库基础设施和分析型 应用软件的开发和管理。 • Informatica的分析型应用软件也是建立在数据集 成平台之上,旨在为企业解决任何可能出现的有 关相关性、性能、瓶颈、战略和其他的种种问题。
产品优势
• • • • 中央元数据管理 开放、可扩展,可集成至大多数的解决方案 高扩展性,高性能 提供面向对象的开发环境,提高生产效率
产品特性
• • • • • • • • • • 数据集成引擎 元数据管理 协同管理 高性能、高扩展性 可视化设计环境 综合工作流 数据安全集成 分布式体系结构 调试器和其他提高生产效率的工具 国际化支持
• PowerCenter
– 业界领先的企业级数据集成平台
• PowerMart
– 部门级数据集市和分析型应用平台(通过数据集成中心(DIH)扩展)
•
PowerConnect
– 用来抽取ERP,CRM,遗产系统,EAI,主机/AS400数据源和元数据
•
PowerChannel
– 提供在分布式环境下的数据采集功能,支持广域网环境
元数据共享
• Informatica的局部和全局的元数据库 (Local and global metadata repository) 可以注册各部门级数据市场的信息并可动 态将部门级数据市场与其它分布式信息存 储连接起来,从而可以得到全企业的统一 的数据仓库元数据视角。
PowerCenter与数据仓库系统
• WEB Metadata Reporter
– 通过WEB共享元数据信息 – 支持WEB Sphere,Tomcat,JRun,Weblogic
Repository Manager
• 元数据版本管理 • 元数据复制、链接 • 组、用户级别权限管理
– 支持操作类型权限(读、写、修改、执行)
• 支持多用户
• 分布式体系结构,可实施跨多服务器的转换引擎 • 并行执行
– 读、转换、写分离进程 – 多线程 – 支持分区缓冲与分区进程
• 支持多数据源直接合并
Workflow Manager , monitor
• • • • • 协同管理 任务、会话级别调度 支持持久性任务、会话变量 运行时实时监控 支持即时容错恢复
– – – – – 所有顶尖的娱乐集团 15家最大的电信集团,有12家是Informatica的客户 10家最大的金融服务/银行集团,有8家是Informatica的客户 15家顶级的公用事业/能源集团,有11家是Informatica的客户 10家最大的保险集团,有8家是Informatica的客户
Informatica
数据集成平台介绍
上海万纬信息技术有限公司
Informatica 全球纵览
公司
成立于 (1993); Nasdaq: INFA (1999) 在全球拥有850名员工 世界标准数据的综合平台 个性化分析递送 (网络, 无线, 及语音) 交叉价值链的分析应用程序 超过1500客户遍布全世界 100强的60%与道琼斯的 63% 拥有超过200个合作伙伴,涉及销售、市场、供给以及国际 性和地区性的配送等多个领域 包括: i2, PeopleSoft, PwC, Siebel, SAP, Sybase, TCSAsia, Mitsubishi Electric - Japan, Softtek – LAR 2001: $197,000,000 增长30% (YOY)
收入增长
200 160
2000 – 2001 的增长率: 30% $152
$197
120
80
$62.4 $30.3
40
$2.1
0 1996
$12.7
1997 1998 1999 2000 2001
Informatica的客户状况
• 100强的60%是Informatica的客户 • 道琼斯工业平均指数的63% • 世界500强
产品
客户
合作伙伴
财务状况