东方通ETL工具软件TI-ETL v2 产品白皮书
H3C大数据产品技术白皮书【范本模板】
H3C大数据产品技术白皮书杭州华三通信技术有限公司8:07 AM目录1H3C大数据产品介绍 (1)1.1产品简介 (1)1.2产品架构 (1)1。
2.1 数据处理 (2)1。
2。
2 数据分层 (3)1。
3产品技术特点 (4)先进的混合计算架构 (4)高性价比的分布式集群 (4)云化ETL (4)数据分层和分级存储 (5)数据分析挖掘 (5)数据服务接口 (5)可视化运维管理 (5)1。
4产品功能简介 (6)管理平面功能: (7)业务平面功能: (8)2DataEngine HDP核心技术 (9)3DataEngine MPP Cluster核心技术 (9)3.1MPP + Shared Nothing架构 (9)3。
2核心组件 (10)3.3高可用 (11)3。
4高性能扩展能力 (11)3.5高性能数据加载 (12)3。
6OLAP函数 (13)3.7行列混合存储 (13)1H3C大数据产品介绍1.1产品简介H3C大数据平台采用开源社区Apache Hadoop2.0和MPP分布式数据库混合计算框架为用户提供一套完整的大数据平台解决方案,具备高性能、高可用、高扩展特性,可以为超大规模数据管理提供高性价比的通用计算存储能力。
H3C大数据平台提供数据采集转换、计算存储、分析挖掘、共享交换以及可视化等全系列功能,并广泛地用于支撑各类数据仓库系统、BI系统和决策支持系统帮助用户构建海量数据处理系统,发现数据的内在价值。
1.2产品架构H3C大数据平台包含4个部分:第一部分是运维管理,包括:安装部署、配置管理、主机管理、用户管理、服务管理、监控告警和安全管理等。
第二部分是数据ETL,即获取、转换、加载,包括:关系数据库连接Sqoop、日志采集Flume、ETL工具 Kettle。
第三部分是数据计算.MPP采用分析型分布式数据库,存储高价值密度的结构化数据;Hadoop存储非结构化/半结构化数据和低价值密度结构化数据.计算结果都存到数据仓库,数据仓库中的数据可直接用于分析和展示。
ETL PLUS v5白皮书
�
作业触发监控接口
第 6 页
ETL PLUS V5 产品白皮书
是调度引擎的输入组件,它以控制文件的方式对外提供服务,接收器定时扫描 接收目录中的控制文件,并且扫描间隔可以定制。 � 作业流执行策略 作业流定义了一组具有相互依赖关系的作业。作业流执行策略定义了作业失败 后的执行策略,包括忽略(Job 失败后流程可以继续运行) 、作业失败后的重 试策略(失败后从断点执行还是重头执行,失败重试间隔,失败重试次数)和 是否检查上次状态(如果检查,失败后不能自动运行,需要干预后重置状态) 。 � 调度代理 调度代理接收调度引擎的执行命令,管理作业从启动到完成,完成后存储作业 日志,返回作业执行结果到调度引擎。 � 资源管理器 资源管理器是作业进行资源分配的管理组件,作业在分发到调度代理前需要查 询资源管理器目前的资源状态,判断是否有合适的服务器执行作业,另外资源 管理器还负责实时采集服务器资源状态,为控制台监控资源提供信息。 � 通知和报警 可以在作业流上设置作业流执行状态通知和报警,在执行成功和失败后,系统 告警,并将异常明细通过 email 发给相关运维人员
灵活配置,可维护性强
� � � 定制简单化,仅需简单的鼠标点击拖拉即可完成任务调度 调度活动痕迹化,为管理风险做到可控化 灵活的消息机制,把各种消息自动分发给用户(例:将作业的执行状态通知给管
第 5 页
ETL PLUS V5 产品白皮书 理员等)
� � � �
平台组件化,耦合度低,接口简单,易开发 平台三层架构,结构清晰,具有良好的稳定性和容错性 采用了先进的 J2EE 技术架构,平台具有很强的跨平台性和良好的可移植性 支持多机集群,能承载大规模数据的高负荷运行
调度平台的逻辑架构如下图所示:
�
TongEASY V5技术白皮书
T o ng T ech
®
TongEASY 技术白皮书
东方通科技中间件技术白皮书(2)
技术白皮书
目 录
1. 前言 ......................................................................................................................................................... 4 1.1 1.2 1.3 1.4 2. 3. 4. 5. 本书范围 ......................................................................................................................................... 4 本书读者 ......................................................................................................................................... 4 本书用法 ......................................................................................................................................... 4 进一步参考资料 ............................................................................................................................. 4
TongWeb4.7技术白皮书
T on g T e c h®TongWeb4.7技术白皮书东方通科技公司2006.12目录1.概要 (1)2.企业级应用 (1)3.多层业务解决方案 (1)3.1T ONG W EB架构 (1)3.2表示层 (2)3.3业务层 (3)3.4集成层 (4)3.5系统服务 (5)1.概要TongWeb4.7应用服务器是完全遵循J2EE1.4规范的企业级应用服务器,是经受大量客户应用验证的应用支撑平台。
TongWeb4.7应用服务器已经通过了Sun MicroSystems的J2EE1.4兼容性认证,并在业界标准的J2EE性能基准测试(SPECjAppServer)中,表现出很高的性能与可伸缩性。
本白皮书包含如下三个方面的内容:•企业级应用•多层业务解决方案•管理服务2.企业级应用TongWeb全面实现了J2EE1.4规范,支持Web服务标准和互操作性。
它提供了高级消息服务、集群、高安全性、高可用性、系统管理监控和优化、方便的企业级管理、多平台开发、应用迁移、良好的集成性等诸多功能。
基于TongWeb应用服务器,您可以方便、快捷、高效地构建多层分布式企业应用,同时能够动态的与外部企业系统进行交互。
TongWeb集群可为企业应用提供高度可用、可靠、可伸缩的平台支撑,在硬件或网络出现故障的情况下提供持续可靠的服务。
可靠的安全特性可以保障企业数据的安全,防止恶意攻击。
同时TongWeb安全框架还具备扩展功能,企业可以通过插件集成其他安全产品,以提供更高级别的安全保护。
TongWeb从体系构架、连接管理、线程管理、数据缓存、对象池等多方面进行性能优化。
同时系统管理员还能监控服务器运行状况,以便及时调整服务器的运行效率。
TongWeb提供基于JBuilder,Eclipse等主流开发平台的工具支持,用户可以在可视化环境下方便的开发,调试和部署基于TongWeb的企业应用。
同时,TongWeb还提供了可视化的应用迁移工具,用户可以把基于其他应用服务器的企业应用方便地迁移到TongWeb上。
东方通公司与产品案例介绍-汇报材料【终】-军工
主机消息中间件 TL/HOST
移动/客户端
极限事务处理 XTP
认证授权服务
虚拟化平台TongCloud
数据库管理系统
基础 软件
P12
P12
军队及国防工业领域的应用
从2008年开始,东方通将经过16年积累的技术及产品开始在国防信息化建设领域 推广应用,并不断为军队及国防工业信息化建设提供优秀的国产自主知识产权的中间件 产品及全方位的技术服务。
应用服务器TongWeb
应用服务器TongWeb 应用集成中间件TI-ESB+消息中间件TLQ 文件交换平台WTP 应用服务器TongWeb
航空 船舶
沈飞通用办公系统 船舶系统部科研条件保障
政府行业重点项目中的应用
公安部某局服务总线项目 国药集团数据交换平台 国家环境信息与统计能力建设项目 卫生部突发公共卫生事件应急指挥决策系统
07国标20075538-T-469 消息中间件软件产品技术规范
共性服务及服务接口描述规范 GB/T 21062.1-2007 电子政务信息资源交换支撑体系标准规范 电子政务应用支撑技术指南 中国人民解放军总后勤部“后勤业务基础架构构件标准”(GJB) 中国人民解放军总后勤部“军事物流架构标准”
数据集成中间件 TongIntegrator v2
消息中间件TongLINK/Q 消息中间件TongLINK/Q JavaEE应用服务器 TongWeb 国军标(以TongIntegrator-ESB技术为基础) 应用服务器TongWeb 消息中间件 TongLINK/Q 消息中间件TongLINK/Q 消息中间件TongLINK/Q 应用集成中间件 TI-ESB+消息中间件TLQ 应用集成中间件 TongIntegrator v4
TongIntegratorETL技术白皮书
TI-ETL 通过转换流程、任务流程这两种流程配合,可以完成不同系统间的 复杂的数据整合工作。
转换流程
5
TongIntegrator ETL 技术白皮书
转换流程负责完成数据集成过程中的数据抽取、转换、加载工作,转换流程 由多个转换组件编排而成。转换组件是转换流程的最小处理单元,每个转换组件 完成一个特殊的数据处理任务,多个转换组件组成一个转换流程。正是因为 TI-ETL 有丰富的转换组件,使得 TI-ETL 具备高水准的数据加工处理能力。
ETL 引擎 TI-ETL 服务器包含两个执行引擎:任务引擎和转换引擎,分别实现对任务 调度管理的任务流程和完成对实际数据抽取、加工处理、加载的转换流程的执行。 在 TI-ETL 服务器启动时,可以检查部署在该节点上的数据集成流程,并执 行配置为“自动重启动”的流程,其他非自动重启动的流程需要手工启动。 在 TI-ETL 数据流程中,数据是以行为单位进行处理,如下图所示,TI-ETL 通过两个对象描述一个数据行:数据对象和元信息对象。数据对象实际的行数据, 由一个或多个数据列(字段)组成;元信息对象用于描述数据对象,包括数据对 象中每个列(字段)的类型、长度、格式等。
TongIntegrator ETL 技术白皮书
前言
主要应用优势
当前信息化的时代,数据成为了最重要的资源,如何能消化信息孤岛,更好
复杂数据结构的(Variety)、 地完成同一组织内部、同一组织上下级、不同组织间的数据汇总、统计、分析等
大批量的(Volume)、高效的 问题就凸显出来;只有很好的完成了数据的整合,才能更进一步地支撑起上层数
队资源共享及运行时引用; 3. 开发调试完成的流程 id 信息(流程引用信息),部署到 TI-ETL 服务器
大数据标准化白皮书
TongDI V2.0 操作手册说明书
TongTech®东方通数据集成软件TongDI V2.0操作手册2021年07月北京东方通科技股份有限公司地址:北京市海淀区中关村南大街2号数码大厦A座22层客户服务热线:400-650-7088目录1.产品介绍 (1)2.准备工作 (1)2.1 登录系统 (1)2.2 收藏产品 (1)3.项目管理 (1)3.1 项目管理 (1)3.1.1创建项目 (1)3.1.2编辑项目 (4)3.1.3停用/启用项目 (4)3.1.4回收资源 (4)3.1.5进入产品页 (5)3.1.6项目授权 (5)3.1.7申请使用 (6)3.1.8删除项目 (6)3.2 项目申请授权 (6)3.2.1申请授权 (6)3.2.2申请撤回 (8)3.2.3授权查看 (8)3.2.4授权冻结/恢复 (9)3.2.5授权终止 (9)3.3 项目申请管理 (10)3.3.1申请查看 (10)3.3.2申请删除 (10)4.分类管理 (11)5.转换管理 (11)5.1 转换管理页 (11)5.2 转换管理-创建转换 (12)5.2.1转换-转换设置 (14)5.2.2转换-组件视图 (18)5.2.3转换-资源视图 (18)5.2.4转换-转换组件选项 (19)5.2.5转换-转换连接选项 (20)5.2.6转换-转换功能栏 (20)5.3 转换管理-流程操作 (20)5.3.1流程操作-编辑 (20)5.3.2流程操作-复制 (21)5.3.3流程操作-部署 (21)5.3.4流程操作-回滚 (22)5.3.5流程操作-删除 (23)5.3.6流程操作-检出 (23)5.3.7流程操作-检入 (23)5.3.8流程操作-产品版本查看日志 (24)5.3.9流程操作-产品版本详情 (24)5.3.10流程批量部署 (24)5.3.11流程导出 (24)6.任务管理 (25)6.1 任务管理页 (25)6.2 任务管理-创建任务 (25)6.2.1任务-任务设置 (27)6.2.2任务-组件视图 (30)6.2.4任务-任务组件选项 (31)6.2.5任务-任务连接选项 (31)6.2.6任务-任务功能栏 (32)6.3 任务管理-流程操作 (32)6.4 任务管理-任务监控 (32)6.4.1创建带子转换的任务流程 (32)7.场景服务 (34)7.1 异构表-全量同步 (35)7.2 异构表-全库备份 (37)7.3 异构表-触发器场景 (37)7.4 异构表-时间戳(自增序列)场景 (38)7.5 异构表-CDC场景 (39)7.6 同构表-全量同步 (40)7.7 同构表-全库备份 (40)7.8 同构表-触发器场景 (40)7.9 同构表-时间戳(自增序列)场景 (41)7.10 同构表-CDC场景 (41)7.11 接口数据到库表 (41)7.12 接口数据到文件 (43)7.13 场景服务列表-操作 (44)7.13.1场景服务流程-库表类型-编辑 (44)7.13.2场景服务流程-接口类型-编辑 (44)7.13.3场景服务流程-部署 (45)7.13.4场景服务流程-删除 (45)8. CDC任务创建流程 (45)8.1 创建抽取 (45)8.2 启动任务 (46)8.3 停止任务 (47)8.4 编辑任务 (47)9. 示例资源 (47)9.1 典型场景 (47)9.1.1 全量同步-任务列表 (47)9.1.2 全量同步-转换列表 (48)9.1.3 增量同步-任务列表 (48)9.1.4 增量同步-转换列表 (49)9.2 转换组件示例 (49)10. 周期任务开发 (49)10.1 选择项目 (49)10.2 解决方案 (50)10.2.1 创建解决方案 (50)10.3 数据开发流程 (52)10.3.1 创建周期业务流程 (52)10.3.2 新增节点 (52)10.3.3 配置节点 (53)10.3.4 节点调度配置 (58)10.3.5 节点依赖配置 (64)10.3.6 配置流程参数 (65)10.3.7 提交节点任务 (66)10.4 数据处理组件 (66)10.4.1 SparkSQL (66)10.4.2 Shell (67)10.4.3 Spark (68)11. 资源管理 (85)11.1 项目表 (85)11.1.1 创建事实模型 (86)11.1.2 创建视图模型 (90)11.1.3 创建普通维度模型 (92)11.1.4 创建层级维度模型 (94)11.1.5 创建枚举维度模型 (97)11.2 函数管理 (99)11.2.1 新增函数 (99)11.2.2 查看函数 (101)11.2.3 删除函数 (102)11.3 自定义算子 (103)11.3.1创建资源文件夹 (103)11.3.2新增资源 (104)11.3.3查看资源 (104)11.3.4替换资源 (105)11.3.5删除资源 (105)1.产品介绍东方通数据集成软件具备数据集成和数据开发能力,通过管理控制台,实现产品开发的项目管理、任务管理,任务全生命周期的管理,还有任务转换管理、任务监控、任务转换、日志审计等Web 管理功能。
东方通应用服务器TongWeb6.0技术产品白皮书
JSF 是 JavaEE 5 规范中提出的关于 Web 层的开发框架,与其他 Web 框架不同的是 JSF 以用户界面为核心,它将控制粒度细化到页面的"组件"一级,即 JSF 将各类页面元素抽 象成 UI(User Interface 即用户界面)组件,这些 UI 组件可以灵活的组装生成页面,并
JavaEE 规范支持的升级..........................................................................................................4 便捷的开发插件 ....................................................................................................................... 5 应用容错性...............................................................................................................................6 开源框架兼容性 ....................................................................................................................... 7 提高可靠性和运营效率,减少维护成本 ....................................................................................... 8 方便运维的工具支持 ............................................................................................................... 8 增强的 Web 应用集群...............................................................................................................8 监控诊断和快照分析 ............................................................................................................... 9 24 小时不中断请求的应用更新系统和完善的应用版本控制 ..............................................9 为云平台快速构建应用运行环境 ........................................................................................... 9 升级到 TongWeb6.0 应用服务器.....................................................................................................9 版本说明......................................................................................................................................... 10 轻量版..................................................................................................................................... 10 标准版..................................................................................................................................... 10 企业版..................................................................................................................................... 10 虚拟镜像版.............................................................................................................................10 总结 ................................................................................................................................................10
TongTech技术白皮书东方通
TongTech ®TongLINK/Q7.0技术白皮书东方通科技中间件技术白皮书(1) 1目录1. 前言........................................................................................................................................................ . (2)2. 企业级应用的传输需求 (2)3. TongLINK/Q简介 (3)4. TongLINK/Q体系结构 (3)4.1. 产品组成 (3)4.2. 节点........................................................................................................................................................ .. 44.3. 监控管理中心 (5)4.4. 开发接口 (5)5. TongLINK/Q基本功能 (6)5.1. 应用构建模式 (6)5.2. 消息传递模式 (7)5.3. 节点组织模式 (8)5.4. 通道连接方式 (8)5.5. 异步通讯机制 (9)5.6. 消息管理 (9)5.7. 队列管理 (10)5.8. 压缩加密 (11)5.9. 断点续传 (11)5.10. 流量控制 (11)5.11. 集群功能 (11)5.12. 事件功能 (12)5.13. 事务管理 (12)5.14. 应用管理 (12)5.15. 日志管理 (12)5.16. 配置监控管理 (12)5.17. 安全出口 (13)5.18. 支持JMS1.1 (13)5.19. 应用接口 (14)6. TongLINK/Q产品特点 (14)6.1. 可靠性 (14)6.2. 高效性....................................................................................................................................................146.3. 安全性....................................................................................................................................................146.4. 可用性 (14)6.5. 可扩展性 (15)6.6. 开放性 (15)6.7. 可管理性 (15)7. 解决方案........................................................................................................................................................157.1. 联合审批系统 (15)7.2. 股票信息发布系统 (17)7.3. 与应用服务器的集成............................................................................................................................ 17 21. 前言随着计算机技术的发展,分布式应用系统的应用日益广泛,在这样的环境中,无论硬件还是软件平台都不可能做到统一。
TongWeb5.0技术产品白皮书
产品概述:阐述TongWeb应用服务器在企业级应用中的作用。
体系结构:详细说明TongWeb应用服务器的体系结构及其优势。
产品特性:简要介绍TongWeb应用服务器的产品特性。
版本说明:简要介绍TongWeb应用服务器的各个版本的区别。
今天,伴随网络和信息化建设的蓬勃发展,中间件平台广泛地应用于电信、金融、政府,交通,能源等各行各业的企业应用。
为了充分利用和保护关键业务基础架构,所选的中间件平台必须是基于标准、具有可扩展性、持续的可用性、高效的易管理性,而且要足够灵活,以支持各类开发团队和多种应用框架。
东方通TongWeb应用服务器完全满足甚至超过了上述要求。
TongWeb应用服务器支持SOA,为企业应用提供最可靠,最稳定的基础支撑环境。
TongWeb应用服务器支持从开发到生产的整个应用生命周期和多种主流的应用框架,并完全支持Java EE 5规范、最新的Web服务标准。
目前,TongWeb应用服务器已经发展到了第5代产品。
10多年来,通过持续创新,艰苦磨练,不断吸收并满足企业的迫切需求,TongWeb应用服务器已经成为企业和开发人员的理想选择,帮助电信、金融、电子政务,以及其它企业应用不断获得成功。
本文面向技术决策者和企业架构师。
阅读本文开头和结尾,您可以从宏观上了解TongWeb应用服务器。
阅读全文,您可以进一步了解TongWeb应用服务器的详情。
概要TongWeb应用服务器在企业级应用中的作用。
产品概述TongWeb应用服务器是一个获得Java EE 5认证的Java应用服务器,它全面实现了Java EE 5规范、最新的Web服务标准和主流的互操作标准;它提供高级消息传输、Web服务、高可用性、集群和多平台支持。
通过配置TongWeb应用服务器集群,可以实现负载均衡,增强应用的扩展性。
通过将高度优化的会话服务器添加到TongWeb应用服务器标准版,TongWeb应用服务器企业版的集群提供多台服务器之间的无缝移植以及故障切换,从而可确保关键应用和服务持续运行,帮助企业应对应用程序宕机或者服务意外无法访问等情况。
TongWEB
T ongT ech®TongWeb技术白皮书东方通科技公司2005.11目录1.概述 (3)2.应用服务器 (3)2.1三层/多层应用模式和应用服务器 (3)2.2J2EE体系结构 (4)3.TONGWEB 体系结构 (4)3.1概述 (4)3.2T ONG W EB主要构件和功能 (5)(1)易于扩展服务的TongWeb内核 (5)(2) TongWeb Web容器 (5)(3) TongWeb EJB容器 (6)(4)会话管理器 (7)(5)数据库管理功能 (7)(6)名字目录服务 (8)(7) JCA支持 (8)(8) Java消息管理 (9)(9)交易服务与交易API (10)(10)安全服务 (10)(11)集群与均衡负载 (10)(12) Web Service支持 (11)(13)通过IIOP与CORBA对象的交互 (11)(14)开发和管理工具支持 (11)4.与传统应用和传统中间件的集成 (12)4.1通过J A V A连接器结构与传统应用集成 (12)4.2与交易中间件T ONG EASY的集成 (12)4.3与消息中间件T ONG LINK/Q的集成 (12)1.概述本技术白皮书是为想深入了解TongWeb 的技术人员编写,内容包括三层/多层应用模式介绍、应用服务器和J2EE介绍、TongWeb体系结构、功能特性、与传统应用的集成等几个部分。
2.应用服务器2.1三层/多层应用模式和应用服务器传统的应用系统模式是“主机/终端”或“客户机/服务器”。
随着Internet 的发展壮大,新的开发模式也应运而生,即所谓的“浏览器/服务器”结构、“瘦客户机”模式。
但是以Internet 为基础的企业级应用,不仅要求在分布式环境下实现信息的采集、管理、发布、交换、处理等,还要求能解决好以下问题:•快速开发和构建•处理大量并发事务•交易完整性•易扩展•互操作性•可靠性•信息安全要很好地解决以上问题,仅靠简单的Web技术是不够的,需要引入三层/多层应用模式。
H3C大数据产品技术白皮书
H3C大数据产品技术白皮书杭州华三通信技术有限公司2022年4月目录1H3C大数据产品介绍 (1)1.1产品简介 (1)1.2产品架构 (1)1.2.1 数据处理 (2)1.2.2 数据分层 (3)1.3产品技术特点 (4)先进的混合计算架构 (4)高性价比的分布式集群 (4)云化ETL (4)数据分层和分级存储 (5)数据分析挖掘 (5)数据服务接口 (5)可视化运维管理 (5)1.4产品功能简介 (6)管理平面功能: (7)业务平面功能: (8)2DataEngine HDP核心技术 (9)3DataEngine MPP Cluster核心技术 (9)3.1MPP + Shared Nothing架构 (9)3.2核心组件 (10)3.3高可用 (11)3.4高性能扩展能力 (11)3.5高性能数据加载 (12)3.6OLAP函数 (13)3.7行列混合存储 (13)1H3C大数据产品介绍1.1产品简介H3C大数据平台采用开源社区Apache Hadoop2.0和MPP分布式数据库混合计算框架为用户提供一套完整的大数据平台解决方案,具备高性能、高可用、高扩展特性,可以为超大规模数据管理提供高性价比的通用计算存储能力。
H3C大数据平台提供数据采集转换、计算存储、分析挖掘、共享交换以及可视化等全系列功能,并广泛地用于支撑各类数据仓库系统、BI系统和决策支持系统帮助用户构建海量数据处理系统,发现数据的内在价值。
1.2产品架构H3C大数据平台包含4个部分:第一部分是运维管理,包括:安装部署、配置管理、主机管理、用户管理、服务管理、监控告警和安全管理等。
第二部分是数据ETL,即获取、转换、加载,包括:关系数据库连接Sqoop、日志采集Flume、ETL工具 Kettle。
第三部分是数据计算。
MPP采用分析型分布式数据库,存储高价值密度的结构化数据;Hadoop存储非结构化/半结构化数据和低价值密度结构化数据。
东方通ETL工具软件TI-ETLv2产品白皮书全解
T ongT ech®TI-ETL v2产品白皮书北京东方通科技公司2015年目录1 前言 (1)2 为什么要用ETL (1)2.1 业务需求 (1)2.2 IT需求 (2)2.3 IT与业务一致性要求 (2)3 TI-ETL v2简介 (3)3.1 产品组成结构 (3)3.1.1 集成开发工具 (4)3.1.2 服务器 (5)3.1.3 资源库 (5)3.1.4 统一管理平台 (6)3.2 产品结构关系 (7)3.3 转换流程和任务流程 (8)3.3.1 转换流程 (8)3.3.2 任务流程 (9)4 主要功能和特点 (10)4.1 大数据适配 (10)4.2 强健的ETL引擎 (10)4.3 丰富的系统适配 (11)4.4 资源统一存储 (11)4.5 丰富的处理组件 (11)4.6 多种数据抽取模式 (11)4.7 图形化操作/调试/预览能力 (11)4.8 高效数据处理 (12)4.9 异常恢复和数据一致性 (12)4.10 强大的监控管理功能 (12)4.11 插件式组件管理和可扩展性 (12)4.12 国产环境支持 (13)5 成功案例 (13)1前言随着IT应用建设的发展,数据成为了最重要的资源,无论是接地气的业务系统、应用软件、数据中心或是高大上的云/物/移/大/智,均是以数据资源为核心,依托发挥数据价值而存在和发展。
目前,虽然各行业IT发展成熟度不一致,但基本已经度过了大批量业务系统建设阶段,业务系统也经过了几年的运转,积累了不同量级的数据资源。
但因早起IT业务系统的很少跨部门、跨单位、跨层级的统一规划和建设,导致业务系统处于分散、独立的状况,业务间数据资源不仅处于烟囱状态,数据资源的一致性和互用性较差,数据资源的价值无法充分发挥。
此外,各行业自身业务也在逐渐多元化和复杂化,业务产生和所需使用的数据也就具有不确定和频繁变动性,导致一旦应用发生变化、新增系统或物理数据变动,一旦无法借助某些手段适应变化,整个应用和数据体系均有较大可能不得不随之修改。
ETL技术白皮书
2.1.3 多种数据源支持
DMETL 支持多种常用数据源,如关系数据库、JMS 消息、XML 文件、TXT 文件等。 DMETL 的数据抽取和装载采用主流标准接口,如 JDBC、JMS、JAXP 等,与具体数据源无 关。系统的数据源接口采用适配器方式实现,新的数据源能够很方便的加入进来。
2.1.1 兼容多种硬件体系
DMETL 兼容多种硬件体系,可运行于 X86、X64、SPARC、POWER 等硬件体系之上。各 种平台上的数据处理方式完全一致。与此同时,各平台的消息通信结构也完全保持一致,使 得 DMETL 的各种组件均可以跨不同的软、硬件平台与 DMETL 服务器进行交互。
2.1.2 多种操作系统支持
达梦数据交换平台
技术白皮书
达梦数据库有限公司
目录
概 述 ................................................................................................................................................4 1 体系结构 ......................................................................................................................................4 2 技术特性 ......................................................................................................................................5
软件中间件-东方通全线产品描述
软件中间件-东方通全线产品描述1、SOA集成中间件TongIntegrator v4企业和政府现有的管理信息系统,由于投入的时间、使用的部门、生产的厂家及实现技术等各不相同,造成企业和政府现有的应用信息系统各自独立运行,数据不能共享,各自业务流程不能自动衔接,造成企业和政府内部许多自成体系的信息化孤岛,各个应用系统不能相互协作,形成统一高效的有机整体。
TongIntegrator v4作为东方通科技公司的企业应用集成产品,可以接上上述问题,其主要适用场景就是在两个或更多的异构系统(如不同的数据库、消息中间件、ERP或CRM等)之间进行资源整合(数据整合、应用整合、流程整合),实现互连互通、数据共享、业务流程协调统一等功能,构建灵活可扩展的分布式企业应用。
2、数据集成中间件TongIntegrator v2●如何实现应用系统的快速构建,迁移和伸缩,以满足不断变化的市场需求。
●如何能够让已有的多种应用系统无缝的集成起来。
●如何设计现代IT架构,使系统不仅功能强大和可靠,而且还有强大的灵活性和可扩展性,以满足不断增长的新需求。
TI2能够为需要数据集成的应用提供数据流服务,即需要解决数据从何而来,哪个应用对其感兴趣,以及如何被每个系统使用。
TI2通过把信息提供者和消费者隔离,来构建灵活的系统,使得这些系统不会受到数据的物理位置的影响,也不会受到需要存取数据信息的应用个数的影响。
这样,对于每一个系统就不需要进行特别的定制处理,就可以在系统之间实现信息的集成了。
3、消息中间件TongLINK/Q随着计算机技术的发展,分布式应用系统的应用日益广泛,在这样的环境中,无论硬件还是软件平台都不可能做到统一。
大规模的应用软件通常要求在软、硬件各不相同的分布式网络上运行,由此出现了不同硬件平台、不同网络环境、不同数据库之间的互操作。
为了更好地开发和应用能够运行在这种异构平台上的软件,迫切需要一种基于标准的、独立于计算机硬件及操作系统的开发和运行环境,这就需要中间件技术了。
东软IT综合监控产品白皮书_图文.
F O R C E V I E W I T综合管理系统标准版白皮书东华软件股份公司2009年4月目录1前言 (42IT管理现状 (52.1 IT系统现状 (52.2 IT管理目标 (52.3 IT管理原则 (72.4 IT管理效益 (73系统架构 (83.1 系统设计思想 (83.2 系统逻辑架构 (103.2.1 数据采集 (113.2.2 数据处理 (123.2.3 数据展示 (173.3 系统功能架构 (184系统功能 (194.1 监控平台功能描述 (194.1.1 用户登录 (194.1.2 IT综合管理系统布局 (19 4.1.3 视图管理 (204.1.4 告警管理 (234.1.5 性能管理 (254.1.6 配置管理 (264.1.7 系统工具 (274.1.8 系统快捷功能 (284.1.9 统计报表 (314.1.10 系统管理 (324.2 服务管理平台功能描述 (36 4.2.1 服务台 (364.2.2 事件管理 (374.2.3 问题管理 (384.2.4 变更管理 (404.2.5 配置管理 (414.2.6 知识库 (425监控平台管理范围 (43 5.1 网络管理 (435.1.1 设备类型 (435.1.2 采集协议 (435.1.3 主要监控指标 (43 5.2 服务器管理 (445.2.1 设备类型 (445.2.2 采集协议 (445.2.3 主要监控指标 (44 5.3 数据库管理 (445.3.1 设备类型 (445.3.2 采集协议 (455.3.3 主要监控指标 (45 5.4 中间件管理 (455.4.1 设备类型 (455.4.2 采集协议 (465.4.3 主要监控指标 (465.5 安全管理 (465.5.1 设备类型 (465.5.2 采集协议 (465.5.3 主要监控指标 (466附件 (471前言近年来,随着信息技术的迅速发展,IT系统的建设规模以高于30%的速度逐年递增。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
T ongT ech®TI-ETL v2产品白皮书北京东方通科技公司2015年目录1 前言 (1)2 为什么要用ETL (1)2.1 业务需求 (1)2.2 IT需求 (2)2.3 IT与业务一致性要求 (2)3 TI-ETL v2简介 (3)3.1 产品组成结构 (3)3.1.1 集成开发工具 (4)3.1.2 服务器 (5)3.1.3 资源库 (5)3.1.4 统一管理平台 (6)3.2 产品结构关系 (7)3.3 转换流程和任务流程 (8)3.3.1 转换流程 (8)3.3.2 任务流程 (9)4 主要功能和特点 (10)4.1 大数据适配 (10)4.2 强健的ETL引擎 (10)4.3 丰富的系统适配 (11)4.4 资源统一存储 (11)4.5 丰富的处理组件 (11)4.6 多种数据抽取模式 (11)4.7 图形化操作/调试/预览能力 (11)4.8 高效数据处理 (12)4.9 异常恢复和数据一致性 (12)4.10 强大的监控管理功能 (12)4.11 插件式组件管理和可扩展性 (12)4.12 国产环境支持 (13)5 成功案例 (13)1前言随着IT应用建设的发展,数据成为了最重要的资源,无论是接地气的业务系统、应用软件、数据中心或是高大上的云/物/移/大/智,均是以数据资源为核心,依托发挥数据价值而存在和发展。
目前,虽然各行业IT发展成熟度不一致,但基本已经度过了大批量业务系统建设阶段,业务系统也经过了几年的运转,积累了不同量级的数据资源。
但因早起IT业务系统的很少跨部门、跨单位、跨层级的统一规划和建设,导致业务系统处于分散、独立的状况,业务间数据资源不仅处于烟囱状态,数据资源的一致性和互用性较差,数据资源的价值无法充分发挥。
此外,各行业自身业务也在逐渐多元化和复杂化,业务产生和所需使用的数据也就具有不确定和频繁变动性,导致一旦应用发生变化、新增系统或物理数据变动,一旦无法借助某些手段适应变化,整个应用和数据体系均有较大可能不得不随之修改。
数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,通过应用间的数据有效流通和流通的管理从而达到集成,主要解决数据的分布性、异构性、有效性和及时性的问题。
此外,数据集成是个长期不断持续的过程,需要有易用的工具、长期可靠的运行环境、全面有效的监控管理共同支撑,而非仅通过工具可以一次性解决的。
ETL是数据集成领域的落地技术,区别与传统数据交换,ETL在可完成基本数据交换(抽取、传输、装载)的前提下,对数据的转换(即数据的按需加工处理)提供更易用和更强大的支持,使数据在不同业务之间流动的同时,各业务获取到的数据确实是可有准确、及时、有效应用的。
TI-ETL是从传统数据交换产品继续发展的产物,有着多年的数据集成领域产品研制的积淀,已在大交通(海/陆/空)、大政府、国防工业、企业等行业核心系统中成功应用,辅助众多行业和用户逐渐发挥出了数据的价值,提升了IT支撑业务的有效性。
2为什么要用ETL2.1业务需求IT建设随业务发展,业务过程以数据贯穿,即业务有效性的基础是数据,且有效性又包含可获得性、及时性、准确性和一致性。
在信息化早起,因信息系统较少、业务关系复杂度较低,对数据关注度也较低。
随着各单位自身的发展,内部组织机构、多级组织机构建设愈发全面,业务关系也愈发复杂,各内部组织以及跨不同单位之间均会因为业务关联产生数据有效关联、互用的需求。
例如单位内人力作为人资管理的职能部门,新人入职、人员在部门间调动、人员岗位晋升等人员变动情况会影响向财务、档案、信息管理等多个部门的业务,包括工资涨降、档案归档、固定资产关联等等,即人资信息发生变化时需要其它同样存储了该信息的业务部门也能够自动完成信息变更。
例如部委需要从各下级委办局汇总数据,各委办局业务系统可能是分别由不同厂商建设,虽然是处理同样的业务,但业务系统存储数据的格式和方式不同。
以数据项“部门名称”为例,有的业务系统存储是的汉字,也的存储的可能是数字编码,此时虽然数据都能汇总到一起,但数据却无法合并,即使汇总后也可能无法支撑业务。
2.2IT需求数据大多以数据库、文件为存储载体,数据库和文件又存在多个品牌和版本,所以业务数据往往是分散在不同品牌、版本的数据库和文件中,业务系统间能够按需的互用数据则需要通过IT手段实现对不同数据源的按需适配、按需采集、按需处理、按需装载以及通过图形化界面操作定义数据间的关系和处理逻辑,实现一次定义长期有效执行,同时提供全局的可视化监控管理,能够随时掌握业务间数据交互的有效性。
2.3IT与业务一致性要求“按需”是业务诉求,对应IT则包括了采集、加工处理、装载、监控、运维、管理等技术要求,以满足业务层面对可获得性、及时性、准确性、一致性的需求,多以ETL产品和技术实现IT支撑:(1)ETL提供多种数据源适配组件,可与多种主流数据库、文件、通信协议进行对接,保障采集的全面适配,提供高可获得性。
(2)ETL提供触发器、时间、CDC等多种数据采集模式,可根据业务对及时性的定义以及业务数据存储的现状选择不同模式,并且提供并行等高效处理机制,提供高及时性。
(3)ETL提供丰富的数据加工处理组件达到100+,且可根据业务规则灵活拼接处理流程,提供高准确性和高一致性。
(4)ETL提供基于Web的监控管理中心,在满足核心业务需求的同时提供易用、可视的运维、监控、管理、监视的统一管理能力。
3TI-ETL v2简介东方通数据集成产品TI-ETL,提供对企业数据的集成处理功能。
通过TI-ETL产品,用户可以从不同结构的数据源中抽取数据(Extract),对数据进行复杂的加工处理(Transform),最后将数据加载到各种存储结构中(Load)。
例如实现从多个异构的数据源(不同数据库、结构化文件等)抽取数据,并加工成统一的数据格式,最后加载到数据仓库中,供商业智能(Business Intelligent,BI)等应用使用。
TI-ETL提供一个简单易用的开发、管理工具,提供覆盖从数据集成逻辑的设计、开发、调试、部署,到运行、管理、监控各个生命周期不同阶段的集成开发工具。
通过TI-ETL可以实现对数据集成流程的开发和部署;通过监控和日志功能,可以实现对数据集成的运行过程进行实时监视,对集成流程历史数据进行分析。
TI-ETL提供了一个强健、高效的数据处理引擎,支撑各种复杂的数据转换流程、任务调度流程的高效运行。
引擎采取异步并行处理的技术,实现流程中的每个组件多线程并行高效处理;支持集群部署方式,允许将转换或转换中的比较耗时的数据处理组件部署在多台服务器上并发执行,从而将转换的工作分摊到多台服务器上,从而提高TIETL的数据处理效率。
TI-ETL基于Java技术和标准数据库接口(JDBC、ODBC等),支持部署在各种主流操作系统和国产操作系统上,支持与各种主流数据库、开源数据库、国产数据库的接入,支持对各种结构化/非结构化格式文件的读写,以及通过多种协议与其他应用系统的交互。
TI-ETL提供大量的任务组件和转换组件,如多源的数据合并、数据的路由、数据行列转换、字典表查询、定时重启、循环调度、流程告警等,用户可以通过拖拽方式快速完成各种复杂的数据集成需求和集成的调度控制,无需人工编码,快速构建数据集成应用。
TI-ETL提供Web形式的统一管理平台,用于将分布式网络环境中部署的TI-ETL服务器运行实例及运行在TI-ETL服务内的任务流程集中统一管理监控。
提供功能级和数据集的权限管理,可定义的错误告警机制,自定义面板等。
同时管理平台提供丰富的管理Rest API接口和方便的管理扩展机制,方便客户集成统一管理平台并扩展自己的插件集成到平台中。
3.1产品组成结构TI-ETL产品架构由集成开发工具TI-ETL Studio、TI-ETL服务器、资源库、统一管理平台四大核心部分组成,如下图所示。
图:TI-ETL v2产品组成结构3.1.1集成开发工具TI-ETL Studio集成开发工具是一个集开发、调试、配置、部署、执行、监控、日志、管理等功能于一体的平台。
通过该平台实现从数据集成需求到实现的快速转化,并实现对整个生命周期的管理。
➢开发/调试TI-ETL Studio提供大量的任务组件和转化组件,通过这些组件,以图形化的方式,实现数据集成流程的快速编排。
TI-ETL Studio还提供了功能强大的调试预览功能,可以在开发过程中实现数据行级别的调试和预览,跟踪和观察每一行数据经过数据集成流程中每一个转化组件进行加工处理的结果。
通过集成开发工具开发调试完成的数据集成流程保存到资源库中统一存储管理。
➢远程管理TI-ETL Studio通过ETL服务器的远程接口,实现对服务器的管理。
包括数据集成流程的分布式部署、远程执行、对执行状态的实时监控、对执行日志进行查看和分析。
TI-ETL Studio的监控管理功能可以对运行中的流程执行暂停、开始、停止、解部署等控制,同时还可以对数据处理状态进行实时监控,包括每个组件处理的记录数、过滤的记录数,并且可以得到每个组件处理数据的性能指标和整个集成流程的性能指标。
3.1.2服务器TI-ETL服务器是一个TI-ETL的逻辑节点,包含对数据集成流程的执行能力,并通过HTTP 协议对外开放对服务器的管理接口。
➢E TL引擎TI-ETL服务器包含两个执行引擎:任务引擎和转换引擎,分别实现对任务调度管理的任务流程和完成对实际数据抽取、加工处理、加载的转换流程的执行。
在TI-ETL服务器启动时,可以检查部署在该节点上的数据集成流程,并执行配置为“自动重启动”的流程,其他非自动重启动的流程需要手工启动。
在TI-ETL数据流程中,数据是以行为单位进行处理,如下图所示,TI-ETL通过两个对象描述一个数据行:数据对象和元信息对象。
数据对象实际的行数据,由一个或多个数据列(字段)组成;元信息对象用于描述数据对象,包括数据对象中每个列(字段)的类型、长度、格式等。
➢监控管理接口TI-ETL服务器还提供了对运行时的监控和管理功能,这些功能通过Java、HTTP、REST等多种封装形式对外开放。
通过这些接口,第三方应用可以将监控管理功能集成到自己的管理控制台中进行统一监控管理,实现对TI-ETL的远程管理,如流程部署、流程控制、转换监控、日志查看等功能。
➢认证授权TI-ETL服务器提供了完善的认证授权机制,只有通过认证和授权的用户,才可以通过监控管理接口实现对服务器的管理和监控。
3.1.3资源库TI-ETL资源库用于持久化存储TI-ETL的元数据,包括ETL服务器的配置信息、任务流程信息、转换流程信息、基础资源信息(如数据库连接)等。