Datastage客户端详细配置
datastage使用说明

用DataStage进行数据整合DataStage 的开发环境是基于C/S 模式的,通过DataStage Client 连接到DataStage Server 上进行开发。
这里有一点需要注意,DataStage Client 只能安装在Windows 平台上面。
而DataStage Server 则支持多种平台,比如Windows、Redhat Linux、AIX、HP-UNIX。
DataStage Client 有四种客户端工具。
分别是DataStage Administrator、DataStage Designer、DataStage Manager、DataStage Director。
接下来首先介绍这几种客户端工具在DataStage 架构中所处的位置以及它们如何协同工作来开发ETL Job 的,接着再分别详细介绍每个工具的功能。
图1 描述了IBM WebSphere DataStage 的整个系统架构。
DataStage 的客户端工具连接到DataStage Server 上进行ETL Job 的开发,DataStage Server 再与后台的数据库连接起来进行数据处理。
DataStage 的客户端工具之间的是一个相互合作的关系。
下面通过介绍ETL Job的开发过程来介绍他们之间的这种关系。
ETL Job开发流程1.用DataStage Administrator 新建一个项目;2.用DataStage Designer 连接到这个新建的项目上进行ETL Job的设计;3.用DataStage Director 对设计好的ETL Job设置运行的模式,比如多长时间运行一次ETL Job;4.用DataStage Manager 进行ETL Job的备份等。
图1:IBM WebSphere DataStage 架构图DataStage AdministratorDataStage Administrator 的主要功能有以下几个:1.设置客户端和服务器连接的最大时间。
DataStage客户端安装及使用文档

DataStage 客户端安装及使用文档1.客户端安装1.1 安装步骤解压客户端文件client_IA-suite.rar,完成后,进入目录,client_IA-suite,运行install.exe,会提示如下:选择英语,点击确定,安装时,最好关闭防火墙,选择要安装客户端的位置,点击NEXT:选择要安装的组件,点击NEXT:选择安装模式,点击NEXT:点击INSTALL后,开始安装:点击FINISH,安装完成。
安装完成后,在本机的HOSTS文件中需要配置一下:目录:C:\Windows\System32\drivers\etc在最后一行添加如下:# localhost name resolution is handled within DNS itself.# 127.0.0.1 localhost# ::1 localhost17.83.26.110(IP地址为服务器地址)ETL110(这个名字可以自己取)1.2 DataStage Client组件安装完成后有如下组件:1.Administrator Client用于创建DataStage 用户,创建,移动项目,设置清除标准的用户界面。
2.Director Client用来验证,计划时间,运行,监控DataStage 作业的用户界面。
3.Designer Client用来创建DataStage 应用(或作业)的设计接口。
每个作业都指定数据源,所需的转换和数据的目的地。
作业被编译成可执行的,由Director 计划,由Server 运行(主机作业被转移,在主机上运行)。
4.Datastage Manager用于存储和管理JOB 的元数据,使之可以在DataStage Designer 中再度被使用,包括库表定义、集中的转换程序等,并对工程备份和恢复。
2.组件使用2.1Administrator Client2.1.1登陆界面ETL110为刚刚我们在HOSTS中配置的名字,端口一般都是9080输入DOMAIN和账号密码完成后,点击DATASTAGE SERVER 右边的小三角,这时DATASTAGE会去验证用户名密码,成功后,会出来下拉框,这时证明已经联通了,选中一个SERVER,点击OK即可登陆2.1.2设置参数登陆成功后,界面如下:General页签:Projects页签:点击工程属性按钮后,显示界面如下:General 页签:Protect Projec t :设置项目为protected, 如果一个项目已经是protected,则按钮就显示为“Unprotect Project”Auto-purge of job log:每个Job 都对应一个log 文件,Job 的每一次运行都会产生新的log 附加到log 文件中,如果不及时清除无用的log,将会占用大量的空间,同时还会影响Job 的运行效率。
Datastage介绍及示例

Datastage介绍及示例1 Datastage 简介Datastage包含四大部件:Administrator、Manager、Designer、Director。
1.用DataStage Administrator 新建或者删除项目,设置项目的公共属性,比如权限。
2.用DataStage Designer 连接到指定的项目上进行Job的设计;3.用DataStage Director 负责job的运行,监控等。
例如设置设计好的job的调度时间。
4.用DataStage Manager 进行Job的备份等job的管理工作。
2 设计一个JOB示例2.1 环境准备目标:将源表中数据调度到目标表中去。
1 数据库:posuser/posuser@WHORADB , ip: 192.168.100.882 源表:a_test_from3 目标表:a_test_to两者表结构一样,代码参考:create table A_TEST_FROM(ID INTEGER not null,CR_SHOP_NO CHAR(15),SHOP_NAME VARCHAR2(80),SHOP_TEL CHAR(20),YEAR_INCOME NUMBER(16,2),SHOP_CLOSE_DATE DATE,SHOP_OPEN_DATE DATE);alter table A_TEST_FROMadd constraint TEST primary key (ID);4. 示例数据:insert into A_TEST_FROM (ID, CR_SHOP_NO, SHOP_NAME, SHOP_TEL, YEAR_INCOME, SHOP_CLOSE_DATE, SHOP_OPEN_DATE)values (24402, '105420580990038', '宜昌市云集门诊部', '82714596 ', 1000, to_date('01-05-2008', 'dd-mm-yyyy'), to_date('01-06-2008', 'dd-mm-yyyy'));insert into A_TEST_FROM (ID, CR_SHOP_NO, SHOP_NAME, SHOP_TEL, YEAR_INCOME, SHOP_CLOSE_DATE, SHOP_OPEN_DATE)values (24403, '105420559982198', '于志良', '82714596 ', 2000, to_date('02-05-2008', 'dd-mm-yyyy'), to_date('02-06-2008', 'dd-mm-yyyy'));insert into A_TEST_FROM (ID, CR_SHOP_NO, SHOP_NAME, SHOP_TEL, YEAR_INCOME, SHOP_CLOSE_DATE, SHOP_OPEN_DATE)values (24404, '105420556410012', '阳光儿童广场', '82714596 ', 3000, to_date('03-05-2008', 'dd-mm-yyyy'), to_date('03-06-2008', 'dd-mm-yyyy'));insert into A_TEST_FROM (ID, CR_SHOP_NO, SHOP_NAME, SHOP_TEL, YEAR_INCOME, SHOP_CLOSE_DATE, SHOP_OPEN_DATE)values (24405, '105420580620033', '秭归县医疗中心', '82714596 ', 4000, to_date('04-05-2008', 'dd-mm-yyyy'), to_date('04-06-2008', 'dd-mm-yyyy'));insert into A_TEST_FROM (ID, CR_SHOP_NO, SHOP_NAME, SHOP_TEL, YEAR_INCOME, SHOP_CLOSE_DATE, SHOP_OPEN_DATE)values (24406, '105420559120063', '同德医药零售北门连锁店', '82714596 ', 5000, to_date('05-05-2008', 'dd-mm-yyyy'), to_date('05-06-2008', 'dd-mm-yyyy'));2.2 打开Designer任务:打开datastage designer,连接datastage服务器1.双击桌面datastage designer图标。
datastage教程

1、【第一章】datastage简介与工作原理1、简介数据中心(数据仓库)中的数据来自于多种业务数据源,这些数据源可能是不同硬件平台上,使用不同的操作系统,数据模型也相差很远,因而数据以不同的方式存在不同的数据库中。
如何获取并向数据中心(数据仓库)加载这些数据量大、种类多的数据,已成为建立数据中心(数据仓库)所面临的一个关键问题。
针对目前系统的数据来源复杂,而且分析应用尚未成型的现状,专业的数据抽取、转换和装载工具DataStage是最好的选择。
Websphere DataStage 是一套专门对多种操作数据源的数据抽取、转换和维护过程进行简化和自动化,并将其输入数据集市或数据中心(数据仓库)目标数据库的集成工具。
DataStage 能够处理多种数据源的数据,包括主机系统的大型数据库、开放系统上的关系数据库和普通的文件系统等,以下列出它所能处理的主要数据源:大型主机系统数据库:IMS,DB2,ADABAS,VSAM 等开放系统的关系数据库:Informix,Oracle,Sybase,DB2,Microsoft SQL Server等ERP 系统:SAP/R3,PeopleSoft系统等,普通文件和复杂文件系统,FTP 文件系统,XML等IIS,Netscape,Apache等Web服务器系统Outlook等Email系统。
DataStage 可以从多个不同的业务系统中,从多个平台的数据源中抽取数据,完成转换和清洗,装载到各种系统里面。
其中每步都可以在图形化工具里完成,同样可以灵活的被外部系统调度,提供专门的设计工具来设计转换规则和清洗规则等,实现了增量抽取、任务调度等多种复杂而实用的功能。
其中简单的数据转换可以通过在界面上拖拉操作和调用一些DataStage 预定义转换函数来实现,复杂转换可以通过编写脚本或结合其他语言的扩展来实现,并且DataStage 提供调试环境,可以极大提高开发和调试抽取、转换程序的效率。
Datastage虚拟机配置指南

Datastage虚拟机配置指南Datastage配置文档由于Datastage是个C/S架构的,如下图所示:因此首先要通过本机客户端(Client)连接服务器(Server),然后再通过服务器(Server)连接数据库(Database)。
本文档主要介绍如何通过配置虚拟机的连接方式,从而连接本机客户端(Client),虚拟机上的服务器(Server)及其本机的数据库(Database)。
具体方式如下:1.打开VMware Workstation,依次点击File ->Open。
2.找到服务器虚拟机存放路径,并打开Red Hat Enterprise Linux 4.vmx(或者直接进入Red Hat 4文件夹,双击打开Red Hat Enterprise Linux 4.vmx)。
3.启动服务器虚拟机,点击红圈所示。
4.对弹出的对话框全部点OK。
5.等待服务器虚拟机启动完毕,使用Username:dsadm及其Password:dsadm登录。
6.修改虚拟机连接方式为NAT,依次点击VMware Workstation 右下角的网络连接设置(图中红圈所示)-> Setting并在弹出的对话框中选择NAT,然后点击OK。
7.打开虚拟机的网卡配置。
在虚拟机中依次点击左上角的Applications -> SystemTools -> Network Device Control.8.然后选择Configure。
此时会提示输入Root密码,在这里输入:wangli,然后点OK。
9.配置网卡,选择所要配置的网卡,然后点击Edit。
10.设置虚拟机IP。
Address: 192.168.92.X(和Dafault gateway address 相对应。
X可以随便写,范围2-253),Subnet mask:255.255.255.0Dafault gateway address:192.168.92.1(注意,此处填写的是本机中虚拟网卡VMnet8的IP地址,比如说我的机器为192.168.92.1。
Datastage 培训资料详述

Datastage培训1.什么是Datastage?➢设计jobs 抽取(Extraction)、转换(Transformation)、装载(Loading)即ETL ➢数据整合项目工具,如数据仓库、数据集市和系统移植。
DataStage的框架,如图-1:图-1在开发过程中是通过DataStage的四个客户端(DataStage Administrator如图-2, DataStage Manager如图-3, DataStage Designer如图-4, DataStage Director如图-5)来进行工作的。
图-2 图-3 图-4 图-5➢DataStage的基本开发流程:1.在Administrator中新建工程、定义全局和工程属性2.在Manager中导入元数据3.在Designer中定义job4.在Designer中编译job5. 在Director中验证,运行,监控job2.DataStage Administrator介绍主要功能:对server进行一些常规的设置、用来执行管理任务,如建立DataStage用户、新建和删除工程,设置工程的属性。
2.1.登陆登陆后的界面:在General标签中、可以看到当前server的版本是7.5.1.A,你也可以点击”NLS…”选择Client端的默认字符集。
2.2.新建工程选择Projects标签,在这里你可以选择Add按钮来新建一个工程“sjzh”如图:该工程存放的目录为“/home/dsadm/Ascential/DataStage/Projects/sjzh”在这里我们选择系统的默认路径。
选择“OK”就新建了一个工程,如图:2.3.更改“Licensing”选择“Licensing”标签,如图:在这里可以对Server和Client端的License进行更改。
比如当软件License过期时,要在不重新安装的情况下改变License就要使用这个功能。
datastage综合使用参考手册

Ascential DataStage Enterprise Edition 综合使用参考手册目录目录 (I)1. 引言 (1)1.1.编写目的 (1)1.2.帮助使用 (1)2. 产品概述 (2)2.1.A DVANCED D EVELOPMENT AND M AINTENANCE (2)2.2.C OMPLETE D EVELOPMENT E NVIRONMENT (3)2.3.H IGHLY S CALABLE A RCHITECTURE (6)2.4.E ND-TO-E ND E NTERPRISE M ETA D ATA (7)3. 安装 (8)3.1.S ERVER安装 (8)3.1.1. Server安装前准备 (8)3.1.2. Server安装步骤 (9)3.1.3. 验证DataStage的安装 (22)3.1.4. Server启动和停止 (23)3.2.C LIENT安装 (24)4. 常规应用 (24)4.1.常用组件使用方法 (24)4.1.1. Sequential file (24)4.1.2. Annotation (27)4.1.3. Change Capture Stage (29)4.1.4. Copy Stage (31)4.1.5. Filter Stage (32)4.1.6. Funnel Stage (33)4.1.7. Tansformer Stage (34)4.1.8. Sort Stage (35)4.1.9. LookUp Stage (36)4.1.10. Join Stage (36)4.1.11. LookUp Stage 和Join Stage的区别 (38)4.1.12. Merge Stage (38)4.1.13. Modify Stage (39)4.1.14. Data Set Stage (40)4.1.15. File Set Stage (41)4.1.16. Lookup File Set Stage (43)4.1.17. Oracle Enterprise Stage (45)4.1.18. Aggregator Stage (46)4.1.19. Remove Duplicates Stage (48)4.1.20. Compress Stage (49)4.1.21. Expand Stage (50)4.1.22. Difference Stage (51)4.1.23. Compare Stage (53)4.1.24. Switch Stage (54)4.1.25. Column Import Stage (55)4.1.26. Column Export Stage (57)4.2.常用数据库的连接 (59)4.2.1. Informix数据库连接 (59)4.2.2. Oracle数据库连接 (60)5. 高级应用 (62)5.1.D ATA S TAGE BASIC接口 (62)5.2.自定义S TAGE T YPE (62)5.2.1. Wrapped Stage (62)5.2.2. Build Stage (67)5.2.3. Custom Stage (75)5.3.性能调优 (75)5.3.1. 优化策略 (75)5.3.2. 关键问题分析 (79)5.3.3. 并行度 (80)5.3.4. 处理建议 (80)5.3.5. 其它 (80)5.3.6. 机器的对称性 (81)5.3.7. 并行调度测试说明: (81)6. 开发经验技巧汇总 (82)6.1.1. 问题 (82)1.引言1.1.编写目的IBM DataStage作为项目主要使用的ETL开发工具,在项目中得到了比较充分的应用,对IBM DataStage产品方方面面的功能,都有所涉及。
DataStage 工作笔记

1.安装与配置参考文档:《Planning, Installation, and Configuration Guide.pdf》1.1服务端与客户端的安装1.1.1安装拓扑采用简单的两层部署进行安装,安装拓扑如下图所示:Host1环境如下:(1)硬件环境CPU:Inetel Core Duo P8600内存:4GB(2)软件环境操作系统:Windows Server 2003 EE SP2C++编译器:Microsoft Visual Studio .NET 2008 Express Edition C++1.1.2安装参考文档:《Planning, Installation, and Configuration Guide.pdf》[pages 198-200]1.1.3C++编译器配置参考链接:/infocenter/iisinfsv/v8r5/index.jsp?topic=/com.ibm.swg.im.iis.productization.iisinfsv.install.doc/topics/wsis inst_set_envars_cpp.html(1)支持的C++编译器,见如下链接的系统要求说明:/support/docview.wss?rs=14&uid=swg270163821.1.4登陆与安装语言选择登陆(会话)语言选择中文,DataStage安装语言选择英文,结果Designer里同时有中文和英文,而DB2和WAS都是中文版,如何安装纯英文版的?解决方法1:登陆语言选择和安装语言全部选择英文即可安装上纯英文版。
解决方法2:通过控制面板->区域和语言选项,将语言设置为英语,安装完成后将语言再修改为中文即可。
1.1.5新建用户与凭证(Credentials)参考文档:《Day 1 Exercise-DS.doc》[Exercise 1: Administration Console] (1)通过Web浏览器登陆Web Console for IBM Information Server,地址如下(localhost为server端主机名):http://localhost:9080/ibm/iis/console/loginForm.jsp?displayForm=true (2)新建两个用户dsadmin和dsuser,如下图:权限设置如下:dsadmin:Suite User、DataStage and QualityStage Administrator/User dsadmin:Suite User、DataStage and QualityStage Userdsadmin 可以正常使用,但dsuser 只能登陆 Administrator,登陆Designer和Director会报错:The current user does not have the required DataStage roles set up. 为什么?解决方法1:直接给dsuser同时授予Suite User、DataStage and QualityStage Administrator/User权限。
DataStage安装手册

目录1安装及配置21.1ETL工具D ATA S TAGE的安装配置过程21.1.1系统环境21.1.2用户与组21.1.3修改系统参数21.1.4编译器的安装31.1.5 DS软件安装步骤31.1.6停止与启动服务181.1.7 DataStage配置201安装及配置1.1ETL工具DataStage的安装配置过程1.1.1系统环境1.1.2用户与组创建组dstage 和用户dsadm,并且将dstage作为dsadm的默认组,同时将dsadm添加进dba组。
注意:需要给数据库用户对oracle sys.dba_extents表的select权限。
1.1.3修改系统参数将dsadm的参数修改成下列值:fsize -1 (无限制)data 至少128 MB (262144 512-byte blocks)stack 至少32 MB (65536 512-byte blocks)查看当前设置:ulimit -a设置最大进程数,建议为4096当前设置:lsattr -E -l sys0 | grep maxuproc以上修改需要root权限用户,在安装DS之前请确认好,避免多次使用root用户。
1.1.4编译器的安装开发完的所有JOB都需要进行编译,需要安装C++编译器,最低版本要求见系统环境要求部分。
1.1.5DS软件安装步骤Datastage安装过程需要用到root用户,确保以超级用户root进入系统。
如果是硬盘包,则先解压缩包,执行命令:$ tar xvf C915JNA.tar,再进入解压后的出现的文件夹 Ascential.media目录如果是光盘包,则执行命令: $ mount /cdrom ,再进入 /cdrom目录。
运行命令:$ ./install.sh -admin dsadm进入图1所示画面:图1图1提示安装程序检测是否是新安装DataStage, 输入y,继续安装过程,进入画面提示是root安装还是non-root安装,输入y进入图3所示画面:图3图3所示画面提示版权信息,输入n进入图4所示画面:图4图4所示画面提示版本信息,输入n进入图5所示画面图5图5所示画面提示License Agreement, 输入y进入图6所示画面图6图6所示画面提示选择安装文件中压缩包解压缩的临时路径,目标文件夹必须要600M以上的空间,默认路径为/tmp/dsinstall/unpack,改变输入c,输入n则进入图7所示画面:图7图7所示画面输入DataStage licence,包括序列号,CPU个数,有效日期,授权码等信息。
Datastage 配置操作步骤

1部署软件环境DB服务器:22.4.8.7DB客户端:22.4.8.10,22.4.8.11,22.4.8.12,22.4.8.13DataStage主服务器:22.4.8.11DataStage备份服务器:22.4.8.13DataStage节点:22.5.8.10,22.5.8.122创建用户为每台机器创建dstage组和dsadm用户运行smit命令,启动管理界面在安装机器上创建dstage组设置ADMINISTRA TIVE USER 选项为true设置GID设为300创建用户dsadm设置主属为dstage,设置ADMINISTRA TIVE USER 选项为true;设置UID设为300;设置Primary GROUP,Group SET,ADMINISTRATIVE GROUPS:均为dstage;设置Soft FILE size [-1] (无限制)设置Hard FILE size [-1] (无限制)3修改系统参数调整每台机器的最大进程数查看用户进程最大数目:lsattr -El sys0|grep maxuproc如:修改用户进程最大数目:注意:要调整每个Datastage节点的最大进程数用root用户登陆,键入即可。
chdev -l sys0 -a maxuproc=40964DataStage安装4.1上传DataStage介质到服务器上将介质拷贝到终端上,然后ftp到22.4.8.11和22.4.8.13上,将介质放在/Ascential.media 目录下,并赋上所有权限:chmod -R 777 /Ascential.media4.2安装DataStage4.2.1进入/Ascential.media,运行sh ./install.sh –admin dsadm,中间安装过程请参考上线文档,在安装过程中创建工程ETL_ODS.4.2.2配置dsadm用户.profile环境变量,增加如下内容22.4.8.11:# The following three lines have been added by IBM DB2 instance utilities.if [ -f /home/db2inst1/sqllib/db2profile ]; then. /home/db2inst1/sqllib/db2profilefi#ds envexport ETLPLUS_HOME=/home/dsadmexport DSHOME=/home/dsadm/Ascential/DataStage/DSEngineexport APT_ORCHHOME=/home/dsadm/Ascential/DataStage/PXEngineexport DB2HOME=/home/db2inst1/sqllibexportPATH=$PATH:$DSHOME/bin:$DB2HOME/include:/home/dsadm/Ascential/DataStage/PX Engine.753.1/libexportLIBPATH=$LIBPA TH:$DSHOME/lib:$APT_ORCHHOME/lib:/home/dsadm/Ascential/Dat aStage/PXEngine.753.1/lib. $DSHOME/dsenv22.4.8.13:# The following three lines have been added by IBM DB2 instance utilities.if [ -f /home/db2inst1/sqllib/db2profile ]; then. /home/db2inst1/sqllib/db2profilefi#ds envexport ETLPLUS_HOME=/home/dsadmexport DSHOME=/home/dsadm/Ascential/DataStage/DSEngineexport APT_ORCHHOME=/home/dsadm/Ascential/DataStage/PXEngineexport DB2HOME=/home/db2inst1/sqllibexportPATH=$PATH:$DSHOME/bin:$DB2HOME/include:/home/dsadm/Ascential/DataStage/PX Engine.753.1/libexportLIBPATH=$LIBPA TH:$DSHOME/lib:$APT_ORCHHOME/lib:/home/dsadm/Ascential/Dat aStage/PXEngine.753.1/lib. $DSHOME/dsenv22.4.8.10:export DSHOME=/home/dsadm/Ascential/DataStage/DSEngineexport APT_ORCHHOME=/home/dsadm/Ascential/DataStage/PXEngineexport DB2DIR=/opt/IBM/db2/V9.5export DB2INSTANCE=db2inst1export INSTHOME=/home/db2inst1exportPATH=$PATH:$INSTHOME/sqllib/bin:$INSTHOME/sqllib/adm:$INSTHOME/sqllib/misc: $APT_ORCHHOME/lib:$APT_ORCHHOME/binexportDB2PATH=$INSTHOME/sqllib/bin:$INSTHOME/sqllib/adm:$INSTHOME/sqllib/misc exportLIBPATH=$LIBPA TH:$DB2DIR/lib:$INSTHOME/sqllib/lib:$APT_ORCHHOME/lib export ETLPLUS_HOME=/home/dsadm22.4.8.12:export DSHOME=/home/dsadm/Ascential/DataStage/DSEngineexport APT_ORCHHOME=/home/dsadm/Ascential/DataStage/PXEngineexport DB2DIR=/opt/IBM/db2/V9.5export DB2INSTANCE=db2inst1export INSTHOME=/home/db2inst1exportPATH=$PATH:$INSTHOME/sqllib/bin:$INSTHOME/sqllib/adm:$INSTHOME/sqllib/misc: $APT_ORCHHOME/lib:$APT_ORCHHOME/binexportDB2PATH=$INSTHOME/sqllib/bin:$INSTHOME/sqllib/adm:$INSTHOME/sqllib/misc exportLIBPATH=$LIBPA TH:$DB2DIR/lib:$INSTHOME/sqllib/lib:$APT_ORCHHOME/libexport ETLPLUS_HOME=/home/dsadm22.4.8.7:# The following three lines have been added by IBM DB2 instance utilities.if [ -f /home/db2inst1/sqllib/db2profile ]; then. /home/db2inst1/sqllib/db2profilefiexport ETLPLUS_HOME=/progexport DSHOME=/home/dsadm/Ascential/DataStage/DSEngineexport APT_ORCHHOME=/home/dsadm/Ascential/DataStage/PXEngineexport DB2DIR=/opt/IBM/db2/V9.5export DB2INSTANCE=db2inst1export INSTHOME=/home/db2inst1exportPATH=$PATH:$INSTHOME/sqllib/bin:$INSTHOME/sqllib/adm:$INSTHOME/sqllib/misc: $APT_ORCHHOME/lib:$APT_ORCHHOME/binexportDB2PATH=$INSTHOME/sqllib/bin:$INSTHOME/sqllib/adm:$INSTHOME/sqllib/misc exportLIBPATH=$LIBPA TH:$DB2DIR/lib:$INSTHOME/sqllib/lib:$APT_ORCHHOME/libexport DateInfoPath=/gpfsf/DateInfoPath5配置rsh环境。
IBM-datastage安装手册

解压文件,切勿将文件放在root下。
一般放在tmp下tar -zxvf IS_V11.5_LINUX_X86_64_MULTILING.tar.gz解压完后将下面文件下的2个授权文件拷贝到上面解压目录下命令行执行安装(这里可能会出现the number of open file descriptors is too low等错误。
解决方式:ulimit -n 18000 设置服务器打开最大文件描述符)执行完后会弹出地址,将地址复制到浏览器。
(这里可能会出现输入地址无法访问的情况,一般情况是因为服务器防火墙没有关闭导致的,关闭防火墙:service iptables stop)这里需要安装光盘输入:yum list libXp查询是否有对应的rpm文件,如果没有去网上下载,然后拷贝到服务器上,然后执行:yum install libXp……执行。
成功后点击安装框右下角的【请再次检查】按钮。
密码1qaz2wsx密码1qaz2wsx密码1qaz2wsx密码1qaz2wsx密码1qaz2wsx密码1qaz2wsx密码相同检测出错,需要授权,如果授权最后一个文件夹还是不行的话,可将root文件夹夹一下的文件夹都授权:chmod –Rf 777 /root这里可能不仅会出这个错误,可能还会出现操作系统少包,根据提示少什么就下载安装。
浏览器输入http://localhost:9080/ibm/iis/console isadmin/1qaz2wsx输入root和密码1qaz2wsx新建dsadmin用户,输入密码:1qaz2wsx,输入dsadmin作为“名字”和“姓氏”,分配“套件用户”“套件管理员”和“DataStage and QualityStage管理员”权限,点击“保存并关闭”重复上述步骤,创建dsuser用户,密码:1qaz2wsx,分配“套件用户”“DataStageand QualityStage用户”权限,点击“保存并关闭”打开DataStage and QualityStage Administrator(Windows),以dsadmin用户登录客户端安装Windows端,先将授权文件拷贝到安装目录下执行安装程序需要按照提示修改注册表注意此处端口不是默认9443,要看前面端口配置,我的是9446,密码是1qaz2wsx客户端配置把以下项的值改为True:APT_DUMP_SCORE,APT_MSG_FILELINE,APT_RECORD_COUNTS,OSH_DUMP,OSH_ECHO,O SH_EXPLAIN,and OSH_PRINT_SCHEMAS进入开发工具Websphere创建该要文件192.168.2.174:9061/ibm/consoleMB:mount -t iso9660 MQSerise_linux_x86_64.iso /mnt或者:mount -o loop iso9660 MQSerise_linux_x86_64.iso /mntrpm –ivh *.rpmyum install ld-linux.so.2yum install libgcc_s.so.1后面一直下一步,直到结束创建用户useradd –g mqbrkrs –G mqm –d /home/wbiadmin –m wbiadmincd rpm-gpg/RPM-GPG-KEY-redhat-releaserpm –import /etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-releaseyum install ld-linux.so.2执行install.bin时可能遇到缺失包,缺少什么就使用下面命令安装什么yum install ld-linux.so.2yum install libgcc_s.so.1然后执行install.bin安装好install.bin后用Root用户执行以下命令:xhost +local:wbiadmin使用wbiadmin执行以下命令启动MQ浏览器:./opt/mqm/mqexplorer/eclipse/runwithtrace。
Datastage安装配置指南v0.2

1.引言DataStage EE Server可以安装在AIX,HP UNIX,Linux等平台上,Client 端安装在Windows平台上。
我们以DataStage 7.5 for Aix 5.1/5.2为例,来详细说明其安装步骤。
2.DataStage安装2.1.Server安装前准备2.1.1.创建用户及组在安装机器上创建dstage组, ADMINISTRATIVE USER 选项为true,Primary GROUP,Group SET,ADMINISTRATIVE GROUPS:均为dstage创建用户dsadm,主属为dstage ,ADMINISTRATIVE USER 选项为true;确保主机重启时datastage server也同样自动重启。
groupadd dstageuseradd -d /data -G dstage -M dsadmpasswd dsadmchown dsadm:dstage -R data2.2.Server安装步骤确保以超级用户root进入系统(非常重要)则执行命令:C915JNA.tar.gz1)执行 ./install.sh,会出现下图所示:每步安装都附有图片,图片上方为本图注释:2)提示这是一个新的安装过程,输入 y 继续3)检测用户是否为root,输入 y 继续4)确认安装,输入 n 继续5)输入 n 继续6)license agreement,输入 y 继续7)选择安装文件临时存放目录,此目录必须存在,dsadm用户要有存取权限,且目录必须为空,输入 c 改变临时目录8)确认临时目录路径,输入 n 继续9)输入serial number,CPU count,expiration date,enterprise edition code, server code,输入 n 继续,MVS edition code不用输入10)确认信息,输入 n 继续11)因为未购买RTI Agent,SAS Integration,IMS Source,所以不用输入以下三个code,输入 n 继续12)默认安装路径,输入 n 继续13)选择语言,输入 c ,改变语言14)输入 5 ,选择简体中文15)输入 n 继续16)选择插件,输入 a 选择全部17)输入 n 继续18)输入project name: UDI,回车继续19)project默认存放路径,回车继续20)输入 U 选择unprotected project,继续21)输入 n 继续22)DataStage引擎安装路径,输入 n 继续23)输入 n 继续24)输入 n 继续25)输入 n 开始安装2.3.安装完毕,检查后台Server是否启动正常输入 ps –ef|grep dsrpcd后台Server进程名 dsrpcd2.4.Client安装执行datastage client文件夹中执行 setup,选择client端安装。
Datastage 用户配置指南

© 2012 IBM Corporation
In the Web Console, go to the Administration Tab, expand the “Users and Groups” category and click “Users”. This will give an option for “New User” on the right side. Click “New User” to create a new Information Server user.
On the right side of the screen, under Assign User Credentials, enter the username and password for the operating system user on the DataStage Engine server that you want the DataStage administrator user to use. The DataStage Administrator account is typically mapped to the OS account that was defined as the DataStage administrator during the initial install. Next, click Apply and Close. The dsadm account should now be a functional DataStage Administrator account.
7
Setting up basic DataStage users
© 2012 IBM Corporation
datastage安装详细文档

Datastage Server安装步骤Datastage安装过程需要用到root用户,确保以超级用户root进入系统(非常重要) 1.准备#创建组$groupadd dstage#创建用户$useradd -g dstage dsadm#修改密码$passwd dsadm#创建安装目录$mkdir -p /home/ap/dsadm#添加目录到用户组$chown -R dsadm:dstage /home/ap/dsadm/2.解压#如果是硬盘包,则先解压缩包,执行命令:$tar xvf C915JNA.tar再进入解压后的出现的文件夹Ascential.media目录如果是光盘包,则执行命令:Mount /cdrom ,再进入/cdrom目录.3.安装(1) 执行./install.sh –admin root(2) 验证dsadm用户环境变量设置,确认输入y,回车:(3) 安装向导画面,输入n,回车(4) 版本更新信息,输入n,回车(5) license agreement,输入y,回车(6) 选择安装文件临时存放目录,此目录必须存在,dsadm用户要有存取权限,且目录必须为空并且有600M的空间,输入c 可以改变临时目录,使用默认临时目录输入n,回车(7) 输入serial number,CPU count,expiration date,enterprise edition code, server code ,回车。
MVS edition code不用输入,注意日期的格式。
(8) 确认serial number,CPU count,expiration date,enterprise edition code, server code是否正确,正确,输入n,回车(9) 根据实际购买RTI Agent,SAS Integration,IMS Source情况,以下三个code可以选择填写,输入n ,回车(10) 确认DataStage Server的安装目录,根据实际情况选择c做更改,指定目录dsadm需有存取权限,确认安装目录后,输入c,回车进行修改(11) 修改正确的DataStage Server的安装目录/home/ap/dsadm,回车(12) 确认DataStage的安装目录已修改成/home/ap/dsadm,输入n,回车(13) 选择语言,输入c,回车进行修改(14) 选择Chinese-Simplified简体中文,输入6,回车(15) 确认已选择6 Chinese-Simplified简体中文,输入n,回车注意:语言一定要修改为CHS(16) 选择相关插件,这样要把所有插件都选择安装,输入a,回车(17) 确认已选择所有插件都安装,输入n,回车(18)DataStage工程存放路径,回车选择默认路径,如需指定确保dsadm有存取权限(19) 创建工程,第一次创建的默认工程不用,随便起个名字,将来在JCI公共组件安装的时候会重新建立工程。
DATASTAGE的介绍及基本操作

同样可以灵活的被外部系统调度,提供专门的设计 工具来设计转换规则和清洗规则等,实现了增量抽 取、任务调度等多种复杂而实用的功能 。
Datastage的组成:
Datastage的服务器端和客户端
Datastage是C/S软件,服务器端存储所有 的ds项目和元数据,由关系型数据库(RDBMS) 组成。客户端具有同服务端一样的软件接口。
第二章 如何安装Datastage
下面的讲解中,将可以了解到:
• 在Windows系统中安装Datastage服务端。 • 建立一个Datastage的工程。 • 安装Datastage的客户端。
Datastage 的服务端要首先安装,之后才 可以安装Datastage 客户端,服务端能都安 装在WinNT、Windows2000或者UNIX系统中, 这个模块将介绍在Windows环境下进行安装。
• 使用DataStage中的Manager来存储和管理Job的元
数据,使之可以在DataStage中的Designer中再度被 使用。
• 元数据包括表单和文件结构和导出数据的Routines
的转换等等。
• Manager是DataStage存储的一个重要的部分,可以
用来加入表单和文件的结构,在左侧分支树中显示 Routines、Transforms和Jobs。
行验证、运行、任务调度和监控的工作。也
可以针对job 的运行查看运行的聚合统计情况。
在Datastage中进行开发
• 在Administrator中定义全局的和项目属性。 • 在Datastage中的Manager里导入定义源的
元数据和目标的元数据。
• 在Datastage中的Designer中验证和编译job。 • 在Datastage中的Director中验证、运行、和
linux环境下安装ds8.7

LINUX下安装DATASTAGE V.8.7详细步骤文档两个文件,ds server8.7为服务端,is-client为客户端一、服务端安装配置1.打开ds server 8.72.双击类型为应用程序的包3.运行解压到指定的目录4.解压完成后,生成内嵌VMDK的众多文件5.运行vmware.exe,打开虚拟文件,并双击DSQS_....vmx文件,编辑虚拟机设置①网络适配器是Host-only②内存最好是2560MB甚至更高6.点击Power on this virtual machine,出现的SUSE Linux Enterprise 配置界面,相继点击NEXT下去,装好后点击Finish7.输入账号root 密码inf0sphere,进入桌面,找到左下角COMPUTER,然后选择点击Network Settings环境下的网络机,能PING通,这样网络的配置就OK了。
二、客户端安装配置1.打开is-client,点击2.在网页中,跳出下列页面3.逐一点击下一步,到早期需求检查这一步,如果是WINDOW的系统,会报脚本编制引擎的错误,即“microsoft windows script engine必须工作正常”如果碰到这个错误,如下是解决方法。
①注册微软的jscript.dll。
在命令行输入命令:regsvr32 %systemroot%\system32\jscript.dll②2、修正js的注册信息。
就是导入一个注册表文件。
把下面这段文本保存为xx.reg,然后双击将这个文件内容注册到注册表中,名字随意。
Windows Registry Editor Version 5.00[HKEY_CLASSES_ROOT\.js]@="jsfile"[HKEY_CLASSES_ROOT\.js\PersistentHandler]@="{5e941d80-bf96-11cd-b579-08002b30bfeb}"[HKEY_CLASSES_ROOT\JSFile]"FriendlyTypeName"=hex(2):40,00,25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,\00,6f,00,6f,00,74,00,25,00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,\32,00,5c,00,77,00,73,00,68,00,65,00,78,00,74,00,2e,00,64,00,6c,00,6c,00,2c,\00,2d,00,34,00,38,00,30,00,34,00,00,00[HKEY_CLASSES_ROOT\JSFile\ScriptEngine]@="JScript"[HKEY_CLASSES_ROOT\JSFile\ScriptHostEncode]@="{85131630-480C-11D2-B1F9-00C04F86C324}"[HKEY_CLASSES_ROOT\JSFile\Shell]@="Open"[HKEY_CLASSES_ROOT\JSFile\Shell\Open\Command]@=hex(2):25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,6f,00,74,00,25,\00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,32,00,5c,00,57,00,53,00,\63,00,72,00,69,00,70,00,74,00,2e,00,65,00,78,00,65,00,20,00,22,00,25,00,31,\00,22,00,20,00,25,00,2a,00,00,00[HKEY_CLASSES_ROOT\JSFile\Shell\Open2]@=hex(2):4f,00,70,00,65,00,6e,00,20,00,26,00,77,00,69,00,74,00,68,00,20,00,43,\ 00,6f,00,6d,00,6d,00,61,00,6e,00,64,00,20,00,50,00,72,00,6f,00,6d,00,70,00,\ 74,00,00,00"MUIVerb"=hex(2):40,00,25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,\ 6f,00,74,00,25,00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,32,00,5c,\ 00,77,00,73,00,68,00,65,00,78,00,74,00,2e,00,64,00,6c,00,6c,00,2c,00,2d,00,\ 34,00,35,00,31,00,31,00,00,00[HKEY_CLASSES_ROOT\JSFile\Shell\Open2\Command]@=hex(2):25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,6f,00,74,00,25,\ 00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,32,00,5c,00,43,00,53,00,\ 63,00,72,00,69,00,70,00,74,00,2e,00,65,00,78,00,65,00,20,00,22,00,25,00,31,\ 00,22,00,20,00,25,00,2a,00,00,00[HKEY_CLASSES_ROOT\JSFile\Shell\Print\Command]@=hex(2):25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,6f,00,74,00,25,\ 00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,33,00,32,00,5c,00,4e,00,6f,00,\ 74,00,65,00,70,00,61,00,64,00,2e,00,65,00,78,00,65,00,20,00,2f,00,70,00,20,\ 00,25,00,31,00,00,00[HKEY_CLASSES_ROOT\JSFile\ShellEx\DropHandler]@="{60254CA5-953B-11CF-8C96-00AA00B8708C}"[HKEY_CLASSES_ROOT\JSFile\ShellEx\PropertySheetHandlers\WSHProps]@="{60254CA5-953B-11CF-8C96-00AA00B8708C}"[HKEY_CLASSES_ROOT\JScript]@="JScript Language"[HKEY_CLASSES_ROOT\JScript\CLSID]@="{f414c260-6ac0-11cf-b6d1-00aa00bbbb58}"[HKEY_CLASSES_ROOT\JScript\OLEScript]4.而后检查就成功了5.相继点击下一步,直到安装完成装成功以下几个图标的用法,会在稍后的文档中详细解说在WINDOWS下打开网页http://172.16.4.140:9080/ibm/iis/console/index.jsp (IP地址是在虚拟机设置的IP)输入账号wasadmin密码inf0server或者如果能进入页面,就表示服务器服务已经起了下面简单介绍一下啊服务里面包含哪些内容1.HOME:可以展现你最喜欢的报告和最近最新的报告结果,通过点击customize My home 来设置2.Administration:管理用户访问进程的套件。
DataStage8.5安装手册

DataStage8.5安装手册DataStage 8.5 安装文档1. 服务器安装前提要求,DataStage 的服务器推荐使用一台全新的干净服务器,全新安装的SUSE Linux Enterprise Server 11,或者Redhat AS 5.4,没有预装任何DB2 和WAS 软件。
rpm -Uvh compat-libstdc++-33-*.rpm rpm -Uvh libXp-1*.rpm rpm -Uvh libXmu-1.0.2-5.x86_64.rpm rpm -Uvh libXmu-1.0.2-5.i386.rpm cat “Add for DataStage" cat "kernel.sem = 250 ***** 32 1024" /etc/sysctl.conf cat "kernel.msgmni = 1024" /etc/sysctl.conf sysctl -p安装步骤如下:DataStage 8.5 的安装介质为InfoSvr_v8.5_Linux64.tar.gz,解压后得到目录is-suite。
在is-suite 下执行./setup,安装程序将启动一个Web 服务,URL 为http://机器IP:8080/ISInstall在浏览器(IE 或者Fixforx)中打开上述URL,例如,待安装的服务器IP 为192.168.5.170,则在浏览器栏输入http://192.168.5.170:8080/ISInstall。
缺省安装界面语言为英文(English),也可以选择中文。
本文档以英文为安装语言。
进入安装界面后,第一个界面选择Next 按钮。
第二个界面如下图所示选择接受License 协议(I accept the terms in the license agreement),然后下一步(Next)。
DataStage使用说明

目录1.安装 (2)2.DataStage Administrator (3)2.1对Project的管理 (3)2.2修改DataStage Server的License (5)3.DataStage Designer篇Job的定义 (5)3.1登录 (5)3.2建立Job (6)3.3界面说明 (6)3.4 ETL过程定义 (7)3.4.1数据库到数据库 (7)3.4.2 Job的调试 (17)3.4.3文件到数据库 (19)3.4.4远程数据抽取 (20)3.4.5多进程联合运行(Job Sequencer) (23)3.4.6数据聚合的处理 (25)3.4.7自定义程序 (27)4.DataStage Director篇Job的运行 (31)4.1登录 (31)4.2运行Job (31)4.3 Job的运行时间定义 (31)4.4日志的查看 (33)1.安装DataStage Server端的安装,如果在Windows操作系统上安装,需要NTFS格式的分区。
安装完毕将启动DataStage Engine Resource Service,DataStage Telnet Service两个服务。
DataStage Client在安装的过程中,会提示建立一个Project,建立了Project之后,Client就可以连接到此Project,当然也可用选择其他Server端的Project。
安装完毕,将产生4个各司其职的模块:DataStage Administrator,DataStage Director,DataStage Designer,DataStage Manager。
DataStage Adminstrator是对DataStage Server的一些参数、Project进行管理的模块。
DataStage Designer是一个界面性的设计平台,实现在创建执行数据集成任务“Job”的同时,对数据流和转换过程创建一个可视化的演示。