DATASTAGE日常运维手册
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章
4.1
问题描述:通过oracle stage,把文本数据写到数据库时候报错:SQL*Loader-925: Error while uldlpim: OCIStmtExecute;SQL*Loader-2026: the load was aborted because SQL Loader cannot continue.实际上数据是装入成功了。
ORA_S_CRD_CICIFADR,0: The call to sqlldr failed; the return code = 256;
ORA_S_CRD_CICIFADR,1: SQL*Loader: Release10.2.0. - Production on Wed Apr 11 19:31:09 2007
{
fastname "T219N2V3"
pools ""
resource disk "/appdata/DSDATA/DATASET" {pools ""}
resource scratchdisk "/appdata/DSDATA/SCRATCH" {pools ""}
}
}
Dataset数据文件目录:resource disk "/appdata/DSDATA/DATASET"
2.9
登录Designer客户机,导出Datastage Job有两种方法:
(1)选择菜单栏的【导出(X)】->【Datastage组件(C)】,界面如下:
点击添加按钮,选择所需的导出的Datastage Job,在要导出的作业组件一般选择“导出不带可执行文件的作业设计”,在导出到文件中选择本地的保存路径跟文件名。
2)Server停止命令:$HOMEDIR/uv–admin /stop
注意:停止前最好确保没有Client连接,可以通过‘onstat–a |grep ds’查看,是否还存在Client连接,否则要通知相应登录的client端彻底退出。
2.3
登录Datastage Designer客户机,参见,打开欲编译的Job,具体Job编译方法有两种:
第1章
1.1
DataStage企业版是Ascential Software公司所有企业整合系列产品中关键产品。企业版支持大容量数据的收集、整合和转换,数据从简单结构到很复杂的结构。基于高可扩展性的软件架购,企业版使得企业能够通过高性能来解决大部分业务问题,并行处理大容量数据。强大的企业元数据管理能力使得可以在数据整合生命周期中在所有工具中共享和使用工具。
Manager:用来编辑管理用户工程的DataStage资料库。
Director:用来验证、时序安排、运行和监测企业版作业。
第2章
2.1
2.1.1
点击图标
选择需要登录的服务器,输入用户名,密码登录
进去后点击项目,可进行项目增加,删除,设置项目属性
2.1.2
点击图标
选择需要登录的域,输入用户名,密码,选择需要登录的项目
{
node "node1"
{
fastname "T219N2V3"
pools ""
resource disk "/appdata/DSDATA/DATASET" {pools ""}
resource scratchdisk "/appdata/DSDATA/SCRATCH" {pools ""}
}
node "node2"
1)主机下发数据目录:/appdata/DATA#DATE
2)Datastage转码生成公共数据集目录:/appdata/DSDATA/$DATE/
3)DataStage的配置目录,/usr/datastage/InformationServer/Configurations,其下有其配置文件,可以设置运行结点数,Dataset数据文件目录,Dataset日志文件目录。
CI_CUST_NO 1:40 40 CHARACTER
NULL if 1:40 = BLANKS
CIADR_LL 41:46 6 PACKED DECIMAL (10, 0)
NULL if 41:46 = 0X000000000000(character '')
CI_ADDR_COD 47:52 6 CHARACTER
(Allow all discards)
Number to load: ALL
Number to skip: 0
Errors allowed: 50
Continuation: none specified
Path used: Direct - with parallel option.
Table S_CRD_CICIFADR, loaded from every logical record.
(2)在所需导出的Job上右键单击,在弹出菜单中选择【导出(X)】,在如上界面中的导出到文件选择本地的保存路径跟文件名。
2.10
登录Designer客户机,选择菜单栏的【导入(I)】->【表定义(T)】->【插件元数据定义(M)】
选择表定义所在的数据库,输入用户名,密码
选择【导入(I)】
第3章
3.1
NULL if 247:258 = BLANKS
CI_TEL_NO 259:298 40 CHARACTER
Dataset日志文件目录:resource scratchdisk "/appdata/DSDATA/SCRATCH"
4)DataStage的引擎所在目录,/usr/datastage/InformationServer/DSEngine,其下有bin,lib等,其中include里面有个很有用,定了很多错误,遇到错误,可以到文件里面找,不过这里只能找到常见错误,一些unexpected error无法在里面找到错误原因。
问题解决:这个问题的原因是客户端和服务器端的版本不一致,装了和服务器一样版本的client后就可以了。
问题分类:系统环境
问题详细描述:
ORA_S_CRD_CICIFADR,0: SQL*Loader-925: Error while uldlpim: OCIStmtExecute
ORA_S_CRD_CICIFADR,0: SQL*Loader-2026: the load was aborted because SQL Loader cannot continue.
2)登录Director客户机,选中欲运行的作业,选择菜单栏的【作业(J)】->【立即运行(N)】,或者点击工具栏的立即运行图标 。
2.5
登录Director客户机,选中欲监视的作业,右键选择【监视】,可以查看作业的运行情况。如下图所示:
2.6
登录Director客户机,选中欲查看日志的作业,右键选择【查看日志】
Copyright (c) 1982, 2005, Oracle. All rights reserved.
Character Set UTF8 specified for all input.
File processing option string: "FIX 363"
Discard File: none specified
DataStage企业版发布了四个核心功能来成功实施企业数据整合:
1)先进的开发和简单化的维护;
2)企业级别的开发、监测和管理;
3)在吞吐量和性能方面提供了无限制的高扩展的体系架构;
4)端对端的企业级元数据管理。
DataStage企业版提供了全面的功能去最优化用户在建立、升级和管理数据整合架构时的速度、灵活性和效率。DataStage企业版增强的功能减少了学习的周期、简单化了管理和优化了开发资源的使用,减少了数据整合应用的开发和维护周期。结果,DataStage企业版使得企业能够花更少的时间开发他们的整合应用,更多的时间是不断的从中受益。
Insert option in effect for this table: APPEND
Column Name Position Len Term Encl Datatype
------------------------------ ---------- ----- ---- ---- ---------------------
出现:
2.7
2.7.1
如遇到断网等一些情况可能导致作业被某一锁定,从而无法对作业进行修改。
解锁方法:
在浏览器输入Server端IP地址跟端口,如,
出现如下界面:
输入用户名,密码,登录后选择
【管理】->【会话管理】->【活动会话】,对那个被锁定作业的会话,选择【断开链接】
2.7.2
1用管理员用户登录DataStage Administrator
3.2
登录Administrator客户机,选择【项目】标签,选择要配置的project,在General->Enviroment…中
1.在General类型下:
TMPDIR=XXX (将其指向一个相对较大的目录,不填写就是指缺省的/tmp目录,此处需要讨论)。
2.在Parallel类型下:
APT_CONFIG_FILE,配置文件及其运行节点数,其配置文件为:/usr/datastage/InformationServer/Configurations/,这里需要检查一下指向的内容是否正确。具体详见中DataStage的配置目录。
NULL if 47:52 = BLANKS
CIADR_DB_TIMESTAMP 53:86 34 CHARACTER
NULL if 53:86 = BLANKS
CI_ADDR 87:246 160 CHARACTER
NULL if 87:246 = BLANKS
CI_POSTCOD 247:258 12 CHARACTER
DATASTAGE日常运维手册
DATASTAGE日常运维手册
项目名称:DATASTAGE运维
编制时间:2015年11月
修改记录
编号
日期
描述
版本wk.baidu.com
作者
审核
发布日期
本文档中所包含的信息,如无中国建设银行的书面许可,任何人都无权复制或利用。Copyright 2011by China Construction Bank
登录成功:
2.1.3
点击图标
选择需要登录的域,输入用户名,密码,选择需要登录的项目
登录成功:
2.2
以dsadm用户进入,执行以下命令:
1)Server启动命令:$HOMEDIR/uv–admin -start
注意:启动前,需要查看端口是否被释放,通过‘netstat–af inet |grep ds’查看,如果有连接,则需要等待操作系统自动释放后在启动服务。
1)选择菜单栏的【文件】->【编译(M)】,快捷键为F7。
2)点击工具栏的编译图标 。
2.4
Datastage Job运行有两种方式:一种在Designer中,一种在Director中。
1)登录Designer客户机,打开欲运行的Job,选择菜单栏的【文件】->【运行(R)】,快捷键为Ctrl+F5或者点击工具栏的运行图标 。
2打开对应PROJECT的【命令(M)】
3执行查看Locks
4通过最后一列item id找到被锁的对应的作业名
5执行下面命令解锁
UNLOCKUSERUsernoALL
其中username为所列出的信息中对应的Userno。
2.8
登录Designer客户机,选择菜单栏的【导入(I)】->【Datastage组件(C)】,选择所需导入的dsx文件,界面如下:
APT_STRING_PADCHAR= (缺省值是0x0,我们需要填写一个空格)
3.在Parallel->Operator Specific类型下
APT_COPY_TRANSFORM_OPERATOR设置为True,在做多结点运行时需要设置。
4.在User Defined类型下:
APT_IMPEXP_ALLOW_ZERO_LENGTH_FIXED_NULL设置为1。(如果目前数据统一为定长无分隔符,或者说不要设置定长的Null值,就不需要设置)。
1.2
1.3
用户通过各个客户端工具访问DataStage企业版的开发、配置和维护功能。这些工具包括:
Designer:用来建立和编辑DataStage作业和表的定义。Designer中的“Job Sequencer”控制作业的执行,其他作业成功完成(或失败,等)的条件。
Administrator:用来执行管理任务,如建立DataStage用户、建立和删除工程并且建立清洗标准。
4.1
问题描述:通过oracle stage,把文本数据写到数据库时候报错:SQL*Loader-925: Error while uldlpim: OCIStmtExecute;SQL*Loader-2026: the load was aborted because SQL Loader cannot continue.实际上数据是装入成功了。
ORA_S_CRD_CICIFADR,0: The call to sqlldr failed; the return code = 256;
ORA_S_CRD_CICIFADR,1: SQL*Loader: Release10.2.0. - Production on Wed Apr 11 19:31:09 2007
{
fastname "T219N2V3"
pools ""
resource disk "/appdata/DSDATA/DATASET" {pools ""}
resource scratchdisk "/appdata/DSDATA/SCRATCH" {pools ""}
}
}
Dataset数据文件目录:resource disk "/appdata/DSDATA/DATASET"
2.9
登录Designer客户机,导出Datastage Job有两种方法:
(1)选择菜单栏的【导出(X)】->【Datastage组件(C)】,界面如下:
点击添加按钮,选择所需的导出的Datastage Job,在要导出的作业组件一般选择“导出不带可执行文件的作业设计”,在导出到文件中选择本地的保存路径跟文件名。
2)Server停止命令:$HOMEDIR/uv–admin /stop
注意:停止前最好确保没有Client连接,可以通过‘onstat–a |grep ds’查看,是否还存在Client连接,否则要通知相应登录的client端彻底退出。
2.3
登录Datastage Designer客户机,参见,打开欲编译的Job,具体Job编译方法有两种:
第1章
1.1
DataStage企业版是Ascential Software公司所有企业整合系列产品中关键产品。企业版支持大容量数据的收集、整合和转换,数据从简单结构到很复杂的结构。基于高可扩展性的软件架购,企业版使得企业能够通过高性能来解决大部分业务问题,并行处理大容量数据。强大的企业元数据管理能力使得可以在数据整合生命周期中在所有工具中共享和使用工具。
Manager:用来编辑管理用户工程的DataStage资料库。
Director:用来验证、时序安排、运行和监测企业版作业。
第2章
2.1
2.1.1
点击图标
选择需要登录的服务器,输入用户名,密码登录
进去后点击项目,可进行项目增加,删除,设置项目属性
2.1.2
点击图标
选择需要登录的域,输入用户名,密码,选择需要登录的项目
{
node "node1"
{
fastname "T219N2V3"
pools ""
resource disk "/appdata/DSDATA/DATASET" {pools ""}
resource scratchdisk "/appdata/DSDATA/SCRATCH" {pools ""}
}
node "node2"
1)主机下发数据目录:/appdata/DATA#DATE
2)Datastage转码生成公共数据集目录:/appdata/DSDATA/$DATE/
3)DataStage的配置目录,/usr/datastage/InformationServer/Configurations,其下有其配置文件,可以设置运行结点数,Dataset数据文件目录,Dataset日志文件目录。
CI_CUST_NO 1:40 40 CHARACTER
NULL if 1:40 = BLANKS
CIADR_LL 41:46 6 PACKED DECIMAL (10, 0)
NULL if 41:46 = 0X000000000000(character '')
CI_ADDR_COD 47:52 6 CHARACTER
(Allow all discards)
Number to load: ALL
Number to skip: 0
Errors allowed: 50
Continuation: none specified
Path used: Direct - with parallel option.
Table S_CRD_CICIFADR, loaded from every logical record.
(2)在所需导出的Job上右键单击,在弹出菜单中选择【导出(X)】,在如上界面中的导出到文件选择本地的保存路径跟文件名。
2.10
登录Designer客户机,选择菜单栏的【导入(I)】->【表定义(T)】->【插件元数据定义(M)】
选择表定义所在的数据库,输入用户名,密码
选择【导入(I)】
第3章
3.1
NULL if 247:258 = BLANKS
CI_TEL_NO 259:298 40 CHARACTER
Dataset日志文件目录:resource scratchdisk "/appdata/DSDATA/SCRATCH"
4)DataStage的引擎所在目录,/usr/datastage/InformationServer/DSEngine,其下有bin,lib等,其中include里面有个很有用,定了很多错误,遇到错误,可以到文件里面找,不过这里只能找到常见错误,一些unexpected error无法在里面找到错误原因。
问题解决:这个问题的原因是客户端和服务器端的版本不一致,装了和服务器一样版本的client后就可以了。
问题分类:系统环境
问题详细描述:
ORA_S_CRD_CICIFADR,0: SQL*Loader-925: Error while uldlpim: OCIStmtExecute
ORA_S_CRD_CICIFADR,0: SQL*Loader-2026: the load was aborted because SQL Loader cannot continue.
2)登录Director客户机,选中欲运行的作业,选择菜单栏的【作业(J)】->【立即运行(N)】,或者点击工具栏的立即运行图标 。
2.5
登录Director客户机,选中欲监视的作业,右键选择【监视】,可以查看作业的运行情况。如下图所示:
2.6
登录Director客户机,选中欲查看日志的作业,右键选择【查看日志】
Copyright (c) 1982, 2005, Oracle. All rights reserved.
Character Set UTF8 specified for all input.
File processing option string: "FIX 363"
Discard File: none specified
DataStage企业版发布了四个核心功能来成功实施企业数据整合:
1)先进的开发和简单化的维护;
2)企业级别的开发、监测和管理;
3)在吞吐量和性能方面提供了无限制的高扩展的体系架构;
4)端对端的企业级元数据管理。
DataStage企业版提供了全面的功能去最优化用户在建立、升级和管理数据整合架构时的速度、灵活性和效率。DataStage企业版增强的功能减少了学习的周期、简单化了管理和优化了开发资源的使用,减少了数据整合应用的开发和维护周期。结果,DataStage企业版使得企业能够花更少的时间开发他们的整合应用,更多的时间是不断的从中受益。
Insert option in effect for this table: APPEND
Column Name Position Len Term Encl Datatype
------------------------------ ---------- ----- ---- ---- ---------------------
出现:
2.7
2.7.1
如遇到断网等一些情况可能导致作业被某一锁定,从而无法对作业进行修改。
解锁方法:
在浏览器输入Server端IP地址跟端口,如,
出现如下界面:
输入用户名,密码,登录后选择
【管理】->【会话管理】->【活动会话】,对那个被锁定作业的会话,选择【断开链接】
2.7.2
1用管理员用户登录DataStage Administrator
3.2
登录Administrator客户机,选择【项目】标签,选择要配置的project,在General->Enviroment…中
1.在General类型下:
TMPDIR=XXX (将其指向一个相对较大的目录,不填写就是指缺省的/tmp目录,此处需要讨论)。
2.在Parallel类型下:
APT_CONFIG_FILE,配置文件及其运行节点数,其配置文件为:/usr/datastage/InformationServer/Configurations/,这里需要检查一下指向的内容是否正确。具体详见中DataStage的配置目录。
NULL if 47:52 = BLANKS
CIADR_DB_TIMESTAMP 53:86 34 CHARACTER
NULL if 53:86 = BLANKS
CI_ADDR 87:246 160 CHARACTER
NULL if 87:246 = BLANKS
CI_POSTCOD 247:258 12 CHARACTER
DATASTAGE日常运维手册
DATASTAGE日常运维手册
项目名称:DATASTAGE运维
编制时间:2015年11月
修改记录
编号
日期
描述
版本wk.baidu.com
作者
审核
发布日期
本文档中所包含的信息,如无中国建设银行的书面许可,任何人都无权复制或利用。Copyright 2011by China Construction Bank
登录成功:
2.1.3
点击图标
选择需要登录的域,输入用户名,密码,选择需要登录的项目
登录成功:
2.2
以dsadm用户进入,执行以下命令:
1)Server启动命令:$HOMEDIR/uv–admin -start
注意:启动前,需要查看端口是否被释放,通过‘netstat–af inet |grep ds’查看,如果有连接,则需要等待操作系统自动释放后在启动服务。
1)选择菜单栏的【文件】->【编译(M)】,快捷键为F7。
2)点击工具栏的编译图标 。
2.4
Datastage Job运行有两种方式:一种在Designer中,一种在Director中。
1)登录Designer客户机,打开欲运行的Job,选择菜单栏的【文件】->【运行(R)】,快捷键为Ctrl+F5或者点击工具栏的运行图标 。
2打开对应PROJECT的【命令(M)】
3执行查看Locks
4通过最后一列item id找到被锁的对应的作业名
5执行下面命令解锁
UNLOCKUSERUsernoALL
其中username为所列出的信息中对应的Userno。
2.8
登录Designer客户机,选择菜单栏的【导入(I)】->【Datastage组件(C)】,选择所需导入的dsx文件,界面如下:
APT_STRING_PADCHAR= (缺省值是0x0,我们需要填写一个空格)
3.在Parallel->Operator Specific类型下
APT_COPY_TRANSFORM_OPERATOR设置为True,在做多结点运行时需要设置。
4.在User Defined类型下:
APT_IMPEXP_ALLOW_ZERO_LENGTH_FIXED_NULL设置为1。(如果目前数据统一为定长无分隔符,或者说不要设置定长的Null值,就不需要设置)。
1.2
1.3
用户通过各个客户端工具访问DataStage企业版的开发、配置和维护功能。这些工具包括:
Designer:用来建立和编辑DataStage作业和表的定义。Designer中的“Job Sequencer”控制作业的执行,其他作业成功完成(或失败,等)的条件。
Administrator:用来执行管理任务,如建立DataStage用户、建立和删除工程并且建立清洗标准。