KETTLE 资源库配置方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
资料库配置方法tiyukeji@
说明:资源配置库是为了存储KETTLE 所有对象的数据库。类似于一个CS 界面化程序。
在我们建立的所有对象,以及对象之间的关系都会存储在数据库表中。这样在做数平台转移测试环境搭建时就比较方便,只需把资源库数据备份文件导入就新的数据中就可以了,并且在调试数据作业、监控作业运行结果时很方便。
在使用过程中遇到过几个怪异的问题,在这里提一下:
●KETTLE 有的时候出现很多的错误。这时候就把你用户下的,如:JA V A空指针,那就
把C:\Documents and Settings\tanhongwei-ghq 下的.kettle .pentaho 删除掉。
●在建立共享控件的时候,命名要用英文的。如果不用的话就会报错,如果报错,那就要
把C:\Documents and Settings\tanhongwei-ghq\.kettle\shared.xml 用UE打开,把乱码手动更改一下就可以了。
●做JOB 日志跟踪的时候,数据库连接要用JDBC的连接方式。有好的时候KETTLE 只
支持JDBC 的连接方式,所以在做其他连接的时候,能用JDBC 最好用这个。
简要介绍一下资料库的配置方法:
●运行Spoon.bat
●点击新建按钮
再次点击新建按钮
●填写相应配置信息,这个就是要建立资源库的配置界面,要注意的是Access 选项,
KETTLE 只支持JDBC配置资源库方式。
●配置完毕后,可以点击TEST 按钮。测试一下,在测试完毕后,点击OK ,再点击OK
填写一些名称:(这个随便写一个就行)
●在点击创建或者更新按钮
●弹出对话中输入管理员密码:admin 点击确定
●点击是
●出现一个SQL 语句的对话框,点击执行按钮
这样配置库就建立完了,输入用户名:admin 密码:admin 登陆
最后:简要说说几个表。主要启引导作用,如果需要了解可以自己打开数据看一下。这样有利于理解KETTLE 的工作原理。
一起做个例子:
●自己建立一个转换,名字是:转换1 ,然后保存。
●最后在配置库中查询select* from r_transformation t 就可以查找出你刚才建立的
转换
再建立一个JOB
可以在select * from r_JOB 这表中查找到
这些只是一个例子可以自己再试着查找其他的东西。比如说:STEP 之间的连接是怎么存储的。
最后:
在建立完资源库的的时候。最后要把表r_database 锁住。以保证其他人手误改动数据库的配置。
方法1:把正表锁住
alter table r_database add constraint read_only_check check(1=1) disable validate;
方法2:不如许出现某些数据源
alter table R_DATABASE
add constraint RULE_R_DA TABASE_1
check (host_name NOT LIKE '%126' AND host_name NOT LIKE '%65');