kettle集成应用之---java调用执行transformation和job
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本文介绍如何在java应用程序中调用执行transformation和job。
(一)起步,配置资源库和数据库连接
运行Spoon.bat,启动登录界面,如下图所示:
第一次运行时,Repository为空,需要创建Repository。
(什么是Repository?Repository即资源库,是kettle用于存储元数据的多张数据表,在资源库模式下设计的transformation和job都被存储在这些数据表中。
)
如果点击界面上的“No repository”,可以在无资源库模式下进行设计,设计的对象最终以xml文件的形式存储到本地目录。
点击“New”配置新的Repository,点击“Edit”编辑现有的Repository,点击“Delete”删除现有的Repository。
资源库配置:
配置Repository需要先配置Database Connection(数据库连接)。
(什么是Database Connection?简单的来说,就是在数据库中分配一个空间存储资源库的元数据表,以Oracle为例,就是分配一个用户给kettle,具体配置见数据库连接配置)
配置好Database Connection后,填写Name和Description,点击“Create or Upgrade”按钮,就可以将kettle的元数据表创建到你指定的数据库中。
RepositoryName : kettle
默认的用户名和密码都是admin(登录后可以进行修改)
数据库连接配置:
用于存储Repository元数据。
配置信息如下:
Connection Name : merit113(名称,自定义)
Connection Type : Oracle (如果数据库是Oracle)
Access : Native(选这个即可)
Host Name : localhost(主机名)
Database Name : merit113(数据库SID)
Port Number : 1521(端口)
User Name : kettle(用户名)
Password : merit(密码)
配置结束,可以点击界面上的“Test”进行测试。
全部配置结束后,在登录界面中,选择配置的Repository,填上登录名和密码(初始均为admin),就可以以Repository模式进入kettle设计界面,在菜单栏的“Repository”中可以连接和断开Repository,可以查看Repository中的transformation和job,管理用户和编辑当前用户信息。
(二)在应用程序中集成kettle
设计好transformation和job后,如何在java里面调用执行呢?
首先,需要在项目中引入执行kettle所需要的jar包:
除了系统jre之外,以上红色标记的外部jar包(可以在kettle对应的目录下找到)都是必须引入的资源,否则,程序不能正常运行;我自己的做的例子中需要写xls文件,所以用到了jxl.jar。
另外,将kettle目录下plugins目录,将其拷贝到你的应用程序根目录下,这一点很重要,
调用资源库中的transformation
调用资源库中的job
调用本地的transformation
调用本地的job。