kettle工具使用文档
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
1. Kettle工具的组成 (2)
2. kettle工具的运行 (2)
3. 资源库的设置 (3)
4. 转换的创建与使用 (8)
4.1 创建一个新的装换 (8)
4.2 DataGird (9)
4.3 Write to log控件 (10)
4.4 表输入控件 (13)
4.5 字段选择控件 (14)
4.6 表输出控件 (15)
4.7 插入/更新控件 (17)
4.8 转换中变量的设置 (18)
4.9变量的使用 (19)
4.10 步骤的错误处理 (19)
4.11 flow控件的使用 (20)
4.11.1 Switch/Case控件 (20)
4.11.2 Blocking Step控件 (21)
4.11.3 Indentify last row in a stream控件 (22)
4.11.4 过滤记录控件 (23)
4.11.5 空操作控件 (23)
4.11.6 Abort控件 (24)
5. 作业(job)的创建及使用 (24)
5.1 创建一个新的作业 (24)
5.2 START控件 (25)
5.3 Success控件 (25)
5.4 Transformation控件 (25)
5.5 变量设置 (26)
5.6 Js脚本使用 (27)
5.7 空操作控件 (27)
1.Kettle工具的组成
Kettle主要由资源库、数据库、作业(job)、转换、步骤五部分组成,资源库是用来存储用户所编写的作业和转换(即kjb文件和ktr文件),一般是在数据库中存储,方便用户的查找和使用。数据库就是处理数据是需要的数据库。作业是用来确定一个工程中需要使用的转换和转换的执行顺序。转换是数据在ktr文件中的具体转换过程,类似于Java的一个方法,而作业就类似于java的一个类,它可以调用各种不同的方法(转换)。
步骤是kettle最小的执行单位。
2.kettle工具的运行
1)在电脑中安装jdk并配置java运行环境(jdk版本建议是1.6或以上版本)
2)Kettle工具的下载:可以在中下载最新的版本,此文档所
使用的是kettel-4.1.0的版本
3)Kettle工具的运行:
在Windows系统下运行,只需要解压kettle文件后,双击data-integration文件夹中的Spoon.bat文件
在Linux下运行则双击data-integration文件夹中的Spoon.sh文件
3.资源库的设置
打开kettle工具后会出现如下界面:
在这里我们可以设置kjb文件和ktr文件存放的资源库,也可以不设置但是在保存的时候就需要手动设置文件的保存路径。
加号按钮是添加新的资源库,铅笔按钮是对已有的资源库进行编辑,叉叉按钮是删除选定的资源库
按下添加按钮后会进入一下界面,双击红色选定框内的文字将弹出新建一个新的资源库
双击红色选定框内的文字将弹出资源库新建窗口,点击上面一行文字是在数据库中创建资源库,下面的文字是在本地中创建资源库(与数据库类似,不作展示)
点击新建按钮将弹出数据库连接窗口
Connection Name:数据库连接名称(随意填写,不能为空)Connection Type:连接的数据库类型
Access:数据库的连接方式(本文档只选择了Native的连接方式,其他方式请读者自行摸索)
Host Name:数据库具体的Ip地址
Database Name:指定连接的数据库名称
Instance Name:(可不填写)
Port Number:数据库监听的tcp/ip端口号
User Name:指定连接数据库登录时的用户名
Password:指定连接数据库登录时的密码
填写完数据库连接的基本信息后,点解界面中的Test按钮进行数据库连接测试,如成功连接会弹出如下信息,反之则会弹出出错信息,出错后根据相关的出错信息进行修改,不需要添加相关的数据库连接jar包,kettle工具中已经把其包含进去了。
连接成功后点击ok按钮,并在一下界面输入Id和名称(id和名称都可以随意填写)
填写完成后点击创建或更新按钮,进行资源库的创建。如果只点击确定按钮是不会创建资源库的。点击创建或更新按钮后会弹出一下界面,是在数据库中创建资源库的sql执行语句,点击执行
执行完后会弹出一下界面,执行完后直接关闭SQL语句的运行结果窗口和简单SQL编辑器窗口(运行成功后不要再次点击执行按钮,否则会报错)
确定资源库信息后返回资源库连接界面,进行资源库登录,新建的资源库密码默认为admin,再次登录后可以对其进行密码的修改(输入密码后按下enter键登录)
探索资源库可以查看资源库中的具体信息
Browse:查看资源库中所存放的ktr文件和kjb文件Connections:数据库连接管理
Security:资源库登录用户管理
4.转换的创建与使用
4.1创建一个新的装换
下图为一个普通的转换流程,下面介绍一些常用的转换控件
4.2DataGird
核心对象—输入—DataGird 中选取
DataGrid是数据的输入表单,用户可以在里面定义数据名称、类型等信息,并设置相对应的值
4.3Write to log控件
核心对象—输入—Write to log 中选取
Write to log 把相关信息打印到日志窗口,获取字段按钮会自动获得从连接中所输入的所有属性
建立数据连接线: shift + 左键