(精品文档)2019年kettle中文文档之output

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Kettle之output中文文档
说明:使用kettle 3.0.0版本。

Cube输出:
说明:输出串行化数据,将数据存储于二进制数据形式,当向后分析文本内容,它将比平面文件更有优势。

个人认为:kettle开始支持文本搜索,尤其是对文本文件的搜索,这是对文本搜索的基础支持。

但是还是提供的功能比较简单,目前的功能只是提供串行化的文本存储。

文本文件输出:将抽取到的数据输出到平面文件。

以下是文本文件输出的设定界面,大部分选项相信大家都应用过了,我所说明的就是“文件名中包含日期/时间”选项,可以区分不同时间抽取的数据,以便以后区分存档。

“封闭符”是将数据字段用指定的字符封闭起来,
XML输出:将数据输出到XML文件中。

参数设定:
“文件”选项卡:“文件名称”指定文件路径和名称,“扩展”指定为XML,“在文件名中包含步骤号码?”是否插入当前步骤号;
●“内容”选项卡:确定XML文件的格式和编码形式,“已压缩”确定当前输
出文件是否生成压缩包。

“正在编码”选择编码格式,一般选择UTF-8格式,“父XML元素”指定XML根tag,“记录XML元素”指定行记录的tag,“分割各一个…记录”将抽取的数据分割存储到不同且连续编号的文件中,目的是使得文件大小合适,在读取文件时占去空间较小。

●“字段”选项卡:点取“获取字段”将上一个步骤输出的字段元数据获得。

更新:根据关键字段将数据更新到目标表,选择数据库连接和选择表及Commit Size等的操作不必多讲,“用来查询值的关键字”列表就是将上一个步骤流入的数据和目标表中的字段比较,我们可以选择比较的字段和比较的条件,以达到比较增量更新的目的,其实就是实现了一个程序级的look up的功能。

个人观点:本功能和插入/更新有相仿的地方,只是插入/更新的部分功能,不执行插入操作,所以插入/更新就不介绍了。

删除:将上一步骤的抽取的数据与目标表的数据进行比较,将目标表的数据与上一步骤抽取的数据相同的数据删除。

未完待续。

欢迎大家修改。

相关文档
最新文档