kettle新手教程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

kettle新⼿教程
1、kettle介绍
kettle是⼀个ETL(Extract, Transform and Load抽取、转换、加载)⼯具,ETL⼯具在数据仓库项⽬使⽤很频繁,kettle也能够应⽤在下⾯⼀些场景:
在不同应⽤或数据库之间整合数据
把数据库中的数据导出到⽂本⽂件
⼤批量数据装加载数据库
数据清洗
集成应⽤相关项⽬是个使⽤
kettle使⽤很easy,通过图形界⾯设计实现做什么业务,⽆需写代码去实现。

因此,kettle是以⾯向元数据来设计。

kettle⽀持⾮常多种输⼊和输出格式。

包含⽂本⽂件。

数据表。

以及商业和免费的数据库引擎。

另外,kettle强⼤的转换功能让您⾮常⽅便操纵数据。

以下展⽰⼀个简单的“Hello World”演⽰样例,本教程将告诉你怎样轻松⽤kettle⼯作。

让你有基础可以学习更复杂的转换功能。

安装kettle
kettle设计⼯具spoon介绍
hello world演⽰样例
⼜⼀次设计helloworld演⽰样例
2、⼊门演⽰样例学习
2.1、安装kettle
⾸先通过官⽹下载kettle;
需求环境:
kettle须要jre1.5及以上版本号。

能够通过oracle官⽹免费下载;
kettle安装
kettle⽆需安装。

直接解压zip⽂件到指定的⽬录。

在类unix操作系统上。

须要运⾏下⾯脚本:
cd Kettle
chmod +x *.sh
执⾏
kettle中的⼀个图形⽤户界⾯叫spoon,spoon能够设计转换和作业,也能够执⾏转换和作业,以下的内容将继续介绍他们。

2.2、kettle设计⼯具spoon介绍
Spoon是⼀个图形设计⼯具,⽤来设计和測试数据交换处理流程,也能够通过命令⾏(终端)运⾏处理流程。

资源库和⽂件
在spoon中设计作业和转换。

kettle提供两种⽅式存储:资源库和⽂件;
假设你选择资源库,spoon第⼀次启动时须要创建资源库。

选择⽂件⽅法,作业保存⽂件是的扩展名是KJB。

转换⽂件的扩展名为KTR,为了简化学习,以下教程採⽤后者。

启动spoon
在windows中运⾏spoon.bat,在类unix系统中运⾏spoon.sh;启动时⾸先出现⼀个对话框窗体提⽰选择资源库及输⼊连接信息,点击取消button。

然后能够看到欢迎窗体,点击“⼯具”菜单下的“选项”。

弹出窗体中能够进⾏⼀些全局设置,如语⾔、⽇志等信息,设置后需重新启动才⼲⽣效。

以下内容參见
2.3、
2.4、。

相关文档
最新文档