Kettle的概念学习系列之Kettle是什么?(一)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Kettle的概念学习系列之Kettle是什么?(⼀)
不多说,直接上⼲货!
Kettle是什么?
Kettle是⼀款国外开源的ETL⼯具,纯java编写,可以在Window、Linux、Unix上运⾏,绿⾊⽆需安装,数据抽取⾼效稳定。

Kettle 中⽂名称叫⽔壶,该项⽬的主程序员MATT 希望把各种数据放到⼀个壶⾥,然后以⼀种指定的格式流出。

Kettle这个ETL⼯具集,它允许你管理来⾃不同数据库的数据,通过提供⼀个图形化的⽤户环境来描述你想做什么,⽽不是你想怎么做。

ETL,相信能来看我这篇博客的朋友,肯定都清楚这个概念了,ETL,是英⽂ Extract-Transform-Load 的缩写,⽤来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)⾄⽬的端的过程。

ETL⼀词较常⽤在,但其对象并不限于数据仓库。

Kettle中有两种脚本⽂件,transformation和job,transformation完成针对数据的基础转换,job则完成整个⼯作流的控制。

ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或⾏业应⽤来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握⼀种etl⼯具的使⽤,必不可少。

那么,在这⾥,我推荐Kettle给⼤家。

在使⽤中我感觉这个⼯具真的很强⼤,⽀持图形化的GUI设计界⾯,然后可以以⼯作流的形式流转,在做⼀些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等⽅⾯有着⽐较稳定的表现,其中最主要的我们通过熟练的应⽤它,减少了⾮常多的研发⼯作量,提⾼了我们的⼯作效率。

Data Integration - Kettle
Data Integration (or Kettle) delivers powerful Extraction, Transformation, and Loading (ETL) capabilities, using a groundbreaking, metadata-driven approach.
更多的,不多赘述,⼤家跟随我来⼀起下载、安装和初步使⽤吧!
欢迎⼤家,加⼊我的微信公众号:⼤数据躺过的坑⼈⼯智能躺过的坑
同时,⼤家可以关注我的个⼈博客:
⼈⽣苦短,我愿分享。

本公众号将秉持活到⽼学到⽼学习⽆休⽌的交流分享开源精神,汇聚于互联⽹和个⼈学习⼯作的精华⼲货知识,⼀切来于互联⽹,反馈回互联⽹。

⽬前研究领域:⼤数据、机器学习、深度学习、⼈⼯智能、数据挖掘、数据分析。

语⾔涉及:Java、Scala、Python、Shell、Linux等。

同时还涉及平常所使⽤的⼿机、电脑和互联⽹上的使⽤技巧、问题和实⽤软件。

只要你⼀直关注和呆在群⾥,每天必须有收获
对应本平台的讨论和答疑QQ群:⼤数据和⼈⼯智能躺过的坑(总群)(161156071)。

相关文档
最新文档