本文从kettle的简介、下载、安装、初级使用来展开。
1.kettle是什么?
kettle是一款开源的ETL工具。可以运行在Windows和linux上。
2.下载地址
https://community.hitachivantara.com/s/article/downloads
3.安装
因为Kettle是基于Java开发的,所以要先安装jdk环境。jdk下载地址:https://www.oracle.com/technetwork/java/javase/downloads/index.html。
解压下载的Kettle即可。其中Spoon.bat双击是运行在Windows上,spoon.sh这个是运行在linux上。(本文以Windows为例)
5.使用
以异构数据源的数据定时抽取为例来展开描述。
5.1数据库连接:将需要抽数的两个数据库连接起来。
5.2选择需要处理数据源的表:选择数据源的ip和要抽取数据的条件。
5.3选中将数据源中表的数据插入到目标表:其中剪裁表的意思就是在插入数据之前,是否将目标表中的数据清空。
5.4数据源和目标表完成:这样一个简单的ETL任务就算搞定了。
6.总结
本文内容较简单,可做入门学习。Kettle在市场上占有的份额还是挺大的,毕竟是开源的。有兴趣的可以深入学习一下。Kettle只是一个数据处理的工具,更重要的是项目上的架构方法。
7.资料分享
由于各种原因,在这就不公开分享资料了。有需要Kettle学习资料的,私聊我。无偿分享。