
软件介绍
Kettle官方版是功能十分强大的数据引流工具,就像是一个水管,可以把数据从这段发送到另一端,以某种指定的格式输出,目前Kettle完美支持Windows、Linux以及Unix等操作系统,为广大用户提供了基础数据转换和工作控流服务,大大提供工作效率。
软件特色
国外开源的ETL工具,纯java编写;
绿色无需安装,数据抽取高效稳定;
可以在Window、Linux、Unix上运行,稳定流畅;
集群允许转换以及转换中的步骤在多个服务器上并发执行;
可以用来实现数据的剖析、清洗、校验、抽取、转换和加载等各类常见的ETL类工作;
数据处理功能也很强大,非常适合于各种数据处理功能。
Kettle中文使用教程
打开kettle
首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
然后打开Spoon.bat,如图所示:
打开后请耐心等待一会儿时间。
建立转换。
在文件-》新建装换。
新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
建立数据库连接的过程与其他数据库管理软件连接数据库类似。
注意:在数据库链接的过程中,Kettle Spoon官方版可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
简单的数据表插入\更新
(1)新建表插入
在左边的面板中选择“核心对象”,在核心对象里面选择“输入-》表输入”,用鼠标拖动到右边面板。如图所示:
双击拖过来的表,可以编辑表输入。
选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
(2)通过插入\更新输出到表。
在左边面板中选择核心对象、选择“输出-》插入\更新”如图所示:
编辑插入更新:
首先:表输入连接插入更新。
选中表输入,按住shift键,拖向插入更新。
然后:双击插入更新,编辑它。
到这里基本上,这个转换就要做完了,可以点击运行Kettle Spoon中文版查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
使用作业控制上面装换执行。
使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
双击start可以编辑,可以设置执行时间等等。
点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr,
最后点击运行即可。
安装方法
1、在本站下载Kettle中文版安装包;
2、使用压缩软件进行解压(推荐使用WinRAR);
3、点击exe文件开始安装。
软件官网
https://www.etlapp.com/
软件综述
Kettle是一款开源的数据集成工具,主要用于将数据从一个地方移动到另一个地方。它具有强大的数据转换和处理功能,可以完成各种复杂的数据提取、转换和加载(ETL)任务。
Kettle的优点:
- 开源: Kettle是一款开源软件,这意味着它可以免费使用和修改。这使得它成为希望构建自定义数据集成解决方案的开发人员的理想选择。
- 功能强大: Kettle具有强大的数据转换和处理功能,可以完成各种复杂的数据ETL任务。它支持多种数据源和目标,并且具有丰富的内置转换器和过滤器。
- 易于使用: Kettle具有友好的图形用户界面(GUI),即使是新手也可以轻松使用。它还提供了丰富的文档和教程,可以帮助用户快速上手。
- 可扩展性强: Kettle是一款可扩展性很强的工具,可以轻松处理大规模的数据集。它支持分布式处理,可以将数据处理任务分配给多个节点,从而提高处理效率。
Kettle的缺点:
- 性能问题: Kettle在处理大规模数据集时可能会遇到性能问题。这主要是因为它是一个单线程应用程序,无法充分利用多核CPU的优势。
- 缺乏安全性: Kettle本身不具备安全性功能,因此在处理敏感数据时需要采取额外的安全措施。
- 技术支持有限: 由于Kettle是一个开源软件,因此缺乏官方的技术支持。不过,网上有许多社区论坛和资源,可以帮助用户解决问题。
总体而言,Kettle是一款功能强大、易于使用且可扩展性强的开源数据集成工具。它非常适合需要完成各种复杂数据ETL任务的开发人员和数据分析师。