开源ETL框架

我被要求对两个ETL框架进行原型设计。 要求如下:

  • 开源
  • 适用于Linux
  • 保持
  • 可以在Web浏览器上查看日志(很高兴)
  • 用Perl,Python,Ruby或Java编写

原始文件可以是任何东西(excel,csv,html页面等)。目标数据库是MySQL。

不要只是删除名称,请根据您的经验说明优缺点。

谢谢!

我用过Kettle 。 它有自己的GUI,但如果您更喜欢使用API​​自己进行ETL,它也会受到支持。 它已被certificate对我非常有用,并且已经有一些插件已经可用。

最流行的基于Java的ETL之一是Talend 。

Jaspersoft ETL是另一个从Talend扩展而来的,它有一个很好的基于eclipse的UI。

另一个选择是CloverETL 。 它是用Java编写的,有一个开源的LGPL版本的Engine。 它还有一个名为CloverETL Community的免费GUI版本。

它可以处理任何指定的源并连接到许多数据库,包括MySQL。

    Interesting Posts