开源ETL框架
我被要求对两个ETL框架进行原型设计。 要求如下:
- 开源
- 适用于Linux
- 保持
- 可以在Web浏览器上查看日志(很高兴)
- 用Perl,Python,Ruby或Java编写
原始文件可以是任何东西(excel,csv,html页面等)。目标数据库是MySQL。
不要只是删除名称,请根据您的经验说明优缺点。
谢谢!
我用过Kettle 。 它有自己的GUI,但如果您更喜欢使用API自己进行ETL,它也会受到支持。 它已被certificate对我非常有用,并且已经有一些插件已经可用。
最流行的基于Java的ETL之一是Talend 。
Jaspersoft ETL是另一个从Talend扩展而来的,它有一个很好的基于eclipse的UI。
另一个选择是CloverETL 。 它是用Java编写的,有一个开源的LGPL版本的Engine。 它还有一个名为CloverETL Community的免费GUI版本。
它可以处理任何指定的源并连接到许多数据库,包括MySQL。