Talend這個工具之前還真沒聽說過。搜索了下,可以借鑒下 Pentaho Data Integration (Kettle)是Pentaho生態(tài)系統(tǒng)中默認的ETL工具。通過非常直觀的圖形化編輯器(Spoon),您可以定義以XML格式儲存的流程。在Kettle運行過程中,這些流程會以不同的方法編譯。用到的工具包括命令行工具(Pan),小型服務(wù)器(Carte),數(shù)據(jù)庫存儲庫(repository)(Kitchen)或者直接使用IDE(Spoon)。 Talend Open Studio是 Talend 開發(fā)的ETL工具——Talend 是一家主營數(shù)據(jù)集成和數(shù)據(jù)管理解決方案的企業(yè)。Talend 采用用戶友好型,綜合性很強的IDE(類似于Pentaho Kettle 的 Spoon)來設(shè)計不同的流程。這些流程可以在IDE內(nèi)部測試并編譯成Java 代碼。您可以隨時查看并編輯生成的Java代碼,同時實現(xiàn)強大的控制力和靈活性。 兩者都非常優(yōu)秀,都屬于用戶友好型的交叉平臺(基于Java的)工具。它們的主要差異在于Kettle 將 ELT 流程編譯為 XML 格式,然而Talend Open Studio 則生成 Java 代碼。 易用性: Talend:有 GUI 圖形界面但是以 Eclipse 的插件方式提供。 Kettle:有非常容易使用的 GUI,出現(xiàn)問題可以到社區(qū)咨詢。 技術(shù)支持: Talend:主要在美國 Kettle:在美國,歐洲(比利時,德國,法國,英國),亞洲(中國,日本,韓國)都可以找到相關(guān)技術(shù)支持人員。 部署: Talend:創(chuàng)建 java 或perl 文件,并通過操作系統(tǒng)調(diào)度工具來運行 Kettle:可以使用 job 作業(yè)方式或操作系統(tǒng)調(diào)度,來執(zhí)行一個轉(zhuǎn)換文件或作業(yè)文件,也可以通過集群的方式在多臺機器上部署。 速度: Talend:需要手工調(diào)整,對特定數(shù)據(jù)源有優(yōu)化知識。 Kettle:比 Talend 快,不過也需要手工調(diào)整,對 Oracle 和 PostGre 等數(shù)據(jù)源做了優(yōu)化,同時也取決于轉(zhuǎn)換任務(wù)的設(shè)計。 數(shù)據(jù)質(zhì)量: Talend:在 GUI 里有數(shù)據(jù)質(zhì)量特性,可以手工寫 SQL 語句。 Kettle:在 GUI 里有數(shù)據(jù)質(zhì)量特性,可以手工寫 SQL 語句、java腳本、正則表達式來完成數(shù)據(jù)清洗。 監(jiān)控: Talend:有監(jiān)控和日志工具 Kettle:有監(jiān)控和日志工具 連接性: Talend:各種常用數(shù)據(jù)庫,文件,web service。 Kettle:非常廣泛的數(shù)據(jù)庫,文件,另外可以通過插件擴展 |
|