Kettle簡介:Kettle 是 PDI 以前的名稱,PDI 的全稱是Pentaho Data Integeration,Kettle 本意是水壺的意思,表達了數(shù)據(jù)流的含義。Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,綠色無需安裝,數(shù)據(jù)抽取高效穩(wěn)定。Kettle這個ETL工具集,它允許你管理來自不同數(shù)據(jù)庫的數(shù)據(jù),通過提供一個圖形化的用戶環(huán)境來描述你想做什么,而不是你想怎么做。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個工作流的控制。作為Pentaho的一個重要組成部分,現(xiàn)在在國內(nèi)項目應(yīng)用上逐漸增多。 Kettle下載和安裝: 1、官網(wǎng)各個版本下載地址:https:///projects/pentaho/files/Data%20Integration/ 2、Kettle是純JAVA編程的開源軟件,本地環(huán)境配置JDK1.7以上即可運行,解壓后直接使用無需安裝。 需準備的其他東西: 數(shù)據(jù)庫驅(qū)動,如筆者連接的是mysql則需將mysql的驅(qū)動放在kettle根目錄的bin下面,然后到服務(wù)中啟動mysql,重啟kettle。 教程步驟: 1、運行spoon.bat,打開spoon圖形工具 kettle解壓包目錄 啟動spoon.bat kettle打開頁面 注意:紅圈處沒有connect按鈕,原因為資源庫配置文件亂碼造成 解決方法:打開系統(tǒng)盤用戶目錄下的repositories.xml配置文件,將亂碼內(nèi)容刪除,并刪除.spoonrc文件,重啟kettle image.png 2、創(chuàng)建或連接資源庫 選擇創(chuàng)建數(shù)據(jù)庫資源庫 創(chuàng)建資源庫 選擇創(chuàng)建數(shù)據(jù)庫資源庫 輸入資源庫名稱(自定義) 點擊Database Connection創(chuàng)建數(shù)據(jù)庫連接 image.png 選擇Create New Connection image.png 3、創(chuàng)建數(shù)據(jù)庫連接 輸入連接名稱、選擇類型(根據(jù)自身所需選擇,這里連接的是mysql數(shù)據(jù)庫,如連接其他數(shù)據(jù)庫,需將數(shù)據(jù)庫驅(qū)動放在kettle根目錄中的lib下面,然后啟動數(shù)據(jù)庫重啟kettle) 確認輸入無誤后點擊測試,測試是否連接成功,失敗多為lib下找不到數(shù)據(jù)庫驅(qū)動 image.png 選擇finish 創(chuàng)建成功,選擇Connect連接到數(shù)據(jù)庫 image.png 登陸,默認有個admin用戶,密碼也為admin啟動后可以修改用戶密碼或添加其他用戶 image.png 創(chuàng)建成功 連接數(shù)據(jù)庫查看可以發(fā)現(xiàn)該數(shù)據(jù)庫自動創(chuàng)建了使用kettle所需要的表結(jié)構(gòu) image.png 更新一、如何添加新用戶 點擊工具=》資源庫=》探索資源 選擇【安全】=》添加用戶=》填寫賬號密碼保存 image.png |
|