上一節:kettle——(1)介紹和Execl輸出舉例 最近公司在做數據總線的工作,需要用kettle這個ETL工具,所以花了一些時間來研究研究,喜歡的話點個贊
kettle抽取一個數據庫中數據,同步到另一數據庫1.新建一個“轉換”,新建兩個數據庫連接如下:目標數據庫MySQL 
源數據庫SQL Server 
2.拖入“輸入表”和“輸出表”輸入表:選擇相應的數據庫,可以直接獲取sql語句 
輸出表:選擇相應的數據庫,填寫目標表(同步數據用的表),可以直接獲取sql語句 
沒有連接導致字段不可讀 
按住shift之后便可以連線 
目標數據庫中沒有相應的表,需要新建  執行 
3.運行轉化文件即可
以上說的是完全同步一張表的情況,而且前提是——在目標數據庫中沒有同名的表 如果我只需要這張表中的某些字段應該怎么辦 4.根據自己的需要刪除或者修改字段,再同步數據源數據表 
添加“字段選擇” 
編輯“字段選擇”,獲取字段 
移除自己不需要的字段:先獲取,然后右擊——刪除 

修改字段(這里偷懶沒有寫,自行腦補哈) 
“輸出表”運行SQL語句,建立新表如下: 
最后結果 
以上的同步數據是在目標數據庫中沒有這張表的情況下,如果目標數據庫中已經存在這張表了呢? 5.同步目標數據庫已存在的表源數據庫表數據如下: 
目標數據庫表數據如下: 
修改字段選擇,刪除字段create_time(同步的數據沒有這一列的數據) 
修改輸出表對應已存在的表 
最后結果 
下一節:kettle——(3)全量抽取和增量抽取
|