PowerCenter基本工作原理
Informatica是基于元數據驅動(dòng)的,所有的元數據都保存在Repository(知識庫)中,該知識庫可以創(chuàng )建在所有主流數據庫當中,充分體現了它元數據的開(kāi)放性。
Repository Server用來(lái)管理所有客戶(hù)端以及Informatica Server跟Repository的交互, 并且一個(gè)Repository Server可以管理多個(gè)Repository,而Repository Server可為每個(gè)Repository分配一個(gè)Repository Agent來(lái)處理所對有元數據操作的響應。
Informatica Server是實(shí)際處理ETL任務(wù)的后臺服務(wù),它是基于內存運行、高效的ETL服務(wù),不需要產(chǎn)生任何的代碼,每次執行任務(wù)之前都會(huì )從Repository中讀取最新的ETL規則。
Informatica的客戶(hù)端提供了無(wú)編碼、完全圖形化的設計和管理調度界面,可實(shí)現快速開(kāi)發(fā)和部署。
一個(gè)基本的ETL任務(wù)設計和部署的大致步驟如下:
A) 使用Designer客戶(hù)端,獲取源數據表的元數據。
B) 使用Designer客戶(hù)端,獲取目標數據表的元數據。
C) 使用Designer客戶(hù)端,設計一個(gè)Mapping,其中就是源->目標的ETL規則。
D) 使用Workflow Manager客戶(hù)端,針對上面實(shí)現的Mapping,實(shí)例化為一個(gè)Session,為其指定實(shí)際的數據源、目標連接,以及其他屬性。
E) 使用Workflow Manager客戶(hù)端,創(chuàng )建一個(gè)Workflow,其中包含上述的Session以及其他的Task,在Workflow中可實(shí)現復雜的流程控制。
F) 運行上述Workflow,使用Workflow Monitor客戶(hù)端,監測最終的任務(wù)運行結果。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。