informatica怎么連接數(shù)據(jù)庫 informatica怎么編輯源的數(shù)據(jù)?
informatica怎么編輯源的數(shù)據(jù)?首先是登錄服務(wù):賬號和密碼一樣:Administrator。r操作(創(chuàng)建存儲庫)A.在ODBC數(shù)據(jù)源管理器中創(chuàng)建一個新的數(shù)據(jù)源,以連接到要創(chuàng)建存儲庫的數(shù)據(jù)庫。B
informatica怎么編輯源的數(shù)據(jù)?
首先是登錄服務(wù):賬號和密碼一樣:Administrator。
r操作(創(chuàng)建存儲庫)
A.在ODBC數(shù)據(jù)源管理器中創(chuàng)建一個新的數(shù)據(jù)源,以連接到要創(chuàng)建存儲庫的數(shù)據(jù)庫。
B.在要連接的數(shù)據(jù)庫中創(chuàng)建一個新用戶。
C.在存儲庫管理器中創(chuàng)建一個文件夾。
d操作
informatica字符集去哪設(shè)置?
信息與文學(xué)。;的元數(shù)據(jù)(賬號、密碼……)信息保存在Oracle上。
有信息 s啟動腳本startup_ in infa/bin。
3.修改windows host的主機,地址為ceco 3-@ .com Windows system32 driver等。
在文件中添加192.168.68.128 infa,infa是當(dāng)時連接配置的域名,192.168.68.128是informatica服務(wù)器主機的ip地址。
4.配置連接
*網(wǎng)關(guān)主機是我們剛剛修改的c: Windows Syst
為什么建數(shù)據(jù)倉庫需要使用ETL工具?
只要涉及到數(shù)據(jù)源的數(shù)據(jù)抽取,數(shù)據(jù)計算,開發(fā)處理流程,就是ETL,ETL就是在這三個階段:抽取抽取,轉(zhuǎn)換轉(zhuǎn)化,加載。
從不同的數(shù)據(jù)源提取數(shù)據(jù),按照一定的數(shù)據(jù)處理規(guī)則和轉(zhuǎn)換對數(shù)據(jù)進行處理,最后將處理后的數(shù)據(jù)輸出到目標(biāo)數(shù)據(jù)表,目標(biāo)數(shù)據(jù)表可以是文件等。這是裝貨。
更通俗地說,ETL的過程和每個人都是一樣的。;日常烹飪。你需要在菜市場的各個攤位上買到好菜。買回來的時候要挑好,洗干凈,切好一切,最后放鍋里炸熟,端上桌。菜市場的每個攤位都是數(shù)據(jù)源,熟食是最終的輸出結(jié)果。中間所有的過程,比如摘菜、洗菜、切菜、做飯,都是轉(zhuǎn)換。
在開發(fā)的時候,大部分時間會通過ETL工具來實現(xiàn),比如KETTLE、PENTAHO、IBM DATASTAGE、INFORNAICA、微軟SQL SERVER中的SSIS等,整個ETL過程將通過結(jié)合基礎(chǔ)SQL來實現(xiàn)。
也有的是自己通過程序開發(fā),然后控制一些數(shù)據(jù)處理腳本批量運行,基本上就是這個過程了。順序加法SQL實現(xiàn)。
哪種更好還取決于使用場景和開發(fā)者 用那種更舒服。我覺得大部分軟件開發(fā)人員都來自,遇到數(shù)據(jù)項目,會更喜歡用程序來控制批量運行,這是程序思維的自然延續(xù)。大部分純BI開發(fā)人員自然選擇成熟的ETL工具進行開發(fā),當(dāng)然也有一上手就寫程序腳本的。這類BI開發(fā)者的師傅基本都是程序員調(diào)過來的。
使用程序的優(yōu)點是適應(yīng)性和擴展性強,可以集成或反匯編到任何程序處理過程中,有時使用程序效率更高。難點在于對維修人員有一定的技術(shù)要求,經(jīng)驗傳遞和可復(fù)制性不夠。
使用ETL工具的第一個好處是整個ETL開發(fā)過程是可視化的,尤其是在數(shù)據(jù)處理流程的分層設(shè)計上,可以清晰的管理。第二是鏈接不同數(shù)據(jù)源時,各種數(shù)據(jù)源和數(shù)據(jù)庫的鏈接協(xié)議已經(jīng)內(nèi)置,可以直接配置,不需要 不需要寫程序來實現(xiàn)它們。第三,各種轉(zhuǎn)換控件都可以拖拽使用,簡化了SQL的一部分開發(fā),不用寫代碼。第四,可以靈活設(shè)計各種ETL調(diào)度規(guī)則,高度配置,而這不需要通過寫代碼來實現(xiàn)。
因此,在大多數(shù)一般項目中,ETL標(biāo)準(zhǔn)組件開發(fā)會更多地用在項目上。
ETL在邏輯上可以分為兩層,控制流和數(shù)據(jù)流,這也是很多ETL工具的設(shè)計理念,不同的ETL工具可能會有不同的名稱。
控制流是控制每個數(shù)據(jù)流和數(shù)據(jù)流處理的順序,一個控制流可以包含多個數(shù)據(jù)流。比如數(shù)據(jù)倉庫開發(fā)過程中,第一層是ODS層或者Staging層的開發(fā),第二層是維度層的開發(fā),后面幾層是DW事實層和DM數(shù)據(jù)集市層的開發(fā)。通過ETL的調(diào)度管理,可以將這些層串聯(lián)起來,形成一個完整的數(shù)據(jù)處理流程。
數(shù)據(jù)流是從源數(shù)據(jù)到目標(biāo)數(shù)據(jù)表的具體數(shù)據(jù)轉(zhuǎn)換過程,所以有ETL工具調(diào)用數(shù)據(jù)流轉(zhuǎn)換。在數(shù)據(jù)流開發(fā)設(shè)計過程中,主要有三個環(huán)節(jié),目標(biāo)數(shù)據(jù)表的環(huán)節(jié),可以通過ETL控件直接配置。這時候中間轉(zhuǎn)換環(huán)節(jié)可能有很多選擇,比如調(diào)整SQL語句,存儲過程,或者使用ETL控件。
有些項目習(xí)慣于使用ETL控件來實現(xiàn)數(shù)據(jù)流中的轉(zhuǎn)換,有些項目要求使用存儲過程而不是標(biāo)準(zhǔn)的轉(zhuǎn)換組件。還有一些因為數(shù)據(jù)倉庫本身不支持存儲過程,只能用標(biāo)準(zhǔn)SQL實現(xiàn)。
我們平時說的BI數(shù)據(jù)架構(gòu)師,其實指的是ETL的架構(gòu)設(shè)計,也就是整個BI項目。數(shù)據(jù)處理、數(shù)據(jù)清洗和建模都在ETL中實現(xiàn)。一個好的ETL架構(gòu)設(shè)計可以同時支持上百個包,也就是控制流,每個控制流下可能有上百個數(shù)據(jù)流處理過程。我之前寫過一篇技術(shù)文章,你可以搜索一下關(guān)鍵詞BIWORK ETL。你也應(yīng)該在網(wǎng)上找到這篇文章。這個框架設(shè)計不僅僅是ETL框架的設(shè)計,還有ETL項目管理和規(guī)范控制器的深層思考,包括后期運維、基于BI的BI分析、ETL性能調(diào)優(yōu)。因為一個大型BI項目可能需要幾十個人同時開發(fā)ETL,所以框架的頂層設(shè)計非常重要。