etl工具有哪些 為什么建數(shù)據(jù)倉(cāng)庫(kù)需要使用ETL工具?
為什么建數(shù)據(jù)倉(cāng)庫(kù)需要使用ETL工具?數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)戰(zhàn)略集合,為各級(jí)決策過(guò)程提供各種數(shù)據(jù)支持。它是為分析報(bào)告和決策支持目的而創(chuàng)建的單個(gè)數(shù)據(jù)存儲(chǔ)。由于要獲取所有的數(shù)據(jù),必然涉及到多系統(tǒng)、多類型數(shù)據(jù)庫(kù)的對(duì)接
為什么建數(shù)據(jù)倉(cāng)庫(kù)需要使用ETL工具?
數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)戰(zhàn)略集合,為各級(jí)決策過(guò)程提供各種數(shù)據(jù)支持。它是為分析報(bào)告和決策支持目的而創(chuàng)建的單個(gè)數(shù)據(jù)存儲(chǔ)。由于要獲取所有的數(shù)據(jù),必然涉及到多系統(tǒng)、多類型數(shù)據(jù)庫(kù)的對(duì)接問(wèn)題,以及數(shù)據(jù)的提取和整理問(wèn)題。
此時(shí),ETL工具的功能體現(xiàn)在數(shù)據(jù)提取、轉(zhuǎn)換和加載的過(guò)程中,直至用于人們的分析。ETL是數(shù)據(jù)抽取、轉(zhuǎn)換和加載的過(guò)程。
在某些地方,可以先在轉(zhuǎn)換中選擇和加載ELT。對(duì)于日志倉(cāng)庫(kù),ETL首先要考慮業(yè)務(wù)需求,最后數(shù)據(jù)登陸模型要體現(xiàn)一定的主題。
一般來(lái)說(shuō),數(shù)據(jù)倉(cāng)庫(kù)就像一個(gè)大的池。水池的供水需要水泵和水管,ETL負(fù)責(zé)水泵和水管的功能。
ETL工具,Kettle和DataStage各自有什么優(yōu)缺點(diǎn),目前哪個(gè)更流行一些?
沒(méi)有流程管理。當(dāng)表被鎖定時(shí),不容易找出原因,無(wú)法終止進(jìn)程,無(wú)法控制最大進(jìn)程數(shù)。
2. 數(shù)據(jù)抽取不能自動(dòng)分包,也沒(méi)有像ABAP這樣高效的查詢語(yǔ)句,比如select from。。所有入口都在。。大數(shù)據(jù)處理速度很慢,大量數(shù)據(jù)的日常處理無(wú)法完成。
3. 無(wú)法自動(dòng)處理指定字段的增量。
4. 無(wú)法調(diào)試,調(diào)試將不提取數(shù)據(jù)。
5. 在計(jì)劃處理鏈中指定命令非常麻煩。沒(méi)有接口操作。處理鏈中有錯(cuò)誤。無(wú)法繼續(xù)運(yùn)行或跳過(guò)處理。
6. 無(wú)法記錄每個(gè)處理詳細(xì)信息并記錄處理時(shí)間。
7. 無(wú)法共享字段。字段不關(guān)聯(lián)本位幣單位,沒(méi)有基礎(chǔ)資料字段的概念。
8. 沒(méi)有包處理的概念,沒(méi)有日志處理。
9. 沒(méi)有版本控制,聯(lián)機(jī)不是傳輸。
10. 另外,沒(méi)有外部發(fā)布WS、OData接口函數(shù)
更不用說(shuō)報(bào)表函數(shù),權(quán)限控制功能不強(qiáng),底層數(shù)據(jù)庫(kù)也不是多維信息立方體結(jié)構(gòu),字段也不區(qū)分指標(biāo)和特征。。。。。