hadoop怎么使用 在大數(shù)據(jù)平臺hadoop可以做哪些應(yīng)用?
在大數(shù)據(jù)平臺hadoop可以做哪些應(yīng)用?Hadoop是一個適合大數(shù)據(jù)的分布式存儲和處理平臺。這是一個開源框架1。搜索引擎(Hadoop的初衷是快速索引大型網(wǎng)頁)。2. 大數(shù)據(jù)存儲,利用Hadoop的分
在大數(shù)據(jù)平臺hadoop可以做哪些應(yīng)用?
Hadoop是一個適合大數(shù)據(jù)的分布式存儲和處理平臺。這是一個開源框架
1。搜索引擎(Hadoop的初衷是快速索引大型網(wǎng)頁)。
2. 大數(shù)據(jù)存儲,利用Hadoop的分布式存儲能力,如數(shù)據(jù)備份、數(shù)據(jù)倉庫等。
3. 大數(shù)據(jù)處理,利用Hadoop的分布式處理能力,如數(shù)據(jù)挖掘、數(shù)據(jù)分析等。
4. Hadoop是一個分布式開源框架,對分布式計算有很大的參考價值。應(yīng)用:例如日志處理、用戶分段特征建模、個性化設(shè)計
1。儲存。
IBM似乎剛剛推出了一項存儲計劃。這樣讀寫速度更快,容錯性高。同時,一般機器可以用于橫向擴展,不需要主機等高性能機器。2Web索引數(shù)據(jù)庫。Hadoop似乎在搜索領(lǐng)域得到了廣泛的應(yīng)用。據(jù)估計,蝙蝠在中國使用,雅虎是國外的典型。三。日志分析。與日志分析類似,數(shù)據(jù)挖掘的應(yīng)用也越來越多。4產(chǎn)品推薦。亞馬遜用于產(chǎn)品推薦的協(xié)同過濾,個性化的廣告推送也應(yīng)該屬于這一類。5垃圾郵件識別和過濾。