hadoop是做什么的 hadoop是怎么存儲(chǔ)大數(shù)據(jù)的?
hadoop是怎么存儲(chǔ)大數(shù)據(jù)的?Hadoop本身就是一個(gè)分布式框架。在Hadoop框架下,我們需要配合HBase、hive等工具進(jìn)行大數(shù)據(jù)計(jì)算。如果你想了解更多關(guān)于HDFS,map/reduce,任務(wù)
hadoop是怎么存儲(chǔ)大數(shù)據(jù)的?
Hadoop本身就是一個(gè)分布式框架。在Hadoop框架下,我們需要配合HBase、hive等工具進(jìn)行大數(shù)據(jù)計(jì)算。如果你想了解更多關(guān)于HDFS,map/reduce,任務(wù)機(jī)制等等。如果你想分析,你需要考慮其他的分析工具。大數(shù)據(jù)只有通過(guò)分析才有價(jià)值。用于分析大數(shù)據(jù)的工具主要包括開(kāi)源和商業(yè)生態(tài)圈。開(kāi)源大數(shù)據(jù)生態(tài)系統(tǒng):1。Hadoop HDFS、Hadoop MapReduce、HBase、hive逐漸誕生,早期的Hadoop生態(tài)系統(tǒng)逐漸形成。
2. Hypertable是另一種選擇。它存在于Hadoop生態(tài)系統(tǒng)之外,但也有一些用戶。
3. NoSQL、Membase、mongodb業(yè)務(wù)大數(shù)據(jù)生態(tài)系統(tǒng):1。一體式數(shù)據(jù)庫(kù)/數(shù)據(jù)倉(cāng)庫(kù):IBMpureData(netezza)、Oracle exadata、SAP Hana等2。數(shù)據(jù)倉(cāng)庫(kù):Teradata、asterdata、EMC Greenplum、hpvertica等3。數(shù)據(jù)集市:中國(guó)的qlikview、tableau和永紅數(shù)據(jù)集市。