hive是基于hadoop的一個 HBase和oracle,Hadoop的區(qū)別?
HBase和oracle,Hadoop的區(qū)別?Hadoop的HDFS支持海量數(shù)據(jù)存儲,MapReduce支持海量數(shù)據(jù)的分布式處理。Oracle雖然可以構(gòu)建集群,但當(dāng)數(shù)據(jù)量達到一定限制時,查詢處理速度會
HBase和oracle,Hadoop的區(qū)別?
Hadoop的HDFS支持海量數(shù)據(jù)存儲,MapReduce支持海量數(shù)據(jù)的分布式處理。Oracle雖然可以構(gòu)建集群,但當(dāng)數(shù)據(jù)量達到一定限制時,查詢處理速度會變得非常慢,對機器性能的要求也非常高。其實,這兩件事是不一樣的。Hadoop是一種分布式云處理架構(gòu),傾向于數(shù)據(jù)計算Oracle是一種關(guān)系數(shù)據(jù)庫,傾向于存儲數(shù)據(jù)。為了比較,我們可以將HBase與Oracle進行比較。HBase是NoSQL數(shù)據(jù)庫,支持海量數(shù)據(jù)存儲和列擴展。但是查詢操作比較復(fù)雜,不像Oracle關(guān)系數(shù)據(jù)庫那么簡單,只支持一個索引。但是,在HBase中設(shè)置合理的表結(jié)構(gòu)的情況下,查詢速度與數(shù)據(jù)量關(guān)系不大,即數(shù)據(jù)量不會影響查詢速度,順便說一下,HBase的查詢速度可以達到ms級
這兩者是相互獨立的。MapReduce是Hadoop的計算組件;HBase是基于Hadoop HDFS的分布式NoSQL數(shù)據(jù)庫
~]:
1。HBase:基于Hadoop數(shù)據(jù)庫,是NoSQL數(shù)據(jù)庫;HBase表是物理表,適合存儲非結(jié)構(gòu)化數(shù)據(jù)。
2. Hive:它不存儲數(shù)據(jù),而是依賴HDFS和MapReduce,通過SQL計算和處理HDFS上的結(jié)構(gòu)化數(shù)據(jù);Hive中的表是純邏輯表。
這兩者通常一起使用。
1. HBase:實時隨機查詢海量詳細數(shù)據(jù),存儲采集到的web數(shù)據(jù);
2。配置單元:適用于離線批量數(shù)據(jù)計算,一般用于查詢分析和統(tǒng)計。