hadoop是做什么的 hbase和hive的差別是什么,各自適用在什么場景中?
hbase和hive的差別是什么,各自適用在什么場景中? 1. HBase:基于Hadoop數(shù)據(jù)庫,是NoSQL數(shù)據(jù)庫;HBase表是物理表,適合存儲非結(jié)構(gòu)化數(shù)據(jù)。2. Hive:它不存儲數(shù)據(jù),而是依
hbase和hive的差別是什么,各自適用在什么場景中?
1. HBase:基于Hadoop數(shù)據(jù)庫,是NoSQL數(shù)據(jù)庫;HBase表是物理表,適合存儲非結(jié)構(gòu)化數(shù)據(jù)。
2. Hive:它不存儲數(shù)據(jù),而是依賴HDFS和MapReduce,通過SQL計(jì)算和處理HDFS上的結(jié)構(gòu)化數(shù)據(jù);Hive中的表是純邏輯表。
這兩者通常一起使用。
1. HBase:實(shí)時(shí)隨機(jī)查詢海量詳細(xì)數(shù)據(jù),存儲采集到的web數(shù)據(jù);
2。配置單元:適用于離線批量數(shù)據(jù)計(jì)算,一般用于查詢分析和統(tǒng)計(jì)。
hive和oracle區(qū)別?
Oracle是一個(gè)數(shù)據(jù)庫,而hive是一個(gè)數(shù)據(jù)倉庫。它們之間最大的區(qū)別在于存儲和計(jì)算。Oracle數(shù)據(jù)庫支持存儲和計(jì)算,hive是一個(gè)基于Hadoop的數(shù)據(jù)倉庫工具。Hive本身沒有存儲和計(jì)算能力,完全依賴HDFS和MapReduce進(jìn)行分布式存儲和并行計(jì)算。通過將Oracle/MySQL等數(shù)據(jù)庫中的表映射到HIV上,利用HQL語句對表數(shù)據(jù)進(jìn)行添加、刪除、修改和查詢,本質(zhì)上就是將HQL語句轉(zhuǎn)換成MapReduce程序運(yùn)行。
依靠MapReduce本身進(jìn)行計(jì)算,內(nèi)置的計(jì)算能力不支持?jǐn)?shù)據(jù)更新,支持?jǐn)?shù)據(jù)更新處理,大數(shù)據(jù)量規(guī)模大、執(zhí)行延遲大、數(shù)據(jù)規(guī)模小、執(zhí)行延遲小,依靠HDFS存儲和分布式大容量存儲,存儲容量有限,可擴(kuò)展性強(qiáng)。它不支持非插件情況下的事務(wù),可擴(kuò)展性較差。它支持事務(wù)和復(fù)雜索引。它不能訪問web前端進(jìn)行顯示,但可以訪問前端web進(jìn)行顯示