什么是批處理 hive和hbase有什么區(qū)別?
hive和hbase有什么區(qū)別?共同點:1.hbase與hive都是架構(gòu)在hadoop之上的。都是用hadoop作為底層存儲區(qū)別:2.Hive是建立在Hadoop之上為了減少MapReduce job
hive和hbase有什么區(qū)別?
共同點:
1.hbase與hive都是架構(gòu)在hadoop之上的。都是用hadoop作為底層存儲區(qū)別:
2.Hive是建立在Hadoop之上為了減少MapReduce jobs編寫工作的批處理系統(tǒng),HBase是為了支持彌補Hadoop對實時操作的缺陷的項目 。
3.想象你在操作RMDB數(shù)據(jù)庫,如果是全表掃描,就用Hive Hadoop,如果是索引訪問,就用HBase Hadoop 。
4.Hive query就是MapReduce jobs可以從5分鐘到數(shù)小時不止,HBase是非常高效的,肯定比Hive高效的多。
5.Hive本身不存儲和計算數(shù)據(jù),它完全依賴于HDFS和MapReduce,Hive中的表純邏輯。
6.hive借用hadoop的MapReduce來完成一些hive中的命令的執(zhí)行7.hbase是物理表,不是邏輯表,提供一個超大的內(nèi)存hash表,搜索引擎通過它來存儲索引,方便查詢操作。8.hbase是列存儲。9.hdfs作為底層存儲,hdfs是存放文件的系統(tǒng),而Hbase負責組織文件。10.hive需要用到hdfs存儲文件,需要用到MapReduce計算框架。