hive怎么向表里插數(shù)據(jù) pyspark怎么把數(shù)據(jù)插入hive表?
pyspark怎么把數(shù)據(jù)插入hive表?您首先了解數(shù)據(jù)倉庫的作用—存儲(chǔ)歷史數(shù)據(jù)—然后分析數(shù)據(jù),只提供查詢—不提供修改1。Hive的目標(biāo)是構(gòu)建數(shù)據(jù)倉庫,因此它提供SQL和文件表映射。因?yàn)閔ive是基于H
pyspark怎么把數(shù)據(jù)插入hive表?
您首先了解數(shù)據(jù)倉庫的作用—存儲(chǔ)歷史數(shù)據(jù)—然后分析數(shù)據(jù),只提供查詢—不提供修改1。Hive的目標(biāo)是構(gòu)建數(shù)據(jù)倉庫,因此它提供SQL和文件表映射。因?yàn)閔ive是基于HDFS的,所以它不提供updatepspark。如何將數(shù)據(jù)插入配置單元表
兩種方法:一種是創(chuàng)建配置單元和HBase共享的表。這樣,可以使用hive來操作HBase表,但插入數(shù)據(jù)的速度很慢。不建議這樣做。
2、手寫MapReduce,將hive中的數(shù)據(jù)轉(zhuǎn)換成hfile,然后倒入。HBase的MapReduce接口中似乎有一個(gè)對(duì)應(yīng)的API可以直接導(dǎo)入。