什么是大數(shù)據(jù) hadoop中一個大文件,在hdfs中是如何存儲的?
hadoop中一個大文件,在hdfs中是如何存儲的?文件是按照塊來存儲的,比如配置的每塊大小為64M,那么5G的文件,會分成5*1024/64=80塊,每個塊會在不同節(jié)點上存多份。你上面說的依次寫入d
hadoop中一個大文件,在hdfs中是如何存儲的?
文件是按照塊來存儲的,比如配置的每塊大小為64M,那么5G的文件,會分成5*1024/64=80塊,每個塊會在不同節(jié)點上存多份。你上面說的依次寫入datanode,是指將每個塊依次寫入。讀取的時候,也是一塊一塊來讀的,當然,這些都已經(jīng)被HDFS的客戶端封裝好了,你看到就是在讀一個文件。