【Hadoop】HDFS 詳解
簡(jiǎn)介 Namenode 和 Datanode HDFS采用master/slave架構。一個(gè)HDFS集群是由一個(gè)Namenode和一定數目的Datanodes組成。 Namenode是一個(gè)中心服務(wù)器,負責管理文件系統的名字空間(namespace)以及客戶(hù)端對文件的訪(fǎng)問(wèn)。 集群中的Datanode一般是一個(gè)節點(diǎn)一個(gè),負責管理它所在節點(diǎn)上的存儲。 HDFS暴露了文件系統的名字空間,用戶(hù)能夠以文件的形式在上面存儲數據。 從內部看,一個(gè)文件其實(shí)被分成一個(gè)或多個(gè)數據塊,這些塊存儲在一組Datanode上。 Namenode執行文件系統的名字空間操作,比如打開(kāi)、關(guān)閉、重命名文件或目錄。它也負責確定數據塊到具體Datanode節點(diǎn)的映射。 Datanode負責處理文件系統客戶(hù)端的讀寫(xiě)請求。在Namenode的統一調度下進(jìn)行數據塊的創(chuàng )建、刪除和復制。 Namenode是所有HDFS元數據的仲裁者和管理者,這樣,用戶(hù)數據永遠不會(huì )流過(guò)Namenode。 Namenode全權管理數據塊的復制,它周期性地從集群中的每個(gè)Datanode接收心跳信號和塊狀態(tài)報告(Blockreport)。 接收到心跳信號意味....