【Hadoop】Hudi 基礎知識詳解
Apache Hudi將核心倉庫和數據庫功能直接帶到數據湖中。Hudi提供了表、事務(wù)、高效upserts/刪除、高級索引、流式攝取服務(wù)、數據群集/壓縮優(yōu)化以及并發(fā),同時(shí)保持數據以開(kāi)源文件格式保留。 Hudi是Hadoop Upserts and Incrementals縮寫(xiě),用于管理分布式文件系統DFS上大型分析數據集存儲。 Hudi是一種針對分析型業(yè)務(wù)的、掃描優(yōu)化的數據存儲抽象,它能夠使DFS數據集在分鐘級的時(shí)延內支持變更,也支持下游系統對這個(gè)數據集的增量處理。