2.2 HDFS 数据存储与管理 第二章:Hadoop 分布式文件系统 HDFS (Hadoop Distributed File System) 2.2 HDFS 数据存储与管理 2.2.1 HDFS 数据存储核心概念 理解 HDFS 的数据存储与管理,首先需要掌握几个核心概念: 数据块 (Block): HDFS 并非将整个文件存储在一个节点上,而是将文件分割成多个固定大小的数据块 (Block) 进行存储。默认情况下,HDFS 的块大小为 128MB (Hadoop 2.x 及更高版本)。将文件分割成块有以下优势: 简化数据管理: 数据块是 HDFS 存储和管理的最小单元。管理固定大小的块比管理大小不一的文件更简单高效。