1.2 Hadoop核心概念 1.2 Hadoop核心概念 1.2.1 Hadoop分布式文件系统 (HDFS) Hadoop分布式文件系统(HDFS)是Hadoop的核心组件之一,它是一个设计用于在廉价硬件上运行的分布式文件系统。HDFS具有高容错性、高吞吐量和高扩展性等特点,使其成为存储和处理大规模数据集的理想选择。 HDFS架构 HDFS采用主/从(Master/Slave)架构,主要由以下几个核心组件构成: NameNode(NN): NameNode是HDFS的“大脑”,负责管理文件系统的命名空间和元数据。元数据包括文件和目录的结构、文件的块信息(块ID、块的位置等)以及访问权限等。