2.4 并行 I/O 与存储系统 在超算中心的凌晨三点,机房里风扇的低频嗡鸣是唯一背景音。此时,一台搭载 128 个计算节点、每节点 4×A100 GPU 的集群正全力运行一个 10TB 级气候模拟任务——而它的 I/O 子系统,正以每秒 7.2 GB 的持续带宽,将 32 个并行进程写入的 NetCDF-4 文件流,均匀分发至底层 Lustre 文件系统的 24 个 OST(Object Storage Target)上。这不是吞吐量的炫技,而是一场精密的协同:是元数据锁粒度的毫秒级调度,是客户端缓存策略与 OST 写缓冲区的动态对齐,是 HDF5 的 与 MPI-IO 的 在字节偏移层面的无声握手。 这,就是并行 I/O 的真实切面——它从不喧哗,却决定着千万核心是否真正“并行”;