6.1.1 轻量级内核与 HPC 专用 Linux 发行版 6.1.1 轻量级内核与 HPC 专用 Linux 发行版:当 遇上 MPI 进程抢占——一个被忽略的 37μs 延迟根源与实时性修复实战 你有没有在千核规模的 MPI 应用中,反复遭遇一种“幽灵延迟”? 不是网络瓶颈,不是内存带宽不足,也不是 CPU 利用率爆表; 而是——在 返回后,紧随其后的计算内核(比如一个 4×4 矩阵乘加微内核)竟要等 37 微秒 才真正开始执行。 这 37μs 不是测量误差,不是时钟抖动,它稳定复现于所有节点的第 3–5 次通信轮次,且仅出现在使用 Slurm + OpenMPI + CentOS Stream 9 的组合下。 更诡异的是:换用 Ubuntu 22.