5.1.1 采样与追踪工具 (Score-P, Tau, Vampir)


文档摘要

5.1.1 采样与追踪工具 (Score-P, Tau, Vampir) 5.1.1 采样与追踪工具(Score-P, Tau, Vampir):当 MPIAllreduce 耗时飙升 37 倍,却在 Vampir 时间轴上“隐身”——一个关于 MPI 隐式同步泄漏 的实战诊断与根治方案 你有没有遇到过这样的场景? 在一台 128 节点、每节点 4 GPU 的异构集群上运行一个中等规模的流体模拟代码(基于 OpenFOAM + custom MPI+OpenMP 混合并行),性能监测显示整体强扩展效率在 64 节点后断崖式下跌——从 92% 暴跌至 31%。 显示 平均耗时从 0.8 ms 跃升至 29.6 ms; 却提示 L3 缓存未命中率仅微增 0.7%,分支预测失败率几乎不变。


发布者: 作者: 转发
评论区 (0)
U