3.4.2 领域特定语言 (DSL) 在 HPC 中的应用


文档摘要

3.4.2 领域特定语言 (DSL) 在 HPC 中的应用 3.4.2 领域特定语言(DSL)在 HPC 中的应用:当 stencil 编译器撞上 NUMA 拓扑——一个真实发生的 3.7× 性能退化与 DSL 层面的修复路径 你有没有试过,把一段在单节点、双路 CPU 上跑得飞快的 stencil DSL 代码,原封不动地部署到一台 4 插槽、128 核、8 内存控制器的 AMD EPYC 服务器上,结果性能反而掉了近四成?不是编译器没开优化,不是 MPI 没配对,甚至不是 OpenMP 线程绑核错了——而是你的 DSL 编译器,根本“看不见” NUMA 域的物理边界。 这不是理论推演。这是去年我们在为某气象中心重构一套基于 + 自研 DSL 的微物理过程求解器时,踩进的一个深坑。


发布者: 作者: 转发
评论区 (0)
U