2.1.3 专用加速器 (ASIC/FPGA) 在 HPC 中的崛起


文档摘要

2.1.3 专用加速器 (ASIC/FPGA) 在 HPC 中的崛起 2.1.3 专用加速器(ASIC/FPGA)在 HPC 中的崛起:当 FPGA 不再是“可编程逻辑”,而是 HPC 数据通路里那根被磨亮的钢针 你有没有见过这样的场景? 一个 512 节点的 MPI 集群,运行着优化到极致的 OpenMP+AVX-512 版本的 Lattice QCD 模拟,在双精度浮点下吞吐逼近理论峰值——结果瓶颈既不在 CPU、不在内存带宽、甚至不在 InfiniBand 网络延迟,而卡在主机 PCIe 总线与加速卡之间那条 16x Gen4 的物理通道上。 数据像被挤进漏斗的沙粒:CPU 把 256MB 的格点场打包好,发往 FPGA;


发布者: 作者: 转发
评论区 (0)
U