6.1.3.1 矢量长度无关编程


文档摘要

6.1.3.1 矢量长度无关编程 当你的 SVE 代码在 A64FX 上跑得飞快,却在 Neoverse V2 上段错误——一个被 欺骗了三年的矢量长度无关真相 你写了一段漂亮的 SVE 汇编:用 加载、 累加、 存储,所有谓词都来自 ,循环体里没硬编码任何 、 或 ——你甚至在函数入口处加了注释:“✅ VL-agnostic: works at any runtime SVE vector length”。 你自信地提交 PR,CI 在 下全绿。 然后 QA 在一台搭载 Neoverse V2(VL=256) 的服务器上运行,程序在第 7 次迭代时 ;而开发机是 Fujitsu A64FX(VL=2048),它不仅不崩,还比标量快 8.3 倍。 没人报 bug。


发布者: 作者: 转发
评论区 (0)
U