5.2.1 屋顶线模型 (Roofline Model):计算绑定 vs 内存绑定 5.2.1 屋顶线模型(Roofline Model):计算绑定 vs 内存绑定 ——一个被反复误读、却总在深夜压垮GPU利用率的幽灵 凌晨两点十七分,你盯着 输出里那行刺眼的 ,而 却像被冻住一样纹丝不动。训练脚本卡在 后的 第三轮, 在涨, 的报告却显示: 高得反常,而 不足峰值的 18%。你心里清楚——这不是显存溢出,不是梯度爆炸,更不是学习率调错了。这是屋顶线模型在敲门,用最冷静的数学,宣告你写的 kernel 正在内存带宽的悬崖边跳踢踏舞。 我们不谈理论推导,不列教科书定义。