4.2.3 稀疏矩阵运算与迭代求解器 (Krylov 子空间法) 4.2.3 稀疏矩阵运算与迭代求解器(Krylov 子空间法): ——当 CG 迭代在 GPU 上“卡”在第 17 步:一个关于预条件子内存布局与访存冲突的真实故障复盘 你有没有遇到过这样的场景? 凌晨两点,集群监控面板上,GPU 利用率曲线像一条被钉死的水平线——稳定在 12%;而 CPU 却在狂飙,NVLink 带宽利用率跌至 8%;日志里反复刷出同一行: …… 连续 43 次迭代,残差纹丝不动。不是发散,不是崩溃,是凝固。 这不是数值不稳定,不是收敛阈值设得太紧,更不是算法选错了——这是 Krylov 方法在异构平台落地时最隐蔽、最顽固的“慢性病”:预条件子施加阶段的非对齐访存与结构化稀疏模式失配。