2.3.2.1 序列紧致与覆盖紧致 2.3.2.1 序列紧致与覆盖紧致:当你的梯度下降在Banach空间里“迷路”了——一个被忽略的收敛性断点排查实录 凌晨两点十七分,监控告警第三次亮起。不是GPU显存溢出,不是CUDA kernel timeout,也不是梯度爆炸的NaN洪流——而是一组看似健康的训练指标:loss稳定下降、accuracy缓慢爬升、gradnorm保持在$10^{-2}$量级……可验证集AUC却卡死在0.731,连续12个epoch纹丝不动。模型没崩,但也没活。它像一具呼吸尚存、意识全无的躯体,在高维参数空间里原地踏步。 这是我在某金融风控模型迭代中亲历的真实故障。