5.2.1 鲁棒性-准确性权衡 5.2.1 鲁棒性-准确性权衡:从PGD对抗训练的梯度裁剪陷阱说起 在深度学习模型部署的真实战场上,我们常常陷入一种两难境地:模型在干净数据上表现卓越,准确率高得令人满意;可一旦面对精心构造的对抗样本,哪怕扰动微乎其微,模型也会瞬间“失明”,输出荒谬结论。这种脆弱性不仅威胁自动驾驶、医疗诊断等高风险场景的安全边界,更暴露出一个根本矛盾——模型的准确性与鲁棒性之间存在深刻的权衡(robustness-accuracy trade-off)。 许多工程师尝试通过对抗训练(Adversarial Training, AT)来提升模型鲁棒性,其中Projected Gradient Descent(PGD)因其理论严谨性和实践有效性成为主流选择。