5.2.1 鲁棒性-准确性权衡

文档摘要

5.2.1 鲁棒性-准确性权衡 5.2.1 鲁棒性-准确性权衡：从PGD对抗训练的梯度裁剪陷阱说起在深度学习模型部署的真实战场上，我们常常陷入一种两难境地：模型在干净数据上表现卓越，准确率高得令人满意；可一旦面对精心构造的对抗样本，哪怕扰动微乎其微，模型也会瞬间“失明”，输出荒谬结论。这种脆弱性不仅威胁自动驾驶、医疗诊断等高风险场景的安全边界，更暴露出一个根本矛盾——模型的准确性与鲁棒性之间存在深刻的权衡（robustness-accuracy trade-off）。许多工程师尝试通过对抗训练（Adversarial Training, AT）来提升模型鲁棒性，其中Projected Gradient Descent（PGD）因其理论严谨性和实践有效性成为主流选择。