2.2 攻击类型分类 2.2 攻击类型分类 在机器学习模型日益成为数字系统核心组件的今天,对抗攻击早已不再是实验室里的理论奇观,而是真实世界中亟待防御的现实威胁。从金融风控模型被精心构造的交易绕过,到自动驾驶感知系统因贴纸误导而误判交通标志,再到人脸识别系统在微小扰动下将陌生人识别为授权用户——这些场景背后,是不同类型的对抗攻击在发挥作用。理解这些攻击的实现机制、技术路径与操作细节,是构建鲁棒AI系统的第一步。 本文将深入剖析四类主流对抗攻击:逃避攻击(Evasion Attacks)、投毒攻击(Poisoning Attacks)、后门攻击(Backdoor Attacks)以及模型窃取与逆向工程(Model Extraction and Inversion)。