2.1.3.3 基于强化学习的攻击


文档摘要

2.1.3.3 基于强化学习的攻击 2.1.3.3 基于强化学习的攻击:如何在黑盒场景下高效生成对抗样本? 在黑盒攻击的疆域中,攻击者如同蒙眼行走在迷宫之中——看不见模型内部结构,却仍需精准地找到通往“误导”的路径。传统基于梯度估计的方法(如ZOO、NES)虽能完成任务,但计算成本高、收敛慢,尤其在面对高维输入(如图像)时,往往需要成千上万次查询才能生成一个有效对抗样本。这在现实攻防中是不可接受的:目标API有调用频率限制,预算有限,时间紧迫。 于是,强化学习(Reinforcement Learning, RL)被引入黑盒攻击领域,试图将“生成对抗扰动”建模为一个序贯决策问题。然而,理论很美,落地却充满荆棘。


发布者: 作者: 转发
评论区 (0)
U