1.1.3 关键术语:对抗样本、鲁棒性、可信AI、可解释性 1.1.3 关键术语:对抗样本、鲁棒性、可信AI、可解释性 —— 从一次模型“被欺骗”说起 深夜,运维告警系统突然弹出一条异常:某金融风控模型在生产环境中的误判率陡增300%。日志显示,一批看似完全正常的用户申请——信用评分高、收入稳定、无逾期记录——却被系统判定为“高风险”。更诡异的是,这些样本在测试集上从未出现过类似问题。工程师们迅速拉取原始数据,用可视化工具逐层分析,最终发现:这些“正常”样本的像素值被人为添加了肉眼不可见的微小扰动。它们不是真实用户,而是精心构造的对抗样本(Adversarial Examples)。 这不是科幻电影,而是每天都在发生的现实。