生成式 AI 初学者指南:第 13 章 - 保护 AI 应用 保护您的AI应用 引言 本课程包括: AI 系统的安全问题。 AI 系统面临的常见风险与威胁。 保障 AI 系统安全的方法与策略。 学习目标 学习完本课程,你将能够: 理解 AI 系统面临的风险与威胁。 掌握保护 AI 系统的常用方法与最佳实践。 了解如何通过安全测试预防意外事件和维护用户信任。 生成式 AI 中的安全是什么意思? 随着人工智能(AI)和机器学习(ML)技术越来越多地影响我们的生活,保护客户数据和 AI 系统本身变得尤为重要。AI/ML 在决策支持方面的应用越来越广泛,一旦决策出错,可能会带来严重的后果。 需要关注的关键点包括: AI/ML 的影响:AI/ML 对我们生活的深远影响使得保护它们变得非常重要。
本课程包括:
学习完本课程,你将能够:
随着人工智能(AI)和机器学习(ML)技术越来越多地影响我们的生活,保护客户数据和 AI 系统本身变得尤为重要。AI/ML 在决策支持方面的应用越来越广泛,一旦决策出错,可能会带来严重的后果。
需要关注的关键点包括:
此外,机器学习模型往往无法区分恶意输入和异常数据。大量训练数据来自于未经筛选、未经审查的公开数据集,任何第三方都可以贡献内容。攻击者可以轻松贡献数据而不必直接篡改数据集。随着时间的推移,如果数据格式正确,即便是低可信度的恶意数据也可能变成高可信度的数据。
因此,确保模型决策依赖的数据存储的完整性和安全至关重要。
目前,数据污染是 AI 及相关系统面临的最大安全威胁。数据污染是指有意修改训练 AI 所用的数据,从而导致 AI 犯错。这种情况之所以发生,一方面是因为缺乏标准化的检测和缓解方法,另一方面是因为我们依赖于不可靠或未经筛选的公共数据集进行训练。跟踪数据的来源和血统,以维护数据完整性并防止训练过程出错,显得尤为重要。否则,就会出现“垃圾进,垃圾出”的情况,最终影响模型的性能。
数据污染对模型的影响示例包括:
MITRE 公司创建了ATLAS(Adversarial Threat Landscape for Artificial-Intelligence Systems),一个记录对手在真实攻击 AI 系统中使用的策略和技术的知识库。
随着 AI 技术的融合,AI 系统的漏洞数量增加,这超出了传统网络攻击的范畴。我们开发 ATLAS 的目的是提高对这些独特且不断演变的漏洞的认识,因为全球社区越来越多地将 AI 纳入各种系统中。ATLAS 参照 MITRE ATT&CK® 框架建立,其策略、技术和程序(TTPs)与 ATT&CK 中的内容相辅相成。
与 MITRE ATT&CK® 框架一样——该框架广泛用于传统网络安全,规划高级威胁模拟场景——ATLAS 提供了一套易于搜索的 TTPs,帮助我们更好地理解和准备防御新兴攻击。
Open Web Application Security Project (OWASP)还创建了一个“前十大漏洞列表”,列出了利用大型语言模型(LLMs)的应用程序中最关键的漏洞。列表强调了包括数据污染在内的威胁风险,以及其他风险,例如:
Microsoft Cloud Advocate Rod Trent 撰写的免费电子书必须学习的 AI 安全深入探讨了这些和其他新兴 AI 威胁,并提供了广泛的指导,以应对这些挑战。
人工智能(AI)正在改变各种领域和行业,为社会带来新的可能性和好处。然而,AI 也带来了数据隐私、偏见、缺乏可解释性和潜在滥用等重大挑战和风险。因此,确保 AI 系统的安全性和责任感至关重要,这意味着它们需要遵守道德和法律标准,并获得用户和利益相关者的信任。
安全测试是通过识别和利用它们的漏洞来评估 AI 系统或大型语言模型的安全性的过程。这项测试可以由开发者、用户或第三方审计员根据测试的目的和范围进行。AI 系统和大型语言模型的一些常见安全测试方法包括:
OpenAI 作为 AI 系统的领先者,建立了一系列安全评估作为其红队网络计划的一部分,旨在测试 AI 系统的输出,希望为 AI 安全做出贡献。
评估可以从简单的问答测试到更复杂的模拟。以下是一些 OpenAI 开发的样本评估,用于从多个角度评估 AI 行为的具体示例:
我们的目标是保护 AI 系统免受恶意攻击、滥用或意外后果的影响。这包括采取措施确保 AI 系统的安全、可靠性和可信度,例如:
AI 安全对于确保 AI 系统和数据的完整性、可用性和机密性至关重要。AI 安全的挑战和机遇包括:
LLMs 可能对它们使用的数据的隐私和安全构成风险。例如,LLMs 可能会记住并泄露其训练数据中的敏感信息,如个人姓名、地址、密码或信用卡号码。它们还可能被恶意行为者操纵或攻击,这些人想要利用它们的漏洞或偏见。因此,了解这些风险并采取适当措施保护 LLMs 使用的数据很重要。您可以采取几个步骤来保护与 LLMs 一起使用的数据。这些步骤包括:
数据安全、治理和合规对于任何希望在多云环境中利用数据和 AI 的力量的组织至关重要。保护和治理您的所有数据是一项复杂和多方面的任务。您需要在多个云中的不同位置保护和治理不同类型的数据(结构化、非结构化和由 AI 生成的数据),并需要考虑现有和未来的数据安全、治理和 AI 法规。为了保护您的数据,您需要采取一些最佳实践和预防措施,例如:
模拟现实世界威胁现在被认为是构建弹性 AI 系统的标准实践,通过采用类似的工具、策略、程序来识别系统的风险并测试防御者的响应。
AI 红队的实践已经演变为具有更广泛的含义:它不仅涵盖了探测安全漏洞,还包括探测其他系统故障,如生成可能有害的内容。AI 系统带来了新的风险,而红队是理解这些新风险的核心,如提示注入和产生不切实际的内容。- Microsoft AI 红队构建更安全的 AI 未来
以下是塑造 Microsoft AI 红队计划的关键洞察。
AI 红队并非包罗万象,应被视为补充其他控制措施,如基于角色的访问控制(RBAC)和全面的数据管理解决方案。它旨在补充一个安全策略,该策略侧重于采用安全和负责任的 AI 解决方案,这些解决方案考虑到隐私和安全,同时努力最小化偏见、有害内容和误导信息,这些都可能侵蚀用户信心。
以下是一些可以帮助您更好地了解红队如何帮助识别和缓解 AI 系统中的风险的额外阅读材料:
维护数据完整性和防止滥用的有效方法是什么?
答案:1,虽然所有这三个建议都很有价值,但确保正确分配用户数据访问权限将大大减少通过 LLMs 操纵和误解数据的风险。
探索更多关于如何在 AI 时代管理和保护敏感信息的方法。
完成本课程后,请继续探索我们的生成式 AI 学习系列,以进一步提高你的生成式 AI 技能!
下一站,第 14 课:生成式 AI 应用生命周期!