开源AI应用安全指导框架 — OWASP AI Exchange

2024年1月24日15:30:11评论107 views字数 2073阅读6分54秒阅读模式

在当今信息化迅猛发展的时代，网络专业人士正竞相提升人工智能（AI）安全领域的专业技能。随着这一趋势的推进，他们的企业也在快速地引入各类AI工具、平台、应用程序和服务，业界也相应涌现出众多资源，以协助从业者适应这一不断变化的环境。

在此背景下，开放全球应用程序安全项目（OWASP）的AI Exchange成为了其中最具价值的资源之一。OWASP正越来越多地被视为AI安全知识的权威来源，其2023年发布的OWASP LLM Top 10便是最早的体系化AI安全风险列表，该列表详述了大型语言模型（LLM）系统的十大潜在风险，并提供了相应的风险缓解策略。

而最新推出的OWASP AI Exchange是一项开源协作项目，它致力于推动全球AI安全标准、法规和知识的进步与共享。该项目覆盖了AI领域的诸多关键方面，包括主要威胁、漏洞和控制措施。

由于全文较长，这里仅抽取了部分内容供大家简要了解，详细了解可查看原项目：https://github.com/OWASP/www-project-ai-security-and-privacy-guide/blob/main/owaspaiexchange.md

AI安全威胁及控制导航

下面的导航图显示了所有威胁、控制措施及其关联方式，包括风险和控制措施类型。

开源AI应用安全指导框架 — OWASP AI Exchange

下面的 AI 安全矩阵显示了所有威胁和风险，并按攻击面和生命周期排序。

开源AI应用安全指导框架 — OWASP AI Exchange

下图形象的展示了AI面临的一些常见攻击手段和信息泄露风险

开源AI应用安全指导框架 — OWASP AI Exchange

AI安全控制内容概要

AI 安全控制（以大写字母表示 - 并在文档中进一步讨论）可以按照元控制进行分组：

应用 AI 治理（AIPROGRAM）
应用信息安全管理 （SECPROGRAM），其中 AI 关注点：

新资产：训练/测试数据、输入数据、输出数据、模型参数、模型技术信息以及代码和配置。这取决于它们是否代表重要的知识产权，或者数据是否敏感，或者数据是否可以帮助攻击者设计攻击（DISCRETE）。
新威胁：ISO/IEC 27563（关于人工智能用例安全和隐私）描述了一些人工智能用例的安全性，以帮助进行风险分析，ISO/IEC 23894详细阐述了风险管理。AI Exchange 和即将推出的 ISO 27090（AI 安全）是更全面的威胁和控制来源。
需要考虑人工智能监管（CHECKCOMPLIANCE）
意识培训需要包括 AI 威胁和控制（SECEDUCATE）
本文档中的信息安全控制属于安全管理活动（例如模型权限、监控、访问控制、数据保护、供应链）

将专业的软件工程实践应用于 AI 生命周期（DEVPROGAM）。
将安全软件开发应用于 AI 工程（SECDEVPROGRAM），并在安全开发时使用涵盖技术应用程序安全控制和操作安全的标准（例如 15408、ASVS、OpenCRE）。AI关注点：

确保保护运行时模型及其 IO（RUNTIMEMODELINTEGRITY、RUNTIMEMODELIOINTEGRITY、RUNTIMEMODELCONFIDENTIALITY、MODELINPUTCONFIDENTIALITY、MODELOBFUSCATION）
控制模型使用（MONITORUSE、MODELACCESSCONTROL、RATELIMIT）
ENCODEMODELOUTPUT（如果它是基于文本的）
LIMITRESOURCES 防止拒绝服务

开发时保护：

DEVDATAPROTECT（保护训练/测试数据、参数、代码和配置）
DEVSECURITY（包括工程师筛选在内的进一步信息安全）
SEGREGATE数据
CONFCOMPUTE的
联邦学习
供应链管理

全新的应用程序安全控制是 MODELOBFUSCATION 和防止间接提示注入 GenAI 的保护：PROMPTINPUTVALIDATION 和 INPUTSEGREGATION
如果数据是敏感的，则限制数据量和存储时间（DATAMINIMIZE、ALLOWEDDATA、SHORTRETAIN、OBFUSCATETRAININGDATA）
限制不需要的模型行为的影响（OVERSIGHT、LEASTMODELPRIVILEGE、AITRAINSPARENCY、EXPLAINABILITY）
使用模型时的数据科学运行时控制：

连续验证
不需要的偏见测试
DETECTODD输入
检测对抗输入
DOSINPUT验证
输入失真
FILTERSENSITIVEMODEL输出
OBSCURECONFIDENCE（防止重建列车数据）

数据科学开发时控制：

连续验证
不需要的偏见测试
EVASIONROBUST模型
POISIONROBUST模型
TRAINADVERSARIAL
TRAINDATADISTORTION
ADVERSARIALROBUST蒸馏（如果您应用蒸馏）
FILTERSENSITIVETRAINDATA
模型合奏
更多火车数据
SMALLMODEL（防止重建训练数据）
DATAQUALITYCONTROL（在 5259 中涵盖，但不针对数据操作）

关注星尘安全

解锁更多行业优质好文

原文始发于微信公众号（星尘安全）：开源AI应用安全指导框架 — OWASP AI Exchange

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

开源AI应用安全指导框架 — OWASP AI Exchange

AI安全威胁及控制导航

AI安全控制内容概要

装机必备！WinRAR 无广告无需激活安装即用！！ WinRAR 2024 v7.11正式版注册商业版+烈火汉化版【最新版】

Droopescan：一款基于插件模式的CMS安全扫描工具

DockerApi未授权利用工具使用感受以及开发手记(2375端口)

2025 最佳漏洞赏金书籍和网站

DNSLog 平台克隆版（自定义域名支持）便于内网渗透测试与痕迹收集，同时绕过部分安全设备对 dnslog.cn 的拦截

【今夜不插电】硬件Hacker的兵器库

Red Teaming Tools

Wavely | 高效便捷的图形化Nuclei GUI POC管理工具

网络安全训练靶场

sqlmap_gui【图形界面化的 SQL 注入漏洞测试工具】

发表评论

在线咨询

微信