一前言世界数字技术院(WDTA)开发和发布了“大语言模型安全测试方法”,这表明相关人员始终致力于推进关键进展,保证人工智能技术的可信和安全使用。大语言模型等人工智能系统逐渐成为社会各个领域中不可或缺的...
洞见RSAC 2024|AI安全分析与挑战
随着人工智能(AI)技术的迅速发展,其在各个领域的广泛应用已经成为现实。然而,随之而来的是AI系统安全性的不断凸显,特别是在大规模语言模型(LLMs)和企业自动化领域。本文将针对2024 RSA大会中...
多模态大语言模型的致命漏洞:语音攻击
OpenAI近日发布的GPT-4o多模态大语言模型震惊了世界,该模型可以通过传感器感知世界并与人类通过语音进行无缝交流,完成各种复杂任务(例如给孩子辅导数学),将科幻电影中的智能机器人场景带入现实。G...
自动驾驶环境下对抗性攻击的可行性 BMW
点击上方蓝色字体,关注我们/ 技术交流群 /添加微信15021948198,申请会员下载ppt & 加入汽车网络信息安全、测试评价、汽车电子、自动驾驶技术交流群、招聘求职群、投融资合作群......
【大模型安全】大模型攻防对抗:揭秘攻击手段与防御策略
大模型攻防对抗:揭秘攻击手段与防御策略 引言 随着科技的飞速发展与智能化的步伐不断加快,人工智能的身影越来越频繁地出现在我们的日常生活中,尤其是大模型的应用。然而,随着其广泛应用,大模型攻防对抗的问题...
AI 人工智能面临哪些攻击威胁?
对于这个问题,咱先问问 GPT 的回答:人工智能(AI)系统面临多种安全威胁,这些威胁可能会影响 AI 的性能、可靠性和安全性。以下是一些主要的攻击威胁:数据污染攻击(Data Poisoning A...
【公益译文】对抗性机器学习与网络安全:风险、挑战和法律影响
全文共10889字,阅读大约需20分钟。 执行摘要 乔治城大学安全与新兴技术中心(CSET)和斯坦福网络政策中心地缘政治、技术和治理项目曾召集过一次专家研讨会,探究人工智能(AI)系统中的漏洞与传统类...
TextBugger:针对实际应用生成对抗性文本
点击上方蓝色字体,关注我们 / 技术交流群 / 添加微信15021948198,申请会员下载ppt & 加入汽车网络信息安全、测试评价、汽车电子、自动驾驶技术交流群、招聘求职群 原文始发于微信...
网络安全人士必知的人工智能对抗模型MITRE ATLAS
点击上方蓝色字体关注,了解更多网络安全知识图片由通义万相绘制MITRE ATLAS™(人工智能系统的对抗威胁格局)是一个关于机器学习 (ML) 系统的对手战术、技术和案例研究的知识库,基于现实世界的观...
G.O.S.S.I.P 阅读推荐 2023-12-11 SneakyPrompt
在飞速发展的人工智能 (AI) 领域,理解和提升AI安全性变得日益重要。近日,约翰霍普金斯大学曹寅志研究组和杜克大学Neil Gong研究组的合作研究成果SneakyPrompt: Jailbreak...
威胁狩猎方法论:AIMOD2
前言本文是对AIMOD2[1]的翻译。字数1.7w字。文章目录什么是对抗性拦截、面向任务的发现和破坏?对抗性拦截任务导向拦截破坏什么是威胁狩猎任务威胁狩猎任务的三个层次操作层递归层分析层CAPEO:收...
屡试不爽|绕过ChatGPT安全限制的新方案
cckuailong读完需要4分钟速读仅需 2 分钟1 前言卡内基梅隆大学近期发现了一种新的绕过 LLM 安全限制的方案 -- 添加对抗性后缀,这种方案完全规避了开源 LLM(...
5