越狱攻击 | CN-SEC 中文网

人工智能安全

面向大模型的生成-利用式越狱攻击

目前做安全大模型或者说做大模型安全，基本都会有必要的两步，分别是对齐以及红队。因为随着大模型在各种应用场景中的广泛使用，越来越多的人开始担忧这些模型可能被滥用，尤其是在传播有害或不道德内容方面。由于...

05月30日33 views评论

阅读全文

人工智能安全

【论文速读】| 漏洞放大：针对基于LLM的多智能体辩论的结构化越狱攻击

基本信息原文标题：Amplified Vulnerabilities: Structured Jailbreak Attacks on LLM-based Multi-Agent Debate原文作者...

05月08日64 views评论

阅读全文

安全新闻

Meta开源LlamaFirewall大模型防火墙框架

Meta公司周二正式发布开源框架LlamaFirewall，该框架旨在保护人工智能（AI）系统免受即时注入（prompt injection）、越狱攻击（jailbreak）及不安全代码等新兴网络安全...

05月01日36 views评论

阅读全文

安全新闻

Linux安全盲区曝光：io_uring机制可绕过主流检测工具

Linux安全盲区曝光：io_uring机制可绕过主流检测工具 ARMO研究团队近日披露Linux运行时安全工具存在重大缺陷，证实io_uring接口可使rootkit（内核级恶意软件）绕过常规监控方...

04月29日25 views评论

阅读全文

安全新闻

新型越狱攻击可突破ChatGPT、DeepSeek等主流AI服务防护

研究人员最新发现的两项越狱技术暴露了当前主流生成式AI服务的安全防护存在系统性漏洞，受影响平台包括OpenAI的ChatGPT、谷歌的Gemini、微软的Copilot、深度求索（DeepSeek）、...

04月28日51 views评论

阅读全文

安全新闻

新的 Inception 越狱攻击绕过了 ChatGPT、DeepSeek、Gemini、Grok 和 Copilot

关键词网络攻击一对新发现的越狱技术暴露了当今最流行的生成式人工智能服务的安全护栏中的系统性漏洞，包括 OpenAI 的ChatGPT、谷歌的 Gemini、微软的 Copilot、DeepSeek、A...

04月27日90 views评论

阅读全文

人工智能安全

USENIX Sec 2025：大模型越狱防御框架——JBShield

随着大语言模型（Large Language Models，LLMs）的广泛应用，其安全问题也逐渐引发关注。尽管现有安全对齐策略能够在一定程度上限制模型输出有害内容，但其仍然容易受到越狱...

04月23日46 views评论

阅读全文

安全闲碎

【论文速读】| PiCo：通过图像代码情境化对多模态大语言模型进行越狱攻击

基本信息原文标题：PiCo: Jailbreaking Multimodal Large Language Models via Pictorial Code Contextualization原文作...

04月16日236 views评论

阅读全文

安全新闻

生成式AI可一键生成诈骗网站，越狱攻击引发钓鱼危机

Lovable AI 易受到越狱攻击，使新手和潜在网络犯罪分子能够设置类似真实页面的凭证收集页面，实施网络钓鱼攻击。由生成式人工智能（AI）驱动的平台Lovable，支持通过文本指令创建全栈式网页应用...

04月10日15 views评论

阅读全文

安全新闻

研究人员发现新方法防御 AI 模型的通用越狱攻击

更多全球网络安全资讯尽在邑安全来自安全研究团队的研究人员开发了一种新方法，用于保护人工智能模型免受通用越狱攻击。这种创新方法被称为“宪法分类器”，已在数千小时的人类红队测试和合成评估中表现出了显著的抗...

02月08日31 views评论

阅读全文

安全新闻

研究人员发现新方法防御 AI 模型的通用越狱攻击

关键词人工智能来自Anthropic保障研究团队的研究人员开发了一种新方法，用于保护人工智能模型免受通用越狱攻击。这种创新方法被称为“宪法分类器”，已在数千小时的人类红队测试和合成评估中表现出了显著的...

02月07日31 views评论

阅读全文

安全新闻

新越狱攻击允许用户操纵 GitHub Copilot

导读研究人员发现了两种操纵 GitHub 人工智能编码助手 Copilot 的新方法，从而能够绕过安全限制和订阅费用、训练恶意模型等。第一个技巧是将聊天交互嵌入到 Copilot 代码中，利用 AI...

02月05日36 views评论

阅读全文

面向大模型的生成-利用式越狱攻击

【论文速读】| 漏洞放大：针对基于LLM的多智能体辩论的结构化越狱攻击

Meta开源LlamaFirewall大模型防火墙框架

Linux安全盲区曝光：io_uring机制可绕过主流检测工具

新型越狱攻击可突破ChatGPT、DeepSeek等主流AI服务防护

新的 Inception 越狱攻击绕过了 ChatGPT、DeepSeek、Gemini、Grok 和 Copilot

USENIX Sec 2025：大模型越狱防御框架——JBShield

【论文速读】| PiCo：通过图像代码情境化对多模态大语言模型进行越狱攻击

生成式AI可一键生成诈骗网站，越狱攻击引发钓鱼危机

研究人员发现新方法防御 AI 模型的通用越狱攻击

研究人员发现新方法防御 AI 模型的通用越狱攻击

新越狱攻击允许用户操纵 GitHub Copilot

在线咨询

微信