jailbreak | CN-SEC 中文网

人工智能安全

USENIX Sec 2025：大模型越狱防御框架——JBShield

随着大语言模型（Large Language Models，LLMs）的广泛应用，其安全问题也逐渐引发关注。尽管现有安全对齐策略能够在一定程度上限制模型输出有害内容，但其仍然容易受到越狱...

04月23日6 views评论

人工智能安全

最近在搞AI自动化渗透的时候刷到了一些资料，关于越狱攻击和防御的。一个是gray swan提出的短路机制，也就是实现类似lora的方式，在推理的过程中记录和观察活跃的节点部分，然后找到共性部分，然后当...

10月19日22 views评论

tag : ChatGPT 越狱、GPT 助手提示泄漏、GPT 提示注入、LLM 提示安全、超级提示、提示破解、提示安全、AI 提示工程、对抗机器学习🚨 gpt越狱探索绕过 GPT 模型限制的技术。🌟...

09月23日安全新闻142 views评论

人工智能安全

今天为大家介绍清华大学计算机系徐恪、宋佳兴、李琦老师团队，高研院丛天硕老师，和香港科技大学(广州)何新磊老师联合完成的综述《Jailbreak Attacks and Defenses Against...

07月21日237 views评论

人工智能安全

原文标题 : Voice Jailbreak Attacks Against GPT-4o 原文作者 : Xinyue Shen, Yixin Wu, Michael Backes, Yang Zha...

06月13日101 views评论

移动安全

终身VIP会员手游逆向与防护(建议收藏)Objection高效对APP逆向分析实践零基础培训课程+技术指导服务(技术交流社群)iOS越狱unc0ver工具(支持iOS11.0~iOS14.8稳定越狱)...

10月07日570 views评论