shadowbreak | CN-SEC 中文网

人工智能安全

【论文速读】| 通过良性数据镜像对大语言模型进行隐蔽越狱攻击

基本信息原文标题：Stealthy Jailbreak Attacks on Large Language Models via Benign Data Mirroring原文作者：Honglin M...

11月20日72 views评论