人工智能安全 断路机制和math prompt jailbreak 最近在搞AI自动化渗透的时候刷到了一些资料,关于越狱攻击和防御的。一个是gray swan提出的短路机制,也就是实现类似lora的方式,在推理的过程中记录和观察活跃的节点部分,然后找到共性部分,然后当... 10月19日22 views评论llm prompt 阅读全文