人工智能安全 【论文速读】| JailPO:一种针对经过对齐的大语言模型,通过偏好优化实现的新型黑盒越狱框架 基本信息原文标题: JailPO: A Novel Black-box Jailbreak Framework via Preference Optimization against Aligned ... 03月12日17 views评论大语言模型 语言模型 阅读全文