jailpo | CN-SEC 中文网

人工智能安全

【论文速读】| JailPO：一种针对经过对齐的大语言模型，通过偏好优化实现的新型黑盒越狱框架

基本信息原文标题: JailPO: A Novel Black-box Jailbreak Framework via Preference Optimization against Aligned ...

03月12日26 views评论