安全闲碎 大模型安全性与有用性难两全?复旦团队说:鱼和熊掌可兼得! 首个集内生安全性和有用性于一身的中文大模型安全对齐策略!过往研究通常认为:大模型安全对齐会导致模型遗忘已经学会的知识,从而导致模型在有用性上下降。OpenAI将这一损失称为对齐税(Alignment ... 06月30日11 views评论arxiv 大模型安全 阅读全文