难两全 | CN-SEC 中文网

安全闲碎

大模型安全性与有用性难两全？复旦团队说：鱼和熊掌可兼得！

首个集内生安全性和有用性于一身的中文大模型安全对齐策略！过往研究通常认为：大模型安全对齐会导致模型遗忘已经学会的知识，从而导致模型在有用性上下降。OpenAI将这一损失称为对齐税（Alignment ...

06月30日14 views评论