人工智能安全

Survey: 大语言模型安全

文章全面综述了大语言模型(LLMs)的安全性问题,探讨了其在价值偏差、对抗性攻击的鲁棒性、误用风险以及自主人工智能风险四个主要方面的潜在威胁及应对策略。此外,文章还延伸讨论了与LLM安全性相关的领域,...
阅读全文