人工智能安全 研究分享 | 大模型欺骗能力评测基准集 OpenDeception 研究背景随着大型语言模型(LLM)能力的提高和智能体(agent)的广泛应用,重大红线风险之一的欺骗性风险逐渐成为一个关键的安全问题。欺骗性风险可以简单理解为,LLM在完成目标的过程中表现出欺骗性,例... 32分钟前0 views评论llm 欺骗性 阅读全文