deceiver | CN-SEC 中文网

人工智能安全

研究分享 | 大模型欺骗能力评测基准集 OpenDeception

研究背景随着大型语言模型（LLM）能力的提高和智能体（agent）的广泛应用，重大红线风险之一的欺骗性风险逐渐成为一个关键的安全问题。欺骗性风险可以简单理解为，LLM在完成目标的过程中表现出欺骗性，例...

32分钟前0 views评论