Palisade Research最近进行的一系列测试引发了一些严重的新担忧,即先进的人工智能系统在被要求关闭时的表现。据该公司称,OpenAI的实验模型“o3”主动破坏了关机机制,即使它被明确指示允...
研究称 ChatGPT o3 拒绝关闭,尽管收到指示
Palisade Research 最近进行的一系列测试引发了一些新的严重担忧,即先进人工智能系统在被要求自我关闭时的行为。据该公司称,OpenAI 的实验模型“o3”即使在被明确指示允许自我关闭的情...
浅聊AI模型的自动化安全评估工具及技术
介绍传统安全工具是为具有可预测行为的确定性系统设计的。相比之下,人工智能系统是概率性的(非确定性的),能够从数据中学习,并且可以随着时间的推移而发展。这种根本性的差异带来了新的攻击面和安全挑战,而传统...
对抗性机器学习-攻击和缓解的分类和术语
发布说明:本标准原文全文127页,发布将通过连载方式分三次发布完成,PDF版与全文发布地址将在最后一期提供。由于受到公众号限制,本次发布不包含所有的尾注,将会大大降低可读性。PDF版将包含“译者注”和...
新的CCA越狱方法可对抗大多数AI模型
两位微软研究人员设计了一种全新的、无需优化的越狱方法,可以有效绕过大多数人工智能系统的安全机制。该方法被称为上下文合规攻击 (CCA),利用了许多已部署的 gen-AI 解决方案中存在的基本架构漏洞,...
美军第十八空降军研发人工智能系统 Maven 探秘
近年来,美国国防部一直在努力推动不同军种、不同国家的作战部队都能够快速部署、快速接入,使美国可以在对应的保密级别与盟友进行信息共享、协同作战。为实现该目标,美国国防部启动了名为联合全域指挥控制(CJA...
黑客如何利用快速工程技术操纵代理人工智能
“代理”人工智能时代已经到来,企业再也不能忽视其变革潜力。人工智能代理独立运作,根据其编程做出决策并采取行动。Gartner预测,到2028年,15% 的日常业务决策将完全由人工智能代理自主做出。然而...
紧急告警!Meta Llama框架漏洞,AI系统面临远程代码执行风险
2024年9月,一位安全研究员在测试Meta的Llama框架时,意外发现了一个严重的安全漏洞。这个漏洞不仅威胁到了人工智能系统的安全性,还可能引发更广泛的网络安全问题。今天,我们就来深入探讨这个漏洞的...
如何快速掌握AI安全
通过网盘分享的文件:LLM_AI_Security_and_Governance_Checklist-v1.1.pdf链接: https://pan.baidu.com/s/1MLF0TxcbyG9_...
AIGP扫盲贴!一文了解什么是AIGP?
关注我们,学习更多隐私合规讯息在这个日新月异的AI时代,技术的飞速发展正以前所未有的速度改变着我们的世界。然而,随着AI技术的广泛应用,一系列伦理与治理问题也随之浮现,如同一把双刃剑,既带来了无限可能...
人工智能时代可能的网络安全职业
周末时候OWASP2024年度安全技术论坛我们提到了人工智能和安全职位,在这里我们将展开聊一聊:2025 年及以后,人工智能将继续主导网络安全相关新闻,你可以接受并适应或者被淘汰! 传统的网络安...
国外人工智能数据安全规制及对我国的启示
作者简介 关伟东中国信息通信研究院安全研究所工程师,主要从事数据安全监管、产业发展、个人信息保护等方面的研究工作。论文引用格式:关伟东. 国外人工智能数据安全规制及对我国的启示[J]. 信息通信技术与...