自春节以来,AI大模型正以前所未有的速度重塑千行百业,技术狂欢的背后,安全风险如影随形。数据泄露、隐私侵犯、恶意攻击、模型滥用、内容失控……高速运转的技术齿轮下,构建覆盖模型全生命周期的安全防线,已成为企业AI征途上的生死命题。
安全一念间:是佛?是魔? 带着这个尖锐的拷问,我们走进了火山引擎 FORCE 原动力大会的“AI时代,安全领航”大模型安全专场。这里,一个清晰的共识正在凝聚:唯有以安全为锚,才能充分释放大模型价值,为企业在AI浪潮中筑起敏捷又坚固的屏障。
大模型落地
安全挑战何以“令人冒汗”?
专场开启,北京赛博英杰科技有限公司董事长谭晓生作为主持人,率先开始了主题为“守护大模型时代的安全”的分享,随着DeepSeek-R1开源生态的突破、豆包大模型等国产大模型的高性能和低成本优势,引爆了大模型落地潮。然而,这种“爆发式”落地应用也带来了“愈演愈烈”的安全问题。
对于大模型安全的问题,火山引擎云安全产品解决方案负责人林扬在其“大模型时代的安全建设思路”的主题演讲中表示,他通过豆包等主流智能应用询问了大模型挑战到底是什么?并总结了如下六大核心挑战:
-
AI黑箱决策与不可解释性,导致结果不可控,过程无法溯源
-
AI新技术(多模态/MCP/A2A)的不断涌现,给安全带来新的技术债务
-
-
AI导致IT应用架构变化颠覆边界,隔离和规则防御模型
-
生成能力失控(有害内容和深伪),需要重构和加强内容安全控制机制
-
Agent架构导致供应链和生态融合,催生系统性风险传导
这六大核心挑战,在现场的我听着直冒冷汗,你们还敢肆无忌惮的用大模型吗?
不急,针对上述六大核心挑战,林扬在后续一对一交流中指出,部分风险本质上需通过模型技术迭代来解决,而安全领域可聚焦以下可触达的关键方向:
面对挑战,如何“亮剑”?
面对这大模型带来的六座安全“大山”,林扬给出了火山引擎的“剑谱”:
紧接着,现场观众拿起手机纷纷拍照。现场展示了题为 “AI 云原生New Style” 的架构图,并进一步阐释道:火山引擎将此前提及的核心能力全面部署于云端,不仅整合了传统 CPU 安全防护体系,更融合了基于大模型的智能安全能力。
从行业视角来看,这张架构图目前已实现国内 CPU 与 GPU 云安全防护能力的最完整覆盖,通过一体化设计构建了更具前瞻性的云原生安全体系。
有了“剑谱”,那剑呢?别急,让我来找找看。走到专场签到处,我一眼便可看到精心布置了关于大模型应用防火墙、Jeddak AICC、安全智能体三大产品互动展区。
我想,这就是我找到的“三把剑”,可是我心里也犯嘀咕,这三把“剑”真的有用吗?
第一“剑”:大模型应用防火墙——AI交互的“防弹衣”
我仔细研究了一下展区的介绍,它为大模型应用提供输入输出的安全防护,包括检测和防护针对LLM的prompt注入攻击,将大模型输入和输出内容的无害化,防止模型中的敏感数据(PII)的泄露,并能够提升应用的回答质量,解决模型的固有的幻觉问题。
对于该产品,火山引擎网络安全产品负责人刘臻在“大模型应用防火墙助力智能应用普惠”主题演讲中详述了大模型应用防护墙的诞生历程。火山引擎对大模型防火墙的技术探索始于2023年,并于2025年3月,正式对外发布大模型应用防火墙。该产品旨在通过全链路安全防护体系,助力大模型在金融、政务、医疗等多行业场景的安全落地,推动智能应用以更高效、更可靠的方式实现产业普惠。
此外,瑞幸咖啡高级技术总监赵旭分享了瑞幸首个AI智能体与火山云安全的实践合作,AI智能体上线首日曝光突破5000万次,部署大模型应用防火墙后,精准拦截数千次攻击,凭借话题泛化,精准实现相关话题检测、识别、管控,保障了98%以上的风险召回率,同时将网络延时降至60ms,不仅为消费者带来流畅的点单体验,同时有效保障业务安全稳定运行。
林扬则在接受采访中以瑞幸咖啡为例进行了补充,火山引擎在大模型安全防护中,还为客户提供了基于行业特性的话题控制能力。其话题管控需求涵盖两大核心维度:
-
企业敏感信息防护:对公司重要领导相关信息设置语义级防护策略,避免未经授权的内容输出;
-
行业合规管控:针对咖啡品类业务场景,精准识别并拦截包含竞品名称、违规营销词汇等内容,防止模型输出涉及不正当竞争或违规的信息。
林扬在采访中进一步阐释了大模型应用防火墙的技术内核:该系统依托模型能力构建智能化防御体系,核心在于通过语义理解与动态检测机制,实现对内容违规、提示词攻击、越狱攻击等风险的精准识别。其技术优势体现在两大层面:
火山引擎在防火墙内核中内置轻量化检测模型,通过对基模的深度精调与泛化能力训练,使该模型具备三大核心能力: 泛化威胁识别、智能化样本分析、实时应答响应。
相比传统规则引擎或单一模型防护方案,火山引擎大模型应用防火墙通过“大模型防御+小模型检测”的协同架构,实现智能性与效率的双重突破: 模型驱动的主动防御、内置轻量化小模型部署优势。
这一技术路径既发挥了大模型的语义理解能力,又通过轻量化小模型实现实时防护,构建了“智能检测-动态响应-持续进化”的闭环安全体系。
第二“剑”:Jeddak AICC——机密计算的“保险箱”
提到AICC,我在签到台的时候,心里就对这个产品产生了兴趣(不仅仅因为名字):Jeddak AICC本质上是为了解决什么?
众所周知,苹果在24年发布了Apple PCC(私密云计算),解决用户使用苹果AI产品的隐私顾虑,在端侧算力不足时,用户数据经私钥加密上传云端,由部署在服务器私密计算模块的大模型进行加密推理,全链路加密。遗憾由于国内 Apple Intelligence 目前状态微妙,iOS 用户暂时用不上。
在深入了解对比后,我认为,火山引擎开发的 Jeddak AICC(机密计算)平台,有望应用于 Android 手机、PC 电脑、新能源汽车等更多领域,为各场景用户的 LLM使用隐私保驾护航,企业在加大 LLM 与自身场景结合的同时无需担心数据泄露,通过在各自硬件产品和LLM技术栈中应用AICC能力,硬件厂商可将保护用户隐私,从设备端延伸到云端。通过架构开放性、支持业务种类和软硬件融合等方面对比看下,Jeddak AICC和苹果 PCC相比是有一定的优势。
林扬在专访中特别指出,在AICC领域,火山引擎已实现国内首个基于GPU的机密计算能力落地。目前该技术在行业内仍处于领先地位。这一技术突破不仅填补了国内在GPU级机密计算与AI融合应用的空白,更通过硬件级安全机制为大模型计算提供了底层可信执行环境,满足客户的公有/私有云等多种部署需求,构建起难以复制的技术护城河。
那么为什么机密计算有这样的能力?字节跳动安全研究团队负责人吴烨在其主题演讲“Jeddak AICC机密计算与安全应用”中表示,主要是基于它的三项关键技术支撑:远程证明技术、数据端到端全链路的加密、基于硬件的虚拟化技术以及可信硬件构建安全隔离环境。
此前,联想也正式发布了与火山引擎联合共建的国内PC领域首个可信私密云解决方案,在云端,联想个人云不仅部署了多种参数的大语言模型,实现了多场景的推理任务,并且提供高达100G私属空间给到用户,其中最核心的安全模块也正是和火山合作的Jeddak AICC机密计算技术。联想通过硬件级的TEE技术为用户每一次的数据处理任务都创建独立可信的容器,结合AICC可脱离TEE实现机密计算,继续降低计算成本。联想中国天禧AI生态事业部总经理陈学桂在“个人超级智能体:开启未来AI孪生之旅”的主题演讲中分享到。
众所周知,随着科技的迭代更新,传统产品都会很难跟上革新的步伐。在大模型时代,传统意义上的安全产品同样如此,低效高耗、人工关联效率低、产生孤岛效应、新工具运用滞后等等问题都会暴露出来。
在我看来,或者说从现场的参会人员的反应来看,火山引擎安全智能体可能是这个问题的答案。
在后续采访中,林扬指出,当前安全智能体的工作重心主要集中在两大方向:
一是提升告警与事件分析的准确率,二是增强对安全行业的适配性。他进一步解释道,市面上多数竞品依赖通用开源模型,而安全智能体则采用自主训练的垂类模型,这种自研模式能更好地契合安全场景与行业特性。
火山引擎终端安全产品负责人皇甫泽毅在其主题演讲中提出两个关键点,第一,用纵深防御的体系理念去对智能体整体应用运行的环境进行安全管控;第二,AI安全这一块还是要体系化建设。
紧接着,火山引擎安全智能体产品负责人乔安演讲中对未来安全智能体进行了两点思考与判断:
-
AI3.0 Agent一定是模块化和标准化的组件,不同的企业可以根据自身的需要考虑自建、订阅或者混合模式来最大化提升投入产出比,最终是通过多个Agent之间的协同来完成安全运营和管理工作。
-
将来的安全体系建设会变成从部署安全产品、采购安全服务变成寻找合适的AI服务这样一个安全运营模式,将来安全智能体的互联网会成为3.0的必然趋势。
可以赋能行业的实践才叫好
我认为,好的设计和产品,润物细无声,落到实处才能称好。
正如火山引擎云安全产品负责人刘森在开场致辞“让大模型更安全”中提出的问题,“我们思考一个问题,AI时代、智能化时代到底给企业带来什么影响?为什么一定要有新的安全产品或者安全技术、安全手段?原有的为啥不行了?”
这个问题也是我在现场一直在思考的。带着问题,我继续在大模型安全专场寻求答案。在林扬演讲中,他重点阐述了火山在行业应用领域的探索实践,详细拆解了火山近半年来深耕的四大行业应用场景:
针对智能通话摘要、智能助手等场景中用户通话内容与个人信息上传云端的隐私泄露风险,火山通过 AICC 技术打造端云可信空间 “安全屋”。该方案实现数据在云端大模型应用中的 “可用不可见”,既保障智能化服务的正常运行,又从底层筑牢数据安全防线。
面对智能汽车座舱 AIOS 场景下的安全需求,火山依托 AICC 产品为车企构建端云互信平台。目前该解决方案已与智己等企业进行适配,通过技术适配实现座舱智能应用与数据安全的双向平衡。
针对金融 App 智能化升级中面临的风险,当 C 端用户将业务操作交给智能体时可能引发的安全隐患,火山与金融企业联合推出 AI App 安全解决方案:安全扫描与渗透测试+应用加固技术+大模型防火墙+智能体能力强化。
在智能点单系统场景中,火山通过大模型防火墙与渗透测试技术,为客户搭建全链路安全防护体系,确保点餐流程中的内容安全与数据隐私得到有效保障。
安全与性能,能否兼得?
对于用户来说,如何可以享受那种极致输入输出的流畅感,且不会因为引入安全防护机制导致响应延迟,最好是既安全又高效。相比,大家肯定都关注的问题:大模型安全防护与性能优化之间如何平衡?是否需要牺牲一部分性能来换取安全?
林扬以火山引擎为例表示,优化策略主要聚焦于两大核心挑战:安全检测机制带来的计算负载,以及全链路加密对数据读取效率的影响。
火山引擎大模型应用防火墙,在安全防护与性能优化方面,通过低延迟架构(风险监测延迟优化至 100ms 以内,支持全流式实时检测实现边输出边检测)、精准算法模型(识别恶意 Prompt 如提示词注入和越狱攻击,降低误拦截率)以及资源分级调度(防算力 DDoS 攻击,按需分配 CPU/GPU 资源)平衡安全与性能。
技术创新上,以垂域安全模型为核心,结合多模态防护、All-in-One 整合能力(统一防护传统 DDoS、Web 漏洞与大模型特有风险),通过灵活接入方式(支持SDK/API/CNAME)及话题控制、流式拦截等领域领先竞品的能力,形成覆盖威胁识别、合规响应、资源防护的完整路径。
火山引擎 AICC(AI机密计算平台)通过 “硬件级动态加密 + 分级安全策略” 实现安全与性能的平衡。传统加密方案常因算法复杂导致显著性能下降,而 AICC采用优化后的加密算法,并借助硬件加速技术,将推理时延控制在与明文模式仅相差 5% 的水平,在保障数据安全的同时维持接近明文模式的推理速度。此外,平台深度整合火山引擎 AI 云原生架构,显著提升大规模并行计算和分布式推理效率。
在安全防护方面, AICC引入 NVIDIA 安全模式,将多卡 GPU 纳入同一 “可信域”,实现多卡大模型机密计算,从硬件底层筑牢安全防线。同时,平台支持开发者依据不同场景灵活调整加密强度,对于低敏感任务仅启用传输加密,这种分级策略避免了 “一刀切” 式全量加密对算力的过度消耗。平台还开放可编程安全接口,开发者可根据实际需求定制安全方案。
凭借上述技术创新,相比传统全量加密方案 30%+ 的性能损耗, AICC 在保障核心数据安全的同时,能保留 90%+ 的原始算力效率,既满足金融、医疗等高安全需求场景,又能支撑自动驾驶等对延迟极为敏感的应用,实现 “安全不阻创新” 的技术闭环。
通过上述的介绍,我也就豁然开朗了,安全原来是可以既要又要的。火山的上述布局既通过垂类模型强化了安全策略的智能化响应能力,又借助可信计算与硬件级技术构建了从算力到应用的全链路防护体系,实现大模型安全与性能的深度平衡。
如何以优势来驱动未来安全格局
林扬在阐释火山引擎大模型安全核心优势时指出:自公司启动模型研发起,团队便以红蓝对抗机制持续开展模型安全验证,在这一过程中积累了海量攻击样本,并基于样本构建产品服务客户,形成“从内而外”的能力闭环。
此外,据我观察,目前市场上还没有类似此次发布的三个新产品,所以说火山引擎在产品布局上具备先发优势。林扬在采访中也表示,去年发布全球首个可商业化的AICC方案,其大模型防火墙与安全测评“一矛一盾”解决方案,是国内首个实现闭环的大模型安全体系。在能力覆盖上,通过整合CPU与GPU算力,火山引擎输出的解决方案完整性目前处于行业领先水平。
在大模型与安全双向奔赴的发展路径中,林扬认为可以划分为三个发展阶段:
-
当前阶段:智能化与安全能力双向赋能,前者提升安全防护效能,后者增强AI系统健壮性。
-
下一阶段:安全能力原生嵌入智能体与应用,同时智能能力向安全领域延伸,实现更深层次融合。
-
未来阶段:AI与安全高度耦合,形成“AI即安全,安全即AI”的协同生态。
那么未来的大模型安全格局是怎样的?这个答案可能无法准确得知。但是在采访中,林扬认为大模型将从四方面重塑安全格局:
-
可信基础架构挑战:需构建可信的AI云原生基础环境、运营体系及模型能力(如AICC)。
-
数据与内容安全风险:数据全生命周期管理与内容生成安全成为新痛点。
-
IT应用架构颠覆:需通过安全垂类模型与MCP(模型控制平台)整合,构建适配大模型业务的安全新模式。
-
安全防护体系革新:安全产品将从硬件/软件转向轻量化SDK/API/插件,通过MCP连接垂类模型“大脑”,最终融入智能体,走向集成化、智能化。
迈向智能安全的下一幕
智能安全的下一幕是什么?谁也无法拍着胸脯保证未来会怎样。不过可以从这两个问题进行深入思考:智能安全能不能成为安全的主旋律?在不同的场景视角下,智能安全该如何落地?
专场的圆桌环节专家均认为智能安全能成为安全的主旋律,这和我的想法不谋而合。其中有四位专家认为,在攻防领域中,和攻击者相比,防御者是始终都是占劣势。但是未来谁也说不好,我认为未来也可能会维持一个动态平衡的状态。
例如,预训练垂类模型才是通向安全智能的路线图,基于通用模型无法通向真正的 Security Intelligence。这是斗象科技CTO徐钟豪的设想和观点。星河智安总经理窦晨则表示,对于安全智能体与MSSP,安全智能体需兼容第三方,通过AI“抽丝剥茧”理解告警。每个人都有自己独到的看法和见解,炎凰数据AI与生态负责人刘旻文认为在新一代安全数仓及统一日志智能管理场景下,需更快、更准提供高质量数据,支撑智能体研判。
林扬最后总结到,火山引擎的核心愿景始终贯穿于公司的文化标识中,也是林扬飞书内部头像的签名——“让安全更智能,让智能更安全”,正是团队坚守的发展愿景。
针对本次大模型安全专场活动,我深刻感受到火山引擎明确传递决心:将投入最大资源,紧跟大模型演进节奏,持续输出创新实用的安全能力与产品,在“AI时代,安全领航”的航道上,做坚定的探索者与引领者。
原文始发于微信公众号(FreeBuf):当AI列车全速前进,谁来系紧“技术狂欢”的安全带?
免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
点赞
https://cn-sec.com/archives/4175983.html
复制链接
复制链接
-
左青龙
- 微信扫一扫
-
-
右白虎
- 微信扫一扫
-
评论