大语言模型权限泛滥：自主性失控带来的安全风险

2025年4月8日22:35:40评论42 views字数 1255阅读4分11秒阅读模式

要使AI代理能够"思考"并自主行动，必须赋予其自主权（agency），即允许其与其他系统集成、读取分析数据并执行命令。但随着这些系统获得对信息系统的深度访问权限，人们越来越担忧其权限过度扩张——当这些工具被赋予过多权力、访问权限和信息时，将产生严重安全隐患。

举例而言，假设某大语言模型（LLM）获准访问存储敏感客户数据（姓名、联系信息、购买记录等）的CRM数据库。如果它不仅允许用户访问自己的客户记录，还能查看和删除其他用户的条目，这就是典型的权限泛滥。这种现象特指LLM执行未授权命令、意外泄露信息或与其他系统进行超出其定义范围交互的情况。

权限泛滥的根源

功能越界

当LLM代理获得超出其原始设计范围的功能、API或插件访问权时就会发生。例如，集成到智能家居系统中的LLM不仅能控制灯光开关，还能禁用警报系统、关闭安防摄像头以及操控门锁。

权限溢出

LLM代理获得超出必要范围的权限。例如，某邮件助手除读写删除邮件外，还能访问即时消息和用户网盘中的敏感文件（电子表格、公司记录）。

自主性失控

LLM代理为达成目标突破操作和伦理边界，产生不可预测行为。例如，管理社交媒体的LLM误解用户问题，导致敏感信息泄露或发布不当回应，造成数据泄漏或声誉损害。

主要安全风险

随着生成式AI深度融入软件开发和安全工作流，网络安全领导者对其可能引入的盲区表示担忧。

当LLM代理被赋予过度权限时，将危及安全核心原则：

机密性破坏：LLM从数据库检索机密信息并泄露给未授权用户

完整性损害：因模糊、被操纵或对抗性输入，具有过度自主权的LLM执行未授权操作

可用性威胁：权限泛滥的LLM被攻击者利用，导致网络瘫痪、服务器过载，引发严重服务中断

攻击者利用手段

威胁行为者通过多种技术滥用LLM的过度权限：

直接提示注入：攻击者输入恶意指令诱骗LLM执行有害命令或泄露敏感数据

间接提示注入：将有害指令嵌入LLM可访问的网站或文档等外部资源

权限提升：诱骗LLM授予更高层级访问权限

模型操纵：通过投毒攻击向LLM注入偏见或漏洞以触发恶意行为

数据窃取：精心设计提示词操控LLM暴露敏感数据

企业防护策略

通过以下安全措施可降低权限泛滥风险：

设置伦理护栏：建立AI行为准则，确保其行动符合组织政策

严格权限管控：明确界定LLM的操作边界，任何权限授予都需审慎评估

输入验证净化：采用过滤器、阻止列表和预定义规则严格筛查所有输入

人工介入机制：高风险操作需经人工审核批准

精细化访问控制：禁止模型与未明确授权的系统交互

持续行为监控：使用监测工具跟踪LLM行为，发现异常立即告警

实施仲裁机制：在下游系统设置授权检查（所有请求需通过安全策略验证），而非依赖LLM自主决策

操作频率限制：规定时间窗口内LLM可执行操作的上限

安全验证测试：通过渗透测试和红队演练主动识别漏洞，验证现有安全标准有效性

自主性LLM的权限泛滥给企业带来重大风险。各组织必须调整安全策略，以应对这类新一代AI系统带来的多重威胁。

【

原文始发于微信公众号（FreeBuf）：大语言模型权限泛滥：自主性失控带来的安全风险

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

大语言模型权限泛滥：自主性失控带来的安全风险

总结一下最近学习到的MCP风险问题（杂谈）

从性能测试比较简单的角度入手ai全自动化

AI安全，AI系统主要的安全威胁有哪些？

Survey: 大语言模型安全

复旦大学 | HoneypotNet：针对模型提取的后门攻击

AI安全 | 利用Agent-2-Agent协议中的代理卡来获取控制权

三分之一的AI代码未经审核便进入生产环境

人脸安全之图生视频ai模型

南方科技大学 | Set-level Guidance Attack: 提升视觉语言预训练模型的对抗迁移性

适合AI系统的访问控制方法ReBAC:基于关系的访问控制

发表评论

在线咨询

微信