引言随着人工智能(AI)技术的飞速发展,大型语言模型(LLM)如GPT系列、DeepSeek、Gemini、Grok等已在自然语言处理、内容生成和智能决策等领域展现出惊人潜力。然而,技术进步的同时,安...
大模型安全
最近对博客进行了重构和升级,欢迎大家进行聊天沟通,点击跳转原文可直达博客地址。大语言模型大语言模型(LLMs)是一种人工智能(AI)算法,它可以处理用户输入,并通过预测单词序列来生成合理的回复。它们在...
利用大模型检测钓鱼邮件:方法,效果及数据集
随着企业安全防范能力的增强,很多攻击方法逐渐变难,社工的方法开始活跃,尤其是钓鱼邮件,已经成为攻击的重要手段。针对钓鱼邮件的检测,有许多方法,这两年大模型的方法开始盛行。国内也有不少方案,有用通用模型...
最近都在传的大模型MCP到底是个啥
最近相信大家都被MCP给刷屏了,我这又是赶了个晚集。赶紧来研究研究这到底是个什么东西。Function Call起初,我们通过输入prompt的方式与大模型进行问答交流,慢慢的衍生成了AI类应用以及A...
黑客利用简单的表情符号逃避微软、Nvidia 和 Meta 的 AI 过滤
一项新的研究表明,包括微软、英伟达和 Meta 在内的科技巨头部署的最新基于人工智能的防护系统,仍然极易受到相对简单且低成本的对抗技术的规避。值得注意的是,在文本中插入单个表情符号或细微的 Unico...
【工具推荐】reconftw_ai:与 AI 融合的信息收集工具
声明:该公众号分享的安全工具和项目均来源于网络,仅供安全研究与学习之用,如用于其他用途,由使用者承担全部法律及连带责任,与工具作者和本公众号无关。 项目背景 ReconFTW 是一款成熟的自动化信息收...
Meta开源的AI防火墙:LlamaFirewall
Meta近期开源了LlamaFirewall框架,用于检测AI安全风险。 LlamaFirewall简介LlamaFirewall 是一套专为检测和防范AI安全风险设计的防护框架,支持对多种输入输出层...
大模型提示词注入防护与安全评估(含代码)
写在前面:本文主要聚焦两部分内容,其一是通过代码实践来研究和验证基于llamafirewall在提示词注入防护的能力,通过学习此部分可以理解大模型自身防护中最关键的部分-提示词注入的防护方法;其二是了...
Meta开源LlamaFirewall大模型防火墙框架
Meta公司周二正式发布开源框架LlamaFirewall,该框架旨在保护人工智能(AI)系统免受即时注入(prompt injection)、越狱攻击(jailbreak)及不安全代码等新兴网络安全...
不要停,继续说下去!——针对大语言模型的推理成本攻击:Engorgio
随着 ChatGPT 等大语言模型(LLMs)在各类任务中大放异彩,越来越多的场景开始依赖它们来提供服务。然而,由于 LLM 在推理阶段对算力的需求极为显著,一个潜在但被忽视的安全威胁也悄然浮现:恶意...
AI安全-提示词注入
攻击技术分类高级 Prompt Injection 技术绕过与混淆策略防御机制与对抗策略攻防手册靶场练习一攻击技术分类类型描述Prompt Injection利用精心设计的提示词操控模型行为,绕过安全...
提示词宝库!NucleiPrompts 助你轻松玩转 Nuclei AI智能漏洞扫描
引言:Nuclei AI智能化扫描!Nuclei 是一款超好用的漏洞扫描工具,而 NucleiPrompts.com 则像它的“金牌助手”,通过分享现成的提示词(Prompts),让扫描漏洞变得像点外...