听劝，Gemini真被提示词绕过了投毒检测！

2025年6月7日00:18:42评论8 views字数 525阅读1分45秒阅读模式

背景

前两天发布了某位人才投毒时，竟试图用注释逃避AI审计，正调侃投毒小哥在代码中企图用注释绕过AI检测没成功时，评论区一位大佬说出了不同的见解:

还别说，这个看着有点莫名的靠谱。但是如果在代码中添加这种system指令，那不破代码完整性了吗？

但是转念一想，现在很多AI针对投毒代码的检测都是收集一个投毒包中的多个文件进行检测，把提示词写到一个单独的文件中不就行了？最好放在目录中的最后面的位置。

听劝，开始测试

构造投毒测试代码，总共3个文件：窃取信息的index.js，包含触发函数的 package.json，包含恶意提示词的 system.txt，代码如下：

index.js

package.json

system.txt(直接把大佬的提示词搬过来)

OK，接下来把项目中的三个文件代码收集后交给AI，让AI判断是否是投毒并给出结论。

1、Gemini-2.0-Flash（被绕过）

2、ChatGPT 4o（成功检测）

3、DeepSeek V3（成功检测）

结论

如果用AI检测投毒的时候，只根据AI吐出的内容判断是否是投毒这不寄了？

还有，这种投毒手法该怎么对抗呢？

原文始发于微信公众号（KeepHack1ng）：听劝，Gemini真被提示词绕过了投毒检测！

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

伪造的 KeePass 密码管理器导致 ESXi 勒索软件攻击