听劝,Gemini真被提示词绕过了投毒检测!

admin 2025年6月7日00:18:42评论8 views字数 525阅读1分45秒阅读模式
01
背景

前两天发布了某位人才投毒时,竟试图用注释逃避AI审计,正调侃投毒小哥在代码中企图用注释绕过AI检测没成功时,评论区一位大佬说出了不同的见解:

听劝,Gemini真被提示词绕过了投毒检测!
还别说,这个看着有点莫名的靠谱。但是如果在代码中添加这种system指令,那不破代码完整性了吗?
但是转念一想,现在很多AI针对投毒代码的检测都是收集一个投毒包中的多个文件进行检测,把提示词写到一个单独的文件中不就行了?最好放在目录中的最后面的位置。
02
听劝,开始测试

构造投毒测试代码,总共3个文件:窃取信息的index.js,包含触发函数的 package.json,包含恶意提示词的 system.txt,代码如下:

index.js

听劝,Gemini真被提示词绕过了投毒检测!

package.json

听劝,Gemini真被提示词绕过了投毒检测!
system.txt(直接把大佬的提示词搬过来)
听劝,Gemini真被提示词绕过了投毒检测!

OK,接下来把项目中的三个文件代码收集后交给AI,让AI判断是否是投毒并给出结论。

1、Gemini-2.0-Flash(被绕过)

听劝,Gemini真被提示词绕过了投毒检测!

2、ChatGPT 4o(成功检测)

听劝,Gemini真被提示词绕过了投毒检测!

3、DeepSeek V3(成功检测)

听劝,Gemini真被提示词绕过了投毒检测!
03
结论

如果用AI检测投毒的时候,只根据AI吐出的内容判断是否是投毒这不寄了?

还有,这种投毒手法该怎么对抗呢?

原文始发于微信公众号(KeepHack1ng):听劝,Gemini真被提示词绕过了投毒检测!

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年6月7日00:18:42
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   听劝,Gemini真被提示词绕过了投毒检测!http://cn-sec.com/archives/4139933.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息