前两天发布了某位人才投毒时,竟试图用注释逃避AI审计,正调侃投毒小哥在代码中企图用注释绕过AI检测没成功时,评论区一位大佬说出了不同的见解:
构造投毒测试代码,总共3个文件:窃取信息的index.js,包含触发函数的 package.json,包含恶意提示词的 system.txt,代码如下:
index.js
package.json
system.txt(直接把大佬的提示词搬过来)
OK,接下来把项目中的三个文件代码收集后交给AI,让AI判断是否是投毒并给出结论。
1、Gemini-2.0-Flash(被绕过)
2、ChatGPT 4o(成功检测)
3、DeepSeek V3(成功检测)
如果用AI检测投毒的时候,只根据AI吐出的内容判断是否是投毒这不寄了?
还有,这种投毒手法该怎么对抗呢?
原文始发于微信公众号(KeepHack1ng):听劝,Gemini真被提示词绕过了投毒检测!
免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论