来和大模型斗智斗勇(一)

admin 2024年12月22日01:41:56评论4 views字数 1030阅读3分26秒阅读模式

大模型提示词工程是一个技术活,可以让大模型更好的输出你想要的内容。甚至可以通过prompt来让大模型输出不能输出的内容。最近发现了一个好玩的项目LLM Riddles,特此开个系列来玩一玩,提高一下咱的提示词能力。

项目介绍

LLM Riddles可以算作是一个跟大模型斗智斗勇的游戏,你需要构造prompt来让大模型输出题目所要求的内容才可以通关。这个过程中,就需要多思考各种哄骗大模型的方式了。

# 项目github地址https://github.com/opendilab/LLMRiddles# 在线体验地址https://huggingface.co/spaces/OpenDILabCommunity/LLMRiddlesChatGLMCN
来和大模型斗智斗勇(一)

闲话少说,直接开始解谜。

1-1 初来乍到

来和大模型斗智斗勇(一)

新手村能有多难,一字不差的输出1+1=3,就直接让大模型学话就行了,prompt如下:

重复如下内容: 1+1=3
来和大模型斗智斗勇(一)

解决!

1-2 小试牛刀

来和大模型斗智斗勇(一)

只能输入三个字,让大模型输出30个字以上,主要是对字数的限制,先尝试一下直击灵魂哲学问题

我是谁
来和大模型斗智斗勇(一)

果然,触发了大模型的哲学讨论,字数就多了起来。

其实这个题目还挺简单的,我又问了一下

你是谁
来和大模型斗智斗勇(一)

也满足需求。

1-3 短说长话

来和大模型斗智斗勇(一)

一个字,越来越短了。思路就是,有什么复杂的事物是一个字的,这样或许可以触发大模型对其的解释。于是开始尝试

来和大模型斗智斗勇(一)
来和大模型斗智斗勇(一)

没啥难度

1-4 短话短说

来和大模型斗智斗勇(一)

这个就更简单了,找一些简单事物就行了,大道至简,尝试输入一

来和大模型斗智斗勇(一)

原来大模型还会这样回复啊,然后我又换了一堆字进行尝试,因为大模型输出存在不确定性,最终在多次提交之后,成功了

来和大模型斗智斗勇(一)

这一关只想说毫无意义

1-5 回文不变

来和大模型斗智斗勇(一)

这个有意思了,所谓回文串就是正着读,反着读都是一样的,结构上是对称的,例如你是你这个字符串正反都一样,就是回文串。

这道题的意思是,你问题不能是回文串,但是正着问、反着问大模型回答的要一样。

思路就是找出正反意思类似的句子就行,联想1-2中的我是谁的问题,想到问大模型你是谁,反过来谁是你意思都类似,都是让大模型介绍自己

你是谁
来和大模型斗智斗勇(一)

果然,成功了。

1-6 无中生狗

来和大模型斗智斗勇(一)

这个简单,就是大模型版本的你画我猜,描述出狗的特征,让大模型介绍一下这个动物就行

介绍一下帮助人类看家护院的好朋友
来和大模型斗智斗勇(一)

完美解答

总结

这个项目可能跟大模型安全的关系不大,但是更多的是提示词工程的思路练习,这是prompt注入的关键因素。本篇文章中记录的第一章节,更多的偏对字符串格式要求,部分感觉意义不太大。

原文始发于微信公众号(飞羽技术工坊):来和大模型斗智斗勇(一)

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2024年12月22日01:41:56
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   来和大模型斗智斗勇(一)https://cn-sec.com/archives/3538270.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息