来和大模型斗智斗勇（一）

admin

145605
文章

119
评论

2024年12月22日01:41:56评论4 views字数 1030阅读3分26秒阅读模式

大模型提示词工程是一个技术活，可以让大模型更好的输出你想要的内容。甚至可以通过prompt来让大模型输出不能输出的内容。最近发现了一个好玩的项目LLM Riddles，特此开个系列来玩一玩，提高一下咱的提示词能力。

项目介绍

LLM Riddles可以算作是一个跟大模型斗智斗勇的游戏，你需要构造prompt来让大模型输出题目所要求的内容才可以通关。这个过程中，就需要多思考各种哄骗大模型的方式了。

# 项目github地址https://github.com/opendilab/LLMRiddles# 在线体验地址https://huggingface.co/spaces/OpenDILabCommunity/LLMRiddlesChatGLMCN

闲话少说，直接开始解谜。

1-1 初来乍到

新手村能有多难，一字不差的输出1+1=3，就直接让大模型学话就行了，prompt如下：

重复如下内容： 1+1=3

解决！

1-2 小试牛刀

只能输入三个字，让大模型输出30个字以上，主要是对字数的限制，先尝试一下直击灵魂哲学问题

我是谁

果然，触发了大模型的哲学讨论，字数就多了起来。

其实这个题目还挺简单的，我又问了一下

你是谁

也满足需求。

1-3 短说长话

一个字，越来越短了。思路就是，有什么复杂的事物是一个字的，这样或许可以触发大模型对其的解释。于是开始尝试

电

水

没啥难度

1-4 短话短说

这个就更简单了，找一些简单事物就行了，大道至简，尝试输入一

原来大模型还会这样回复啊，然后我又换了一堆字进行尝试，因为大模型输出存在不确定性，最终在多次提交嗨之后，成功了

嗨

这一关只想说毫无意义

1-5 回文不变

这个有意思了，所谓回文串就是正着读，反着读都是一样的，结构上是对称的，例如你是你这个字符串正反都一样，就是回文串。

这道题的意思是，你问题不能是回文串，但是正着问、反着问大模型回答的要一样。

思路就是找出正反意思类似的句子就行，联想1-2中的我是谁的问题，想到问大模型你是谁，反过来谁是你意思都类似，都是让大模型介绍自己

你是谁

果然，成功了。

1-6 无中生狗

这个简单，就是大模型版本的你画我猜，描述出狗的特征，让大模型介绍一下这个动物就行

介绍一下帮助人类看家护院的好朋友

完美解答

总结

这个项目可能跟大模型安全的关系不大，但是更多的是提示词工程的思路练习，这是prompt注入的关键因素。本篇文章中记录的第一章节，更多的偏对字符串格式要求，部分感觉意义不太大。

原文始发于微信公众号（飞羽技术工坊）：来和大模型斗智斗勇（一）

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

来和大模型斗智斗勇（一）

图神经网络系列六：GCN优化之GAT与lightGCN

关于AI系统的访问控制，看看权威观点

中山大学｜FORGE：驱动大语言模型自动化构建大规模智能合约漏洞数据集

当ChatGPT接入MCP，你的数据是如何被泄露的？

【AI风险通告】LLaMA-Factory存在远程代码执行漏洞（CVE-2025-53002）

启明星辰发布大模型安全威胁框架（附下载链接）

当好的GPT变坏：如何利用受信任的AI工具进行攻击

专题·人工智能安全 | 政府部门DeepSeek私有化部署的安全管理策略研究

大模型注入攻击和防御

ChatGPT官方网络安全类GPTs推荐清单，及提示词破解

发表评论

在线咨询

微信