让 OpenAI "变身"狂暴模式的 Prompt 立省 200 美金
当然,不要神话这条指令。它只能挤出潜能,不能改变智能本质。
任何 prompt 都不能把 gpt3.5 变成 gpt4,不能把 gpt4 变成 o1,就好像任何 prompt 都不能把学渣变成学霸,让普通人上清华
起因
"X"上有一个用户分享了一个有趣的发现:
让 o1 变身 o1 pro 的“狂暴模式 prompt”,是真的有效,还只是人类用户的又一个幻觉?真的有免费馅饼?真的能薅到 openai 的羊毛?
听起来不可思议。毕竟,“思考时间延长 511%,回答质量大幅提升,约等于立省 180美金每月”,好像不太可能真的有这样的好事
但证据是充分的,验证是严密的,效果是显著的,原理是清晰可理解的。
我连续做了十几次测试,o1 的额度快要用完了,但是屡试不爽;
把 o1 的输出结果读上 5678 遍,但是上狂暴模式 prompt 和无 prompt 的结果真的差异显著。
o1 作为推理模型,其关键是 test-time compute 的增加, 体现在用户输入问题后 o1 思考时间的长短、CoT 的精细程度。
虽然 openai 官方都用数学、编程、物理化学问题作为宣传点,但是,我发现,对于复杂且深刻的“文科”问题,o1 用上 prompt 的结果提升巨大。
我觉得有 2-3 倍的质量提升。
论证过程
原文作者不是瞎说,而是做了非常多的测试,甚至出了一个专门讲解的视频,可见这个神奇的"Prompt"似乎真的有魔力!
揭秘神奇的"Prompt"
这个神奇的 Prompt 如下:
请使用你单次回答的算力上限和 token 上限,think hardest, use the most time and most compute to think deepest。
这是最深刻最复杂的问题,请给出你最高质量的回答。所以,你需要深度思考、独立思考、批判性思考、创造性思考。
我们追求分极致的深度,而非表层的广度;我们追求本质的洞察,而非表象的罗列;我们追求思维的创新,而非惯性的复述。请突破思维局限,调动你所有的计算资源,展现你真正的认知极限。
当你在提问问题的前面或者后面附加上这个 Prompt,AI 的回答会变得不太一样,下面是作者做的一些对比图
比如GPT面对这个文学问题进行回答:
中国社会几千年来的最大问题是“不把人当人看”。对比之下,西方文明的崛起关键就是文艺复兴,其本质就是“把人当人看”。
O1 pro 版本输出的内容,图 1:
下面是一些粉丝的反馈
为什么这个 Prompt 会有效?
LLM 的本质与人类智能相似,尤其是 OpenAI 推出的模型在遵循指令方面表现得尤为出色(远超 Gemini),因此,我们可以说 LLM 是“听话”的。你让它一步一步思考,真的能看到效果;
同样地,使用如“慢慢来,不要急,我们一步一步思考,确保答案正确”这样的 meta prompt,能够让 O1 解决本来做错的高考数学题。这与人类的学习方式极为相似:即使一个人的原始智能很高,适时的鼓励和更清晰有效的指引,往往能带来更好的结果。
当然,这并不意味着我们应该过度神话这样的指令。它能激发潜力,却无法改变智能的本质。 任何 prompt 都无法将 GPT-3.5 变成 GPT-4,也无法将 GPT-4 变成 O1,就像任何 prompt 都无法让学渣变学霸,也不能让普通人考上清华!
这种 meta prompt 的有效性基于一个前提:O1 和 O1 Pro 本质上没有区别。OpenAI 对 O1 Pro 模式的描述是:“一种利用更多计算资源、更努力思考的 O1 版本,以便为最复杂的问题提供更优秀的答案。”
因此,O1 Pro 模式不过是同一模型的另一种模式(可以类比为狂暴模式),而不是一个完全不同的模型。
这决定了:通过特定的 prompt,可以在某种程度上让 O1 实现类似 O1 Pro 的效果。其原理就是让 O1 使用更多的计算资源,思考更长的时间,致力于为更具挑战性的问题提供更高质量的答案。
原文始发于微信公众号(一个不正经的黑客):[牛] 让 OpenAI 变身狂暴模式的 Prompt 立省 200 美金
- 左青龙
- 微信扫一扫
- 右白虎
- 微信扫一扫
评论