随着 OpenAI 的 o1、DeepSeek-R1 和谷歌的 Gemini 2.5 等推理模型争夺顶级 AI 智能基准,希望整合 AI 的企业越来越警惕所谓的“模型膨胀”——模型变得不必要地庞大或复...
DeepSeek 出现严重漏洞!一个问题直接导致无限循环!
转载于公众号:量子位。只要一句话,就能让DeepSeek陷入无限思考,根本停不下来?北大团队发现,输入一段看上去人畜无害的文字,R1就无法输出中止推理标记,然后一直输出不停。强行打断后观察已有的思考过...
OpenAI Reft原理
下面我将对原文中涉及的技术点进行一步步的技术解读和梳理,使内容条理化,并给出更系统、深入的分析。原文核心主题:文中谈论的是一种基于Reasoning Fine-Tuning(ReFT)的方法,对比传统...
人、科研与大模型:对现状与未来的思考
我们伫立于大雪弥漫、浓雾障眼的山口,我们只能偶尔瞥见未必正确的路径。我们待在那儿不动,就会被冻死;若是误入歧途,就会摔得粉身碎骨。我们无法确知是否有一条正确的道路。我们该怎么做呢?“你们当刚强壮胆”,...