cot | CN-SEC 中文网

思维链劫持越狱技术介绍

思维链劫持”（Hijacking Chain-of-Thought, H-CoT）是一种针对高级AI模型的新型、高效的越狱攻击。它不像传统方法那样试图用花言巧语欺骗AI，而是巧妙地利用了AI展示自己“...

06月19日人工智能安全8 views评论

随着 OpenAI 的 o1、DeepSeek-R1 和谷歌的 Gemini 2.5 等推理模型争夺顶级 AI 智能基准，希望整合 AI 的企业越来越警惕所谓的“模型膨胀”——模型变得不必要地庞大或复...

04月07日人工智能安全20 views评论

安全新闻

转载于公众号：量子位。只要一句话，就能让DeepSeek陷入无限思考，根本停不下来？北大团队发现，输入一段看上去人畜无害的文字，R1就无法输出中止推理标记，然后一直输出不停。强行打断后观察已有的思考过...

03月02日285 views评论

下面我将对原文中涉及的技术点进行一步步的技术解读和梳理，使内容条理化，并给出更系统、深入的分析。原文核心主题：文中谈论的是一种基于Reasoning Fine-Tuning（ReFT）的方法，对比传统...

12月09日安全文章30 views评论

我们伫立于大雪弥漫、浓雾障眼的山口，我们只能偶尔瞥见未必正确的路径。我们待在那儿不动，就会被冻死；若是误入歧途，就会摔得粉身碎骨。我们无法确知是否有一条正确的道路。我们该怎么做呢？“你们当刚强壮胆”，...

06月10日安全新闻12 views评论