推理模型 | CN-SEC 中文网

人工智能安全

万字长文DeepSeek-R1、Kimi 1.5及强推理模型开发解读（长文配视频）

北大 AI 对齐团队对包括 DeepSeek-R1、Kimi-K1.5在内的一些强推理模型进行了 2 万字的技术解读，也是此前 o1 解读的续作。建议文字搭配视频观看，效果更佳。视频：DeepSeek...

03月31日3 views评论

人工智能安全

引言：推理模型的新王诞生2025年3月，阿里Qwen团队扔出一颗“技术核弹”——仅320亿参数的QwQ-32B推理模型，竟在多项评测中碾压参数高达6710亿的DeepSeek R1！这场以小博大的战役...

03月10日65 views评论

安全新闻

转载于公众号：量子位。只要一句话，就能让DeepSeek陷入无限思考，根本停不下来？北大团队发现，输入一段看上去人畜无害的文字，R1就无法输出中止推理标记，然后一直输出不停。强行打断后观察已有的思考过...

03月02日233 views评论

人工智能安全

「Z计划」是智谱面向未上市初创企业与优秀独立开发者/团队，提供 Tokens 赞助、投资支持和技术支持等资源的创新加速计划。面向全球，持续招募中！🐋（点击报名）「Z基金」是智谱联合生态伙伴设立的大模型...

02月12日20 views评论

安全闲碎

DeepSeek是什么？• DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。• DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。Deeps...

02月10日177 views评论

人工智能安全

早上打开VS Code，发现copilot目前已经支持o3-mini模型：o3-mini 推理模型在编码基准测试中优于 o1，响应时间与 o1-mini 相当，这意味着您将在几乎相同的延迟下获得更高的...

02月08日61 views评论

安全新闻

近日，斯坦福大学和华盛顿大学的人工智能研究人员仅凭50美元的云计算积分，就训练出了一个具备“推理”能力的AI模型。据上周五发布的一篇最新研究论文https://arxiv.org/pdf/2501.1...

02月07日17 views评论

编者按和大家一样，春节假期期间，公号君也高度关注DeepSeek的技术表现。作为一名研究法律政策的人员，当然也关注其可能带来的潜在影响。今天是本系列的开篇。最近，DeepSeek团队发布了其最新的AI...

02月03日人工智能安全45 views评论