媲美 deepseek-r1:671b 的模型来了

2025年3月6日20:21:10评论27 views字数 371阅读1分14秒阅读模式

QwQ-32B 是阿里巴巴通义千问团队推出的一款高性能推理模型，拥有 320 亿参数，其性能可媲美 6710 亿参数 的 DeepSeek-R1 满血版。

该模型通过大规模强化学习（RL）训练，显著提升了在数学推理、编程和通用任务上的表现。在数学推理（如 AIME、MATH-500）、编程能力（如 LiveCodeBench）和通用能力（如 LiveBench、IFEval、BFCL）测试中，QwQ-32B 表现优异，甚至超越了 DeepSeek-R1。

QwQ-32B 需要 24GB 显存，可在消费级显卡（如 NVIDIA 4090）上运行。QWQ-32B 可支持 Ollama 本地部署。

Ollama 模型列表：

Ollama 中下载 QWQ-32B 模型：

等下载好了我测试一下模型能力。

全文完。

原文始发于微信公众号（生有可恋）：媲美 deepseek-r1:671b 的模型来了

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

本文由 admin 发表于 2025年3月6日20:21:10
转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出)：
媲美 deepseek-r1:671b 的模型来了https://cn-sec.com/archives/3805548.html
免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉.

媲美 deepseek-r1:671b 的模型来了

专题·人工智能安全 | 大模型联网的风险分析与应对举措

从0到1大模型MCP自动化漏洞挖掘实践

网络安全分析人员的生成式AI辅助指南

优秀论文 | 生成式人工智能在侦查讯问中的应用——基础、尝试、风险及对策建议

悟空Agent实战：LLaMA-Factory高危0day漏洞挖掘与修复

图神经网络系列六：GCN优化之GAT与lightGCN

关于AI系统的访问控制，看看权威观点

中山大学｜FORGE：驱动大语言模型自动化构建大规模智能合约漏洞数据集

当ChatGPT接入MCP，你的数据是如何被泄露的？

【AI风险通告】LLaMA-Factory存在远程代码执行漏洞（CVE-2025-53002）

发表评论

在线咨询

微信