媲美 deepseek-r1:671b 的模型来了

admin 2025年3月6日20:21:10评论19 views字数 371阅读1分14秒阅读模式
QwQ-32B 是阿里巴巴通义千问团队推出的一款高性能推理模型,拥有 320 亿参数,其性能可媲美 6710 亿参数 的 DeepSeek-R1 满血版。
该模型通过大规模强化学习(RL)训练,显著提升了在数学推理、编程和通用任务上的表现。在数学推理(如 AIME、MATH-500)、编程能力(如 LiveCodeBench)和通用能力(如 LiveBench、IFEval、BFCL)测试中,QwQ-32B 表现优异,甚至超越了 DeepSeek-R1。
QwQ-32B 需要 24GB 显存,可在消费级显卡(如 NVIDIA 4090)上运行。QWQ-32B 可支持 Ollama 本地部署。
Ollama 模型列表:
媲美 deepseek-r1:671b 的模型来了
Ollama 中下载 QWQ-32B 模型:
媲美 deepseek-r1:671b 的模型来了
等下载好了我测试一下模型能力。
全文完。

原文始发于微信公众号(生有可恋):媲美 deepseek-r1:671b 的模型来了

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年3月6日20:21:10
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   媲美 deepseek-r1:671b 的模型来了https://cn-sec.com/archives/3805548.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息