告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1

admin 2025年1月30日02:08:37评论128 views字数 2167阅读7分13秒阅读模式

什么是Cloud Studio

Cloud Studio(云端 IDE)是基于浏览器的集成式开发环境,为开发者提供了一个稳定的云端工作站。支持CPU与GPU的访问。用户在使用 Cloud Studio 时无需安装,随时随地打开浏览器即可使用。 

传送门:https://ide.cloud.tencent.com/

DeepSeek-R1模型家族有哪些

首先,所有低于671b的模型都不是纯血的DeepSeek-R1,都是基于Qwen2.5和Llama的基础模型蒸馏
告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1
  • DeepSeek-R1-Zero:该模型直接对基础模型进行RL训练,不依赖任何SFT数据。采用Group Relative Policy Optimization(GRPO)算法来优化策略模型,减少训练成本。奖励模型主要包括准确性奖励和格式奖励,以确保模型输出的正确性和可读性。

  • DeepSeek-R1:该模型在DeepSeek-R1-Zero的基础上,引入冷启动数据和多阶段训练管道。首先,收集数千个冷启动数据对基础模型进行微调,然后进行以推理为导向的RL训练。在RL过程接近收敛时,通过拒绝采样和SFT生成新的SFT数据,并结合DeepSeek-V3的领域数据重新训练模型。最后,再次进行RL训练,得到DeepSeek-R1。

  • 蒸馏模型:选择Qwen2.5和Llama系列模型作为基础模型,这些模型本身具有较强的推理能力。通过简单的SFT蒸馏方法,将DeepSeek-R1的推理能力迁移到这些小型模型上。蒸馏后的模型在多个推理任务上表现出色。低于

    告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1

Step 1 创建GPU空间

登录Cloud Studio创建GPU工作空间

选择【Ollama模板】+【基础型规格】

告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1

大约相当于每月6.94天免费

等待5分钟环境初始化

Step 2 部署模型

操作方式类似vscode,这里直接打开一个终端

告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1

# 拉取14B模型(约30分钟,受网络影响)ollama pull deepseek-r1:14b# 启动交互式对话(出现>>>提示符即成功)  ollama run deepseek-r1:14b 

查看GPU状态:nvidia-smi 可以看到提供的是Tesla T4

Mon Jan 27 12:25:46 2025       +-----------------------------------------------------------------------------+| NVIDIA-SMI 525.105.17   Driver Version: 525.105.17   CUDA Version: 12.0     ||-------------------------------+----------------------+----------------------+| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC || Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. ||                               |                      |               MIG M. ||===============================+======================+======================||   0  Tesla T4            On   | 00000000:00:09.0 Off |                    0 || N/A   36C    P8     9W /  70W |      4MiB / 15360MiB |      0%      Default ||                               |                      |                  N/A |+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+| Processes:                                                                  ||  GPU   GI   CI        PID   Type   Process name                  GPU Memory ||        ID   ID                                                   Usage      ||=============================================================================||  No running processes found                                                 |+-----------------------------------------------------------------------------+

避坑指南

⚠️ 提示词敏感警告

  • 直接描述需求效果更好,少样本提示会显著降低其性能

⚠️ 局限提示

  • 复杂角色扮演
  • JSON输出
  • 多轮对话等场景能力仍然不如DeepSeek-V3

原文始发于微信公众号(玄月调查小组):告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年1月30日02:08:37
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1https://cn-sec.com/archives/3686384.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息