什么是Cloud Studio
Cloud Studio(云端 IDE)是基于浏览器的集成式开发环境,为开发者提供了一个稳定的云端工作站。支持CPU与GPU的访问。用户在使用 Cloud Studio 时无需安装,随时随地打开浏览器即可使用。
传送门:https://ide.cloud.tencent.com/
DeepSeek-R1模型家族有哪些
-
DeepSeek-R1-Zero:该模型直接对基础模型进行RL训练,不依赖任何SFT数据。采用Group Relative Policy Optimization(GRPO)算法来优化策略模型,减少训练成本。奖励模型主要包括准确性奖励和格式奖励,以确保模型输出的正确性和可读性。
-
DeepSeek-R1:该模型在DeepSeek-R1-Zero的基础上,引入冷启动数据和多阶段训练管道。首先,收集数千个冷启动数据对基础模型进行微调,然后进行以推理为导向的RL训练。在RL过程接近收敛时,通过拒绝采样和SFT生成新的SFT数据,并结合DeepSeek-V3的领域数据重新训练模型。最后,再次进行RL训练,得到DeepSeek-R1。
-
蒸馏模型:选择Qwen2.5和Llama系列模型作为基础模型,这些模型本身具有较强的推理能力。通过简单的SFT蒸馏方法,将DeepSeek-R1的推理能力迁移到这些小型模型上。蒸馏后的模型在多个推理任务上表现出色。低于
Step 1 创建GPU空间
登录Cloud Studio创建GPU工作空间
选择【Ollama模板】+【基础型规格】
大约相当于每月6.94天免费
等待5分钟环境初始化
Step 2 部署模型
操作方式类似vscode,这里直接打开一个终端
# 拉取14B模型(约30分钟,受网络影响)ollama pull deepseek-r1:14b# 启动交互式对话(出现>>>提示符即成功) ollama run deepseek-r1:14b
查看GPU状态:nvidia-smi 可以看到提供的是Tesla T4
Mon Jan 27 12:25:46 2025 +-----------------------------------------------------------------------------+| NVIDIA-SMI 525.105.17 Driver Version: 525.105.17 CUDA Version: 12.0 ||-------------------------------+----------------------+----------------------+| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC || Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. || | | MIG M. ||===============================+======================+======================|| 0 Tesla T4 On | 00000000:00:09.0 Off | 0 || N/A 36C P8 9W / 70W | 4MiB / 15360MiB | 0% Default || | | N/A |+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+| Processes: || GPU GI CI PID Type Process name GPU Memory || ID ID Usage ||=============================================================================|| No running processes found |+-----------------------------------------------------------------------------+
避坑指南
⚠️ 提示词敏感警告
-
直接描述需求效果更好,少样本提示会显著降低其性能
⚠️ 局限提示
-
复杂角色扮演 -
JSON输出 -
多轮对话等场景能力仍然不如DeepSeek-V3
原文始发于微信公众号(玄月调查小组):告别本地算力焦虑:使用腾讯云免费GPU部署DeepSeek-R1
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论