告别本地算力焦虑：使用腾讯云免费GPU部署DeepSeek-R1

admin

142269
文章

117
评论

2025年1月30日02:08:37评论145 views字数 2167阅读7分13秒阅读模式

什么是Cloud Studio

Cloud Studio（云端 IDE）是基于浏览器的集成式开发环境，为开发者提供了一个稳定的云端工作站。支持CPU与GPU的访问。用户在使用 Cloud Studio 时无需安装，随时随地打开浏览器即可使用。

传送门：https://ide.cloud.tencent.com/

DeepSeek-R1模型家族有哪些

首先，所有低于671b的模型都不是纯血的DeepSeek-R1，都是基于Qwen2.5和Llama的基础模型蒸馏

DeepSeek-R1-Zero：该模型直接对基础模型进行RL训练，不依赖任何SFT数据。采用Group Relative Policy Optimization（GRPO）算法来优化策略模型，减少训练成本。奖励模型主要包括准确性奖励和格式奖励，以确保模型输出的正确性和可读性。
DeepSeek-R1：该模型在DeepSeek-R1-Zero的基础上，引入冷启动数据和多阶段训练管道。首先，收集数千个冷启动数据对基础模型进行微调，然后进行以推理为导向的RL训练。在RL过程接近收敛时，通过拒绝采样和SFT生成新的SFT数据，并结合DeepSeek-V3的领域数据重新训练模型。最后，再次进行RL训练，得到DeepSeek-R1。
蒸馏模型：选择Qwen2.5和Llama系列模型作为基础模型，这些模型本身具有较强的推理能力。通过简单的SFT蒸馏方法，将DeepSeek-R1的推理能力迁移到这些小型模型上。蒸馏后的模型在多个推理任务上表现出色。低于

Step 1 创建GPU空间

登录Cloud Studio创建GPU工作空间

选择【Ollama模板】+【基础型规格】

大约相当于每月6.94天免费

等待5分钟环境初始化

Step 2 部署模型

操作方式类似vscode，这里直接打开一个终端

# 拉取14B模型（约30分钟，受网络影响）ollama pull deepseek-r1:14b# 启动交互式对话（出现>>>提示符即成功）  ollama run deepseek-r1:14b

查看GPU状态：nvidia-smi 可以看到提供的是Tesla T4

Mon Jan 27 12:25:46 2025       +-----------------------------------------------------------------------------+| NVIDIA-SMI 525.105.17   Driver Version: 525.105.17   CUDA Version: 12.0     ||-------------------------------+----------------------+----------------------+| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC || Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. ||                               |                      |               MIG M. ||===============================+======================+======================||   0  Tesla T4            On   | 00000000:00:09.0 Off |                    0 || N/A   36C    P8     9W /  70W |      4MiB / 15360MiB |      0%      Default ||                               |                      |                  N/A |+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+| Processes:                                                                  ||  GPU   GI   CI        PID   Type   Process name                  GPU Memory ||        ID   ID                                                   Usage      ||=============================================================================||  No running processes found                                                 |+-----------------------------------------------------------------------------+

避坑指南

⚠️ 提示词敏感警告

直接描述需求效果更好，少样本提示会显著降低其性能

⚠️ 局限提示

复杂角色扮演
JSON输出
多轮对话等场景能力仍然不如DeepSeek-V3

原文始发于微信公众号（玄月调查小组）：告别本地算力焦虑：使用腾讯云免费GPU部署DeepSeek-R1

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

告别本地算力焦虑：使用腾讯云免费GPU部署DeepSeek-R1

什么是Cloud Studio

DeepSeek-R1模型家族有哪些

Step 1 创建GPU空间

Step 2 部署模型

操作方式类似vscode，这里直接打开一个终端

避坑指南

黄金赛道|MCP eBPF引爆AI应用可观测赛道

透视MCP交互

面向大模型的生成-利用式越狱攻击

云上LLM数据泄露风险研究系列（一）：基于向量数据库的攻击面分析

生成式AI应用分析报告（上）：深度合成服务现状

从零搭建企业安全自动化：Coze工作流实战手册

为什么 AI 可观察性需要一种新方法（eBPF）

MCP协议在网络安全领域应用（以Shodan 为例）

MCP Server 攻击面初探与思考

国内外大模型安全技术框架汇总

发表评论

在线咨询

微信