用DeepSeek训练私有数据

admin 2025年2月11日01:04:54评论76 views字数 1476阅读4分55秒阅读模式
这段时间,研究DeepSeek的应用成为了最流行的话题,部署它在内网中来训练私有数据、为我所用的运用尝试在各大群中热火朝天、铺天盖地地讨论着,“第四次工业革命”的威力果不其然。我也进行了一些学习尝试,利用DeepSeek训练数据,助力我们完成一些“非常规”的研究。其间,也走了一些弯路,现将成功之道分享给你们。
一、一键式生成PPT
这是我最近在内部一次交流课上的ppt,用了“提出要求+DeepSeek生成文案+Kimi ppt助手”组合式手法,一键生成了一份ppt,非常美观,省力无数,效率提升1000倍,看下界面:
用DeepSeek训练私有数据
二、本地部署
1、Ollama安装

Ollama 是一个开源项目,旨在帮助用户轻松地在本地运行和部署大型语言模型(LLMs)。它提供了一个简单的框架,允许用户下载、管理和运行各种预训练的语言模型,而无需复杂的配置或依赖云服务。Ollama 的目标是让开发者和研究人员能够更方便地在本地环境中实验和应用 LLMs。

安装成功是这样:

用DeepSeek训练私有数据

2、装载DeepSeek-r1大模型:

DeepSeek提供多种模型版本,如V3基础模型和R1推理模型。

根据需求选择合适模型,V3适合日常对话,R1适合复杂推理任务。

在客户端或API调用时指定模型名称,如deepseek- v3或deepseek- r1。

以下两条命令 查看 或 运行 大模型:

用DeepSeek训练私有数据

3、集成式管理,这里我用AnyThingLLM。

关于《Ollama+DeepSeek+AnythingLLM搭建个人AI知识库》,可以看这里的帖子https://blog.csdn.net/m0_59164520/article/details/145460591?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-1-145460591-blog-145434863.235%5Ev43%5Epc_blog_bottom_relevance_base2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-1-145460591-blog-145434863.235%5Ev43%5Epc_blog_bottom_relevance_base2&utm_relevant_index=2,

但下面的训练数据一定要看我这里的,少走弯路。

在官网下载安装好后,运行,界面如下,

用DeepSeek训练私有数据

三、如何训练私有数据?

1、配置AnyThingLLM,一是LLM首选项

用DeepSeek训练私有数据

二是向量数据库

用DeepSeek训练私有数据

三是嵌入引擎

用DeepSeek训练私有数据
【例子一】

2、建立工作区,并配置

用DeepSeek训练私有数据

3、上传训练样本

用DeepSeek训练私有数据

我这里建立【Heaven's Gate】(以我上篇文章【天堂之门】技术来作例子),在红框这里上传我们的训练数据样本

4、训练数据来自【看雪论坛的几篇关于天堂之门的帖子】

用DeepSeek训练私有数据

这时,完成训练数据的构建,自动update到量数据库。

5、提出需求,得出结果

用DeepSeek训练私有数据

AI给出思考过程,

用DeepSeek训练私有数据

最后,给出它的答案:

用DeepSeek训练私有数据

这样,几篇训练数据就构建完成了我的新材料,完美地输出了结果。

【例子二】

1、同上面的1;

2、建立新工作区【恶意代码分析】,配置同上面的2;

3、上传PDF,训练数据入库;

用DeepSeek训练私有数据

4、提出需求,得出结果

用DeepSeek训练私有数据

后记:我也是初学者,只是进行了一些摸索,发现这个训练数据卡住了不少人,写出来分享给你,不要喷我。

原文始发于微信公众号(MicroPest):用DeepSeek训练私有数据

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年2月11日01:04:54
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   用DeepSeek训练私有数据https://cn-sec.com/archives/3724727.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息