Ollama 是一个开源项目,旨在帮助用户轻松地在本地运行和部署大型语言模型(LLMs)。它提供了一个简单的框架,允许用户下载、管理和运行各种预训练的语言模型,而无需复杂的配置或依赖云服务。Ollama 的目标是让开发者和研究人员能够更方便地在本地环境中实验和应用 LLMs。
安装成功是这样:
2、装载DeepSeek-r1大模型:
DeepSeek提供多种模型版本,如V3基础模型和R1推理模型。
根据需求选择合适模型,V3适合日常对话,R1适合复杂推理任务。
在客户端或API调用时指定模型名称,如deepseek- v3或deepseek- r1。
以下两条命令 查看 或 运行 大模型:
3、集成式管理,这里我用AnyThingLLM。
关于《Ollama+DeepSeek+AnythingLLM搭建个人AI知识库》,可以看这里的帖子https://blog.csdn.net/m0_59164520/article/details/145460591?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-1-145460591-blog-145434863.235%5Ev43%5Epc_blog_bottom_relevance_base2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EOPENSEARCH%7ERate-1-145460591-blog-145434863.235%5Ev43%5Epc_blog_bottom_relevance_base2&utm_relevant_index=2,
但下面的训练数据一定要看我这里的,少走弯路。
在官网下载安装好后,运行,界面如下,
三、如何训练私有数据?
1、配置AnyThingLLM,一是LLM首选项
二是向量数据库
三是嵌入引擎
2、建立工作区,并配置
3、上传训练样本
我这里建立【Heaven's Gate】(以我上篇文章【天堂之门】技术来作例子),在红框这里上传我们的训练数据样本
4、训练数据来自【看雪论坛的几篇关于天堂之门的帖子】
这时,完成训练数据的构建,自动update到量数据库。
5、提出需求,得出结果
AI给出思考过程,
最后,给出它的答案:
这样,几篇训练数据就构建完成了我的新材料,完美地输出了结果。
【例子二】
1、同上面的1;
2、建立新工作区【恶意代码分析】,配置同上面的2;
3、上传PDF,训练数据入库;
4、提出需求,得出结果
后记:我也是初学者,只是进行了一些摸索,发现这个训练数据卡住了不少人,写出来分享给你,不要喷我。
原文始发于微信公众号(MicroPest):用DeepSeek训练私有数据
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论