本文9691字 阅读约需 27分钟1从DeepSeek爆火说起DeepSeek作为中国人工智能领域的重要代表,于2024年12月26日发布DeepSeek-V3模型,随后2025年1月20号发布D...
代码大模型怎么选?开源模型选型及微调方法对比
热⻔开源模型HuggingfaceModelscope代码模型性能对⽐⼀、顶尖代码⼤模型性能对⽐表⼆、漏洞类型与模型适配矩阵三、基于模型效果推荐排序🔥1.深度定制场景:DeepSeek-Coder-V...
多厂家满血deepseek,对高校图书馆接入deepseek情况分析对比
豆包以下是南京部分高校DeepSeek接入情况表:高校名称使用模型模型类型大小应用场景发布时间消息来源东南大学DeepSeek-R1671B教学、科研及办公,未来可接入校本知识库打造“AI+教育”“A...
离线部署DeepSeek/QWen大模型
昨天,介绍了DeepSeek的部署,有些人问如何离线部署,那篇文章中没有讲,既然有这个需求,中午花了点时间介绍下离线部署,两种不同的方法部署DeepSeek、Qwen。一、DeepSeek离线部署1、...
五分钟搭建 DeepSeek R1 +Ollama 本地化 打造自己的私私有化AI知识库
昨天发布的在线形式的DeepSeek R1 后台好多人留言说没办法白嫖了,这点我很抱歉,可能太火爆了 我们可以等待一下 让看看腾讯后续是否补货。 今天特意想了下还是一次性说明白 我们也可以自...
本地离线部署DeepSeek、qwen等,超详细教程
(文末DeepSeek交流群)一、工作场景1、内网需要使用DeepSeek、qwen等大模型,这时就需要在内网(无互联网状态下)部署,2、内网部署DeepSeek、qwen等大模型提供服务以供内网同事...
零基础:从搭建DeepSeek开始
实验背景 在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前员工Andrew...
网络安全AI大模型训练从入门到精通
时至今日,众多IT大佬们开源共享,各种类型AI框架,训练工具等如雨后春笋般,层出不穷,类似AI大模型不再是高高在上,已经进入平民化,普通人亦可0基础做一个属于自己的AI。网络与信息安全行业更显的重要,...
外挂RAG知识库后原生Qwen1.5和Qwen2对于研发安全的理解会有提升吗?
先上结论:经过自建监督微调,以及基座模型的更新迭代,我们对原有的RAG技术进行了重新评估。结论是会提升! 耗费大成本去微调经常更新迭代的基座模型是不可取的。 高质量的专业RAG让原生Qwen1.5和Q...
阿里开源的qwen-agent长文本agent RAG
阿里这个方法,其实在langchain之前就实现了,只是说langchain是个框架,不做具体的内容。其实很多论文也有类似的解决多跳,不过我发这个原因是它国产的,自己人干的好就要吹加上qwen2tok...