一、简介在实际应用中,针对任务的具体需求,我们会对大模型进行微调使其能更好适应专门的任务和场景。然而,在具体任务实现时,即使是对较小的大模型(如7B)进行微调也需要大量的算力资源,并且在没有大量的数据...
这半年多的AI经验杂谈
2022年11月左右看到一篇关于openai的ai起飞的文章,我开始关注openai 注册了账号搞了api测试gpt3.5的水平,那时候的gpt3.5虽然不能写的很好,运行经常报错,但是改改就可以用了...
手把手教你个人离线AI知识库搭建
声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由用户承担全部法律及连带责任,文章作者不承担任何法律及连带责任。博客新域名:https://gugesay...
【论文速读】| 涟漪下的漩涡:对启用RAG的应用程序的实证研究
本次分享论文:Vortex under Ripplet: An Empirical Study of RAG-enabled Applications基本信息原文作者:Yuchen Shao, Yuh...
RAG QA 系统的检索和生成调优
点击蓝字 关注我们 RAG QA系统的检索 和生成调优 随着联想AI PC的推出,消费者越来越多地接触到大型语言模型应用(LLMs)。这些应用可以回答用户的问题,提供有用的信息,甚至进行有意义的对话。...
有趣的AI安全-数据污染导致敏感信息泄露
今天看到一个有趣的AI安全问题原文是:https://promptarmor.substack.com/p/data-exfiltration-from-writercom整个漏洞的触发流程是这样的:...
外挂RAG知识库后原生Qwen1.5和Qwen2对于研发安全的理解会有提升吗?
先上结论:经过自建监督微调,以及基座模型的更新迭代,我们对原有的RAG技术进行了重新评估。结论是会提升! 耗费大成本去微调经常更新迭代的基座模型是不可取的。 高质量的专业RAG让原生Qwen1.5和Q...
阿里开源的qwen-agent长文本agent RAG
阿里这个方法,其实在langchain之前就实现了,只是说langchain是个框架,不做具体的内容。其实很多论文也有类似的解决多跳,不过我发这个原因是它国产的,自己人干的好就要吹加上qwen2tok...
技术实践 | RAG精确应对大模型敏感问题知识幻觉难题
一、引言在大模型的实际应用落地过程中,会遇到所谓的幻觉(Hallucination)问题。对于语言模型而言,当生成的文本语法正确流畅,但与原文不符(Faithfulness)或事实不符(Factual...
碳泽解读 | 生产环境中的RAG——分块决策(Chunking Decisions
从原型到生产——关于分块策略和避免失败的决策过程不同的领域和类型的查询需要不同的分块策略。灵活的分块方法使RAG系统能够适应各种领域和信息需求,从而最大限度地提高其在不同应用程序中的有效性。和你一样,...
推荐3款Github上开源的大模型,非常惊艳
在人工智能的浪潮中,大型语言模型(LLM)正成为推动技术进步的关键力量。 最近,几个值得关注的开源项目以其创新性和实用性引起了业界的广泛兴趣。在这里,七夜给大家分享一下。 Meta Llama 3 M...
利用llm api 长文本阅读代码和学习
之前写了一个开源的长文本的代码阅读 ,其实很流程很简单的,如果使用langchain是可以很快解决这个问题的。我目前也是用自己写的python langchain来实现阅读代码,舒服的一批!地址我再发...
4