核心内容摘要
java+vue+springboot慈溪市猫咪宠物网王飞---
之前我们在讲大模型的应用方向和架构时有提到RAG、Agent、Fine-Tune。
在作者写大模型专题的文章时也是边学习边梳理边
总结。
在这个过程中大模型在各个方向都不断地快速发展对应的paper、理论、方向也是不断地涌现出来。
在理论不断发展实践不断丰富的过程中我们学习和使用RAG作者个人认为已经不能再单独孤立的去看了
RAG和Fine-Tune都是为了解决LLM的某些问题而出现我们需要去了解各自的优缺点和使用场景
RAG的核心知识以及应用、未来的发展趋势
混合增强策略RAG Fine-Tuning前言结合上述我们聊到的以及在学习和查阅资料的时候我发现好多文章都在写某一个方面我们进行梳理整合写一个大模型RAG的子系列方便大家集中阅读主要围绕以下展开
大模型应用RAG系列一之初识RAG为什么会出现RAG及未来发展趋势
大模型应用RAG系列二之RAG与Fine-Tune的区别应用场景
大模型应用RAG系列三之从0搭建一个RAG构建我们的垂域向量知识库
大模型应用RAG系列四之混合增强策略RAG Fine-Tuning什么是RAG所谓RAG检索增强生成Retrieval Augmented Generation简称 RAG已经成为当前最火热的LLM应用方案。
通俗点说;就是通过自有垂域数据库检索相关信息然后合并成为提示模板给大模型生成漂亮的回答。
为什么会出现RAGRAG的出现是因为在大模型的广泛应用中伴随着出现的一些问题比如知识的局限性模型自身的知识完全源于它的训练数据而现有的主流大模型ChatGPT、文心一言、通义千问…的训练集基本都是构建于网络公开的数据对于一些实时性的、非公开的或离线的数据是无法获取到的这部分知识也就无从具备。
幻觉问题所有的AI模型的底层原理都是基于数学概率其模型输出实质上是一系列数值运算大模型也不例外所以它有时候会一本正经地胡说八道尤其是在大模型自身不具备某一方面的知识或不擅长的场景。
而这种幻觉问题的区分是比较困难的因为它要求使用者自身具备相应领域的知识。
数据安全性对于企业来说数据安全至关重要没有企业愿意承担数据泄露的风险将自身的私域数据上传第三方平台进行训练。
这也导致完全依赖通用大模型自身能力的应用方案不得不在数据安全和效果方面进行取舍。
而RAG是解决上述问题的一套有效方案。
RAG 检索技术 LLM 提示。
例如我们向 LLM 提问一个问题RAG 从各种数据源检索相关的信息并将检索到的信息和问题注入到 LLM 提示中LLM 最后给出答案。
许多产品基于 RAG 构建从基于 web 搜索引擎和 LLM 的问答服务到使用私有数据的chat应用程序。
举个例子咱们以知识局限性为例众所周知GPT-4 Turbo的现实世界知识截止时间现在是2023年9月。
补充一下经朋友提醒plus用户更新到了
2
4。
而小米SU72021年3月小米官宣造车2021年9月小米汽车公司正式注册2022年8月小米自动驾驶技术视频公布2023年12月28日小米汽车召开技术发布会 2024年3月28日小米集团召开XIAOMI SU7上市发布会 同年4月3日XIAOMI SU7正式交付。
然后我们将这个问题让GPT-4 Turbo来回答看看RAG是如何解决问题的我们从数据准备、数据检索、LLM生成三个维度来看一张架构图这里简要的描述一下RAG的这个流程后面会再专门详细讲解。
完整的RAG应用流程主要包含两个阶段数据准备阶段数据提取——文本分割——向量化embedding——数据入库应用阶段用户提问——数据检索召回——注入Prompt——LLM生成答案RAG的优点
外部知识的利用RAG 模型可以有效地利用外部知识库它可以引用大量的信息以提供更深入、准确且有价值的答案这提高了生成文本的可靠性。
数据更新及时性RAG 模型具备检索库的更新机制可以实现知识的即时更新无需重新训练模型。
说明 RAG 模型可以提供与最新信息相关的回答高度适配要求及时性的应用。
回复具有解释性由于 RAG 模型的答案直接来自检索库它的回复具有很强的可解释性减少大模型的幻觉。
用户可以核实答案的准确性从信息来源中获取支持。
高度定制能力RAG 模型可以根据特定领域的知识库和 prompt 进行定制使其快速具备该领域的能力。
说明 RAG 模型广泛适用于的领域和应用比如虚拟伴侣、虚拟宠物等应用。
安全和隐私管理RAG 模型可以通过限制知识库的权限来实现安全控制确保敏感信息不被泄露提高了数据安全性。
减少训练成本RAG 模型在数据上具有很强的可拓展性可以将大量数据直接更新到知识库以实现模型的知识更新。
这一过程的实现不需要重新训练模型更经济实惠。
RAG的一些应用场景
问答系统QA SystemsRAG 可以用于构建强大的问答系统能够回答用户提出的各种问题。
它能够通过检索大规模文档集合来提供准确的答案无需针对每个问题进行特定训练。
文档生成和自动摘要Document Generation and Automatic SummarizationRAG 可用于自动生成文章段落、文档或自动摘要基于检索的知识来填充文本使得生成的内容更具信息价值。
智能助手和虚拟代理Intelligent Assistants and Virtual AgentsRAG 可以用于构建智能助手或虚拟代理结合聊天记录回答用户的问题、提供信息和执行任务无需进行特定任务微调。
信息检索Information RetrievalRAG 可以改进信息检索系统使其更准确深刻。
用户可以提出更具体的查询不再局限于关键词匹配。
知识图谱填充Knowledge Graph PopulationRAG 可以用于填充知识图谱中的实体关系通过检索文档来识别和添加新的知识点。
RAG的未来发展趋势RAG技术已超越了最初的文本问答范畴开始拥抱多样化的模态数据包括图像、音频、视频和代码。
这一扩展催生了创新的多模态模型如图像RA-CM3和BLIP-2等模型在图像和文本的检索与生成方面取得了突破。
音频和视频GSS方法和UEOP等技术在音频和视频的检索与生成方面展现了潜力。
代码RBPS和CoK等方法在代码检索和知识图谱问答任务中表现出色。
RAG技术最初被设计用于文本信息的检索和生成但其强大的知识增强能力使其在多模态数据领域具有巨大的潜力。
随着人工智能技术的发展对能够处理图像、音频、视频和代码等多种数据类型的系统的需求日益增长。
这种需求推动了RAG技术向多模态领域的扩展。
RAG技术面临的挑战尽管RAG技术已取得显著进展但仍面临一些挑战其中包括上下文长度限制LLMs的上下文窗口大小限制了RAG的有效性需要平衡信息的充分性和处理成本。
鲁棒性在检索过程中噪声或矛盾信息的存在可能严重影响RAG的输出质量。
混合方法RAGFT结合RAG和微调fine-tuning的策略正在兴起但如何优化两者的集成方式仍需探索。
LLM角色扩展LLMs在RAG框架中的作用不仅限于生成最终答案还包括检索和评估进一步挖掘LLMs的潜力成为研究的新方向。
综上我们能够看到未来RAG技术的发展将集中在以下几个方面技术优化、多模态融合、生态系统完善随着RAG技术的不断进步其在AI领域的应用前景广阔预计将在学术和工业界引起更多关注。
同时为了确保RAG技术的有效性和实用性对其评估方法的完善也将成为未来研究的关键方向。
想入门 AI 大模型却找不到清晰方向备考大厂 AI 岗还在四处搜集零散资料别再浪费时间啦2025 年AI 大模型全套学习资料已整理完毕从学习路线到面试真题从工具教程到行业报告一站式覆盖你的所有需求现在全部免费分享扫码免费领取全部内容
学习必备100本大模型电子书26 份行业报告 600 套技术PPT帮你看透 AI 趋势想了解大模型的行业动态、商业落地案例大模型电子书这份资料帮你站在 “行业高度” 学 AI
100本大模型方向电子书
26 份行业研究报告覆盖多领域实践与趋势报告包含阿里、DeepSeek 等权威机构发布的核心内容涵盖职业趋势《AI 职业趋势报告》《中国 AI 人才粮仓模型解析》商业落地《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》领域细分《AGI 在金融领域的应用报告》《AI GC
实践案例集》行业监测《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。
600套技术大会 PPT听行业大咖讲实战PPT 整理自
年热门技术大会包含百度、腾讯、字节等企业的一线实践安全方向《端侧大模型的安全建设》《大模型驱动安全升级腾讯代码安全实践》产品与创新《大模型产品如何创新与创收》《AI 时代的新范式构建 AI 产品》多模态与 Agent《Step-Video 开源模型视频生成进展》《Agentic RAG 的现在与未来》工程落地《从原型到生产AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。
求职必看大厂 AI 岗面试 “弹药库”300 真题 107 道面经直接抱走想冲字节、腾讯、阿里、蔚来等大厂 AI 岗这份面试资料帮你提前 “押题”拒绝临场慌
107 道大厂面经覆盖 Prompt、RAG、大模型应用工程师等热门岗位面经整理自
年真实面试场景包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题每道题都附带思路解析
102 道 AI 大模型真题直击大模型核心考点针对大模型专属考题从概念到实践全面覆盖帮你理清底层逻辑
97 道 LLMs 真题聚焦大型语言模型高频问题专门拆解 LLMs 的核心痛点与解决方案比如让很多人头疼的 “复读机问题”
路线必明 AI 大模型学习路线图1 张图理清核心内容刚接触 AI 大模型不知道该从哪学起这份「AI大模型 学习路线图」直接帮你划重点不用再盲目摸索路线图涵盖 5 大核心板块从基础到进阶层层递进一步步带你从入门到进阶从理论到实战。
L1阶段:启航篇丨极速破界AI新时代L1阶段了解大模型的基础知识以及大模型在各个行业的应用和分析学习理解大模型的核心原理、
关键技术以及大模型应用场景。
L2阶段攻坚篇丨RAG开发实战工坊L2阶段AI大模型RAG应用开发工程主要学习RAG检索增强生成包括Naive RAG、Advanced-RAG以及RAG性能评估还有GraphRAG在内的多个RAG热门项目的分析。
L3阶段跃迁篇丨Agent智能体架构设计L3阶段大模型Agent应用架构进阶实现主要学习LangChain、 LIamaIndex框架也会学习到AutoGPT、 MetaGPT等多Agent系统打造Agent智能体。
L4阶段精进篇丨模型微调与私有化部署L4阶段大模型的微调和私有化部署更加深入的探讨Transformer架构学习大模型的微调技术利用DeepSpeed、Lamam Factory等工具快速进行模型微调并通过Ollama、vLLM等推理部署框架实现模型的快速部署。
L5阶段专题集丨特训篇 【录播课】