问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

一文详解RAG技术的五大范式及其工程实践

创作时间:
作者:
@小白创作中心

一文详解RAG技术的五大范式及其工程实践

引用
1
来源
1.
https://cloud.tencent.com/developer/article/2498870

RAG(Retrieval-Augmented Generation)技术自2021年问世以来,经历了快速的发展和迭代。从最初的简单形态到如今的复杂完善,RAG系统已经演化出多种范式,包括NaiveRAG、AdvancedRAG、ModularRAG、GraphRAG和最新的AgenticRAG。本文将为您梳理RAG技术的关键进展和五大范式,并总结工程应用中的常见工具和痛点。

一、综述与关键论文

1.1 三篇关键综述

  • Zhao等人的综述(2024)详细介绍了RAG的三个基本范式:朴素RAG、高级RAG和模块化RAG。
  • Gao等人的综述(2024)是该领域最具影响力的综述之一,全面概述了RAG在大语言模型中的应用。
  • Fan等人的综述(2024)探讨了RAG与大语言模型的结合,提出了检索增强大语言模型的概念。

1.2 发展历程

RAG技术的发展历程可以概括为以下几个阶段:

  1. 2021年:RAG首次被用于LLMs的预训练阶段。
  2. ChatGPT发布后:大量用于推理阶段的RAG方法涌现,演化出NaiveRAG、AdvancedRAG和ModularRAG三种范式。
  3. 2024年:微软开源的GraphRAG开启了第四种范式,融合了知识图谱。
  4. 2024年下半年:AgenticRAG出现,成为前四种范式的集大成者,具有自适应性。


图1:按照主要设计重点、提出时间及影响力(以引用量体现)梳理的检索增强生成(RAG)和检索增强大语言模型(RA - LLMs)方法。


图2:RAG研究技术树。

1.3 RAG基本概念

为什么需要RAG?
大型语言模型(LLMs)虽然取得了显著成就,但在特定领域或知识密集型任务中仍面临挑战,尤其是在处理超出其训练数据或需要当前信息的查询时,会产生"幻觉"。RAG通过从外部知识库中检索相关文档块,有效减少了生成与事实不符内容的问题。

RAG的起源
RAG的起源可以追溯到Lewis等人的研究(2021),他们提出了将预先训练的参数记忆和非参数记忆结合起来用于语言生成的模型。这种方法通过引入检索增强生成(RAG)模型,显著提高了模型在知识密集型任务中的性能。

RAG简单流程与总览
RAG的基本流程包括三个主要步骤:索引、检索和生成。索引阶段将文档分割成块并编码成向量;检索阶段根据语义相似度检索相关块;生成阶段将原始问题和检索到的块一起输入LLM,生成最终答案。


图3:应用于问答的RAG过程的代表性实例。


图4:RAG三种范式的比较。

二、RAG技术的五大范式

2.1 高级RAG

高级RAG通过引入具体的改进措施,克服了朴素RAG的局限性。它采用了检索前和检索后策略,优化了索引技术和检索过程。关键论文包括Jin等人的FlashRAG研究(2024),提出了一个模块化的开源工具包,帮助研究人员在统一框架内复制和开发RAG方法。


图6:FlashRAG工具箱总览。

2.2 模块化RAG

模块化RAG超越了前两种RAG范式,具有更强的适应性和多功能性。它采用了多种策略来改进其组件,例如为相似性搜索添加搜索模块,以及通过微调完善检索器。关键论文包括Gao等人的研究(2024),提出了模块化RAG框架,通过将复杂的RAG系统分解为独立的模块和专门的操作符,形成高度可重构的框架。


图8:三种 RAG 范式之间的比较。

2.3 GraphRAG

GraphRAG利用图数据库中的结构化信息来增强RAG系统的检索能力。关键论文包括Peng等人的综述(2024),全面概述了GraphRAG方法,包括基于图形的索引、图形引导的检索和图形增强的生成。


图9:GraphRAG流程。

2.4 AgenticRAG

AgenticRAG将ReACT的推理能力与Agent的任务执行能力相结合,创建了一个动态和自适应的系统。关键论文包括Singh等人的综述(2025),探讨了Agentic RAG如何通过将自主AI代理嵌入RAG管道,超越传统RAG系统的限制。


图13:AgenticRAG工作流程。

三、工程实践

3.1 RAG框架

在工程实践中,选择合适的RAG框架至关重要。推荐使用RAGFlow,这是一个模块化的开源工具包,支持快速构建和部署RAG系统。

3.2 文档解析

文档解析是RAG系统中的关键环节。推荐使用MinerU,这是一个强大的文档解析工具,支持多种数据格式的解析和处理。

3.3 RAG的12个痛点

在实际应用中,RAG系统可能会遇到多个痛点,包括内容缺失、错过排名靠前的文档、格式错误、答案不正确等问题。解决方案包括优化检索策略、调整嵌入模型、改进提示词设计等。

四、总结

RAG技术的发展呈现出几个重要趋势:

  1. 数据库层面:从简单的词嵌入发展到向量数据库、知识图谱,再到混合的多种类型数据库。
  2. 数据方面:从单纯文本扩展到多模态数据,包括文本、音频、图片、视频。
  3. 工作流层面:设计编排一个高效准确的RAG pipeline。
  4. 动态自动化层面:让RAG系统作为一个agent主动自适应复杂查询。

参考文献

[1] Zhao P, Zhang H, Yu Q, et al. Retrieval-Augmented Generation for AI-Generated Content: A Survey. arXiv, 2024.

[2] Gao Y, Xiong Y, Gao X, et al. Retrieval-Augmented Generation for Large Language Models: A Survey. arXiv, 2024.

[3] Fan W, Ding Y, Ning L, et al. A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models. arXiv, 2024.

[4] Lewis P, Perez E, Pikthus A, et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. arXiv, 2021.

[5] Jin J, Zhu Y, Yang X, et al. FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research. arXiv, 2024.

[6] Sarmah B, Hall B, Rao R, et al. HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction. arXiv, 2024.

[7] Gao Y, Xiong Y, Wang M, et al. Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks. arXiv, 2024.

[8] Peng B, Zhu Y, Liu Y, et al. Graph Retrieval-Augmented Generation: A Survey. arXiv, 2024.

[9] Edge D, Trinh H, Cheng N, et al. From Local to Global: A Graph RAG Approach to Query-Focused Summarization. arXiv, 2024.

[10] Singh A, Ehtesham A, Kumar S, et al. Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG. arXiv, 2025.

[11] Asai A, Wu Z, Wang Y, et al. Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection. arXiv, 2023.

[12] Yu S, Tang C, Xu B, et al. VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents. arXiv, 2024.

[13] Faysse M, Sibille H, Wu T, et al. ColPali: Efficient Document Retrieval with Vision Language Models. arXiv, 2024.

[14] Feng W, Hao C, Zhang Y, et al. AirRAG: Activating Intrinsic Reasoning for Retrieval Augmented Generation via Tree-based Search. arXiv, 2025.

[15] Fan T, Wang J, Ren X, et al. MiniRAG: Towards Extremely Simple Retrieval-Augmented Generation. arXiv, 2025.

[16] Han H, Wang Y, Shomer H, et al. Retrieval-Augmented Generation with Graphs (GraphRAG). arXiv, 2025.

[17] Gupta S, Ranjan R, Singh S N. A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions. arXiv, 2024.

[18] Wang X, Wang Z, Gao X, et al. Searching for Best Practices in Retrieval-Augmented Generation. arXiv, 2024.

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号