一文详解RAG技术的五大范式及其发展历程
一文详解RAG技术的五大范式及其发展历程
检索增强生成(RAG)技术自2021年问世以来,经过多轮范式迭代,已经成为推动聊天机器人发展的一项关键技术。本文将带你全面了解RAG技术的五大范式及其发展历程,深入解析关键研究论文,并探讨工程实践中的痛点和解决方案。
一、综述与关键论文
1.1 三篇关键综述
- Zhao等人(2024)的综述详细介绍了RAG的三个基本范式:朴素RAG、高级RAG和模块化RAG。
- Gao等人(2024)的综述重点介绍了RAG在大语言模型中的应用,是该领域的最佳综述之一。
- Fan等人(2024)的综述探讨了RAG与大语言模型的结合,提出了检索增强大语言模型的概念。
1.2 发展历程
RAG技术的发展历程可以概括为以下几个阶段:
- 初始阶段:RAG主要用于LLMs的预训练阶段,以增强语言模型。
- 聊天机器人阶段:随着ChatGPT的发布,用于推理阶段的RAG方法迅速发展,演化出朴素RAG、高级RAG和模块化RAG三种范式。
- 知识图谱阶段:2024年微软开源的GraphRAG开启了第四种范式,融合了知识图谱。
- Agent阶段:2024年下半年出现的AgenticRAG,集成了前四种范式的优点,具有自适应性。
图1:RAG研究技术树
1.3 RAG基本概念
为什么需要RAG?
大型语言模型(LLMs)虽然取得了显著成就,但在特定领域或知识密集型任务中仍面临挑战,尤其是在处理超出其训练数据或需要当前信息的查询时,会产生"幻觉"。RAG通过从外部知识库中检索相关文档块,有效减少了生成与事实不符内容的问题。
RAG的起源
Lewis等人(2021)首次提出了RAG模型,通过结合预训练的参数记忆和非参数记忆,显著提高了模型在知识密集型任务中的性能。
RAG简单流程与总览
RAG的基本流程包括三个主要步骤:索引、检索和生成。索引阶段将文档分割成块并编码成向量;检索阶段根据语义相似度检索相关块;生成阶段将原始问题和检索到的块输入LLM,生成最终答案。
图3:应用于问答的RAG过程的代表性实例
二、高级RAG
高级RAG通过引入具体的改进措施,克服了朴素RAG的局限性。主要改进包括:
- 检索前策略:通过滑动窗口方法、细粒度分割和元数据整合优化索引技术。
- 检索后策略:采用多种优化方法简化检索过程。
关键论文:
- Jin等人(2024)开发了FlashRAG工具箱,提供了一个模块化的开源框架,支持12种先进的RAG算法和32个基准数据集。
- Sarma等人(2024)提出了HybridRAG,通过融合知识图谱和向量检索增强生成技术,提高了信息提取的准确性。
三、模块化RAG
模块化RAG架构超越了前两种RAG范式,具有更强的适应性和多功能性。主要特点包括:
- 支持顺序处理和跨组件的集成端到端训练。
- 通过路由、调度和融合机制控制RAG流程。
- 支持在不同应用场景中灵活扩展新方法。
关键论文:
- Gao等人(2024)提出了模块化RAG框架,将复杂的RAG系统分解为独立的模块和专门的操作符,形成高度可重构的框架。
四、GraphRAG
GraphRAG利用图数据库中的结构化信息,实现更精确、全面的检索,捕捉关系知识,促进更准确、更能感知上下文的响应。
关键论文:
- Peng等人(2024)对GraphRAG方法进行了全面概述,提出了基于图形的索引、图形引导的检索和图形增强的生成三个主要阶段。
- Edge等人(2024)提出了一种图RAG方法,通过图神经网络构建图索引,预生成相关实体的摘要,显著提升了大规模数据集的全局问题处理能力。
五、AgenticRAG
AgenticRAG将ReACT的推理能力与Agent的任务执行能力相结合,创建了一个动态和自适应的系统。主要特点包括:
- 通过使用ReACT根据用户查询的上下文动态协调Agent。
- 能够主动规划、执行并调整其方法以独立解决问题。
- 能够处理更复杂的任务,动态适应新挑战,并提供更具上下文相关性的响应。
关键论文:
- Singh等人(2025)对Agentic RAG进行了全面探索,讨论了其在医疗保健、金融和教育等行业的关键应用。
- Asai等人(2023)提出了Self-RAG框架,通过自我反思机制提高LM的质量和真实性。
六、其他重要研究方向
多模态RAG
- Yu等人(2024)提出了VisRAG,通过直接将文档作为图像嵌入到视觉-语言模型中,保留了文档中的所有信息。
- Faysse等人(2024)开发了ColPali模型,利用最新的视觉-语言模型生成高质量的上下文嵌入。
逻辑推理RAG
- Feng等人(2025)提出了AirRAG,通过树基搜索激活LLMs的内在推理能力。
个性化记忆扩展
- Mem0是一个开源项目,为AI助手和代理提供智能记忆层,支持多层次记忆和自适应个性化。
RAG系统性能优化
- Fan等人(2025)提出了MiniRAG,通过语义感知的异构图索引机制和轻量级拓扑增强检索方法,实现了在资源受限场景下的高效部署。
七、工程实践中的痛点与解决方案
在实际应用中,RAG系统面临多个痛点,包括内容缺失、错过排名靠前的文档、上下文整合限制、数据提取困难、格式错误、答案不准确、回答不完整、数据摄取可扩展性问题、结构化数据问答困难、复杂PDF数据提取、后备模型需求以及LLM安全性问题。解决方案包括优化检索策略、调整嵌入模型、改进提示词设计、采用先进的检索技术、并行处理、隐私保护等。
参考文献
[1] Zhao P, Zhang H, Yu Q, et al. Retrieval-Augmented Generation for AI-Generated Content: A Survey. arXiv, 2024.
[2] Gao Y, Xiong Y, Gao X, et al. Retrieval-Augmented Generation for Large Language Models: A Survey. arXiv, 2024.
[3] Fan W, Ding Y, Ning L, et al. A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models. arXiv, 2024.
[4] Lewis P, Perez E, Pikthus A, et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. arXiv, 2021.
[5] Jin J, Zhu Y, Yang X, et al. FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research. arXiv, 2024.
[6] Sarma B, Hall B, Rao R, et al. HybridRAG: Integrating Knowledge Graphs and Vector Retrieval Augmented Generation for Efficient Information Extraction. arXiv, 2024.
[7] Gao Y, Xiong Y, Wang M, et al. Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks. arXiv, 2024.
[8] Peng B, Zhu Y, Liu Y, et al. Graph Retrieval-Augmented Generation: A Survey. arXiv, 2024.
[9] Edge D, Trinh H, Cheng N, et al. From Local to Global: A Graph RAG Approach to Query-Focused Summarization. arXiv, 2024.
[10] Singh A, Ehtesham A, Kumar S, et al. Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG. arXiv, 2025.
[11] Asai A, Wu Z, Wang Y, et al. Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection. arXiv, 2023.
[12] Yu S, Tang C, Xu B, et al. VisRAG: Vision-based Retrieval-augmented Generation on Multi-modality Documents. arXiv, 2024.
[13] Faysse M, Sibille H, Wu T, et al. ColPali: Efficient Document Retrieval with Vision Language Models. arXiv, 2024.
[14] Feng W, Hao C, Zhang Y, et al. AirRAG: Activating Intrinsic Reasoning for Retrieval Augmented Generation via Tree-based Search. arXiv, 2025.
[15] Fan T, Wang J, Ren X, et al. MiniRAG: Towards Extremely Simple Retrieval-Augmented Generation. arXiv, 2025.
[16] Han H, Wang Y, Shomer H, et al. Retrieval-Augmented Generation with Graphs (GraphRAG). arXiv, 2025.
[17] Gupta S, Ranjan R, Singh S N. A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions. arXiv, 2024.
[18] Wang X, Wang Z, Gao X, et al. Searching for Best Practices in Retrieval-Augmented Generation. arXiv, 2024.
[19] Papers with Code - RAG. 2025.
[20] Graph Memory. 2025.
[21] Oroz T. Comparative Analysis of Retrieval Augmented Generator and Traditional Large Language Models. Data Science.
[22] Infiniflow. 万字长文梳理 2024 年的 RAG. 2025.