资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

【RAG】RAG范式演进及Agentic-RAG总结综述

创作时间:

作者:

@小白创作中心

【RAG】RAG范式演进及Agentic-RAG总结综述

引用

来源

https://developer.volcengine.com/articles/7468990498733359143

RAG（检索增强生成）技术通过结合外部数据检索和大语言模型（LLM）生成能力，为自然语言处理（NLP）领域带来了革命性的突破。然而，传统的RAG系统在处理动态、多步推理任务时仍存在诸多局限。为了解决这些问题，Agentic RAG应运而生，通过引入自主代理和动态决策机制，实现了更高的灵活性和适应性。本文将深入探讨RAG范式的演进历程，并详细解析Agentic RAG的核心模式和系统分类。

RAG范式演进

Naive RAG：基础实现

Naive RAG是RAG范式的最初实现，其核心思想是通过简单的关键词检索来增强生成模型的能力。这种方法依赖于TF-IDF、BM25等传统的检索技术，从静态数据集中获取文档，并将其用于生成模型的输入。

优点：

简单易实现：由于依赖简单的关键词匹配，Naive RAG易于实现。
快速部署：适合需要快速上线的场景。

缺点：

缺乏上下文感知：由于仅依赖词汇匹配，无法捕捉查询的语义细微差别。
输出碎片化：生成的响应可能不连贯或过于通用。
可扩展性问题：在处理大规模数据集时表现不佳。

Advanced RAG：语义增强

为了克服Naive RAG的局限性，Advanced RAG引入了语义理解和增强的检索技术。Advanced RAG使用密集向量搜索模型（如Dense Passage Retrieval, DPR）和神经排序算法来提高检索的精确度。

关键特性：

密集向量搜索：通过将查询和文档表示在高维向量空间中，实现更好的语义对齐。
上下文重排：使用神经模型重新排序检索到的文档，优先考虑最相关的信息。
多跳检索：支持跨多个文档的推理，适用于复杂查询。

适用场景：

高精度需求：如研究综合和个人化推荐。

Modular RAG：模块化设计

Modular RAG代表了RAG范式的最新发展，强调灵活性和定制化。这种系统将检索和生成管道分解为独立的、可重用的组件，允许针对特定领域进行优化和任务适应。

创新点：

混合检索策略：结合稀疏和密集检索方法，以最大化不同查询类型的准确性。
工具集成：可以集成外部API、数据库或计算工具来处理专门任务。
可组合管道：允许独立替换、增强或重新配置检索器、生成器和其他组件。

适用场景：

复杂多领域任务：如金融分析和个性化推荐。

Graph RAG：图结构整合

Graph RAG通过整合图结构数据来扩展传统的RAG系统。这些系统利用图数据中的关系和层次结构来增强多跳推理和上下文丰富。

特点：

节点连接性：捕捉实体之间的关系。
层次知识管理：通过图结构处理结构化和非结构化数据。
上下文丰富：通过图路径增加关系理解。

适用场景：

结构化数据任务：如医疗诊断和法律研究。

Agentic RAG：自主代理

Agentic RAG代表了一种范式转变，通过引入能够动态决策和优化工作流的自主代理来实现更高层次的灵活性和适应性。与静态系统不同，Agentic RAG采用迭代细化和自适应检索策略来处理复杂的实时和多领域查询。

Agentic RAG的核心模式

反思

定义：智能体评估自己的决策和输出，识别错误和需要改进的领域。
主要优势：
启用迭代结果改进。
提高多步推理任务的准确性。
示例：在医疗诊断系统中，智能体根据检索到的数据进行迭代反馈，以完善诊断。

规划

定义：智能体创建结构化的工作流和任务序列，以高效解决问题。
主要优势：
通过分解任务，促进多步推理。
通过优化任务优先级，减少计算开销。
示例：金融分析系统规划数据检索任务，以评估风险并提供建议。

工具使用

定义：智能体与外部工具、API和知识库交互，以检索和处理数据。
主要优势：
扩展系统的能力，超越预训练知识。
通过整合外部资源，实现特定领域的应用。
示例：法律助理智能体从合同数据库中检索条款，并应用特定领域的规则进行合规性分析。

多智能体协作

定义：多个智能体协作，通过分工和共享信息及结果来解决复杂任务。
主要优势：
高效处理大规模和分布式问题。
结合专业智能体的能力，获得更好的结果。
示例：在客户支持中，智能体协作以从常见问题解答（FAQ）中检索知识、生成响应并提供后续服务。 LawGlance通过利用多智能体工作流简化法律研究，检索相关文件，分析信息，并提供精确的法律见解。它整合了Crew AI、LangChain和Chroma，以检索法律文件、进行网络搜索，并提供针对用户查询的简洁、准确的答案。

小结：这些模式构成了Agentic RAG系统的核心，使它们能够动态适应任务需求，通过自我评估改进决策，利用外部资源进行特定领域的推理，通过协作处理复杂、分布式的工作流。

Agentic RAG系统的分类

Agentic检索增强型生成（RAG）系统涵盖了各种架构和工作流，每种都针对特定任务和复杂程度进行了定制。

单智能体RAG

核心思想：由单个自主智能体管理检索和生成过程。
工作流程：
1. 向智能体提交查询。
2. 智能体从外部来源检索相关数据。
3. 对数据进行处理并合成回复。
优点：
对于基本用例，架构简单。
易于实现和维护。
局限性：
可扩展性有限。
对于多步推理或大型数据集效果不佳。

多智能体RAG

核心思想：一组智能体协作执行复杂的检索和推理任务。
工作流程：
1. 智能体动态划分任务（例如，检索、推理、合成）。
2. 每个智能体专门负责特定的子任务。
3. 将结果汇总并合成为连贯的输出。
优点：
对于分布式、多步任务表现更佳。
模块化程度更高，可扩展性更强。
局限性：
随着智能体数量的增加，协调复杂度上升。
智能体之间存在冗余或冲突的风险。

分层智能体RAG

核心思想：将智能体组织成层次结构，以便更好地进行任务优先级排序和委派。
工作流程：
1. 顶层智能体在较低层级智能体之间协调子任务。
2. 每个较低层级智能体处理流程中的特定部分。
3. 结果在较高层级迭代优化并整合。
优点：
对于大型复杂任务具有可扩展性。
模块化设计便于实现专业化。
局限性：
需要复杂的协调机制。
在层级结构的较高层级可能出现瓶颈。

纠错智能体RAG

核心思想：通过反馈循环使智能体能够迭代评估和优化其输出。
工作流程：
1. 智能体生成初始回复。
2. 一个评判模块评估回复是否存在错误或不一致之处。
3. 智能体根据反馈优化回复。
4. 重复步骤2 - 3，直到输出达到质量标准。
优点：
通过迭代改进实现高准确性和可靠性。
对于容易出错或高风险任务很有用。
局限性：
计算开销增加。
反馈机制必须精心设计，以避免无限循环。

自适应智能体RAG

核心思想：根据任务要求动态调整检索策略和工作流程。
工作流程：
1. 智能体评估查询及其上下文。
2. 根据可用数据和用户需求实时调整检索策略。
3. 使用动态工作流程合成回复。
优点：
对于各种任务和动态环境具有高度灵活性。
提高上下文相关性和用户满意度。
局限性：
设计强大的自适应机制具有挑战性。
实时调整会带来计算开销。

基于图的智能体RAG

基于图的RAG系统通过整合基于图的数据结构进行高级推理，扩展了传统的RAG。

Agent - G：用于图RAG的智能体框架

核心思想：使用图知识库和反馈循环，动态地将任务分配给专门的智能体。
工作流程：
1. 从图知识库中提取关系（例如，疾病与症状的映射）。
2. 用来自外部来源的非结构化数据进行补充。
3. 使用评判模块验证结果并迭代改进。
优点：
结合了结构化和非结构化数据。
对于复杂任务具有模块化和可扩展性。
通过迭代优化确保高准确性。