【AI大模型】RAG 架构设计三阶段演进之路

创作时间:

作者:

@小白创作中心

【AI大模型】RAG 架构设计三阶段演进之路

引用

CSDN

https://m.blog.csdn.net/2401_85325557/article/details/143787633

RAG（Retrieval-Augmented Generation）是一种通过融合外部数据库知识来增强大型语言模型（LLMs）性能的技术。它在处理特定领域或知识密集型任务时表现出色，能够有效应对产生虚假信息、知识陈旧等问题。本文将详细介绍RAG架构设计的三个阶段演进：Naive RAG、Advanced RAG和Agentic RAG。

第一阶段：Naive RAG 架构设计

大型语言模型（LLMs）虽然展现出卓越的性能，但在处理特定领域或知识密集型任务时，存在一些挑战，比如：产生虚假信息、知识陈旧以及推理过程的非透明性和不可追溯性。RAG 技术作为一种有希望的解决方案，通过融合外部数据库的知识，有效应对了这些问题。它显著提升了生成内容的准确性和可靠性，尤其在知识密集型任务中表现突出，并支持知识的持续更新及特定领域信息的整合。

大模型 Naive RAG 的运作可概括为以下两个关键阶段：

检索阶段：大模型首先在外部知识库中搜寻与输入文本相关的信息。该知识库通常是由大规模文本数据集经过索引处理后形成的数据库。
生成阶段：将检索到的信息送入生成模型（比如：GPT-4o）。该生成大模型会根据这些信息，生成最终的回答或文本内容。

第二阶段：Advanced RAG 架构设计

大模型 Advacned RAG 技术在企业应用中的落地全流程，涵盖了架构、模块、技术三大方面，形成了一套完整的框架，包含10个关键模块和36项技术要点！对于一些关键且复杂的模块，比如：分块、向量化、重排等，也进行了全面总结和概述。

Query 理解（Query NLU）：利用 LLM 作为核心引擎，对用户 Query 进行改写以提升检索效果，涉及意图识别、歧义消除、Query 分解、抽象等七个技术点。
Query 路由（Query Routing）：查询路由是 LLM 支持的关键决策环节，决定了用户查询的下一步行动，包含一项核心技术。
索引（Indexing）：作为 RAG 中的核心模块，索引包括文档解析（五种工具）、文档切块（五类方法）、嵌入模型（六种类型）、索引类型（三种分类）等，共计八项技术。
Query 检索（Query Retrieval）：除了 Naive RAG 向量检索外，还关注图谱和关系数据库检索（NL2SQL），共涉及三项技术。
重排（Rerank）：不同检索策略的结果需要通过重排来优化，包括重排器类型（五种）和自训练领域重排器等，共计三项技术。
生成（Generation）：在企业应用中，生成环节可能会遇到重复、幻觉、流畅性、美化、溯源等问题，涉及 RLHF、偏好打分器、溯源 SFT、Self-RAG 等七项技术。
评估与框架：RAG 需要一个全链路的评价体系，作为企业上线和迭代的依据，包括三项技术。
RAG 新技术：探讨 RAG 未来的发展方向及实现路径，共提出三项潜在的新技术。

第三阶段：Agentic RAG 架构设计

最终，大模型 RAG 问答终章是 Agentic RAG！

向Lv2-智能体提出一个问题。
while (Lv2-智能体无法根据其记忆回答问题) {
    Lv2-智能体提出一个新的子问题待解答。
    Lv2-智能体向Lv1-RAG提问这个子问题。
    将Lv1-RAG的回应添加到Lv2-智能体的记忆中。
}
Lv2-智能体提供原始问题的最终答案。

比如：Query：“与第五交响曲创作于同一世纪的交通工具是什么？”，Agent 通过规划能力分两个子问题来解决：