问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

检索增强生成(RAG)技术与应用的全景图

创作时间:
作者:
@小白创作中心

检索增强生成(RAG)技术与应用的全景图

引用
CSDN
1.
https://m.blog.csdn.net/qq_36603091/article/details/145821946

检索增强生成(RAG)是人工智能领域中一种先进技术,它将大型语言模型(LLMs)的能力与实时数据检索相结合,以提供上下文相关且最新的响应。这种方法解决了传统LLMs的局限性,这些模型通常依赖于静态的预训练数据,导致输出内容过时或不准确。RAG系统通过从外部知识源动态检索信息,如知识库、API或网络,增强了响应的相关性和时效性。

1. RAG的发展

1.1 朴素RAG


朴素RAG是检索增强生成的基础实现,侧重于基于关键词的检索和静态数据集。这些系统使用简单技术(如TF-IDF和BM25)来获取文档,然后将其用于增强语言模型的生成能力。虽然易于实现,但朴素RAG缺乏对查询语义的理解,常常导致输出内容碎片化。

1.2 高级RAG

高级RAG在朴素RAG的基础上,引入了语义理解和增强的检索技术。它利用密集检索模型(如Dense Passage Retrieval,DPR)和神经排序算法来提高检索精度。关键特性包括密集向量搜索、上下文重新排序和迭代检索,使其适用于需要高精度和细微理解的应用。

1.3 模块化RAG


模块化RAG强调灵活性和定制化,将检索和生成管道分解为独立、可重用的组件。这允许针对特定领域进行优化和任务适应。关键创新包括混合检索策略、工具集成和可组合管道,使其适用于复杂的多领域任务。

1.4 图RAG


图RAG通过整合图数据结构扩展了传统RAG系统。这些系统利用图数据中的关系和层次结构来增强多跳推理和上下文丰富。图RAG适用于需要关系理解的任务,如医疗诊断和法律研究。

1.5 代理RAG


代理RAG通过在RAG管道中引入自主代理,实现了动态决策、迭代推理和自适应检索策略。这些代理利用代理设计模式(如反思、规划、工具使用和多代理协作)来管理检索策略并优化工作流程。代理RAG系统在需要精确性和适应性的场景中表现出色,如客户支持、金融分析和自适应学习平台。

2. RAG的核心组件


RAG系统整合了三个主要组件:

2.1. 检索模块

检索模块是RAG的基石,负责查询外部数据源,如知识库、API或向量数据库。先进的检索器利用密集向量搜索和基于变换器的模型来提高检索精度和语义相关性,包含以下关键技术:

  • 分块与索引
    采用动态分块策略(如父文档检索、语义分块)将知识库文档分割为可管理单元,结合滑动窗口(chunk overlap)保留上下文连续性。索引优化通过多粒度嵌入(句子/段落级)提升语义召回率,典型技术包括:

  • 稀疏检索(BM25):基于关键词匹配,效率高但语义理解有限;

  • 密集检索(DPR/REALM):利用双编码器模型捕捉语义相似性;

  • 混合检索:结合稀疏与密集方法平衡效率与精度。

  • 数据加载与预处理
    支持多源数据格式(PDF/HTML/CSV)的加载器(如PyPDFLoader、WebBaseLoader),通过数据清洗(去噪声、语法纠错)和元数据增强(时间戳、章节标题)提升索引质量。

2.2. 增强策略

增强策略旨在优化检索结果与生成需求的匹配度:

  • 查询对齐
    使用LLM对用户查询进行重写与扩展(HyDE生成假设性文档),解决语义鸿沟问题。
  • 多跳推理
    迭代式检索(如Self-RAG)通过多次检索逐步逼近答案,适用于复杂场景(医疗诊断中的症状-病因链式推理)。
  • 上下文融合
    采用重排序(Cohere交叉编码器)筛选关键信息,结合聚焦模式(Focus Mode)压缩无关段落,降低噪声干扰。

2.3. 生成模块

生成模块将检索结果与用户查询结合,生成最终响应:

  • 约束生成
    强制引用机制确保输出基于检索内容,减少幻觉;多模态生成(OmniSearch框架)支持图文混合问答。
  • 反馈优化
    Self-RAG通过生成评分动态调整检索策略,实现闭环迭代优化。

2.4组件优化方法

2.41. 预检索优化

  • 分块策略优化
  • 任务驱动分块:摘要任务使用大块(512 tokens),编码任务采用小块(128 tokens);
  • 层级检索:先检索子块定位关键信息,再关联父文档补充上下文(父文档检索技术)。
  • 嵌入模型优化
    领域微调(如医疗术语适配)提升垂直场景性能,混合编码(TF-IDF+向量)增强鲁棒性。

2.4.2. 检索优化

  • 混合路由扩展
  • 多跳检索:结合实体链指实现多阶段推理(如法律案例中的条文-判例关联);
  • 跨语言检索:构建中英混合索引支持多语言问答。
  • 动态相似度计算
    引入对比学习(Contrastive ICL)训练模型区分可靠与虚假信息,提升检索相关性。

2.4.3. 后检索优化

  • 上下文压缩
    基于注意力权重的关键句提取,减少输入LLM的冗余信息。
  • 事实核查
    使用FActScore工具对比生成内容与检索结果,标记不一致部分。

2.4.4. 模块化架构优化

  • 灵活组件替换
    知识图谱索引替代传统向量库,支持复杂关系推理;动态路由选择根据任务类型调用最优模块。

3. RAG系统的类型

3.1 单代理RAG


单代理RAG系统使用一个集中式代理来管理信息的检索、路由和集成。该架构适用于工具或数据源数量有限的场景。代理评估用户查询,选择最合适的知识源,检索数据,并将其合成成连贯的响应。

3.2 多代理RAG


多代理RAG系统将责任分配给多个专门的代理,每个代理都针对特定角色或数据源进行优化。这种模块化和可扩展的架构旨在处理复杂的工作流程和多样化的查询类型。系统利用并行处理来高效处理高查询量并提高准确性。

3.3 分层RAG


分层RAG系统采用结构化的多级方法进行信息检索和处理。代理按层次组织,高层代理监督和指导低层代理。这种结构实现了多级决策制定,确保查询由最合适的资源处理。

3.4 纠正型RAG

纠正型RAG引入了自我纠正检索结果的机制,增强了文档利用并提高了响应生成质量。它使用专门的代理动态评估和优化检索到的文档和查询,确保高响应准确性和最小化错误。

3.5 自适应RAG

自适应RAG根据传入查询的复杂性动态调整查询处理策略。它使用分类器评估查询复杂性,并确定最适当的方法,从单步检索到多步推理,甚至对简单查询完全绕过检索。

3.6 基于图的RAG

基于图的RAG系统将图知识库与非结构化文档检索相结合,增强了推理和检索准确性。这些系统利用模块化检索库、动态代理交互和反馈循环来确保高质量输出。

4. RAG的应用

RAG系统在多个领域具有变革潜力,包括:

4.1 客户支持和虚拟助手

代理RAG系统通过实时、上下文感知的查询解决,彻底改变了客户支持。它们动态检索相关信息,适应用户上下文,并生成个性化响应,提高了响应质量和运营效率。

4.2 医疗保健和个性化医疗

在医疗保健领域,代理RAG系统检索实时临床指南、医学文献和患者病史,以协助临床医生进行诊断和治疗计划,实现个性化护理和时间效率。

4.3 法律和合同分析

代理RAG系统重新定义了法律工作流程,提供了快速文档分析和决策制定的工具。它们自动化合同审查流程,识别风险,并确保合规。

4.4 金融和风险分析

在金融领域,代理RAG系统通过提供实时洞察来支持投资决策、市场分析和风险管理。它们整合实时数据流、历史趋势和预测建模,生成可操作的输出。

4.5 教育和个性化学习

代理RAG系统通过生成针对学习者进度和偏好的解释、学习材料和反馈,实现了自适应学习,支持个性化学习路径和互动。

4.6 图增强的多模态工作流程应用

图增强的代理RAG结合了图结构和检索机制,在需要互联数据源的多模态工作流程中表现出色。它整合文本、图像和视频数据,生成全面的输出,增强创造力和适应性。

5. RAG的工具和框架

多个工具和框架支持代理RAG系统的发展,满足现实世界应用的复杂需求:

  • LangChain和LangGraph:为构建RAG管道和图工作流提供模块化组件。
  • LlamaIndex:实现文档处理、检索和结构化推理的端到端自动化。
  • Hugging Face Transformers和Qdrant:提供预训练模型和自适应向量搜索能力。
  • CrewAI和AutoGen:强调具有强大内存系统和工具集成的多代理架构。
  • OpenAI Swarm Framework:设计用于人体工程学、轻量级多代理编排。
  • 代理RAG与Vertex AI:与代理RAG无缝集成,提供构建、部署和扩展机器学习模型的平台。
  • Semantic Kernel:微软的开源SDK,将LLMs集成到应用程序中,支持代理模式。
  • Amazon Bedrock for Agentic RAG:提供实现代理RAG工作流的健壮平台。
  • IBM Watson和代理RAG:利用先进的AI能力构建代理RAG系统。
  • Neo4j和向量数据库:处理复杂关系和语义查询,形成高性能代理RAG工作流的支柱。

6. 基准测试和数据集

基准测试和数据集对于评估RAG系统至关重要。关键基准包括:

  • BEIR:评估各种信息检索任务的嵌入模型。
  • MS MARCO:关注段落排序和问答。
  • TREC:提供段落和文档检索的数据集。
  • MuSiQue:评估跨多个文档的多跳推理。
  • 2WikiMultihopQA:针对两篇维基百科文章的多跳问答任务。
  • AgentG:针对代理RAG任务,评估动态信息合成。
  • HotpotQA:需要跨互联上下文检索和推理的多跳问答基准。
  • RAGBench:具有TRACe评估框架的大型可解释基准。
  • BERGEN:系统评估RAG系统的基准库。
  • FlashRAG Toolkit:实现12种RAG方法,包含32个基准数据集。
  • GNN-RAG:评估图RAG系统在节点级和边级预测等任务上的表现。

7. 结论

代理检索增强生成(RAG)代表了人工智能领域的一项重大进步,通过整合自主代理解决了传统RAG系统的局限性。这些系统引入了动态决策、迭代推理和协作工作流的能力,使其能够以更高的精确度和适应性处理复杂的现实世界任务。未来的研究应关注协调复杂性、可扩展性和伦理考虑等挑战,同时开发专门的基准和数据集,以评估代理能力。随着AI系统的不断发展,代理RAG作为创建适应性强、上下文感知和具有影响力解决方案的基石,满足了快速变化世界的需求。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号