问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

更高级的 RAG 架构:提升 AI 大模型回答准确性的前沿技术

创作时间:
作者:
@小白创作中心

更高级的 RAG 架构:提升 AI 大模型回答准确性的前沿技术

引用
1
来源
1.
https://uee.ai/427/%E6%9B%B4%E9%AB%98%E7%BA%A7%E7%9A%84-rag-%E6%9E%B6%E6%9E%84%EF%BC%9A%E6%8F%90%E5%8D%87-ai-%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%9B%9E%E7%AD%94%E5%87%86%E7%A1%AE%E6%80%A7%E7%9A%84%E5%89%8D%E6%B2%BF%E6%8A%80/

RAG(检索增强生成)技术通过将大量外部数据与基础模型相结合,显著提升了AI大模型的回答准确性。本文将深入探讨RAG的工作原理、优势以及几种更高级的RAG架构,帮助读者全面了解这一前沿技术。

RAG的工作原理

  1. 查询:通过虚拟助手或界面将文本格式的问题发送到RAG流程中。
  2. 文档搜索(Retrieval):LLM从外部资源(如数据库、文档或搜索引擎结果)中搜集相关信息。
  3. 增强(Augmentation):将搜索阶段获取的信息与原始输入结合,并通过提示工程技术转换为LLM可理解的格式。
  4. 生成(Generation):LLM评估接收到的信息和原始输入,生成准确的输出文本。
  5. 回答:LLM将最终回答发送给用户。

RAG通过整合外部信息,可以提供比传统模型更准确和丰富的回答。

RAG与传统方法的区别

基于分类的传统模型

传统自然语言模型通过输入查询,从预定义的响应集中选择最合适的响应。这些模型通过测量输入与预定义答案之间的相似性来确定最适合的响应。

基于RAG的模型

生成式AI模型从头开始创建答案,使用复杂的神经网络算法生成更接近真人表达的文本。这些模型通过预测下一个单词或一系列单词来学习并生成新的上下文相关回答。

RAG的优势

  1. 上下文相关性:RAG系统能生成更具有上下文相关性和信息丰富的回答。
  2. 事实核查与验证:通过从可靠外部来源获取信息,RAG系统可以在生成过程中进行事实核查与验证。
  3. 优化知识整合:RAG系统能有效利用外部知识库或文档,特别适用于问答任务。
  4. 灵活性和适应性:通过从各种资源获取信息,RAG系统无需针对每个特定场景进行微调。
  5. 处理分布外输入:RAG系统能处理训练数据中不存在的输入。
  6. 控制内容生成:通过引导文档搜索过程,开发人员可以控制模型生成响应的信息类型和质量。
  7. 减少偏见:结合多种信息来源,RAG系统可以提供更平衡的回答。

尽管RAG具有显著优势,但也面临一些挑战,如多渠道整合、数据质量、可扩展性和搜索优化等问题。

更复杂的RAG系统

文档分块(Document Chunking)

文档分块是指将文本分割成小的、简明的、有意义的部分。RAG系统可以在较小的文本片段中更快、更准确地找到相关上下文。分块策略需要在捕获所有重要信息和保证处理速度之间取得平衡。

CRAG(Check RAG)

CRAG通过为搜索结果定义阈值的上限和下限,将结果分类为“正确”、“错误”或“不确定”。这种验证机制可以确保只使用相关和可靠的信息,降低错误或误导性结果的风险。

RAG Fusion

RAG Fusion通过创建多个查询并重新排序结果来弥补用户提出的问题与他们真正想问的问题之间的差距。它利用互惠排名融合(RRF)技术提供更全面的搜索结果,但可能会导致信息泛滥,需要通过请求工程控制。

HyDE

HyDE通过生成临时的虚拟答案或文档来帮助理解和处理输入问题。这种方法特别适用于模糊或细节不足的问题,但当讨论话题超出语言模型的知识范围时,可能会导致错误信息。

层次索引(Hierarchical Indexing)

层次索引是一种结构化方法,通过将信息分层次进行分类来提高数据检索的效率和准确性。这种方法可以减少由于片段提取问题引起的幻觉。

总结

RAG技术仍在快速发展中,微软最近发布的GraphRAG将RAG的应用延伸到了图领域。随着技术的不断进步,RAG与LLM的结合将越来越紧密,为用户提供更强大的AI功能。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号