【AI大模型】RAG 架构设计三阶段演进之路
创作时间:
作者:
@小白创作中心
【AI大模型】RAG 架构设计三阶段演进之路
引用
CSDN
1.
https://m.blog.csdn.net/2401_85325557/article/details/143787633
RAG(Retrieval-Augmented Generation)是一种通过融合外部数据库知识来增强大型语言模型(LLMs)性能的技术。它在处理特定领域或知识密集型任务时表现出色,能够有效应对产生虚假信息、知识陈旧等问题。本文将详细介绍RAG架构设计的三个阶段演进:Naive RAG、Advanced RAG和Agentic RAG。
第一阶段:Naive RAG 架构设计
大型语言模型(LLMs)虽然展现出卓越的性能,但在处理特定领域或知识密集型任务时,存在一些挑战,比如:产生虚假信息、知识陈旧以及推理过程的非透明性和不可追溯性。RAG 技术作为一种有希望的解决方案,通过融合外部数据库的知识,有效应对了这些问题。它显著提升了生成内容的准确性和可靠性,尤其在知识密集型任务中表现突出,并支持知识的持续更新及特定领域信息的整合。
大模型 Naive RAG 的运作可概括为以下两个关键阶段:
- 检索阶段:大模型首先在外部知识库中搜寻与输入文本相关的信息。该知识库通常是由大规模文本数据集经过索引处理后形成的数据库。
- 生成阶段:将检索到的信息送入生成模型(比如:GPT-4o)。该生成大模型会根据这些信息,生成最终的回答或文本内容。
第二阶段:Advanced RAG 架构设计
大模型 Advacned RAG 技术在企业应用中的落地全流程,涵盖了架构、模块、技术三大方面,形成了一套完整的框架,包含10个关键模块和36项技术要点!对于一些关键且复杂的模块,比如:分块、向量化、重排等,也进行了全面总结和概述。
- Query 理解(Query NLU):利用 LLM 作为核心引擎,对用户 Query 进行改写以提升检索效果,涉及意图识别、歧义消除、Query 分解、抽象等七个技术点。
- Query 路由(Query Routing):查询路由是 LLM 支持的关键决策环节,决定了用户查询的下一步行动,包含一项核心技术。
- 索引(Indexing):作为 RAG 中的核心模块,索引包括文档解析(五种工具)、文档切块(五类方法)、嵌入模型(六种类型)、索引类型(三种分类)等,共计八项技术。
- Query 检索(Query Retrieval):除了 Naive RAG 向量检索外,还关注图谱和关系数据库检索(NL2SQL),共涉及三项技术。
- 重排(Rerank):不同检索策略的结果需要通过重排来优化,包括重排器类型(五种)和自训练领域重排器等,共计三项技术。
- 生成(Generation):在企业应用中,生成环节可能会遇到重复、幻觉、流畅性、美化、溯源等问题,涉及 RLHF、偏好打分器、溯源 SFT、Self-RAG 等七项技术。
- 评估与框架:RAG 需要一个全链路的评价体系,作为企业上线和迭代的依据,包括三项技术。
- RAG 新技术:探讨 RAG 未来的发展方向及实现路径,共提出三项潜在的新技术。
第三阶段:Agentic RAG 架构设计
最终,大模型 RAG 问答终章是 Agentic RAG!
向Lv2-智能体提出一个问题。
while (Lv2-智能体无法根据其记忆回答问题) {
Lv2-智能体提出一个新的子问题待解答。
Lv2-智能体向Lv1-RAG提问这个子问题。
将Lv1-RAG的回应添加到Lv2-智能体的记忆中。
}
Lv2-智能体提供原始问题的最终答案。
比如:Query:“与第五交响曲创作于同一世纪的交通工具是什么?”,Agent 通过规划能力分两个子问题来解决:
- 第一个子问题:“第五交响曲是在哪个世纪创作的?”
- 第二个子问题:“19 世纪发明的交通工具是什么?”
热门推荐
国产电车续航都突破1000km了,为何豪华品牌还是造不出一台长续航
太空育种:航天技术与农业育种的完美结合
杜仲茶什么时候喝最好?杜仲茶的功效与饮用指南
斜视:原因、治疗方法及预防建议
如何训练儿童近视斜视
冷凝水、冷却水、冷冻水的区别:揭秘工业用水中的“三剑客”
具备人工智能的反舰导弹,美国LRASM隐身反舰导弹
广州交通枢纽升级服务全攻略:地铁指引优化、身份证自助领取等便民措施
广州地铁21号线凤岗站挤满学生等车!客流激增!如何疏解?
三国时期的智谋与谋略:卧龙、凤雏、冢虎、幼麟与毒龟
一文读懂:量子算法如何破解现代加密算法?
AI生成歌词的版权危机:Anthropic的对策与未来发展
驾驭Docker容器生命周期:从创建到销毁的全面指南
突厥发源于甘肃平凉杂胡之三
人参、燕窝与虫草的搭配炖煮方法及注意事项详解
痛风患者可以食用大枣吗?
WIN32编程入门:嵌入式软件开发与Windows CE API深度解析
使用 MacType 优化 Windows OLED 子像素渲染
最简单、最实惠的“心脏养护方法”,每个人天生就会做
水泥行业标准GB4915-2103的主要内容是什么?
如何软件测试水冷好坏
摄影入门者的单反选择指南:避免这些常见陷阱
构建卓越品牌:全案策划从三大核心入手
失业时医疗保险如何处理?这种情况下医疗保险有哪些变化?
财务三大报表的勾稽关系,看这篇就够了!
地球上最古老的树及其同类
人工智能想象在科幻文艺中的百年演变
使用SOLIDWORKS导出UR10e机器臂URDF模型并配置MoveIt!
华为发家史:三次危机,两次差点被卖,靠啥打胜仗?
GPU、NPU与LPU:大语言模型(LLM)硬件加速器全面对比分析