问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

一文读懂：AI大模型RAG（检索增强生成）含高级方法

创作时间:

作者:

@小白创作中心

一文读懂：AI大模型RAG（检索增强生成）含高级方法

引用

CSDN

1.

https://m.blog.csdn.net/DEVELOPERAA/article/details/145276230

RAG（检索增强生成）是当前最热门的LLM应用方案之一。它通过结合检索技术和LLM提示，有效解决了大模型在知识局限性、幻觉问题和数据安全性等方面的挑战。本文将系统讲解RAG的关键高级技术，帮助读者深入理解这一重要技术。

RAG概述

RAG（Retrieval Augmented Generation）的核心理念是通过自有垂直领域数据库检索相关信息，然后将其合并到提示模板中，供大模型生成更准确的回答。这种方法在2023年成为基于LLM系统的最受欢迎架构之一，广泛应用于从基于Web的问答服务到使用私有数据的聊天应用。

RAG的基本流程包括两个主要步骤：语义搜索和生成输出。在语义搜索阶段，系统从知识库中检索与查询最相关的内容；在生成阶段，系统使用这些内容生成最终答案。

RAG实现过程

RAG通过融合多种技术来提升检索阶段的效果。例如，可以使用LLM生成多个查询，以覆盖问题的各个方面，从而提高检索的全面性和准确性。

RAG架构

完整的RAG应用流程包含两个主要阶段：数据准备阶段和应用阶段。

数据准备阶段

数据准备阶段是一个离线过程，主要包括数据提取、文本分割、向量化和数据入库等环节。

数据提取：包括多格式数据加载、数据过滤、压缩、格式化等。
文本分割：需要考虑embedding模型的Tokens限制和语义完整性，常见的分割方式有句分割和固定长度分割。
向量化：将文本数据转化为向量矩阵，常用的embedding模型包括ChatGPT-Embedding、ERNIE-Embedding、M3E和BGE等。
数据入库：将向量化后的数据构建索引并存入数据库，适用于RAG场景的数据库包括FAISS、Chromadb、ES和milvus等。

应用阶段

应用阶段主要包括数据检索和注入Prompt等环节。

数据检索：常见的检索方法包括相似性检索和全文检索，可以根据业务需求选择合适的检索方式。
注入Prompt：Prompt的设计对模型输出的准确率有重要影响，通常包括任务描述、背景知识和任务指令等部分。

原始RAG

原始RAG管道从文本文档语料库开始，通过Transformer Encoder模型将文本块嵌入向量，然后创建LLM提示，根据搜索步骤中找到的上下文回答用户查询。

高级RAG

高级RAG技术包括分块、向量化、搜索索引、重排和过滤等多个环节，其中搜索索引是关键部分，可以采用faiss、nmslib等工具实现。此外，还有分层索引、假设性问题、内容增强、融合检索等多种优化方法。

RAG融合

RAG融合的主要优点包括提供多样化的上下文、额外的控制层面和自动校正功能。但同时也存在延迟、自动纠错和成本等方面的挑战。在实际应用中，需要根据具体场景选择合适的RAG融合策略。

编码器和LLM微调

编码器和LLM的微调是优化RAG系统的重要手段。编码器影响嵌入质量，LLM负责生成答案。通过微调可以提升检索效果和答案质量。

评估

RAG系统的评估主要关注检索内容相关性、答案基础性和忠实度等指标。常用的评估框架包括Ragas和Truelens，它们提出了RAG三元组评估模式。

总结

RAG作为一种强大的AI技术，已经在多个领域得到广泛应用。通过不断优化检索和生成环节，可以进一步提升RAG系统的性能和用户体验。

热门推荐

江西福建浙江彩礼大揭秘：从10万到百万，背后有何玄机？

江西福建浙江彩礼大揭秘：从10万到百万，背后有何玄机？

彩礼到底该不该取消？听听90后怎么说

彩礼到底该不该取消？听听90后怎么说

长三角地区彩礼金额知多少？最高法新规剑指“天价彩礼”

长三角地区彩礼金额知多少？最高法新规剑指“天价彩礼”

最高法新规出台：彩礼纠纷如何合法解决？

最高法新规出台：彩礼纠纷如何合法解决？

昆山必玩景点TOP榜，你去过几个？

昆山必玩景点TOP榜，你去过几个？

江苏淮安水稻收割忙，丰收景象刷屏朋友圈

江苏淮安水稻收割忙，丰收景象刷屏朋友圈

间充质干细胞外泌体：鼻炎治疗的新希望

间充质干细胞外泌体：鼻炎治疗的新希望

流感高发，如何识别和科学应对？听听专家怎么说

流感高发，如何识别和科学应对？听听专家怎么说

威海日岛炮台：甲午海战中成功击退日军的海上堡垒

威海日岛炮台：甲午海战中成功击退日军的海上堡垒

从《毛骗》到《漫长的季节》：近十年国产剧的高分答卷

从《毛骗》到《漫长的季节》：近十年国产剧的高分答卷

三亚自驾游必备神器：《自驾指南》上线啦！

三亚自驾游必备神器：《自驾指南》上线啦！

秋冬滋补首选：花胶海参鸡汤

秋冬滋补首选：花胶海参鸡汤

脊髓灰质炎疫苗：研究进展和策略

脊髓灰质炎疫苗：研究进展和策略

老鸭头走势再掀股市热潮

老鸭头走势再掀股市热潮

海南自贸港建设推动三亚旅游发展，前三季度入境游客增2.2倍

海南自贸港建设推动三亚旅游发展，前三季度入境游客增2.2倍

高血糖人群的健康零食：4种低GI选择，稳定血糖无负担

高血糖人群的健康零食：4种低GI选择，稳定血糖无负担

10月25日起银行调整存量房贷利率，5000万户年减负1500亿

10月25日起银行调整存量房贷利率，5000万户年减负1500亿

3月21日重庆研讨会聚焦非晶态合金催化剂，专家认为其在绿氢制备领域大有可为。

3月21日重庆研讨会聚焦非晶态合金催化剂，专家认为其在绿氢制备领域大有可为。

抓住春播好时节：各类蔬菜种植要点与创新方法

抓住春播好时节：各类蔬菜种植要点与创新方法

中国海军海南舰：直-8、直-20搭配使用，未来将搭载无人机

中国海军海南舰：直-8、直-20搭配使用，未来将搭载无人机

5步简化法，让红烧排骨达到米其林水准

5步简化法，让红烧排骨达到米其林水准

解密斗破苍穹：七大境界构建玄幻世界

解密斗破苍穹：七大境界构建玄幻世界

雪燕食用方法大全：传统炖煮与4种创意搭配

雪燕食用方法大全：传统炖煮与4种创意搭配

一文详解：Windows 10下IE 11四大常见问题及解决方案

一文详解：Windows 10下IE 11四大常见问题及解决方案

停赛5场罚款10万元！男篮国手赵睿冲撞裁判遭处罚

停赛5场罚款10万元！男篮国手赵睿冲撞裁判遭处罚

脂肪肝：一线城市的新公敌？

脂肪肝：一线城市的新公敌？

数据科学与大数据技术专业的就业前景与发展方向

数据科学与大数据技术专业的就业前景与发展方向

海洋馆水族箱养护秘诀：20%换水法则与日常管理要点

海洋馆水族箱养护秘诀：20%换水法则与日常管理要点

打卡司空山，探访禅宗圣地二祖禅堂

打卡司空山，探访禅宗圣地二祖禅堂

如何选择科学计算服务器？

如何选择科学计算服务器？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号