RAG理论到实战(一):3分钟!了解什么是RAG!
RAG理论到实战(一):3分钟!了解什么是RAG!
RAG(检索增强生成)技术是当前AI领域的前沿技术,它结合了检索和生成式两种技术,让AI大模型能够更准确地回答问题。本文将从基本概念、工作原理、必要性及具体架构等方面,为您详细介绍这一重要技术。
什么是RAG?
RAG(Retrieval-Augmented Generation)中文名字叫检索增强生成技术。RAG听名字就能知道,是结合了检索 和 生成式(llm)两种技术,从而让AI大模型(LLM)更能准确的回答问题而催生出来的解决方案。
通俗的讲解
以上说的可能略微难懂,我们可以换一种通俗的说法。
设想下,当有人让你背诵一篇课文,你记不清楚,你会会怎么做?
你会翻书查看,然后在回答问题!
RAG就是可以看作类似的过程。当你像AI提问一个问题,RAG会先去知识库中检索相关片段,然后把问题和找到的知识片段一起扔给大模型来回答
这样AI大模型就能够更加准确的回答你的问题了!
为什么需要RAG?
AI生成式大模型技术(LLM)的确很惊艳,让所有使用过的人都震惊到。但是这项技术虽然经历一年多的高速发展,依旧还是有很多问题。
大模型幻觉:使用过chatGPT等AI的都能有体会,当你问的问题让AI回答不上来,它会随便编造一些内容给你。
知识库有时效性:很多AI大模型(例如chatGPT-3.5)训练使用的数据是旧数据,而不是实时更新的。我们如果为了更新知识而重新训练或者微调它,那可就花费太高的成本了。况且每次更新都重新训练或微调也是不现实的!
长文本处理:AI大模型是有输入限制的,虽然现在推出了很多长文本的模型,但终究是有度。
那么?如果使用RAG,以上的问题都能解决吗?
答案:是的!
RAG的资料库就相当于AI的资料书,回答问题前先看书,大难更准确。而且,更新资料库比训练或者微调模型简单多了,上传文档处理下就ok;
大模型就是相当于一个大学生,经历了9年义务教育+4年大学学习,让AI大学生掌握很多知识。RAG就相当于给大学生配备了百度和资料书。通过此方法让AI大学生能更准确,处理更多的问题。
RAG的具体架构
RAG技术目前发展比较迅速,具体的实现方式有很多。我只介绍一个简单的常用的方式,具体架构见下图。
我们读取知识文本。输入的格式可以是word、pdf、csv、纯文本、excel等。只要是能够转为纯文本就可以。
那么有人可能问了,不是纯文本不行吗?不是纯文本,比如数据库文件,或者图片的确有难度(有些情况就是无法处理)。目前我们先把最简单的纯文本模式走通。
通过上图可以看出,我们核心的部分有:知识获取、嵌入模型、向量数据库、检索、调用AI回答。后续会挨个详细介绍。