从传统RAG到知识图谱RAG:AI检索增强生成技术的革新
从传统RAG到知识图谱RAG:AI检索增强生成技术的革新
当大型语言模型与知识图谱相遇时,一种创新的检索增强生成(RAG)方法应运而生。这种方法通过将知识图谱与大型语言模型相结合,为AI系统提供了更强大的上下文理解和推理能力。本文将详细介绍知识图谱RAG的原理、优势以及实际应用,并为读者提供一个完整的学习路径。
传统RAG的工作原理
大型语言模型(LLM)在固定数据集上运行,其知识在上次训练更新时被冻结。这种限制可能导致不准确或过时的响应,因为这些模型会“幻觉”信息。在不进行再培训或微调的情况下,用新信息更新它们或增强上下文理解在资源和人力方面都可能具有挑战性。
检索增强生成(RAG)是一种技术,通过整合来自外部可靠知识库的信息来改进大型语言模型(LLM)。RAG主要通过两个阶段运行:检索和内容生成。
检索阶段
在检索阶段,该算法定位并收集与用户提示或查询相关的相关信息片段。例如,如果您正在搜索福建面的食谱,您的提示可能是“福建面的成分是什么?”。该系统识别具有与查询语义相关的内容的文档,并使用相似度度量计算相关性,通常是其向量之间的余弦相似度。
整理外部知识后,它会将其附加到用户的提示符中,并将其作为扩充的输入发送到语言模型。
内容生成阶段
在随后的生成阶段,LLM将此增强提示与其自己的训练数据表示相结合,以生成针对用户查询自定义的响应。此响应提供了个性化和可验证信息的组合,适合通过聊天机器人等应用程序使用。
Retrieval Augmented Generation
传统RAG的局限性
虽然RAG在增强LLM的能力方面具有开创性,但也存在某些局限性,可能会影响其有效性和适用性。主要挑战之一涉及检索信息的准确性和数据源的异质性。为了使RAG有效,它通常依赖于多个外部来源,这些来源可能具有不同的格式、标准和可靠性级别。
RAG实现处理模棱两可的查询或需要深入理解上下文的查询时也会遇到困难。这些问题是该技术设计所固有的,主要源于检索过程,在检索过程中,它偶尔会忽略精确响应所必需的细微差别。
知识图谱RAG的创新
Graph RAG通过利用知识图谱(KG)建立在RAG的概念之上。这种创新方法是由NebulaGraph率先提出的一个概念,它通过图形数据库的集成改变了LLM解释和响应查询的方式。
Graph RAG通过将来自KG的结构化数据集成到LLM的处理中来运行,为模型的响应提供更细致和更明智的基础。KG是真实世界实体及其之间关系的结构化表示,由节点组成,节点表示人、地点、对象或概念等实体以及边缘。反过来,这些节点表示这些实体之间的关系或连接。
A simple knowledge graph
这种结构使模型能够访问精确且与上下文相关的数据,从而大大提高了LLM生成明智响应的能力。Graph RAG的创新之处在于它将图数据库与LLM集成在一起,以在生成响应之前丰富模型的上下文。一些流行的graphDB产品是Ontotext、NebulaGraph和Neo4J。
Graph RAG的演示
在本演示中,我们将使用Govtech开发人员门户中的产品信息作为我们的知识库。演示步骤包括:
- 使用Neo4j桌面启动Neo4j本地实例
- 使用LangChain本地连接到Neo4j数据库
- 提取信息、节点及其连接
- 图形构造:使用CSVLoader和文档分段来处理我们的文档
- 评估和完善:指定LLM应该提取哪些节点标签来优化我们的方法
Graph RAG vs Base RAG
让我们通过几个实际查询来对比Graph RAG和Base RAG的表现:
问:“请介绍一下开发该产品的AiSay及其优势和应用。另外,请告诉我AiSay的独特之处。”
Base RAG:“AiSay是新加坡政府开发的人工智能文档阅读器。它可以自动检测、扫描和理解各种类型的文档,包括手写笔记、打印文章、多语言文本和结构化/非结构化文档。与传统的OCR系统不同,AiSay可以为图像和PDF文件等文档提供结构化响应。它使用OCR、文档问答技术和大型语言模型来派生上下文和回答查询。AiSay可通过同步和异步调用选项进行扩展,允许处理大文件大小。它在云上无服务器托管,使其在数量上可扩展并能够处理大文件大小。AiSay正在积极开发中,支持高达RESTRICTED/SENSITIVE NORMAL的安全和数据分类。今后,将支持更多文档类型。AiSay的独特功能包括它能够为各种文档类型提供结构化响应、可扩展性以及对安全和数据分类的支持。”
Graph RAG:“AiSay是新加坡政府开发的人工智能文档阅读器。它是一个文档解析器,可以提供结构化响应、提取各种文档中的信息并将其集成到现有系统中。AiSay可以自动检测、扫描和理解各种文档,包括手写笔记、打印文章、多语言文本和结构化/非结构化文档。与传统的光学字符识别(OCR)系统不同,AiSay可以为图像(JPEG、PNG、TFIF)和PDF文件等文档提供结构化响应。AiSay的一些主要优势包括:1.减少人为错误,提高数据准确性,因为从文档上传中自动填写表单提交的关键数据。2.提升了数字化服务体验,因为一旦文件上传,AiSay就可以自动填写关键数据。AiSay的独特之处在于它能够为各种文档类型提供结构化响应,支持各种格式和语言。它还为每个任务提供置信度分数,以确定是否需要额外的支持,从而允许在具有高置信度的任务中进行最少的人工干预。此外,AiSay是可扩展的,因为它是无服务器托管在云上,使其能够异步处理大文件大小和提取过程。”
Graph RAG的优势
与传统的RAG方法相比,Graph RAG的优势在这种情况下是显而易见的。该响应不仅展示了准确性,而且还丰富了上下文和关系,提供了标准RAG方法所没有的深度水平。Graph RAG的秘密在于它能够分析用户的查询,在图形数据库中精确定位相关数据,并结合这种上下文洞察力来指导LLM的响应。这种方法利用了传统方法可能遗漏的相互关联的信息网络,从而对查询有更细致的理解。
学习路径
为了帮助读者掌握大模型AI技术,本文提供了一个系统的学习路径,分为四个阶段:
第一阶段(10天):初阶应用
- 大模型AI能干什么?
- 大模型是怎样获得“智能”的?
- 用好AI的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向GPT-3.5灌入新知识
- 提示工程的意义和核心思想
- Prompt典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt攻击和防范
第二阶段(30天):高阶应用
- 为什么要做RAG
- 搭建一个简单的ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的RAG
- 搭建RAG系统的扩展知识
- 混合检索与RAG-Fusion简介
- 向量模型本地部署
第三阶段(30天):模型训练
- 为什么要做RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
第四阶段(20天):商业闭环
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建OpenAI代理
- 热身:基于阿里云PAI部署Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于vLLM部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源LLM项目
- 内容安全
- 互联网信息服务算法备案
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成60-70%的内容,你就已经开始具备成为一名大模型AI的正确特征了。