问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

StructRAG:通过推理时混合信息结构化提升 LLMs 的知识密集型推理

创作时间:
作者:
@小白创作中心

StructRAG:通过推理时混合信息结构化提升 LLMs 的知识密集型推理

引用
1
来源
1.
https://www.modb.pro/db/1851801399326248960

随着深度学习技术的发展,特别是大型语言模型(LLMs)的广泛应用,检索增强生成(RAG)方法在知识密集型任务中显示出强大的潜力。然而,现有的 RAG 方法在处理知识密集型推理任务中仍然面临挑战,因为这些任务所需的有用信息往往分布不均。为了解决这一问题,中国科学院和阿里巴巴集团的研究人员共同提出了新的RAG框架StructRAG。

摘要

随着深度学习技术的发展,特别是大型语言模型(LLMs)的广泛应用,检索增强生成(RAG)方法在知识密集型任务中显示出强大的潜力。然而,现有的 RAG 方法在处理知识密集型推理任务中仍然面临挑战,因为这些任务所需的有用信息往往分布不均。这一特性使得现有的 RAG 方法难以准确识别关键信息,并在这种嘈杂的增强信息中进行全局推理。为了解决这一问题,StructRAG 借鉴了人类处理复杂问题时将信息结构化的认知理论,采用混合信息结构化机制,根据任务需求以最合适的格式构建和利用结构化知识,从而提升LLMs在知识密集型推理任务上的性能。

方法

框架

如上图所示,StructRAG 首先采用混合结构路由器(Hybrid Structure Router)来识别给定任务最合适的结构类型,然后采用分散知识结构化器(Scattered Knowledge Structurizer)将原始文档转化为该格式的结构化知识,最后结合结构化知识利用器(Structured Knowledge Utilizer.)将复杂问题分解为简单的子问题,从而实现对结构化知识的更准确推理。

以下是StructRAG框架其主要组成部分及功能的详细说明:

1. 混合结构路由器(Hybrid Structure Router)

功能:该路由器负责根据输入问题(q)和文档的核心内容(C)选择最合适的知识结构类型(t),如表格、图形、算法、目录或文本块。

流程:通过分析任务要求,路由器识别不同结构类型的适用性,生成最佳结构类型(t)。这一过程是基于对相关文档核心内容的理解,使得后续的知识提取更加高效。

训练方法:使用基于 DPO(Direct Preference Optimization)的方法进行训练,确保路由器在知识类型选择上表现优异。

2. 分散知识结构化器(Scattered Knowledge Structurizer)

功能:在识别到最适合的结构类型(t)后,该模块提取原始文档中分散的知识并重构为结构化的知识()和知识描述()。

流程:利用 LLM 的强大理解和生成能力,将每个原始文档转换为选定结构类型的结构化知识。例如,表格通过 markdown 表示,图通过头-关系-尾三元组列表表示,块通过常规文本表示,算法通过伪代码表示,目录通过带有分层编号(例如,第一节,1.1,1.1.2)作为明确章节标识符的文本表示。然后将生成的结构化知识()和描述()汇总成整体知识结构()和结构化知识的总体描述(),为后续推理提供基础。

3. 结构化知识利用器(Structured Knowledge Utilizer)

功能:该模块负责将获得的结构化知识用于回答问题,通过分解复杂问题来提高推理的准确性。

流程

问题分解(Decomposition: Sub-Questions):将原始问题(q)和结构化知识的描述()作为输入,将问题分解为多个简单的子问题()。

知识提取(Extraction: Precise Knowledge):从整体结构化知识()中提取每个子问题所需的精确知识()。

最终推理(Inference: Final Answer):整合所有子问题及其提取的知识,生成最终答案(a)。

混合结构路由器训练

在 StructRAG 框架中,准确确定输入任务的最合适结构类型是关键因素,而混合结构路由器的性能直接影响到整体效果。因此,为了实现高性能的路由器,作者设计了一种合成-模拟-判断方法来有效地构建用于训练的偏好对,如上图所示。训练过程由以下步骤组成:

种子任务收集(Seeding): 首先,手动收集若干种子任务,这些任务覆盖可能的结构类型(如表格、图形等)。

合成新任务(Synthesizing): 利用 LLM 的上下文学习能力,基于这些种子任务合成一组新任务。每个合成任务包含一个问题及其对应文档的核心内容。

模拟解决方案(Simulating): 对于每个合成任务,使用 LLM 模拟不同类型结构化知识下的解决过程,从而生成多种模拟解决方案。

偏好判断(Judging): 最后,利用 LLM 对这些模拟解决方案进行比较,生成关于结构类型的偏好对。

总结

StructRAG 的创新之处在于其混合信息结构化机制,通过结构化知识高效整合分散信息,为每个任务量身定制最佳知识结构类型,有效地解决了知识密集型推理任务中常见的信息分散和噪音问题。与传统的 RAG 方法相比,StructRAG 显著提高了在复杂问题上的推理能力。

结构化方法路由

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号