资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

MemoRAG：基于长期记忆的检索增强生成新范式

创作时间:

作者:

@小白创作中心

MemoRAG：基于长期记忆的检索增强生成新范式

引用

CSDN

https://blog.csdn.net/m0_59235245/article/details/142342948

MemoRAG是一种基于长期记忆的检索增强生成新范式，通过引入记忆模块来解决传统RAG系统在处理模糊信息需求和非结构化知识时的不足。本文将详细介绍MemoRAG的核心架构、记忆模块的设计以及基本使用方法。

前言

RAG（Retrieval-Augmented Generation）在减少大模型对于垂类知识的问答幻觉上取得了不错的效果，也成为私域知识问答的一种范式。然而，传统RAG系统主要适用于明确信息需求的问答任务，但在处理涉及模糊信息需求或非结构化知识的复杂任务时表现不佳。因为，现实世界中的许多问题信息需求是模糊的，外部知识是非结构化的，例如理解书籍中主要角色之间的相互关系。

因此，研究难点在于：

如何有效处理模糊的信息需求
如何从非结构化知识中提取有用信息
如何在长文本上下文中进行有效的信息检索和生成

本文介绍的MemoRAG，一种基于长期记忆的检索增强生成新范式。

方法

MemoRAG

传统RAG
这里，表示最终答案，表示输入查询，表示从相关数据库中检索到的上下文，和分别表示生成模型和检索模型，和表示模型参数。
MemoRAG：MemoRAG提出了一个双系统架构，采用了一个轻量级但长上下文的LLM来形成数据库的全局记忆，并在任务呈现时生成草稿答案，提示检索工具在数据库中定位有用信息。另一方面，它利用一个能力较强的LLM，根据检索到的信息生成最终答案。

MemoRAG的核心是引入了一个记忆模块：

记忆模型的作用：记忆模型的设计目的是建立数据库的全局记忆，并生成有助于检索的线索。

记忆模型选型：任何能够有效处理超长上下文的语言模型都可以作为记忆模型。文章也实现了两个记忆模型（memorag-qwen2-7b-inst和memoragmistral-7b-inst）。

表示由记忆模型生成的中间答案，用作检索线索。
这个中间答案帮助检索模型从数据库中检索最相关的上下文。

记忆模块设计

输入
输入序列 X 包含 n 个标记，表示为
标注注意力机制
短期记忆到长期记忆的转换为了将短期记忆转换为长期记忆，引入了记忆标记作为LLMs中长期记忆的信息载体。假设底层LLM 的工作上下文窗口长度为，在每个上下文窗口后，附加个记忆标记：

新的注意力变成：

通过多个注意力过程，原始标记被编码成隐藏状态，其中表示原始标记的隐藏状态，表示记忆标记的隐藏状态。

记忆模块训练：

训练过程
记忆模块的训练分为两个阶段：
预训练：使用来自RedPajama数据集的随机抽样长上下文对模型进行预训练，使记忆模块能够从原始上下文中学习如何形成记忆。
指令微调（SFT）：使用特定任务的SFT数据，使MemoRAG能够基于形成的记忆生成特定任务的线索。
训练目标
这个公式表示训练过程中的目标是最大化给定先前记忆标记和最近原始标记的情况下，下一个标记的生成概率。通过这种设计，记忆模块能够有效地将大量原始上下文压缩成少量的记忆标记，同时保留关键的语义信息，从而在处理长上下文和高层次查询时提供显著的优势。

基本使用

from memorag import MemoRAG      # Initialize MemoRAG pipeline
pipe = MemoRAG(
    mem_model_name_or_path="TommyChien/memorag-mistral-7b-inst",
    ret_model_name_or_path="BAAI/bge-m3",
    gen_model_name_or_path="mistralai/Mistral-7B-Instruct-v0.2", # Optional: if not specify, use memery model as the generator
    cache_dir="path_to_model_cache",  # Optional: specify local model cache directory
    access_token="hugging_face_access_token",  # Optional: Hugging Face access token
    beacon_ratio=4
)

context = open("examples/harry_potter.txt").read()
query = "How many times is the Chamber of Secrets opened in the book?"

# Memorize the context and save to cache
pipe.memorize(context, save_dir="cache/harry_potter/", print_stats=True)

# Generate response using the memorized context
res = pipe(context=context, query=query, task_type="memorag", max_new_tokens=256)
print(f"MemoRAG generated answer: \n{res}")

运行上述代码时，编码后的键值 (KV) 缓存、Faiss 索引和分块段落都存储在指定的中save_dir。之后，如果再次使用相同的上下文，则可以快速从磁盘加载数据：

pipe.load("cache/harry_potter/", print_stats=True)

摘要任务

res = pipe(context=context, task_type="summarize", max_new_tokens=512)
print(f"MemoRAG summary of the full book:\n {res}")

热门推荐

“开卷有益”，亦益大脑

从零开始精通Onvif之历史与演变

属羊人性格特点与命运预测：从优点缺点到具体运程分析

一顿狂炫3斤大米饭，日本博主“米饭仙人”开辟吃播新赛道

25届考生参考！2024重庆新高考数学试卷结构变化分析

神经衰弱的症状和起因，神经衰弱测试和应对方法

“不以物喜，不以己悲”，到底是什么意思？很多人都理解错了

2024年十大灾难电影排行榜：第一为真实事件，危机航线上榜

为什么日本没能经历德国式的去军事化与去军国主义化？

LED灯泡更换指南：步骤详解与注意事项

Excel Power Query学习笔记：从入门到精通

吃小龙虾的季节是几月到几月？5月到10月，尤以6月到8月最好！

如何缓解幼儿入园焦虑

怎样查男朋友是否有不忠的开房记录

成纤维细胞脱分化：探索细胞命运的逆转之旅

如何选择合适的冰箱大小以提高使用体验？这种选择标准是否适用于所有家庭需求？

Surface笔记本电脑上升级和扩大内存的操作步骤

HR面试会问什么？答案就在简历里

天一热就不想吃东西？研究发现居然是神经细胞在“作怪”！

老人叶酸片一天吃几粒？科学用量指南

4种经典金字塔训练法，哪种效果增肌最好？

球面镜片和非球面镜片的区别，在设计原理、视觉体验、外观，佩戴和价格等方面有差异！

机构课时费不退怎么办

怎么判断自己有没有心理疾病

数字与传统：AI生成插画与手绘插画的艺术对比

楼房外下水管道破裂谁负责？律师专业解答来了