大模型模仿人类记忆,迎来无限上下文时代
创作时间:
作者:
@小白创作中心
大模型模仿人类记忆,迎来无限上下文时代
引用
CSDN
1.
https://blog.csdn.net/specssss/article/details/140526641
大型语言模型(LLMs)在处理长上下文时存在困难,这限制了它们在处理长序列时保持连贯性和准确性的能力。为了解决这一问题,研究人员提出了EM-LLM(Episodic Memory,情景记忆)方法,通过模仿人类事件记忆来处理几乎无限长的上下文。
我们都知道,人类大脑在处理长时间的记忆和事件时表现出色。而现有的大型语言模型(LLMs),虽然已经展现出了非凡的能力,但在处理广泛的上下文时仍然存在困难,这限制了它们在处理长序列时保持连贯性和准确性的能力。这样的表现有限主要是因为:
- Transformer架构在遇到比它们训练时用的上下文更长的内容时,会变得不太灵活。
- 当序列很长时,注意力机制的效果会变得混乱和噪声化。
- 尽管像检索增强生成(RAG)这样的技术有一些进展,但在处理长上下文任务时,效果还是不够好。
相比之下,人类的大脑在组织和检索跨越一生时间尺度的事件体验方面非常出色。
在这项工作中,介绍了EM-LLM,这是一种新颖的方法,它将人类事件记忆和事件认知的关键方面整合到LLMs中,使它们能够有效处理几乎无限的上下文长度,同时保持计算效率。
EM-LLM(Episodic Memory,情景记忆):使得LLM能够处理几乎无限长的上下文,同时保持计算效率。
EM-LLM通过在推理过程中基于惊奇水平(Bayesian surprise)对词序列进行分段,初步边界是动态确定的,随后通过图论度量进行优化。这种方法不仅提高了模型的记忆检索效率,还模仿了人类记忆的时间动态,使得相关信息的检索既基于相似性也考虑时间连续性。
EM-LLM通过结合贝叶斯惊喜和图论,在保持计算效率的同时,实现了对长上下文的有效处理。这一创新方法为未来AI模型的发展提供了新的思路和方向。
热门推荐
中国海军22级导弹艇:从应急装备到国际市场的潜力股
冬虫草究竟是属于哪一类生物?
冬虫夏草:一种可产生生物活性化合物的线虫草属真菌
区间交易必备攻略:5种形态及实战技巧,盈利会更轻松(多图解析)
降低预期之后!宁芜铁路扩能改造的每一个进展都是享受
生地的功效与作用,生地和熟地的区别是什么?
家庭小酒坊“酿”出乡村振兴“好味道”
饮用咖啡是否可以帮助减肥或产生饱腹感
2024高校录取流程详细步骤(附图解),高考招生是怎么录取的?
孤独是如何产生的?如何才能超越孤独?
猪瘟和非洲猪瘟的区别是什么
北京儿童医院专家李现令:腹腔镜微创技术成功治愈复杂鞘膜积液患儿
有肺结节不复查,二年后肺癌转移,身体最易忽略也是最危险的预警有哪些?
如何让银行活期存款收益更高?
加班调休、晚上加班、拒绝加班:劳动法如何规定?
伴生花:一种提升农作物产量的生态农业实践
判断二手房投资价值的三个实用公式
英国约克旅游全攻略:从景点到美食的深度指南
老年人有血尿严重吗
今日春分 | 涨知识!春分是这样被确定的→
春分夏至秋分冬至的太阳直射点位置
社保基数是什么意思,社保基数怎么计算?
定妆喷雾的正确使用顺序:从妆前到妆后的完整指南
缺乏维生素D会导致腿无力吗?
曼基康猫矮脚橘猫(曼基矮脚):迷人的矮脚猫品种
预防出生缺陷:婚孕前检查的重要性与注意事项
斯拉夫语言系属:三大分支及其主要语言
测试AI创作的不同风格的讲故事能力
同样是贵金属,黄金大火价格飙升!白银却为啥越来越不值钱?
个税汇算 | 填错了填漏了怎么办?可自行更正申报