科学家提出迭代自反馈检索增强法,让大模型像人类一样自我学习
创作时间:
作者:
@小白创作中心
科学家提出迭代自反馈检索增强法,让大模型像人类一样自我学习
引用
新浪网
1.
https://finance.sina.com.cn/tech/roll/2024-04-28/doc-inatkvkv0622771.shtml
科学家提出了一种新的迭代自反馈检索增强方法,通过引入自我知识、文章相关性和问题分解三个模块,显著提升了大模型的自我学习能力。这种方法不仅在多种检索增强方案和数据集中表现出色,还为解决大模型幻觉问题提供了新思路。
在最新研究中,科学家们将检索增强框架与三个辅助模块相结合,包括自我知识、文章相关性和问题分解模块,以实现更高效的大模型自我学习。
这三个模块各自承担着不同的功能:
- 自我知识模块:当大模型的回答很可能包含正确答案时,该模块可以指示模型直接作答,避免不必要的检索时间和错误。
- 文章相关性模块:类似于文章重排策略,但更进一步。它不仅能筛选出相关文本,还能在找不到相关文本时触发问题分解模块,从而避免不相关文本导致的事实性错误。
- 问题分解模块:当检索内容过于粗略时,该模块会将原问题分解为一系列语义覆盖的子问题,以减少错误知识和无关信息的影响。
通过这种迭代处理方式,研究人员能够确保检索过程中的文本相关性,同时更好地利用现有知识或在缺乏旧知识时获取新知识。在多种检索增强方案和不同数据集中,该框架均展现出最佳表现效果。此外,研究团队还在不同迭代次数和子模块大小选择上进行了深入分析,进一步验证了框架的严谨性。目前,相关代码已在开源社区开放。
据介绍,该框架具有广泛的应用前景:
- 可作为大模型的知识增强方法,特别是在专业领域知识的融合方面
- 可实现语料知识与大模型在存储上的分离,通过缓存接口按需获取语料知识,降低存储复杂性
- 在数据隐私保护方面,个人数据可存放至语料库,从而更好地保护隐私
(来源:arXiv)
未来,研究团队计划在GitHub(https://github.com/OceannTwT/ra-isf)上持续更新该框架,并基于此框架为LangChain用户提供服务,以帮助用户更好地利用框架功能。
图 | 论文作者之一刘彦铭(来源:资料图)
参考资料:
本文原文来自DeepTech深科技
热门推荐
窗户2.0的多少钱一平方,影响价格的因素有哪些?
如何提前还房贷?这种还款策略有哪些经济考量?
哺乳期能吃土豆吗?哺乳期吃土豆的好处及食用禁忌
白糖:“战时黄金”的不为人知的秘密
一张“水果热量排行表” 没想到这些水果让人发胖
如何理解黄金作为避险资产的重要性?这种重要性在不同经济环境下如何体现?
恐慌指数VIX:股市的“温度计”
爽剧背后的科学:怎样通过追剧治愈日常焦虑?
脚部经常出汗是怎样的情况
价格“能涨能跌” 省间电力现货市场今起正式运行
振动台使用注意事项详解
麦芽在啤酒酿造中的重要作用
湘籍匠人“话”党史之《醴陵毛瓷 红色印记》
安徽一高校没收大学生香烟,公开销毁,宿舍禁烟令的更多细节曝光
甘草片小孩能吃几片?儿科医生提醒:这药儿童需谨慎服用
铝合金车身的优缺点是什么?车身材料对车辆性能有何影响?
Edge浏览器兼容性问题如何修复,这篇文章告诉你
女人如何淡化黑眼圈比较有效
外卖系统开发实战:从架构设计到代码实现
带老妈孩子去西双版纳旅游合适吗?玩几天合适?
选择显示器时需考虑的尺寸、宽高比与分辨率等因素
一文搞懂“支付核心”
彼岸花:一种跨越时空的爱之花
肾病病理分型及病因
泼尼松和地塞米松区别有哪些
甲沟炎的早期处理方法和技巧
长债国债收益率走低,央行出手了!
马拉松跑者的阿喀琉斯之踵,如何避免应力性骨折
怕冷的原因及改善方法:从生理到生活方式的全方位解析
韩文入选世界古老文字,为何配图用汉字?抹去汉字,韩国再无历史