RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
肺炎恢复期一般是多久
警署署长曾启荣的传奇人生与结局:一个时代的见证者
汉族,源远流长的民族血脉与多元文化交融的历史解析
孕期控制体重的16个好方法
登机箱最大尺寸:满足航空公司规定的完美指南
脑血管瘤介入术后全身无力?
一代宗师叶问背后的女性力量:记念叶问夫人的不屈生命
羧基修饰的荧光PS微球:结构特点、制备方法与应用领域
笔记本电脑清灰以及升级硬盘与内存
OV2640摄像头模块技术详解:从原理到应用
南宋权臣为何没有篡位?权力的游戏与王朝的衰落
宋朝皇帝评鉴:谁是真正的治国佼佼者?
双赢策略:企业合作的智慧之道
男生晚上睡不着可以做些什么-有哪些方法帮助快速入睡
“固态电池”居然不是真固态?是虚假宣传?还是真值得期待?
2024梦幻西游单开推荐:门派选择与玩法攻略
阳春白雪的成语故事
在仓库管理中SOP指的是什么
《红楼梦》中妙玉的结局究竟是怎样的?
从零开始打造个性化机械键盘:入门与进阶全指南
龚自珍:一首怀旧诗,道尽珍重,人生里要学会感恩和珍惜缘分
近代第一高僧虚云:曾为蒋介石预言结局,120岁圆寂留下一字遗言
软件测试工程师必备的27个基础技能
五行火和木的关系,金、木、水、火、土五行之
《自然》:科学家揭示慢性压力导致快感缺乏的神经机制
九维度揭秘迷你主机散热性能:从设计到实测全方位解析
玄空派和三合派风水的发展和主要观点
买内存怕不兼容怎么办 | 主板QVL帮你忙
如何挑选夏季连衣裙的面料?
保质期?最佳赏味期?保存期 到底哪个期之前食用最好?