RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
游戏职业技能认定平台上线:六大职业认证助力行业规范化发展
从40万在线观众到游戏主播:抖音平台如何助力你火遍全网?
医疗用NFC的关键
春节去福建旅游,这样穿最舒适!
离婚后如何修复亲情?《都挺好》给你答案!
战神的柔情:《琉璃美人煞》中禹司凤的情感世界
成毅:用演技诠释角色,以实力赢得观众
详解蒸鸡蛋糕的方法,教你做出光面鲜香的传统美味
中国古代三大教:儒教、道教、佛教的形成与影响
数据库锁机制:避免并发冲突的神器
仓鼠健康小贴士:如何避免常见病?
仓鼠清洁小窍门大揭秘!
仓鼠:夜间小精灵的神秘生活
仓鼠饲养必备神器大揭秘!
华为固态电池技术突破:掺杂硫化物电解质破解容量衰减难题
石墨烯电池:充电1.1秒,续航一整天!
橄欖功效的6大好處!這樣吃最健康,品種、壞處與食用禁忌全解析
菠菜的6种经典搭配,让传统食材焕发新魅力
多样菠菜菜谱:健康美味的烹饪体验分享
菠菜的创意吃法,打造营养丰富的美味餐桌
菠菜在菜肴中的多样表现,你试过吗
汉中寻味:入冬四日游,美食与文化的交响
黑神话悟空故事背景介绍:一个关于英雄重生的传奇
张立柱:从草丛潜伏到国务院表彰的辅警传奇
同期两篇顶刊论文:食盐竟能增强T细胞抗癌能力,促进肿瘤消退
食盐可提升免疫细胞抗癌能力
新能源车牌编码新规则解析:D与F的奥秘
建立良好亲子关系最有效的方法,不是严厉管教,而是运用 “平等法则”,你认同吗?
为什么啤酒瓶盖上的锯齿总是 21 个?
为什么啤酒瓶盖上的锯齿总是 21 个?