RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
在化工车间使用减速电机,如何选择合适的防腐等级?
乌力波:一个将文学创作变成数学实验的写作团体
定金收据怎么写?来聊规范书写与重要意义
乙肝145怎么回事
理解独立事件:概率计算中的关键概念
瓷盆花盆的花卉选择指南(如何根据瓷盆的特点选择合适的植物?)
NBA常规赛前瞻:雄鹿vs老鹰,双核对决团队篮球
低压电动机的保护装设规定
联合国妇女署呼吁为妇女就业和职业发展建立性别包容的工作场所
吉他基本功每日练习计划表
五大计单城市税收净贡献状况:深圳超过4千亿,宁波远高于青岛
唱歌护肺:科学依据与实用方法
在忙碌与疲惫中,重构“边界感”的坚固防线
宝宝需要高效陪伴,半小时胜过一整天!
人事行政的日常工作包括哪些内容?
英国人晚上吃什么
欧冠附加赛首回合综述:大巴黎法甲内战遥遥领先,科瓦奇取得执教多特首胜
海报设计图片中的创意与技巧
酒局说吃“鱼”
走向未来的太阳能发电
月亮在本命12宫位的情感与生活路径解读
高三政治答题技巧总结:如何高效学习与备考
光电技术的革新与未来展望
哪些光可以让肌肤更加美丽?医美治疗中使用的光疗技术详解
编导生都要学哪些知识?
风信子球根越来越小?开完花后这样处理,种球健壮开花多
AI成语、寓言故事视频制作教程及变现指南
聚焦黄河流域生态保护 | 谱写黄河上游流域清洁能源高质量发展新篇章
深圳失业金个人领取办理指南(条件/材料/流程)
什么情况下工程建设项目不得开工建设