RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
学考一般多少分能通过?大概多少人过不了?
脚大拇指痛是什么原因
种植什么树木收益最好
高速超速的处罚:规则与后果
“数智”赋能:节水灌溉技术实现绿色升级
如何提高公众的节水意识?
仙人掌科普知识
高铁抽烟法条的法律适用与处罚机制探析
高铁为什么禁止乘客吸烟?会造成什么后果?
科学减脂:必须经历的三个阶段
离婚诉讼中审判人员回避制度的具体规定
风向对钓鱼的影响:不同季节的差异分析
江苏最适合养老的4座城,有底蕴,有格调,房价又不算高
16+8减肥法结合健身:科学减脂全面指南与成功经验分享
真实世界研究:艾考糊精腹透液降低新发腹透患者的死亡、技术失败及首次腹膜炎发生风险
炼乳检测项目及国家标准详解
为什么美股波动会影响黄金价格?这种影响的程度和范围如何?
构建智慧未来:深入解析社区综合服务管理平台
西汉王朝外戚专权的影响及其探讨
音乐发烧友必看:八步打造完美音响系统,让音质飙升
情绪的小小艺术家:家长如何欣赏并引导孩子表达情感
保持良好口腔卫生,从现在开始使用牙线和牙间刷!
真正的朋友,都懂得这18个相处规则
预防柴油发电机故障的有效措施
胆囊息肉到底要不要切?医生提醒:超过这个大小,恶变风险高
胆囊息肉0.5cm严重吗?医生这样说
如何分析黄金价格的月度走势?这种月度走势有何规律?
二类牵引在牙齿矫正中的应用:原理、操作与注意事项
9个超强查找下载化学学科文献的数据库 建议收藏
玉米面和白面混合做法,这些方法值得看!