RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
用意念控制?“脑机接口”如何大开脑洞
AI换头术:开启人类意识转移的新篇章
猫咪脱肛怎么自己处理?教你简单有效的应对方法
工程管理本科自考指南:从考纲解读到高效备考策略
制定有效周计划:从时间分配到习惯养成
急性腰扭伤后的快速康复指南
新疆春节:天山下的羊肉串与维吾尔族歌舞
春节去新疆:十天玩转天山南北,错峰游更实惠!
春节打卡新疆四大宝藏景点
台湾岛的绝美风光,你打卡了吗?
牛肉营养价值:高蛋白助肌肉生长,六大功效守护健康
王星揭露妙瓦底电诈内幕:从演员招募到跨境救援
中医调理肝阴不足型胆囊炎,专家支招
中华中医药学会推荐:肝阴不足型胆囊炎中药方剂
海口住宅楼火灾敲警钟:手机充电器长期插在插座上隐患大
手机充电有讲究:20%-80%是最佳电量区间
中国实现大脑冷冻复活,清华开发无线脑机接口
道教“逍遥自在”理念如何助力现代人减压
户外骑行:在自然中寻找自由,在运动中释放压力
揭秘小学放学后的“黄金三小时”
学习标杆 | 老旧小区改造成功案例
Steam截图功能全攻略:F12一键捕捉游戏精彩瞬间
玩转Steam截图功能,《赛博朋克2077》精彩画面随时保存
轻度反流性食管炎可自愈,医生推荐这些方法
柴胡黄连配伍治疗反流性食管炎,临床有效率超九成
海南三大必游景点,你打卡了吗?
海南热带雨林国家公园:守护“雨林歌王”海南长臂猿
海南省农业产值再创新高!
膝盖痛的5大原因与7种缓解方法,中老年人必看
CS2语音技巧大揭秘:制胜关键