RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
眼睛“迎风流泪”?兰州普瑞眼科医生提醒,这可不是小问题
语言政策对英语教育的影响:国际比较视角
兰彻斯特方程探秘:战争中的兵力消耗动态模型
携带骨灰盒乘机指南:所需程序及注意事项
2025重庆大学研究生奖学金和助学金有哪些,多少钱?
英雄联盟手游视野机制解析:从基础到进阶的全方位指南
气泡袋的材质制作原理:聚乙烯与特殊材质的应用
人事专员面试问题及答案有哪些技巧
错峰邂逅东山岛,寻那一抹悠然山海情
孙颖莎首夺世界杯,马龙拿下第30个世界冠军
五行对五音:探索音乐与自然元素的神秘联系
培养孩子主动思考的思维方式,提升学习兴趣与能力
自媒体脚本制作指南:提升观看留存率的核心思维与架构!
过户时保险应如何处理?处理过户时的保险有哪些要点?
签订租房合同时,水电费的写清楚是关键!
"七星连珠"天象科普:真相揭秘与观测指南
“超雄”冲上热搜!“超雄孩子”真是“天生坏种”吗?专家解读
PET-CT检查能否确定肺结节的性质?专家权威解读
气门油封烧机油怎么解决
ACG与二次元文化的关系
欧奈尔选股模式实践
淮山汤可以补脾胃吗
武汉这个城市名称虽然只有100年,但武汉已有建城史3500年
启明创投入主天迈科技,邝子平意在“买壳”?
GMP洁净室级别划分及监管重点
维生素B族小孩子能吃吗?如何通过饮食获取维生素B族
TCP/IP协议详解:物理层基础知识
矫正牙齿超级痛如何应对与缓解疼痛问题
智能羊舍在智慧牧场中的应用与发展前景
3DMark通过率低于97%意味着什么?如何判断显卡是否为矿卡?