RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
护照照片拍摄秘籍大揭秘!
打卡海南最美线路:三亚亚龙湾至海口西海岸
涿州市医院苏亮教你直肠癌术后饮食
十大健康食品排名:专家解析功效与食用方法
什么是委托书
快时代的生活平衡术:效率提升不以牺牲质量为代价
布尔巴基学派:整数结构的全新解读
2024太湖梅花节:林屋梅海领衔,4天玩转西山岛
成都严查越线停车:新增124条严管路段,违规将罚款100元
青菜富含多种维生素,四种烹饪方法留住营养
饭后半小时,益生菌这样吃才有效!
王力宏元旦发行新专辑《I'M alive》,用音乐宣告重生
北京社保卡升级:新增非接触功能,15家银行可办理换发
揭秘上古八大姓氏背后的传奇人物
恒大财富拖欠300亿本息,任泽平辟谣没拿到报酬,钱拿得回来吗?
从“贱女孩”到作家:90后双胞胎姐妹的伤痛与救赎
西班牙大洪水:一场提前预报过的暴雨,为何会夺走223条人命?
铁路新规助力老年人无忧出行
山海关:秦皇岛的自然与历史奇观
2006年DBNs的提出,开启深度学习黄金时代
揭秘囊肿成因:遗传还是内分泌失调?
从地板到厨房:中年阿姨的实用清洁技巧
台湾方言里的“阿婆”有多神奇?
企业集团财务管理模式种类及特点
兰州牛肉面汤底熬制秘籍:从选料到调味的全流程解析
国家卫健委:2025年将启用12356全国统一心理援助热线
职场新人如何做好职业规划?
晚香玉种植指南:从选土到养护,打造夜间芳香空间
冬游河西走廊:5天自驾打卡三大遗产,莫高窟门票半价
科莫多巨蜥:神秘巨龙的生存密码