RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
了解公司ROE的方法有哪些?这些方法的可靠性如何?
【C++】Qt:WebSocket客户端示例
骨传导耳机:原理与优势全解析
冬季养生食疗食谱 冬天5大提高免疫力菜谱推荐
急性咽炎的病因、预防与治疗全解析
量子科技板块表现活跃 龙头企业竞相布局
《古惑仔之江湖新秩序》:江湖情义与现代社会的碰撞探讨
我的世界附魔大全(史上最全详解)
量子光学|量子理论的产生与发展
专科院校志愿填报指南:城市、大学、专业如何选择?
科幻与奇幻的交汇点:揭开 sf 魔域的奥秘
八大网络安全策略:如何防范物联网(IoT)设备带来的安全风险
轮胎压力监测系统 (TPMS) 终极指南:重要性、类型和维护技巧
柳宗元《江雪》诗文赏析
信阳毛尖茶是哪种茶?功效、水温、冲泡方法详解
本科学历性质是什么
胶头滴管的用途和使用注意事项
全面解析:购房投资中的风险管理策略
绿景中国被提出清盘呈请,白石洲旧改项目面临挑战
肋骨神经疼痛如何缓解
揭秘水泊梁山:历史真相与文学传奇的交织
玉米价跌四年新低!农户如何翻盘?
全真七子创建七大门派:道教全真教的辉煌传承
花鲢养殖全攻略:从鱼塘建设到越冬管理
家庭教育|父母用自身的成长引领孩子的成长
新材料的应用与未来发展:探索、挑战、机遇
会计也要失业了!DeepSeek预测高失业率的七大行业,文科生绝望了
带你认识大学专业 | 揭开"宝藏"化学的奥秘
和合术详解:挽回感情与促进关系的传统方法
文化中国行·长江之歌丨南京明城墙,为何是“长江上漂来的古城墙”