RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
创作时间:
作者:
@小白创作中心
RB-SQL:基于检索的LLM框架处理大型数据库和复杂多表查询的NL2SQL
引用
CSDN
1.
https://blog.csdn.net/m0_59164304/article/details/140405598
NL2SQL的任务是将自然语言问题转换为SQL查询,以便从数据库中获取答案。现有LLM来指导SQL生成的方法在处理大型数据库和复杂多表查询时存在挑战,尤其是在处理冗余信息和提高提示工程效率方面。
(a) 利用大型语言模型(LLM)解决文本到SQL任务的一个示例。(b) DPR模型和提出的RB模型的图表。与DPR模型相比,RB模型将输入从文档扩展到其他数据类型(即表格、列、SQL框架)。
为了解决上述问题,提出了RB-SQL框架,包含三个模块:
- Table-Retriever:检索与问题最相关的表格。
- Column-Retriever:在检索到的表格中进一步检索相关列。
- SQL-Skeleton-Retriever:搜索具有相似SQL骨架的少量示例,并将SQL骨架引入示例组织,以增强上下文学习过程。
RB-SQL框架。表格检索器从数据库中筛选表格,列检索器进一步筛选列。SQL框架检索器用于选择相似的少量示例,并将SQL框架添加到示例组织中。
RB-SQL框架利用密集型段落检索(Dense Passage Retrieval, DPR)模型来检索相关表格、列和示例,以构建有效的提示工程。此外,框架还引入了SQL骨架作为示例组织中的中间步骤,以指导正确的SQL生成过程。
(a)表格检索器的工作流程。该模块计算问题与表格之间的相似度,并检索与问题高度相关的表格。(b)表格检索器的框架。使用BERT分别对问题和表格进行编码,并使用基于MaxSim的后期交互来计算相似度得分。
(a)列检索器的工作流程。该模块检索与问题高度相关的列。(b) 列检索器的框架。
(a)SQL骨架检索器的工作流程。 (b) SQL骨架检索器的框架。
通过在公共数据集BIRD和Spider上的实验,结果表明RB-SQL模型在性能上优于几个竞争基线:GPT-4、DIN-SQL、DAIL-SQL
还进行了消融研究,证明了RB-SQL框架中所有模块对于性能提升都起到了重要作用。
https://arxiv.org/pdf/2407.08273``RB-SQL: A Retrieval-based LLM Framework for Text-to-SQL``prompt:https://anonymous.4open.science/r/Anonymize-A5E7/prompt_case.txt
热门推荐
商朝的国防力量和军事建设如何?带来怎样的影响?
近期山东农民目击UFO事件?真相调查
商汤灭夏之战:古代王朝更迭的一幕
山东农民“电死外星人”事件始末:一场轰动全国的乌龙事件
8 个设计 AI 产品的用户体验技巧
陵水黎安滨海学校:一座现代化教育创新平台的崛起
海南陵水黎安:打造心理健康教育新高地
孕妇吃猪脑对胎儿的影响:营养与风险并存
隋唐英雄史大奈:突厥猛将的辉煌一生
孕妇保健:孕期营养与健康的生活方式
鲁国作为春秋第一大国,为何最先覆灭,没有成为春秋五霸
职场变动时,如何保持积极心态?
2025年事业大变局:八字命理与塔罗牌双重预测
UCL:伦敦大学学院的地理位置与学术优势
从春晚到《笑声传奇》:蔡明的艺术突破与创新
蔡明加盟《一路繁花》,老戏骨的新挑战!
著名舞台剧本案例分析
电子钢琴的崛起:探索现代音乐制作的新工具
微信自动续费坑太多?教你轻松避雷!
2027年上海哈利·波特乐园探秘攻略
大连理工大学:东北明珠为何被低估?
英国糖尿病协会推荐:科学饮食助力血糖控制
铁皮石斛:糖尿病饮食管理中的新选择
清华大学教授揭秘:飞行汽车的安全黑科技
大连理工医工结合创新中心开工,将为地方经济注入新动力
朋友背后说你坏话?这招教你优雅反击!
校外培训家长端App vs 学顺网:如何为孩子选择合适的培训机构?
济南市教育局发布:50所五星级校外培训机构名单
济南市校外培训选择指南:四要三不要,保障孩子学习安全
兰州公安2025:最新执法规范全解析