XiYan-SQL:⼀种多⽣成器集成的Text-to-SQL框架

发布于:2024 年 12 月 03 日 星期二 北京

#NL2SQL #阿里巴巴 #Text-to-SQL

文提出了一种用于自然语言到 SQL 转换的多生成器集成框架 ——XiYan-SQL,旨在应对大型语言模型在 NL2SQL 任务中的挑战。该框架融合提示工程与监督微调(SFT)方法,利用 SFT 的可控性与上下文学习(ICL)潜力提升 SQL 查询质量与多样性。引入的 M-Schema 半结构化模式表示法增强数据库理解,其在多模型实验中表现优于传统模式。在模式链接环节精准筛选数据元素;候选生成阶段,微调 SQL 发生器经两阶段训练定制模型,ICL SQL 发生器依骨架相似选例,SQL 精炼器纠错优化;候选选择模块突破传统自一致性局限,训练模型精准抉择。多数据集实验验证 XiYan-SQL 优势,在 Spider、SQL-Eval、NL2GQL 达领先准确率,消融研究证实各组件关键作用,为 NL2SQL 任务开辟新径、引领发展。关注公众号【AIGC前沿技术追踪】后回复 XiYan 获取第一手英文翻译稿。

在这里插入图片描述

一、引言

在当今数字化时代,海量数据存储于各类数据库中,如何让非专业用户也能便捷地从复杂数据集中提取有价值信息,成为一项关键挑战。自然语言到 SQL(NL2SQL)技术应运而生,它能将自然语言查询转化为结构化查询语言(SQL),极大地提升了数据访问的效率与便捷性。大型语言模型(LLMs)的迅猛发展为 NL2SQL 应用注入强大动力,然而现有基于 LLMs 的 NL2SQL 解决方案仍存在诸多不足。

1.1 现有 NL2SQL 解决方案的局限

当前,基于 LLMs 的 NL2SQL 解决方案主要有提示工程和监督微调(SFT)两种途径。提示工程通过优化提示利用模型固有能力生成多样 SQL 查询,在零样本或少量样本提示的 NL2SQL 任务中成效显著,像 GPT-4 和 Gemini 1.5 等闭源大参数模型潜力巨大、泛化能力强,但多路径生成与自一致性选优的方式致使推理开销高昂。SFT 方法则在 NL2SQL 任务上对小参数模型微调,以生成更可控 SQL 查询,如 CodeS 虽能产生可控结果,却因参数有限,在复杂 NL2SQL 推理及新领域数据库迁移时力不从心。

1.2 XiYan-SQL 的创新理念

为攻克这些难题,XiYan-SQL 框架闪亮登场。它巧妙融合提示工程与 SFT 方法之长,在候选生成阶段展现出卓越性能。一方面,凭借 SFT 的高可控性,精心设计系列训练策略微调模型,生成风格各异、高质量的候选 SQL 查询;另一方面,借助上下文学习(ICL)的强大功能提升候选多样性与复杂查询生成能力。同时,引入 M-schema 这一新颖的半结构化模式表示法,助力 LLMs 更好地把握数据库架构,还通过优化各组件及精细的候选选择策略,全方位提升 NL2SQL 任务的处理水平。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/61926.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

插入算法介绍(c基础)

介绍一下希尔排序法(c基础)-CSDN博客 一、插入算法概述 定义 插入算法是一种常见的排序算法,它的基本思想是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。适用场景 插入算法适用于数据量较小…

qtcanpool 知 08:Docking

文章目录 前言口味改造后语 前言 很久以前,作者用 Qt 仿照前端 UI 设计了一个 ministack(https://gitee.com/icanpool/qtcanpool/blob/release-1.x/src/libs/qcanpool/ministack.h) 控件,这个控件可以折叠。部分用户体验后&#…

嵌入式C编程:宏定义与typedef的深入对比与应用

目录 一、宏定义(Macro Definition) 1.1. 特点与应用 1.1.1 定义常量 1.1.2 定义函数式宏 1.1.3 条件编译 1.2. 作用范围和生命周期方面 1.3. 应用注意事项 二、typedef 2.1. 特点与应用 2.1.1 简化类型声明 2.1.2 提高代码可读性 2.1.3 实现…

如何高效写论文-学习笔记【AI算法研究猿James】

视频链接:如何高效写论文_哔哩哔哩_bilibili 视频里面广告内容较多,为便于复习回顾,现对学习内容进行记录。 目录 1、写论文总体认知 1.1、写论文到底有多重要? 1.2、写论文难在哪儿? 2、从审稿人角度看论文写作 2.1、审稿人在意的是…

使用 EasyExcel 实现高效的 Excel 读写操作

在日常开发中,Excel 文件的读写操作是一个常见的需求。EasyExcel 是阿里巴巴开源的一个高性能、易用的 Excel 读写库,可以大幅提高处理 Excel 文件的效率。它通过事件驱动模型优化了大数据量 Excel 的读写性能,非常适合处理大文件或高并发场景…

电脑插入耳机和音响,只显示一个播放设备

1. 控制面板-硬件和声音-Realtek高清音频-扬声器-设备高级设置-播放设备里选择使用前部和后部输出设备同时播放两种不同的音频流 在声音设置中就可以看到耳机播放选项

代码随想录算法训练营day49|动态规划part11

最长公共子序列 这个与上篇笔记最大的不同就是子序列里的数可以不相邻,那么只需加入一个dp[i][j]的上和左的更新方向即可 class Solution { public:int longestCommonSubsequence(string text1, string text2) {vector<vector<int>> dp(text1.size()1,vector<…

JavaEE-经典多线程样例

文章目录 单例模式设计模式初步引入为何存在单例模式饿汉式单例模式饿汉式缺陷以及是否线程安全懒汉式单例模式基础懒汉式缺陷以及是否线程安全懒汉式单例模式的改进完整代码(变量volatile) 阻塞队列生产者消费者模型生产者消费者模型的案例以及优点请求与响应案例解耦合削峰填…

qt QCryptographicHash详解

1、概述 QCryptographicHash是Qt框架中提供的一个类&#xff0c;用于实现加密散列函数&#xff0c;即哈希函数。哈希函数能够将任意长度的数据转换为固定长度的哈希值&#xff0c;也称为散列值或数据指纹。这个哈希值通常用于数据的完整性校验、密码存储等场景。QCryptographi…

【数据结构】动态规划-基础篇

针对动态规划问题&#xff0c;我总结了以下5步&#xff1a; 确定dp数组以及下标的含义&#xff1b; 递推公式&#xff1b; dp数组如何初始化&#xff1b; 遍历顺序&#xff1b; 打印dp数组&#xff08;用来debug&#xff09;&#xff1b; 以上5步适用于任何动态规划问题&#x…

字符串函数和内存函数

字符串函数 1、strlcpy 【字符串拷贝】 &#xff08;将原字符串中的字符拷贝到目标字符数组中&#xff0c;包括终止符号\0&#xff0c;并在这里停止&#xff1b;为了避免越界&#xff0c;目标字符串数组应该足够大去接收&#xff09;&#x1f446; &#xff08;返回值是 dest…

Electron-vue 框架升级 Babel7 并支持electron-preload webapck 4 打包过程记录

前言 我这边一直用的electron-vue框架是基于electron 21版本的&#xff0c;electron 29版本追加了很多新功能&#xff0c;但是这些新功能对开发者不友好&#xff0c;对electron构建出来的软件&#xff0c;使用者更安全&#xff0c;所以&#xff0c;我暂时不想研究electron 29版…

模型优化与迁移学习

三大要素&#xff1a;数据、算法&#xff08;神经网络&#xff09;、算力 一、数据获取方法 数据集分类 分类数据&#xff1a;用于图像分类&#xff0c;一般是以目录形式分开 标注数据&#xff1a;用于目标检测和图像分割&#xff0c;是有标注数据的 1 开源数据集 1.PyTo…

ML 系列:第 39 节 - 估计方法:最大似然估计 (MLE)

目录 一、说明 二、什么是最大似然估计 (MLE)&#xff1f; 2.1 理解公式 2.2 MLE 的定义 2.3 我们何时使用 MLE&#xff1f; 三、结论 一、说明 在统计学领域&#xff0c;我们经常需要根据观察到的数据估计统计模型的参数。为此目的广泛使用的两种关键方法是最大似然估计 ( MLE…

文本生成类(机器翻译)系统评估

在机器翻译任务中常用评价指标&#xff1a;BLEU、ROGUE、METEOR、PPL。 这些指标的缺点&#xff1a;只能反应模型输出是否类似于测试文本。 BLUE&#xff08;Bilingual Evaluation Understudy&#xff09;&#xff1a;是用于评估模型生成的句子(candidate)和实际句子(referen…

Asp.net Mvc在VSCore中如何将增删改查的增改添加数据传输到页面(需配合上一篇Mvc的增删改查一起)

Linq集成查询&#xff08;关联Lambda&#xff09; First FirstOrDefault 找到第一个符合条件的元素 First(x >x.Id id) 返回第一个Id等于id的元素&#xff0c;如果都没有符合的&#xff0c;报错FirstOrDefault(x >x.Id id) 返回第一个Id等于id的元素&#xff0c;如果…

vue.js学习(day 19)

自定义创建项目 ESlint 代码规范 代码规范错误 手动修正 自动修正 settings.json {"emmet.triggerExpansionOnTab": true,"editor.fontSize": 25,// 当保存的时候&#xff0c;eslint自动帮我们修复错误"editor.codeActionsOnSave": {&qu…

【springboot】健康检查 监控

文章目录 1. 引言重要性 2. 配置Spring Boot ActuatorSpring Boot Actuator的角色和功能引入必要的依赖启用Actuator的健康检查端点配置安全性和可见性 3. 扩展健康检查指标创建自定义健康指示器示例&#xff1a;数据库连接健康检查示例&#xff1a;自定义缓存健康检查 4. 利用…

考研英语翻译与大小作文

名词动化词 1 持有 harbor2 2 反映 mirror 3 缩短 bridge 4 使用 harness 5 掩饰 mask/veil 6 修改 tailor 7 汇集 pool 8 控制 curb 9 想象 picture 10 激发 trigger 拉丁…

两个畸变矩阵相乘后还是一个2*2的矩阵,有四个畸变元素。1、畸变矩阵吸收了法拉第矩阵。2、畸变矩阵也给法拉第旋转角带来模糊(求解有多种可能)

角度一&#xff1b;恢复畸变的时候也把法拉第旋转恢复了 角度二&#xff1a;求解法拉第旋转角的时候 前面乘的复系数的不同也会带来法拉第旋转角和畸变的不同解 注意&#xff1a;无论多少个畸变矩阵相乘&#xff0c;结果都是2*2的矩阵&#xff0c;也就是畸变参数可以减少…