EMNLP 2023精选:Text-to-SQL任务的前沿进展(下篇)——Findings论文解读

导语

本文记录了今年的自然语言处理国际顶级会议EMNLP 2023中接收的所有与Text-to-SQL相关(通过搜索标题关键词查找得到,可能不全)的论文,共计12篇,包含5篇正会论文和7篇Findings论文,以下是对这些论文的略读,某几篇也有详细的笔记(见链接)。

由于篇数过多,分为两篇博客记录,本篇为第二篇,主要记录Findings论文:

序号类型标题
1MainBenchmarking and Improving Text-to-SQL Generation under Ambiguity
2MainEvaluating Cross-Domain Text-to-SQL Models and Benchmarks
3MainExploring Chain of Thought Style Prompting for Text-to-SQL
4MainInteractive Text-to-SQL Generation via Editable Step-by-Step Explanations
5MainNon-Programmers Can Label Programs Indirectly via Active Examples: A Case Study with Text-to-SQL
6FindingsBattle of the Large Language Models: Dolly vs LLaMA vs Vicuna vs Guanaco vs Bard vs ChatGPT - A Text-to-SQL Parsing Comparison
7FindingsEnhancing Few-shot Text-to-SQL Capabilities of Large Language Models: A Study on Prompt Design Strategies
8FindingsError Detection for Text-to-SQL Semantic Parsing
9FindingsReFSQL: A Retrieval-Augmentation Framework for Text-to-SQL Generation
10FindingsSelective Demonstrations for Cross-domain Text-to-SQL
11FindingsSemantic Decomposition of Question and SQL for Text-to-SQL Parsing
12FindingsSQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data

Findings

Battle of the Large Language Models: Dolly vs LLaMA vs Vicuna vs Guanaco vs Bard vs ChatGPT - A Text-to-SQL Parsing Comparison

  • 链接:https://arxiv.org/abs/2310.10190
  • 摘要:ChatGPT的成功引发了一场AI竞赛,研究人员致力于开发新的大型语言模型(LLMs),以匹敌或超越商业模型的语言理解和生成能力。近期,许多声称其性能接近GPT-3.5或GPT-4的模型通过各种指令调优方法出现了。作为文本到SQL解析的从业者,我们感谢他们对开源研究的宝贵贡献。然而,重要的是要带着审查意识去看待这些声明,并确定这些模型的实际有效性。因此,我们将六个流行的大型语言模型相互对比,系统评估它们在九个基准数据集上的文本到SQL解析能力,涵盖了五种不同的提示策略,包括零样本和少样本场景。遗憾的是,开源模型的性能远远低于像GPT-3.5这样的封闭源模型所取得的成绩,这凸显了进一步工作的需要,以弥合这些模型之间的性能差距。

image.png

  • 要点:本文对比了六种大型语言模型(包括ChatGPT、Dolly、LLaMA、Vicuna、Guanaco和Bard)在文本到SQL解析任务上的性能。尽管模型在生成语法正确的SQL语句方面表现出色,但在生成语义上仍有挑战。特别是,开源模型的表现普遍低于闭源模型。论文还指出,这些语言模型对少次学习中使用的示例非常敏感。

Enhancing Few-shot Text-to-SQL Capabilities of Large Language Models: A Study on Prompt Design Strategies

  • 链接:https://arxiv.org/abs/2305.12586
  • 摘要:上下文学习(ICL)作为一种新的方法应用于各种自然语言处理任务,利用大型语言模型(LLMs)基于补充了少量示例或特定任务指令的上下文来进行预测。在这篇论文中,我们旨在将这种方法扩展到使用结构化知识源的问答任务,并通过探索使用LLMs的各种提示设计策略来改进文本到SQL系统。我们对不同的示例选择方法和提示LLMs的最佳指令格式进行了系统性的研究。我们的方法涉及利用示例SQL查询的语法结构来检索示例,并证明了在示例选择中追求多样性和相似性会带来性能的提升。此外,我们展示了LLMs从与数据库相关的知识增强中受益。我们最有效的策略在Spider数据集上比最先进的系统高出2.5个百分点(执行准确率),比最佳微调系统高出5.1个百分点。这些结果凸显了我们的方法在适应文本到SQL任务中的有效性,并且我们对促成我们策略成功的因素进行了分析。

image.png

  • 要点:本文主要探索了ICL中的Few-shot示例的选取原则,作者提出应该使用SQL的表征进行kNN选择而不是问题的表征,通过一系列实验证明了该方法的优越性。
  • 笔记:LLM少样本示例的上下文学习在Text-to-SQL任务中的探索

Error Detection for Text-to-SQL Semantic Parsing

  • 链接:https://arxiv.org/abs/2305.13683
  • 摘要:尽管近年来文本到SQL语义解析取得了显著进展,但现有解析器的性能仍远非完美。与此同时,基于现代深度学习的文本到SQL解析器经常过于自信,因此在实际使用时对其可信度产生了怀疑。为此,我们提出建立一个独立于解析器的文本到SQL语义解析错误检测模型。所提出的模型基于预训练的代码语言模型,并通过图神经网络学习的结构特征进行增强。我们在跨领域环境中收集的真实解析错误上训练我们的模型。使用具有不同解码机制的三个强大的文本到SQL解析器进行的实验表明,我们的方法超越了依赖解析器的不确定性指标,并能有效地提高文本到SQL语义解析器的性能和可用性,无论它们的架构如何。

image.png

  • 要点:本文基于CodeBERT训练了一个独立于解析器的SQL语义检查器,可以用于Text-to-SQL系统交互式触发检测和输出beam的重排序。

ReFSQL: A Retrieval-Augmentation Framework for Text-to-SQL Generation

  • 链接:https://openreview.net/pdf/39418589877bfe8b6dae6abbd727bcdb81a46d15.pdf
  • 摘要:文本到SQL是将自然语言问题转换为SQL查询的任务。现有方法直接将自然语言与SQL语言对齐,并训练一个基于编码器-解码器的模型来适应所有问题。然而,它们低估了SQL的固有结构特征,以及特定结构知识与一般知识之间的差距。这导致生成的SQL中出现结构错误。为了解决上述挑战,我们提出了一个检索增强框架,即ReFSQL。它包含两个部分:结构增强检索器和生成器。结构增强检索器旨在以无监督的方式识别具有可比特定知识的样本。随后,我们将检索到的样本的SQL纳入输入,使模型能够获得类似SQL语法的先验知识。为了进一步弥合特定知识与一般知识之间的差距,我们提出了一种马哈拉诺比斯对比学习方法,该方法有助于将样本转移到由检索样本构建的特定知识分布。在五个数据集上的实验结果验证了我们的方法在提高文本到SQL生成的准确性和鲁棒性方面的有效性。我们的框架在与许多其他主干模型(包括11B flan-T5)结合时取得了改进的性能,并在与采用微调方法的现有方法进行比较时,也取得了最先进的性能。

image.png

  • 要点:提出使用检索式增强Text-to-SQL生成,并利用对比学习帮助解码器更好的学习到检索样本构建的特定知识分布。

Selective Demonstrations for Cross-domain Text-to-SQL

  • 链接:https://arxiv.org/abs/2310.06302
  • 摘要:具有上下文学习能力的大型语言模型(LLMs)在跨领域文本到SQL任务中展示了令人印象深刻的泛化能力,而无需使用领域内注释。然而,已发现纳入领域内的示例演示能大大提高LLMs的性能。在本文中,我们深入研究了领域内示例中对改善贡献的关键因素,并探索我们是否可以在不依赖领域内注释的情况下利用这些优势。基于我们的发现,我们提出了一个示例选择框架ODIS,该框架利用领域外示例和合成生成的领域内示例来构建演示。通过从混合来源检索演示,ODIS利用了两者的优势,与依赖单一数据源的基线方法相比,展示了其有效性。此外,ODIS在两个跨领域文本到SQL数据集上均超过了最先进的方法,执行准确率分别提高了1.1和11.8个百分点。

image.png

  • 要点:本文介绍了ODIS框架,这是一种新颖的Text-to-SQL方法,它结合了领域外示例和合成生成的领域内示例,以提升大型语言模型在In-context Learning中的性能。
  • 笔记:从领域外到领域内:LLM在Text-to-SQL任务中的演进之路

Semantic Decomposition of Question and SQL for Text-to-SQL Parsing

  • 链接:https://arxiv.org/pdf/2310.13575v1.pdf
  • 摘要:文本到SQL语义解析面临着泛化到跨领域和复杂查询的挑战。最近的研究采用了问题分解策略来增强复杂SQL查询的解析。然而,这种策略遇到了两个主要障碍:(1)现有数据集缺乏问题分解;(2)由于SQL的语法复杂性,大多数复杂查询无法分解为可以轻松重组的子查询。为了应对这些挑战,我们提出了一种新的模块化查询计划语言(QPL),它系统地将SQL查询分解为简单和规则的子查询。我们利用SQL服务器查询优化计划的分析,开发了从SQL到QPL的转换器,并用QPL程序增强了Spider数据集。实验结果表明,QPL的模块化特性有利于现有的语义解析架构,并且训练文本到QPL解析器比文本到SQL解析更有效,用于语义上等价的查询。
    QPL方法还提供了两个额外的优势:(1)QPL程序可以被释义为简单的问题,这使我们能够创建一个(复杂问题,分解问题)的数据集。在这个数据集上训练,我们获得了一个对数据库模式敏感的数据检索问题分解器。(2)对于复杂查询,QPL对非专家来说更容易访问,导致语义解析器的输出更具可解释性。

image.png

  • 要点:本文提出了一种叫做Query Plan Language (QPL)的语言,用来将复杂SQL语句分解为更加简单的子语句。QPL可以将复杂问题转述为简单问题,提供了一种复杂问题分解方案。同时,QPL对于非专家处理复杂查询更易于接近,使语义解析器的输出更易于理解。
  • 笔记:QPL:一种新型的Text-to-SQL任务中间表示形式

SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data

  • 链接:https://arxiv.org/abs/2311.02883
  • 摘要:文本到SQL旨在自动化从自然语言文本生成数据库SQL查询的过程。在这项工作中,我们提出了“SQLPrompt”,专门用于提高大型语言模型(LLMs)的文本到SQL的少样本提示能力。我们的方法包括创新的提示设计、基于执行的一致性解码策略(在其他SQL提议中选择执行结果最一致的SQL),以及一种旨在通过在一致性选择期间使用不同的提示设计(“MixPrompt”)和基础模型(“MixLLMs”)多样化SQL提议来提高性能的方法。我们展示了SQLPrompt在少量标注数据的上下文学习中超过了以前的方法,以大幅度提升,缩小了与使用数千个标注数据进行微调的最新技术的差距。

image.png

  • 要点:本文提出了SQLPrompt,通过创新的Prompt设计、基于执行一致性的解码策略,以及混合不同格式的Prompt和不同LLMs输出的方式,提高了LLM在Few-shot In-context Learning下的能力。
  • 笔记:论文笔记:SQLPrompt: In-Context Text-to-SQL with Minimal Labeled Data

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/676586.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode2786. 访问数组中的位置使分数最大

Every day a Leetcode 题目来源:2786. 访问数组中的位置使分数最大 解法1:动态规划 状态数组: dp[i][0]: 访问下标范围 [0, i] 中的元素且最后访问的元素是偶数时的最大得分;dp[i][1]: 访问下标范围 [0, i] 中的元素且最后访问…

html5+css3胶囊按钮代码

效果 代码 <!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <title></title> <style> /* 胶囊开关的样式 */ .switch { position: relative; display: inline-block; width: 6…

EasyExcel操作Excel表格

一、EasyExcel介绍 1.1 介绍 EasyExcel 是一个基于 Java 的简单易用的 Excel 文件读写工具&#xff0c;它提供了一种简单而又高效的方式来读取、写入和操作 Excel 文件。EasyExcel 是阿里巴巴开源的项目&#xff0c;它旨在简化开发人员处理 Excel 文件的流程&#xff0c;使得…

API网关架构设计与实现的经验总结与实践

API网关是现代微服务架构中的重要组件&#xff0c;它充当了前端和后端微服务之间的中介。本文将介绍API网关的架构设计原则和实现方法&#xff0c;以帮助开发人员更好地理解和应用这些技术。 1. 什么是API网关&#xff1f; - 解释了API网关的基本概念和作用&#xff0c;以及…

【Spring框架】Spring事务的原理

目录 〇、对类或方法的Spring事务属性进行解析 0.1 解析标签 0.2 注册 InfrastructureAdvisorAutoProxyCreator 0.3 判断目标方法是否适合 canApply 0.4 匹配标签 match 0.5 小结 一、Spring事务的实现 1.1 准备事务 1.1.1 收集Transactional注解属性信息&#xff0c;…

美创科技与河南金融信创生态实验室签署战略合作协议

2024年1月31日&#xff0c;由普惠通科技与河南省科学院物理所、北京交通大学、中国金融电子化集团重庆金融认证中心联合发起成立中部地区第一家金融信创生态实验室运营公司&#xff08;即河南豫科普惠通信创科技有限公司&#xff09;与杭州美创科技股份有限公司战略合作签约仪式…

探索Xposed框架:个性定制你的Android体验

探索Xposed框架&#xff1a;个性定制你的Android体验 1. 引言 在当今移动设备市场中&#xff0c;Android系统作为最受欢迎的操作系统之一&#xff0c;其开放性和可定制性备受用户青睐。用户希望能够根据个人喜好和需求对其设备进行定制&#xff0c;以获得更符合自己习惯的使用…

深度学习自然语言处理(NLP)模型BERT:从理论到Pytorch实战

文章目录 深度学习自然语言处理&#xff08;NLP&#xff09;模型BERT&#xff1a;从理论到Pytorch实战一、引言传统NLP技术概览规则和模式匹配基于统计的方法词嵌入和分布式表示循环神经网络&#xff08;RNN&#xff09;与长短时记忆网络&#xff08;LSTM&#xff09;Transform…

谷歌 DeepMind 联合斯坦福推出了主从式遥操作双臂机器人系统增强版ALOHA 2

谷歌 DeepMind 联合斯坦福推出了 ALOHA 的增强版本 ——ALOHA 2。与一代相比&#xff0c;ALOHA 2 具有更强的性能、人体工程学设计和稳健性&#xff0c;且成本还不到 20 万元人民币。并且&#xff0c;为了加速大规模双手操作的研究&#xff0c;ALOHA 2 相关的所有硬件设计全部开…

Elasticsearch:通过 ingest pipeline 对大型文档进行分块

在我之前的文章 “Elasticsearch&#xff1a;使用 LangChain 文档拆分器进行文档分块” 中&#xff0c;我详述了如何通过 LangChain 对大的文档进行分块。那个分块的动作是通过 LangChain 在 Python 中进行实现的。对于使用版权的开发者来说&#xff0c;我们实际上是可以通过 i…

问题:老年人心理健康维护与促进的原则为________、________、发展原则。 #媒体#知识分享

问题&#xff1a;老年人心理健康维护与促进的原则为________、________、发展原则。 参考答案如图所示

[SAP] ABAP代码程序美化器大小写格式化设置

按照ABAP开发的规范&#xff0c;ABAP源代码里推荐将所有的关键字大写&#xff0c;其余ABAP变量小写 我们可以手动修改上述代码大小写规范的问题&#xff0c;但如果代码量很多的情况下&#xff0c;手动确保这个规范(所有的关键字大写&#xff0c;其余ABAP变量小写)有点费事&…

k8s -ingress

概念 Ingress 公开了从集群外部到集群内服务的 HTTP 和 HTTPS 路由&#xff0c;ingress能代理集群为内部的网络&#xff0c;将集群外部的HTTP/HTTPS网络请求转发至不同的service&#xff0c;其本质就是创建一个NodePort类型的svc,和一个nginx 组成 k8s中的ingress 其实是指…

Go语言的100个错误使用场景(30-40)|数据类型与字符串使用

前言 大家好&#xff0c;这里是白泽。 《Go语言的100个错误以及如何避免》 是最近朋友推荐我阅读的书籍&#xff0c;我初步浏览之后&#xff0c;大为惊喜。就像这书中第一章的标题说到的&#xff1a;“Go: Simple to learn but hard to master”&#xff0c;整本书通过分析100…

数据结构-->线性表-->单链表

链表的定义 链表&#xff1a;链表是一种物理存储结构上非连续、非顺序的存储结构&#xff0c;数据元素的逻辑顺序是通过链表中的指针链接次序实现的。 与顺序表不同的是&#xff0c;链表里的每节都是独立申请下来的空间&#xff0c;我们称之为“节点、结点”。 节点的组成主要由…

【深度学习】:滴滴出行-交通场景目标检测

清华大学驭风计划课程链接 学堂在线 - 精品在线课程学习平台 (xuetangx.com) 代码和报告均为本人自己实现&#xff08;实验满分&#xff09;&#xff0c;只展示主要任务实验结果&#xff0c;如果需要详细的实验报告或者代码可以私聊博主&#xff0c;接实验技术指导1对1 有任…

C++学习Day04之单例模式

目录 一、程序及输出1.1 饿汉式实例1.2 饿汉式单例1.3 懒汉式单例1.4 线程安全的懒汉式单例 二、分析与总结 一、程序及输出 1.1 饿汉式实例 #include<iostream> using namespace std; #include <string> class Printer { public:static Printer * getInstance()…

零基础学编程怎么入手,中文编程工具构件箱之渐变背景构件用法教程,系统化的编程视频教程上线

零基础学编程怎么入手&#xff0c;中文编程工具构件箱之渐变背景构件用法教程&#xff0c;系统化的编程视频教程上线 一、前言 今天给大家分享的中文编程开发语言工具资料如下&#xff1a; 编程入门视频教程链接 https://edu.csdn.net/course/detail/39036 编程工具及实例…

Python速成篇(基础语法)下(新年快乐♥)

引言 一天不学编程手就痒&#xff0c;今天是除夕&#xff0c;学C艹vector的话就没时间出去玩了&#xff0c;所以就写写博客。今天要讲的内容是关于&#xff0c;list&#xff08;列表&#xff09;&#xff0c;tuple&#xff08;元组&#xff09;&#xff0c;字典&#xff08;di…

005集——shp格式数据转换乱码问题——arcgis

shp数据格式与其他数据格式转换过程中会遇到乱码等问题&#xff0c;原因如下&#xff1a; 在Shapefile头文件&#xff08;dBase Header&#xff09;中&#xff0c;一般会包含字符编码信息&#xff0c;这个信息称为 LDID &#xff08; Language Driver ID&#xff09;。在使用ar…