论文浅尝 - ACL2022 | 面向推理阅读理解的神经符号方法

转载公众号 | 南大Websoft


65e538b7d07a372aa0d2ad966c4edbe3.png

概述

    近两年来NLP领域出现了一些富有挑战性的机器阅读理解数据集,如ReClor和LogiQA。这两个数据集中的问题需要对文本进行逻辑推理,然而传统的神经模型不足以进行逻辑推理,传统的符号推理器不能直接应用于文本。为了应对这一挑战,我们提出了一种神经-符号方法,将基本语篇单元用它们之间的逻辑关系组成图并进行推理。我们提出了一个自适应逻辑图网络(AdaLoGN),可以自适应地根据逻辑关系来扩展图,并且在一定程度上实现了神经和符号推理之间的交互和迭代强化。我们还实现了一种子图到节点的图消息传递机制,以增强多选题问答中的背景和选项交互,并在ReClor和LogiQA上取得了较好的结果。

3b36d47aee80fbd22c783fe372910f23.png

动机

    如下图,背景文本(Context)中包含了一系列描述基本语篇单元(elementary discourse unit, EDU)之间的逻辑关系的文本,如第一句话中描述了两个EDU之间的蕴含关系:”the company gets project A” -> “product B can be put on the market on schedule”。人类能够很自然地将这些命题转换为符号推理,然而对于计算机来说却是个有挑战性的任务。我们希望能够融合神经推理和符号推理,提升计算机解决逻辑推理问题的能力。

2c1cbcb3ba84be6e0faa2d165a65a1f4.png

方法

    我们构建了一个融合神经-符号推理的框架,这个框架总体上包括以下几个模块:

  1. 首先将文本划分为单独的EDU并使用预定义好的规则将关系映射到对应的逻辑关系。建立一个文本逻辑图(Text Logic Graph),并使用RoBERTa编码文本并得到EDU的初始表示。

    247e76eb072fc1f6dab92d9f40eb9e44.png

  2. 将逻辑推理的过程加入到图神经网络的框架中。我们根据结点的表示使用神经方法判断是否需要根据预定好的规则更改TLG的结构(添加额外的边或者结点)。实现了通过符号推理(逻辑规则)增强神经推理(图神经网络)。在图神经网络的中间层扩充的结果并不会保留到下一层,而是在下一层重新推理并扩充,能够一定程度上避免错误累积,而在上一层更新过的结点表示保留到下一层,通过这种机制反过来实现神经推理增强符号推理。

    f5bccb717c62d936491e209ce810111c.png

  3. 为了增强多选题中的背景和选项交互,我们提出了子图-结点消息传递机制。将TLG划分为背景子图和选项子图,在消息传递过程中,每一个结点不仅仅会收到邻居结点的消息,还会收到另外一个子图整体的消息,这个子图消息是注意力机制指导下的子图结点池化的结果。

    eb1babe35835369a5081360c9f434319.png

  4. 最后综合原始的背景、问题、选项表示和TLG的图表示预测答案。

实验

    我们在逻辑推理数据集ReClor和LogiQA上进行了实验,评测指标:accuracy。

ef83e8b55576b666b840646943888a00.png

    对比多个Baseline取得了更好的结果(除了LReasoner(w/ DA)),我们认为我们的方法和其它Baselines也能通过LReasoner中的DA(数据增强)方法获得提升。

    消融实验也展现了我们的各个模块的有效性,其中no-ext表示没有扩充,full-ext表示加入所有候选扩充,no-at表示去掉Adjacency transmission规则,n2n表示去掉子图-结点消息传递,n2n+中为背景子图和消息子图中的结点两两之间添加一条双向边。

e1302fe9494ce3ce55504ef4d144e0b9.png

错误分析和未来的改进方向

    在错误分析中发现错误集中在以下几类:

  1. 受限于EDU抽取工具的精度,出现TLG构建错误。

  2. TLG扩充过程中出错导致的错误。

  3. 使用的命题逻辑不能表示的推理过程(需要更高阶的逻辑系统)。

  4. 其它错误(可能是因为神经推理)。

535f9a3a6a66e62ab6c71278124e42ce.png

    基于错误分析,计划在未来的工作中使用表示能力更强的逻辑系统并设计更好的判断是否需要根据逻辑规则扩充的神经网络结构。

论文链接:https://arxiv.org/pdf/2203.08992.pdf

代码链接:https://github.com/nju-websoft/AdaLoGN


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

ca1128c8430b29624b0ea16bd864c916.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477788.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1026. 节点与其祖先之间的最大差值(二叉树DFS)

1. 题目 给定二叉树的根节点 root,找出存在于不同节点 A 和 B 之间的最大值 V,其中 V |A.val - B.val|,且 A 是 B 的祖先。 (如果 A 的任何子节点之一为 B,或者 A 的任何子节点是 B 的祖先,那么我们认为…

凭“难听”上热搜的 idol 们,不如考虑下让 Transformer 帮您作曲?

视频制作 | 白鹡鸰编 | 小轶考虑到 “AI 音乐”这一主题的特殊性,唯有多媒体的视频形式才能更好地给大家带来视听上的多重感受。于是,小屋的白鸟鸟同学在科研间隙连续肝了好几个晚上,才得以完成这次视频。然而在上周的推送中,不知…

YUI3在美团的实践

美团网在2010年引爆了团购行业,并在2012年销售额超过55亿,实现了全面盈利。在业务规模不断增长的背后,作为研发队伍中和用户最接近的前端团队承担着非常大的压力,比如用户量急剧上升带来的产品多样化,业务运营系统的界…

论文浅尝 - ICLR2022 | OntoProtein:融入基因本体知识的蛋白质预训练

论文题目:OntoProtein: Protein Pretraining With Gene Ontology Embedding本文作者:张宁豫(浙江大学)、毕祯(浙江大学)、梁孝转(浙江大学)、程思源(浙江大学&#xff09…

LeetCode 540. 有序数组中的单一元素(位运算二分查找)

1. 题目 给定一个只包含整数的有序数组,每个元素都会出现两次,唯有一个数只会出现一次,找出这个数。 示例 1: 输入: [1,1,2,3,3,4,4,8,8] 输出: 2示例 2: 输入: [3,3,7,7,10,11,11] 输出: 10注意: 您的方案应该在 O(log n) 时间复杂度 和 O…

迁移Prompt–解决Prompt Tuning三大问题!

文 | Harris刘鹏飞博士将近代NLP的研究划归为四种范式 [1] 并把预训练语言模型加持下的Prompt Learning看作是近代自然语言处理技术发展的“第四范式”。当我们使用新范式的方法的时候,能够意识到它带来的优异性可能是以某种“人力”牺牲为代价的。而如何让这种人力…

征文 | 2022年全国知识图谱与语义计算大会(CCKS 2022) 征稿通知

2022年全国知识图谱与语义计算大会征稿通知Call for Papers2022年8月25日-28日,秦皇岛征稿截止: 2022年5月22日第十六届全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语…

Spring Cloud 和 Dubbo 哪个会被淘汰?

今天在知乎上看到了这样一个问题:Spring Cloud 和 Dubbo哪个会被淘汰?看了几个回答,都觉得不在点子上,所以要么就干脆写篇小文瞎逼叨一下。 简单说说个人观点 我认为这两个框架大概率会长期都存在。 时至今日,这两个…

DNN与推荐两大门派,一念神魔,功不唐捐

文 | 水哥源 | 知乎Saying1. embeddingDNN范式有两个流派,一个更关注DNN,叫逍遥派;一个更关注embedding,叫少林派2. embeddingDNN这种结构中,embedding一般是模型并行;DNN一般是数据并行3. 逍遥派能够创造奇…

会议交流—PPT下载|DataFunSummit2022:知识图谱在线峰会PPT合集!

点击上方公众号卡片,后台回复『20220312』,即可下载!有哪些PPT?下载方式点击下方公众号卡片,后台回复『20220312』,即可下载!OpenKGOpenKG(中文开放知识图谱)旨在推动以中…

Spring Cloud 2020年路线图发布,涵盖Spring Boot 2.3、2.4,Spring Cloud Ilford等重磅内容!

Spring Cloud 开发团队昨日公布了 Spring Cloud 2020 年的路线图,并对 Spring Cloud Greenwich 和 Hoxton 的生命周期进行了一些讲解。 Spring Cloud Ilford 开发团队称 Spring Cloud Ilford 将是下一个主要版本,这也将是自 Spring Cloud Finchley 发布…

LeetCode 398. 随机数索引(概率)

1. 题目 给定一个可能含有重复元素的整数数组,要求随机输出给定的数字的索引。 您可以假设给定的数字一定存在于数组中。 注意: 数组大小可能非常大。 使用太多额外空间的解决方案将不会通过测试。 示例: int[] nums new int[] {1,2,3,3,3}; Solutio…

再论推荐特征与embedding生成

文 | 水哥源 | 知乎Saying1. 工业特征处理和学术特征处理存在巨大差异,这里建议同学们一定认真阅读。这个差异可能引发未来各种方法落地的矛盾。2. full embedding在概念上和one-hot的操作等价,但在操作上省略了这个过程。3. hash是最省事的,…

图谱实战 | 李翔:美团到店综合知识图谱的构建与应用

转载公众号 | DataFunTalk分享嘉宾:李翔 美团 算法专家编辑整理:王惠灵 合肥工业大学出品平台:DataFunTalk导读:美团到店综合业务涵盖了本地生活中的休闲玩乐、丽人、亲子、结婚、宠物等多个行业。为了不断提升到店综合业务场景下…

Spring Cloud Hoxton正式发布,Spring Boot 2.2 不再孤单

距离Spring Boot 2.2.0的发布已经有一个半月左右时间,由于与之匹配的Spring Cloud版本一直没有Release,所以在这期间碰到不少读者咨询的问题都是由于Spring Boot和Spring Cloud版本不匹配导致。 很多时候,我们在学习或重建系统的时候都喜欢直…

加了元学习之后,少样本学习竟然可以变得这么简单!

文 | Rukawa_Y编 | Sheryc_王苏,小轶去年年初 GPT-3 的论文在 arxiv 上出现,论文名为 “Language Models are Few-Shot Learners”,引起一阵轰动。除了前无古人的模型规模外,最抓人眼球的是, GPT-3 能够不需要 fine-tu…

Spring Cloud Alibaba基础教程:与Dubbo的完美融合

很早以前,在刚开始搞Spring Cloud基础教程的时候,写过这样一篇文章:《微服务架构的基础框架选择:Spring Cloud还是Dubbo?》,可能不少读者也都看过。之后也就一直有关于这两个框架怎么选的问题出来&#xff…

DIN+DIEN,机器学习唯一指定涨点技Attention

文 | 水哥源 | 知乎Saying1. 如果你面对一个全新的机器学习任务,让你来涨点。你可能第一个想到的往往是attention,第一个实现的是attention,第一个真的涨点了的技术也是attention;2. DIN的最主要的意义,把attention引入…

RabbitMQ延迟消息的极限是多少?

之前在写Spring Cloud Stream专题内容的时候,特地介绍了一下如何使用RabbitMQ的延迟消息来实现定时任务。最近正好因为开发碰到了使用过程中发现,延迟消息没有效果,消息直接就被消费了的情况。因此就继续深入研究了一下问题原因,在…

推荐中的attention有什么作用?

文 | 水哥源 | 知乎Saying1. attention要解决两个问题:(1)attention怎么加,在哪个层面上做attention;(2)attention的系数怎么来,谁来得到attention2. Attention常见的本质原因是求和…