论文浅尝 | KGNLI: 知识图谱增强的自然语言推理模型

9564ecbad0f526ce8e8116985b28a241.png

笔记整理 | 韩振峰,天津大学硕士

链接:https://aclanthology.org/2020.coling-main.571.pdf

动机

自然语言推理 (NLI) 是自然语言处理中的一项重要任务,它旨在识别两个句子之间的逻辑关系。现有的大多数方法都是基于训练语料库来获得语义知识从而进行推理的,很少采用背景知识或者限制与少量特定类型的知识。本文提出了一种新颖的知识图谱增强的NLI模型(KGNLI),以利用知识图谱中的背景知识。KGNLI 模型由三个模块组成:知识关系表示模块、语义关系表示模块和标签预测模块。与以前的方法不同,本文提出的 KGNLI 模型中可以灵活地组合各种背景知识。在四个数据集(SNLI、MultiNLI、SciTail和BNLI)上的实验验证了模型的有效性。

亮点

KGNLI的亮点主要包括:

1.提出使用句子中的主语、谓语和宾语来构建知识图谱子图,从而获取句子的知识关系表示。2.使用BiLSTM获取句子的语义关系表示,并将其与知识关系表示进行融合。3.模型在四个数据集上都取得了很多好的效果。

概念及模型

KGNLI模型由知识关系表示、语义关系表示和标签预测三个模块组成,模型整体框架如下:

fb6ef6287a2561cebdc71c911c44a34a.png

•知识关系表示

本文假设句子对 p h 之间的关系由它们的主语、宾语和谓语之间的关系决定。 

背景关系子图:给本文将句子对 p h 中的主语对、谓语对和宾语对分别表示为(p_s, h_s)、(p_p, h_p)和(p_o, h_o)。对于每一个句子对,通过在知识图谱KG上进行随机游走获取实体之间的路径,从而提取出背景关系子图中的主语对(p_s, h_s)。谓语对和宾语对以同样的方式提取。本文使用句子的句法依存树来提取主语、谓语和宾语。

知识嵌入:本文基于子图来学习句子对的知识关系表示。首先,使用TransE来初始化 p h 的知识嵌入向量{a_s^k, a_p^k, a_o^k}和{b_s^k, b_p^k, b_o^k}:

6b24ab7bb6bf3e61577bead73e6858e7.png

然后使用图神经网络更新嵌入向量。对于每一个实体,检索子图上它的所有邻居节点,使用如下规则利用邻居节点的信息:

9a78a0f9c6951b5efcdbddf59efd9a48.png

其中S_pi代表p_i的所有(e,r)对的集合,e是p_i的邻居,r 是p_i和e之间的关系。对于p,\phi_p(e, r)为:

188ce343fbbd5ad4eda733912f83b70c.png

对于h,\phi_h(e, r)为:

bcb410b1b52bb5dea0b8ea39fc0bc096.png

关系表示:基于子图中路径的表示来获取关系表示。将主语对(p_s, h_s)之间的第个i路径表示为:

1ecca5a36a4935cdf98ab483fe26ac2b.png

r_j和e_j表示路径上的第j个关系和实体。谓语和宾语的路径l_i^P和l_i^O以相同的方式定义。使用BiLSTM编码路径序列:

1d132cad801e79072bebc00ba260489c.png

知识融合:使用下列融合层来融合主语对、谓语对和宾语对的关系:

8870f3dde4fcd77a851e6980924ca00d.png

•语义关系表示

为下文将p和h表示为p=[p_1, ..., p_m]和 h=[h_1,...h_m]。

语义嵌入:首先使用GloVe初始化单词向量,然后使用双向LSTM编码p和h,p和h的语义嵌入为:

3fcde9fb426966aeeb605a8e3988d7f0.png

局部推理:首先使用一个软对齐层来计算单词之间的相似度:

832c5d395cb9c5a6eaf0f6e5b72305c2.png

然后根据联合注意力E来计算局部相关信息:

c4ad88053e2c31db4d5cde84855a4e53.png

最后使用下列公式增强局部推理信息:

6f3400b048a5cb9b7f09069d665d718d.png

语义融合:融合层在句子层面上学习局部推理关系的类型,使用BiLSTM获取融合的向量:

fd80cb9eab87720e68f81b9518a6d9e5.png

然后使用池化层计算句子的平均池化和最大池化:

41d9a68c1a47b46ef4dce2c2d04a5f4c.png

最后得到p和h的语义关系为:

9c6cd3176657cd8b85855f91c5f5946b.png

•标签预测 使用句子对的全局关系来预测最终的标签,这里使用MLP:

5671ec0074fcd0caebed1a849c659f61.png

实验

本文采用了4个数据集进行实验,分别是SNLI, MultiNLI, SciTail, and BNLI,在每个数据集上的实验结果如下:

2f99513289d7e05c89022fce16983dcb.png

b5431f712c1686931a99a0e522f02a49.png

e5f9c2135a2e6e5d4e525fdc68152d29.png

ebd602044ede082c61747aead2134d6d.png

从以上各表可以看出,本文提出的模型KGNLI在各个数据集上均取得了很好的效果。

消融实验

为了验证主语、谓语和宾语对实验结果的影响,本文设计了如下表所示的消融实验,可以看出主语、谓语和宾语对模型的影响。

78aca36e899aaa8b80689e96f921cbdc.png

总结

本文提出了一种基于知识图谱的知识增强的自然语言推理模型(KGNLI),将背景知识引入NLI模型中。对于句子对,KGNLI模型学习到了基于知识图谱路径的知识关系表示和基于句子对的语义关系表示。这两个表示通过前馈神经网络融合以预测关系标签。实验结果验证了KGNLI模型的有效性。在未来的工作中,将致力于探索如何确定句子对中决定句子关系的关键字。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

2e039bcd6919f9c588032477965f3db6.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477865.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

block在美团iOS的实践

说到block,相信大部分iOS开发者都会想到retain cycle或是__block修饰的变量。 但是本文将忽略这些老生常谈的讨论,而是将重点放在美团iOS在实践中对block的应用,希望能对同行有所助益。 本文假设读者对block有一定的了解。 从闭包说起 在Lisp…

写Rap,编菜谱,你画我猜……这些 AI demo 我可以玩一天!

文 | ZenMoore编 | 小轶上次写的那篇 《Prompt 综述15篇最新论文梳理]》 有亿点点肝。这次给大家整点轻松好玩的(顺便给这篇推文打个广告,快去看!)。不知道读者朋友们有没有遇到这样的情况:有新的论文发表了&#xff0…

LeetCode 1254. 统计封闭岛屿的数目(图的BFS DFS)

文章目录1. 题目2. 解题2.1 DFS2.2 BFS1. 题目 有一个二维矩阵 grid ,每个位置要么是陆地(记号为 0 )要么是水域(记号为 1 )。 我们从一块陆地出发,每次可以往上下左右 4 个方向相邻区域走,能…

技术动态 | 图对比学习的最新进展

转载公众号 | DataFunSummit 分享嘉宾:朱彦樵 中国科学院自动化研究所编辑整理:吴祺尧 加州大学圣地亚哥分校出品平台:DataFunSummit导读:本文跟大家分享下图自监督学习中最近比较热门的研究方向:图对比学习&#xff0…

如何把Android手机变成一个WIFI下载热点? — 报文转发及DNS报文拦截

随着WiFi的普及,移动运营商的热点也越来越多了,如中国移动的CMCC、中国电信的ChinaNet、中国联通的ChinaUnicom等,一般来说,连上此类的热点,打开浏览器上网时都会自动跳转到一个验证页面,最近有个项目也有类…

OpenKG 祝大家新春快乐

OpenKG 祝各位读者新春快乐,虎虎生威!OpenKGOpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。点击阅读原文,进入 OpenKG 网站。…

推荐中使用FNN/PNN/ONN/NFM优化特征交叉

文 | 水哥源 | 知乎sayingDNN时代来临的时候,LR没打过,也很难加入。FM打不过,但他可以加入FM的精髓,最上在于latent embedding,有了它才能把交互拆解到基底上;居中在于element-wise乘,能让两个特…

LeetCode 310. 最小高度树(图 聪明的BFS,从外向内包围)

文章目录1. 题目2. 解题2.1 暴力BFS2.2 聪明的BFS1. 题目 对于一个具有树特征的无向图,我们可选择任何一个节点作为根。图因此可以成为树,在所有可能的树中,具有最小高度的树被称为最小高度树。给出这样的一个图,写出一个函数找到…

Emma使用与分析

什么是Emma EMMA 是一个开源、面向 Java 程序测试覆盖率收集和报告工具。 它通过对编译后的 Java 字节码文件进行插装,在测试执行过程中收集覆盖率信息,并通过支持多种报表格式对覆盖率结果进行展示。 EMMA 所使用的字节码插装不仅保证 EMMA 不会给源代码…

论文浅尝 | WWW2022 - “知识提示”之知识约束预训练微调

本文作者 | 陈想(浙江大学)、张宁豫(浙江大学)、谢辛(陈想)、邓淑敏(浙江大学)姚云志(浙江大学)、谭传奇(阿里巴巴),黄非&…

吐血整理:论文写作中注意这些细节,能显著提升成稿质量

文 | python编 | 小轶前言不知诸位在科研的起步阶段,是否曾有过如下的感受:总感觉自己写的论文就是和自己读过的论文长得不太一样,也不知道为啥。投稿的时候,审稿人也总是 get 不到论文的核心,只揪着论文的次要细节不放…

LeetCode 1237. 找出给定方程的正整数解

1. 题目 给出一个函数 f(x, y) 和一个目标结果 z&#xff0c;请你计算方程 f(x,y) z 所有可能的正整数 数对 x 和 y。 给定函数是严格单调的&#xff0c;也就是说&#xff1a; f(x, y) < f(x 1, y) f(x, y) < f(x, y 1)函数接口定义如下&#xff1a; interface Cu…

基于Wi-Fi的室内定位在美团总部的实践和应用(上)

室内定位技术的商业化必将带来一波创新高潮&#xff0c;尤其是在O2O领域&#xff0c;各种基于此技术的应用将出现在我们的面前。我们可以想象一些比较常见的应用场景&#xff0c;比如在大型商场里面借助室内导航快速找到目标商铺&#xff0c;商店根据用户的具体位置向用户推送更…

LeetCode 1266. 访问所有点的最小时间(数学)

1. 题目 平面上有 n 个点&#xff0c;点的位置用整数坐标表示 points[i] [xi, yi]。请你计算访问所有这些点需要的最小时间&#xff08;以秒为单位&#xff09;。 你可以按照下面的规则在平面上移动&#xff1a; 每一秒沿水平或者竖直方向移动一个单位长度&#xff0c;或者…

Coding Party 邀你出战!飞桨黑客马拉松线下场来啦

12月4-5日&#xff0c;这48H&#xff0c;与100开发者HACK Together“黑客”很酷&#xff1f;和“黑客”一起“战斗”是种什么样的体验&#xff1f;你参与这场“战斗”了吗&#xff1f;PaddlePaddle Hackathon 2021飞桨黑客马拉松&#xff0c;由百度飞桨联合深度学习技术及应用国…

技术动态 | 「知识图谱嵌入技术研究」最新2022综述

转载公众号 | 专知知识图谱(KG)是一种用图模型来描述知识和建模事物之间关联关系的技术. 知识图谱嵌入(KGE)作为一 种被广泛采用的知识表示方法,其主要思想是将知识图谱中的实体和关系嵌入到连续的向量空间中,用来简化操作, 同时保留 KG 的固有结构.它可以使得多种下游任务受益…

全球仅3000人通过的TensorFlow开发人员认证到底有多香!

现在&#xff0c;我们每个人都已经习惯了社交网络&#xff0c;随时随地都能进行微信、QQ语音和视频通话。那么&#xff0c;你是否发现在不同场景下&#xff0c;这些社交软件音频、视频都是那么的流畅&#xff0c;这背后是什么科技在支撑这“声”与“话”的美好呢&#xff1f;这…

LeetCode 1043. 分隔数组以得到最大和(DP)

1. 题目 给出整数数组 A&#xff0c;将该数组分隔为长度最多为 K 的几个&#xff08;连续&#xff09;子数组。分隔完成后&#xff0c;每个子数组的中的值都会变为该子数组中的最大值。 返回给定数组完成分隔后的最大和。 示例&#xff1a; 输入&#xff1a;A [1,15,7,9,2,…

图谱实战 | 安全领域知识图谱建设与典型应用场景总结

转载公众号 | 老刘说NLP 安全知识图谱是网络安全领域专用知识图谱&#xff0c;也是知识图谱应用于安全业务的重要工业尝试。当前&#xff0c;安全领域中存在大量的业务数据&#xff0c;建模需求以及应用需求&#xff0c;了解安全领域知识图谱的建设方法以及典型应用场景&#x…

Hadoop安全实践

前言 在2014年初&#xff0c;我们将线上使用的 Hadoop 1.0 集群切换到 Hadoop 2.2.0 稳定版&#xff0c; 与此同时部署了 Hadoop 的安全认证。本文主要介绍在 Hadoop 2.2.0 上部署安全认证的方案调研实施以及相应的解决方法。 背景 集群安全措施相对薄弱 最早部署Hadoop集群时并…