论文浅尝 | ExCAR: 一个事件图知识增强的可解释因果推理框架

076cb1b0e6ff2afa709eb102d58fb2f7.png

笔记整理:朱珈徵,天津大学硕士

链接:https://aclanthology.org/2021.acl-long.183.pdf

动机

因果推理旨在理解因果之间的一般因果相关性,对于各种人工智能应用都有很大的价值。先前的研究主要是基于从手工注释的因果事件对中归纳出的知识来推断事件之间的因果关系。然而,关于因果关系的更多证据信息仍未被利用。通过整合这些信息,可以揭示因果关系背后的逻辑规律,提高因果推理系统的可解释性和稳定性。为此,作者们提出了一个事件图知识增强的可解释因果推理框架(ExCAR)。ExCAR首先从大规模的因果事件图中获取额外的证据信息,作为因果推理的逻辑规则。为了学习逻辑规则的条件概率,作者们提出了条件马尔可夫神经逻辑网络(CMNLN),它以端到端可微的方式结合了逻辑规则的表示学习和结构学习。实验结果表明,ExCAR的性能优于以往的SOTA方法。对抗性攻击评估显示ExCAR的稳定性优于基线系统。人工评估结果表明,ExCAR具有良好的可解释性能

亮点

ExCAR的亮点主要包括:

1.提出了一个事件图知识增强的可解释因果推理(ExCAR)框架充分利用证据信息的潜力。给定一个输入事件对,ExCAR首先从大型因果事件图中检索外部证据事件,并将它们之间的因果关系定义为一组逻辑规则;2.进一步提出了一个条件马尔可夫神经逻辑网络(CMNLN),以端到端方式学习逻辑规则的条件因果相关性,以解决事件之间因果关系的不确定。

概念及模型

•背景

因果推理任务可以形式化为一个预测问题:给定一个因果事件对<C,E>,由前提事件和其中一个假设事件组成,预测模型需要预测一个分数来度量事件对的因果关系。

CEG是由作者构建的大规模因果知识库,从该知识库中可以检索出一组针对某一因果事件对<C,E>的额外证据。在形式上,CEG是一个有向无环图,表示为G = {V,R},其中V是节点集,R是边集。每个节点  对应一个事件,而每条边  表示第i个事件和第j个事件之间存在因果关系。

为了提高因果推理的可解释性和稳定性,本文将因果推理问题转化为基于规则的推理任务。具体来说,给定一个输入因果事件对<C,E>,从CEG那里检索到一组证据事件。证据事件与C、E进一步形成一套因果逻辑规则,其中一条规则描述了两个事件之间的因果关系。在形式上,规则  ,其中是⇒一个逻辑连接,表示两个事件  和  之间的因果关系。针对这些因果逻辑规则,可以揭示因果机制,并以一种可解释的方式进行因果推理

事件图知识增强的可解释因果推理(ExCAR)框架结构如下:

b0139e79681112d34558673e053c684e.png

•ExCAR

如图上所示,ExCAR由两个组件组成。给定事件对<C,E>,ExCAR采用证据检索模块,从预先构建的因果事件图中检索证据事件,生成一组逻辑规则。然后ExCAR利用条件马尔可夫神经网络进行基于逻辑规则的因果推理。

•证据事件检索

给定在因果事件图之外的事件对<C,E>,为了从因果事件图中获得证据,作者首先在因果事件图中定位因果关系。从直观上看,语义上相似的事件会有相似的原因和结果,并且在CEG中共享相似的位置。为此,采用了一种预先训练的语言模型ELMo来推导CEG中事件的语义表示,以及因果事件。然后利用语义表示的余弦相似度,在CEG中找到与输入的因果事件语义相似的事件。这些事件可以作为定位因果事件的锚点。然后如上图所示,以原因事件的锚点为起点,以效应事件的锚点为终点,可以通过广度优先搜索(BFS)算法检索证据事件。

•条件马尔可夫神经逻辑网络

规则的因果强度可能因先行词的不同而不同,其中先行词可以是一个事件,一个简单的规则或单个规则的复杂组合。为清楚起见,将规则  的先行词表示为  。如图所示,从因果逻辑图派生出的单个规则可以有多个前因,每个前因都可以对规则的因果强度产生自己的影响。为了通过利用神经模型在表示学习中的有效性来解决这个问题,提出了基于逻辑规则嵌入的CMNLN。为了模拟规则的叠加因果效应,CMNLN将CLG视为不同因果逻辑链的组合,并结合每个因果逻辑链的信息预测因果评分。因此,在每个因果逻辑链中,使用一个前因感知的势函数,为每个规则估计特定于链的因果强度。然后CMNLN聚合链内因果信息和链间因果信息,得出因果评分。

•训练

在训练过程中,引入了因果逻辑驱动的负抽样,以提高条件因果强度估计的可靠性。特别是,如果在CLG中存在规则  ,由于因果关系的单向性,可以推导出相应的错误规则  。从CLG中,也可以通过随机抽样为错误规则生成一个错误的前因式。因此,理想情况下,这些错误规则的条件因果强度应该等于0。此外,还将因果关系的单向性与因果关系的及物性结合起来,生成具有更复杂模式的错误规则。通过对错误规则进行采样并训练这些错误规则的势函数为零时,条件因果强度估计的可靠性可以得到提高。对于因果逻辑驱动的负抽样过程,CMNLN的损失函数定义为

7f150b1f2755349db45b825ee616d7f4.png

理论分析

实验

为了评估ExCAR框架的鲁棒性,作者构建了一个额外的中文常义因果推理数据集C-COPA。

Baseline:这些方法从大规模语料库中估计词或短语层次的因果关系。然后通过合成词级或短语级的因果关系,得到输入事件对的因果关系。PMI使用点互信息度量词级因果关系。PMI EX是一个非对称的词水平PMI,它考虑了因果推理的方向性。CS通过整合必要性因果关系和充分性因果关系来衡量词汇层面的因果关系。CS MWP使用CS评分来衡量单词和介词短语之间的因果关系。

作者在下表中列出了COPA数据集和C-COPA数据集上的结果。实验表明,与基于因果对的BERT相比,ExCAR相关方法的性能有所提高。这表明从事件图中加入额外的证据有助于揭示因果决策机制,从而提高因果推理的准确性。ExCAR-w/ MLN和ExCAR-w/ CMNLN的性能优于ExCAR-concat,后者将CLG简化为一个事件序列。这表明利用逻辑规则之间复杂的因果关系模式可以帮助完成因果推理任务。与ExCAR-w/ fixed-cs相比,ExCAR-w/ MLN和ExCAR-w/ CMNLN的性能有所提高。这证实了神经化规则来解释逻辑规则的不确定性对因果推理任务是有帮助的。与ExCAR-w/ MLN相比,ExCAR-w/ CMNLN进一步提高了预测精度,表明通过整合前因感知势函数,CMNLN可以对因果推理逻辑规则的条件因果强度进行建模。

21515572bb3f9a5586ce3bc6499823ac.png

表2为对抗性攻击后的预测精度,∆为对抗性攻击带来的性能变化。例如,∆= -9.9表示攻击后的预测精度下降了9.9%。作者发现,与基于事件对的BERT相比,ExCAR能够显著提高预测精度的稳定性。这些结果表明,ExCAR可以通过引入额外的证据事件来揭示其背后的因果机制,从而提高预测结果的稳定性。

b70374add92953fdb17628eca3e040c6.png

总结

本文设计了一个新颖的可解释的因果推理框架ExCAR。给定一个事件对,ExCAR能够从一个大规模的因果事件图中获取逻辑规则,以提供对推理结果的洞察力。为了学习逻辑规则的条件概率,作者提出了一种结合了基于规则和神经模型的优势的条件马尔可夫神经逻辑网络。经验上,本文的方法在两个因果推理数据集,包括COPA和C-COPA上优于之前的工作。此外,ExCAR可以通过提供概率逻辑规则的解释来解释。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

d03e4d3b9b4179fdc95b9f07fa4acba5.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477834.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从ACL2021看对比学习在NLP中的应用

本文首发于微信公众号”夕小瑶的卖萌屋“文 | 花小花Posy源 | 夕小瑶的卖萌屋最近关注对比学习&#xff0c;所以ACL21的论文列表出来后&#xff0c;小花就搜罗了一波&#xff0c;好奇NLPers们都用对比学习干了什么&#xff1f;都是怎么用的呀&#xff1f;效果怎样呀&#xff1f…

美团性能优化之路——性能指标体系

前言 在互联网网站百花齐放的今天&#xff0c;网站响应速度是用户体验的第一要素&#xff0c;其重要性不言而喻&#xff0c;这里有几个关于响应时间的重要条件&#xff1a; 用户在浏览网页时&#xff0c;不会注意到少于0.1秒的延迟&#xff1b;少于1秒的延迟不会中断用户的正常…

图谱实战 | 面向C端场景的概念图谱构成、建设与应用索引

转载公众号 | 老刘说NLPC端是知识图谱应用的一个重要领域&#xff0c;这个领域有大量的用户行为数据&#xff0c;存在着包括搜索、推荐、广告投放等业务。当前&#xff0c;主流的互联网公司&#xff0c;如美团、阿里、腾讯都在尝试相关落地&#xff0c;在此当中&#xff0c;概念…

11 个好用的科研工具推荐!工作效率提升 max!

文 | 炼丹学徒编 | 小轶前阵子&#xff0c;卖萌屋团队群里大家互相分享了一波自己收藏已久的 好用科研工具 。小伙伴们纷纷都有一种相见恨晚的感觉&#xff01;这么多好东西&#xff0c;当然也要分享与各位读者小伙伴啦~也希望大家能把自己用过好用的工具留言在评论区&#xff…

搜索引擎关键字智能提示的一种实现

背景 搜索关键字智能提示是一个搜索应用的标配&#xff0c;主要作用是避免用户输入错误的搜索词&#xff0c;并将用户引导到相应的关键词上&#xff0c;以提升用户搜索体验。 美团CRM系统中存在数以百万计的商家&#xff0c;为了让用户快速查找到目标商家&#xff0c;我们基于s…

会议交流 | DataFunSummit 知识图谱在线峰会——链接知识图谱最前沿技术和最落地产业化应用的桥梁!...

随着人工智能技术的发展与应用&#xff0c;知识图谱作为AI进步的阶梯越来越受到学术界和产业界的重视&#xff0c;并且已经在很多领域、场景中体现出自身的价值。从最初的互联网搜索、推荐、问答等ToC场景&#xff0c;逐渐进入到垂直行业ToB的应用当中。然而&#xff0c;场景的…

LeetCode 1209. 删除字符串中的所有相邻重复项 II(栈)

1. 题目 给你一个字符串 s&#xff0c;「k 倍重复项删除操作」将会从 s 中选择 k 个相邻且相等的字母&#xff0c;并删除它们&#xff0c;使被删去的字符串的左侧和右侧连在一起。 你需要对 s 重复进行无限次这样的删除操作&#xff0c;直到无法继续为止。 在执行完所有删除…

YUI经验谈 - 自定义事件默认行为

纵观主流JS库和框架&#xff0c;YUI在自定义事件方面做的尤为出色。如果需要挑出一个代表性的feature&#xff0c;那么非事件默认行为莫属。 是什么 YUI自定义事件在总体上模仿了DOM事件的设计思想。DOM中的一些事件是有默认行为的&#xff0c;详细见DOM3 Event - Default acti…

美团NLP中心算法实习生招聘

致力于连接最靠谱的算法岗与最强的求职者招聘贴投放请联系微信xixiaoyao-1岗位职责&#xff1a;NLP算法研发&#xff0c;例如文本挖掘、知识预训练、知识&多模态预训练等知识图谱构建核心技术相关论文撰写岗位要求&#xff1a;北京高校在校大学生。&#xff08;2023年毕业优…

论文浅尝 | 改善多语言KGQA的 Zero-shot 跨语言转换

笔记整理&#xff1a;谭亦鸣, 东南大学博士生来源&#xff1a;NAACL21链接&#xff1a;https://aclanthology.org/2021.naacl-main.465/概述为了扩展多语言知识图谱问答的应用&#xff0c;Zero-shot方法成为一个研究趋势。在Zero-shot的设定下&#xff0c;通过高资源语言的训练…

LeetCode 1172. 餐盘栈(栈 + set)

1. 题目 我们把无限数量 ∞ 的栈排成一行&#xff0c;按从左到右的次序从 0 开始编号。每个栈的的最大容量 capacity 都相同。 实现一个叫「餐盘」的类 DinnerPlates&#xff1a; DinnerPlates(int capacity) - 给出栈的最大容量 capacity。void push(int val) - 将给出的正…

Hive SQL的编译过程

Hive是基于Hadoop的一个数据仓库系统&#xff0c;在各大公司都有广泛的应用。美团数据仓库也是基于Hive搭建&#xff0c;每天执行近万次的Hive ETL计算流程&#xff0c;负责每天数百GB的数据存储和分析。Hive的稳定性和性能对我们的数据分析非常关键。 在几次升级Hive的过程中&…

Prompt tuning新工作,五个参数解决下游任务 fine-tuning

文 | 小伟编 | 小轶前言自从Google石破天惊地发布Bert以来&#xff0c;NLP就进入了预训练语言模型的时代。众所周知&#xff0c;我们可以用预训练语言模型来学习各种各样的任务&#xff0c;即使它们的特征空间有比较大的差异。那么预训练语言模型为什么会有这种泛化能力呢&…

会议交流 | 如何将图谱实体与关系更好的向量化,并基于推理扩充知识边界?——DataFun Summit2022知识图谱在线峰会...

背景介绍知识图谱是对人类先验知识的概括&#xff0c;具有重要的学术价值和广泛的应用前景。在深度学习广泛应用环境下&#xff0c;知识图谱的表示学习通过将图谱实体和关系向量化&#xff0c;便于利用深度学习技术实现异质信息融合&#xff1b;同时&#xff0c;基于这种图谱表…

真正的高阶特征交叉:xDeepFM与DCN-V2

文 | 水哥源 | 知乎Saying1. xDeepFM和DCN-V2是真正的高阶交叉&#xff0c;和前面讲的High Order Factorization Machine&#xff08;HOFM&#xff09;又有着千丝万缕的联系。某种简化下&#xff0c;都能退化为HOFM的形式2. 如图3. 推荐模型迭代的时候要平衡涨点和复杂度的关系…

学术会议 | 中国杭州举办——第21届国际语义网大会​ISWC2022 Call for Papers

中国杭州举办&#xff01;ISWC2022 Call for Papers.ISWC(International Semantic Web Conference)是语义网和知识图谱领域的国际顶级学术会议&#xff0c;2022年10月23-27日&#xff0c;ISWC将在中国杭州举行&#xff0c;通过线上线下结合的方式&#xff0c;汇聚全世界相关的科…

LeetCode 82. 删除排序链表中的重复元素 II(链表)

1. 题目 给定一个排序链表&#xff0c;删除所有含有重复数字的节点&#xff0c;只保留原始链表中 没有重复出现 的数字。 示例 1: 输入: 1->2->3->3->4->4->5 输出: 1->2->5示例 2: 输入: 1->1->1->2->3 输出: 2->3来源&#xff1a;力…

从 ACL’22 投稿情况,速览当下 NLP 研究热点!

文 | Yimin_饭煲编 | 小轶卖萌屋的作者们&#xff0c;最近可真是忙秃了头~&#xff0c;不仅要苦哈哈地赶 ACL 2022 提前了两个月的Deadline&#xff0c;还要尽心尽力为读者们提供高质量的内容。如果大家心疼卖萌屋的作者们的话&#xff0c;还请多多一键三连:)ACL2022 全部转向了…

开源开放 | DeepKE发布新版本:支持低资源、长篇章、多任务的图谱抽取开源框架(浙江大学)...

OpenKG地址&#xff1a;http://openkg.cn/tool/deepkeGitHub地址&#xff1a;https://github.com/zjunlp/deepkeGitee地址&#xff1a;https://gitee.com/openkg/deepkeDeepKE网站&#xff1a;http://deepke.zjukg.org/CN/index.html开放许可协议&#xff1a;GPL 3.0贡献者&…

LeetCode 478. 在圆内随机生成点(概率)

1. 题目 给定圆的半径和圆心的 x、y 坐标&#xff0c;写一个在圆中产生均匀随机点的函数 randPoint 。 说明: 输入值和输出值都将是浮点数。圆的半径和圆心的 x、y 坐标将作为参数传递给类的构造函数。圆周上的点也认为是在圆中。randPoint 返回一个包含随机点的x坐标和y坐标…