论文浅尝 - ICML2020 | 对比图神经网络解释器

论文笔记整理:方尹,浙江大学在读博士,研究方向:图表示学习。


Contrastive Graph Neural Network Explanation

动机与贡献
本文主要关注图神经网络的解释性问题,这样的解释有助于提升GNN的可信度,能够更好的理解输入中的哪些部分对预测结果的影响最大。本文主要的贡献有三个:

1)提出了Distribution Compliant Explanation (DCE)主张,要求做模型解释所用到的数据要和训练数据服从相同的分布,即具有一致性;

2)基于DCE,他们提出了一种方法,Contrastive GNN Explanation (CoGE),用于解释GNN在图分类问题中的预测结果;

3)在真实数据集和合成数据集上证明了这种方法的有效性。

相关工作

之前已经有过一些用于解释网络的方法:

1)Occlusion: 它是通过遮挡一个节点或者一条边,通过这样做对预测结果的影响大小,来判断该节点或边的重要性程度。

2)GNNExplainer: 通过最大化预测结果和子图结构之间的互信息,找到最重要的结构和特征。

3)Image attribution methods: 计算每个节点的相关性得分,并把这个相关性得分反向传播到输入层,以得到节点和输入之间的相关性。

DCE主张

以上提到的方法中有一些是基于图像的方法,它们考察的是像素而不是边。如果直接迁移到GNN上来会有一些弊端。直接移除边可能会得到disconnected graph. 而且很小的扰动也会导致图的拓扑结构发生很大的变化,从而导致模型的预测结果的变化,不利于判断到底哪些节点或者边对模型预测起关键性作用。

因此文章中提出,做模型解释的时候用到的数据必须和训练数据的分布具有一致性,而不能使用拓扑结构差异很大的数据。

模型与算法

根据DCE,文章提出了一种对比的方法,一个图的graph embedding远离和它具有不同label的图,靠近和它具有相同label的图,是因为图中某些parts在起作用。

这里用到了最优传输距离OT,图2展示了如何计算第一张图和第二张图之间的OT.首先给每个节点分配了一个权重,并且保证每个图的所有节点的权重之和为1,每个source node都要把自己的权重传输给target nodes, target nodes可以有一个或多个。每一个权重表示它们的最大容量,就是target nodes接收到的权重不能大于它本身的最大容量。一个传输过程的cost是传输权重乘以两节点的表示之间的距离。这里node embedding之间距离用L2距离计算。最优运输就是找到全局的最优权重分配,在这个过程中可能会涉及到某些节点的次优选择,比如图2中,节点2没有把所有权重都传输到节点4,即使他俩的node embedding是相同的,不会有cost. OT使得我们能够在节点的粒度上去对比两个图的表示。

Source node的权重也可以是不相等的,如果要最小化OT,那么在target图中没有对应项的节点的权重就会比较低。如节点2的对应项是4,2有对应项,1和3没有,那么1和3的权重就会比2低。若节点有对应项,source node和target node之间的距离为0,如果要最小化OT,其他source node的权重就会比较低。同理,如果要最大化OT,那么在target图中有对应项的节点的权重就会比较低。(让其他不为0的项更大)

 

CoGE的基本思想就是同时最大化具有相同label的图之间的OT和最小化不同label的图之间的OT,并寻找其中具有最小权重的那些节点,那些点就是explanation nodes.

第一部分是最大化同一类图之间的OT,又因为在最大化OT时,在target图中有对应项的节点的权重比较低,如图中2的权重比较低,去找其中具有最小权重的节点,就是在找有对应项的节点,相当于在找两个图中的共性,这些节点解释了为什么两个图可以被归为一类;

第二部分是最小化不同类图之间的OT,在最小化OT时,在target图中没有对应项的节点的权重比较低,比如图中1和3,去找其中具有最小权重的节点就是在找没有对应项的节点,相当于在找两个图中的特性,这些节点解释了为什么两个图不是同一类。

CoGE就是要同时做这两件事,可以归纳为公式1:

第一项损失,这里d指的是G和H两个不同类别的图之间的OT,其中G是权重不是均等的,H的权重是均等的,计算出G和所有不同类别的图之间的OT,选出其中最相似的k个,取平均;第二项损失是k个最相似的相同类别的图之间OT的平均。因为要最大化同一类图之间的OT,所以第二项损失前面取负号。第三项损失是一个惩罚项,它计算的是G和均等权重的G之间的OT,它惩罚了偏离均等权重的情况,因此会使w只做出有实质性好处的微小调整。

实验与结果

文章在两个用于图形分类的真实数据集上做了explanation:

1、MUTAG标记了4337个化学分子的诱变性,图3中颜色越浅表明该节点越重要,CoGE方法将NO2识别为最重要的,一些文献已表明NO2确实是具有诱变性的,但是NO2也存在于一些非诱变的图中;CoGE同时也发现O旁边的C对诱变性的判别也很重要。CO和NO2的组合仅存在于诱变的实例中,不具有诱变性的化学分子不会同时含有这两个结构。

2、REDDIT-BINARY是一个论坛讨论数据集。节点是用户,边是对另一个用户评论的响应,两个label分别为Q&A和discussion。如图4所示,CoGE认为中心节点以及与中心节点相连的节点对分类起重要作用。事实上,Q&A是大多数用户向极少数的专家提问并且得到答复。而Online Discussion具有深度比较大的树状结构。

3、本文还在一个合成数据集CYCLIQ上进行了实验。这是一个用于二分类的数据集,它的label是图里是含有环或含有团。这个问题中正确的explanation应是包含在团或者环结构中的边。边的重要性是边两头的节点的重要性之和。

4、explanation的准确性定义如下,用CoGE选出x条最重要的边,找出在这x条边中有多少条在环或者团中,计算两者的比例。实验的baseline是random guessing, 基于节点的occlusion(通过移除或遮挡一些节点,计算它对实验结果的影响),sensitivity analysis(反向传播),GNNExplainer.由表1,解释团的准确率大于解释环的,CoGE产生了最好的结果,对于两种类别来说,准确率都比其他方法高出10%。图1展示了随机抽取的某个示例,CoGE很准确的找到了包含在团中的边。

Ablation Study

本文又在同样的合成数据集上研究了每个损失项的重要性程度,选择不同的Loss进行实验。对比第一行和第三行可以看到,第一项损失其实具有更多的解释性。在它的基础上,其他两项的加入让它的性能有一定的提高。

除此之外,用欧式距离代替OT距离,计算node embedding的加权平均值之间的欧式距离。这样会导致准确率下降,但还是优于baseline.

Conclusion

1)讨论了GNN的特殊性。图的拓扑结构很重要,少量的修改就会导致图脱离了已知的数据分布。

2)提出了DCE主张:explanation用到的数据应该与训练数据分布保持一致。

3)提出了一种新的解释方法CoGE,它遵循DCE.并且实验结果表明它具有有效性和参数选择的鲁棒性。

4)Future work: 将该方法扩展到node classification上,更深入的理解explanation和对抗攻击之间的联系。

欢迎有兴趣的同学阅读原文。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478820.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

这可能是最简单又有效的自监督学习方法了

文 | 王珣知乎本文已获作者授权,禁止二次转载从Kaiming的MoCo和Hinton组Chen Ting的SimCLR开始,自监督学习(SSL)成了计算机视觉的热潮显学。凡是大佬大组(Kaiming, VGG,MMLAB等),近两…

大众点评账号业务高可用进阶之路

引言 在任何一家互联网公司,不管其主营业务是什么,都会有一套自己的账号体系。账号既是公司所有业务发展留下的最宝贵资产,它可以用来衡量业务指标,例如日活、月活、留存等,同时也给不同业务线提供了大量潜在用户&…

LeetCode 493. 翻转对(归并排序)

1. 题目 给定一个数组 nums &#xff0c;如果 i < j 且 nums[i] > 2*nums[j] 我们就将 (i, j) 称作一个重要翻转对。 你需要返回给定数组中的重要翻转对的数量。 输入: [1,3,2,3,1] 输出: 2输入: [2,4,3,5,1] 输出: 3来源&#xff1a;力扣&#xff08;LeetCode&#x…

论文浅尝 - ICML2020 | 通过关系图上的贝叶斯元学习进行少样本关系提取

论文笔记整理&#xff1a;申时荣&#xff0c;东南大学博士生。来源&#xff1a;ICML 2020链接&#xff1a;http://arxiv.org/abs/2007.02387一、介绍本文研究了少样本关系提取&#xff0c;旨在通过训练每个关系少量带有标记示例的句子来预测句子中一对实体的关系。为了更有效地…

美团外卖客户端高可用建设体系

背景 美团外卖从2013年11月开始起步&#xff0c;经过数年的高速发展&#xff0c;一直在不断地刷新着记录。2018年5月19日&#xff0c;日订单量峰值突破2000万单&#xff0c;已经成为全球规模最大的外卖平台。业务的快速发展对系统稳定性提出了更高的要求&#xff0c;如何为线上…

我哭了,工业界AI项目落地有多难?

文 | 皮特潘源 | CVer人工智能是近几年最火热的技术名词&#xff0c;如果不谈人工智能相当于落伍&#xff0c;但当真正进入人工智能领域时才发现&#xff0c;一开始以为“拦路虎”是算法&#xff0c;后面发现落地是一个巨大的难题。本文从作者的经历和经验教训展开&#xff0c;…

LeetCode 646. 最长数对链(区间 贪心)

1. 题目 给出 n 个数对。 在每一个数对中&#xff0c;第一个数字总是比第二个数字小。 现在&#xff0c;我们定义一种跟随关系&#xff0c;当且仅当 b < c 时&#xff0c;数对(c, d) 才可以跟在 (a, b) 后面。我们用这种形式来构造一个数对链。 给定一个对数集合&#xf…

以太网和路由设置,内网和外网同时上

第一步&#xff0c;查看自己内网的地址&#xff0c;网络与internet设置&#xff0c;更改适配器选项&#xff0c;出现下面的页面 点击内网&#xff0c;右击WLan&#xff0c;点击状态 点击详细信息&#xff1a; 记录网关信息&#xff1a; 第二步&#xff1a;查找路由器设置 …

论文浅尝 - AAAI2020 | 通过知识库问答改善知识感知对话生成

论文笔记整理&#xff1a;胡楠&#xff0c;东南大学博士。来源&#xff1a;AAAI 2020动机现在的将外部知识整合到对话系统中的研究仍然存在一定缺陷。首先&#xff0c;先前的方法难以处理某些语句的主语和关系&#xff0c;比如当语句中的相关实体彼此相距较远时。其次&#xff…

互联网企业数据安全体系建设

一、背景 Facebook数据泄露事件一度成为互联网行业的焦点&#xff0c;几百亿美元市值瞬间蒸发&#xff0c;这个代价足以在地球上养活一支绝对庞大的安全团队&#xff0c;甚至可以直接收购几家规模比较大的安全公司了。 虽然媒体上发表了很多谴责的言论&#xff0c;但实事求是地…

NLP研究者必备的语言学书籍!

文 | Serena Gao知乎首先&#xff0c;做nlp不一定要很懂语言学&#xff0c;也不一定要跟语言学扯上关系。nlp可以仅是data mining&#xff0c;features engineering, 也的确有很多work目前在用文本或者对话做为数据集&#xff0c;然后用统计学方法实现目的&#xff0c;比如deep…

LeetCode 334. 递增的三元子序列

1. 题目 给定一个未排序的数组&#xff0c;判断这个数组中是否存在长度为 3 的递增子序列。 数学表达式如下: 如果存在这样的 i, j, k, 且满足 0 ≤ i < j < k ≤ n-1&#xff0c; 使得 arr[i] < arr[j] < arr[k] &#xff0c;返回 true ; 否则返回 false 。 说…

论文小综 | Neuro-Symbolic Reasoning in NLP

本文作者&#xff1a;邓淑敏&#xff0c;浙江大学在读博士&#xff0c;研究方向为低资源条件下知识图谱自动化构建关键技术研究。深度学习的高速发展使得模型的表达能力逐步完善&#xff0c;在一些感知任务&#xff08;例如动作识别和事件检测&#xff09;上取得了显著成果。但…

实时数据产品实践——美团大交通战场沙盘

背景 大数据时代&#xff0c;数据的重要性不言而喻&#xff0c;尤其对于互联网公司&#xff0c;随着业务的快速变化&#xff0c;商业模式的不断创新、用户体验个性化、实时化需求日益突出&#xff0c;海量数据实时处理在商业方面的需求越来越大。如何通过数据快速分析出用户的行…

谁才是Transformer家族中的最强王者?谷歌告诉你答案

文 | Sherry自从17年Attention is all you need发出&#xff0c;继而18年BERT刷新各大榜单&#xff0c;大型预训练Transformer似乎已经成为自然语言处理的标准基准模型&#xff0c;甚至进一步渗透到图像领域。各路大神基于Transformer提出了海量改进方法。这些改变是否对大多数…

LeetCode 652. 寻找重复的子树(DFS)

1. 题目 给定一棵二叉树&#xff0c;返回所有重复的子树。对于同一类的重复子树&#xff0c;你只需要返回其中任意一棵的根结点即可。 两棵树重复是指它们具有相同的结构以及相同的结点值。 示例 1&#xff1a;1/ \2 3/ / \4 2 4/4 下面是两个重复的子树&#xff1a…

论文浅尝 - CIKM2020 | Relation Reflection Entity Alignment

论文笔记整理&#xff1a;谭亦鸣&#xff0c;东南大学博士生。来源&#xff1a;CIKM 2020链接&#xff1a;https://arxiv.org/pdf/2008.07962.pdf研究背景与任务描述:实体对齐旨在基于已有对齐实体标注的情况下&#xff0c;确定不同KG中未知的对等实体&#xff0c;其本质是mult…

SQL解析在美团的应用

数据库作为核心的基础组件&#xff0c;是需要重点保护的对象。任何一个线上的不慎操作&#xff0c;都有可能给数据库带来严重的故障&#xff0c;从而给业务造成巨大的损失。为了避免这种损失&#xff0c;一般会在管理上下功夫。比如为研发人员制定数据库开发规范&#xff1b;新…

无内鬼,来点ICML/ACL审稿人笑话

文 | Sheryc_王苏最近&#xff0c;如果你的小伙伴突然没时间陪你出来玩了&#xff0c;请不要担心&#xff0c;ta可能正在与ICML/IJCAI/ACL的审稿人斗智斗勇。过去的一周里&#xff0c;机器学习顶会ICML、人工智能顶会IJCAI和NLP顶会ACL扎堆放出审稿人意见&#xff0c;有人欢喜有…

Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at

Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at&#xff1a;https://blog.csdn.net/python__reported/article/details/106318330 Docx:docx.opc.exceptions.PackageNotFoundError: Package not found at 一、报错内容二、解决方法 一、报错内容 报错&a…