论文浅尝 - SWJ | 基于知识图谱和注意力图卷积神经网络的可解释零样本学习

论文题目:Explainable Zero-shot Learning via Attentive Graph Convolutional Network and Knowledge Graphs

本文作者:耿玉霞,浙江大学在读博士,研究方向为知识图谱、零样本学习、可解释性

发表期刊:Semantic Web Journal (IF=3.524)

论文链接:http://www.semantic-web-journal.net/content/explainable-zero-shot-learning-attentive-graph-convolutional-network-and-knowledge-graphs-1


零样本学习(Zero-shot Learning, ZSL近年来引起了广泛关注,它可以将训练类别(Seen Classes)学习到的样本特征迁移到未出现在训练集中的新类别(Unseen Classes)上,有效减少了机器学习模型尤其是深度学习模型对标记数据的依赖。然而,目前大部分的ZSL方法是缺乏可解释性的,其模型预测的结果很容易被人质疑。因此,本文基于知识图谱和注意力图卷积神经网络提出了一个ZSL的可解释性框架,解释ZSL场景中样本特征的可迁移性,以此提升模型的可信赖度。

图1 KG-based ZSL 可解释性框架说明图

本文提出了一个基于知识图谱的ZSL可解释框架,在使用知识图谱帮助ZSL特征迁移的同时,利用知识图谱中丰富的类别知识,对特征的可迁移性作出解释。框架如图1所示,主要包括两部分:注意力ZSL学习器(Attentive ZSL Learner)和解释生成器(Explanation Generator)。其中:

(1) 注意力ZSL学习器(Attentive ZSL Learner)主要负责ZSL中的特征迁移并为后续可解释性奠定基础。具体地,学习器首先利用知识图谱如WordNet建立seen classes和unseen classes之间的语义关系,随后借助注意力图卷积神经网络(Attentive Graph Convolutional Network, AGCN)中的图卷积层(Graph Convolutional Layer)和注意力层(Attention Layer)将图结构的语义关系编码映射到样本空间并与类别对应的样本特征(即classifier)进行对齐。在训练阶段,学习器以seen classes的classifiers作监督,同时在图卷积层的聚合操作下进行特征迁移为unseen classes学习 classifiers。其中,注意力层为不同的类别尤其是seen classes学习不同的权重,最终,为每一个unseen class学习到在特征迁移过程中最有贡献的一些seen classes(即impressive seen classes, IMSCs),学习器的模型结构图如图2所示。

图2 注意力ZSL学习器模型结构图

(2) 给定unseen class和它学习到的IMSCs,解释生成器(Explanation Generator)将它们分别对齐到外部知识图谱如Attribute Graph和DBpedia中抽取类别间的共有知识,并生成自然语言的解释,以此验证IMSCs的特征迁移到该unseen class的合理性,对类别间特征的可迁移性作出解释。其中,考虑到不同知识图谱中知识类型的不同,本文设计了三种知识抽取的算法,如基于关联规则挖掘的属性抽取算法、基于三元组模式和SPARQL查询语句的三元组抽取算法、以及基于TextRank的关键词抽取算法分别抽取类别间共有的属性、三元组及关键词。对应地,本文为抽取到的不同类型的知识,设计了不同的模版,以自然语言句子的形式组织这些知识,最终生成人可以理解的解释,生成器的模型结构图如图3所示。

图3 解释生成器模型结构图

最终,本文在AwA和ImageNet两个数据集以及更稠密的ImageNet*数据集上验证了ZSL学习器的效果,同时邀请志愿者对生成的解释在可信度和可读性两方面进行了评估,并给出了一些案例。基于生成的解释,本文对ZSL模型中特征迁移的情况进行了更深入的讨论。评估结果分别如下:

图4 注意力ZSL学习器实验结果

图5 注意力层权重学习可视化结果

图6 可迁移性解释案例,包括:类别对应的图片、DBpedia实体,从不同的知识图谱中抽取的知识,以及最终生成的解释和人工评分结果

总而言之,这篇文章研究工作的主要贡献是:

(1) 首次提出了基于知识图谱的ZSL可解释框架,用于解释ZSL中特征的可迁移性;      

(2) 提出了一个新的、基于知识图谱和注意力图卷积神经网络的ZSL算法,它利用知识图谱建模类别间的语义关系,并且将样本特征由seen classes迁移到unseen classes,在标准数据集上提升ZSL模型效果的同时,为后面的可解释工作提供了基础;

(3) 提出了一个可解释生成器,包含多个知识抽取算法抽取外部知识图谱如领域特定的Attribute Graph和通用域的DBpedia中丰富的类别知识;本文同时设计了一系列模板用于将从外部知识图谱中抽取的知识组织为自然语言句子,增加生成解释的可阅读性。

(4) 实验表明,基于知识图谱和注意力图卷积神经网络的ZSL可解释性框架可有效地对ZSL模型中特征的可迁移性作出解释,同时一定程度上保证ZSL算法本身的预测能力。

如果对本文的工作感兴趣,欢迎大家阅读原文,也欢迎大家和我们交流。

   


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478610.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 3. 无重复字符的最长子串(滑动窗口+哈希)

1. 题目 给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。 示例 1: 输入: "abcabcbb" 输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。示例 2: 输入: "bbbbb" 输出: 1 解释: 因为无重…

安装kenlm出现问题的解决方案gcc g++

安装kenlm出现问题的解决方案 apt-get install gcc apt-get install g参考文章:gcc: error trying to exec ‘cc1plus’: execvp: No such file or directory

论文浅尝 - TACL2020 | 改进低资源跨语言实体链接的候选生成问题

论文笔记整理:谭亦鸣,东南大学博士。来源:TACL 2020链接:https://arxiv.org/ftp/arxiv/papers/2003/2003.01343.pdf1.背景介绍跨语言实体链接(Cross-lingual Entity Linking, XEL)旨在利用源语言文本中实体描述(提及),…

卫星系统——酒店后端全链路日志收集工具介绍

背景 随着酒店业务的高速发展,我们为用户、商家提供的服务越来越精细,系统服务化程度、复杂度也逐渐上升。微服务化虽然能够很好地解决问题,但也有副作用,比如,问题定位。 每次问题定位都需要从源头开始找同事帮我人肉…

拖拽式Vue组件代码生成平台(LCG)新版详细介绍

拖拽式Vue组件代码生成平台是一款小猴自研的Vue代码生成工具,英文全称:Low Code Generator,简称LCG。它也是一种LowCode解决方案。通过它可以快速完成Vue组件的代码骨架搭建,通过减少不必要的重复工作从而带来开发效率的提升。 体…

ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory

apt-get update apt-get install libglib2.0-dev系统:ubuntu16.04

LeetCode 454. 四数相加 II(哈希)

1. 题目 给定四个包含整数的数组列表 A , B , C , D ,计算有多少个元组 (i, j, k, l) ,使得 A[i] B[j] C[k] D[l] 0。 为了使问题简单化,所有的 A, B, C, D 具有相同的长度 N,且 0 ≤ N ≤ 500 。所有整数的范围在 -228 到 228 - 1 之间…

论文浅尝 - AAAI2020 | 多轮对话系统中的历史自适应知识融合机制

论文笔记整理:潘锐,天津大学硕士。链接:https://www.aaai.org/ojs/index.php/AAAI/article/view/6425来 源:AAAI 2020论文简介保持对话的一致性和避免内容重复是构建以知识为基础的多轮对话系统的两个关键因素。尽管一些工作倾…

高性能平台设计—美团旅行结算平台实践

本文根据第23期美团技术沙龙演讲内容整理而成。 背景 美团酒旅有很多条业务线,例如酒店、门票、火车票等等,每种业务都有结算诉求,而结算处于整个交易的最后一环不可缺少,因此我们将结算平台化,来满足业务的结算诉求。…

小程序调试技术导读

近期团队内在自研小程序,我负责开发者工具中的调试部分。调试作为面向开发者的基础能力,扮演了极为重要的角色。 本篇文章是导读文章。 调试能力从0到1一共经历了4个版本,接下来的文章将会以这4个版本为主线分别进行介绍。 初始版 上图为调试…

可交互的 Attention 可视化工具!我的Transformer可解释性有救了?

文 | Sherry视觉是人和动物最重要的感觉,至少有80%以上的外界信息是经过视觉获得的。我们看论文的时候,通过图表来确定文章的大致内容往往也是一个更高效的 说到深度神经网络的可视化,最经典的莫过于的CNN密恐图了:这种可视化方法…

ImportError: libSM.so.6: cannot open shared object file: No such file or dir

ImportError: libSM.so.6: cannot open shared object file: No such file or dir 出现错误: ImportError: libSM.so.6: cannot open shared object file: No such file or dir 解决方法: apt-get install libsm6如果你出现了上面的错误,那…

LeetCode 347. 前 K 个高频元素(哈希/优先队列)

文章目录1. 题目2. 解题2.1 哈希2.2 优先队列1. 题目 给定一个非空的整数数组,返回其中出现频率前 k 高的元素。 示例 1: 输入: nums [1,1,1,2,2,3], k 2 输出: [1,2]示例 2: 输入: nums [1], k 1 输出: [1] 说明: 你可以假设给定的 k 总是合理的&…

Lego-美团接口自动化测试实践

一、概述 1.1 接口自动化概述 众所周知,接口自动化测试有着如下特点: 低投入,高产出。比较容易实现自动化。和UI自动化测试相比更加稳定。如何做好一个接口自动化测试项目呢? 我认为,一个“好的”自动化测试项目&#…

小程序调试技术详解(基于小猴小程序)

本篇文章主要围绕小猴小程序调试技术第三版进行展开。 在上一篇导读文章中提到,小猴小程序的调试部分从无到有一共经历了3个版本。本篇文章会详细描述面向开发者的调试功能是如何实现的。 文章将会描述以下部分: 调试实现的基本通信关系结构。如何实现…

论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

论文笔记整理:王琰,东南大学硕士。来源:CIKM 2020链接:https://doi.org/10.1145/3340531.3411947研究背景与任务描述为了解决推荐系统中的数据稀疏和冷启动问题,研究人员通过利用有价值的外部知识作为辅助信息&#xf…

FedNLP: 首个联邦学习赋能NLP的开源框架,NLP迈向分布式新时代

文 | 阿毅两周前,南加大Yuchen Lin(PhD student USC and ex-research intern GoogleAI)所在的团队在Twitter官宣开源首个以研究为导向的联邦学习赋能NLP的FedNLP框架。发布数小时内就获得了647个赞,163次转发,可见其热度。我相信大…

LeetCode 380. 常数时间插入、删除和获取随机元素(哈希+vector)

1. 题目 设计一个支持在平均 时间复杂度 O(1) 下,执行以下操作的数据结构。 insert(val):当元素 val 不存在时,向集合中插入该项。 remove(val):元素 val 存在时,从集合中移除该项。 getRandom:随机返回现…

论文浅尝 - ICLR2020 | 知识图谱中数值规则的可微学习

论文笔记整理:许泽众,浙江大学博士研究生。研究方向:知识图谱,规则挖掘等。论文链接:https://openreview.net/pdf?idrJleKgrKwS本文解决的是规则的学习问题,学习出来的规则可用于知识推理任务,…

2021大厂面试高频100题最新汇总(附答案详解)

昨天在知乎上刷到一个热门问题:程序员需要达到什么水平才能顺利拿到 20k 无压力?其中一个最热门的回答是:“其实,无论你是前端还是后端、想进大厂还是拿高薪,算法都一定很重要。”为什么,算法会如此重要?不…