论文浅尝 - ICLR2020 | 用于半监督分类的图形推理学习

论文笔记整理:周虹廷,浙江大学研究生。研究方向:知识图谱,图表示学习等。


论文链接:https://arxiv.org/pdf/2001.06137.pdf

本文是发表在ICLR2020上针对图数据做节点半监督分类任务的论文。现有的算法解决图上节点分类问题一般使用传统的可监督的图卷积方法,但是当标签数据不足时,性能可能会大大降低。因此论文提出了一种图推理学习(GIL)框架,通过学习图拓扑上的节点标签推理来提高半监督节点分类的性能。为了更好的刻画两个节点之间的连接,论文通过将节点属性,节点间路径和局部拓扑结构封装在一起来正式定义结构关系,从而可以方便地从一个节点推导到另一个节点。为了学习推理过程,论文进一步介绍了从训练节点到验证节点的结构关系的元优化,从而使学习到的图推理能力可以更好地适应测试节点。对四个基准数据集(包括Cora,Citeseer,Pubmed和NELL)的综合评估表明,与半监督节点分类任务中的最新技术相比,GIL具有优越性。

1、Motivation

论文提出了一种图推理学习(GIL)框架,以指导模型本身从参考标记节点自适应地推断那些查询未标记节点,并在少数情况下提高半监督节点分类的性能。标记的样品。给定一个输入图,GIL尝试通过建立节点间关系从那些观察到的节点中推断出未标记的节点。节点间关系的结构是节点属性,连接路径和图形拓扑结构的集成。这意味着两个节点之间的相似性是从三个方面决定的:节点属性的一致性,局部拓扑结构的一致性以及节点间路径的可达性,如图1所示。为了高级特征提取,其中的节点以及其中节点的属性都通过图卷积联合编码。对于节点间路径可达性,采用随机游走算法来获取给定图中从标记参考节点到查询未标记节点的特征。基于计算的节点表示和节点间可达性,可以通过计算从参考节点到图中未标记节点的相似得分/关系来获得结构关系。受近期元学习策略的启发,作者认为如果模型学习了从训练集到验证集的结构关系推断,可以有益于学习模型的泛化能力。换句话说,论文提出的GIL试图学习从训练样本到验证样本的结构关系中潜在的一些可移植知识,从而使所学习的结构关系可以更好地适应新的测试阶段。

2、Model

本文提出的GIL模型包含三个模块,分别为对于各个节点,通过如GCN等算法编码节点自身的属性信息和周围的邻居的信息,然后通过算法确定两个节点的可达性后,通过已标记节点的信息推导出带确定节点的标签信息。

为了方便推断,论文专门在拓扑图上的两个节点之间建立了结构关系。将标记的顶点(在训练集中)视为参考节点,它们的信息可以传播到那些未标记的顶点中,以提高标记预测的准确性。形式上,给定参考节点vi∈VLabel,论文定义类似于vi的查询节点vj的得分:

Gvi 和Gvj分别为节点vi和vj的邻居子图,由于本文是对节点做一个多分类任务,因此类和节点的关系如下表示:

我们在下面综述一下整个模型的过程:

(1)节点表示

本文通过对各个节点的子图执行图卷积运算来提取顶点vi处的局部表示。类似于栅格化图像/视频,在栅格化图像/视频上,局部卷积核被定义为具有各种接受场的多个晶格,在文本的工作中,频谱图卷积用于编码输入图的局部表示。即对每个节点的子图,都进行类似于GCN的卷积操作以编码各个节点周围的邻居信息。

(2)路径可达性

在这里,我们通过在图上采用随机游走来计算从顶点i到顶点j的路径的概率,这是指根据概率矩阵P从vi到vj遍历图。从顶点i到顶点j的节点序列是图上的随机游动,可以通过考虑图顶点的集合将其建模为经典的马尔可夫链。为了表示该公式,我们表明P t是在t步中从顶点vi到达顶点vj的概率。通过考虑从顶点vi到顶点vj的t步路径,首先采取单步到某个顶点h,然后对tj采取t−1步,就很容易体现这一事实。

最后,从vi到vj的节点可达性可以写成dp维向量:

(3)节点分类

为了定义对于查询节点来说,周围各个已标记节点的贡献,本文同时考虑了节点间路径可达性,节点对之间的子图表示。然后通过加权和计算查询节点的节点表示,最后拼接周围节点的加权结果表示和查询节点本身的节点表示,通过一个全连接层,输出为标签类别数。

(4)推导学习

模型的损失函数即为如下的多分类损失函数:

      由于我们期待在训练集上训练良好的模型在验证集上仍然能有较好的表现,因此本文现在训练集上进行模型参数的梯度下降:

然后再在验证集上进一步的进行梯度下降:

在训练过程中,文章从训练节点和验证节点执行批量采样,而不是一次训练所有数据。在测试阶段,我们可以获取所有训练节点像训练过程一样进行模型更新。更新后的模型用作最终模型,推断那些查询节点的类标签。

3、Experiment

(1)模型比较

论文在四个数据集,包括Cora、Citeseer、Pubmed、NELL上与DeepWalk、GCN等经典模型进行了比较,结果显示模型的准确性有了显著的提升,它证明了文章提出的GIL通过构建图推理学习过程在各种图数据集上表现良好,其中有限的标签信息和图结构可以很好地用于预测框架中。

(2)模型分析

下表展示了经典的GCN模型以及我们提出的GIL模型只在训练集上进行训练和同时使用训练集和验证集进行训练的结果比较,可以看到,在使用验证集的数据后,模型有一个显著的提升,这表明可以通过元优化来学习良好的推理能力。值得注意的是,GIL采用了元优化策略来学习推理模型,这是一个从训练集迁移到验证集的过程。换句话说,验证集仅用于教导模型本身如何转移到看不见的数据。相比之下,常规方法通常采用验证集来调整特定模型的参数。

4、结论

在这项工作中,本文使用图推理学习方法解决了半监督节点分类任务,该方法可以在端到端框架中更好地预测这些未标记节点的类别。本文建立结构关系以获得任何两个图节点之间的连接,其中节点属性,节点间路径和图结构信息可以封装在一起。为了更好地捕获可转移的知识,本文的方法进一步学习了将挖掘的知识从训练样本转移到验证集,最终提高了测试集中未标记节点的标签的预测准确性。广泛的实验结果证明了论文提出的GIL在解决半监督学习问题方面的有效性,即使是在几次尝试中也是如此。将来,我们将扩展图推理方法以处理更多与图相关的任务,例如图生成和社交网络分析。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478955.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

WMRouter:美团外卖Android开源路由框架

WMRouter是一款Android路由框架,基于组件化的设计思路,功能灵活,使用也比较简单。 WMRouter最初用于解决美团外卖C端App在业务演进过程中的实际问题,之后逐步推广到了美团其他App,因此我们决定将其开源,希望…

Android官方开发文档Training系列课程中文版:管理系统UI之变暗系统条

原文地址:http://android.xsoftlab.net/training/system-ui/index.html 引言 系统条(System Bars)是屏幕上的一块显示区域,专门用来显示通知,设备的通讯状态以及设备的导向。典型的System Bars与APP同时显示在屏幕上。APP展示了具体的内容&…

实话实说:中文自然语言处理的N个真实情况

文 | Liu Huanyong按语中文自然语言处理,目前在AI泡沫之下,真假难辨,实战技术与PPT技术往往存在着很大的差异。目前关于AI或者自然语言处理,做的人与讲的人往往是两回事。作者简介Liu Huanyong,就职于中国科学院软件研…

Android官方开发文档Training系列课程中文版:管理系统UI之隐藏状态条

原文地址:http://android.xsoftlab.net/training/system-ui/status.html 这节课将会介绍如何隐藏不同的版本的状态条。隐藏状态条可以使内容展示区域更大,因此可以提供一种更强的身临其境的用户体验。 含有状态条的APP: 隐藏状态条的APP&am…

论文浅尝 - ACL2020 | 用于回答知识库中的多跳复杂问题的查询图生成方法

论文笔记整理:谭亦鸣,东南大学博士。来源:ACL 2020链接:https://www.aclweb.org/anthology/2020.acl-main.91.pdf1.介绍在以往的工作中,知识图谱复杂问答一般被分为两种类型分别处理:其一是带有约束的问题&…

深入理解JSCore

背景 动态化作为移动客户端技术的一个重要分支,一直是业界积极探索的方向。目前业界流行的动态化方案,如Facebook的React Native,阿里巴巴的Weex都采用了前端系的DSL方案,而它们在iOS系统上能够顺利的运行,都离不开一个…

全球44家机构,55位大佬,历时两年,打造最强NLG评测基准!

文 | 小轶(大家好,我是已经鸽了夕总仨月没写文章了的小轶(y)!新的一年一定改过自新,多读paper多写稿,望广大读者敦促(ง •̀_•́)ง)今天要和大家分享的是卖萌屋学术站上的本月最热…

LeetCode 171. Excel表列序号(26进制转10进制)

1. 题目 给定一个Excel表格中的列名称,返回其相应的列序号。 例如,A -> 1B -> 2C -> 3...Z -> 26AA -> 27AB -> 28 输入: "A" 输出: 1输入: "AB" 输出: 28输入: "ZY" 输出: 701来源:力扣&…

用户评论标签的抽取

原文链接:https://blog.csdn.net/shijing_0214/article/details/71036808 无意中在知乎中看到一个问题:淘宝的评论归纳是如何做到的? 了解之后觉得较为容易实现,就简单实现了一个对用户评论的标签抽取功能,纯属兴趣所致…

开源开放|数据地平线通过OpenKG开放全行业因果事理、大规模实时事理等7类常识知识库...

本期介绍开放中文简称、中文同义、中文抽象、全行业因果事理、实体概念描述、实时事理知识库、军事武器装备知识等七个事理相关知识图谱。截至目前,该七个数据集规模达数千万、累计下载次数达两千余次,可用于底层事理推理、查询扩展、数据增强等多个自然…

写给工程师的十条精进原则

引言 时间回到8年前,我人生中第一份实习的工作,是在某互联网公司的无线搜索部做一个C工程师。当时的我可谓意气风发,想要大干一场,结果第一次上线就写了人生中第一个Casestudy。由于对部署环境的不了解,把SVN库里的配置…

我删掉了Transformer中的这几层…性能反而变好了?

文 | chaos编 | 小轶基于Transformer结构的各类语言模型(Bert基于其encoder,Gpt-2基于其decoder)早已经在各类NLP任务上大放异彩,面对让人眼花缭乱的transformer堆叠方式,你是否也会感到迷茫?没关系,现在让…

LeetCode 821. 字符的最短距离

1. 题目 给定一个字符串 S 和一个字符 C。返回一个代表字符串 S 中每个字符到字符串 S 中的字符 C 的最短距离的数组。 示例 1:输入: S "loveleetcode", C e 输出: [3, 2, 1, 0, 1, 0, 0, 1, 2, 2, 1, 0]来源:力扣(LeetCode) 链…

论文浅尝 - ESWC2020 | ESBM:一个面向实体摘要的评测集

本文转载自公众号:南大Websoft。实体摘要(Entity Summarization),是知识图谱研究与应用中的一个关键问题。南京大学Websoft团队为此制作了一个评测集,称作ESBM,是目前可以公开获取的规模最大的评测集。这项…

美团在O2O场景下的广告营销

美团作为中国最大的在线本地生活服务平台,覆盖了餐饮、酒店、旅行、休闲娱乐、外卖配送等方方面面生活场景,连接了数亿用户和数百万商户。如何帮助本地商户开展在线营销,使得他们能快速有效地触达目标用户群体提升经营效率,是美团…

LeetCode 202. 快乐数(快慢指针)

1. 题目 2. 解题 一个数经过若干次各位数平方和后,会等于它自己使用类似环形链表的快慢指针法,最终快慢指针相遇,若不为1则是不快乐数 class Solution { public:int bitSquareSum(int n) {int sum 0, bit;while(n > 0){bit n % 10;su…

全栈深度学习第4期: 机器学习岗位区别与团队管理

一起追剧鸭简介Berkeley全栈深度学习追剧计划是由夕小瑶的卖萌屋发起的优质公开课打卡项目,通过微信群为同期追剧的小伙伴提供交流平台。关于该计划的详请见这里。Berkeley深度学习追剧群目前已有1000小伙伴加入,公众号后台回复口令 深度学习追剧 入群。…

会议交流 | DataFunCon 线上大会 - 知识图谱专题论坛

OpenKG开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。点击阅读原文,进入 OpenKG 博客。

我国政务大数据政策的文本分析:推进逻辑与未来进路

原文地址:https://www.sohu.com/a/238844423_99983415 摘要:[目的/意义]从已颁布政策文件中找出我国推进政务大数据发展和应用的内在逻辑, 为优化未来的政策路径提供对策建议。[方法/过程]通过政府门户网站收集189条有效政策文本, 综合运用词频分析软件…

Flutter原理与实践

Flutter是Google开发的一套全新的跨平台、开源UI框架,支持iOS、Android系统开发,并且是未来新操作系统Fuchsia的默认开发套件。自从2017年5月发布第一个版本以来,目前Flutter已经发布了近60个版本,并且在2018年5月发布了第一个“R…