图卷积神经网络_深度层次化图卷积神经网络

f7193b51bee18f98f2355d0dbd0e51ee.png
来源:IJCAI 2019
论文地址:https://arxiv.org/abs/1902.06667
代码地址:https://github.com/CRIPAC-DIG/H-GCN

Introduction

1、问题定义:什么是半监督的节点分类?

5ddef27be50cdb97b6209379a5057b6c.png
图1 半监督节点分类

如图1所示,在标记数据量很少,待预测的节点和标记节点距离较远的情况下,预测未知节点的标签就叫做半监督的节点分类。

2、为什么要进行半监督的节点分类?

在现实生活中,图数据无处不在,例如社交网络,知识图谱,蛋白质分子等。许多应用都需要分析每个节点的性质,图节点分类任务就是这样一个基础的任务。但是,目前图的节点分类存在一些挑战,主要包括:

(1)图数据的非欧式空间难以应用传统的深度学习方法;

(2)节点之间的关系错综复杂;

(3)实际应用中标注数据相比总体数据数据很少。

Related Work

1、GCN

f213d60159b04b2dc4da1bfa32d0bbcc.png
图2 图卷积神经网络的示意图

如图2所示,每个节点通过邻域聚合的方式,把它的邻居节点的特征通过一定的方式聚合到一起,学出来中心节点的表达。

2、GAT

638ffa135337f8448094a83b01574fff.png
图3 GAT的示意图

如图3所示,GAT仍然是采用邻域聚合的思想,想要学习h1表达,需要聚合h2~h6的特征,只是这里权重的学习使用了Attention机制。

3、GraphSAGE

7294a72e3ce986d1225ee80e9d529946.png
图4 GraphSAGE示意图

GCN、GAT都属于直推学习(transductive),无法直接泛化到之前未见的节点。而GraphSAGE属于归纳式(inductive)模型,能够为新增节点快速生成embedding,而无需额外训练过程。

主要由以下三部分组成:

邻居采样:因为每个节点的度是不一致的,为了计算高效, 为每个节点采样固定数量的邻居。

邻居特征聚集:通过聚集采样到的邻居特征,更新当前节点的特征。

训练:既可以用获得的特征预测节点的上下文信息(context),也可以利用特征做有监督训练。

4、Hierarchical Graph Representation Learning with Differentiable Pooling(NIPS 2018)

93b02cc28e33150236987144b6286aa7.png
图5 层次化的图卷积网络

如图5所示,层次化的图卷积网络加入了Pooling层,能够捕捉图的层次信息,扩大了感受野。但是,这里的Pooled network训练十分困难,需要两个Loss保证网络能够收敛,Pooled network at level 1,2,3各不相同,需要分别训练。导致整个网络参数量巨大。

Proposed Method

7233668b86f7f9823abd43954ce77e63.png
图6 H-GCN的网络结构

如图6所示,H-GCN是一个对称的网络结构:在图6的左侧,在每次GCN操作后,我们使用Coarsening方法把结构相似的节点合并成超节点,因此可以逐层减小图的规模。由于每个超点对应了原始图中的一个局部结构,对超节点组成的超图进行图卷积操作就可以获得更大的更大的感受野。对应地,在示意图的右侧,我们在每次GCN操作后将超节点进行还原,即可得到每个原始节点的表达。同时,我们在对称的神经网络层之间加了shortcut连接,从而可以更好地训练。

具体的coarsening方法如图7所示:

d123e96a94876d6ffb8ee05b32798e65.png
图7 Coarsening方法

具体分为两种情况:

(1)SEG(Structural Equivalence Grouping):合并邻居节点完全相同的节点为一个超节点。

(2)SSG(Structural Similarity Grouping):按照结构相似度从大到小,合并相应的节点。结构相似性按照如下公式计算:

e0c866d204278dd1153057b7d35a6b4b.png

其中,Aij表示节点Vi,Vj所组成边的权值,D(Vi),D(Vj)表示节点Vi,Vj的度。

Experiment

为了验证H-GCN的有效性,作者在主流的节点分类任务上进行了测试,数据集包括引文数据集和知识图谱。分类结果如图8所示,H-GCN取得了SOTA的结果。

一个有意思的发现是:相比在引文数据集上的效果,H-GCN在知识图谱数据集NELL上的精度远远超过其他baseline方法。这是因为在NELL数据集上的训练数据量最少(仅0.3%的标记率),这可以定性地说明H-GCN能有效的增大感受野,使节点感受到相距比较远的标记节点的标签信息。

e661c8396dbbada4512b74b3e785abad.png
图8 分类准确率

为了进一步定量验证H-GCN对模型感受野的增大作用,作者在Pubmed上逐渐减小训练数据量,从每类20个标记样本到每类仅5个样本,结果如图9所示。可以发现,当训练样本逐渐减少时,baseline的精度下降非常明显,而H-GCN却能保持很高的准确率。在每类仅5个样本时,H-GCN比其他方法至少高出6个百分点。这是个非常有用的性质,因为现实生活中由于海量的数据量和高昂的标记成本,我们通常没有太多的标记样本,而H-GCN更大的感受野可以更充分地利用标记样本的标签信息。

293b50c63d0be2c602cc84362acedaec.png
图9 样本从20-5的分类准确率

相比于传统模型,H-GCN的一个特点是网络层数更深了,作者进一步分析了层数加深对性能的影响。如图10所示,当网络层数加深时,精度逐渐提升,但是当网络太深时,由于过拟合等原因,精度开始下降。在实验中,我们在引文数据集上使用了4层粗化层(对应的网络共有9层),在NELL数据集上使用了5层粗化层(对应的网络共有11层),这可能是由数据集的规模不同导致的。因为NELL的数据集最大,所以网络容量可以更大一点。

226d8eb67b8e5f56e3ae890c39155d6d.png
图10 层次加深对网络的影响

conclusion

图数据上的coarsening/pooling机制可以有效地增大模型的感受野,从而获取足够的全局信息。不同于传统的浅层图神经网络,作者提出了层次化的深度(分别为9层和11层)图卷积模型H-GCN,在节点分类任务上取得了SOTA的结果。特别地,在训练数据非常少的场景下,H-GCN的提升更为明显。而在现实生活中由于海量的数据量和高昂的标记成本,我们通常没有太多的标记样本,而H-GCN更大的感受野可以更充分地利用标记样本的标签信息,进一步提高分类准确性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/260074.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

老师能提供什么帮助

老师能提供什么帮助? 这篇本来想上周写的,原计划在感恩节推送,可惜太忙,计划赶不上变化。 时隔十年,我又要给计算机系的同学们上课了,心里还是有些小激动的。我下学期要开一门大课叫程序设计与数据结构,涵盖…

12个Icon图标资源网站

1.除了Icon以外,还有很多不错的UI设计素材。 地址:http://worldui.com/2.除了免费Icon资源下载以外,还提供Icon定制的付费服务。地址:http://dryicons.com/3.很喜欢这个icon资源站的展示方式。地址:http://www.icotrip…

linux中解决SSH连接慢问题

2019独角兽企业重金招聘Python工程师标准>>> 现在连接linux服务器一般都是使用SSH远程连接的方式。最近新装了一台服务器,发现telnet时速度很快,ping时一切也正常,但SSH连接的时候却很慢。经过网上资料查询,大致是有以…

阿里云深圳数据中心正式开放

阿里云深圳数据中心正式开放 ​ 8月29日,阿里云深圳数据中心正式开放运营,这是继杭州、青岛、北京、香港之后,我们在全球开放的第五个数据中心。 深圳数据中心主要辐射以深圳、广州为中心的华南区域,以满足这一区域内的商贸企业、…

c语言函数声明定义参数命名,C语言函数声明与定义

C语言函数声明与定义教程在C语言函数声明与定义语法type funcName(paramType1 param1, paramType2 param2){// 执行语句...return val}参数参数描述type函数的返回值类型,如果没有任何返回值,则写 void,不可以死省略不写。funcName函数名。pa…

SNF开发平台WinForm之五-高级查询使用说明-SNF快速开发平台3.3-Spring.Net.Framework

5.1运行效果: 5.2开发实现: 1、按上面效果来说,先来看一下在程序当中如果调用。第一步在页面拖拽一个按钮为“高级查询”,事件上写下如下代码: 如果是单表查询的话,只需要传GridView就行,如果是…

颈椎病防治指南

2019独角兽企业重金招聘Python工程师标准>>> 长期从事财会、写作、打字、办公室等职业的工作人员,由于长期低头伏案工作,使颈椎长时间处于屈曲位或某些特定体位,不仅使颈椎间盘内的压力增高,而且也使颈部肌肉长期处于非…

智能手机计步算法c语言实现,【转载】智能手机计步器算法的实现

现在的智能手机嵌入了一些微小的传感器,比如重力传感器、光传感器、声音传感器等。如何有效地利用这些传感器来开发一些应用,是一个值得深入研究的课题。比如开发医疗健康的应用、运动量监视器等。本文采用htc Touch Pro智能手机的重力传感器来开发一款监…

Arduino教程资料汇总(8月22日悄悄跟新了一下)

http://www.geek-workshop.com/thread-985-1-1.html 本帖最后由 迷你强 于 2013-8-31 12:36 编辑 F-101 arduino基础套件使用资料 Arduino入门教程--课前准备--Arduino驱动安装及1.0 IDE菜单介绍Arduino入门教程--第一课--板载Led闪烁实验Arduino入门教程--第二课--第一次面包板…

HTML5/CSS3系列教程:HTML5 区域(Sectioning)的重要性

日期:2013-2-4 来源:GBin1.com 不管你以前在web页面布局中如何称呼它们 - “区域”还是“块”,我们一直都在布局中将页面分成可视的不同区域。但真正的问题在于我们并没有使用任何正确的工具来实现。一般情况下我们使用典型的网格来划分页头…

CoreAnimation —— CAReplicatorLayer(拷贝图层)

2019独角兽企业重金招聘Python工程师标准>>> CAReplicatorLayer是一个layer容器,会对其中的subLayer进行一些差异处理(它的子layer都可以拷贝) 属性: //拷贝的次数 property NSInteger instanceCount; //是否开启景深效…

android 接收短信代码,短信接收功能实现的代码

其中包含了widget必备的要素以及对应文件分别为:appwidgetprovider--------------------------SmsWidget.javawidget的config--------------------------SmsWidgetConfig.javawidget引发的app-------------------------SmsAider.javaappwidgetproviderinfo---------…

Entity Framework With Oracle

虽然EF6都快要出来了,但是对于Oracle数据库,仍然只能用DB first和Model First来编程,不能用Code First真是一个很大的遗憾啊。 好了,废话少说,我们来看看EF中是如何用DB first和Model First来对Oracle编程的。 首先我们…

(三)Maven仓库介绍与本地仓库配置

1.Maven本地仓库/远程仓库的基本介绍 示意图: 本地仓库是指存在于我们本机的仓库,在我们加入依赖时候,首先会跑到我们的本地仓库去找,如果找不到则会跑到远程仓库中去找。对于依赖的包大家可以从这个地址进行搜索:http…

android分辨率比例成像,像素不是唯一 决定成像效果你必知的真相

像素并不是唯一如今不少人在选购一部手机时,非常重视手机摄像头的像素大小,因为一部高像素的手机可以为不少喜爱拍照的人省去买单反的费用,而且携带起来也非常方便。不过,手机并不能与专业的单反相机相比,成像效果并不…

Android底部导航栏实现(一)之BottomNavigationBar

BottomNavigationBar这个控件的使用之前已经写过,这里不再赘述,详情请参考BottomNavigationBar的使用。 下面直接上代码: 初始化及相关设置: mBottomNavigationBar (BottomNavigationBar) view.findViewById(R.id.bottom_navigat…

USACO 2.4.1 The Tamworth Two

牛和农夫按照固定的走法在10x10的地图中走,每分钟走一步,求经过几分钟相遇。永远不能相遇输出0. 纯模拟的题。 判断永远不能相遇的方法是如果遇到了一个先前的状态,那么肯定存在循环,必定不能相遇。 程序中把状态表示为牛和农夫的…

013,spring boot下JedisCluster客户端的配置,连接Redis集群

2019独角兽企业重金招聘Python工程师标准>>> 1&#xff0c;pom依赖添加&#xff1a; <dependency> <groupId>redis.clients</groupId> <artifactId>jedis</artifactId> <type>jar</typ…

android控件使用大全,Android常见控件使用详解

本文实例为大家分享了六种Android常见控件的使用方法&#xff0c;供大家参考&#xff0c;具体内容如下1、TextView 主要用于界面上显示一段文本信息2、Button 用于和用户交互的一个按钮控件//为Button点击事件注册一个监听器public class Click extends Activity{private Butto…

Afterthought 原来是这样的啊。。。。

$(ProjectDir)Libs\Afterthought\Afterthought.Amender.exe "$(TargetPath)" "$(TargetDir)EntityFramework.Patterns.dll" 我实际上分析代码好久&#xff0c;也没整明白它是怎么运行的&#xff0c;看一下官方文档明白了&#xff0c;原来。。。 Next, add …