论文浅尝 | 图神经网络综述：方法及应用

640?wx_fmt=png

论文链接：https://arxiv.org/pdf/1812.08434.pdf

GNN相关论文列表链接：https://github.com/thunlp/GNNPapers

近日，清华刘知远老师组在arXiv上发表了一篇关于图神经网络的综述，本次论文浅尝在分享这篇论文的基础上，对图神经网络的相关方法及应用作一次梳理。

一、前言

图神经网络(GraphNeural Networks, GNNs)，主要针对非欧几里得空间结构（图结构）的数据进行处理。具有以下特点：

忽略节点的输入顺序；
在计算过程中，节点的表示受其周围邻居节点的影响，而图本身连接不变；
图结构的表示，使得可以进行基于图的推理。

640?wx_fmt=png

二、图神经网络模型

通常，图神经网络由两个模块组成：传播模块(PropagationModule)和输出模块(Output Module)，具体地：

（1）Propagation Module：图中节点之间传递信息并更新状态；

aggregator: 对于一个节点v, 通过聚合其周围节点的信息，学习其潜在表示h_v (state embedding)。

640?wx_fmt=png

其中，x_v为节点v的features，x_co[v]为其周围边的features，h_ne[v]表示节点v周围邻居节点的state embedding，x_ne[v]表示周围节点的features。

updater: 更新节点的stateembedding。

640?wx_fmt=png

（2）Output Module：基于节点和边的向量表示根据不同的任务定义目标函数

640?wx_fmt=png

在监督学习场景中，对于一个特定的节点，其监督信号表示为：t_v，lossfunction定义为：

640?wx_fmt=png

常见的图神经网络有：图卷积神经网络(GraphConvolutional Networks, GCNs)，门控图神经网络(Gated Graph Neural Networks,GGNNs)以及基于Attention机制的GraphAttention Networks(GAT)，下面详细介绍这三种网络：

640?wx_fmt=png

1、图卷积神经网络（GCN）

（1）基于谱方法(Spectral Methods):

相关论文：<ICLR-17> Kipf T N, Welling M.Semi-supervised classification with graph convolutional networks.

640?wx_fmt=png

通过计算图拉普拉斯算子(Graph Laplacian)的特征分解，在Fourier域定义卷积计算。对于输入信号x和卷积核?_?=????(?):

640?wx_fmt=png

其中，表示图结构的Graph Laplacian矩阵可分解为：

640?wx_fmt=png

上式的计算将卷积核近似为切比雪夫多项式，并进行化简：

640?wx_fmt=png

最终得到GCN网络中的表示：

aggregator:

640?wx_fmt=png

updater:

640?wx_fmt=png

但是以上方法有几点不足，卷积核的学习依赖图拉普拉斯矩阵的特征分解，对于图结构有一定的要求，在固定结构上学习的模型，无法迁移到其他结构的模型上。

（2）基于非谱方法(Non-spectral Methods):

在图上直接定义卷积计算，将不同size的邻居节点考虑在内，同时保持像CNN一样的局部卷积不变性。

DCNNs：基于扩散卷积的思想的网络；
GraphSAGE：采样固定size的邻居节点，同时通过mean,LSTM, pooling等方式聚合周围节点的信息。

640?wx_fmt=png

2、门控图神经网络（GGNN）

相关论文：<ICLR-16> Li Y, Tarlow D, Brockschmidt M,et al. Gated graph sequence neural networks.

提高图结构信息的long-term传播能力
将图中的edge信息考虑在内

将图矩阵作如下表示，不同类型的边采用不同类型的传播矩阵，同时，用 A^(out)和 A^(in) 分别表示节点的入度信息和出度信息。

640?wx_fmt=png

计算图传播信息：

（1）Propagation module

initialization step

pass information：矩阵A中包含了当前节点与其他节点的交互信息

节点的state embedding h_{v^(t-1)}，与其他节点的交互信息a_{v^(t)}通过GRU单元进行融合：

update gate

reset gate

activate

640?wx_fmt=png

（2）Output module

node-level

graph-level

其中，i,j表示两个全连接神经网络。

3、注意力图神经网络（GAT）

相关论文：<ICLR-18> Velickovic, Petar, et al. Graphattention networks.

为节点的不同的邻居节点指定不同权重
节点-邻居节点对的计算可并行化，相比于GCN等网络，速度较快

节点权重的计算：

640?wx_fmt=png

节点信息的更新：

640?wx_fmt=png

由“Attentionis all you need”一文中提出的head attention，GAT网络中也使用了headattention：

640?wx_fmt=png

三、图神经网络应用

640?wx_fmt=png

1、Structural Scenarios

主要应用于其数据结构为图结构的场景，如蛋白质分子结构图、KnowledgeGraph等。

以KnowledgeGraph中应用GNN为例：

相关论文：<IJCAI-17> Hamaguchi T, et al. Knowledgetransfer for out-of-knowledge-base entities: a graph neural network approach.

论文主要针对KG中的out-of-knowledge-base(OOKB)实体，进行知识库补全等任务。

a、OOKB实体定义：

在训练过程中未被训练到的实体，无法得到其embedding表示，从而无法预测其与知识库中其他实体之间的关系。如下图中在测试期间新出现的实体“Blade-Runner”，或者说新出现的三元组“(Blade-Runner,based-on, Do-Androids-Dream-of-Electric-Sheep?)”（图中红线所示部分）。

640?wx_fmt=png