一、为什么使用图卷积
传动的深度学习方法,比如卷积网络,效果很好,但是它研究的对象是Euclidean data,这种数据的特征就是有规则的空间结构,比如图片是规则的正方形格子,比如语音是规则的一维序列。这些数据结构能用一维、二维矩阵表示,卷积神经网络处理起来很高效。
但是,现实中有很多数据没有规则的空间结构,称为Non Euclidean data。比如推荐系统抽出的图谱。图谱结构的每个节点连接不一定相同,有的节点有两个连接,有的有三个,是不规则的数据结构。
二、图的特征
- 每个节点都有之间的特征信息
- 图谱中每个节点还具有结构信息
在图数据中,我们要同时考虑到节点的特征信息和结构信息,而用来自动化的学习图的特征信息和结构信息的一种方式就是,图卷积神经网络。
三、什么是图卷积神经网络
图卷积神经网络(Graph Convolutional Network)是一种能对图数据进行深度学习的方法。
图卷积算子:
如何理解图卷积算法?
- 发射(send):每个节点将
自身的特征信息经过变换后发送
给邻居节点。这一步是在对节点的特征信息进行抽取变换。 - 接收(receive):每个节点将
邻居节点的特征信息聚合
起来。这一步是在对节点的局部结构信息进行融合。 - 变换(transform):把前面的信息聚集之后做非线性变换,增加模型的表达能力。
图卷积神经网络具有卷积神经网络的以下性质:
- 局部参数共享,算子适用于每个节点,处处共享。
- 感受域正比于层数,一层包含邻居,二层包含邻居的邻居。层数越多,感受域越广,参与运算的信息越多。
GCN模型同样具备深度学习的三种性质:
- 层级结构(特征一层一层抽取,一层比一层更抽象,更高级)
- 非线性变换 (增加模型的表达能力)
- 端对端训练(不需要再去定义任何规则,只需要给图的节点一个标记,让模型自己学习,融合特征信息和结构信息。)
图在现实世界中的应用
社交网络:
1、推荐用户可能感兴趣的人
2、推荐用户可能感兴趣的帖子或者内容
3、社群发现(通过用户社交关系网络挖掘群体结构)
4、用户画像(地点、兴趣、关系网络)
评分系统:
分析比如哪些用户可能对啤酒感兴趣,哪些用户可能对尿布感兴趣,从而实现商品推荐。
还可以实现评分清洗,建模用户的公平度、商品的良心度、评分的可信度,按照一定的规则迭代更新这三个值,从而分析商品的优劣或者区分恶意用户。例如上图中的用户f,很大可能就是恶意评价用户。
推荐系统:
比如沿着用户-歌曲-曲风-歌曲这个路径是推荐用户喜欢的曲风下的其他歌曲;沿着用户-年代-歌曲-歌手是推荐活跃在用户出生年代的歌手的歌曲(可能是用户小时候听过的歌,俗称回忆杀系列),这些就是可解释的推荐。