【PYG】节点特征合并和节点特征提取

在图神经网络（Graph Neural Networks, GNN）中，节点特征合并与节点特征提取是两个关键步骤。以下是对这两个步骤的简要解释和常用方法：

节点特征合并

节点特征合并是指在图神经网络中，将节点的自身特征与其邻居节点的特征进行组合，以更新节点的特征表示。常见的特征合并方法包括以下几种：

求和（Sum）：将节点的自身特征与其邻居节点的特征相加。
平均（Mean）：将节点的自身特征与其邻居节点的特征取平均值。
最大值（Max）：取节点自身特征与其邻居节点特征的逐元素最大值。
注意力机制（Attention）：使用注意力机制为每个邻居节点分配不同的权重，然后加权求和邻居节点的特征。

公式表示：
$h_i^{(k+1)} = \text{AGGREGATE} \left( \{h_j^{(k)} : j \in \mathcal{N}(i)\} \cup \{h_i^{(k)}\} \right)$
其中， $h_i^{(k)}$ 表示节点 $i$ 在第 $k$ 层的特征表示， $\mathcal{N}(i)$ 表示节点 $i$ 的邻居节点集合， $\text{AGGREGATE}$ 表示聚合函数，如求和、平均等。

节点特征提取

节点特征提取是指在图神经网络中，通过若干层的特征合并操作，最终得到节点的嵌入表示（embedding），这些表示可以用于节点分类、图分类、链接预测等任务。以下是几种常见的图神经网络模型及其节点特征提取方法：

Graph Convolutional Network (GCN)：通过卷积操作进行特征提取，公式为：
$H^{(k+1)} = \sigma ( \tilde{D}^{-1/2} \tilde{A} \tilde{D}^{-1/2} H^{(k)} W^{(k)} )$
其中， $\tilde{A}$ 是加入自环后的邻接矩阵， $\tilde{D}$ 是 $\tilde{A}$ 的度矩阵， $H^{(k)}$ 是第 $k$ 层的节点特征矩阵， $W^{(k)}$ 是第 $k$ 层的权重矩阵， $\sigma$ 是激活函数。
GraphSAGE：通过采样邻居节点，并对其特征进行聚合：
$h_i^{(k+1)} = \sigma \left( W^{(k)} \cdot \text{AGGREGATE} \left( \{h_i^{(k)}\} \cup \{h_j^{(k)} : j \in \text{sample}(\mathcal{N}(i))\} \right) \right)$
Graph Attention Network (GAT)：通过自注意力机制为每个邻居节点分配不同的权重：
$h_i^{(k+1)} = \sigma \left( \sum_{j \in \mathcal{N}(i) \cup \{i\}} \alpha_{ij} W^{(k)} h_j^{(k)} \right)$
其中， $\alpha_{ij}$ 是节点 $i$ 和节点 $j$ 之间的注意力权重。