基本信息
文章链接:[1906.04881] Multiple instance learning with graph neural networks
将每个包视为一个图,利用GNN学习包的嵌入,以探索包中实例之间有用的结构信息。最终的图表示被送入分类器进行标签预测。
具体方法
输入:包
(1)将包转化为图:使用启发式算法
邻接矩阵的计算如下:
当两个实例的距离比较近,在阈值范围内,则认为它们具有连接的边。
(2)构建一个基于GNN的MIL,输入(A,V),其中A是邻接矩阵,V是节点的特征矩阵,
(3)对整个图进行聚合
采用基于GNN的可微池算法(Ying et al ., 2018)将具有不同节点数的图折叠为向量表示。可微池化由两个操作组成:1)学习图的分配矩阵,该矩阵给出了节点属于cluster的概率。2)在给定学习分配矩阵的情况下,通过软池化将图节点压缩为cluster的数量。cluster的数量是预定义的,对于不同的图是相同的。
实验
1.实验一:五个基准数据集
- 10倍交叉验证
2.实验二:文本分类数据集
使用(Zhou et al ., 2009)作者整理的20个文本分类数据集来验证基于GNN的MIL的性能
3.实验三:视网膜图像分类
第三个实验采用公开的糖尿病视网膜病变筛查数据集“Messidor”(Decenciere et al ', 2014)。 采用双重CV来测量(Kandemir & Hamprecht, 2015)中提出的基于GNN的MIL。