论文下载:
https://arxiv.org/pdf/2310.19210
一、基本原理
该方法包括两个阶段:半监督表示学习和社区检测。在半监督表示学习中,使用了监督对比损失来充分地推导标记信息。此外,由于对比学习方法与协同训练假设一致,研究引入了同一样本的弱增强和强增强以提取两种不同的视图。最后,该研究还部署了协同训练框架,以加强两个视图之间特征原型相似性和聚类分配的一致性。在社区检测中,研究利用在半监督表示学习中学习到的特征嵌入来构造主图,然后应用社区检测方法来获得结果。
二、拟解决的关键问题
为了克服使用新类别发现(NCD)、半监督学习k-means的限制,该研究提出了一种用于聚类分配的协同训练一致性策略,以发现未标记数据集中的潜在表示。对于最终的聚类目标,研究利用社区检测技术为未标记的实例分配标签,并根据学习到的表示自动确定聚类类别的最佳数量。
三、相关解决方案
对通用数据集的评估结果如图1所示。该方法在所有通用数据集(特别是在ImageNet100上)上的All和Novel测试中达到了最先进的性能,也与已知的其他方法取得了相当的结果。具体来说,对于所有类,该方法在CIFAR-10、CIFAR-100和ImageNet-100上分别比GCD方法高0.8%、5.5%和7.0%。对于Novel类,它在CIFAR-10上高6.2%,在CIFAR-100上高9.1%,在ImageNet-100上高15.5%。这些实验结果表明,该方法在未标记的数据集上学习到更紧凑的表示。此外,UNO+使用线性分类器,它在已知类上显示出很强的准确性,但在新颖类上导致性能较差。
图1 通用数据集验结果
图2中报告了三个细粒度数据集的结果。该方法在测试的三个数据集的所有类上显示出最佳性能,并且在已知类和新颖类上取得了可比的结果,证明了方法在细粒度类别发现方面的有效性。具体来说,在CUB-200、Stanford-Scars和herbarum19数据集上,方法在所有类别上分别比最先进的方法提高了6.7%、8.6%和0.9%。对于Novel类,方法在Stanford-cars和herbararium19上分别比GCD高3.9%和3.7%。同时,研究发现,由于细粒度数据集之间的低可变性,使得发现新颖类更加困难,因此在结果方面,新颖类的精度通常较低。
图2 三个细粒度数据集实验结果
为了更直观地探索不同方法上的聚类特征,本研究在CIFAR-10上使用T-SNE将DINO、GCD和我们的方法提取的特征进一步可视化。如图所示,与DINO和GCD相比,该方法得到了更清晰的群间边界,也得到了更紧凑的簇。
图3 邻域大小消融实验结果
图4 聚类结果
四、总结
本研究引入了一个聚类分配一致性框架,提出了一种GCD的协同训练策略。此外,还提出了一种社区检测方法来解决GCD中的半监督聚类问题。实验结果表明,该方法在通用和细粒度任务中都达到了最先进的性能。
五、思考
通过研究结果可以看出,该研究提出的一种用于聚类分配的协同训练一致性策略在对通用数据集以及三个细粒度数据集上都取得了较好的结果,也得到了更清晰的簇与簇边界,但是在新颖类的发现上性能较差,可以尝试对该方法进行改进。