论文：Generalized Category Discovery with Clustering Assignment Consistency

论文下载：

https://arxiv.org/pdf/2310.19210

一、基本原理

该方法包括两个阶段:半监督表示学习和社区检测。在半监督表示学习中，使用了监督对比损失来充分地推导标记信息。此外，由于对比学习方法与协同训练假设一致，研究引入了同一样本的弱增强和强增强以提取两种不同的视图。最后，该研究还部署了协同训练框架，以加强两个视图之间特征原型相似性和聚类分配的一致性。在社区检测中，研究利用在半监督表示学习中学习到的特征嵌入来构造主图，然后应用社区检测方法来获得结果。

二、拟解决的关键问题

为了克服使用新类别发现（NCD）、半监督学习k-means的限制，该研究提出了一种用于聚类分配的协同训练一致性策略，以发现未标记数据集中的潜在表示。对于最终的聚类目标，研究利用社区检测技术为未标记的实例分配标签，并根据学习到的表示自动确定聚类类别的最佳数量。

三、相关解决方案

对通用数据集的评估结果如图1所示。该方法在所有通用数据集(特别是在ImageNet100上)上的All和Novel测试中达到了最先进的性能，也与已知的其他方法取得了相当的结果。具体来说，对于所有类，该方法在CIFAR-10、CIFAR-100和ImageNet-100上分别比GCD方法高0.8%、5.5%和7.0%。对于Novel类，它在CIFAR-10上高6.2%，在CIFAR-100上高9.1%，在ImageNet-100上高15.5%。这些实验结果表明，该方法在未标记的数据集上学习到更紧凑的表示。此外，UNO+使用线性分类器，它在已知类上显示出很强的准确性，但在新颖类上导致性能较差。

图1 通用数据集验结果

图2中报告了三个细粒度数据集的结果。该方法在测试的三个数据集的所有类上显示出最佳性能，并且在已知类和新颖类上取得了可比的结果，证明了方法在细粒度类别发现方面的有效性。具体来说，在CUB-200、Stanford-Scars和herbarum19数据集上，方法在所有类别上分别比最先进的方法提高了6.7%、8.6%和0.9%。对于Novel类，方法在Stanford-cars和herbararium19上分别比GCD高3.9%和3.7%。同时，研究发现，由于细粒度数据集之间的低可变性，使得发现新颖类更加困难，因此在结果方面，新颖类的精度通常较低。