论文:Generalized Category Discovery with Clustering Assignment Consistency

论文下载:

https://arxiv.org/pdf/2310.19210

一、基本原理

该方法包括两个阶段:半监督表示学习和社区检测。在半监督表示学习中,使用了监督对比损失来充分地推导标记信息。此外,由于对比学习方法与协同训练假设一致,研究引入了同一样本的弱增强和强增强以提取两种不同的视图。最后,该研究还部署了协同训练框架,以加强两个视图之间特征原型相似性和聚类分配的一致性。在社区检测中,研究利用在半监督表示学习中学习到的特征嵌入来构造主图,然后应用社区检测方法来获得结果。

二、拟解决的关键问题

为了克服使用新类别发现(NCD)、半监督学习k-means的限制,该研究提出了一种用于聚类分配的协同训练一致性策略,以发现未标记数据集中的潜在表示。对于最终的聚类目标,研究利用社区检测技术为未标记的实例分配标签,并根据学习到的表示自动确定聚类类别的最佳数量。

三、相关解决方案

对通用数据集的评估结果如图1所示。该方法在所有通用数据集(特别是在ImageNet100上)上的All和Novel测试中达到了最先进的性能,也与已知的其他方法取得了相当的结果。具体来说,对于所有类,该方法在CIFAR-10、CIFAR-100和ImageNet-100上分别比GCD方法高0.8%、5.5%和7.0%。对于Novel类,它在CIFAR-10上高6.2%,在CIFAR-100上高9.1%,在ImageNet-100上高15.5%。这些实验结果表明,该方法在未标记的数据集上学习到更紧凑的表示。此外,UNO+使用线性分类器,它在已知类上显示出很强的准确性,但在新颖类上导致性能较差。

图1 通用数据集验结果

图2中报告了三个细粒度数据集的结果。该方法在测试的三个数据集的所有类上显示出最佳性能,并且在已知类和新颖类上取得了可比的结果,证明了方法在细粒度类别发现方面的有效性。具体来说,在CUB-200、Stanford-Scars和herbarum19数据集上,方法在所有类别上分别比最先进的方法提高了6.7%、8.6%和0.9%。对于Novel类,方法在Stanford-cars和herbararium19上分别比GCD高3.9%和3.7%。同时,研究发现,由于细粒度数据集之间的低可变性,使得发现新颖类更加困难,因此在结果方面,新颖类的精度通常较低。

图2 三个细粒度数据集实验结果

为了更直观地探索不同方法上的聚类特征,本研究在CIFAR-10上使用T-SNE将DINO、GCD和我们的方法提取的特征进一步可视化。如图所示,与DINO和GCD相比,该方法得到了更清晰的群间边界,也得到了更紧凑的簇。

图3 邻域大小消融实验结果

图4 聚类结果

四、总结

本研究引入了一个聚类分配一致性框架,提出了一种GCD的协同训练策略。此外,还提出了一种社区检测方法来解决GCD中的半监督聚类问题。实验结果表明,该方法在通用和细粒度任务中都达到了最先进的性能。

五、思考

通过研究结果可以看出,该研究提出的一种用于聚类分配的协同训练一致性策略在对通用数据集以及三个细粒度数据集上都取得了较好的结果,也得到了更清晰的簇与簇边界,但是在新颖类的发现上性能较差,可以尝试对该方法进行改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/899947.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java高级JVM知识点记录,内存结构,垃圾回收,类文件结构,类加载器

JVM是Java高级部分,深入理解程序的运行及原理,面试中也问的比较多。 JVM是Java程序运行的虚拟机环境,实现了“一次编写,到处运行”。它负责将字节码解释或编译为机器码,管理内存和资源,并提供运行时环境&a…

MySQL 5.7 Online DDL 技术深度解析

14.13.1 在线DDL操作 索引操作主键操作列操作生成列操作外键操作表操作表空间操作分区操作 索引操作 下表概述了对索引操作的在线DDL支持情况。星号表示有附加信息、例外情况或依赖条件。有关详细信息,请参阅语法和使用说明。 操作原地执行重建表允许并发DML仅修…

kafka 报错消息太大解决方案 Broker: Message size too large

kafka-configs.sh --bootstrap-server localhost:9092 \ --alter --entity-type topics \ --entity-name sim_result_zy \ --add-config max.message.bytes10485880 学习营课程

HarmonyOS:ComposeTitleBar 组件自学指南

在日常的鸿蒙应用开发工作中,我们常常会面临构建美观且功能实用的用户界面的挑战。而标题栏作为应用界面的重要组成部分,它不仅承载着展示页面关键信息的重任,还能为用户提供便捷的操作入口。最近在参与的一个项目里,我就深深体会…

前端面试题之CSS中的box属性

前几天在面试中遇到面试官问了一个关于box的属性面试题,平时都是直接AI没有仔细去看过。来说说CSS中的常用box属性: 1. box-sizing box-sizing 属性定义了元素的宽度和高度是否包括内边距(padding)和边框(border&…

前端开发时的内存泄漏问题

目录 🔍 什么是内存泄漏(Memory Leak)?🚨 常见的内存泄漏场景1️⃣ 未清除的定时器(setInterval / setTimeout)2️⃣ 全局变量(变量未正确释放)3️⃣ 事件监听未清除4️⃣…

Java 基础-30-单例设计模式:懒汉式与饿汉式

在软件开发中,单例设计模式(Singleton Design Pattern)是一种常用的设计模式,它确保一个类只有一个实例,并提供一个全局访问点。这种模式通常用于管理共享资源(如数据库连接池、线程池等)或需要…

为 MinIO AIStor 引入模型上下文协议(MCP)服务器

Anthropic 最近宣布的模型上下文协议 (MCP) 将改变我们与技术交互的方式。它允许自然语言通信替换许多任务的复杂命令行语法。不仅如此,语言模型还可以总结传统工具的丰富输出,并以人类可读的形式呈现关键信息。MinIO 是世界领先的…

2023年12月电子学会青少年软件编程四级考级真题—新“跳7”游戏

此题可点下方去处查看,支持在线编程,获取源码: 新“跳7”游戏_scratch_少儿编程题库学习中心-嗨信奥https://www.hixinao.com/tiku/scratch/show-5109.html?_shareid3 程序演示可点击下方查看,支持源码查看:新“跳7…

3D 地图渲染-区域纹理图添加

引入-初始化地图&#xff08;关键代码&#xff09; // 初始化页面引入高德 webapi -- index.html 文件 <script src https://webapi.amap.com/maps?v2.0&key您申请的key值></script>// 添加地图容器 <div idcontainer ></div>// 地图初始化应该…

如何避免内存泄漏,尤其是在React中

在React中避免内存泄漏主要涉及到两个方面&#xff1a;组件的卸载清理和异步操作的正确管理。以下是几个关键的策略和最佳实践&#xff1a; 1. 清理组件中的事件监听器和定时器 当组件卸载时&#xff0c;确保清除所有绑定的事件监听器和定时器&#xff0c;否则它们会持续占用内…

如何学习C++以及C++的宏观认知

学习方法 首先可以给出一个论断&#xff1a;C的语法和各种组件的原理及使用可以说是所有编程语言里面比较难的 那么如何掌握所有东西&#xff0c;比如网络编程&#xff0c;文件读写&#xff0c;STL。 不要对语法记各种笔记&#xff0c;比如vector容器有什么什么方法什么什么…

Minimind 训练一个自己专属语言模型

发现了一个宝藏项目&#xff0c; 宣传是完全从0开始&#xff0c;仅用3块钱成本 2小时&#xff01;即可训练出仅为25.8M的超小语言模型MiniMind&#xff0c;最小版本体积是 GPT-3 的 17000&#xff0c;做到最普通的个人GPU也可快速训练 https://github.com/jingyaogong/minimi…

Spring Boot 与 Spring Integration 整合教程

精心整理了最新的面试资料和简历模板&#xff0c;有需要的可以自行获取 点击前往百度网盘获取 点击前往夸克网盘获取 Spring Boot 与 Spring Integration 整合教程 简介 Spring Integration 是 Spring 生态系统中用于实现企业集成模式&#xff08;Enterprise Integration Pa…

Nginx 核心配置详解与性能优化最佳实践

1.什么是 Nginx&#xff1f; Nginx 是一个高性能的 Web 服务器和反向代理服务器。它轻量、高效&#xff0c;被广泛用于现代 Web 开发中。 2.为什么前端需要了解 Nginx&#xff1f; ★ 了解 本地开发&#xff1a;可以模拟生产环境 部署前端项目&#xff1a;作为静态文件服务器…

LayaAir3.3.0-beta.3重磅更新!Spine4.2、2D物理、UI系统、TileMap等全面升级!

正式版推出前&#xff0c;说明3.3的功能还没开发完。所以&#xff0c;又一大波更新来了~ 下面对重点更新进行说明。 Spine的重要更新 3.3.0-beta.3版本开始&#xff0c;新增了Spine 4.2 的运行时库&#xff0c;Spine动画上可以支持物理特性了。例如&#xff0c;下图右侧女孩在启…

pip安装timm依赖失败

在pycharm终端给虚拟环境安装timm库失败&#xff08; pip install timm&#xff09;&#xff0c;提示你要访问 https://rustup.rs/ 来下载并安装 Rust 和 Cargo 直接不用管&#xff0c;换一条命令 pip install timm0.6.13 成功安装 简单粗暴

BUUCTF-web刷题篇(7)

16.BackupFile 题目提示backupfile&#xff0c;是备份文件的意思&#xff1a; 查看源码没有什么有用信息&#xff0c;也没有登录界面&#xff0c;所以也不会用到蚁剑链接来找备份文件&#xff0c;所以大概率就是通过构造playload来查找备份文件。 注&#xff1a;备份文件常用…

Maven 构建生命周期

Maven 构建生命周期 引言 Maven 是一个强大的项目管理和构建自动化工具,广泛应用于 Java 开发领域。Maven 的核心概念之一是构建生命周期,它定义了从项目创建到构建、测试、打包、部署等一系列操作的流程。本文将详细介绍 Maven 的构建生命周期,帮助读者更好地理解和使用 …

PyTorch 深度学习实战(29):目标检测与 YOLOv12 实战

在上一篇文章中,我们探讨了对比学习与自监督表示学习。本文将深入计算机视觉的核心任务之一——目标检测,重点介绍最新的 YOLOv12 (You Only Look Once v12) 算法。我们将使用 PyTorch 实现 YOLOv12 模型,并在 COCO 数据集上进行训练和评估。 一、YOLOv12 基础 YOLOv12 是 …