从CVPR 2024看域适应、域泛化最新研究进展

域适应和域泛化一直以来都是各大顶会的热门研究方向。

域适应指:当我们在源域上训练的模型需要在目标域应用时,如果两域数据分布差异太大,模型性能就有可能降低。这时可以利用目标域的无标签数据,通过设计特定方法减小域间差异,来提升模型在目标域的性能。

域泛化与域适应不同,域泛化让模型学会泛化到多个新测试域,而不仅仅是适应一个特定的目标域。这种方法的核心在于利用多源域信息增强模型泛化能力。

本文盘点了 CVPR 2024 有关域适应、域泛化的研究成果 32 篇,帮助大家了解并掌握最新的进展。

论文原文以及开源代码需要的同学看文末

域适应

Improving the Generalization of Segmentation Foundation Model under Distribution Shift via Weakly Supervised Adaptation

第一个针对「Segment Anything」大模型的域适应策略

方法:本文研究了Segment-Anything模型在多个图像分割任务中的泛化能力,并提出了一种适应性方法,该方法不需要访问源数据集且内存开销低,能够通过弱监督有效改善模型的适应性,通过对10个数据集的广泛评估,表明了该方法的有效性。

创新点:

  • 引入自我训练的自适应框架:作者提出了一种基于自我训练的自适应框架,通过弱监督来建立伪预测之间的对应关系,实现对下游数据的自适应。这种方法能够在没有源领域数据的情况下适应下游任务,从而避免了高计算开销和潜在的隐私问题。

  • 低内存占用的模型权重更新方法:作者介绍了一种低内存占用的模型权重更新方法,通过对编码器网络进行LoRA微调,实现了最佳性能。这种方法能够在大型基础模型上进行适应或微调,而无需重新训练整个模型,从而节省了计算资源。

LEAD: Learning Decomposition for Source-free Universal Domain Adaptation

方法:本文介绍了源无关通用领域自适应(SF-UniDA)问题,并提出了一种LEArning Decomposition(LEAD)框架来解决该问题。LEAD框架通过特征分解将特征分为源已知和源未知两部分,并根据与目标原型和源锚点的距离建立实例级别的决策边界,以识别目标私有未知数据。

创新点:

  • 提出了一种新的方法来处理源自由通用领域适应(SF-UniDA)问题。通过特征分解的方法,LEAD能够识别目标私有数据,减少了对手工调整阈值或依赖不稳定聚类的依赖。LEAD还可以作为现有方法的补充,进一步提高性能。

  • LEAD提出了一种实例级伪标签策略,通过与目标原型和源锚点的距离来建立决策边界。实例级决策边界策略在OPDA场景中能够显著提高性能,它考虑了不同类别之间的协变量漂移的不一致性和相同类别中样本的变异性。

域泛化

PracticalDG: Perturbation Distillation on Vision-Language Models for Hybrid Domain Generalization

方法:从算法、基准和指标的角度提高领域泛化的实用性,首先开发了一种新颖的扰动蒸馏(PD)算法,将视觉-语言模型的零样本能力转移到轻量级视觉模型,从而避免了传统微调范式下的大量计算成本;作者引入了从得分、类别和实例(SCI)中挖掘视觉-语言模型知识的扰动;此外,还提出了一个混合领域泛化(HDG)基准和一种新颖的度量H2 -CV来全面评估模型的鲁棒性

创新点:

  • 提出了一种名为SCI-PD的方法,通过从得分、类别和实例三个角度对轻量级视觉模型进行扰动,从而将知识从视觉-语言模型转移给轻量级视觉模型,解决了开放集域泛化问题。

  • 提出了一种名为HDG的基准和一种新的度量指标H2-CV,用于全面评估模型的鲁棒性。

Single Domain Generalization for Crowd Counting

方法:本文研究了单域泛化(SDG)在人群计数中的应用。作者提出了MPCount方案,该方案包括基于密度回归的注意力记忆库、内容错误掩码和注意一致性损失等。此外,为了应对标签模糊的挑战,还提出了基于补丁分类的方法。研究还引入了单域泛化的概念,该方法可以在只有一个源域可用的情况下进行训练。

创新点:

  • MPCount引入了一个注意力内存库(AMB),用于处理密度回归问题。与以往的方法不同,它只使用一个注意力内存库,而不是多个子域分别对应不同的类别。这种设计使得MPCount在狭窄的源分布下仍然有效,并能够对密度回归进行建模。

  • MPCount通过将图像划分为网格来实现基于块的分类作为辅助任务,以减轻标签的歧义性。这种方法可以解决标签模糊的问题,提供可靠的众数信息,从而提高模型对领域变化的鲁棒性。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CVPR域”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/36362.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter笔记(一)- 安装和配置Flutter

一、下载Flutter 访问网址:https://docs.flutter.dev/get-started/install?hlzh-cn 根据电脑所使用的操作系统的平台进行选择。笔者电脑的操作系统为Windows,因此选择如图1-1的Windows图片: 图1-1 Flutter网站(一) …

国行版苹果Vision Pro即将发售 高昂定价吓退普通消费者?

2024年2月2日,苹果第一代空间计算设备Vision Pro在美国上市。6月28日,国行版苹果Vision Pro也将正式发售,别为256GB版29999元、512GB版31499元、1TB版32999元。不过从此前Vision Pro预售情况来看,Vision Pro的“杀手锏”在“价格”…

【应届应知应会】Linux常用指令

SueWakeup 个人主页:SueWakeup 系列专栏:学习技术栈 个性签名:保留赤子之心也许是种幸运吧 本文封面由 凯楠📸友情提供 目录 文件与目录管理 目录操作命令: ls [选项] [目录或文件] mkdir 文件操作命令&#xf…

多媒体本地化的五个步骤

多媒体本地化为试图在多个全球目的地建立市场的企业提供了许多好处。 由于多媒体并不局限于一个内容标签,因此您需要注意一些元素。 这个过程通常从翻译开始,但因为我们处理的是视频和音频,所以从一开始就要处理一个附加层。让我们从这里开…

SqlServer 2008远程过程调用失败,错误代码[0x800706be]

1、解决方式: 将SQL 2008 R2升级到SP1或SP2 下载地址:SQL Server 2008 R2 Service Pack 2下载地址

非最大值抑制(NMS)函数

非最大值抑制(NMS)函数 flyfish 非最大值抑制(Non-Maximum Suppression, NMS)是计算机视觉中常用的一种后处理技术,主要用于目标检测任务。其作用是从一组可能存在大量重叠的候选边界框中,筛选出最具代表…

初学51单片机之长短键应用定时炸弹及扩展应用

51单片机RAM区域划分 51单片机的RAM分为两个部分,一块是片内RAM,一块是片外RAM。 data: 片内RAM从 0x00 ~0x7F 寻址范围(0-127) 容量共128B idata: 片外RAM从 0x00~0xFF 寻址范围(0-255) 容量共256B pdata&am…

定位问题6.27 petal数据接口问题

petal接口响应结果 响应结果为空的数据,而我们需要的是正确的响应结果。 排查问题 确认接口是否正确 以下是爬虫的配置文件内容,我查看了PETAL_URL的接口,并询问接口开发人员,得知接口地址并未改变 确认接口请求体是否正确 我使…

记一次对ouija渗透测试c语言逆向学习

概要 初始知识 web应用枚举 二进制逆向 文件枚举 堆栈溢出 学到知识 hash长度攻击 任意文件读取 二进制逆向分析 信息收集 端口扫描 nmap --min-rate 1000 -p- 10.129.30.104 发现22,80,3000端口 网站探测 目录枚举 feroxbuster -u http://10.1…

“数字政协”平台如何提高政协工作效率?正宇软件助力建设!

随着信息技术的飞速发展,数字化已成为推动各行各业转型升级的重要力量。在政协工作中,数字政协平台的建设与运用,正成为提高政协工作效率、促进民主协商的重要手段。本文将从数字政协平台的功能特点、优势分析以及实践应用等方面,…

何用Vue3和Plotly.js打造交互式3D图

本文由ScriptEcho平台提供技术支持 项目地址:传送门 利用 Plotly.js 创建交互式动画图表 应用场景 本代码适用于需要创建交互式动画图表的数据可视化项目。例如,可以用来展示时间序列数据或比较不同函数的行为。 基本功能 该代码使用 Plotly.js 库…

架构师篇-5、架构语言-ArchiMate

内容摘要: TOGAF内容元模型TOGAF架构语言ArchiMate3ArchiMate实践案例分享 TOGAF内容框架【核心内容元模型】 作为一个通用且开放式的标准,TOGAF需要采用一种非常灵活的方式来对其内容元模型进行定义,从而使得不同的企业可以根据自身需要对…

头歌——机器学习——决策树案例

第1关:基于决策树模型的应用案例 任务描述 本关任务:使用决策树算法完成成人收入预测。 相关知识 为了完成本关任务,你需要掌握:1.数据特征处理,2.使用决策树算法完成成人收入预测。 数据处理及特征工程 本次任务…

2024最新特种设备(锅炉作业)题库分享。

1.锅炉蒸发量大小是由(  )决定的。 A.压力的高低 B.受压元件多少 C.受热面积大小 答案:C 2.哪项不是自然循环的故障?( ) A.停滞 B.倒流 C.下降管带汽 D.上升管带汽 答案:D 3.水冷壁被现代大型锅炉广泛采用的是(  )。 A.光管水冷壁 B.膜…

【C++】继承(详解)

前言:今天我们正式的步入C进阶内容的学习了,当然了既然是进阶意味着学习难度的不断提升,各位一起努力呐。 💖 博主CSDN主页:卫卫卫的个人主页 💞 👉 专栏分类:高质量C学习 👈 &#…

RabbitMQ安装部署

简介 RabbitMQ一款知名的开源消息队列系统,为企业提供消息的发布、订阅、点对点传输等消息服务。 RabbitMQ在企业开发中十分常见,课程为大家演示快速搭建RabbitMQ环境。 安装 rabbitmq在yum仓库中的版本比较老,所以我们需要手动构建yum仓库…

# Kafka_深入探秘者(8):kafka 高级应用

Kafka_深入探秘者(8):kafka 高级应用 一、kafka 消费组管理 1、kafka 命令行工具 参考官网: http://kafka.apache.org/22/documentation.html 2、kafka 消费组管理:查看消费组 # 切换到 kafka 安装目录 cd /usr/local/kafka/…

leetCode.91. 解码方法

leetCode.91. 解码方法 题目思路 题解 class Solution { public:int numDecodings(string s) {int n s.size();// dp 中f[0]一般不做使用&#xff0c;只是存一个初值1&#xff0c;表示默认由一种方案s s;vector<int> f( n 1 );f[0] 1;for ( int i 1; i < n;…

【数学】100332. 包含所有 1 的最小矩形面积 II

本文涉及知识点 数学 LeetCode100332. 包含所有 1 的最小矩形面积 II 给你一个二维 二进制 数组 grid。你需要找到 3 个 不重叠、面积 非零 、边在水平方向和竖直方向上的矩形&#xff0c;并且满足 grid 中所有的 1 都在这些矩形的内部。 返回这些矩形面积之和的 最小 可能值…

vant4的组件气泡弹出框van-popover,在列表中遍历后点击一个全部/显示隐藏,解决办法

环境&#xff1a;vue3 vant-ui4 <div v-for"(info, index) in item.infoListVOs" :key"index"><van-popoverv-model:show"showPopover":actions"actions"overlayplacement"bottom-end"select"onSelect(info…