【论文速看】DL最新进展20241106-图像分类、图像分割、时间序列预测

目录

    • 【图像分类】
    • 【图像分割】
    • 【时间序列预测】

【图像分类】

[2024 解耦数据增强] Decoupled Data Augmentation for Improving Image Classification

机构:腾讯优图

论文链接:https://arxiv.org/pdf/2411.02592v1

代码链接:无

最近在图像混合和生成数据增强方面的进展显示出提高图像分类性能的潜力。然而,这些技术面临平衡语义保真度与多样性的挑战。具体来说,图像混合涉及插值两张图像以创建新的图像,但这种像素级别的插值可能会损害保真度。生成增强使用文本到图像的生成模型来合成或修改图像,通常限制多样性以避免生成可能影响准确性的分布外数据。文中认为,这种保真度-多样性困境部分源于现有方法的整体图像范式。由于图像由类依赖部分(CDP)和类独立部分(CIP)组成,每个部分对图像的保真度有不同的影响,因此统一处理不同部分可能是误导性的。为了解决这个保真度-多样性困境,作者引入了去耦合数据增强(De-DA),它通过将图像分为CDP和CIP并自适应处理来解决这一难题。为了保持保真度,在受控条件下使用生成模型修改真实的CDP,以保持语义一致性。为了增强多样性,将图像的CIP替换为类间变体,从而创建多样的CDP-CIP组合。此外,在训练期间实施在线随机组合策略,以低成本有效生成众多独特的CDP-CIP组合。全面的实证评估验证了所提方法的有效性。

在这里插入图片描述

在这里插入图片描述
实验结果
在这里插入图片描述


【图像分割】

[NeurlPS 2024 解码器设计] 重新思考Transformer的语义分割解码器:压缩是必需的 Rethinking Decoders for Transformer-based Semantic
Segmentation: Compression is All You Need

论文链接:https://arxiv.org/pdf/2411.03033

代码链接:https://github.com/QishuaiWen/DEPICT

基于Transformer的语义分割最先进方法通常采用Transformer解码器,通过交叉注意力从图像嵌入中提取额外的嵌入,通过自注意力细化一种或两种类型的嵌入,并通过点积将图像嵌入投影到额外的嵌入上。尽管取得了显著成功,但这些经验设计仍然缺乏理论依据或解释,从而阻碍了潜在的有原则的改进。本文认为语义分割和压缩之间存在根本的联系,特别是Transformer解码器与主成分分析(PCA)之间的关系。从这个角度出发,作者推导出一个白盒、全注意力的用于引导式语义分割的解码器(DEPICT),其解释如下:1)自注意力操作器精细化图像嵌入,构建一个理想的主子空间,该子空间与视觉一致并保留大部分信息;2)交叉注意力操作器寻求找到精炼后的图像嵌入的低秩近似,这预期是主子空间的一组正交基,对应于预定义的类别;3)点积操作产生紧凑表示作为图像嵌入的分割掩码。在ADE20K数据集上进行的实验发现,DEPICT始终优于其黑盒对手Segmenter,且更轻量级、更鲁棒。

在这里插入图片描述

在这里插入图片描述

实验结果

在这里插入图片描述

在这里插入图片描述


【时间序列预测】

[2024 少量数据的时序预测] A Mamba Foundation Model for Time Series Forecasting

论文链接:https://arxiv.org/pdf/2411.02941

代码链接:无,即将公开

时间序列基础模型在零样本学习中表现出色,使其非常适合预测现实世界应用中快速演变的模式,这些应用中的相关训练数据很少。然而,这些模型大多依赖于Transformer架构,随着输入长度的增加会带来二次复杂度。为了解决这个问题,文中引入了TSMamba,一个基于Mamba架构的线性复杂度时间序列预测基础模型。该模型通过前向和后向Mamba编码器捕捉时间依赖性,实现高预测准确性。为了减少对大数据集的依赖并降低训练成本,TSMamba采用了两阶段的迁移学习过程,利用预训练的Mamba语言模型(LLMs),允许以适中的训练集进行有效的时间序列建模。在第一阶段,通过patch自回归预测优化前向和后向主干;在第二阶段,模型训练一个预测头并细化其他组件以进行长期预测。尽管主干假设通道独立性来管理不同数据集中的通道数量变化,但在特定多变量数据集上的微调期间引入了一个通道压缩注意力模块,以捕捉跨通道依赖性。实验表明,尽管使用的训练数据显著更少,但TSMamba的零样本性能与最先进的时间序列基础模型相当。此外,与任务特定的预测模型相比,它也实现了具有竞争力或更优的全样本性能。

在这里插入图片描述

在这里插入图片描述

实验结果

在这里插入图片描述

在这里插入图片描述


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/59507.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[MRCTF2020]PYWebsite1

如果输入的密钥是对的那么我们就直接跳转到flag.php页面 那么我们直接访问😎,他不带我们去我们自己去. 那就用XFF呗. 知识点: 定义:X-Forwarded-For是一个HTTP请求头字段,用于识别通过HTTP代理或负载均衡方式连接到W…

穿越文化与时空的回响——从廖问洁《红豆诗词选》看当代人文情怀

穿越文化与时空的回响 ——从廖问洁《红豆诗词选》看当代人文情怀 在快节奏的现代生活中,我们时常感到身心的疲惫,渴望找到一种能够洗涤内心的方式。而廖问洁的《红豆诗词选》就如同一股清泉,为我们带来了心灵的洗礼和慰藉。 这位来自94年的…

01 Oracle 数据库存储结构深度解析:从数据文件到性能优化的全链路探究

文章目录 Oracle 数据库存储结构深度解析:从数据文件到性能优化的全链路探究一、Oracle存储结构的物理层次1.1 控制文件(Control File)1.2 联机重做日志文件(Online Redo Log File)1.3 数据文件(Data File&…

练习LabVIEW第四十二题

学习目标: 使用labview编写一个用户确认界面: 我们在程序中赋予5个人的账号密码,账号使用人名,密码随便,并规定相关权限。访问权限要在前面板显示,并且访问成功与否也要有显示。 开始编写: 前…

如何安装QT(linux/windows)

1. linux 1.1 下载安装程序 进入QT官网,点击右上角下载 Qt | Tools for Each Stage of Software Development Lifecycle​www.qt.io/ 然后选择下载linux版本,这里你需要填写一些信息,注册一些即可 填写之后会出现下面这个网页,…

数组和指针的复杂关系

C语言中指针和数组的关系似乎很“纠结”,让人爱恨交织。本文试图帮助读者理清它们之间的复杂关系! 数组名的理解 数组元素在内存中是连续存放的,在C语言中,数组名有特殊的含义,它表示数组首元素的地址。因此&#xf…

前后端分离,Jackson,Long精度丢失

案例:后端接口放回一个Long数据 GetMapping("/testForLong")public Map<String, Object> testForLong() {Map<String, Object> map new HashMap<>();map.put("aaa", 1234567890123456789L);return map;}实际前端接收的数据 前后端数据…

1.3 自然语言处理的应用

自然语言处理&#xff08;NLP&#xff09;在多个领域有广泛应用&#xff0c;如自动文摘、机器翻译、情感分析等。本实战将通过NLTK库&#xff0c;演示文本预处理的关键技术&#xff0c;包括小写转换、去噪、文本规范化、词干提取、词形还原、标记化以及删除停止词。这些技术为构…

深度学习经典模型之LeNet-5

1 LeNet-5 1.1 模型介绍 ​ LeNet-5是由 L e C u n LeCun LeCun 提出的一种用于识别手写数字和机器印刷字符的卷积神经网络&#xff08;Convolutional Neural Network&#xff0c;CNN&#xff09; [ 1 ] ^{[1]} [1]&#xff0c;其命名来源于作者 L e C u n LeCun LeCun的名字…

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01 目录 文章目录 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01目录1. A Perspective for Adapting Generalist AI to Specialized Medical AI Applications and Their Challenges2. Synergi…

D60【python 接口自动化学习】- python基础之数据库

day60 数据库定义 学习日期&#xff1a;20241106 学习目标&#xff1a;MySQL数据库-- 128&#xff1a;数据库定义 学习笔记&#xff1a; 无处不在的数据库 数据库如何存储数据 数据库管理系统&#xff08;数据库软件&#xff09; 数据库和SQL的关系 总结 数据库就是指数据…

mysql error:1449权限问题 及 用户授权

一、权限问题 Got error: 1449: The user specified as a definer (skip-grants userskip-grants host) does not exist when using LOCK TABLES 在迁移数据库时&#xff0c;定义的definer&#xff0c;在两个数据库之间不同步时&#xff0c;要将不存在的definer改成数据库中已…

HTB:Grandpa[WriteUP]

目录 连接至HTB服务器并启动靶机 1.Which version of Microsoft IIS is running on TCP port 80? 2.Which 2017 CVE abuses a Buffer overflow in the ScStoragePathFromUrl function in that specific IIS version, allowing remote attackers to execute arbitrary code?…

AI笔筒操作说明及应用场景

AI笔筒由来&#xff1a; 在快节奏的现代办公环境中&#xff0c;我们一直在寻找既能提升效率、增添便利&#xff0c;又能融入企业文化、展现个人品味的桌面伙伴。为此&#xff0c;我们特推出专为追求卓越、注重细节的您设计的AI笔筒礼品版&#xff0c;它集高科技与实用性于一身…

ssm+vue684基于WEB技术的在线商品交易平台的设计

博主介绍&#xff1a;专注于Java&#xff08;springboot ssm 等开发框架&#xff09; vue .net php phython node.js uniapp 微信小程序 等诸多技术领域和毕业项目实战、企业信息化系统建设&#xff0c;从业十五余年开发设计教学工作 ☆☆☆ 精彩专栏推荐订阅☆☆☆☆☆不…

【青牛科技】GC8549替代LV8549/ONSEMI在摇头机、舞台灯、打印机和白色家电等产品上的应用分析

引言 在现代电子产品中&#xff0c;控制芯片的性能直接影响到设备的功能和用户体验。摇头机、舞台灯、打印机和白色家电等领域对控制精度、功耗和成本等方面的要求日益提高。LV8549/ONSEMI等国际品牌的芯片曾是这些产品的主要选择&#xff0c;但随着国内半导体技术的进步&…

【英特尔IA-32架构软件开发者开发手册第3卷:系统编程指南】2001年版翻译,2-15

文件下载与邀请翻译者 学习英特尔开发手册&#xff0c;最好手里这个手册文件。原版是PDF文件。点击下方链接了解下载方法。 讲解下载英特尔开发手册的文章 翻译英特尔开发手册&#xff0c;会是一件耗时费力的工作。如果有愿意和我一起来做这件事的&#xff0c;那么&#xff…

[SAP ABAP] 面向对象程序设计-类和对象

面向对象开发的特点&#xff1a;封装、继承和多态 什么是类和对象&#xff1f; 类(CLASS)是创建对象的模板&#xff0c;对象(OBJECT)是类的实例 一个类可以创建多个对象 类 > 类型 对象 > 个体 在ABAP语言中&#xff0c;定义一个类&#xff0c;需要包含定义(defin…

模型 泰斯勒定律(复杂性守恒定律)

系列文章 分享 模型&#xff0c;了解更多&#x1f449; 模型_思维模型目录。复杂性守恒&#xff0c;转移而非消除。 1 泰斯勒定律的应用 1.1 电视遥控器的复杂性转移 在过去&#xff0c;电视遥控器设计得非常复杂&#xff0c;拥有许多按钮和功能&#xff0c;这使得用户在使用…

KubeSphere v4 扩展组件使用指南

KubeSphere v4 扩展组件使用指南 日前&#xff0c;KubeSphere v4 发布&#xff0c;相较于之前的版本&#xff0c;新版本在架构上有了较大的变化。其中&#xff0c;有一个新的概念——扩展组件。 本文我们将针对扩展组件做一个详细的说明&#xff0c;让大家对扩展组件能够了解…