ICLR 2024 杰出论文开奖了!录用率31%,两篇国内论文获荣誉提名

朋友们,ICLR 2024开奖了!5月7日至11日,今年的大会在奥地利维也纳展览会议中心举行。

ICLR(国际表征学习大会)是公认的深度学习领域国际顶级会议之一属于CCF A类,主要专注于深度学习和强化学习等相关技术的研究与发展。

据统计,本届ICLR 2024共收到了7262篇论文,整体接收率约为31%,与去年(31.8%)基本持平。其中Spotlight论文比例为5%,Oral论文比例为1.2%。

但无论是参会人数还是论文提交量,相比往年都有极大提升!

近日,大会公布了 5 篇杰出论文奖和 11 篇荣誉提名奖,以及2篇时间检验奖。非常值得一提的是,其中有两篇国内论文获荣誉提名,分别来自北京大学和香港城市大学。

我这次帮大家整理了这些ICLR 2024所有的获奖论文,其中杰出论文可参考的创新点做了简单提炼。另外,为帮助想发论文的同学获取灵感,我也整理了25篇热门的ICLR高分录用论文,原文以及开源代码一并附上。

全部获奖+高分论文+开源代码需要的同学看文末

5篇杰出论文

Generalization in diffusion models arises from geometry-adaptive harmonic representations

方法:论文研究了深度神经网络在图像去噪中的归纳偏差,发现网络倾向于学习适应图像几何结构的谐波基,这种偏差使网络在大数据集上能够达到较优的去噪性能,并生成高质量的样本。

创新点:

  • 提出了一种弱优化的方法,通过在噪声水平下降时对噪声抑制误差的渐近衰减进行匹配上下界的方式来找到基础(e k (y))1≤k≤d,以捕捉Figure1中PSNR曲线的渐近斜率。这种方法在噪声抑制中具有较好的性能。

  • 提出了一种最佳自适应基础的方法,通过对噪声图像y进行自适应的基础(e k (y))1≤k≤d的选择,可以获得对未知清晰图像x的更稀疏的表示,从而获得更好的噪声抑制性能。

Learning Interactive Real-World Simulators

方法:论文介绍了一种建立通用模拟器(UniSim)的方法,该模拟器能够通过生成模型模拟真实世界的互动。通过精心组织不同的数据集,展示了UniSim如何将不同维度的信息整合在一起,从而模拟具有高水平指令和低水平控制的可视结果。

创新点:

  • 综合不同维度的数据集,通过统一的生成模型建立了一个行为-视频的生成模型,实现了真实世界交互的通用模拟器(UniSim)。

  • 将行为-视频生成模型转化为条件观测预测模型,并通过自回归的方式实现了一致且长时程的视频生成。

  • 展示了模拟器在高层语言策略、低层控制策略和视频字幕模型的训练中的应用,并表明这些模型在纯模拟训练后能够在真实环境中进行泛化,从而弥合了模拟与真实之间的鸿沟。

Never Train from Scratch: Fair Comparison of Long-Sequence Models Requires Data-Driven Priors

方法:研究旨在探讨在长序列建模任务中,预训练对模型性能的影响,并研究了不同架构在预训练条件下的性能差异。相较于从零开始训练,预训练可以显著提高模型性能,并且使得简化的模型可以达到复杂架构的性能水平。

此外,研究还发现预训练的效果在数据规模较小时更为显著,同时展示了预训练对于不同数据模态的适用性。最后,研究还分析了通过预训练获得的先验与手动设计先验之间的关系,并提出了一种基于预训练的新的性能评估方法。

创新点:

  • 通过标准去噪目标从任务数据中简单学习捕捉远程依赖关系的先验。作者发现,无需对模型进行干扰性改变,仅通过标准去噪目标就可以从任务数据中学习到捕捉远程依赖关系的有益先验。这一创新使得在数据相对稀缺的情况下,SPT的好处更加明显。

  • 针对SSMs,通过分析通过SPT学习到的卷积核,揭示了捕捉长程依赖关系的学习先验。作者发现,根据模态的不同,快速衰减的卷积核可以比原始S4模型中使用的缓慢衰减的卷积核带来更好的性能,进一步凸显了从数据本身学习先验的效用。

Protein Discovery with Discrete Walk-Jump Sampling

方法:作者开发一种用于离散数据的新型分离能量和评分建模方法,以改善训练和采样离散序列的困难。研究通过降低训练数据的能量(正样本)和增加从模型中采样的数据的能量(负样本)的期望值来达到这一目的。通过使用单步去噪回到离散值,该方法简化了离散数据的评分模型训练过程。

创新点:

  • 提出了在NEB形式中将离散数据视为在欧几里得空间中取连续值,并选择较大的噪声水平来平滑原始分布,使得采样更容易。此外,他们还使用单步去噪回到离散值。

  • 提出了一种解耦能量和分数模型的新方法,用于训练和采样离散序列。他们还设计了一种名为“分布符合得分”(Distributional Conformity Score)的度量指标,用于评估蛋白质样本的质量。

Vision Transformers Need Registers

方法:为解决现代视觉转换器中注意力图中的异常现象,作者提出了通过添加寄存器令牌来修复这一问题的简单而有效的解决方案,该解决方案不仅改善了模型性能和可解释性,而且在密集视觉预测任务中创造了自监督视觉模型的新纪录,还为使用更大模型的对象发现方法提供了可能性。

创新点:

  • 提出了一种简单而有效的解决方案,通过向Vision Transformer的输入序列中添加额外的tokens来解决特征图中的异常问题。

  • 研究者发现这些异常tokens通常出现在特征图的边缘区域,而不是中心区域。研究者认为这是因为基础模型倾向于在低信息区域中重用tokens作为寄存器,而这些区域通常对应于背景,其包含的信息较少。

  • 通过在token序列中添加额外的寄存器tokens,这些异常tokens完全消失。这种修正技术提高了模型在密集预测任务中的性能,并且生成的特征图显著更平滑。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“ICLR获奖”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/8428.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

hexo 博客插入本地图片时遇到的坑

哈喽大家好,我是咸鱼。 最近一直在折腾博客的事,说是 hexo 极易上手,我觉得只仅限于在安装部署的时候,随着对 hexo 的深入使用,发现遇到的问题还是挺多的。 那今天来讲一下我在把本地图片插入到 hexo 博客文章中遇到…

树莓派4b红外检测

1.红外检测连接图 2.红外检测工作原理 红外传感器的工作原理类似于物体检测传感器。该传感器包括一个红外LED和一个红外光电二极管,因此通过将这两者结合起来,可以形成一个光耦合器。 红外LED是一种发射红外辐射的发射器。该LED看起来与标准LED相似&a…

Games101-动画与模拟(求解常微分方程,刚体与流体)

Single Particle Simulation 规定了任何一个物体任何时刻的速度,知道它的初始位置,求它某个时间后的位置? 如果一个物体是匀速直线运动,用初始位置加上速度和时间的乘积即可 如上图,如果想描述一个粒子在一个速度场&am…

【平台开发】MTK6833——cache操作记录

CPU Cache 用的是一种叫 SRAM(Static Random-Access Memory,静态随机存储器) 的芯片。 通常分为L1,L2,L3三层缓存。 CPU 并不会直接和每一种存储器设备直接打交道,而是每一种存储器设备只和它相邻的存储器…

Linux---HTTP协议

HTTP HTTP协议(Hypertext Transfer Protocol,超文本传输协议)是一种应用层协议,主要用于在Web浏览器和Web服务器之间传输数据。 一、认识URL 平时我们俗称的 " 网址 " 其实就是说的 URL http请求样例 看起来是一行一…

ubuntu20文件安装和卸载cuda11.6

搜索cuda 11.6 nvidia,进入官网https://developer.nvidia.com/cuda-11-6-0-download-archive 选择linux --> runfile 用安装包安装 wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local_installers/cuda_11.6.0_510.39.01_linux.run sudo s…

uniapp 小程序图片懒加载组件 ImageLazyLoad

预览图 组件【ImageLazyLoad】代码 <template><viewclass"image-lazy-load":style"{opacity: opacity,borderRadius: borderRadius rpx,background: background,transition: opacity ${time / 1000}s ease-in-out,}":class"image-lazy-loa…

第二代增强-采购订单抬头子屏幕增强

文章目录 第二代增强-采购订单抬头子屏幕增强需求查找增强点创建项目增强子屏幕定义全局变量编写出口函数代码激活增强运行结果查看创建的采购订单底表数据 第二代增强-采购订单抬头子屏幕增强 需求 查找增强点 创建项目 增强子屏幕 定义全局变量 *&---------------------…

读书笔记——《高质量C++/C编程指南》(2)

目录 前言 命名规则 共性规则 简单的Windows应用程序命名规则 表达式和基本语句 运算符优先级 复合表达式 if语句 布尔变量与零值比较 整型变量与零值比较 浮点变量与零值比较 指针变量与零值比较 对if 语句的补充说明 循环语句的效率 for 语句的循环控制变量 s…

自动驾驶中常见坐标系极其转换

各个传感器坐标系 相机坐标系统 摄像头的作用是把三维世界中的形状、颜色信息,压缩到一张二维图像上。基于摄像头的感知算法则是从二维图像中提取并还原三维世界中的元素和信息,如车道线,车辆、行人等,并计算他们与自己的相对位置。 感知算法和相机相关的坐标系有图像坐…

Pandas进阶

文章目录 第1关&#xff1a;Pandas 分组聚合第2关&#xff1a;Pandas 创建透视表和交叉表 第1关&#xff1a;Pandas 分组聚合 编程要求 使用 Pandas 中的 read_csv() 函数读取 step1/drinks.csv 中的数据&#xff0c;数据的列名如下表所示&#xff0c;请根据 continent 分组并…

MySQL-ELK基础

1&#xff1a;什么是 ELK ELK是由一家elastic公司开发的三个开源项目的首字母缩写&#xff0c;这三个项目分别是&#xff1a;Elasticsearch、Logstash 和 Kibana。三个项目各有不同的功能&#xff0c;之后又增加了许多新项目, 于是 从5.X版本后改名为Elastic Stack Elastic S…

【JavaScript】内置对象 - Date 日期对象 ④ ( 制作倒计时页面 )

文章目录 一、倒计时页面实现1、需求分析2、计算秒数3、计算倒计时时间的 天 / 时 / 分 / 秒4、页面中显示倒计时时间 二、完整代码示例1、完整代码2、执行结果 Date 日期对象参考文档 : https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/Da…

速卖通商品评论API(aliexpress.item_review)返回值全解析

在电商领域&#xff0c;用户评论对于产品的推广和销售具有极其重要的影响。速卖通&#xff08;AliExpress&#xff09;作为全球知名的跨境电商平台&#xff0c;提供了丰富的API接口供开发者使用&#xff0c;其中aliexpress.item_review API允许开发者获取商品的评论信息。本文将…

品质为王:高效溶解性鱼油胶囊的软胶囊弹性硬度测试解析

品质为王&#xff1a;高效溶解性鱼油胶囊的软胶囊弹性硬度测试解析 在当今的健康产品市场中&#xff0c;高效溶解性鱼油胶囊以其独特的营养价值和吸收效率赢得了众多消费者的青睐。然而&#xff0c;要想在激烈的市场竞争中脱颖而出&#xff0c;产品的品质保证至关重要。其中&a…

深入理解WPF的ResourceDictionary

深入理解WPF的ResourceDictionary 介绍 在WPF中&#xff0c;ResourceDictionary用于集中管理和共享资源&#xff08;如样式、模板、颜色等&#xff09;&#xff0c;从而实现资源的重用和统一管理。本文详细介绍了ResourceDictionary的定义、使用和合并方法。 定义和用法 Res…

鸿蒙内核源码分析(信号消费篇) | 谁让CPU连续四次换栈运行

本篇有相当的难度&#xff0c;涉及用户栈和内核栈的两轮切换&#xff0c;CPU四次换栈&#xff0c;寄存器改值&#xff0c;将围绕下图来说明. 解读 为本篇理解方便&#xff0c;把图做简化标签说明: user:用户空间kernel:内核空间source(…):源函数sighandle(…):信号处理函数&a…

【操作系统】进程与线程概念基础知识

进程与线程概念基础知识 进程进程的概念进程控制块进程状态进程三状态模型挂起进程模模型进程的上下文切换进程控制 线程为什么引入线程线程的概念线程与进程的比较线程的上下文切换线程的实现 进程 进程的概念 1. 进程的定义&#xff1a; 进程是指一个具有一定独立功能的程序…

【面试干货】http请求报文的组成与作用?

【面试干货】http请求报文的组成与作用&#xff1f; 一、http 的请求报文组成二、请求行&#xff08;Request Line&#xff09;三、请求头部&#xff08;Request Headers&#xff09;四、请求体&#xff08;Request Body&#xff09;五、响应头部 &#xff08;Response Headers…

iframe的基本用法

一、背景 在web页面开发中,有时会遇到在一个应用A的页面中引用应用B的页面,此时就需要在应用A中使用iframe嵌入引用B的页面了,比如多租户的web应用,或者门户系统的智能客服助手弹框应用,博主也是在做通用智能客服应用的过程中用到了iframe。网络上有关iframe的信息虽然很…