CVPR 2024最佳论文分享:打破刚性的超分辨率图像处理GNN

CVPR 2024最佳论文分享:打破刚性的超分辨率图像处理GNN

CVPR(Conference on Computer Vision and Pattern Recognition)是计算机视觉领域最有影响力的会议之一,主要方向包括图像和视频处理、目标检测与识别、三维视觉等。近期,CVPR 2024 公布了最佳论文。共有10篇论文获奖,其中2篇最佳论文,2篇最佳学生论文,2篇最佳论文题目和4篇最佳学生论文提名。本公众号推出CVPR 2024最佳论文专栏,分享这10篇最佳论文。

本文详细介绍了CVPR 2024最佳论文《Image Processing GNN: Breaking Rigidity in Super-Resolution》。该论文的第一作者为北京大学博士田雨川。论文针对超分辨率图像重建中的刚性问题,提出了一个新的图神经网络模型IPG,通过灵活的图结构提升超分辨率性能。本文由李杨撰写,审校为朱旺和陆新颖。

1.研究背景与解决的关键问题

超分辨率(Super-Resolution, SR)是指从低分辨率图像重建高分辨率图像。在现有的SR方法中,卷积神经网络(Convolutional Neural Network,CNN)和基于自注意力机制的Transformer模型是主要的两大类方法。然而,这些方法在操作上存在刚性问题:每个像素聚集相同数量的邻近像素信息,导致在细节丰富的图像部分上重建效果不佳。论文提出了一种基于图的超分辨率方法(Image Processing GNN,IPG),通过灵活的图结构(Graph Structure)打破传统方法的刚性限制,提升超分辨率性能。

2.方法

(1)模型架构

图1 IPG模型的总体架构

其中, 多尺度聚合块(Multiscale Graph-aggregation Blocks,MGB):负责从局部和全局尺度聚合信息。图聚合层(Graph Aggregation Layers,GAL):执行图聚合操作,聚合局部和全局信息。图构建:在每个MGB块中,分别执行局部和全局采样,构建图结构,交替分配给GAL层进行聚合操作。

(2)优势
1)度灵活性

在传统方法中,每个像素聚集相同数量的邻域像素信息,这种“度等效刚性”在SR任务中显得不合理。论文提出了一种度灵活性的图解决方案,基于细节丰富的图像部分,设计了一种度变异图结构。具体来说,通过设计一个细节感知指标(Detail-rich Indicator Metric,DF),对图像节点的重要性进行度量,并将更高的度分配给细节丰富的节点。

2)像素节点灵活性

在图像图结构中,论文采用像素而非图像块作为图节点,以避免由于图块刚性导致的对齐问题。相比之下,像素节点能够更灵活地找到其相关像素进行聚合,从而避免像素对齐问题。

3)空间灵活性

论文提出了一种结合局部和全局采样的像素节点连接搜索策略,以聚合局部和全局信息。局部采样在节点周围的邻域中选择,构建局部图;全局采样在整个图像上以扩展模式选择,构建全局图。通过这种方式,图能够灵活地聚合局部和全局信息,从而提升SR性能。

4)图聚合

在图聚合过程中,论文采用边缘条件聚合(Edge-conditioned Aggregation),这种方法在保持邻域信息的同时,关注像素之间的关系,适用于低级视觉任务。通过在节点特征中加入相对位置编码,增强位置信息,进一步提升图聚合的效果。

3.实验结果

图2 IPG-S和IPG与SR基线在FLOPs和性能方面的比较

所提出的 IPG-S 和 IPG 与 SR 基线在浮点运算次数(Floating Point Operations per Second,FLOPs)和性能方面的比较。由于图结构的灵活性,IPG 在类似的 FLOPs下可以比其他 SR 模型高出0.1dB。值得注意的是,FLOPs仅反映理论计算成本,而不反映实际推理速度。

表1 IPG与其他SR方法在多个基准数据集上的比较

表1展示了IPG与其他SR方法在多个基准数据集上的详细比较。结果显示,IPG在峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和结构相似性(Structural Similarity,SSIM)指标上均取得了显著的提升。

4.可视化

图3与最新 SR 基线的视觉比较

图3展示了在Urban100数据集上的可视化结果对比。可以看到,IPG模型在细节重建方面表现优异,重建出的图像细节更加清晰,伪影更少。

5. 结论

论文提出了一种基于图的超分辨率方法IPG,通过灵活的图结构打破传统方法的刚性限制,提升超分辨率性能。实验结果表明,IPG在多个基准数据集上的表现优于现有的SR模型。论文设计了度灵活图、像素节点和空间灵活性策略,使得IPG能够充分利用图的灵活性,在超分辨率任务中取得了显著的提升。

图片

扫码关注我们

微信号:人工智能怎么学

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/40445.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式数据库HBase:从零开始了解列式存储

在接触过大量的传统关系型数据库后你可能会有一些新的问题: 无法整理成表格的海量数据该如何储存? 在数据非常稀疏的情况下也必须将数据存储成关系型数据库吗? 除了关系型数据库我们是否还有别的选择以应对Web2.0时代的海量数据? 如果你也曾经想到过这些问题, 那么HBase将是…

C++: 左值引用和右值引用

目录 概念: 理解: 左值引用,右值引用 左值引用能否给右值取别名? 右值引用能否给左值取别名? 引用的意义是什么? 左值和右值对自定义类型有什么区别吗? move的妙用! 没有优化…

LLMs之CriticGPT:CriticGPT的简介、安装和使用方法、案例应用之详细攻略

LLMs之CriticGPT:CriticGPT的简介、安装和使用方法、案例应用之详细攻略 目录 CriticGPT的简介 1、简介 2、CriticGPT的方法 2.1、CriticGPT的训练方法 2.2、CriticGPT的批评生成方法 3、局限性 4、后续步骤 CriticGPT的安装和使用方法 CriticGPT的案例应用…

“proxy_pass“ directive is duplicate

后面发现是nginx.conf里面proxy pass这里有两个,注释其中一个并重新运行即可!

AI并不是开发者的敌人,而是帮助他们实现更高效工作的得力助手。

AI是在帮助开发者还是取代他们? 在软件开发领域,生成式人工智能(AIGC)正在改变开发者的工作方式。无论是代码生成、错误检测还是自动化测试,AI工具正在成为开发者的得力助手。然而,这也引发了对开发者职业前…

基于主流SpringBoot进行JavaWeb开发的学习路线

目录 一、学习路线 (1)第一部分(Web前端开发的技术栈) (2)第二部分(Web后端开发) 二、学习之后必备的技能 三、学习Web开发的基础与未来的收获 学完这一类知识目标:…

Mybatis-01 原理

一. JDBC式编程 在 jdbc 编程中,我们最常用的是 PreparedStatement 式的编程,我们看下面这个例子; Connection conn null; PreparedStatement ps null; ResultSet rs null;try {// 1. 注册驱动Class.forName("com.mysql.jdbc.Drive…

Sping源码总览

源码地址:https://github.com/spring-projects/spring-framework 仓库地址:https://gitcode.net/qq_42665745/spring/-/tree/master 文章目录如下: 实现一个简单的Bean容器Bean 的定义、注册、获取Bean有参构造实例化Bean属性注入资源加载器…

C++11使用std::future和std::promise实现线程同步和异步通信

std::future 和 std::promise 是 C11 引入的标准库特性,用于实现线程间的异步通信和同步。它们提供了一种机制,使一个线程能够生成一个值或异常,并让另一个线程获取这个值或异常。 (线程A中设置结果) std::promise 用于设置异步操作的结果(线…

【Jupyter Notebook与Git完美融合】在Notebook中驾驭版本控制的艺术

标题:【Jupyter Notebook与Git完美融合】在Notebook中驾驭版本控制的艺术 Jupyter Notebook是一个流行的开源Web应用程序,允许用户创建和共享包含实时代码、方程、可视化和解释性文本的文档。而Git是一个广泛使用的分布式版本控制系统,用于跟…

关于C#在WPF中如何使用“抽屉”控件

关于C#在WPF中如何使用“抽屉”控件 1.前提准备2.XAML代码3.对应的C#代码4.显示效果1.前提准备 需要引用MaterialDesign控件库,关于如何引用,请参照文章——关于C#如何引用MaterialDesign控件库 2.XAML代码 <Window x:Class="MaterialDesign_Test.MainWindow"…

化身成羊:关于羊的词群探析

在西方的神话故事中&#xff0c;像主神宙斯&#xff0c;或者基督教义中的上帝&#xff0c;通常都有化身成羊的形象。 那为什么会这样呢&#xff1f; 一、什么是神话(myth)&#xff1f; 神话&#xff0c;正式的用词是 mythology&#xff1a; mythology n.神话&#xff1b;神话…

Http接口RestSharp中StatusCode返回0, 但服务器或本地postman获取应答正常(C#)

我的本地和其他服务器用同一段代码都可以访问&#xff1a; 原代码&#xff1a; RestClient client new RestClient(url); client.Timeout -1; RestRequest request new RestRequest(Method.POST); request.AddHeader("Authorization", "Bearer " acc…

Echarts中的折线图,多个Y轴集中在左侧(在Vue中使用多个Y轴的折线图)

简述&#xff1a;在 ECharts 中&#xff0c;创建一个带有多个 Y 轴的折线图&#xff0c;并且将这些 Y 轴都集中显示在图表的左侧&#xff0c;可以通过合理配置 yAxis 和 series 的属性来实现。简单记录 一. 函数代码 drawCarNumEcs() {// 初始化echarts图表,并绑定到id为"…

网络安全设备——探针

网络安全设备探针是一种专门用于网络安全领域的工具&#xff0c;它通过对网络流量进行监控和分析&#xff0c;帮助发现和防止网络攻击。以下是对网络安全设备探针的详细解释&#xff1a; 定义与功能 定义&#xff1a;网络安全设备探针是一种设备或软件&#xff0c;它通过捕获…

【docker】运行阶段遇到的问题

目录 1、查询docker 下挂载了哪些工具 2、docker中的简单命令 3、实际场景应用&#xff08;redis&#xff09; 目前工作中仅用到了redis,所以没有太多经验可以交流&#xff0c;暂时仅将我目前遇到的进行发布。还请见谅。 1、查询docker 下挂载了哪些工具 docker ps -a 或者…

Vue组件如何“传话”?这里有个小秘诀!

​&#x1f308;个人主页&#xff1a;前端青山 &#x1f525;系列专栏&#xff1a;vue篇 &#x1f516;人终将被年少不可得之物困其一生 依旧青山,本期给大家带来vue篇专栏内容:vue-组件通信 目录 Vue组件通信 &#xff08;1&#xff09; props / $emit 1. 父组件向子组件传…

适合职场小白的待办事项管理方法和工具

刚入职场那会儿&#xff0c;我每天都像只无头苍蝇&#xff0c;忙得团团转却效率低下。待办事项像潮水般涌来&#xff0c;会议、报告、客户跟进……每一项都像是悬在头顶的利剑&#xff0c;让我焦虑不堪。我深知&#xff0c;管理好待办事项是职场生存的必修课&#xff0c;但该如…

内衣洗衣机哪个牌子好用?倾力推荐四大热门产品,质量放心

在当今社会&#xff0c;内衣洗衣机已经成为每个家庭必不可少的家电之一。但由于市场上的内衣洗衣机品牌和型号繁多&#xff0c;对于消费者来说&#xff0c;选择一款实用、性价比高的内衣洗衣机是非常重要的。那么&#xff0c;内衣裤洗衣机哪个品牌最好&#xff1f;接下来我将会…

框架为我们做了什么?

1. SpringBoot 1.1 web服务器 Spring Boot 的 web 服务器原理主要基于其嵌入式服务器的概念&#xff0c;这意味着它内嵌了一个 web 服务器&#xff0c;无需部署到外部服务器上。Spring Boot 内嵌了如 Tomcat、Jetty 或 Undertow 等 servlet 容器。 1.2 servlet Servlet&…