CVPR 2024最佳论文分享:打破刚性的超分辨率图像处理GNN

CVPR 2024最佳论文分享:打破刚性的超分辨率图像处理GNN

CVPR(Conference on Computer Vision and Pattern Recognition)是计算机视觉领域最有影响力的会议之一,主要方向包括图像和视频处理、目标检测与识别、三维视觉等。近期,CVPR 2024 公布了最佳论文。共有10篇论文获奖,其中2篇最佳论文,2篇最佳学生论文,2篇最佳论文题目和4篇最佳学生论文提名。本公众号推出CVPR 2024最佳论文专栏,分享这10篇最佳论文。

本文详细介绍了CVPR 2024最佳论文《Image Processing GNN: Breaking Rigidity in Super-Resolution》。该论文的第一作者为北京大学博士田雨川。论文针对超分辨率图像重建中的刚性问题,提出了一个新的图神经网络模型IPG,通过灵活的图结构提升超分辨率性能。本文由李杨撰写,审校为朱旺和陆新颖。

1.研究背景与解决的关键问题

超分辨率(Super-Resolution, SR)是指从低分辨率图像重建高分辨率图像。在现有的SR方法中,卷积神经网络(Convolutional Neural Network,CNN)和基于自注意力机制的Transformer模型是主要的两大类方法。然而,这些方法在操作上存在刚性问题:每个像素聚集相同数量的邻近像素信息,导致在细节丰富的图像部分上重建效果不佳。论文提出了一种基于图的超分辨率方法(Image Processing GNN,IPG),通过灵活的图结构(Graph Structure)打破传统方法的刚性限制,提升超分辨率性能。

2.方法

(1)模型架构

图1 IPG模型的总体架构

其中, 多尺度聚合块(Multiscale Graph-aggregation Blocks,MGB):负责从局部和全局尺度聚合信息。图聚合层(Graph Aggregation Layers,GAL):执行图聚合操作,聚合局部和全局信息。图构建:在每个MGB块中,分别执行局部和全局采样,构建图结构,交替分配给GAL层进行聚合操作。

(2)优势
1)度灵活性

在传统方法中,每个像素聚集相同数量的邻域像素信息,这种“度等效刚性”在SR任务中显得不合理。论文提出了一种度灵活性的图解决方案,基于细节丰富的图像部分,设计了一种度变异图结构。具体来说,通过设计一个细节感知指标(Detail-rich Indicator Metric,DF),对图像节点的重要性进行度量,并将更高的度分配给细节丰富的节点。

2)像素节点灵活性

在图像图结构中,论文采用像素而非图像块作为图节点,以避免由于图块刚性导致的对齐问题。相比之下,像素节点能够更灵活地找到其相关像素进行聚合,从而避免像素对齐问题。

3)空间灵活性

论文提出了一种结合局部和全局采样的像素节点连接搜索策略,以聚合局部和全局信息。局部采样在节点周围的邻域中选择,构建局部图;全局采样在整个图像上以扩展模式选择,构建全局图。通过这种方式,图能够灵活地聚合局部和全局信息,从而提升SR性能。

4)图聚合

在图聚合过程中,论文采用边缘条件聚合(Edge-conditioned Aggregation),这种方法在保持邻域信息的同时,关注像素之间的关系,适用于低级视觉任务。通过在节点特征中加入相对位置编码,增强位置信息,进一步提升图聚合的效果。

3.实验结果

图2 IPG-S和IPG与SR基线在FLOPs和性能方面的比较

所提出的 IPG-S 和 IPG 与 SR 基线在浮点运算次数(Floating Point Operations per Second,FLOPs)和性能方面的比较。由于图结构的灵活性,IPG 在类似的 FLOPs下可以比其他 SR 模型高出0.1dB。值得注意的是,FLOPs仅反映理论计算成本,而不反映实际推理速度。

表1 IPG与其他SR方法在多个基准数据集上的比较

表1展示了IPG与其他SR方法在多个基准数据集上的详细比较。结果显示,IPG在峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和结构相似性(Structural Similarity,SSIM)指标上均取得了显著的提升。

4.可视化

图3与最新 SR 基线的视觉比较

图3展示了在Urban100数据集上的可视化结果对比。可以看到,IPG模型在细节重建方面表现优异,重建出的图像细节更加清晰,伪影更少。

5. 结论

论文提出了一种基于图的超分辨率方法IPG,通过灵活的图结构打破传统方法的刚性限制,提升超分辨率性能。实验结果表明,IPG在多个基准数据集上的表现优于现有的SR模型。论文设计了度灵活图、像素节点和空间灵活性策略,使得IPG能够充分利用图的灵活性,在超分辨率任务中取得了显著的提升。

图片

扫码关注我们

微信号:人工智能怎么学

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/40445.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分布式数据库HBase:从零开始了解列式存储

在接触过大量的传统关系型数据库后你可能会有一些新的问题: 无法整理成表格的海量数据该如何储存? 在数据非常稀疏的情况下也必须将数据存储成关系型数据库吗? 除了关系型数据库我们是否还有别的选择以应对Web2.0时代的海量数据? 如果你也曾经想到过这些问题, 那么HBase将是…

C++: 左值引用和右值引用

目录 概念: 理解: 左值引用,右值引用 左值引用能否给右值取别名? 右值引用能否给左值取别名? 引用的意义是什么? 左值和右值对自定义类型有什么区别吗? move的妙用! 没有优化…

“proxy_pass“ directive is duplicate

后面发现是nginx.conf里面proxy pass这里有两个,注释其中一个并重新运行即可!

基于主流SpringBoot进行JavaWeb开发的学习路线

目录 一、学习路线 (1)第一部分(Web前端开发的技术栈) (2)第二部分(Web后端开发) 二、学习之后必备的技能 三、学习Web开发的基础与未来的收获 学完这一类知识目标:…

Mybatis-01 原理

一. JDBC式编程 在 jdbc 编程中,我们最常用的是 PreparedStatement 式的编程,我们看下面这个例子; Connection conn null; PreparedStatement ps null; ResultSet rs null;try {// 1. 注册驱动Class.forName("com.mysql.jdbc.Drive…

化身成羊:关于羊的词群探析

在西方的神话故事中,像主神宙斯,或者基督教义中的上帝,通常都有化身成羊的形象。 那为什么会这样呢? 一、什么是神话(myth)? 神话,正式的用词是 mythology: mythology n.神话;神话…

Echarts中的折线图,多个Y轴集中在左侧(在Vue中使用多个Y轴的折线图)

简述:在 ECharts 中,创建一个带有多个 Y 轴的折线图,并且将这些 Y 轴都集中显示在图表的左侧,可以通过合理配置 yAxis 和 series 的属性来实现。简单记录 一. 函数代码 drawCarNumEcs() {// 初始化echarts图表,并绑定到id为"…

网络安全设备——探针

网络安全设备探针是一种专门用于网络安全领域的工具,它通过对网络流量进行监控和分析,帮助发现和防止网络攻击。以下是对网络安全设备探针的详细解释: 定义与功能 定义:网络安全设备探针是一种设备或软件,它通过捕获…

【docker】运行阶段遇到的问题

目录 1、查询docker 下挂载了哪些工具 2、docker中的简单命令 3、实际场景应用(redis) 目前工作中仅用到了redis,所以没有太多经验可以交流,暂时仅将我目前遇到的进行发布。还请见谅。 1、查询docker 下挂载了哪些工具 docker ps -a 或者…

Vue组件如何“传话”?这里有个小秘诀!

​🌈个人主页:前端青山 🔥系列专栏:vue篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来vue篇专栏内容:vue-组件通信 目录 Vue组件通信 (1) props / $emit 1. 父组件向子组件传…

适合职场小白的待办事项管理方法和工具

刚入职场那会儿,我每天都像只无头苍蝇,忙得团团转却效率低下。待办事项像潮水般涌来,会议、报告、客户跟进……每一项都像是悬在头顶的利剑,让我焦虑不堪。我深知,管理好待办事项是职场生存的必修课,但该如…

内衣洗衣机哪个牌子好用?倾力推荐四大热门产品,质量放心

在当今社会,内衣洗衣机已经成为每个家庭必不可少的家电之一。但由于市场上的内衣洗衣机品牌和型号繁多,对于消费者来说,选择一款实用、性价比高的内衣洗衣机是非常重要的。那么,内衣裤洗衣机哪个品牌最好?接下来我将会…

Python | Leetcode Python题解之第206题反转链表

题目: 题解: # Definition for singly-linked list. # class ListNode: # def __init__(self, val0, nextNone): # self.val val # self.next next class Solution:def reverseList(self, head: Optional[ListNode]) -> Optio…

VulnHub靶场之DarkHole_1

1 信息收集 1.1 主机发现 arp-scan -l 主机IP地址为:192.168.1.17 1.2 端口和服务扫描 nmap -sS -sV -A -T5 -p- 192.168.1.17 开放22,80端口 1.3 目录扫描 dirsearch -u 192.168.1.17 2 渗透 2.1 访问端口 2.2 注册账号 暴力破解不现实&#…

Python爬取国家医保平台公开数据

国家医保服务平台数据爬取python爬虫数据爬取医疗公开数据 定点医疗机构查询定点零售药店查询医保机构查询药品分类与代码查询 等等,数据都能爬 接口地址:/ebus/fuwu/api/nthl/api/CommQuery/queryFixedHospital 签名参数:signData {dat…

java版本ERP管理系统源码 Spring Cloud ERP_ERP系统_erp软件_ERP管理系统

在当今数字化时代,企业对高效、稳定且易于扩展的管理系统的需求日益增长。为了满足这一需求,我们精心打造了一款基于Java技术的ERP(Enterprise Resource Planning)管理系统。该系统充分利用了Spring Cloud Alibaba、Spring Boot、…

python-计算矩阵边缘元素之和(赛氪OJ)

[题目描述] 输入一个整数矩阵&#xff0c;计算位于矩阵边缘的元素之和。 所谓矩阵边缘的元素&#xff0c;就是第一行和最后一行的元素以及第一列和最后一列的元素。输入&#xff1a; 输入共 m 1 行。 第一行包含两个整数 m, n (1 < m,n < 100) &#xff0c;分别为矩阵的…

VDS虚拟导播切换台软件

VDS 导播软件是一款功能强大的虚拟导播系统软件&#xff0c;具有全媒体接入、播出内容丰富、调音台、快捷切播与导播键盘、云台控制等特点&#xff0c;同时支持向多个平台直播推流。以下是一些常见的 VDS 导播软件特点&#xff1a; 1. 全媒体接入&#xff1a;支持多种设备和网…

【APK】SDKManager运行后闪退

本地JDK已安装&#xff0c;且配置了环境变量&#xff0c;未安装 android studiio 问题描述&#xff1a;右键以管理员身份运行 SDKManager&#xff0c;终端窗口闪退 问题原因&#xff1a;未找到正确的Java路径 解决办法&#xff1a; 1.修改tools目录下的 android.bat 文件&am…

langchain 入门中篇:数据封装,Memory 封装

数据的处理流程可以看一张图来帮助理解 数据来源可以是网络&#xff0c;可以是邮件&#xff0c;可以是本地文件 经过 Document Loaders 加载&#xff0c;再在 Transform 阶段对文档进行 split, filter, translate, extract metadata 等操作&#xff0c;之后在 Embed 阶段进行向…