图像复原天花板!IR开创性新作实现最佳视觉质量,修复更智能、更逼真

图像复原(IR)指在已知图像退化的原因和模型的情况下,通过一系列的逆过程来恢复出原始图像的过程。这是一个长期的低级视觉任务,也是图像处理领域的一个重要课题。

随着深度学习技术的发展,图像复原领域不断出现新的网络架构、损失函数、训练策略等创新点,研究者们受此启发,提出了许多突破性成果。

目前,基于神经网络、transformer、生成先验等的图像复原新方法在处理复杂退化情况时表现出色。比如中国科学院大学、上海人工智能实验室提出的SUPIR、刷新多个low-level任务指标的Restormer。

  • SUPIR:一种突破性的图像复原方法,开创性结合文本引导先验和模型规模扩大。通过利用多模态技术和先进的生成先验,在智能和逼真的图像复原方面取得了重大进展。

  • Restormer:MPRNet与MIRNet的作者在图像复原领域的又一力作,极大程度上缓解了计算量与GPU缓存占用问题,刷新了多个图像复原任务的SOTA性能。

为帮助同学们了解这一重要课题的最新研究方向,我整理了12种最新的图像复原创新方案,简单分析了一些可参考的方法和创新点,并附上开源代码方便各位复现。

论文以及开源代码需要的同学看文末

SUPIR

Scaling Up to Excellence:Practicing Model Scaling for Photo-Realistic lmage Restoration In the Wild

方法:SUPIR是一种开创性的图像复原方法,它利用了生成先验和模型扩展的能力。通过使用多模态技术和先进的生成先验,SUPIR在智能和现实的图像复原方面取得了显著的进步。作为SUPIR中的一个关键催化剂,模型扩展极大地增强了其能力,并为图像复原展示了新的潜力。

创新点:

  • 提出了一种基于文本提示的图像修复方法,通过在大规模图像-文本对数据集上进行训练,并利用扩散模型的特征,可以根据人类提示有选择地修复图像。

  • 提出了一种抗降级编码器,可以减少降级对生成模型的影响,进一步防止生成模型将伪影误认为图像内容。

  • 提出的方法在感知质量方面明显优于现有的方法。通过与其他具有相同能力的先进方法进行比较,实验证明了该方法在感知质量上的显著优势。

Restormer

Restormer: Effcient Transformer for High-Resolution Image Restoration

方法:RNAN是一个基于Transformer的模型,用于处理高分辨率图像的恢复任务。它通过引入多头自注意力层和多尺度分层模块来提高计算效率。DeamNet是一个基于CNN的模型,也用于图像恢复任务。这两个模型在多个图像处理任务上进行了实验和分析,包括图像去雨、单图像运动去模糊、焦点去模糊和图像去噪。

创新点:

  • 渐进学习策略:通过在早期时期对小图像块和大批量进行训练,然后在后期时期对逐渐增大的图像块和小批量进行训练,使得Restormer能够从大图像中学习上下文,并在测试时提供质量性能的改进。

  • 高分辨率图像处理的Transformer模型:提出了一种能够处理高分辨率图像的高效Transformer模型,通过对多头自注意力层和多尺度分层模块进行关键设计,减轻了计算瓶颈。该模型能够学习长距离依赖关系,并保持计算效率。

  • 改进的前馈网络:引入了门控机制和局部机制,以及门控深度卷积,增强了前馈网络的性能。这些改进使得Restormer在噪声水平为50时相对于标准前馈网络获得了0.26 dB的PSNR增益。

MiOIR

Towards Effective Multiple-in-One Image Restoration:A Sequential and Prompt Learning Strategy

方法:论文研究了多任务图像恢复(MiO IR)问题,该问题包括了七个常见的图像恢复任务。研究发现MiO IR面临两个关键挑战:多样化目标的优化和适应多个任务。为了解决这些挑战,本文提出了两种简单而有效的策略。第一种策略是顺序学习,通过逐步学习单个IR任务,而不是将它们混合在一起,来优化多样化的目标。第二种策略是提示学习,通过帮助网络理解特定任务并提高泛化能力,来适应不同的IR任务。

创新点:

  • 提出了多任务图像恢复(MiO IR)问题,旨在训练一个单一模型来处理多个IR任务。

  • 引入了顺序学习策略,通过按顺序逐个学习不同的IR任务,而不是将它们混合在一起,以优化多样化的目标。

  • 提出了提示学习策略,通过提供额外的输入或自适应提取动态视觉提示,帮助网络理解特定任务并提高泛化能力,以适应不同的IR任务。

InstructIR

InstructIR: High-Quality Image Restoration Following Human Instructions

方法:作者提出了第一个使用人类编写指令来指导图像恢复模型的方法。给定自然语言提示,该模型可以从它们的退化对应物中恢复高质量的图像,考虑到多种退化类型。该方法在包括图像去噪、去雨、去模糊、去雾和(低光)图像增强等几个恢复任务上取得了最先进的成果。

创新点:

  • 引入了基于人类指令的图像修复模型,该模型可以根据人类指令对图像进行修复,实现了对多种类型和程度的图像退化进行修复的能力。

  • 设计了一个全新的图像模型,该模型具有4级编码器-解码器结构,并在编码器和解码器之间使用了4个中间块来进一步增强特征。此外,解码器使用了加法而不是串联来进行跳跃连接,这是一种新颖的方法。

  • 提出了一种基于文本编码器的训练方法,通过训练一个投影头来适应文本编码器,从而更好地编码图像修复模型所需的信息。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“图像复原”获取论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/704239.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python算法题集_全排列

Python算法题集_全排列 题46:全排列1. 示例说明2. 题目解析- 题意分解- 优化思路- 测量工具 3. 代码展开1) 标准求解【标记数组递归】2) 改进版一【指针递归】3) 改进版二【高效迭代模块】4) 改进版三【高效迭代模块极简代码】 4. 最优算法5. 相关资源 本文为Python…

STM32F103学习笔记(六) RTC实时时钟(应用篇)

目录 1. RTC 实时时钟的应用场景 2. RTC 的配置与初始化 2.1 设置 RTC 时钟源 2.2 初始化 RTC 寄存器 2.3 中断配置 2.4 备份寄存器配置 2.5 校准 RTC 3. 实例演示代码 4. 总结 1. RTC 实时时钟的应用场景 实时时钟(RTC)在嵌入式系统中具有广泛…

用C#开发Excel插件的强大开源工具

推荐一个开源项目,方便我们使用C#为Excel开发插件。 01 项目简介 Excel-DNA是一个.Net开源项目,为开发者提供了一种便利的方法,可以将.Net代码与Excel集成,能够轻松的为Excel创建自定义函数、图表、表单等,一方面不仅…

VS2022调试技巧(一)

什么是bug? 在1945年,美国科学家Grace Hopper在进行计算机编程时,发现一只小虫子钻进了一个真空管,导致计算机无法正常工作。她取出虫子后,计算机恢复了正常,由此,她首次将“Bug”这个词用来描…

【C语言基础】:操作符详解(二)

文章目录 操作符详解一、上期扩展二、单目操作符三、逗号表达式四、下标访问[]、 函数调用()五、结构成员访问操作符六、操作符的属性:优先级、结合性1. 优先级2. 结合性 操作符详解 上期回顾:【C语言基础】:操作符详解(一) 一、上期扩展 …

https://htmlunit.sourceforge.io/

https://htmlunit.sourceforge.io/ 爬虫 HtmlUnit – Welcome to HtmlUnit HtmlUnit 3.11.0 API https://mvnrepository.com/artifact/net.sourceforge.htmlunit/htmlunit/2.70.0 https://s01.oss.sonatype.org/service/local/repositories/releases/content/org/htmlunit…

进程间通信学习笔记(有名管道和无名管道)

进程间通信方式: 无名管道(pipe)有名管道(fifo)信号(signal)共享内存(mmap)套接字(socket) 无名管道: 在内核里面开辟一片内存,进程1和进程2都可以通过这片内存进行通信 无名管道特点: 只能用于具有亲缘关系的进程之间的通信&am…

YOLOv9图像标注和格式转换

一、软件安装 labelimg安装(anaconda) 方法一、 pip install labelImg 方法二、 pip install PyQt5 -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip install pyqt5-tools -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip install lxml -i ht…

系统找不到xinput1_3.dll怎么办?试试这五种解决方法轻松搞定

在计算机系统运行过程中,当我们遭遇“找不到xinput1_3.dll”这一错误提示时,实际上正面临一个软件兼容性、系统组件缺失以及游戏或应用程序无法正常启动的关键问题。深入探究这一现象,我们会发现它可能引发一系列连带问题,例如某些…

linux之前后端项目部署与发布

目录 前言 简介 一、安装Nginx 二、后端部署 2.1多个tomcat负载均衡 2.2 负载均衡 2.3 后端项目部署 三、前端部署 1.解压前端 2.Nginx配置文件修改 3.IP域名映射 4.重启Nginx服务 前言 上篇博主已经讲解过了单机项目的部署linux之JAVA环境配置JDK&Tomcat&a…

车载终端_联发科MTK6762车载平板电脑解决方案

智能车载终端方案搭载了MTK联发科8xARM Cortex-A53(64bit)高速CPU,采用12nm工艺制程,提供更快的数据采集速度和APP响应速度,能够快速满足用户的应用需求。配备3GB RAM32GB ROM的低功耗EMCP一体化存储,性能良好,支持多任…

【LeetCode:2476. 二叉搜索树最近节点查询 + 中序遍历 + 有序表】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

python使用winio控制x86工控机的gpio

视频讲解 https://www.bilibili.com/video/BV1Nu4m1w7iv/?vd_source5ba34935b7845cd15c65ef62c64ba82f pywinio库 https://pypi.org/project/pywinio/ 安装库 pip install pywinio寄存器地址 测试代码 import pywinio winio get_winio() # 设置排针2输出1,0x40是bit6置…

嵌入式中逻辑分析仪基本操作方法

前期准备 1.一块能触摸的屏对应的主板机 2.逻辑分析仪对应的软件工具 3.对应的拓展板 4.确定拓展板的引脚分布情况 第一步:逻辑分析仪j基本操作 1.数据捕捉需要先进行对应软件安装,并按照需求进行配置 2.这里以A20为例:此手机使用显示驱动芯片CST148,触摸屏分辨…

插件废土课:打造属于你的“智能笔记”!

哎呀嘞,亲爱的网页冲浪者们,抓紧浮板,我们要继续在Chrome插件的海浪上翻滚啦!上次我们玩了个小把戏,搞了个显示时间的Hello World插件,这次我们要把游戏玩大,准备打造一个能让你在网页上乱涂乱画…

数学建模【GM(1, 1)灰色预测】

一、GM(1, 1)灰色预测简介 乍一看,这个名字好奇怪,其实是有含义的 G:Grey(灰色)M:Model(模型)(1, 1):只含有一个变量的一阶微分方程模型 提到灰色,就得先说…

大数据开发项目--音乐排行榜

环境:windows10,centos7.9,hadoop3.2、hbase2.5.3和zookeeper3.8完全分布式; 环境搭建具体操作请参考以下文章: CentOS7 Hadoop3.X完全分布式环境搭建 Hadoop3.x完全分布式环境搭建Zookeeper和Hbase 1. 集成MapReduce…

消息中间件之RocketMQ源码分析(十八)

Broker CommitLog索引机制中的构建过程 1.创建ConsumeQueue和IndexFile。 ConsumeQueue和IndexFile两个索引都是由ReputMessageService类创建的 RequestMessageService类图 ReputMessageService服务启动后的执行过程。 doReput()方法用于创建索引的入口,通常通过…

运用工具Postman快速导出python接口测试脚本

Postman的脚本可以导出多种语言的脚本,方便二次维护开发。 Python的requests库,支持python2和python3,用于发送http/https请求 使用unittest进行接口自动化测试 一、环境准备 1、安装python(使用python2或3都可以)…

【数据结构与算法】常用算法 前缀和

🎉🎉欢迎光临🎉🎉 🏅我是苏泽,一位对技术充满热情的探索者和分享者。🚀🚀 🌟特别推荐给大家我的最新专栏《数据结构与算法:初学者入门指南》📘&am…