python去除图像光照不均匀_CVPR 2020 | 从重建质量到感知质量:用于低光照增强的半监督学习方法...

CVPR 2020 | 从重建质量到感知质量:

用于低光照增强的半监督学习方法

961c8e647c2ec0c766b7893b65df0d18.png

Code: https://github.com/flyywh/CVPR-2020-Semi-Low-Light

1

背景

478ca7cedca63f3b98ac4b0b86cf0c90.gif

本篇为大家介绍我们组被2020年IEEE国际计算机视觉与模式识别会议(CVPR 2020)接收的工作《From Fidelity to Perceptual Quality: A Semi-Supervised Approach for Low-Light Image Enhancement》。该文章主要针对低光照增强任务。现有的高性能低光照增强工作大多数基于全监督或无监督学习方法——前者提供更详细具体的建模信息,但一方面数据往往难以收集导致缺乏多样性,另一方面客观的重建质量与主观的感知质量并不完全重合;后者可以收集更多样的数据提升泛化性能,但代价是噪声消除以及细节重建性能较差。本文通过深度学习来进行低光照图像的半监督学习,提出了一种递归频带表示来连接无监督和全监督框架。本文提取出一系列由粗到精的频带表示,并通过递归的端到端学习进行增强,进行噪声去除和细节修正。在感知质量引导的对抗学习下,深度频带表示进行重构,生成最终的增强结果。大量实验从多角度证明了该网络结构的有效性,展现出超过现有各类方法的优秀表现。

低光照增强任务介绍

在暗光场景下进行拍摄会导致成片的一系列降质,例如低亮度、低对比度以及密集的噪声。利用更尖端的摄影设备或是更专业的摄像技术可以在一定程度上降低暗光带来的降质。然而这些选择也很难解决较弱的信号淹没在相对高强度的系统噪声中这一问题。利用长曝光来减轻噪声是一个常见且有效的选择,然而在动态场景下长曝光会带来运动模糊。在拍摄设备普及,拍摄需求旺盛且拍摄场景多样的当下,如何减轻,甚至去除这种暗光场景带来的图像降质,成为了学术界及工业界亟待解决的问题。

2

算法

478ca7cedca63f3b98ac4b0b86cf0c90.gif

本文首先使用端到端的网络提取出一系列由粗到精的频带表示,并用重建目标进行全监督,保证频带表示的重建质量要求,并通过递归的框架进行增强,进一步进行噪声去除和细节修正。然后通过对抗学习的方法,组合不同粒度的频带表示,重构最终结果,使用对抗学习以及感知损失进行感知质量引导的无监督学习。

网络结构

具体的半监督深度递归频带网络(DRBN)结构如图所示。

8acb3998de90453ae936c5f873778e75.png

图1 深度递归频带网络结构

首先是深度频带学习阶段。将低光照图像输入带有残差连接的深度网络中,提取其中不同粒度的特征作为图像的频带表示。在重建时粒度最粗的表示作为基本层,对粒度相对较细的表示采取残差学习的方式,输出重建结果。在进行第一轮的特征提取后,与图像同分辨率的频带表示和图像同时作为下一轮递归网络的输入,不同粒度的表示都会作为下一轮递归的基础做残差学习。本文采用了4轮递归,最后一轮递归重建出的最细粒度的图像将作为整个深度频带学习阶段的最终结果,与重建目标进行目标函数计算并反传。此阶段的目标函数为三个粒度上的SSIM Loss。

然后是频带重构阶段。将深度频带学习阶段三个粒度上的最终输出插值到标准分辨率后做差,输入网络进行权重学习,将输出的权重与对应的通道相乘后求和,输出最终的重构结果。重构出的图像将计算目标函数。此阶段的目标函数包括判定是否为高质量图像的Discriminator Loss,利用VGG提取特征的Perceptual Loss以及衡量保真度的SSIM Loss,其中Discriminator由工作[1]提供的数据作为训练集。该目标函数作为感知引导,可以将仅关注重建质量的图像进一步进行感知质量的增强。

3

实验

478ca7cedca63f3b98ac4b0b86cf0c90.gif

本文利用LOL[2]数据集进行训练以及测试,在不同的设置下进行了实验以验证网络的性能。这些实验证明DRBN在低光照场景下的应用价值以及网络所采用的模块的有效性。

定量实验

0dc96641d9239cfe9c4ed853e5f2b191.png

图2 客观指标对比实验

定量对比试验与BIMEF, BPDHE, CRM, DHECE, MR. JED, RRM, SRIE, Dong, EFF, CLAHE, LIME, MF, DRD, DeepUPE, SICE和EG进行了对比,指标选择了PSNR,SSIM以及基于伽马矫正结果的SSIM(SSIM-GC)。可以看到在这些指标下,DRBN对LOL-Real数据集有更好的重建质量。

定性实验

866191b06a65cb7e5bc344fca084ab7d.png1bdc4e6af527d048ec7a235e17fedbcf.png

图3 主观结果对比实验

定性对比试验提供了各类低光照增强方法的最终结果。可以看到与其他方法相比,DRBN在噪声处理和细节恢复上有着更佳的性能,且输出的图像有更好的视觉质量。

消融实验

6e7010961f3a7bc78e52db4e311ffd9f.png

图4 感知引导有效性实验

消融实验主要针对本文采用的两阶段框架。图4中从左到右依次是:输入、第一阶段输出、第二阶段输出以及作为参考的正常光照图像。可以看到第二阶段的感知引导能有效地提升图像的主观质量,有更鲜明的色彩和较强的对比度。

4

总结

478ca7cedca63f3b98ac4b0b86cf0c90.gif

该文章设计了一种基于半监督学习的兼顾重建质量以及感知质量的低光照增强方法,利用两阶段的框架实现了图像重建质量和感知质量的增强。作者通过实验证明了整体网络框架的优越性以及感知引导作为网络模块的有效性,为未来相关领域的工作提供了新的思路。

791ea20b79bd23499c65347fbfb44cc4.png

扫码访问代码主页

或点击左下方“阅读原文”进行跳转。

参考文献

[1] N. Murray, L. Marchesotti, and F. Perronnin. Ava: A largescale database for aesthetic visual analysis. In Proc. IEEEInt’l Conf. Computer Vision and Pattern Recognition, pages2408–2415, June 2012. 5

[2] Chen Wei, Wenjing Wang, Wenhan Yang, and Jiaying Liu.Deep retinex decomposition for low-light enhancement. InBritish Machine Vision Conference, Sept 2018. 1, 3, 5, 6

28c32c2a2cc38fae357c94e5215eb824.png

想知道更多有趣项目

欢迎扫码访问小组主页

www.wict.pku.edu.cn/struct/

948fa54ef499ed80632be196d5a674e4.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/340984.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多层陶瓷电容器用处_【科普贴】多层陶瓷电容器的制造工序,你知道吗?

本文将向大家介绍多层陶瓷电容器的结构及制造工序。多层陶瓷电容器的基本结构电容器用于储存电荷,其最基本结构如图1所示,在2块电极板中间夹着介电体。图1. 电容器的基本结构电容器的性能指标也取决于能够储存电荷的多少。多层陶瓷电容器为了能够储存更多…

分段式多级离心泵_离心泵与多级离心泵工作原理

离心泵工作原理:离心泵工作时,液体注满泵壳,叶轮高速旋转,液体在离心力作用下产生高速度,高速液体经过逐渐扩大的泵壳通道,动压头转变为静压头。性能特点:高效节能:泵有高效的水力形…

牛客网数据开发题库_数据库刷题—牛客网(21-30)

21.查找所有员工自入职以来的薪水涨幅情况,给出员工编号emp_no以及其对应的薪水涨幅growth,并按照growth进行升序CREATE TABLE employees ( emp_no int(11) NOT NULL, birth_date date NOT NULL, first_name varchar(14) NOT NULL, last_name varchar(16…

弹性堆栈介绍

当您运行对公司至关重要的软件时,您将无法获得仅用于分析一段时间前发生的事情的日志,让客户端告诉您您的应用程序已损坏,而您甚至不知道发生了什么是真实的问题。 解决该问题的方法之一是使用监视和日志记录。 大多数应用程序都将具有日志记…

access统计没有选课的人数_当代大学生发愁求职就业,更发愁“选课”,自主选课变成了负担...

当代大学生除了求职就业,最发愁的就是“选课”。不得不说,随着科技的发展,各行各业都发生了翻天覆地的变化。而在大学里的选课,也因此有了巨大的改变。过去,大学生上课,其实课程都是被安排好的,…

产线数字化软件源码_品质笔记⑥丨卢宇聪:把握数字化趋势,坚定创新发展道路...

6天5夜,跨越3座城市,深度走访7家企业,对话多位企业家……这是一趟开阔视野之旅。我接触了很多之前极少有机会接触的企业,比如做光缆的法尔胜泓晟集团、做节能装备的双良集团、做密封件的天生密封件有限公司等。我以前经常接触的是…

es 安装kopf_Elasticsearch-kopf导览

es 安装kopf当我需要一个插件来显示Elasticsearch的集群状态时,或者需要深入了解通常为经典插件elasticsearch-head所达到的索引时。 由于有很多建议,而且似乎是非官方的继任者,所以我最近更详细地研究了elasticsearch-kopf 。 我喜欢它。 我…

arm 交叉编译找不到so_搭建交叉编译环境并验证

1. 搭建编译环境并验证1.1 实验目的 掌握嵌入式开发环境、交叉编译器的搭建、安装和配置方法 熟悉Linux应用程序的编译、调试方法,能够验证X86平台和ARM平台的差异1.2 实验内容 交叉编译器环境搭建 编写一个典型的Linux应用程序 使用GDB调试Linux程序(PC平台) 用Mak…

雷达的工作原理示意图_电磁阀的构成和工作原理示意图

电磁阀符号的含义:电磁阀符号由方框、箭头、“T”和字符构成。电磁阀图形符号的含义一般如下:1、用方框表示阀的工作位置,每个方块表示电磁阀的一种工作位置,即“位”。有几个方框就表示有几“位”,如二位三通表示有两…

sqlserver拼接字符串换行_1.3【Python】第三章 字符串

人工智能入门与实战第一季:python基础语法字符串是比较常见的数据类型,在第一章中我们最早接触的数据类型就是字符串:"hello world",字符串可以用单引号’‘或双引号""来表示代码示例:name "…

mot数据集_谈谈ReID与MOT的关系

1.ReID与MOT的联系在MOT任务中,一般常用的特征模型有运动模型和表观模型,其中表观模型以行人重识别(ReID)类算法为主流。Re-ID任务主要解决的是跨摄像头场景下行人的识别与检索,其中存在给定了身份的图片序列query,需要为不同摄像…

jClarity:在Azure上升级到Java

在互联世界公共基础结构的新时代,最大和最重要的两个方面是Java和OpenJDK的诞生和兴起。 因此,许多公司将时间和资源投入到构建最先进的技术上,以确保整个行业在未来几年内在AdoptOpenJDK上拥有丰富的质量,而且免费的OpenJDK二进制…

装饰器模式应用场景_装饰器设计模式的应用

装饰器模式应用场景嗨,您好! 今天,我将展示装饰设计模式的实际应用。 装饰器设计模式是一种广泛使用的设计模式,同时在运行期间处理图形,树木和动态更改。 如果您正在寻找或尝试进行递归,这也是一个不错的…

Auto Lisp 标注子样式_CSS 核心样式

CSS核心样式粗细font-weight作用:设置文字是否加粗显示属性名: font-weight, 属于font属性的一个单-属性属性值有两种方式:单词类型、数字类型单词类型数字类型100-900之间的整百数字数字越大,文字显示越粗其中400等价于normal, 700等价于bold字体风格font-style作用…

均质机工作原理动画_3D动画演示:有刷直流电机的工作原理

点上面蓝色字体直观学机械可长期订阅我们法律顾问:赵建英律师下面这张图是电机的分类,在看完这张图后,大家基本也就知道咱们今天说的有刷电机具体属于哪一类了。下面这个是LearnEngineering制作的动画,讲解的是直流电机的工作原理…

a113 智能音箱芯片方案_高通入局智能音箱,首款四核单芯片方案曝光

不得不说,智能音箱已经成为目前重要的科技品类之一,许多公司包括亚马逊、谷歌、苹果、阿里巴巴、小米等等,都在大举进军智能音箱市场。为了尽可能为更多产品提供核心原件,近日,高通公司推出了一款全新的SOC系列——QCS…

隐藏水滴屏的软件_屏下摄像头,实现这一全面屏终极方案有多难?

为了实现真正全面屏,手机厂商们到底能有多拼?在奔向全面屏的征途里,导航键、听筒、传感器、指纹识别模组等都被成功解决,隐藏在边框或屏幕底。唯独前置摄像头,成为全面屏征途的最后一块终极障碍。这场由iPhone X刘海屏…

java ee api_Java EE并发API教程

java ee api这是一个示例章节,摘自Francesco Marchioni编辑的WildFly上的实用Java EE 7开发 。 本章讨论了新的Java EE并发API(JSR 236) ,它概述了使用一组托管资源在Java EE容器上并行执行任务的标准方法。 为了描述如何在您的应…

二进制_简学:二进制数制的应用

设现有正整数150,二进制形式为10010110,现有如下题目,求其尽可能简单的解法。题目一:判断该正整数是否是2的乘方;解法:由上表可以看出2的乘方的二进制形式只有一个bit为1,因此判断一个正整数A是…

swagger 动态设置版本号_如何快速玩转swagger

Spring Boot 框架是目前非常流行的微服务框架,我们很多情况下使用它来提供 Rest API。而对于 Rest API 来说很重要的一部分内容就是文档,Swagger 为我们提供了一套通过代码和注解自动生成文档的方法,这一点对于保证 API 文档的及时性将有很大…