二维码提升对比度文献调研(5)--DeepLPF: Deep Local Parametric Filters for Image Enhancement

简介

(1)论文名称:
DeepLPF: Deep Local Parametric Filters for Image Enhancement CVPR 2020
(2)论文链接:
https://arxiv.org/abs/2003.13985
(3)源代码:
https://github.com/sjmoran/deep_local_parametric_filters

主要idea

本篇文章提出一种新颖的方法,它可以采用学习到的三种类型(椭圆滤波器、渐变滤波器以及多项式滤波器)的空间局部滤波器进行图像增强。作者引入一种深度神经网络(Deep Local Parametric Filters, DeepLPF)用于回归这些空间局部滤波器的参数并利用这些滤波器对图像进行增强。DeepLPF提供了一种很自然的形式进行模型正则、可解释性、直觉调整,从而生成具有更好视觉效果的图像。作者在多个数据集(Adobe-5K及变种)上验证了所提方法的优异性能.
在这里插入图片描述
上图给出了所提DeepLPF的网络架构示意图,给定低质输入RGB图像III及其对应的高质图像YYY,可以训练DeepLPF学习变换fθf_{\theta}fθ,此时有Y^=fθ(I)\hat{Y} = f_{\theta}(I)Y^=fθ(I)
作者所设计的模型包含一个用于细粒度图像增强的单流(single-stream)网络,与一个用于局部增强的双流(two-stream)网络。
1.首先,采用标准CNN骨干网络(如ResNet、UNet)估计一个维度为C×H×WC \times H \times WC×H×W的特征图,其中前三个通道表示待调整图像Y^1\hat{Y}_1Y^1,其他C′=C−3C_{'} = C - 3C=C3通道将送入后续的是三个滤波器参数预测模块;
2.然后,采用单流网络用于预测多项式滤波器的参数并用于增强骨干网络的输出Y^1\hat{Y}_1Y^1得到Y^2\hat{Y}_2Y^2
3.其次,增强后的Y^2\hat{Y}_2Y^2将与特征C′C^{'}C进行拼接并送入双流网络学习局部增强滤波器(渐变滤波器、椭圆滤波器)参数,所学习到的两种类型滤波器通过Add方式进行融合并得到尺度图S^\hat{S}S^,该尺度图将与前述增强图像Y^2\hat{Y}_2Y^2通过Multiply融合得到Y^3\hat{Y}_3Y^3
4.最后,通过骨干网络增强的图像Y^1\hat{Y}_1Y^1将与所得到的Y^3\hat{Y}_3Y^3通过Add方式融合得到最终的输出Y^\hat{Y}Y^
本文对用于图像增强的自动参数化滤波器进行探索与研究。受启发与专业图像编辑工具与软件,作者提出采用深度学习方式估计三种类型的滤波器(称之为滤镜可能更合适)参数,并用于指导图像增强。本文所提方法具有更好的可操作空间,同时具有更好的可解释性。该文为图像增强方法的研究打开了一扇窗户,它将有助于更多可落地AI画质算法的落地与产品化。

实验简介

数据集:
作者选用了由两个数据集衍生出的三个数据集。
(1)MIT-Adobe-5K-DPE;
(2)MIT-Adobe-5K_UPE;
(3)See-in-the-dark.

实验结果

输入1:
在这里插入图片描述
输出1:
在这里插入图片描述
输入2:
在这里插入图片描述
输出2:
在这里插入图片描述
输入3:
在这里插入图片描述
输出3:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/507684.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c语言单选题大全,C语言单选题(五)

1.C语言结构体类型变量在程序执行期间(C)。A.部分成员驻留在内存中B.只有一个成员驻留在内存中C.所有成员一直驻留在内存中D.没有成员驻留在内存中2.当定义一个结构体变量时,系统分配给它的内存是(D)。A.结构中最后一个成员所需内存量B.结构中第一个成员所需内存量C…

java 匿名函数_Java 理论与实践,闭包之争

Java 语言是否应增加闭包以及如何添加?在跨越边界 系列最近的一篇文章中,我的朋友兼同事 Bruce Tate 以 Ruby 为例描述了闭包的强大功能。最近在安特卫普召开的 JavaPolis 会议上,听众人数最多的演讲是 Neal Gafter 的 “向 Java 语言增加闭包…

二维码识别中面临的主要问题

问题描述 下面有两个二维码的图片: 这两个二维码其实是一样的,也就是二维码码制在设计的时候,其实不需要那么大的黑点,只需要中心一小部分即可。 问题一:在优化二维码的过程中,能否考虑优化边缘部分&…

lia人是什么意思_69年属鸡人终身灾难是什么意思

69年属鸡人终身灾难是什么意思69年出生的生肖鸡,他们为人正直,有一颗转速飞快的脑袋,做事勤快,对生活非常乐观,但是因为过于自信总是做一些自己能力还不够的事,有句老话说的好“大难不死,必有后…

睡眠声音识别中的准确率问题(一)--问题描述及评价指标

1 问题描述 如何定义一个评价指标来评估睡眠声音识别中的准确率? 1.1 按照评分如何设计评价指标 睡眠声音识别预测的结果是一个概率分布,如下表所示: c1c_1c1​c2c_2c2​c3c_3c3​snortspeechcough0.50.20.70.550.450.77 在这种场景下&…

c51 嵌入汇编语言,在C51中嵌入汇编

在C51编程中,有时控制一些器件时,需要较强实时性,这时有必要在其中嵌入ASM语句,关于嵌入的方法众多,网上也可以找到相关说明,不过说得并不详细,这里结合本人调试18B20测温程序来说说如何在C中嵌…

睡眠声音识别中的准确率问题(二)--测试结果及分析

1 测试数据集介绍 (1)Audioset数据集: 从该数据集中筛选出鼾声数据500条; (2)人工采集的数据集:我们收集了鼾声及咳嗽数据50条,其中鼾声数据40条,咳嗽数据10条&#xff…

睡眠声音识别中的准确率问题(三)--采集的音频测试结果及分析

简介 本次我们对自己采集的93条Snoring音频进行测试并分析。 不区分音频质量的测试。 分别测试了NNN取1-5、8以及10时候的准确率,测试结果如下所示: N2345810Accuracy0.27960.47310.49460.49460.54840.5699 分析:从上表中可以得出…

中文 转gbk编码_go查找中文首字母

前言常见的通讯录都是按首字母来排序的,想象一下你要实现一个首字母排序的功能,若是全英文,那将会是一件很轻松的事情,一般语言层面就会提供排序方法,亦或自己实现也不是难事,那如果存在中文呢?…

语音增强相关技术综述

1 非监督语音增强技术 2 监督语音增强技术 3 github上提供的源代码及分析 3.1 Dual-signal Transformation LSTM Network 简介 https://github.com/breizhn/DTLN 用于实时噪声抑制的堆叠双信号变换 LSTM 网络 (DTLN) 的 Tensorflow 2.x 实现。这个存储库提供了在 python …

睡眠音频分割及识别问题(十二)--基于IOS的YAMNet音频识别(总结)

1 结构体 此部分定义了两个结构体用于存储音频信息: AudioFragment:用于存储单个音频片段(0.975s, 16000Hz)的标签评分信息;AudioInfo:用于存储整个音频信息,包含音频文件名、时间等基础信息&…

js 字符串替换_正则精要:玩转JS正则表达式,也许只需这一篇(建议收藏)

0.导引在正文开始前,先说说正则表达式是什么,为什么要用正则表达式?正则表达式在我个人看来就是一个程序可以识别的规则,有了这个规则,程序就可以帮我们判断某些字符是否符合我们的要求。但是,我们为什么要…

小米平板android最新版本,想要翻身还需努力 小米平板2安卓版评测

1依旧发烧?小米平板2评测如今的平板市场虽不能用日薄西山来形容,但各大厂商费尽心机惨淡经营也无力阻止平板电脑市场的衰落,iPad Air和Mini系列的销量下滑迫使苹果不得不用寄希望于iPad Pro打开一片新天地,而在手机行业风生水起了…

国内计算机类APP相关竞赛总结

中国高校计算机大赛–移动应用创新赛 http://www.appcontest.net/ 中国高校计算机大赛—移动应用创新赛”旨在促进高校计算机课程教学内容和教学方法改革,激发学生创新意识,提升学生利用计算机分析问题、解决问题的能力,特别是移动应用的设计…

flink 写kafka_flink消费kafka的offset与checkpoint

生产环境有个作业,逻辑很简单,读取kafka的数据,然后使用hive catalog,实时写入hbase,hive,redis。使用的flink版本为1.11.1。为了防止写入hive的文件数量过多,我设置了checkpoint为30分钟。env.…

论文阅读:超高分辨率图像中快速、准确的条码检测

摘要 由于目标对象的尺度不同,超高分辨率 (UHR) 图像中的对象检测长期以来一直是计算机视觉中的一个具有挑战性的问题。在条码检测方面,将 UHR 输入图像调整为更小的尺寸通常会导致相关信息的丢失,而直接处理它们的效率很高且计算成本很高。…

android 多线程 场景,精选Android初中级面试题 (三): 深探Handler,多线程,Bitmap

码个蛋(codeegg) 第 930 次推文作者:Focusing链接:https://juejin.im/post/5c85cead5188257c6703af47Handler1、谈谈消息机制Handler作用 ?有哪些要素 ?流程是怎样的 ?参考回答:负责跨线程通信,…

通过超分辨率重构来提高二维码的对比度

1 问题描述 (1)图像分辨率小。例如一些嵌入在海报(如图1)或远距离拍摄的码,其分辨率远小于通常情况下的码图像。 图1.海报中的二维码占比很小 (2)图像质量较低。有很多是经过了多次的压缩和转…

android web 访问数据库,Web下的JDBC访问数据库的基本步骤

Web下的JDBC访问数据库的基本步骤(2012-06-02 12:09:33)在Java程序中连接数据库的一般步骤分为一下几部分,我摘录出来,跟大家分享。(1)将数据库的JABC驱动加载到classpath中,在基于JavaEE的Web应用开发过程中,通常把JDBC驱动放在W…

linux 磁盘扩容_记录一次ESXi Linux在线扩容,不重启系统

因为工作需要,需要将运行在ESXi主机上面的一台Centos 里面的一个LV卷进行扩容,下面记录了此次扩展的详细过程,整个过程,不需要重启服务器。1. 首先通过df-h 查看当前磁盘结构如下:我们此次的最终目标,就是将…