微光图像增强算法学习记录(一)

微光图像增强(LLIE)旨在恢复照明并提高微光图像的可见性,本文对阅读的文献进行记录和分享,帮助回顾和大家建立学习资料。

  • 文献一
    • 摘要及前沿摘选
    • 主要贡献
    • 网络结构
    • 实验
    • 结论
  • 文献二
    • 摘要
  • 文献三
    • 摘要
    • 主要贡献
    • 网络架构
    • 实验
  • 文献四
    • 摘要
    • 实验

文献一

在这里插入图片描述

摘要及前沿摘选

在这里插入图片描述
论文翻译:
当一个人在弱光条件下拍摄图像时,图像往往能见度低。除了降低图像的视觉美感外,这种低质量还可能显著降低许多主要为高质量输入而设计的计算机视觉和多媒体算法的性能。在本文中,我们提出了一种简单而有效的微光图像增强(LIME)方法。更具体地说,首先通过找到R、G和B通道中的最大值来单独估计每个像素的照度。此外,我们通过在初始照明图上施加结构先验来细化初始照明图,作为最终照明图。具有构造良好的照明图,可以相应地实现增强。在许多具有挑战性的微光图像上进行的实验揭示了我们的LIME的功效,并表明其在增强质量和效率方面优于现有技术。

在这里插入图片描述
论文翻译:
此外,变分方法旨在通过在直方图上施加不同的正则化项来提高HE性能。例如,上下文和变分对比度增强(CVC)[6]试图找到一种关注大灰度差异的直方图映射,而工作[7]通过寻求2D直方图(LDR)的分层差异表示来实现改进。然而,在自然界中,它们专注于对比度增强,而不是利用真实的照明原因,存在增强过度和不足的风险。另一种解决方案是伽玛校正,它是对图像的非线性操作。主要缺点是,伽玛校正的非线性操作是在不考虑某个像素与其邻居的关系的情况下对每个像素单独执行的,因此可能会使增强的结果变得脆弱,并且在视觉上与真实场景不一致。
在这里插入图片描述
论文翻译:
在Retinex理论[8]中,主要的假设是(彩色)图像可以分解为两个因素,比如反射率和照明。基于Retinex的早期尝试,如单尺度Retinex(SSR)[9]和多尺度Retineex(MSR)[10],将反射率视为最终增强结果,这通常看起来不自然,并且经常看起来过度增强。[11]中提出的方法试图在保持照明自然度的同时增强对比度。尽管它防止了结果的过度增强,但在我们的实验中,它在效率和视觉质量方面都不如我们的方法令人印象深刻。傅等人提出了一种通过融合初始估计的照度图(MF)的多个导数来调整照度的方法[12]。MF的性能大部分是有希望的。但是,由于光照结构的盲目性,MF可能会失去纹理丰富区域的真实感。[13]的最新工作提出了一种用于同时反射率和光照估计(SRIE)的加权变分模型。利用估计的反射率和照度,可以通过操纵照度来增强目标图像。如[14]所示,倒置的微光图像看起来像雾度图像,如图2所示。基于这一观察结果,[14]的作者对倒置的微光图像进行了除雾处理。在去雾之后,所获得的不真实图像被再次反转,作为最终的增强结果。最近,李等人遵循这一技术路线,通过首先对输入图像进行过度分割,然后自适应地对不同的片段进行去噪,进一步提高了视觉质量[15]。尽管上述类似除雾的方法可以提供合理的结果,但它们所依赖的基本模型缺乏物理解释。相比之下,我们的方法具有清晰的物理直觉。
在这里插入图片描述

主要贡献

在这里插入图片描述
论文翻译:
我们的方法属于基于Retinex的类别,旨在通过估计其照明图来增强微光图像。值得注意的是,与[13]等将图像分解为反射率和照明分量的传统基于Retinex的方法不同,我们的方法只估计一个因素,比如照明,这缩小了解决方案空间,降低了计算成本,以达到所需结果。首先通过找到R、G和B通道中每个像素的最大强度来构建照明图。然后,我们利用照明的结构来细化照明图。给出了一种基于增广拉格朗日乘子(ALM)的算法来精确求解精化问题,同时设计了另一个加速求解器来大大减少计算量。在许多具有挑战性的图像上进行了实验,以揭示我们的方法与其他最先进的方法相比的优势。

网络结构

在这里插入图片描述
在这里插入图片描述
不使用全局的最大R、G、B三通道的值,而是使用每个像素点的RGB的最大值,有助于确保恢复不饱和
目标是非均匀地增强低光图像的照明,而不是消除光源引起的颜色偏移

在这里插入图片描述
另一个广泛使用的模型是基于观察到的倒置微光图像1−L看起来与雾度图像相似,因此表示为公式(4)。
其中a表示全球大气光。尽管倒置微光图像1−L的视觉效果在直觉上与雾度图像相似,但与模型(1)相比,上述的物理意义仍然模糊。下面我们将展示(4)和(1)之间的关系。
在这里插入图片描述
之前的方法大多关注于邻域像素,
在这里插入图片描述
如何使目标函数公式(8)最小,作者给出了相应的方案。如下方的伪代码。
在这里插入图片描述
然后就是如何加速上面的迭代求解过程。
最后是算法的整体流程。
在这里插入图片描述

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结论

在这里插入图片描述
翻译
在本文中,我们提出了一种高效、有效的方法来增强微光图像。微光增强的关键是照明图的估计效果。已经开发了结构感知平滑模型来提高照明一致性。我们设计了两种算法:一种可以获得目标问题的精确最优解,另一种可以交替求解近似问题,显著节省时间。此外,我们的模型对不同的(结构)加权策略是通用的。实验结果表明,与几种最先进的替代方案相比,我们的方法是先进的。值得肯定的是,我们的微光图像增强技术可以为许多基于视觉的应用提供高可见性输入,如边缘检测、特征匹配、对象识别和跟踪,从而提高其性能。

文献二

摘要

Yang, ** Nie. “Reference-free low-light image enhancement by associating hierarchical wavelet representations.” Expert Systems with Applications 213 (2023): 118920.
在这里插入图片描述
翻译
对于计算机视觉和图像内容理解来说,微光图像由于其对比度和光照差而成为一个明显的挑战。因此,微光图像增强(LLIE)技术引起了人们的极大关注。然而,现有的基于深度学习技术的LLIE方法大多依赖于参考图像来指导监督训练。在真实世界的场景中捕获参考图像是非常困难的。为了弥补这一点,我们提出了一种无参考的低光增强框架,通过小波分解和关联估计像素曲线。典型的LLIE方法大致在RGB图像上应用照明调整。与此相反,我们重新审视了当前的LLIE管道,并通过提取和关联频率先验提出了一个细粒度的图像增强框架。首先,利用小波变换将图像分解到频域。然后,利用层次小波分解实现了跳频信息的传递。最后,在小波频率之间具有一致关联的情况下,应用无参考损耗函数。这些损失用于指导细粒度的无参考LLIE范式。我们通过综合实验验证了我们的方法,并证明我们的模型在定量指标和视觉感知方面优于其他相关方法。

文献三

Liu, Yunlong, et al. “Low-Light Image Enhancement with Multi-stage Residue Quantization and Brightness-aware Attention.” Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023.
在这里插入图片描述
在这里插入图片描述

摘要

在这里插入图片描述
在这里插入图片描述

翻译:

微光图像增强(LLIE)旨在恢复照明并提高微光图像的可见性。传统的LLIE方法往往产生较差的结果,因为它们忽略了噪声干扰的影响。基于深度学习的LLIE方法专注于学习弱光图像和正常光图像之间的映射函数,该函数优于传统的LLIE算法。然而,大多数基于深度学习的LLIE方法还不能完全利用训练数据集中正常光图像提供的辅助先验的指导。在本文中,我们提出了一种基于亮度感知注意力和残差量化码本的具有正常光先验的亮度感知网络。为了实现更自然、更逼真的增强,我们设计了一个查询模块来获得更可靠的正常光特征,并通过融合分支将其与低光特征融合。此外,我们提出了一个亮度感知注意力模块,以进一步提高网络对亮度的鲁棒性。对真实捕获数据和合成数据的大量实验结果表明,我们的方法优于现有的最先进方法。

主要贡献

在这里插入图片描述
翻译:
提出了一种新的基于VQ-VAE的三阶段框架微光图像增强方法。据我们所知,我们提出的方法是第一种基于VQ的LLIE方法。
(1)通过残差量化构建了一个更具层次性和表达力的码本。此外,我们还设计了一个查询模块来弥合弱光特征和普通光码本之间的差距。
(2)为了避免下采样操作丢失图像细节,我们提出了一种融合低光特征和不同尺度的正常光先验的融合分支。
(3)设计了一个亮度感知注意力模块,该模块学习亮度图来调制特征,以提高网络对亮度的鲁棒性。
(4)在几个流行数据集上的大量实验结果表明,我们提出的方法优于现有的几种最先进的LLIE方法。

网络架构

在这里插入图片描述
在这里插入图片描述
翻译:
第一阶段I:阶段I的网络包含正常光编码器EN、具有码本C的残差量化(RQ)模块和正常光解码器DN。学习一个有表现力的码本C和一个精确的解码器DN是阶段I的核心。更多细节将在第3.2节中描述。
•第二阶段:在第二阶段,我们建议学习一个查询模块Q,并根据微光编码器EL和学习的查询Q的特征之间的相似性来选择码本项目。编码器EL和查询Q的参数需要训练,而在第一阶段学习的码本C和解码器DN是固定的。更多细节将在第3.3节中描述。
•第三阶段:在第三阶段,我们提出了一个融合分支来融合预训练编码器EL和解码器DN的特征。这样,它可以进一步保护更有价值的细节,并获得比第二阶段更好的性能。更多细节将在第3.4节中描述。

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

文献四

在这里插入图片描述

摘要

在这里插入图片描述

实验

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/766273.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习K-means算法

K-Means 算法(K-Means算法、K-Means 中心值计算、K-Means 距离计算公式、K-Means 算法迭代步骤、K-Means算法实例) 问题引入 给你如下两种图片,快读回答2个问题,问 图1 中有几类五谷杂粮?问 图2 中有几类五谷杂粮&…

linux源配置:ubuntu、centos;lspci与lsmod命令区别

1、ubuntu源配置 1)先查电脑版本型号: lsb_release -c2)再编辑源更新,源要与上面型号对应 参考:https://midoq.github.io/2022/05/30/Ubuntu20-04%E6%9B%B4%E6%8D%A2%E5%9B%BD%E5%86%85%E9%95%9C%E5%83%8F%E6%BA%90/ /etc/apt/…

基于SpringBoot+MyBatis框架的智慧生活商城系统的设计与实现(源码+LW+部署+讲解)

目录 前言 需求分析 可行性分析 技术实现 后端框架:Spring Boot 持久层框架:MyBatis 前端框架:Vue.js 数据库:MySQL 功能介绍 前台功能拓展 商品详情单管理 个人中心 秒杀活动 推荐系统 评论与评分系统 后台功能拓…

分布式之网关介绍

一、网关简介 1、网关背景 由于微服务“各自为政的特性”使微服务的使用非常麻烦。通常公司会有一个“前台小姐姐”作为统一入口,这就是网关 2、网关作用 统一入口:为服务提供一个唯一的入口,网关起到外部和内部隔离的作用, 保…

阿里云幻兽帕鲁4核16G和8核32G服务器优惠价格

2024阿里云幻兽帕鲁专用服务器价格表:4核16G幻兽帕鲁专用服务器26元一个月、149元半年,默认10M公网带宽,8核32G幻兽帕鲁服务器10M带宽价格90元1个月、271元3个月。阿里云提供的Palworld服务器是ECS经济型e实例,CPU采用Intel Xeon …

C#,图论与图算法,用于检查给定图是否为欧拉图(Eulerian Graph)的算法与源程序

1 欧拉图 欧拉图是指通过图(无向图或有向图)中所有边且每边仅通过一次通路, 相应的回路称为欧拉回路。具有欧拉回路的图称为欧拉图(Euler Graph), 具有欧拉通路而无欧拉回路的图称为半欧拉图。 对欧拉图的一个现代扩展是蜘蛛图,它向欧拉图增加了可以连接的存在点。 这给…

AJAX-综合

文章目录 同步代码和异步代码回调函数地狱解决回调函数地狱Promise-链式调用async函数和awaitasync函数和await-捕获错误 事件循环宏任务与微任务Promise.all静态方法 同步代码和异步代码 同步代码:逐步执行,需原地等待结果后,才继续向下执行…

阿里云效流水线—发布公用jar到Maven私仓

后端项目发布 1.选择流水线 2.新建流水线 3.选择模板 4.选择代码仓库 5.调整构建命令 添加mvn install 重新构建项目 6.添加镜像 在wms-app目录下新建Dockerfile文件(Dockerfile文件名中的D一定要是大写的)文件,重新推送项目 #基础镜像 FROM openjd…

【力扣hot100】1. 两数之和 49.字母异位词分组 128. 最长连续序列

目录 1. 两数之和题目描述做题思路参考代码 49.字母异位词分组题目描述做题思路参考代码 128. 最长连续序列题目描述做题思路参考代码 1. 两数之和 题目描述 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数…

EPO企业生产运营数智化平台助力制造企业迈向智能制造

随着“中国制造2025”和工业4.0的不断推进,越来越多的制造企业准备迈入智能制造和智慧制造领域,实现数智化管理。企业通过搭建EPO企业生产运营平台,结合自身业务现状和数字化需求,从各个业务场景、部门人员、产品组成等方面进行分…

Django缓存(二)

一、视图缓存 Django的缓存可以设置缓存指定的视图,具体方式使用django.views.decorators.cache.cache_page, 方法有2种方式: 装饰器:以方法以装饰器的方式使用 from django.views.decorators.cache import cache_page@cache_page(60 * 15,cache="default") def…

【算法每日一练]-图论(保姆级教程篇16 树的重心 树的直径)#树的直径 #会议 #医院设置

目录 树的直径 题目:树的直径 (两种解法) 做法一: 做法二: 树的重心: 题目: 会议 思路: 题目:医院设置 思路: 树的直径 定义:树中距离最…

科技革新背后:码垛机器人在不同领域的实践应用

随着科技的进步,机器人技术已经渗透到各个行业之中,成为提高生产效率、减少人工成本的重要工具。码垛机器人作为自动化技术的杰出代表,其在各个行业中的应用场景日益广泛,从食品饮料到化工产品,再到物流仓储&#xff0…

睿考网:注册会计师考试有年龄限制吗?

参加注册会计师考试是否有年龄限制?现行的规定并没有要求考生的年龄,所以只要符合既定的报名条件任何人都是可以参加的。 报名资格要求如下: 1. 报考者须为中国国籍公民,并且具备完全的民事行为能力。 2. 学历要求方面&#xf…

CSS的特殊技巧

1.精灵图 使用精灵图核心总结: 1. 精灵图主要针对于小的背景图片使用。 2. 主要借助于背景位置来实现--- background-position 。 3. 一般情况下精灵图都是负值。(千万注意网页中的坐标: x轴右边走是正值,左边走是负值&#xf…

海康威视-AIOT的业务转型

海康威视的转型和定位为智能物联网(AIoT)解决方案和大数据服务的提供商。 公司不仅仅聚焦于其核心的视频监控业务,而且正在积极拓展到新的技术领域和市场。通过专注于物联感知、人工智能、大数据等技术的创新,对未来技术发展方向的…

生产计划数据模型,实现能源企业数字化高效管理

随着市场经济的快速发展,能源企业在经济发展中的地位也随之提高。但由于能源企业在生产计划经济管理上存在指标不平衡、市场观念落后和环保意识欠缺等问题,导致企业的经济效益降低。目前,提高企业的生产计划管理是改善能源企业现状最有利的途…

计算机网络:物理层下的传输媒体概览

✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。&am…

MySQL---视图

目录 一、介绍 二、语法 三、视图的更新 四、视图作用 一、介绍 视图(View)是一种虚拟存在的表。视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的。 通俗的讲&#…

Ambari——编译——解决解决windows和linux下phantomjs链接超时问题

您的支持是我继续创作与分享的动力源泉!!! 您的支持是我继续创作与分享的动力源泉!!! 您的支持是我继续创作与分享的动力源泉!!! 错误日志: [INFO] Copying extracted folder C:\Users\LENOVO\AppData\Local\Temp\phantomjs\phantomjs-2.1.1-windows.zip-extract-1786692…