ISP流程--去马赛克详解

前言

      本期我们将深入讨论ISP流程中的去马赛克处理。我们熟知,彩色图像由一个个像元组成,每个像元又由红、绿、蓝(RGB)三通道构成。而相机传感器只能感知光的强度,无法直接感知光谱信息,即只有亮暗而没有颜色。因此,相机厂商通常在传感器前面加上滤色器来透过不同波段的光。想要得到彩色图像,理论上需要给每个像元加上RGB三个通道对应波段的滤色器。厂商们为了节约成本,通常采用颜色滤波器阵列CFA(Color Filter Array)给不同的像元按照阵列排序加上不同波段的滤色器。有了CFA,每个像元只记录对应波段的信息,为了获得完整彩色图像,我们在ISP流程中通过去马赛克处理给图像恢复色彩。因此,我们可以称去马赛克处理为灰色图像融合为彩色图像的神来之笔。

图片
▲传感器感光示意图

      对于不同的CFA类型,成像器件像素单元接收的光强信号不同,相应的去马赛克方法也不一样,因此去马赛克方法与CFA的类型高度相关。

颜色滤波器阵列:

      接下来,小彩将针对几个有代表性的CFA进行具体讨论。

RGGB:

图片
▲RGGB型CFA

      RGGB型CFA也被称为Bayer阵列,是一种最典型、最成熟的CFA,可以透过红、绿、蓝三种光线。RGGB型CFA以2×2像元为基本单元,其中包括1个红光滤色器、1个蓝光滤色器和2个绿光滤色器。这样设计的传感器有50%的空间用于接收绿光,符合人眼对绿色更敏感的事实。虽说利用该CFA可以从绿色通道图像中获得较好的视觉细节,但是整体透光量不足,色彩信息损失较大,所以在暗光环境下拍摄表现较差。

RGBW:

图片
▲RGBW型CFA

     RGBW型CFA由柯达公司于2007年提出,2012 年索尼便将其应用于自家图像传感器产品线中,2015 年华为 P8 相机也是采用索尼的 RGBW 传感器 IMX278。

      RGBW型CFA取消了2×2基本单元中第二排的绿光滤色器,这使得所有光线都可以透过这个无滤色器的像元(称之为W像元)。这样设计的好处是可以增大透光量,增强暗光拍摄能力。同时,其缺点也较为明显,由于减少了一个滤色器,色彩信息损失较大,导致拍摄出来的图像色彩普遍较为寡淡,而且因为W像元透光量大而易于导致过曝。

RYYB:

图片
▲RYYB型CFA

     2014年安森美公司提出RYYB型CFA,随后在2019年华为和索尼联合发布了RYYB产品。该CFA的2×2基本单元中的绿光滤色器被替换成黄光滤色器。由于黄光波峰介于绿光与红光之间,Y像元能同时接收红光与绿光的能量,从而使整体感光能力提升40%。

      这样的设计在保持原有色彩信息的同时也能增大透光量,能适应各种拍摄场景。其缺点是在2×2基本单元中,两个黄光滤色器捕获的光能量远超红光和蓝光滤色器,而单个像元可接收的最大能量又是有限的 ,导致在一些光线强烈的场景,如果优先考虑 R、B 像元的可接收最大能量,那么 Y 像元接收的光能量就可能会溢出,造成过曝;如果优先满足 Y 像元的可接收最大能量,那么 R、B 像元就可能欠曝光,最终导致大光比环境下宽容度不够高。此外,RYYB型CFA需要对捕获的黄光进行红、绿分离,而这一步骤依赖于ISP流程中的校色算法,容易对最终图像产生偏色影响。

Others:

      除了上面提到的三种类型,还存在如Diagonal Stripe,CYGM,Hirakaw,Lukac & Plataniotis等其它形式的CFA,这里不再赘述。

图片
▲Diagonal stripe,CYGM,Hirakawa,DMCNN-VD-Pa设计的CFA

      无论是哪种类型的CFA,都无法完美地解决目前摄影行业中的图像记录颜色信息问题。因此,CFA设计固然重要,而与之搭配的去马赛克算法也是图像记录颜色的重要环节。

传统去马赛克算法:

      去马赛克的传统方法通常指插值法。早期研究人员利用最近邻插值、双线性插值、双三次插值和三次B样条插值等方法简单地预测图像像元中缺失的通道值。

图片
▲双线性插值预测绿色通道驱动值

       这样简单地对缺省值做插值算法忽略了图像边缘结构与三个通道之间的相关性,这可能会导致生成的图像存在拉链效应、伪彩与图像模糊等问题。

图片
▲拉链效应(左)与伪彩问题(右)

      后来,研究人员针对这个问题提出了基于色差一致性的插值算法,即在同一个图像中,两个相邻像素间对应通道的像素值差近似相等。色差插值算法可视为以色差一致性为约束条件的双线性插值。该算法虽从理论分析上更严谨,实际结果也更优秀,但仍存在着在图像高频部分表现不足的问题。

      与色差插值法类似的色比插值法,是以“两个相邻像素间对应通道的像素值比近似相等”为约束条件,但该算法在像素值为0时无法使用。

图片
▲色差插值法示意图

      色差插值法没有考虑到图像纹理方向,而是无差别使用邻域色差,故其效果在高频区的效果一般。为此,HA算法(Hamilton & Adams插值算法)于1997年被提出,其在色差插值法的基础上利用像元间的梯度来判断纹理方向(梯度小的地方被认为是纹理方向),进而使用这个方向的色差进行插值。该算法改进了普通色差插值法的缺点,在实际测试中取得了更高的PSNR。

      2010年,Pekkucuksen和 Altunbasak进一步改进了色差插值法,提出基于梯度的无阈值算法(gradient based threshold free,GBTF) 。该方法利用色差梯度计算每个方向的权重,然后根据每个方向的权重,结合来自各个方向的估计对图像像素值进行插值。

      2013年,Kiku等人在GBTF的框架上提出了残差插值(residual interpolation,RI)。该算法将GBTF法中的色差插值替换为残差插值(残差为最初采样到的像素值与初步估计值之间的差值),为广大学者提供了新的去马赛克思路。之后其他学者基于此方法提出了更多有建设性的去马赛克算法,例如最小化拉普拉斯残差插值算法(MLRI)、迭代残差算法(IRI)、自适应残差插值算法(ARI)等。

图片
▲GBTF(左)与RI(右)算法框架

AI去马赛克算法:

       目前,相关研究者提出了基于AI的ISP概念,即在传统的ISP流程中加入AI,而去马赛克、去噪等模块融入AI算法往往会有较好的效果提升。

       自人们发现卷积神经网络在提取图像特征方面有良好表现后,众多研究人员尝试利用该类网络进行去马赛克处理。目前,热门的方法可以分为三类,即分段式去马赛克、端到端去马赛克和联合其它任务的去马赛克算法。

      分段式去马赛克算法遵循传统去马赛克流程,通常是对Bayer阵列进行去马赛克处理。该类型算法先恢复采样率较高的G通道,并以此为先验信息,再推导出R、B通道的值。

图片
▲二段式去马赛克算法 CDM-CNN

       端到端去马赛克算法指的是输入马赛克图像并直接输出重建后图像的算法。该类算法凭借其重建效率高、泛化能力强的优点获得众多研究人员的青睐。最早Syu等人根据董超提出的超分辨率卷积网络,提出了应用于去马赛克操作的DMCNN(Demosaicing-CNN)与DMCNN-VD(DMCNN-very deep)算法,不但可以轻松应对Bayer阵列,并且对于其它任何类型CFA也有优秀的图像重建效果。

图片
▲端到端去马赛克算法 DMCNN(蓝色层为卷积层)

      除了利用简单卷积堆叠,研究人员还提出了采用残差网络、密集连接网络、U-Net网络与生成对抗网络等完成去马赛克处理的方法。

      除上述的分段式去马赛克算法与端到端去马赛克算法外,考虑到通过CFA采集到的图像存在噪声大、采样率低的问题,还有相关研究人员提出了将去马赛克、去噪、超分辨等任务联合处理的方法。

小结:

    去马赛克是ISP流程中的一项卓越技术,通过巧妙的插值和处理技巧,能够高效而准确地还原图像中缺失的彩色细节,为用户呈现出真实自然的色彩效果。

     目前,去马赛克算法取得了长足的进展,无论是传统插值算法还是深度学习法,都有优秀的重建效果。在未来,可以进一步改进去马赛克算法的自适应能力,使其能够更好地适应不同的拍摄场景和光照条件。除此之外,我们还可以优化算法以提高实时性能,确保用户在拍摄和预览中能够获得高质量的彩色图像。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/65840.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里云-通义灵码:在 PyCharm 中的强大助力(下)

目录 六.通义灵码在 PyCharm 中的优势与不足 1.优势 (1).提高开发效率 (2).提升代码质量 (3).易于使用 (4).不断学习和改进 2.不足 (1).依赖网络 (2).准确性有待提高 (3).局限性 七.未来发展展望 1.提高准确性和可靠性 2.与其他工具的集成 3.智能化程度的提升 八…

开源项目stable-diffusion-webui部署及生成照片

参考链接 https://www.freedidi.com/13133.html 基础环境部署 python 官网链接 Python Release Python 3.10.6 | Python.org 下载 Python 3.10.6 版本安装包 下载好后双击 点击安装,这里需要选择一下,把环境变量加上。(这里是默认安装到C盘…

【芯片封测学习专栏 -- 单 Die 与 多Die(Chiplet)介绍】

请阅读【嵌入式开发学习必备专栏 Cache | MMU | AMBA BUS | CoreSight | Trace32 | CoreLink | ARM GCC | CSH】 文章目录 Overview单个Die(Monolithic Die)多个Die(Chiplet Architecture or Heterogeneous SoC)如何判断一个SoC是…

Windows 安装 Docker 和 Docker Compose

🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall ︱vue3-element-admin︱youlai-boot︱vue-uniapp-template 🌺 仓库主页: GitCode︱ Gitee ︱ Github 💖 欢迎点赞 👍 收藏 ⭐评论 …

java_将数据存入elasticsearch进行高效搜索

使用技术简介: (1) 使用Nginx实现反向代理,使前端可以调用多个微服务 (2) 使用nacos将多个服务管理关联起来 (3) 将数据存入elasticsearch进行高效搜索 (4) 使用消息队列rabbitmq进行消息的传递 (5) 使用 openfeign 进行多个服务之间的api调用 参…

Github Copilot学习笔记

(一)Prompt Engineering 利用AI工具生成prompt设计好的prompt结构使用MarkDown语法,按Role, Skills, Constrains, Background, Requirements和Demo这几个维度描述需求。然后收输入提示词:作为 [Role], 拥有 [Skills], 严格遵守 […

android分区和root

线刷包内容: 线刷包是一个完整的android镜像,不但包括android、linux和用户数据,还包括recovery等。当然此图中没有recovery,但是我们可以自己刷入一个。 主要分区 system.img 系统分区,包括linux下主要的二进制程序。 boot.img…

RabbitMQ基础(简单易懂)

RabbitMQ高级篇请看: RabbitMQ高级篇-CSDN博客 目录 什么是RabbitMQ? MQ 的核心概念 1. RabbitMQ 的核心组件 2. Exchange 的类型 3. 数据流向说明 如何安装RabbitQueue? WorkQueue(工作队列): Fa…

大数据环境搭建进度

1.使用虚拟机的系统:centos7.xLinux 2.资源不足,使用云服务器: 1. 3.使用远程登录进行操作 用xshell 4.任务 1.虚拟机装好 2.设置IP地址 3.可以联网 4.设置远程登录访问 5.创建module和software目录,修改两…

Mysql--运维篇--主从复制和集群(主从复制I/O线程,SQL线程,二进制日志,中继日志,集群NDB)

一、主从复制 MySQL的主从复制(Master-Slave Replication)是一种数据冗余和高可用性的解决方案,它通过将一个或多个从服务器(Slave)与主服务器(Master)同步来实现。主从复制的基本原理是&#…

【EI会议征稿通知】第十一届机械工程、材料和自动化技术国际会议(MMEAT 2025)

本次大会旨在汇聚全球机械工程、材料科学及自动化技术的创新学者和行业专家,为他们提供一个卓越的交流与合作平台。随着全球对可持续技术和智能制造需求的不断增加,MMEAT 2025将重点关注这些领域的最新发展趋势和未来前景。此次大会的主要目标是推动机械…

OpenCV基础:视频的采集、读取与录制

从摄像头采集视频 相关接口 - VideoCapture VideoCapture 用于从视频文件、摄像头或其他视频流设备中读取视频帧。它可以捕捉来自多种源的视频。 主要参数: cv2.VideoCapture(source): source: 这是一个整数或字符串,表示视频的来源。 如果是整数&a…

解读Linux Bridge中的东西流向与南北流向

解读Linux Bridge中的东西流向与南北流向 在现代云计算和虚拟化环境中,网络流量的管理和优化变得越来越重要。Linux Bridge作为Linux内核提供的一个强大的二层交换机工具,在虚拟化和容器化应用中扮演着至关重要的角色。本文将深入探讨Linux Bridge中的两…

车联网安全--TLS握手过程详解

目录 1. TLS协议概述 2. 为什么要握手 2.1 Hello 2.2 协商 2.3 同意 3.总共握了几次手? 1. TLS协议概述 车内各ECU间基于CAN的安全通讯--SecOC,想必现目前多数通信工程师们都已经搞的差不多了(不要再问FvM了);…

RuoYi Cloud项目解读【四、项目配置与启动】

四、项目配置与启动 当上面环境全部准备好之后,接下来就是项目配置。需要将项目相关配置修改成当前相关环境。 1 后端配置 1.1 数据库 创建数据库ry-cloud并导入数据脚本ry_2024xxxx.sql(必须),quartz.sql(可选&…

第432场周赛:跳过交替单元格的之字形遍历、机器人可以获得的最大金币数、图的最大边权的最小值、统计 K 次操作以内得到非递减子数组的数目

Q1、跳过交替单元格的之字形遍历 1、题目描述 给你一个 m x n 的二维数组 grid,数组由 正整数 组成。 你的任务是以 之字形 遍历 grid,同时跳过每个 交替 的单元格。 之字形遍历的定义如下: 从左上角的单元格 (0, 0) 开始。在当前行中向…

Harry技术添加存储(minio、aliyun oss)、短信sms(aliyun、模拟)、邮件发送等功能

Harry技术添加存储(minio、aliyun oss)、短信sms(aliyun、模拟)、邮件发送等功能 基于SpringBoot3Vue3前后端分离的Java快速开发框架 项目简介:基于 JDK 17、Spring Boot 3、Spring Security 6、JWT、Redis、Mybatis-P…

R数据分析:多分类问题预测模型的ROC做法及解释

有同学做了个多分类的预测模型,结局有三个类别,做的模型包括多分类逻辑回归、随机森林和决策树,多分类逻辑回归是用ROC曲线并报告AUC作为模型评估的,后面两种模型报告了混淆矩阵,审稿人就提出要统一模型评估指标。那么肯定是统一成ROC了,刚好借这个机会给大家讲讲ROC在多…

记一次学习skynet中的C/Lua接口编程解析protobuf过程

1.引言 最近在学习skynet过程中发现在网络收发数据的过程中数据都是裸奔,就想加入一种数据序列化方式,json、xml简单好用,但我就是不想用,于是就想到了protobuf,对于protobuf C/C的使用个人感觉有点重,正好…

SQLAlchemy

https://docs.sqlalchemy.org.cn/en/20/orm/quickstart.htmlhttps://docs.sqlalchemy.org.cn/en/20/orm/quickstart.html 声明模型 在这里,我们定义模块级构造,这些构造将构成我们从数据库中查询的结构。这种结构被称为 声明式映射,它同时定…