图像信号处理器(ISP)基础算法及处理流程

在这里插入图片描述

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇:
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《暗光增强》
📝《模型优化》
📝《模型实战部署》


在这里插入图片描述

传统的ISP(Image Signal Processing)图像处理算法涵盖了从图像传感器(通常是CMOS或CCD传感器)获取原始图像数据到生成最终显示图像的全过程。以下是一些常见的传统ISP图像处理算法处理步骤。

目录

  • 一、黑电平校正(Black Level Correction)
    • 1.1 代码
  • 二、去噪(Denoising)
    • 2.1 固定模式噪声校正
    • 2.2 随机噪声去除
    • 2.3 代码
  • 三、白平衡(White Balance)
    • 3.1 灰世界算法(Gray World Algorithm)
    • 3.2 完美反射算法(Perfect Reflector Algorithm)
    • 3.3 代码
  • 四、去马赛克(Demosaicing)
    • 4.1 代码
  • 五、伽玛校正(Gamma Correction)
    • 5.1 代码
  • 六、色彩校正(Color Correction)
    • 6.1 色彩空间转换
    • 6.2 色彩矩阵处理
    • 6.3 代码
  • 七、锐化(Sharpening)
    • 7.1 拉普拉斯锐化
    • 7.2 非线性锐化
    • 7.3 代码
  • 八、色彩空间转换(Color Space Conversion)
    • 8.1 代码
  • 九、色调映射(Tone Mapping)
    • 9.1 局部色调映射
    • 9.2 全局色调映射
    • 9.3 代码
  • 十、变换(Transformations)
    • 10.1 代码
  • 十一、校准和矫正(Calibration and Correction)
    • 11.1 镜头畸变校正
    • 11.2 色差校正
    • 11.3 遮光校正
    • 11.4 代码
  • 十二、自动对焦(Autofocus)
    • 12.1 对比度检测
    • 12.2 相位检测
    • 12.3 代码
  • 十三、曝光控制(Exposure Control)
    • 13.1 代码
  • 十四、自动增益控制(Auto Gain Control, AGC)
    • 14.1 代码
  • 十五、动态范围压缩(Dynamic Range Compression, DRC)
    • 15.1 局部动态范围压缩
    • 15.2 全局动态范围压缩
    • 15.3 代码
  • 十六、总结

一、黑电平校正(Black Level Correction)

目的:在图像传感器捕获的原始图像中,可能存在黑电平偏移。这一步校正这些偏移,使得黑电平值归零,从而提高图像的动态范围。

步骤:

传感器捕获的原始图像可能包含偏移的黑电平值。
计算或查找黑电平值。
从每个像素值中减去黑电平值,使得图像黑电平归零。

1.1 代码

def black_level_correction(image, black_level=16):return np.clip(image - black_level, 0, 255).astype(np.uint8)black_level_corrected_image = black_level_correction(image)
cv2.imwrite('black_level_corrected_image.jpg', black_level_corrected_image)

二、去噪(Denoising)

抑制图像中的各种噪声,如固定模式噪声(FPN)和随机噪声。

步骤:

2.1 固定模式噪声校正

固定模式噪声是由传感器中各像素的响应不均匀引起的。
使用暗帧(captured when no light is entering the sensor)来校正固定模式噪声。

2.2 随机噪声去除

随机噪声通常包括热噪声和读出噪声。
使用滤波技术(如中值滤波、均值滤波或高斯滤波)来抑制随机噪声。

2.3 代码

下面给出通过高斯模糊去噪的例子:

import cv2
import numpy as npdef denoise_image(image):return cv2.GaussianBlur(image, (5, 5), 0)image = cv2.imread('input_image.jpg')
denoised_image = denoise_image(image)
cv2.imwrite('denoised_image.jpg', denoised_image)

三、白平衡(White Balance)

白平衡算法调整图像的色温,以确保图像在各种照明条件下颜色的准确性。常见的白平衡方法包括灰世界算法(Gray World Algorithm)和完美反射算法(Perfect Reflector Algorithm)。

步骤:

3.1 灰世界算法(Gray World Algorithm)

假设图像中所有颜色的平均值应该是中性的灰色。
计算图像中红、绿、蓝三通道的平均值。
根据平均值的偏差,调整各通道的增益使其均衡。

3.2 完美反射算法(Perfect Reflector Algorithm)

假设图像中存在一个完美反射的白色物体。
使用该物体的颜色作为白平衡参考点,调整其他颜色的增益。

3.3 代码

def white_balance(image):result = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)avg_a = np.average(result[:, :, 1])avg_b = np.average(result[:, :, 2])result[:, :, 1] = result[:, :, 1] - ((avg_a - 128) * (result[:, :, 0] / 255.0) * 1.1)result[:, :, 2] = result[:, :, 2] - ((avg_b - 128) * (result[:, :, 0] / 255.0) * 1.1)return cv2.cvtColor(result, cv2.COLOR_LAB2BGR)white_balanced_image = white_balance(denoised_image)
cv2.imwrite('white_balanced_image.jpg', white_balanced_image)

四、去马赛克(Demosaicing)

大多数图像传感器使用拜耳(Bayer)滤色器阵列,因此捕获的图像是单色图像(每个像素只记录一种颜色)。去马赛克算法将这些单色图像转换为全彩色图像。

步骤:

传感器使用拜耳滤色器阵列捕获图像,每个像素只记录一种颜色(红、绿或蓝)。

插值算法(Interpolation Algorithms):
最简单的方法是线性插值。
更复杂的方法包括双向插值、边缘方向插值和加权方向插值。

4.1 代码

去马赛克将拜耳阵列转换为RGB图像。

def demosaic(image):return cv2.cvtColor(image, cv2.COLOR_BAYER_BG2BGR)demosaiced_image = demosaic(black_level_corrected_image)
cv2.imwrite('demosaiced_image.jpg', demosaiced_image)

五、伽玛校正(Gamma Correction)

伽玛校正用于调整图像的亮度,以匹配显示设备的特性。它将线性传感器数据转换为非线性,以更好地反映人眼对亮度的感知。

步骤:

原始图像数据通常是线性响应的。
应用非线性伽玛曲线将线性数据转换为伽玛校正后的数据。
常见的伽玛值为2.2(对于sRGB显示设备)。

5.1 代码

加粗样式

def gamma_correction(image, gamma=1.0):invGamma = 1.0 / gammatable = np.array([((i / 255.0) ** invGamma) * 255 for i in np.arange(0, 256)]).astype("uint8")return cv2.LUT(image, table)gamma_corrected_image = gamma_correction(color_corrected_image, gamma=2.2)
cv2.imwrite('gamma_corrected_image.jpg', gamma_corrected_image)

六、色彩校正(Color Correction)

色彩校正包括色彩空间转换和色彩矩阵处理,以确保图像的颜色准确性。

步骤:

6.1 色彩空间转换

将原始RGB数据转换为目标色彩空间(如sRGB)。

6.2 色彩矩阵处理

应用色彩校正矩阵,调整图像的颜色分布。
该矩阵通常根据摄像头和显示设备的色彩特性预先计算。

6.3 代码

def color_correction(image, red_gain=1.0, green_gain=1.0, blue_gain=1.0):b, g, r = cv2.split(image)b = cv2.multiply(b, blue_gain)g = cv2.multiply(g, green_gain)r = cv2.multiply(r, red_gain)return cv2.merge([b, g, r])color_corrected_image = color_correction(white_balanced_image, red_gain=1.1, green_gain=1.0, blue_gain=1.2)
cv2.imwrite('color_corrected_image.jpg', color_corrected_image)

七、锐化(Sharpening)

锐化算法用于增强图像的细节和边缘,使图像看起来更加清晰。常用的方法包括拉普拉斯锐化和非线性锐化。

步骤:

7.1 拉普拉斯锐化

使用拉普拉斯算子计算图像的二阶导数,增强边缘。

7.2 非线性锐化

使用非线性滤波器,如高斯拉普拉斯(LoG)滤波器,增强细节。

7.3 代码

图像锐化可以通过卷积操作来实现。

def sharpen_image(image):kernel = np.array([[0, -1, 0],[-1, 5, -1],[0, -1, 0]])return cv2.filter2D(image, -1, kernel)sharpened_image = sharpen_image(gamma_corrected_image)
cv2.imwrite('sharpened_image.jpg', sharpened_image)

八、色彩空间转换(Color Space Conversion)

将图像从一种色彩空间转换到另一种色彩空间,例如从RGB到YCbCr,以便于压缩和显示。

步骤:

常见的色彩空间转换包括RGB到YCbCr。
这种转换有助于压缩和显示。
使用线性变换矩阵进行转换。

8.1 代码

色彩空间转换将图像从一种色彩空间转换到另一种。

def convert_color_space(image, conversion_code=cv2.COLOR_BGR2YCrCb):return cv2.cvtColor(image, conversion_code)color_converted_image = convert_color_space(demosaiced_image, cv2.COLOR_BGR2YCrCb)
cv2.imwrite('color_converted_image.jpg', color_converted_image)

九、色调映射(Tone Mapping)

色调映射用于处理高动态范围(HDR)图像,将其映射到低动态范围显示设备上,同时保留细节和对比度。

步骤:

9.1 局部色调映射

根据局部亮度调整色调,保留细节。

9.2 全局色调映射

根据整体亮度调整色调,压缩动态范围。

9.3 代码

def tone_mapping(image, gamma=2.2):invGamma = 1.0 / gammatable = np.array([((i / 255.0) ** invGamma) * 255 for i in np.arange(0, 256)]).astype("uint8")return cv2.LUT(image, table)tone_mapped_image = tone_mapping(color_converted_image)
cv2.imwrite('tone_mapped_image.jpg', tone_mapped_image)

十、变换(Transformations)

图像几何变换包括旋转、缩放、平移和镜像等,用于图像的对齐和校正。

步骤:

使用变换矩阵对图像进行几何变换。
常用的变换包括仿射变换、透视变换和投影变换。

10.1 代码

def transform_image(image, angle=0, scale=1.0):h, w = image.shape[:2]M = cv2.getRotationMatrix2D((w/2, h/2), angle, scale)return cv2.warpAffine(image, M, (w, h))transformed_image = transform_image(tone_mapped_image, angle=15, scale=1.1)
cv2.imwrite('transformed_image.jpg', transformed_image)

十一、校准和矫正(Calibration and Correction)

包括镜头畸变校正、色差校正、遮光校正等,以补偿镜头和传感器引入的各种失真和缺陷。

步骤:

11.1 镜头畸变校正

计算镜头畸变参数(如径向和切向畸变)。
应用畸变校正模型(如鱼眼校正)校正图像。

11.2 色差校正

校正由于不同波长的光在镜头中折射率不同引起的色差。

11.3 遮光校正

补偿由于镜头遮光引起的图像边缘变暗现象(渐晕)。

11.4 代码

def calibrate_and_correct(image, camera_matrix, dist_coeffs):h, w = image.shape[:2]new_camera_matrix, roi = cv2.getOptimalNewCameraMatrix(camera_matrix, dist_coeffs, (w, h), 1, (w, h))corrected_image = cv2.undistort(image, camera_matrix, dist_coeffs, None, new_camera_matrix)x, y, w, h = roireturn corrected_image[y:y+h, x:x+w]# 示例相机矩阵和畸变系数
camera_matrix = np.array([[800, 0, 320], [0, 800, 240], [0, 0, 1]], dtype=np.float32)
dist_coeffs = np.array([-0.2, 0.1, 0, 0], dtype=np.float32)calibrated_image = calibrate_and_correct(transformed_image, camera_matrix, dist_coeffs)
cv2.imwrite('calibrated_image.jpg', calibrated_image)

十二、自动对焦(Autofocus)

自动对焦算法根据图像内容调整镜头位置,以确保图像的清晰度。

步骤:

12.1 对比度检测

通过检测图像的对比度最大化来实现自动对焦。

12.2 相位检测

使用相位检测传感器快速确定对焦位置。

12.3 代码

def auto_focus(image):# 示例:评估图像的拉普拉斯变换的方差,作为对焦度的度量focus_measure = cv2.Laplacian(image, cv2.CV_64F).var()return focus_measurefocus_value = auto_focus(calibrated_image)
print(f"Focus measure: {focus_value}")

十三、曝光控制(Exposure Control)

根据场景亮度调整曝光时间和增益,以获得最佳亮度的图像。

步骤:

自动曝光(Auto Exposure, AE):
测量场景的整体亮度。
根据预设的曝光策略调整曝光参数(快门速度、光圈和ISO感光度)。

13.1 代码

def adjust_exposure(image, target_brightness=128):gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)current_brightness = np.mean(gray)correction_factor = target_brightness / current_brightnessreturn np.clip(image * correction_factor, 0, 255).astype(np.uint8)exposure_adjusted_image = adjust_exposure(calibrated_image)
cv2.imwrite('exposure_adjusted_image.jpg', exposure_adjusted_image)

十四、自动增益控制(Auto Gain Control, AGC)

调整图像传感器的增益,以确保在不同光照条件下图像的亮度。

步骤:

增益调整:
根据测量到的图像亮度,动态调整传感器的增益。

14.1 代码

自动增益控制用于调整图像的对比度。

def auto_gain_control(image, clip_limit=2.0, tile_grid_size=(8, 8)):lab = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)lab_planes = cv2.split(lab)clahe = cv2.createCLAHE(clipLimit=clip_limit, tileGridSize=tile_grid_size)lab_planes[0] = clahe.apply(lab_planes[0])lab = cv2.merge(lab_planes)return cv2.cvtColor(lab, cv2.COLOR_LAB2BGR)gain_adjusted_image = auto_gain_control(exposure_adjusted_image)
cv2.imwrite('gain_adjusted_image.jpg', gain_adjusted_image)

十五、动态范围压缩(Dynamic Range Compression, DRC)

压缩图像的动态范围,以适应显示设备的能力。

步骤:

15.1 局部动态范围压缩

在保留细节的情况下压缩亮度范围。

15.2 全局动态范围压缩

调整图像的整体对比度,压缩高光和阴影部分的亮度。

15.3 代码

直方图均衡化对图像的亮度通道(L通道)进行处理,从而实现动态范围压缩。以下是代码的实现步骤:

将图像转换为LAB色彩空间:LAB色彩空间将亮度和色彩分离,便于单独处理亮度。

对L通道进行直方图均衡化:直方图均衡化是一种常见的动态范围压缩技术,通过调整图像亮度分布来增强图像的对比度和细节。

合并通道并转换回BGR色彩空间:处理完L通道后,重新合并LAB通道并转换回BGR色彩空间,以便显示和保存图像。

显示和保存结果图像:使用matplotlib库显示原始图像和处理后的图像,并将结果保存为JPEG文件。

import cv2
import numpy as np
from matplotlib import pyplot as pltdef dynamic_range_compression(image):# 将图像转换为LAB色彩空间lab = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)l, a, b = cv2.split(lab)# 对L通道进行直方图均衡化l_eq = cv2.equalizeHist(l)# 合并通道并转换回BGR色彩空间lab_eq = cv2.merge((l_eq, a, b))compressed_image = cv2.cvtColor(lab_eq, cv2.COLOR_LAB2BGR)return compressed_image# 读取图像
image = cv2.imread('input_image.jpg')# 进行动态范围压缩
compressed_image = dynamic_range_compression(image)# 保存结果图像
cv2.imwrite('compressed_image.jpg', compressed_image)# 显示原图和处理后的图像
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.title('Original Image')
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.subplot(1, 2, 2)
plt.title('Compressed Image')
plt.imshow(cv2.cvtColor(compressed_image, cv2.COLOR_BGR2RGB))
plt.show()

十六、总结

通过以上步骤,ISP图像处理系统能够将传感器捕获的原始图像数据转换为高质量的可视图像,适用于各种应用和显示设备。以上算法只是基础算法,各个板块都可以衍生出独立领域研究,现在更多的研究引入深度学习(AI ISP),与传统方法相比,深度学习方法可以提供更高质量的图像处理效果,并且能够适应复杂多变的图像内容和拍摄环境。

感谢您阅读到最后!😊总结不易,多多支持呀🌹 点赞👍收藏⭐评论✍️,您的三连是我持续更新的动力💖

关注公众号「视觉研坊」,获取干货教程、实战案例、技术解答、行业资讯!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/40776.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

传输距离3000M|低延迟|48K采样音频传输模块-SA356大功率发射模块

无线音频应用中,远距离音频传输在许多领域具有广泛的应用需求,例如大型会议系统、公共广播、户外活动和音乐演出等。为了满足这些需求,音频传输模块需要具备一些关键特性,包括长距离传输能力、高音质、低延迟、稳定性以及抗干扰能…

fastzdp_login的第一次构建

概述 为了方便能够快捷的实现fastapi实现登录相关功能代码开发,决定开发一个开源的fastapi组件库,想了很多个名字,在检查pypi的时候发现都被占用了,所以最终决定使用fastzdp_login这个名字。 fast代表的时fastapi。zdp代表的是张…

Springboot与xxl-job

一、下载xxl-job项目 XXL-JOB是一个分布式任务调度平台,其核心设计目标是开发迅速、学习简单、轻量级、易扩展。现已开放源代码并接入多家公司线上产品线,开箱即用。 从GitHub上面将项目clone下来,如果网络问题导致速度慢也可以从Gitee上面拉…

JavaScript中的立即执行函数表达式(Immediately Invoked Function Expression, IIFE)

聚沙成塔每天进步一点点 本文回顾 ⭐ 专栏简介JavaScript中的立即执行函数表达式(Immediately Invoked Function Expression, IIFE)1. 引言2. IIFE的概念2.1 概述2.2 语法2.3 历史背景 3. IIFE的作用3.1 创建独立作用域3.2 模块化代码3.3 防止变量提升3.…

SAPUI5基础知识10 - i18与国际化

1. 背景 i18n 是 “internationalization” 的缩写,其中的 18 是 “internationalization” 这个单词中间的字符数。i18n 是一种让应用程序支持多种语言的方法,也就是我们通常所说的国际化。 在SAPUI5中,i18n主要通过使用资源模型&#xff…

跑腿平台小程序的设计

管理员账户功能包括:系统首页,个人中心,基础数据管理,管理员管理,接单详情管理,跑腿员管理,跑腿任务管理 微信端账号功能包括:系统首页,跑腿任务,接单员&…

RocketMQ源码学习笔记:Producer启动流程

这是本人学习的总结,主要学习资料如下 马士兵教育rocketMq官方文档 目录 1、Overview1.1、创建MQClientInstance1.1.1、检查1.1.1、MQClientInstance的ID 1.2、MQClientInstance.start() 1、Overview 这是发送信息的代码样例, DefaultMQProducer produ…

Gradio 教程四:Building Generative AI Applications with Gradio

文章目录 一、使用interface构建NLP应用1.1 构建文本摘要应用1.1.1 设置API密钥1.1.2 调用文本摘要API1.1.3 运行本地模型获取响应1.1.4 使用interface构建应用 1.2 构建命名实体识别应用1.2.1 调用NER任务API1.2.2 使用interface构建应用1.2.3 加入额外函数,合并to…

CPU/内存/综合性能评估工具汇总-3:unixbench

目录 一、概括二、UnixBench 一、概括 嵌入式开发中对要设计的产品、立项的项目进行设计时,往往需要对关键芯片进行性能评估,本文主要总结基于linux系统的产品在性能评估时的工具使用总结,在aarch64(arm64平台下测试),板卡根文件…

Rhino 犀牛三维建模工具下载安装,Rhino 适用于机械设计广泛领域

Rhinoceros,这款软件小巧而强大,无论是机械设计、科学工业还是三维动画等多元化领域,它都能展现出其惊人的建模能力。 Rhinoceros所包含的NURBS建模功能,堪称业界翘楚。NURBS,即非均匀有理B样条,是计算机图…

【笔记】记录一次全新的Java项目部署过程

记录一次全新的Java项目部署过程 环境:CentOS7 一、初始环境准备 yum install wget -y yum install vim -y yum install net-tools -y mkdir /data mkdir /data/html mkdir /data/backend一、安装JDK 17 安装JDK17 # 下载rpm wget https://download.oracle.com…

数据驱动:Facebook的广告策略与商业模式

在现代数字经济中,数据已经成为新的石油,驱动着企业的增长和创新。Facebook,作为全球最大的社交媒体平台之一,充分利用其庞大的用户数据和先进的算法技术,建立了一个高度精确和高效的广告生态系统。这不仅推动了平台自…

带着味蕾去旅行,在“必吃”餐厅里认识一座城

时代不同了,旅游也变了。十多年前的旅游,是文艺青年的诗与远方,生活在别处的荷尔蒙之旅,宁浩拍了部电影叫《心花怒放》,那些年不管是大理、丽江、拉萨、成都,还是张家界,商家最喜欢用的宣传口号…

Oracle Database 23ai新特性:DB_DEVELOPER_ROLE角色

角色介绍 从 Oracle Database 23ai 开始,新角色“DB_DEVELOPER_ROLE”允许管理员快速分配开发人员为 Oracle 数据库设计、构建和部署应用程序所需的所有必要权限。(包括构建数据模型所需的系统权限以及监视和调试应用程序所需的对象权限)。通…

NSSCTF-Web题目23(RCE-空格绕过)

目录 [SWPUCTF 2022 新生赛]webdog1__start 1、题目 2、知识点 3、思路 [FSCTF 2023]webshell是啥捏 4、题目 5、知识点 6、思路 [SWPUCTF 2022 新生赛]webdog1__start 1、题目 2、知识点 RCE、空格绕过,嵌套eval 3、思路 出现这个页面,没有其…

【SSL 1056】最大子矩阵 (多维DP)

题目大意 已知矩阵的大小定义为矩阵中所有元素的和。给定一个矩阵,你的任务是找到最大的非空(大小至少是 1 ∗ 1 1*1 1∗1)子矩阵。 比如,如下 4 ∗ 4 4*4 4∗4 子矩阵 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 的最大子矩阵是 …

组件丰富、支持2/3D数据可视化的编辑器平台软件?

数据可视化编辑器通常用于创建交互式的图表和模型,可以帮助用户以更直观的方式展示数据。一些在线平台软件提供了丰富的组件,支持2D和3D数据可视化: 1、Plotly - 提供了多种语言的库,支持在线创建交互式图表,包括2D和…

mac|Mysql WorkBench导入文件失败(修改编码)

⚠️:表格中有中文的不适用表格中有中文的不适用表格中有中文的不适用表格中有中文的不适用 我有一个excel表,想导入到mysql数据库中,但是Workbench的导入格式只支持csv,通过excel、wps将excel另存为csv文件进行导入 导入会因为编…

【软件测试】之自动化测试

🏀🏀🏀来都来了,不妨点个关注! 🎧🎧🎧博客主页:欢迎各位大佬! 文章目录 什么是自动化测试Selenium介绍什么是SeleniumSelenium的特点工作原理 SeleniumJava环境搭建下载…

第1章 信息系统综合知识

第1章 信息系统综合知识 本章主要介绍信息系统综合知识,介绍信息、信息系统的基本概念,概述两化融合和国家信息化战略,讲解电子政务、电子商务的典型应用,描述信息化整体总体规划以及IT战略的主要内容。 1.1 信息的定义和属性 …